ここ数年は、大量のデータを用いて機械学習の手法で画像の病変部を抽出するとか自動診断をするという試みがよくなされている。
いわゆる「医療AI」というやつですね。
だが、流行っている割には、(少なくとも皮膚科領域には)質の高いデータセットがなく、そのときは「アタリをつけた」くらいで放置していた。
なお、上が良性腫瘍・下が悪性腫瘍(悪性黒色種)である。
CNN による「一般画像分類」課題
この手の問題は「一般画像分類」の応用と考えるとアプローチしやすいと思う。
この分野の有名な課題として CIFAR10 というのがある。
CIFAR10 データセットからランダムに画像を取り出すと下図のようになる。各画像は
0 飛行機、1 自動車、2 鳥、・・・、7 馬、8 船、9トラック
に分類・ラベルされている(これら以外はない)。
これらの画像とラベルを生物の神経系を模した「ニューラルネット」に「学習」させる。
うまく学習が行われていれば、適当な画像を「ニューラルネット」に入力させるとそれをある程度の確からしさで「分類」してくれる。
特に加工せずモデルに投入してみた。
不正確な縦横比や「傍にうな丼氏がいる」という悪条件にも関わらず、モデルが予測したカテゴリーは「9 トラック」といい線いってくれた。なお、ついでで言っておくと、ニューラルネット自体は過去に何度かブームになっている。今のブームの前は 1990 年頃。なんで覚えているかと言えば、私はこの頃、物理学科の学生で若干この問題を取り扱かっていたから。ただし、当時は CNN の C、すなわちコンボリューション層(畳み込み層)が「発見」されておらず、認識すべき物体の変形(歪みや回転など)に対して予測の精度が凄まじく悪かった。この弱点はかなり致命的で、それゆえ廃れていったと記憶している。
若干悔しいので投入する写真を加工。
再度、モデルに投入。
今度は、「1 自動車」と正しく認識してくれましとさ。
医療AI の方へ
上記の課題では、10種類の分類から1つを選んだが、医療画像の場合、分類して欲しいのは、もっとも単純には「正常」か「正常でないか」の2種類だ。
さて、上記課題解決法の応用ではどこまでいけるでしょうか?
(おそらく、続く)
スポンサーサイト
コメント