『それは一枚の画像から始まった』機械学習・AI編

以前に本館?の方で『それは一枚の画像から始まった』・『それは一枚の画像から始まった(2)』という記事を書いたのだが、そのときは、この分野 ーつまり医療画像の自動診断ー のアタリを掴むくらいの感じでいた。

horliX-dermatology.png


ここ数年は、大量のデータを用いて機械学習の手法で画像の病変部を抽出するとか自動診断をするという試みがよくなされている。
いわゆる「医療AI」というやつですね。

だが、流行っている割には、(少なくとも皮膚科領域には)質の高いデータセットがなく、そのときは「アタリをつけた」くらいで放置していた。

が、最近になって、SIIM (Society for Imaging Informatics in Medicine) というところからまとまったデータセットが公開された。(https://challenge2020.isic-archive.com/

benign.jpg

malignant2.jpg

なお、上が良性腫瘍・下が悪性腫瘍(悪性黒色種)である。


CNN による「一般画像分類」課題


この手の問題は「一般画像分類」の応用と考えるとアプローチしやすいと思う。
この分野の有名な課題として CIFAR10 というのがある。

CIFAR10 データセットからランダムに画像を取り出すと下図のようになる。各画像は
 0 飛行機、1 自動車、2 鳥、・・・、7 馬、8 船、9トラック
に分類・ラベルされている(これら以外はない)。

CNN-CIFAR10-sample.png

これらの画像とラベルを生物の神経系を模した「ニューラルネット」に「学習」させる。
うまく学習が行われていれば、適当な画像を「ニューラルネット」に入力させるとそれをある程度の確からしさで「分類」してくれる。

以前に自動車関係でスズキのセルボ を取り上げたので、うな丼氏の動画の一画面をキャプチャ。これでテストする。

cervo.jpg


特に加工せずモデルに投入してみた。

cervo-result-9.png

不正確な縦横比や「傍にうな丼氏がいる」という悪条件にも関わらず、モデルが予測したカテゴリーは「9 トラック」といい線いってくれた。なお、ついでで言っておくと、ニューラルネット自体は過去に何度かブームになっている。今のブームの前は 1990 年頃。なんで覚えているかと言えば、私はこの頃、物理学科の学生で若干この問題を取り扱かっていたから。ただし、当時は CNN の C、すなわちコンボリューション層(畳み込み層)が「発見」されておらず、認識すべき物体の変形(歪みや回転など)に対して予測の精度が凄まじく悪かった。この弱点はかなり致命的で、それゆえ廃れていったと記憶している。


若干悔しいので投入する写真を加工。

cervo2.jpg

再度、モデルに投入。

cervo-result-1.png

今度は、「1 自動車」と正しく認識してくれましとさ。


医療AI の方へ


上記の課題では、10種類の分類から1つを選んだが、医療画像の場合、分類して欲しいのは、もっとも単純には「正常」か「正常でないか」の2種類だ。
さて、上記課題解決法の応用ではどこまでいけるでしょうか?

(おそらく、続く)

にほんブログ村 病気ブログ 医者・医師へ







スポンサーサイト



コメント

非公開コメント

inomata0612

猪股弘明
筑波大物理専攻卒。新技術事業団(ERATO)で走査型トンネル顕微鏡の開発に従事。横浜市立大医学部を経て医師免許取得。都立松沢病院などで精神科医として臨床に従事。
精神保健指定医。東京都医学総合研究所客員研究員。
日本精神神経学会 ECT・rTMS等検討委員会委員。