AIによる外観検査（3/3） | みずほリサーチ&テクノロジーズ

情報通信研究部コンサルタント橋本大樹

4AIによる外観検査の普及拡大に向けての課題と期待される技術

AIによる外観検査の実用化に際しては、現場の状況に応じて、解決しなければならない課題が数多く存在する。本章では、外観検査の実用化において課題となることの多い、異常データ不足とAIの推論根拠のブラックボックス化という2つの課題について取り上げ、各課題を解決できる可能性がある手法として関心が集まっている技術について紹介する。

（1）半教師あり異常検知

外観検査による異常検知においては、歩留まりが高く異常データを多く収集できない場合や、発生し得るすべての異常パターンの収集が困難な場合があり、異常データを大量かつ網羅的に取得することが困難であることが多い。このようなケースにおいて、正常データのみを学習させて正常／異常データを判別する半教師あり^*8異常検知（1クラス分類、良品学習）と呼ばれる手法が考案されている。

半教師あり異常検知手法の1つに、画像の次元削減及び再構成を利用した方法がある。初めに画像データの特徴を保持しつつデータの成分数を減らす次元削減構造と、その次元削減したデータから元の画像を作成する再構成構造の2つの構造を、正常データのみを用いた学習により構築する。この2つの構造は、正常データが元の画像に再構成されるように構築するため、正常データの次元削減・再構成に特化した構造となる。この次元削減・再構成構造に異常データを入力すると、再構成前後で異常個所の画像が変化して正常データに似た画像に再構成される傾向がある。これを利用し、再構成前後の差分である再構成誤差を評価することで良品か不良品かを判別するという仕組みである。

当社においても、画像の次元削減及び再構成構造に、Auto Encoder^*9やpix2pix^*10等、ディープラーニング手法を利用した場合の異常検知の性能について検証を進めている。ここでは、画像の次元削減及び再構成構造としてpix2pixを用いた場合の異常検知の検証事例^*11を紹介する。図表6に例示した電子基板を模した正常データに対してpix2pixを用いて次元削減・再構成構造を学習したところ、図表7に例示したシミ状欠陥および糸くず状欠陥の2種類の異常データに対し、正常な背景パターンはそのままに欠陥部分のみが消えた再構成画像が得られた。図表8にその1例を示す。この構造を利用し再構成誤差の評価による判別を行ったところ、ROC-AUC^*12がシミ状欠陥に対して0.934、糸くず状欠陥に対して0.948を達成し、異なる傾向をもつ2種類の異常に対してともに高い異常検出性能が得られた。

この事例では良品形状があまり複雑でない等、限定的な条件下ではあるものの、実用化に向けた今後の発展に期待が出来る技術と考えている。

図表6　電子基板を模した画像（正常データ）

（資料）みずほ情報総研作成

図表7　電子基板を模した画像（異常データ）

（資料）みずほ情報総研作成

図表8　異常データの再構成例

（資料）みずほ情報総研作成

（2）説明可能なAI

機械学習手法を用いたAIの実用化に際しての課題の1つに、AIが予測・識別した推論根拠が分からないという、推論根拠のブラックボックス化があげられる。特に複雑な判断をおこなえるディープラーニングではその傾向が強い。実用においては、推論の根拠が説明できない手法を使用することに対する抵抗感は強く、推論の根拠が明確な手法が好まれることが多い。推論の根拠を目に見える形で確認することができれば、不信を払しょくするだけでなく、精度向上に向けた有用な情報になりうる。この課題を解決するため、説明可能なAI（explainable AI、XAI）と呼ばれる、推論根拠が説明可能なAIに関してさまざまな研究が行われている。

当社では、機械学習による胸部X線画像の異常検知の実用化に向けた共同研究を公立大学法人福島県立医科大学とすすめており^*13、その中で説明可能なAIについての検討も行っている。この共同研究は、読影医の負担を軽減し、疑い例に対する読影時間を今以上に確保することを目的として、ディープラーニングを用いてX線画像から肺がんの疑いがあるものを推定する取り組みである。福島県保健衛生協会から提供を受けた853枚（正常401枚＋肺がん疑い452枚）の胸部X線の画像データを教師データとして用い、DenseNet^*14を改良したディープラーニング手法により肺がん疑いを推定して、ROC-AUC^*12 0.80を達成した。この数値は、実用に向けてはまだ不十分な精度ではあるものの、同じくディープラーニング手法を用いて肺疾患の推定を試みたRajpurkarらの先行研究^*15における、（X線画像での見え方が肺がんに近い）結節の検出精度ROC-AUC 0.78に匹敵するものである。実用的な精度の達成に向け、引き続きデータの拡充や医学的知見の活用を予定している。

この共同研究においては、Rajpurkarらの先行研究^*15を参考に説明可能なAIの1手法であるCAM（Class Activation Mapping）を利用してディープラーニングの判断における注目領域の可視化を試みた。

図表9の左側の画像は、ChestX-ray14^*16にて結節と分類されているデータであり、当社の試行においても疾患の疑いがあると判定されたものである。読影医により疾患の疑いがあると判断された領域を青丸で示した。同じ画像を入力としてAIが判定の際に着目した領域をCAMにより可視化した結果が図表9の右側の画像である。青色部分は反応が弱い部分、赤色部分は反応が強い部分である。肺の疾患の疑いがあると読影医によって判断された箇所にAIが強く着目していることが確認できる。ただし、AIの着目範囲は読影医の判断箇所よりも広く、この差異について、「AIの判断は不十分である」と捉えるか、実は人間も無意識のうちに周囲の箇所との比較により判定しているため「AIの判断は十分である」と捉えるか、これ以上の考察は難しい。

実のところCAMをはじめとする解釈可能なAI手法は、推論根拠を少しでも可視化しようとする試みとして高い注目を集めている一方で、本当に正しく可視化できているのかに関しても多くの手法で議論が続いており、課題は多い。機械学習手法を理解するための足掛かりとなる「これから」の技術として、説明可能なAIに対する最先端の技術をキャッチアップし、検証を続けることが必要だと筆者は考えている。

図表9　異常検知の可視化例

（資料）Rajpurkarらの先行研究^*15を参考に、ChestX-ray14^*16の画像を使用しみずほ情報総研作成

5おわりに

本稿では、AIや機械学習、ディープラーニングについて概説した上で、AIによる外観検査の現状およびAIの普及拡大に向けて注目される技術の一端について、当社での研究開発事例を交えて紹介した。さまざまな分野でAIの活用が広がっている一方で、寄せられる期待も広がり、これまで以上の付加価値を持つAIが求められている。

With/Afterコロナの世界において、今後も外観検査の自動化の需要は増加していくと考えられる。現状、AIの利用にあたっては、その課題や特徴を「人間」が理解した上で、いかにツールとして有効に活用するかを「人間」が見極めることが必要である。本稿がAI導入への理解の一助になれば幸いである。

注

*1)Olga Russakovsky^*, Jia Deng^*, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang, Andrej Karpathy, Aditya Khosla, Michael Bernstein, Alexander C. Berg, Li Fei-Fei.（*=equal contribution）“ImageNet Large Scale Visual Recognition Challenge.” IJCV, 2015.
*2)Russakovsky ら*1によると、人間による分類精度の検証において、事前に評価データ以外のデータで分類に関して訓練した上で、被験者の一人がTop5エラー率5.1%を達成している。ただしコンテストの評価データは10万枚と画像枚数が多く、上記の検証する際には評価データの一部1500枚のみを使用しているため、この精度は参考数値となる。
*3)Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun. “Delving Deep into Rectifiers: Surpassing Human-Level Performanceon Image Net Classification.” IEEE International Conference on Computer Vision（ICCV），2015.
*4)あるデータに対して、関連する情報を付与する作業。機械学習の分野では、主に画像やテキスト、音声などの学習に用いるデータに意味づけを行い、教師データを作成することを指す。
*5)被害状況がアノテーション済みの道路撮影画像のデータセット。データセットの画像は、Creative Commons Attribution-ShareAlike 4.0 International License（CC BY-SA 4.0）のライセンスの下で公開されている（ https://github.com/sekilab/RoadDamageDetector#license-1 ）。Hiroya Maeda, Yoshihide Sekimoto, Toshikazu Seto,Takehiro Kashiyama, Hiroshi Omata,“ Road Damage Detection and Classification Using Deep Neural Networks with Smartphone Images.”Computer-Aided Civil and Infrastructure Engineering.
*6)橋本大樹，水谷麻紀子，杉原裕規，松下裕也，永田亮，重信薫，永田毅，“U-Net ベースの新しいニューラルネットワーク構造による鋳巣検出.” 外観検査アルゴリズムコンテスト，2019.
*7)
みずほ情報総研，“AI（人工知能）・機械学習の技術開発・コンサルティング開発事例2【事例2】X線CT画像からの鋳巣（空洞欠陥）の検出.”
*8)異常検知の分野における慣習に法り、ここでは正常データのみを用いて学習する手法を「半教師あり」と表現している。一般に「半教師あり」は、教師データに少量のアノテーション実施済みデータと、大量のアノテーション未実施データが含まれる場合の学習手法のことを指すことが多い。
*9)Geoffrey E. Hinton, Ruslan R. Salakhutdinov,“Reducing the Dimensionality of Data with Neural Networks.” science 313.5786（2006）: 504-507.
*10)Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. Efros,“ Image-to-Image Translation with Conditional Adversarial Networks.” Proceedings of the IEEE conference on Computer Vision and Pattern Recognition. 2017.
*11)橋本大樹，永田毅，“深層学習・機械学習を取り入れた外観検査.”第34回エレクトロニクス実装学会　春季講演大会，官能検査システム化技術 5B1-04,2020.
*12)横軸に偽陽性率（陰性データのうち、陽性と予測したデータの率）、縦軸に真陽性率（陽性データのうち、陽性と予測したデータの率）を取る受信者動作特性（receiver operatorating characteristic, ROC）曲線の下側面積（area under the curve, AUC）。二値分類における評価指標であり、0から1の値を取る。1に近いほど分類の精度が高く、完全ランダムの場合0.5となる。
*13)
みずほ情報総研，“肺がん検診におけるAI実用化に向けた共同研究を開始.”
*14)Gao Huang, Zhuang Liu, Laurens van der Maaten,Kilian Q.Weinberger“Densely connected convolutional networks.” arXiv preprint arXiv:1608.06993, 2016.
*15)Pranav Rajpurkar, Jeremy Irvin, Kaylie Zhu,Brandon Yang, Hershel Mehta, Tony Duan, Daisy Ding, Aarti Bagul, Curtis Langlotz, Katie Shpanskaya, Matthew P. Lungren, Andrew Y. Ng,“CheXNet:Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning.”arXiv preprint arXiv: 1711.05225, 2017.
*16)National Institutes of Health（NIH）のNIH Clinical Centerにより提供されている胸部X線データセット（
https://nihcc.app.box.com/v/ChestXray-NIHCC
）。Xiaosong Wang, Yifan Peng, Le Lu,Zhiyong Lu, Mohammadhadi Bagheri, Ronald Summers, “ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases.” IEEE CVPR, pp.3462-3471, 2017.

本レポートは当部の取引先配布資料として作成しております。本稿におけるありうる誤りはすべて筆者個人に属します。