AI検査はデータの質・量に依存
AI検査において「データの質と量に依存する」という点がとても重要です。
データの質とは、正確なラベル付けを行うことを指します。たとえば、不良品の不良箇所にラベルを付ける際、NuLMiLでは不良箇所を色でマーキングしていますが、AIはそのマーキングされた部分を不良として学習します。そのため、マーキングが不正確であったり塗り漏れがあったりすると、AIが正しく学習できず、結果として精度の低いモデルが構築されてしまいます。
そして、データの量も非常に重要です。AIに学習させるデータの量が極端に少ない場合、AIは特徴を十分に抽出できず、やはり精度の低いモデルができてしまいます。仮に高い精度のAIが構築できたとしても、データ量が不足していると汎用性の低いモデルとなり、実際の運用には耐えられないことが多いです。
データの質(Quality)について
実際に、質の高いデータと質の低いデータでAIの精度を比較すると、違いが明確に現れます。
質の低いデータで学習させた場合、不良の一部は検出できていますが、不良箇所全体を正確に捉えることができず、不良面積の判定も正確ではありません。
一方で、質の高いデータを用いて学習させた場合、同じサンプルでも不良箇所全体を正確に検出でき、正確な不良面積を捉えることが可能になります。
データの量(Quantity)について
データ量に関しても同様で、量の違いによってAIの精度に差が生じます。
不十分なデータ数で学習させた場合、十分な学習ができず、未検出の箇所が残る結果になります。一方で、十分なデータ数で学習させた場合は、同じ不良箇所でも正確に検出でき、高い精度を達成することが可能です。