良品学習 vs 不良品学習:外観検査AIの"正しい始め方"

2026/02/26

0. この記事でやること

  • 同じ20枚だけ集めるとしたら、良品学習(教師なし異常検知)と不良品学習(教師あり検出:YOLO)のどちらがより使えるか比較します。

  • 数値だけでなく、「過検出」「見逃し」も検証します。

1. 背景:外観検査AIの“2つのルート”はどっちが現実的?

不良品学習(教師あり)

概要

不良箇所を人手でアノテーション(bbox / mask)し、CNNや物体検出モデル(YOLO、Faster R-CNN など)で「不良の種類・位置」を直接学習させる方法です。

不良品学習の代表的な手法の一つが、物体検出(Object Detection)と呼ばれる、画像中の位置とクラスを同時に推定する技術です。検出精度の評価には 平均精度(mAP:Mean Average Precision)、Precision(プレシジョン:適合率)、Recall(リコール:再現率)といった指標が代表的です。

実務での評価

  • 見たことのある不良には非常に強い

  • 欠陥位置を可視化でき、説明責任を果たしやすい

  • 一方で「不良が集まらない工程」では導入が止まりやすい

良品学習(教師なし)

概要

良品のみを学習し、「正常とは何か」をモデル化(正常空間 / Normal Manifold の構築)することで、そこから外れたものを異常として検出する、いわゆる異常検知(Anomaly Detection)のアプローチです。

学習に正常データしか使わないため One-class learning とも呼ばれます。

推論時には各入力に対して異常スコア(Anomaly Score)を算出し、あらかじめ設定した閾値(Thresholding)を超えたものを異常と判定します。

実務での評価

  • 不良がなくても開始できる

  • 未知不良に反応しやすい

  • ただし「良品の定義」が揺らぐと不良検出の基準が安定せず、精度が悪くなることがある

これら2つの具体的な学習方法は過去の記事で詳しく取り扱っていますので、ぜひご覧ください。

2. 検証条件

データと枚数

良品学習(ResNet18+IsolationForest

  • 学習:良品20枚

  • 評価:不良品20枚+良品5枚

不良品学習(YOLOv8n)

  • 学習:不良品20枚

  • 評価:不良品5枚+良品20枚

評価観点

  • 見逃し(NGがOK判定)

  • 過検出(OKがNG判定)

Part 1:良品学習

3. 良品学習の学習方法(今回の簡易モデル)

今回の良品学習では、良品だけを「正常の集まり(正常空間)」として覚え、新しい画像がその集まりからどれだけ離れているか(距離)を異常度としました。

  • メリット:ラベル不要、実装が軽い、少量でも傾向が出ること

  • 注意:画像全体の“違和感”なので、欠陥位置の明示は工夫が必要

4. 良品学習の結果(スコア分布)

正常(good)画像の異常スコアは -0.05〜0.00 程度の狭い範囲に集中しました。

一方で、異常(anomaly)画像のスコアは 0.00 付近から 0.04 程度まで広く分布しており、正常画像と異常画像の間に明確なスコア差が確認できました。

正常画像のスコアは狭い範囲に集中し、異常画像は広く分布しています。

これは、良品学習が「正常/異常の二値分類」ではなく「正常からの距離」で異常度を見ていることを示しています。

実運用では、この分布を見ながら“どこをNGとするか(閾値)”を決めることが重要になります。

5. 良品学習の気づき

  • 閾値設計が肝(過検出 vs 見逃し)

  • 軽微な異常ほど正常に近いスコアになりやすい

  • 撮像環境ブレ・良品ばらつきがあると過検出が増えやすい
    → 設備側の改善(照明、位置決め)が有効

Part 2:不良品学習

6. YOLO(物体検出)の学習方法

不良箇所を四角(bbox)で教え、画像のどこに欠陥があるかを学習させます。

良品学習と違い、欠陥の位置を“根拠として提示”できるのが特徴です。

  • メリット:欠陥位置が出る/説明しやすい/現場が納得しやすい

  • デメリット:ラベルが要る/不良の網羅が必要/未知不良に弱い

7. YOLOの結果

不良品画像のみを用いて学習した物体検出モデル(YOLO)について、少量データ(20枚)で検証を行いました。その結果、以下の評価指標が得られました。(評価指標についてはこちらをご覧ください)

  • mAP@50:83.5%

  • Precision(適合率):75.2%

  • Recall(再現率):93.0%

mAP@50 が 80% を超えていることから、不良箇所の検出精度は全体として安定しており、少量の学習データであっても一定レベルの性能を発揮できていることが分かります。

特に Recall が 93.0% と高く、不良品を見逃す可能性が低い点は、品質検査の用途において重要な特性といえます。

一方で、Precision は 75.2% に留まっており、一部のケースでは不良ではない箇所を誤って検出している可能性があることも示唆されます。これは、学習データ数が限られていることや、不良パターンの種類を十分に網羅できていないことが影響していると考えられます。

以上の結果から、不良品学習(YOLO)は「不良箇所の位置を明確に示せる」「NG判定の根拠を説明しやすい」という点で現場説明性に優れている一方、少量データでの運用においては過検出が発生する可能性があり、実運用ではしきい値調整や追加学習を行いながら精度を高めていくことが重要であるといえます。

8. まとめ:20枚での検証から見えた判断基準

本検証では、同一データ・同一枚数(20枚)という極端に限られた条件下で、良品学習と不良品学習(YOLO)を比較しました。

この条件は、実際の製造現場でよくある「PoC初期」「まだ不良が揃っていない段階」を強く意識したものです。 以下に、今回の検証から得られたそれぞれの学習方法の差を示します。

不良品学習(YOLO)

強み

  • 欠陥位置を明確に示せるため、説明性が非常に高い

  • NG判定の「根拠」を画像として提示でき、現場合意を得やすい

  • 欠陥種が限定されている工程では、少量データでも一定の性能が出やすい

ボトルネック

  • 不良画像の収集が最大のハードル

  • ラベル作成の工数が無視できない

  • 未知不良や想定外の欠陥には反応しにくい

向いているケース

  • 欠陥パターンがある程度出揃っている

  • NG理由を明確に示す必要がある(監査・品質保証対応など)

  • 過検出よりも見逃しを極力避けたい工程

良品学習

強み

  • 不良データがなくても開始できる

  • 未知不良にも反応しやすく、初期探索に向いている

  • モデル構築・更新が比較的軽量で、導入初期のハードルが低い

ボトルネック

  • 閾値設計が難しく、運用中の調整が不可欠

  • 撮像条件や良品ばらつきの影響を受けやすい

  • 欠陥位置を直接説明するには追加工夫が必要

向いているケース

  • 不良がほとんど発生しない、または集められない工程

  • 「未知の異常をまず拾いたい」段階

  • PoCや初期立ち上げフェーズ結論

枚数を増やしていくとどうなるか

今回は「20枚」と設定して比較しましたが、この数字自体に特別な意味があるわけではなく、PoC初期に現実的に集められる規模感を想定したものです。

ここから枚数を増やしていった場合、両者の伸び方には違いが出ると考えられます。

不良品学習(YOLO)は、不良パターンのバリエーションが増えるほど検出力が着実に上がりやすく、枚数増加によって精度向上しやすい手法だと考えられています。

一方で良品学習は、枚数を増やしても「どういう画像が正常か」の基準が詳しくなるだけで、ある程度のところで性能が頭打ちになる傾向があります。つまり、データを集められる体制が整ってくるほど不良品学習の優位性が増していくと考えられます。

結論

本検証を通じて見えてきたのは、不良品学習をベースとしながらも、良品データを組み合わせることで、検査精度がさらに安定するという点です。

不良品学習(YOLOなど)は、

  • 欠陥位置を明確に示せる

  • NG判定の根拠を説明しやすい

  • 見逃しを抑えやすい

という強みを持ち、現場説明性や品質保証の観点で非常に重要な役割を果たします。

ただし、

  • 不良データの収集が難しい

  • 不良パターンの網羅が必要

  • 未知不良に弱い

という制約もあります。

「不良品+良品」を組み合わせるという考え方

そこで効果的なのが、不良品学習に良品データを加えるという運用です。

良品画像を混ぜることで、モデルが「正常な状態」を把握しやすくなり、

  • 撮像ブレや良品ばらつきによる誤検出を抑えられる

  • 未知の不良にも反応しやすくなる

  • 判定の安定性が向上する

といった効果が期待できます。

つまり、不良品学習単体でも十分に機能しますが、良品データを加えることで 「より精度高く、安定した検査」 が実現できるイメージです。

最後に

外観検査AIの導入において重要なのは、最初から完璧なモデルを作ることではありません。

  • 不良品データで確実な検出基盤を作りつつ

  • 良品データを加えて誤検出を抑制し

  • 将来的に説明性・安定性をさらに高めていく

このように段階的にモデルを育てていく発想が、現場での実運用において非常に有効です。

本記事の検証結果が、現場に合った外観検査AI設計を考える際の一つの判断材料になれば幸いです。

製造業の現場で活躍するAIなら「TechSword Vision」

本記事で見てきたように、不良品学習はデータが増えるほど検出力が着実に伸びていく、長期的にもっとも成果につながりやすいアプローチです。

TechSword が提供する TechSword Vision は、まさにこの「不良品画像を集めて育てる」ことを軸に設計された画像認識AIプラットフォームです。

専門知識がなくても、ノーコードで不良品画像からモデルを構築でき、現場で画像を追加していくほど検出精度が向上していきます。段階的にAI検査を導入・拡張していくことが可能です。

具体的な導入事例や導入後の流れについても、ご希望に応じて説明させていただきます。AIによる外観検査の導入をご検討の際は、ぜひお気軽にお問合せください。

非エンジニアでも簡単

画像認識AIの
開発・実装・運用を
実現できる
ノーコードAI
プラットフォーム