AIの精度アップで大切なこととは?

2024/10/11

いま世界で最も注目されているテクノロジーの一つであるAI。医療分野や自動運転、製造業における外観検査など様々な分野での活用が進み、さらなる応用が期待されています。こうした社会実装段階では、AI技術が高い精度で機能することが不可欠です。

本記事では、まずAIの社会実装において、なぜ精度という指標が重要になるのかについて解説します。その後、精度を向上させるためにはどのようなことに気を配らなければならないのかについて、主に物体検出AIを例に詳しく解説します。

AIの社会実装において精度が重要な理由

医療や産業、教育など社会のあらゆる領域でAIの活用が進んでいますが、なぜ精度という指標が重要視されるのでしょうか。そこには主に3つの理由があると考えられます。

信頼性の確保

AIが高精度であれば、AIの利用者であるユーザーや企業はその結果を信頼しやすくなります。特定の分野では誤った判断が重大な影響を及ぼすため、精度が極めて重要です。例えば、医療分野ではAIは診断や治療計画の策定に利用されていますが、これらに誤りがあった場合、患者の命を危険にさらしてしまう可能性もあります。医療事故・医療過誤を防ぎ、質の高い医療の提供をサポートするにはAIの信頼性が重要となります。

効率化とコスト削減

高精度なAIは業務効率を向上させ、人件費の削減にもつながります。特に単調で同じ動作が繰り返されるような作業においては、AIは品質・コスト効率の両面で人間を超える場合も多くあります。このような効果を狙ったAIの導入は特に製造業や物流などの分野で多く見られます。

安全性の向上

自動運転、ドローン、道路や橋梁の点検など、安全性が求められる分野ではAIの高い精度が事故防止に直結する場合もあります。例えば、自動運転において、AIは状況予測や危険回避などの領域で利用されています。精度の高いAIはカメラやセンサーから得たデータを解析し、道路上の障害物や歩行者をいち早く認識することが可能です。その結果をもとに他の車両や歩行者の動きを予測し、最適なルート選択や速度調整を行います。これにより、安全性とスムーズな運転を両立し、交通渋滞の回避にもつながると期待されています。
また、道路や橋梁の点検はそれ自体が極めて危険な作業です。これをAIで代替することで、作業者の負担軽減や修繕作業の迅速化、作業時間やコストの削減も期待できます。

AIの精度を向上させるには?

ここまで、AIの精度向上が社会においてどのような意味を持つのかについて解説してきました。ここからはAIの精度を向上させるためにはどのようなことに気を配らなければならないのかについて、詳しく解説していきます。

「AI」といっても、画像生成や自然言語処理など、対象とする領域は非常に広範な分野であるため、本記事では特に物体検出AIについて解説します。

適切なアルゴリズムの選択

一口に物体検出AIといっても、利用されるアルゴリズムは様々で、適切なものを選択しなければ精度向上は見込めません。ディープラーニングを用いた手法は、古典的手法と比較して検出精度や汎用性の面で優れており、現状は多くの物体検出AIがCNNやYOLO、SSDなどのアルゴリズムを採用しています。

それぞれのメリット・デメリットについては過去に物体検出アルゴリズムの違いについて解説した記事を執筆していますので、そちらをご覧ください。

参考:YOLO?R-CNN?物体検出アルゴリズムの違いと進化を解説

データセットの工夫

物体検出AIの性能はデータセットの品質に大きく左右されます。データ量が少ない場合は十分な学習ができず、高い精度のAIを作り出すことは困難です。しかし、これから物体検出AIを活用しようとしている中で、はじめから十分な量の画像があるケースは稀です。多くの場合は学習用の画像を収集することから始める必要があります。少ないデータでも十分な規模のデータセットを構築したい場合、データ拡張や画像生成技術を利用することも手段のひとつです。

データ拡張

データ拡張とは、既存のデータセットから新しいデータを人工的に生成するプロセスです。これにより、元のデータ量が少ない場合でも、追加のデータ収集をせずに学習用データの量と多様性を増やすことができます。

データ拡張には様々な方法がありますが、画像データに対して回転・反転・明るさや色味の調整などを行うことが一般的です。うまく利用するとモデルの精度を改善し、汎化性能を向上させることができる一方で、過度なデータ拡張は逆効果になる場合もあります。タスクに適した手法を選択し、適切な範囲で拡張を行うことが重要です。

TechSword Visionではこのデータ拡張を行う機能が用意されています。画像が不自然になってしまわない範囲で左右・上下に反転させた画像を学習用データとして利用することができ、データ量を簡単に2倍、4倍へと増加させることが可能です。

画像の拡充画面

画像生成技術による学習データ生成

製造業においては、製品の不良画像を「異常」として学習させたAIにより外観検査を行う異常検知が利用されてきました。しかし、そもそも異常の発生が極めて稀であり、異常データを数十枚、数百枚、場合によっては数千枚収集することは難しい、というケースも多々あります。そのため、異常検知の精度を高めるための異常データが足りないという問題が発生しています。

そこで、AIによる画像生成技術を用いて異常画像を人工的に生成しようというアプローチが生まれました。正常画像を元に異常画像を作り出すことができるため、異常データを収集するための時間とコストを削減できます。

TechSword Visionではこの画像生成を行う機能もオプションで用意しています。金属製品の打痕やお菓子の欠けなどをユーザの入力に応じて生成することが可能です。異常の位置や大きさなども調整可能で、お客様のデータに合わせてリアルな異常画像を作成できます。

ハイパーパラメータの調整

ハイパーパラメータとは、AIの学習プロセスで利用する設定値です。これらはモデルの学習が始まる前に決定されるもので、学習時に自動的に調整されるパラメータとは異なります。適切なハイパーパラメータを設定することでモデルはより効率的に学習を進めることができ、高い精度を実現できます。また、モデルが学習データに過剰に適合する過学習を防止し、計算資源を効率的に利用することにも寄与します。

調整の方法は様々ですが、手動での調整が最も単純な方法です。経験と試行錯誤により調整していくことになるため時間がかかりますが、開発者はモデルの挙動を深く理解することができます。より大規模なパラメータの探索を行う場合、グリッドサーチやベイズ最適化などのアルゴリズムを用いて自動的に適切なパラメータを見つける方法もあります。

AIの判断根拠の可視化

ここまで様々な手法を紹介してきましたが、依然として目標としている精度に届かない場合、AIの判断根拠を可視化してみることが有効な可能性もあります。
AIは一般にブラックボックスモデルといわれ、内部の動作が不透明なため、なぜそのような出力になったのかが分かりにくいという一面があります。しかしながら、AIの内部の動作を理解する方法が全くないわけではありません。クラス活性化マッピング(CAM)はそのような手法の一つです。

CAMでは任意のクラスに対する推論結果をヒートマップとして確認することができます。これによりAIが誤判別している部分やモデルの挙動を知り、AIの改善に用いることができます。

たとえば、犬と猫を識別したいモデルとしてAとBの二つがあるとします。AのほうがBより精度が劣っており、その原因を考えたいとき、CAMを利用すれば『Aは「尻尾の部分」を判断根拠にしており、Bは「動物の全体」を判断根拠にしている』ことをヒートマップにより確認することができます。このようなモデルの場合は、データセットを改善することやパラメータを調整することを通して精度を改善できないか、検討する必要があります。

Grad-CAMによる注視領域の描画

出典:Selvaraju, Ramprasaath R., et al. "Grad-cam: Visual explanations from deep networks via gradient-based localization." Proceedings of the IEEE international conference on computer vision. 2017.

一方、CAMの結果を過剰に信頼するのも危険です。CAMはAIがどの部分を注視しているかを判断することは出来ますが、それを元にどのような判断を行ったかという情報まで得ることは出来ません。つまり、犬と猫の耳に注目していると分かったとしても、耳がどのような形・色の場合に犬、もしくは猫と判定しているかは分からないのです。AIの説明性はまだまだ研究が必要な分野で、人の判断が排除できない部分もあります。

まとめ

今回はAIの精度がなぜ重要か、精度を向上させるためにはどのような手法があるのかについて解説しました。

本記事で紹介した手法のなかには、TechSword Visionの一機能として導入されているものもあり、専門的な知識がなくても、簡単な操作で精度アップを狙うことが可能となっています。

ご興味のある方はぜひ詳細なサービス説明資料をご請求ください。

また、具体的な導入事例や導入後の流れについても、ご希望に応じて説明させていただきます。ぜひお気軽にお問い合わせください。

非エンジニアでも簡単

画像認識AIの
開発・実装・運用を
実現できる
ノーコードAI
プラットフォーム