AIを利用した画像認識とは?種類や活用事例などを解説

最終更新日:2024.09.17
DX・システム開発
Wakka Inc. メディア編集部
AIを利用した画像認識とは?種類や活用事例などを解説
SHARE ON
  • FaceBook
  • Twitter
  • LINE
  • Note

こんにちは。Wakka Inc.メディア編集部です。

近年はAIの発展が目覚ましく、さまざまな事業分野で活用されるようになりました。
AIを活用した画像認識もその一種です。

AIによる画像認識は業種・業界を問わず、多種多様なビジネスで利用される場面は珍しくありません。
今やAIによる画像認識の活用は、ビジネスの手段として定着しつつあります。

本記事では、AIを利用した画像認識について解説します。
企業で実際に使用している事例も紹介するので、ぜひ参考にしてください。

目次

システム開発を検討されている方に向けてすぐに使える『RFP(提案依頼書)テンプレート』をご用意!

編集しやすいパワーポイント形式のテンプレートなので、項目を埋めるだけで簡単にRFPが作成できます。

【基礎知識】AIを利用した画像認識とは

画像認識とは、画像に映っている対象を認識し、解析・判断するための技術です。

画像認識は、さまざまな情報から対象を選別するパターン認識の一種であり、AIのディープラーニングと組み合わせることで、膨大な情報を処理できるようになりました。
AIによる画像認識は高精度であり、ほとんどの画像を正確に認識できます。

加えて、リアルタイムで学習することにより、さらなる精度の向上も可能です。

昨今は対象をただ識別するだけでなく、より細部まで分析できる画像認識AIが登場しています。
人間であれば、顔を認識するだけでなく、性別や年齢などを識別できるAIも活用されています。

AIを利用した画像認識の種類

AIを利用した画像認識は一種類ではありません。
昨今では用途に合わせた、さまざまな画像認識が登場しています。

本章では、画像認識の種類について解説します。

物体認識

物体認識は身近な画像認識の一種であり、画像内にある物体を認識し、特定のカテゴリに分類したり、対象だけを抽出したりする技術です。

AIを活用すれば、雑多な画像情報から任意の対象を正確に捕捉できます。
さらに個別の対象だけでなく、画像が映し出している環境や状況の把握も可能です。

物体検知

物体検知は物体認識と似ている機能ですが、厳密には異なるものです。

物体検知は画像内の物体の位置を特定し、バウンティボックスで検出します。
スマートフォンのカメラで撮影する際の、顔認識が代表例です。

その性質上、物体検知は物体認識と併用して使われます。

画像キャプション生成

画像キャプション生成とは、AIの自然言語処理機能と画像認識を組み合わせたものです。
画像内の対象や状況を認識するだけでなく、説明するテキストを出力できます。

画像キャプション生成は、視覚障がい者向けのアプリやSNSなどで活用されています。
また、逆にテキストから画像を生成する技術も実用化されるようになりました。

顔認識

顔認識は画像内の人間の顔を検出し、識別する機能です。

昨今では、顔認識技術を活用した顔認証がスマートフォンのセキュリティに用いられているなど、身近な技術として定着しています。
高度な顔認識だと、認識した顔の分類や類似した特徴のある顔を検索などが可能です。

文字認識

文字認識はOCR(光学認識技術)とも呼ばれ、書類上の文字を認識するための技術です。
印刷された文字はもちろん、手書きの文字も認識できます。

文字認識は商品の仕分け・データの自動入力・伝票の読み取りなど、多種多様な業務で活用されています。
また、翻訳機能と組み合わせることにより、テキストを読み込むだけで別の言語に翻訳できるアプリも登場しました。

異常検知

異常検知は物体検知技術の応用であり、画像や動画内にあるイレギュラーな事態を自動で検出するために用いられます。

異常検知はあらかじめAIにパターンを学習させることにより、パターンから逸脱した事象を検知できるようになります。
防犯カメラで利用される異常検知が有名ですが、製造業での品質管理などでも活用されている技術です。

医療分野でも、医療画像を解析し、異常検知する技術が使われています。

システム開発を検討されている方に向けてすぐに使える『RFP(提案依頼書)テンプレート』をご用意!

編集しやすいパワーポイント形式のテンプレートなので、項目を埋めるだけで簡単にRFPが作成できます。

AIによる画像認識の活用事例7選

本章では、AIによる画像認識の活用事例を紹介します。
紹介する事例は以下の7つです。

  • Amazon合同会社|顔認識による無人コンビニを実現
  • キヤノン株式会社|画像認識によるインフラ構造物点検サービスの提供
  • 株式会社電通|マグロの検品業務を画像認識で実践
  • 佐川急便株式会社|画像認識AIで配送伝票入力業務を自動化
  • 東日本電信電話株式会社|画像認識AIを使った万引き防止サービスの開発
  • 株式会社日立ソリューションズ|建設現場での事故を画像認識で防止
  • 理化学研究所|胎児の異常を画像認識AIで検知

いずれも、独自の方法で画像認識AIを活用している点が特徴です。

Amazon合同会社|顔認識による無人コンビニを実現

世界的に活用されているECストアであるAmazon合同会社は、顔認識を活用した無人コンビニを実現しています。

「Amazon Go」と呼ばれる無人コンビニは、常在のスタッフはもちろん、会計レジもありません。
Amazon Goで使われているシステムはアプリを利用しているユーザーを識別し、カートに入れた商品を検知するだけでなく、棚の商品の出し入れすらも記録します。

さらに店からユーザーが出た際に自動で清算できるなど、店を出入りするだけで買い物が完了するコンビニを実現しました。
Amazon Goのシステムは顔認識に加え、センサー融合や先進マシンラーニングなど、さまざまな技術を複合しています。

参照:Amazon Go|Amazon合同会社

キヤノン株式会社|画像認識によるインフラ構造物点検サービスの提供

キヤノン株式会社は、法人向けに画像とAIを利用したソリューションを提供しています。
本記事で紹介するのは、橋梁やトンネル工事などのような、社会インフラ構築物の点検や安全管理に特化したサービスです。

キヤノン株式会社のインスペクション EYE for インフラは、自社の優れた画像処理技術・カメラやレンズに関連する技術・画像認識AIを組み合わせたものです。
クライアントが提出した撮影画像や図面などを、AIによる精密な分析をかけることで、変状を正確に検知できます。

さらに分析したデータを基に、点検調書の作成や補修計画の策定ができるなど、実務をサポートできる点も特徴です。

参照:インスペクション EYE for インフラ|キヤノン株式会社

株式会社電通|マグロの検品業務を画像認識で実践

広告代理店大手である電通は、傘下にあるクリエイティブ横串組織のFCCで、TUNA SCOPEを開発しました。
TUNA SCOPEは画像認識で、マグロの目利き職人の技術を再現した品質判定AIです。

日本では、昔からマグロの品質は、熟練の目利きができる仲買人の技術によって判別されてきました。
しかし、近年は後継者不足により、仲買人の技術が引き継がれない状況に陥っています。

この状況を改善するため、FCCは画像認識技術とAIのディープラーニングを組み合わせることで、TUNA SCOPEを開発しました。
TUNA SCOPEはマグロの尾部の断面画像を大量に認識、ディープラーニングによって高度な品質判定を実施できます。

参照:TUNA SCOPE|TUNA SCOPE事務局

佐川急便株式会社|画像認識AIで配送伝票入力業務を自動化

大手物流会社の佐川急便は、複数の企業と連携し、画像認識AIを用いた新しいシステムを導入しています。

佐川急便が導入したシステムは、画像認識によって配送伝票を読み取り、情報の入力やデータ連携を自動で実施するものです。
文字認識にも対応しており、手書きの文字やかすれた文字であっても99.995%以上の精度で判別できます。

新しいシステムの導入によって、佐川急便は業務負担とコストの大幅な削減に成功しました。

参照:【佐川急便、SGシステム】佐川急便の配送伝票入力業務を自動化するAIシステムが本稼働|佐川急便

東日本電信電話株式会社|画像認識AIを使った万引き防止サービスの開発

東日本電信電話株式会社(NTT東日本)では、画像認識AIを使った万引き防止サービスが開発されました。

開発されたサービスは「AIガードマン」と呼ばれ、AIを搭載した防犯カメラが不審行動を検知し、店員が持つスマートフォンに自動で通知できます。
AIは消費者行動の膨大なデータを学習しており、パターンファイルを定期的に更新することで、顧客層の変動や新たな手口の登場にも対応が可能です。

さらに、AIガードマンで使用される防犯カメラは検知エリアが広く設定されています。
そのため、少ない台数で必要な範囲をカバーできます。

参照:万引き防止AIサービス「AIガードマン」の提供について|NTT東日本

株式会社日立ソリューションズ|建設現場での事故を画像認識で防止

株式会社日立ソリューションズは、建設業向けに墜落制止用器具フック不使用検知サービスをリリースしました。
これは、建築現場で使用される安全帯フックの不使用者をカメラを通じてAIが検知し、連動した通知機器で警報を鳴らしたり、パソコンに情報を出力したりするサービスです。

AIは安全帯フックの状態だけでなく、作業員の状況や器具の位置関係なども加味して判断するため、より高い検知制度を実現しています。

参照:建設業向け 墜落制止用器具フック不使用者検知サービス|株式会社日立ソリューションズ

理化学研究所|胎児の異常を画像認識AIで検知

医療分野でもAIを利用した画像認識技術は積極的に導入されています。

例えば、理化学研究所はAIによる胎児心臓超音波スクリーニングを開発しました。
胎児心臓超音波スクリーニングは、超音波画像から、小さく複雑な胎児の心臓の状態を正確に読み取れます。

画素が粗い状態でも読み取れるうえに、スピーディーかつ高精度な検知ができるため、迅速な診断を実現します。

参照:AIを用いた胎児心臓超音波スクリーニング|理化学研究所

AIを利用した画像認識の5つの注意点

AIを利用した画像認識はさまざまなビジネスで役立ちますが、導入する際は以下のような注意点に気を付けなければいけません。

  • 学習に膨大なデータが必要
  • 撮影環境の整備
  • プライバシーへの配慮が不可欠
  • 説明可能性の担保
  • 誤認識や破局的忘却への対応

上記の注意点を意識しないと、AIによる画像認識を使いこなせないリスクがあります。
導入前に必ずチェックしましょう。

学習に膨大なデータが必要

業務に活用できるレベルのAIにするには、ディープラーニングが不可欠です。
しかし、AIの学習には膨大な量のデータが必要になります。

AIの認識精度を向上させるには、画像データをただ読み込ませるだけでは意味がありません。
撮影角度・明るさ・環境などが異なる多彩な画像データを偏りなく読み込ませることで、効果的な学習が実現します。

画像データの収集はそれだけでもコストや労力がかかる作業です。
自社で用意することが難しければ、代行業者に依頼する方法もあります。

撮影環境の整備

画像認識を利用するうえで、撮影環境の整備は欠かせません。

どれだけAIの性能が優れていても、カメラの性能が悪いと正しく認識できません。
画像を読み取るネットワークカメラは、求める精度に合わせて選びましょう。

プライバシーへの配慮が不可欠

AIを利用した画像認識は、学習やデータ収集の過程で膨大な数の画像データを利用します。
その際にプライバシーを侵害するリスクがある点には注意しましょう。

AIによる画像認識を利用すれば、肖像権に抵触する画像はもちろん、医療画像のような高度な個人情報を扱う場面もあります。
万が一漏洩すれば、企業の信頼性を損ないかねません。

プライバシーに配慮するうえでも、画像は厳重に管理しましょう。

説明可能性の担保

AIを使った画像認識は、精度が高いほど判断のプロセスがブラックボックス化しやすいものです。

AIが提示した情報の説明可能性を担保できていない状況だと、重要な場面での意思決定ができなくなる恐れがあります。
複雑で高度な機能を持つAIほど、ブラックボックス化が起きやすい点には注意しましょう。

誤認識や破局的忘却への対応

AIの精度は100%ではありません。

時には誤認識を起こすリスクがあります。
誤認識はAIの脆弱性が原因であるため、適宜アップデートするなどの対応が必要です。

また、破局的忘却にも注意しなければなりません。
破局的忘却とは、AIが学習の過程で過去に習得した情報をリセットしてしまう現象を意味します。

学習済みのAIをさらに学習させると発生するリスクがあるので、学習データの復習や疑似リハーサルなどの防止策が不可欠です。

画像認識AIなら新たなビジネスを実現できる

画像認識AIは、多くの企業がビジネスに取り入れており、多大な成果を上げています。

特に画像検知や顔認識などの技術は、今では日常的に使われるようになりました。
今でも、画像認識AIは新たなビジネスを実現する可能性を秘めています。

競合他社の活用事例や注意点を学び、適切に活用しましょう。

この記事を書いた人
Wakka Inc. メディア編集部
  • ホーム
  • ブログ
  • AIを利用した画像認識とは?種類や活用事例などを解説