画像認識の利用事例とその仕組み

Developers's blog

2019.11.05 入江 佳輝
画像認識の利用事例とその仕組み

目次

画像認識とは

データから数理的な手法によってデータのパターンを見つけ出す処理を パターン認識 と呼ぶ。その中でも、特に画像からパターンを抽出し、何が写っているのかを判断するものを 画像認識と呼ぶ。人間はごく自然に目の前の光景を知覚・認識することができるが、その一連の流れをコンピュータに行わせるのがこの画像認識の目的である。 コンピュータに行わせることより、元々は人間が行うはずであった画像の判別や物体の検出などを自動化することができるのである。

元々はロボットにおいて外界にある物体検出の手段として考えられた画像認識技術であるが、1970年代における人間の知識をプログラムとして直接書く方式から、画像の形、色、動きなどの幾何学的な特徴を認識する方法にシフトして大きな進歩を遂げた。そして、近年では機械学習分野における ディープラーニング技術が発達したことにより、より高い精度で画像認識を行うことができるようになった。ディープラーニング技術には ニューラルネットワークが大きく関わっており、こちらのブログを参考にしてほしい。

技術発展により、画像認識はAI(人工知能)が活用される一分野として現在も急速に発展している。次節ではこの画像認識が使われている事例をいくつか紹介する。

画像認識技術の活用事例

文字認識

画像認識の代表的な活用事例として 文字認識が挙げられる。文字の書かれた画像から文字の領域を抽出し、それがどの文字なのかコンピュータ上のデータとして推測する手法である。人間が行っているこの作業をコンピュータに行わせることで、文章の読み取りの自動化などが実現でき人間が読むよりも遥かに速く文字の判別が行える。

tegaki_image.png

このような画像に写る物体(今回は文字)を理解し、それが何かというラベルを割り当てる過程を 物体認識 と呼ぶ。

医療画像認識による診断支援

医療分野においても画像認識は活用されている。医師が医療画像を見ることで病変を判断する過程を、コンピュータである程度自動化するのである。近年では医師でさえ見抜けない腫瘍の変異をコンピュータが画像の中の領域を抽出し、判別することもできる。これによって病変の発見までの時間の短縮化、および診断ミスの低減を図ることができる。

この医療画像からの変異の発見は 物体検出 と呼ばれ、画像の中の変異の領域を抽出することを セマンティックセグメンテーションと呼ぶ。

インターネット上の画像検索

インターネット上で画像認識を身近に感じるのは、この 画像検索 であろう。これは入力された文字列あるいは画像と類似する画像を検索する技術であり、データベースに保存された画像から似たような画像を検索する。

kensaku_image.png

画像検索は具体的な判別を行う インスタンス認識 によってラベル付けを行う。あらかじめラベル付けしておくことで瞬時に内容や見た目の近い画像を見つける類似画像検索が可能となる。

自動車の自動運転

これから発展するであろう画像認識の活用分野として、自動車の自動運転が挙げられる。自動車に搭載されたカメラによって外部の状況を判断し、自動車に運転をさせる技術である。カメラから受け取った画像を認識させることで、人間が難しい操作をすることなく搭載されたコンピュータが運転することが可能になる。

自動運転では静止した画像だけでなく、その時系列情報も必要になる。この時系列情報を利用した画像認識を 動画像認識と呼ぶ。

画像認識の仕組み

一般的な画像認識のプロセスはおおまかに以下のようになっている。

画像認識のモデルの構築

画像認識を行う上では「この画像のどこに何が写っているのか」という認識をするためのモデルが必要となる。そのため、機械学習を用いて学習データからこのような検出・判別するモデルを構築する。モデルをあらかじめ構築しておいて、認識する画像に対して判別結果を出力する仕組みを作る。

特徴抽出

画像認識を行う際に、モデルで実際に判別する際には画像の中から 特徴抽出する必要がある。特徴抽出では画像の局所的な特徴の抽出や画像に含まれるノイズの除去などを、画像処理の手法や統計的な手法によって行う。これにより判別に必要のない情報を除いた上で判別結果を計算することができる。

プーリング

抽出した特徴はいくつかの一定の大きさの領域にまとめた後、プーリング と呼ばれる処理を行ってまとめられた領域を1つの値で代表することを行う。これによって画像の空間的な情報は欠落するが、判別に必要な情報のみを残すことができる。

分類

特徴抽出・プーリングを行った後は、事前に用意していたモデルによって画像の判別を行う。

image_recognization.png

これにより、入力画像から認識を行うことができる。また、ディープラーニングに代表される学習手法は特徴抽出・プーリングの処理をひとまとめにして、それらの手順をさらに繰り返すことで認識精度を高めている。

まとめ

今回述べたことは以下の事項である。

  • 画像認識とは何か
  • 画像認識技術の活用事例
  • 画像認識の仕組み

これらから、画像認識は多岐に渡る分野で活用されるパターン認識の技術の一つであることが分かる。

おわりに

画像認識は画像処理や機械学習、ビッグデータなどと深い関わりを持ち、これらの分野の発展によって相互的に技術が進歩していくと考えられる。そのため画像認識の発展によって他の分野での研究も飛躍的に進み、画像認識は分野を越えて我々の生活を豊かにしてくれる技術だと言える。


定期的にメルマガでも情報配信をしています。
ご希望の方は問い合わせページに「メルマガ登録希望」とご連絡ください。

参考文献

原田達也(2018) 『画像認識』 講談社

平井有三(2018) 『はじめてのパターン認識』 森北出版

お問い合わせはこちらから