あなたが書いた数字を、人工知能は正しく認識できるか? – 第1回(全4回)



まずは体験!

早速ですが、手書き数字を人工知能で認識するデモ を試してみてください。(今回の記事の為に、私が作成しました)
おそらく、100%近い確率で、あなたの手書き数字を正しく認識できたのではないでしょうか?(わざと下手な字で書いてみるのも面白いです。人間みたいな間違え方をします)
 (※公開終了しました。下の画像はデモ画面のスナップショットです。マウスで描いた数字を認識します )
手書き数字を人工知能で認識するデモ(自作)

はじめに

このデモには、人工知能(AI)が使われています。近年巷を賑わせている、自動車の自動運転や囲碁ゲーム(Alpha Go)、スマホの音声アシスタントなどに搭載されているアレです。

ただ、私たちが普段目にする「人工知能」関連のニュースは、過剰なアピールや不安を煽る記事が多いので、人工知能の技術的本質への理解を妨げている気がします。

本記事では、非研究者・非エンジニアの方でも理解できるように気をつけながら、人工知能のカラクリを具体的に解説します。長文なので、全4回に分けて掲載する予定です。人間はAIとどう共存していくべきか・・みたいな、大袈裟で抽象的な話は一切しません。

 画像認識の難しさ

先ほどのデモの内側で、どんな処理が行われているか想像つきますか?コンピューターの目線に立つと、下記のような分類処理をしています。

コンピューターから見た画像の認識方法

理論的には、あらゆるピクセルの組み合わせを事前に用意しておけば、機械的なマッチングにより100%正確に分類できます。とはいえ、組み合わせパターンは無限にあるので、現実的ではありません。(28×28ピクセルの小さい白黒画像でさえ、パターン数は”2の784乗”という途方もない数になります)

手書き数字の場合、同じ数字であっても、ヒトによって書き方が違います。同一人物が同じ数字を書いた場合でさえ、1ピクセルのズレもなく同じ書き方になることはまずありません。従って、「33番目から48番目のピクセルが「白」だったら”5”」などといったルールを予め設定しておくこともできません。

ヒトとコンピューターの認識の違い
人工知能は、 このような”あいまい”な入力から、入力者の意図を汲み取る技術と言えます。
次回(第2回)は、この”あいまい”な入力を、コンピューターで処理する方法について説明します。

“あなたが書いた数字を、人工知能は正しく認識できるか? – 第1回(全4回)” への 1 件のフィードバック

コメントは受け付けていません。