サンプル画像１０枚で、Haar分類器の自作に挑戦！

OpenCV でHaar分類器を自作してみる

昨年の１２月に、OpenCV のバージョン3.1がリリースされました。画像認識の分野では、おそらく一番有名なプログラミング用ライブラリです。

OpenCVには、既に出来合いのHaar分類器があって、これを使うと、画像のどこに顔があるか認識できます。この分類器の認識精度に満足できない場合は、分類器を自作する必要があります。というわけで、試しに作ってみました。

分類器の自作にあたっては、「Create Your Own Haar Classifier for Detecting objects in OpenCV」というブロク記事と、「詳解 OpenCV　-コンピュータビジョンライブラリを使った画像処理・認識-」という書籍を参考にしています。

Haar分類器とは？

Haar分類器は、教師あり機械学習手法の一つです。教師あり機械学習の場合、大量の正解画像（例えば、画像＋顔の位置を表す矩形領域のXY座標）を予め人の手で用意しておいて、それを分類器の入力データとして与えます。そうすると、顔の位置を特定する為に最適な”パラメーター”を求めます。このパラメーターを求めるプロセスが、いわゆる「学習」に相当します。

パラメーターとは、-0.29384 とか、 2.3734509882 といった実数の集まりです。使う分類器の種類によって、パラメーターの意味合いは変わります。人間がその数字を見ても、デタラメな数にしか見えません。正解画像を１枚ずつ与えていくと、パラメーターの個数は変わらずに各々の値だけが刻々と変化します。値だけ眺めていても、どれくらいの認識精度を実現できそうなのか、さっぱり分かりません。テスト画像を実際に分類器にかけてみて、初めて精度を実感できます。