まだ画像認識

最大の課題は数字や記号を正しく読み取れること。

カメラで撮ったものを認識させる関係上、多少の傾きでも平気なアルゴリズムを使う必要がある。なので、認識ベクトルに「認識対象の外周の法線の方向のフーリエ係数」を使うアプローチを使う。これなら、傾いていても同じ方向のベクトルになる。

ところが問題があって、この方法だと「6」と「9」がうまく認識できない。また「2」と「5」も誤認識しやすい。「|」と「ー」もダメ。向きが重要なものって少なくないのだ。

まぁいろいろな工夫を使えば出来る見通しはたっているのだけど、あんまりアドホックなものを並べるのもなぁ。

と言えば、「クサ」の報告によれば、某所でのQRコードの認識のデモはコケたらしい。資料とか見るといろいろ言い訳があったようだが、資料見る限り、「そりゃーダメでしょ」だな。いや、頑張ってるとは思うけどさ。どこが根本的な問題かってのは、きっとやってる奴等わかってないんだろな。

画像処理は大昔にもやってたし、今回は認識までやったのだけど、それでわかったことは「ロバストにやらせるには、プログラムの見通しが大事」ってことだな。最近は良質のライブラリが多いんだけど、まだまだブラックボックスだと思って使えるものじゃない。アルゴリズムとコードを理解しつつ、一歩一歩作って行くのがロバストへの近道のようだ。もちろん速度の点ではライブラリの方が一日の長があるのだけど、そこに至るまでは理解しつつやらないといけないようだ。

Google Reader Yahoo Facebook Twitter Digg FriendFeed Delicious Google Translate
This entry was posted on4月 24th, 2007 at 7:25:55. You can follow any responses to this entry through the RSS 2.0. You can Leave a response, or Trackback.

Leave a Reply

(Ctrl+Enter)

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

  • 私について

    ただのプログラマです、ハッカーではありません。

    秋葉で暮し秋葉で仕事してますが、秋葉系は嫌いです。物事を冷静に分析することは好きですが、ニヒリストは嫌いです。

    秋葉でちっこい会社をやってます。 こーゆーことがお仕事です。

    詳しいことは、自己紹介のページでも見て下さい。また、mixiの方でもいろいろわかるかも知れません。

    日経ITProに連載(生越昌己のオープンソースGTD)を書いています。「ちゃんと書いた文章」が読みたい人は、そっちを読む方がいいと思います。

  • このページについて

    ここは私の雑文の置き場です。WordPressを使っていますが、いわゆるblogのつもりで書いているわけではありません。「覗き見のできるチラ裏」くらいの意味しかありません。

    もしかしたら有用なことがあるかも知れません。あるいはむかつくことも書いてあるかもしれません。それらはみな「そんなものだ」と思っておくに留めましょう。

    コメントを書くのは構いませんが、「反論」の類はよそでやって下さい。同意する気のない人達と議論する気は全くありませんので、議論したければよそで勝手にやって下さい。

    と言っても、「読むな」「広めるな」というわけでもありません。リンク、ブクマの類は御自由に。

  • カテゴリ

  • 過去の記事

  • メタ情報