第29回関東CV勉強会でSelective Search for Object Recognitionを紹介してきました

初ガツオの季節です。都会なので目に青葉は映りません。山などないのでホトトギスもいません。テッペン原稿カケタカ!

さて、仕事がらComputer Vision的な活動はぜんぜんできていなかったこの1年でしたが、年明けたぐらいから気持ち的にも余裕ができてきたので、ちょいちょいと遊んでいました。
そして先日開催された関東CV勉強会で、かなりひさしぶりに外で専門分野のお話をさせていただく機会をいただき、検出界隈では有名と思われる手法Selective Search(*1)(*2)について紹介してきたので、簡単に振り返ってみたいと思います。

勉強会情報

Continue reading

gnuplotのepslatexを使ってTeXへちゃんとした数式入りのグラフを挿入する

学会への投稿などで忙殺されてるうちに季節は春になり,鯖とかホタルイカとかが結構旬になってきましたね.
お魚が食べたいです.

さて,(少なくとも僕たちの界隈では)学会準備シーズンということで僕も日々涙目になりながらいくつかの原稿を書いてます.
そんなとき,gnuplotで生成した図の凡例やラベルに複雑かつ綺麗な数式を書いてTeX原稿に貼り付けたい!とか,グラフ中に日本語が使いたい!とかの需要は極めて多くあるんですが,やりたいことのシンプルさのわりにえっらい作業量が多くて困る.

20130319_top_bad20130319_top_good

その中でもよく使われるのがpsfragで,epsをTeXソース貼り付けてコンパイルするとき,強引にeps中の特定文字列をTeXの記述に置換してコンパイルすることで・・・というかなり強引なやり方です.

これで普通にうまくいくならそれでOKなのですが,手元の環境でうまくいったことがない・・・後述するTeX Liveとの相性なんだと思いますが.

ということで,psfragを使わないepslatexによる方法を解説します.
この方法はpsfragのように追加のスタイルが必要ないこと,また記述の柔軟性がかなり高いという大きなメリットがあります.

一方,psfragのメリットは使えるフィールドがgnuplotに限られないことが大きいです.psfragなら例えばtgifで描いた図のラベルを数式に出来たりします.
あと作業量はやっぱりpsfragの方が少なくて済むので,手元の環境で動けばpsfragで構わないだろうとは思います.適切に使い分けてください.

Continue reading

BundlerによるStructure from MotionでKAZE局所特徴量を使ってみた

一応お魚キャラとしてやっているわけですが,私のアイコンの魚を前からみるとどうなるの?とときどき聞かれます.
回答としては,このお魚は”幅を持たない”形状をしています.二次元です。

さて,大量の未整列な多視点画像からの三次元形状復元ついでにカメラの内外部パラメータの推定まで一気にしちゃう手法のことをStructure from Motion(SfM)と言い,結構長いこと研究されているホットな話題であります.

そんなSfMを行うためのツールにBundlerがあります.r○byのbundlerとは全く関係ありません.
Bundlerは局所特徴量を用いたsparseな画像間対応からSfMをするもので,一般的にはSIFTが使われていますが,対応付けは独立プログラムに委譲されてるので,うまくやればどんな局所特徴量でもSfMをお楽しみいただける設計になっています.

ということで,Computer Vision Advent Calendar 2012で書いたさかな前線 » ECCV2012で発表されたKAZE局所特徴量を試してみたの続きという事で,KAZE特徴量を用いたBundlerでのSfMを試してみました.実用的な例がほしかったのでw
CVAdventCalendarの@yasutomo57jpさんの記事の二番煎じです…

Bundler(やPMVS)のアルゴリズムについては他に譲ります(←

20121209_bundler_example_pmvs

※結論から言うとやり方がまずいのでto be continuedです…

Continue reading

CV勉強会@関東に参加してきました.ついでに少ししゃべりました.

フグといえば山口県ということで僕の地元でして,県としては対外的にはフグのことを福とかけて「フ」と言ってるわけですが,ぶっちゃけ一般市民はそう読んでなくてフク雑な気持ちになります.

さて,2012/12/16に慶応大矢上キャンパスにて@takminさん主催でコンピュータビジョン勉強会@関東ECCV2012読み会が開催されまして,就活ついでに行ってきたついでに発表までしてきました.

簡単に感想だけ.

Continue reading

ECCV2012で発表されたKAZE局所特徴量を試してみた

先日ちょっと膝をケガしてしまいまして,ギプスに松葉杖です.けっこうリアルさかなに近づけたんじゃないかと思うのですがいかがでしょう?
折しも12/6で私も23歳を迎えました.できれば無事健康体で迎えたかったこの日.

この記事はComputer Vision Advent Calendar 2012の12/7担当分として書かれたものです.
主催者でありながら華麗に遅刻をキメました.これはひどい.
高専時代の後輩でもある@blue_jamくん,お疲れ様でした.そして誕生日メッセージありがとうございます.

さて,コンピュータビジョンにおける極めて重要な要素のひとつに画像特徴量があります.
これまでにたくさんの特徴抽出手法が提案されてきているわけですが,この度は最近の国際会議で発表されたばかりの新しい手法の実装が公開されていたので,それを試して見ることにしました.

Continue reading

今週のサーベイ(2012/11/30)

11月が旬のお魚って何があるかな?と思って調べてたんですが,アイナメって年中おいしくいただけるんですね知りませんでした.

さて,研究に関係することも純粋な興味も,なんかいろいろサーベイしながら構造的に記録取ってなくて時間の無駄感MAXなので毎週簡単にログ書くことにしました.
あんまり自分の研究に近いものはちょっと省きます.何をどうやってやろうとしてるかバレちゃうのでw
なんで,ここに書いたのの数倍は呼んでるんじゃないかなw

継続的にやります.うん.

"Online Moving Camera Background Subtraction"
  • Ali Elqursh, Ahmed Elgammal(Rutgers University)
  • ECCV2012 poster
  • 非固定カメラからの動物体領域をdenseに推定する手法の提案

    • このタイトル誤解を招くよ…
    • いわゆる背景差分の要素はないです
  • ラボの論文紹介で紹介
  • 今度の関東CVのECCV2012読み会で紹介します〜
“A Database and Evaluation Methodology for Optical Flow”
  • S.Baker,D.Scharstein,J.P.Lewis,S.Roth,M.J.Black,R.Szeliski
  • IJCVのジャーナル(2011)
  • optical flowを算出する各種手法を統一的に評価するデータセット
“A Stereo Vision System for 3D Reconstruction and Semi-Automatic Surveillance of Museum Areas”
  • Shahram Bahadori, Luca Iocchi
  • イタリア国内のワークショップ?2003年とこの分野のstate-of-the-artからすると古め
  • ステレオ映像から3次元復元をベースにしたactivityのsurveillance
  • システムとしてはおもしろいけど手法としてはまぁ

    • ページ数が少ないのでそれほどわかんないですけどね

CUDAで二次元配列の転置は高効率にできないと言ったな!あれは嘘だ!

寒くなってくるとお魚で鍋とかもしたくなってきますね.
海辺のお魚屋さんでは人々が行列を成してるんでしょうか.

行列といえばGPGPUが活躍する最も重要な分野の一つと言えますね.

んで,そんな行列でよく使われるタスクのひとつに「転置」があります.

  \bold{A}=  \begin{pmatrix}  1 & 2 & 3 \\  4 & 5 & 6 \\  7 & 8 & 9 \\  \end{pmatrix},  \bold{A}^{\mathrm{T}}=  \begin{pmatrix}  1 & 4 & 7 \\  2 & 5 & 8 \\  3 & 6 & 9 \\  \end{pmatrix}
  \bold{B}=  \begin{pmatrix}  1 & 2 & 3 \\  4 & 5 & 6 \\  \end{pmatrix},  \bold{B}^{\mathrm{T}}=  \begin{pmatrix}  1 & 4 \\  2 & 5 \\  3 & 6 \\  \end{pmatrix}

画像屋さんなら,線形なフィルタをかけるときには縦方向にフィルタして横方向にフィルタすればいいのですが,実装的には横方向にフィルタして画像全体を転置してまた横方向にフィルタして転置して戻す方法のほうが効率的なことが多いです.特にGPGPUなどでは.

ということでよく使う転置というタスクですが,CUDAでやるにはちょっと工夫しないとメモリアクセス効率が下がります.今日のお題はそれで.

Continue reading

第20回 名古屋CV・PRML勉強会を開催しました

だんだん寒くなってきて体調崩さないか少し怖いです.深海魚になれば温度は安定しているのになと思うと地上生活もラクじゃありませんね.

さて,先日2012/10/20に,第20回 名古屋CV・PRML勉強会を開催いたしました.

概要

内容

  • @sakanazensen(ぼくです):高専プロコンとComputer Vision

    • 今年の高専プロコン競技部門で出されたタスクがCVに関するものでした
    • いままでもそういうのあったので,非常に若い(10代中頃〜)のひとがCVに興味を持ってやってくれてることを紹介したくて発表しました
    • 資料は未許諾の画像の引用があるので,非公開です>< すみません・・・
  • @yasutomo57jpさん:背景モデリングに関する研究紹介

    • 発表資料資料
    • 定点カメラ映像から背景画像を推定する

      • 定点カメラ映像と言えども照明変動や木の揺れなどの変動を含むので,ロバストな背景推定は難しい問題だったりするわけです
    • 高専時代の卒論には背景差分を使ってて,背景画像の自動推定・更新をやってました

      • その時使った手法としては今回の話で分類すると「確率分布に基づく手法」になりますね
    • D論の関連研究紹介
    • 個人的で恐縮ですが,今回初めてお互い認識してお会いできたのが非常に嬉しかったです
  • @takminさん:Deep Learningに関する研究紹介

    • Building High-level Features Using Large Scale Unsupervised Learning
    • 大規模物体認識コンテストILSVRCで黒船のごとくやってきたDeep Learning,それに関する論文の紹介
    • 生の画素データを入力して,ニューラルネットで低次の特徴から徐々に高次の特徴に反応するネットワークを組む

      • 最上位でどのニューロンが生起したかでclassifyができるよ!という手法
    • とにかく規模がえげつない.
    • googleさんスゲー…
    • ただ,特徴抽出からの識別というオーソドックスな枠組みを一夜にして時代遅れにするものではなくて,DeepLearningの知見を生かしたHand-craftedな特徴量設計というアプローチが今後はでるはず
  • 高橋さん:ECCV2012報告

    • 今月開催されたばかりのトップ会議ECCV2012の参加報告
    • 採択率の話や,投稿数の話など
    • 面白そうだった研究など

      • 問題設定の新しさなどのアイデアでけっこう勝負できるということを再確認できましたね

懇親会

発表者4人(これ自体はたまたま)で懇親会(反省会ともいう?w)をしました.
ちょっと印象的だったのは, ちょっと印象的だったのは,機械学習の人が黒船が如くやってきて,CVをやっていた人たちが生き残るにはどうしたらいいんだろう?という話でした.機械学習の人が黒船が如くやってきて,CVをやっていた人たちが生き残るにはどうしたらいいんだろう?という話でした.
インタフェースの分野や制御の分野に進出することはひとつの生き方だし,機械学習の人がやってくるなら自分たちが機械学習の人になるというのもあるね,というかんじに.

(そもそも,たぶんこういうテリトリー思考すらも既に古い考えなのでしょうね.)

振り返って

今回は最先端なお話ばかりということで本当に楽しませていただきました.
僕個人としては発表内容の理解度がいつもよりよかったように思います.発表者の方の説明が大変わかりやすかったのもありますし,ここ最近けっこう勉強してきたのが生きたかな,とか思っておりますw

勉強会自体はいつの間にか20回を数えるまでになりましたね.ここまで来れたのもみなさんのご協力あってのことで大変感謝しております.

今回は発表者確保に手間取ってしまった故に告知が遅れてしまい,参加者は少なめ…かな?と思いきや,実際に開催してみるとけっこうな数の方に来ていただけました.
反省点は反省点として取っておくとして,それでも内容の濃さももちろん皆様からの質疑も結構活発でいいかんじだったんじゃないかなと思ってます.

あと,発表者の方の時間感覚が素晴らしくて,予定のタイムテーブルから3分とズレることなく最後までいけました.大変ありがたいことです.
僕自身は「これで時間使いきれるのかな?><」くらいの感覚でちょうどいいんだなと実感しましたw

無理を言って発表していただきました@yasutomo57jpさん,@takminさん,高橋さん本当にありがとうございます.
いつも場所をお貸しいただいてる中部大の藤吉先生(@hf149さん)やustしていただいた@fararrow9先輩にもこの場を借りて感謝いたします.

次回について

次回は2012/11/17(土)の予定です.
中部大・中京大の学生さん(配属前?)が多く来られるかもしれない,とのことです.
テーマは未定ですが,ここのところ最先端の研究紹介が続いたこともありますし,この際だからアプリケーションの紹介やCVの可能性の話などattractiveな内容にしてもいいかもな〜などと考えております.

実は次回の開催は,第1回勉強会開催から2周年ということになります.なにかそれに関しても考えてみようかな(・∀・)

Line Segment Detector線分検出器で秋をおいしくいただく

夏の暑さもだいぶやわらぎ,おさかなが美味しい季節になってきましたね.

画像からの線分検出といえばHough変換やRANSACなどがあり,そんな手法のひとつであるLSD;Line Segment Detectorを使ってみた.
原著は2010年のIEEE論文誌で発表されたようですね.今でもこれ系の分野がアツいということで見ていて楽しいですw

さて,ところで今日の記事は,
JugglerYou日記 :: LineSegmentDetectorを使ってみた
さんの記事の丸パクリに近い.
juggler_youさんはリアル知り合いだったりします.thx!

Continue reading

研究の全てをgitで管理してたら( ・∀・)イイ!!

ここ1ヶ月半くらいかな,研究データの全てをgitで管理してみるようにしました.

画像系の研究なので,テスト画像だったり,テスト画像毎の処理結果だったり,実験を走らせるためのスクリプトだったり,プログラムだったり.
今まではreadme的なテキストファイルに「これはいついつこういう目的でやった実験だよ!(>ヮ<*)」と書いてるだけだったんですが,時間軸方向の管理能力には限界があったのです.

全てをひとつのリポジトリにぶっ込むとリポジトリが肥大化しすぎて(それこそ画像数万枚の実験を何百回となく行うので,バイト数でいうとLinuxカーネルどころじゃない),速度的にさすがに問題が出てくるので,ひとまとまりの実験をひとつのリポジトリにして,全体はsubmoduleとして管理します.
特定の実験のためのアドホックなプログラムはさらにそいつのsubmoduleで,みたいな.

まだ日は浅く管理してる要素の数もそれほどですが,
ドジっ子おさかなさんはしょっちゅう実験ミスするので,こういう形であらゆる実験結果を検証できるようにしておくと非常によいです.

みなさんもいかがでしょうか?