2009-08-06[n年前へ]
■【SIGGRAPH 2009】NVIDIA社がレイトレーシング向けAPIを発表,SDK配布へ
【SIGGRAPH 2009】NVIDIA社がレイトレーシング向けAPIを発表,SDK配布へ
NVIDIA社は2009年3月に開催された「i3D 2009(ACM SIGGRAPH Symposium on Interactive 3D Graphics and Games)」において,「NVIRT(NVIDIA Interactive Ray Tracing API)」と呼ぶレイトレーシング向けのAPIを発表している。今回のOptiX Engineは,このNVIRTに正式名称が付いたもの。近日中にSDKを配布する予定で,2009年8月3日から開催予定のSIGGRAPHにおいて詳細を解説するという。
2009-12-28[n年前へ]
■NEWS今昔物語「瞳を開いて眺める」編 (初出2005年06月23日)
5年前のNEWS(未来)を振り返ってみて思うこと
「未来を予測し・未来を少し操作するような作業」をする、と言えばカメラの赤目防止機能も、考えてみれば、そんな作業です。フラッシュを光らせた時に、瞳が赤く写ってしまわないように、フラッシュを使って写真を撮る前に予備発光を行ない被写体の瞳孔を閉じさせた次の瞬間に、本番のフラッシュを光らせ写真を撮る、というわけです。意外に、そういった技術は、身の回りに隠れていて、私たちはいつの間にか少し操作されているのかもしれません。
(記事を書いた時の)ひとこと
液晶画面をペンで操作することができる(もちろん、キーボードでも操作できる)Tablet PCを使い始めた。すると、「マウスで操作する」という作業が「ペンや自分の手を使う作業」のフェイク(偽物)に過ぎなかった、ということに今さらながら気づかされた。未来のPC、そのPCを扱うユーザ・インタフェースは一体どんな風に変化していくのだろうか
トランプ・カード透視術
6月1日、(自分から見るた時に)裏向きのトランプのカードを透視し、どんなカードであるかを見分けてしまうことができる技術がNewScientist.comに掲載された。7月31日から開催されるSIGGRAPH2005で発表予定の資料(">全文PDF)を読むとわかるように、他の物体に跳ね返る(自分からは見えない)カードの表面からの反射光の色や量を逆算することで(結果として)カードの表を透視できる、という技術である(日本語参考記事)。
デモンストレーションの動画(MP4形式 63MB)の後半(4分20秒辺りから)を眺めてみれば、その技術の楽しさ・面白さに見とれてしまうと思う。
みんなが笑顔の「ベストショット検出技術」
大学生の頃、写真館でアルバイトをしていた。仕事の大半は、結婚式の記念写真を撮影する仕事である。結婚式の集合写真を作成する時、(気をつけて何枚か写真を撮るのだが)瞳を閉じ気味であったり、閉じてしまった人がいることがある。そんな時には、極細筆を使い目を閉じている人の瞳を(他の写真を参考にして自分の手で)描いたものである。
そんな新技術が5月末から、各種メディアで紹介された。電気通信大学院 電子工学専攻の金子研究室の「ベストショット検出技術」は、デジカメで連続撮影した十数枚の画像中から、その中で撮影された人たちの瞳検出・抽出を行い、すべての人が目を開いている写真があれば、その「ベストショット写真」を出力する、という技術である。さらに、もしも目を閉じている人がいれば、その人の「目をつむっていない部分画像」を他の写真から探し出し、「ベストショット写真」を合成することで、造り出してしまおうというものである。
こういった技術は以前から開発されている。例えば、まばたき検出から目を閉じている写真を防止するだけでなく、さらに笑顔検出も行って笑顔の瞬間の写真を出力しようというような技術もある。
写真館でのバイト中、「被写体の気持ち・動きをいつも予測するようにしろ」というアドバイスを受けることが多かった。「(例えば何か面白いものを見て)次の瞬間に笑顔を見せる、(例えば何かに気づき)次の瞬間にふと考えごとをする、(歩く先にライトが当たっていたら)眩しくて目を閉じる、そんな未来の被写体の動きを予測しながら映す瞬間を考えろ・そしていい瞬間になるようにして待ちかまえろ」と言われていた。
そんな作業、未来を予測し・未来を少し操作するような作業も、デジタル信号処理が肩代わりするようになる時代が、近く来るのだろうか。
実は3倍の大きさだった「アンドロメダ座大銀河」
先月末、地球から200万光年先にあるアンドロメダ座大銀河の大きさがこれまで知られていたよりも実は3倍も大きかった、という報告がされた(日本語記事)。以前は、直径がおよそ7~8万光年と見積もられていたが、今回周辺の天体の動きを観測した結果、実は22万光年以上の大きさであることがわかった、という。
アンドロメダ銀河の直径が8万光年なら地球から眺めた時の大きさは2.3°程であるが、もし直径22万光年ならば6.3°にもなる。6.3°というと、11cmの直径のものを1m離れて眺めたときの大きさである。
両手を伸ばして、左右の親指と人差し指をで「大きな円」を作ってみよう。それが、今回判明したアンドロメダ銀河の大きさだ。もうすぐ始まる夏からは、アンドロメダ銀河を眺めるのに良い時期になってくる。夜空に向かって両手を伸ばし、自分の指越しに「大きな銀河」の姿を思い浮かべてみよう。直径22万光年もの大きさのアンドロメダ銀河を、自分の指で作ったリングの中で眺めてみれば、きっと奇妙で不思議な感覚に襲われると思う。
2010-01-02[n年前へ]
■製品化されつつあるコンピュータ・ビジョン技術動向
もう一つ,私が大きな流れになってきたと感じているのが,これまでコンピュータ・ビジョンのR&Dに多大な投資を行ってきたIT系の大企業が,いよいよ本気で商品を世に出し始めたのではないかという点です。
この分野の研究に多大な投資をしているIT企業というと例えば,Microsoft,Adobe,Googleが挙げられます。特に前の2社は,CVPRやICCV,SIGGRAPHといった世界トップクラスの国際会議に,毎回多くの研究を通しています。この3社が昨年,次々と驚くべき製品/サービスを発表しました。
2014-08-15[n年前へ]
■「スマホで簡単3次元計測」MS論文を簡単に試してみよう!?
『スマホの赤外線カットフィルタ取り外して、赤外線投光器取り付けて、距離と輝度の関係(とあと適当な機械学習で)、スマホを簡易3D形状センサにしちゃう』という話(論文、ビデオ)が面白かったので、簡単な実験してみました。100円ショップのライト前面にピンホールと拡散板を組み合わせてた点光源作り(箸で穴開けた紙にティッシュ貼り付けただけ、とも言う)、立体メガネから取り外した回転偏光フィルタで表面反射光を除去した上で、なるべく光源とレンズを近づけた配置にして(影ができてるけど=光源と撮像系が一致してないけど)、デジカメで撮影した画像から3次元形状の復元をしてみました。
ピンポン玉を撮影したり、カメラに向かって広げた指を撮影して、その画像から簡易に3次元形状を復元してみたのが下に貼り付けた画像です。…まぁ、こんなところでしょうか。
点光源と撮像系位置を一致させれば、遮蔽による影や対象物の法線分布を無視できる系になるでしょうから(件の論文にはそうしたことは書かれていませんが)、今度は透明シートをハーフミラーの代わりにでも使って、そうした簡易実験でもしてみようかと思います。
2015-03-05[n年前へ]
■未来に失われる「今この瞬間」に没入できる「この瞬間を記録しておくこと」は、きっと未来の役に立つ
SIGGRAPH2015の没入感コンテストみたいな「没入感コンテンツ」を作るなら、個人的には「実写は使わない」。だって、どこかに行けば本物が存在する”コンテンツ”だったとしたら、本物の方がずっとリアルだし・豊かだし、その本物と再生物の間にある差分としての「物足りなさ」を感じちゃうだろうし。
だから、たとえば「昭和の日本の景色」みたいな、もう行くことができない場所に行けるコンテンツならば、とても体験してみたいと思う。もう今は存在しない60〜80年代の東京、数え切れない人たちが生活していた香港九龍城、廃墟となる前の軍艦島、90年代のバンコク…何だかそういう没入感コンテンツこそ眺めてみたい。(参考:昭和が古臭く見えたり懐かしく思えるのって写真の画質のせいだよな?)
かつて自分がよく知ってた世界を眺めると、色んな記憶が鮮明に甦る。…だから、GoPro6台リグとか、Ricoh Theta m15みたいな全天周動画を撮れるカメラで、普通の場所を意味無く撮り溜めておけばいい思う(昨年11月のチェンマイ・ロイクラトンは、そんなGoPro6台リグ野郎達が溢れてた。韓国から来たGoPro6台リグでステレオ撮影していた野郎は熱かった。…しまった名前聞いとけば良かった。<−3m三脚の上にTheta取り付け撮影してたわたしもたぶんその野郎のひとりだ)。そうすれば、20〜30年後、その世界に没入し・症状が改善する将来のボケた老人(それはつまりは将来の自分自身のことだ)だってとても多いだろう。
今、Google Street view carが走り回って写し続けてるこの瞬間の360°の街並みの数々は…きっと十年・二十年先に、貴重なメディカル・マテリアルになっているに違いない。Google Medical health care centerとか、数年先に立ち上がってても、全然違和感ないかも(Google社員が読んだらら鼻で笑いそうだけど)。
で、3丁目の夕日的なかつての昔あった世界をレンダリング生成し甦らせる技術を持っている人たち作り上げるコンテンツが、数年先には、(多分)認知症治療とかその手の業界で普通に使われ・役立っているんだろう、と思う。それは、機械・光学・物理技術が現在の医療を作り上げてきたけれど、将来は情報技術がその役割の少なくない割合を担っているという具合だろうと考えてみたりする。