2006-02-12[n年前へ]
■斜め配置CCD・CMOの秘密 前編
「画素を45度回転させ斜めに配置した」クリアビッドCMOSセンサをSONYが発表した時に、Fast & First 情報掲示板(No.9601, No.9603)で「斜め配置センサと通常配置センサの解像度」について少し書かれています。それを面白く読みながら、書かれていたことを自分なりに整理して、つらつらと考えごとをしてみました。その内容を前編・中編・後編としてまとめてみることにします。あくまで撮像素子の部分だけを考え、後の画像処理の部分については全く考えていません。また、素人のテキトーな自主学習なので、内容について信頼性が全然ないことをお断りしておきます。
撮像素子を45度傾けると高解像度に
通常の撮像素子の画素は垂直・水平方向に綺麗に並んでいます。例えば、撮像素子の画素を適当に描いてみると右のような感じになります。つまり、単位長さ1×1の大きさの正方形状画素が(各画素が垂直・水平方向に並びながら)平面をびっしり埋めている、というイメージです。こんなイメージ画像を描いてみた後に、水平(あるいは垂直)方向の解像度、すなわち「単位長さあたりの画素数」がどうなるかを考えてみることにします。
この場合、画素の大きさが1なのですから、距離(単位長)1あたり画素が1個あることはすぐにわかります。つまり、水平(垂直)方向の解像度は「単位長さ辺り1画素」となっているわけです。試しに、水平(垂直)線を任意の場所で描いてみると、「長さ1あたり画素を必ず1個横切る(長さ1あたり画素が1個ある)」ということを確認することができます。
それでは、この撮像素子中の画素配置を45度傾けた(回転させた)場合、水平(垂直)方向の解像度はどのようになるでしょうか? この場合も、適当なイメージ画像を描いて考えてみることにしましょう。…そこで、右のように、各画素の配置を「45度」回転させた撮像素子を描いてみます。そして、水平(垂直)線を任意の場所で描いてみると、「ほぼ(つまりごく限られた特殊な条件を除き)」全ての箇所で「長さ√2あたり画素を必ず2個横切る(長さ√2あたり画素が2個ある)」ことがわかります。
つまり、水平(垂直)方向に対しては、単位長あたり「2 / √ 2 = √ 2 ≒ 1.4」個の画素があることになるのです。つまり、撮像素子の画素を45度斜めに傾いた配置にすることで、1.4倍の解像度化を実現することができた、ということになります。もちろん、(この状態で)45度斜めの方向に対する解像度は「単位長1あたり1個の画素」ということになっているわけですから、逆に言えば、水平・垂直方向に各画素が綺麗に並んでいる配置の場合には、45度斜めの方向に対する解像度が「水平・垂直方向よりも1.4倍高かった」ということになるわけです。
視覚特性は斜め方向には鈍い
ところで、人間の視覚特性は斜め方向に対しては感覚が鈍くなっています。ということは、人間が画像を眺める際には、その画像の斜め方向の解像度は低くても構わない、ということになります。斜め方向の解像度は低くても構わないから、その分水平・垂直方向の解像度が高い方が良い(アラが目立たない)というわけです。つまり、「ごくごく単純に考える限りは」画素配置を45度斜めに傾けたタイプの撮像素子の方が、人間の視覚特性と特性が合っていて都合が良い、という風に思えます。
それでは、現在多く発売されている製品で使われている撮像素子を45度傾ければ高解像度化するか、というとそうはなりません。それは、現状の撮像素子では(本来モノクロの)撮像素子をカラー化する時の手順中において、(多くの場合)すでに45度回転のテクニックが使われているからです。
RGGBフィルタを使ったカラー化の場合
本来「カラー」でない撮像素子をカラー化するためには、色のついたフィルタを撮像素子の前にとりつけることになります。例えば、原色フィルタと呼ばれる「赤・緑・青色のカラーフィルタなどを各画素の前にとりつけるシステム」では、赤色・緑色・青色それぞれの光の割合がわかるように、各画素の前にRGB(Red, Green, Blue)いずれかの色のフィルタをつけます。例えば、右のイメージ図はRGGB配列のベイヤー配列のカラーフィルタのイメージ図です。近隣4画素のうち、1画素ずつに青色と赤色のフィルタを張り、残り2画素に緑色のフィルタが張られています。緑色の画素が青色と赤色の画素の2倍の量にされているのは、人間が感じる視覚特性は緑色の成分によるところが大きいからです。
それでは、話を簡単にするために、人間が感じる視覚特性への寄与が大きい緑色に割り当てられた画素だけを抽出して、フィルタ方式のカラー撮像素子における解像度を考えてみることにします。右の画像は、緑色の画素だけを描き、そして各画素間の境界線中心を点線で描いてみたものです。このように、補助線を描いてみると、緑色を担う各画素がどのように配置しているかがわかりやすくイメージできるようになります。この点線で描かれた緑色の画素配置をひとことで大雑把に言ってしまえば、√2×√2の大きさの画素が45度傾いた状態で配置されている、ということになります。つまり、つまり、RGGB型のベイヤー配列のカラーフィルタを使ったカラー撮像素子においては、すでに45度回転配置により高解像度化のテクニックが(視覚特性への寄与が大きい緑色に対して)使われているというわけです。
実際、右の画像で、水平(垂直)線を任意の場所で描いてみれば、「ほぼ(つまりごく限られた特殊な条件を除き)」全ての箇所で「長さ2あたり画素を必ず2個横切る(長さ2あたり画素が2個ある)」ことがわかります。つまり、単位長さ1に対して水平(垂直)方向には画素が1個の解像度がある、というわけです。本来は「√2×√2の大きさの画素」ですから、もしも45度回転したような配置にしなければ、水平(垂直)方向には長さ√2あたり1画素の解像度しかなかった、ということになります。しかし、緑色が斜めに配置されたRGGB配置にすることで、緑色画素を45度回転させることができて、結果として1.4倍の高解像度化がされていることになります。
RGGBフィルタCCDを45度回転させたらどうなる…?
それでは、カラーフィルタがRGGBの配置をしている撮像素子を45度回転させた場合にはどのようなことが起きるのでしょうか? 例えば、右の画像のように回転・配置させてみた場合には、解像度はどのようになるのでしょうか。右の配置は、ちょうど冨士フィルムのハニカムCCD(資料1資料2)と同じような場合なのですが、この場合に人間の視覚特性上重要な水平・垂直方向の解像度はどのようになっているのでしょうか? …上の例と同じように、このRGGBフィルタCCDを45度回転させた場合でも考えてみることにしましょう。
さきほどと同じく、この右の画像には緑色の画素だけを描いてあり、そして各画素間の境界線中心を示す直線を描いてあります。すると、この場合というのは、「√2×√2の大きさの画素」が水平垂直方向に綺麗に並んでいることがわかります。そして、この画像中で水平(垂直)線を任意の場所で描いてみれば、全ての箇所で「長さ√2あたり画素を必ず1個横切る(長さ√2あたり画素が1個ある)」ことがわかります。長さ√2あたり画素が1個ということは、単位長さ1あたりならば水平(垂直)方向に画素が0.7個の解像度ということになります。
つまり、RGGBフィルタCCDを45度回転させてしまうと、視覚特性上重要な緑色の水平・垂直方向の解像度が「単位長あたり1画素」から「単位長あたり0.7画素」に低下してしまっている、ということになります。ということは、単純に「人間にとって重要な緑色の解像度」だけを考えるのであれば、(RGGBフィルタを使った場合)斜め配置センサは決して有利とはいえない、ということがわかります。
クリアビッドCMOSセンサの場合
単純に「人間にとって重要な緑色の解像度」だけを考えるのであれば、(RGGBフィルタを使った場合)斜め配置センサは決して有利とはいえないというのであれば、先日発表されたクリアビッドCMOSセンサの場合には一体どうなっているのでしょうか…?謳い文句の「画素を45度回転させ斜めに配置することで、1画素の面積を大きくしながら(高感度にしながら)、解像度は維持」というものは一体どういうことなのでしょうか?
そこで、SONYのサイトにある情報(右にページ・サムネイルで示したページ)を見てみると、RGGB配置のカラーフィルタを使っているわけではないことがわかります。4画素×4画素中に緑色を12画素を配置し・赤色と青色を2画素ずつ配置するという独自の配列です。つまり、大胆に言ってしまえば、ほとんどの画素を緑色担当にしているわけです。よくあるカラーフィルタの配置とは全く違うわけです。
ほとんどの画素が緑色担当ということは、非常に大雑把に言ってしまえば、緑色単色のモノクロ撮像素子のようなものですから、一番最初に「撮像素子を45度傾けると高解像度に」で書いたように、45度回転配置による高解像度化の効果が生じます。クリアビッドCMOSセンサの場合、1画素の面積を大きくすることで高感度を実現しようとしています。つまり、通常であれば1×1の大きさの画素の面積を大きくして、√2×√2の大きさにしてあります。そして、その画素を斜め45度に回転させたモノクロ撮像素子のようなものであるわけです。…ということは、結局のところ、上で考えてみた「RGGBフィルタを使ったカラー撮像素子」と全く同じ解像度であることがわかります。なるほど、赤色と青色の画素数を減らし、その分の面積を緑色に回すことで、高感度と高解像度を両立させようという考え方であるようです。
色情報の解像度はどうなる?ハニカムCCDなら…?
ところで、クリアビッドCMOSセンサの場合には、赤色と青色の画素数を減らしているわけですから、色情報の解像度をある程度低く設定しているわけです。また、「RGGB配置を45度回転させた」富士フィルムのハニカムCCDは(視覚特性上重要な)緑色に関する限り解像度の点で有利には見えないわけですが、やはり何らかのメリットはあるはずです。そこで、そういった点について、中編・後編で考えてみたいと思います。
2006-03-11[n年前へ]
■「ハイスペックな人」と「年収500万円の境界線」
先日、ある人材を扱う会社で打ち合わせをしている時に「ハイスペック」という言葉が飛び出てきました。意味がわからなかったのですが、何回か聞き直してから、ようやく「人」を指す言葉だということがわかりました。「優秀な人」というような意味で、「ハイスペック」という言葉を使うのだというわけです。PCなどの製品を扱う際には、よくスペックという言葉を確かによく使います。「人」を売り買いする会社なので、製品たる人を差して「スペック」という言葉を使うのでしょう。
そこで、私は「ハイスペックでない人はなんて呼ぶのでしょうか?」と聞いてみました。…すると、「そういう人を話題にすることは少ないので、とりたてて(そういう人たちを指す)名前はありません」という答えでした。なるほど、何だかとても「リアル」な話です。「ハイスペックでない人」「優秀でない人」は話題に上らない、というわけです。ハイスペックでなくて、優秀でもない私としては、背筋に汗をタラタラかきつつ、リ・リアルだ…と心の中で呟いていたのです。いえ、もしかしたら、口に出して呟いていたかもしれません。「そういう人を話題にすることは少ないから、呼び名も特に必要ない」というリアルさに、まさにそんな私は「吾輩は猫である。名前はまだ無い…」と呟きながら、ただダラダラと汗をたらしていたのです。
そして、「ハイスペックの基準」はというと、これがまた興味深い基準でした。なぜかというと、ハイスペックか否かは「市場価値が決める」というのです。そして、その市場価値は結局のところ「現在の給料」が大きな基準になる、というわけです。価値が金額を決めるのか、金額が価値を決めるのか…?というようなナゾを私はふと考えてしまいました。…そして、そのハイスペックか否かのボーダーラインは「年収500万円」だということを聞いて、さらにもっと複雑な気持ちになったのです。「年収500万円以上の人たちが"ハイスペック"」という言葉を聞いて、何とも形容しがたい気分になったのです。
どこへ行っても跳ね付けられて相手にしてくれ手がなかった。いかに珍重されなかったかは、今日に至るまで名前さえつけてくれないのでも分る。
夏目漱石 「我が輩は猫である」
2006-04-05[n年前へ]
■「過去と未来の境界線」
from n年前へ.
もうすぐ鉄腕アトムの誕生日2003年4月7日だ。50年近く夢の未来だったアトムの誕生日は、もうすぐに「過去の未来」になる。 そういえば、私たちはいつだって、過去と未来という二つの面の接点にいる。過去と未来の狭間にいつだって私たちは立っている。少しだけでも後ろを振り返ってみれば、そこは過去の世界だし、足下の先に見える世界は全部未来の世界だ。
2006-09-07[n年前へ]
■「apple」「飲食店」「風俗店」
今日のn年前へは「appleのビデオ機能」や「飲食店」と「風俗店」の境界線などです。
2008-02-25[n年前へ]
■「ゴールデン/デッド・クロス」と「ナンシー版画」
株とか為替の売買のタイミングの指標である「ゴールデン・クロス」「デッド・クロス」というものを知った時に、対象ジャンルがどんなに違っていても、(専門的でない)基本的な技術はほとんど同じなのだな、と感じたのが「ナンシー版画アルゴリズム」を作った時後に、株や為替売買の指標となる「ゴールデン/デッド・クロス」を知った時だ。
ゴールデン・クロスとデッド・クロスというのは、何かの価値の「短期的な平均」が「長期的な平均」よりも上になったら(ゴールデン・クロス)、その価値が「上昇中」と判断し、その価値の「短期的な平均」が「長期的な平均」より下になったら(デッド・クロス)、その価値は「下降中」だと判断するやり方である。たとえば、何かの株価の「25日間の平均値」が「75日間の平均値」を上回ったら、その変化はなにかのノイズや誤差でなく「株価が確かに上昇傾向にある」ことを示していると判断し、その株価の「25日間の平均値」が「75日間の平均値」を下回ったら、株価が確かに下がり始めていると判断する、そういったやり方である。言い換えれば、「25日間の平均値」と「75日間の平均値」、すなわち、「短期的な平均」と「長期的な平均」が交差した瞬間が、「上げ」と「下げ」の境界地点だと判断するやり方である。そういった株や為替の上下の境界線を長期平均と短期平均の差分から判断する方法が、「ゴールデン・クロス/デッド・クロス」だ。
「ナンシー"小"関 風 パッチもん版画」作成ソフトの輪郭抽出アルゴリズムも、「ゴールデン・クロス/デッド・クロス」と完全に同じアルゴリズム(やり方)で作られている。実際のところ、このプログラムは10行に満たないほどの実にシンプルな「境界」検知プログラムに過ぎない。そして、その実現アルゴリズムは「狭い範囲で平均化した明るさ」が「広い範囲で平均化した明るさ」が等しくなる=交差する箇所がモノの「境界」だと判断するだけ、である。つまり、「ガウシアン差分」を行うことで顔や景色の境界線を描画した上で、さらに塗りつぶしを行うだけのアプリケーションが「ナンシー"小"関 風 パッチもん版画」作成ソフトである。
株や為替の売買の判断も、目に見えている画像の認識・判断も完全に同一のアルゴリズムで判断することができたりする。それは、対象とする現象(のジャンル)は違えども、どちらも「境界線」「分水嶺」判断をするという同じ作業に過ぎないのだから、至極当たり前の話であるのかもしれない。…けれど、それはやはり少し面白い話であると思う。全然違うように思える事柄が、完全に同一の処理で解決することができたり、一つの道具で全く違う(ように見える)世界を描くことができたりするのは面白いと思う。