1999-09-26[n年前へ]
■デバイスドライバーは仮免
ClearTypeの秘密
昨年、COMDEX/Fall '98においてMicrosoftが発表した「ClearType」技術というものがある。液晶ディスプレイなどの表示の解像度をソフトウェアのみで向上させるという技術である。PCだけでなく、液晶を使った電子ブックなどをターゲットにしているという。(参照:http://www.zdnet.co.jp/news/9811/16/gates.html)
技術の詳細については、「特許申請中」ということで、明らかにされていない。しかし、その技術について推論している人は数多くいる。例えば、
- Optimising LCD display of text( http://oxy.sfx.co.nz/lcdtype/ )
- The Technology of Sub-Pixel FontRendering ( http://grc.com/cleartype.htm )
ビックリすることに、確かに効果があるのである。カラーシフティングによりシャッキリした文字になるのだ。しかも滑らかなのである。デジタル接続の液晶を用いている方は確認すると面白いと思う。
もっとも、こういう画像はWEB上で納得するのは難しい。JPEGのような圧縮画像では、情報が完全には保存されず、意図した出力ができないからである。とりあえず、デジタル接続の液晶ディスプレイを使っている方はとにかく試してみると良い。目からウロコである。
さて、この原理であるが、カラーシフトについては色々なところで説明してあるが、若干わかりにくい画像例が多い。そこで、自分流に解釈しなおして考えてみたい。そして、実験してみようと思う。
まずは、右上から左下に走る黒字に白斜線を考えてみる。1ドット幅で、しかも、上から下へ行く間に1ドット右から左にずれるようなものである。液晶の1ドットはRGBが縦に並んでいる。例えば、
で計測した画像例だと、 1ドット幅で、しかも、上から下へ行く間に1ドット右から左にずれる黒字に白い斜線を考えてみる。これはそのような斜線を拡大したものである。
そのような斜線を液晶で描くと通常は下の左図のようになる。通常の処理が左で、カラーシフトを用いた処理が右である。通常の処理ではRGBの位置を同じものとして処理しているので、RGBそれぞれが同じように変化している。しかし、カラーシフトを用いた処理においては、RGBの各位置が異なっていることを考慮の上、処理を行ってみたものである。そのため、滑らかな斜線になっているのがわかると思う。
このように、デバイスの個性を把握した上できちんと生かしてやれば、デバイスの能力をもっと引き出すことができるわけだ。 個性の違いを越える世界というのは、個性を無視した世界とはまったく逆であり、個性を最大限理解して初めて個性の違いを超えることができるのだ。
さて、効果を確認するために、そのようなハーフトーンパターンを作成してみた。ただし、ここで表示している画像はJPEGに変換してしまっているので、効果は現れない。また、本来見えるはずの画像とはかなり異なってしまっているので、各画像をクリックしてオリジナルのTIFファイルをダウンロードして確認して欲しい。
さて、この画像ではわからないだろうが、TIFFファイルの方を見て頂くと、カラーシフトを用いた斜線ハーフトーンの方では、色模様が出現してしまっているのがわかると思う。それは、液晶のガンマ特性を考慮していないからである。
このガンマ補正については、一般的に使われるガンマの意味だけでないものが含まれている。一言では簡単には説明しきれないので、説明は次の機会にする。Free&Crearでもそのガンマ特性を調整する機能がついている。白地に黒文字であるか、黒字に白文字であるかの違いがあることに注意すれば、その数字の意味がわかる。ここでは、その補正をしたものを示すだけにしておく。と、いっても、私が使用している液晶のガンマを考慮したものなので、一般的には役に立たないだろう。
あなたが目にしている画像では、画像ではガンマ補正した方が変に見えていると思う。それは、私とあなたの使っているデバイス(と視点)が異なるからである。ここでやったのと同じやり方で、あなたの液晶に合わせて(なおかつ、同じ視点で)やれば、きれいに出るはずだ。
さて、この結果を私の液晶で見てみると、カラーシフトを用いた斜線(ガンマ補正後)の方ではきれいに斜線のハーフトーンが出ている。ただ、いくつか問題があるのだが、それは次回までの宿題だ。と、いってもヒントはすでに「できるかな?」中でも出現している。ごく最近の話題でも、だ。
このカラーシフト技術は実に単純なアイデアである。しかし、これは実に面白いアイデアであると思う。効果が有る無しに関わらず、こういうネタは私は大好きである。ただ、こういう技術が日本のデバイス屋さんから出てこないことが少し残念だとは思う。デバイスもドライバーも両方作っているところにがんばって欲しいものだ。それまでは、「デバイスドライバーは仮免」といった所だろう。 .....うーん、ちょっと、強引かな。というわけで、何故か私の手元にはPalm-size PCであるCasio E-500があり、そして、久しぶりにVisualStudioをいじり始めるのであった。。
1999-10-07[n年前へ]
■CCDカメラをバラせ!
モアレは自然のClearText
あまり、「できるかな?」では工作の話題が出ていない。いや、もしかしたら全然出ていないかもしれない。そこで、手元に8mmビデオのジャンクがあったので、こいつをバラしてみることにした。そして、これまで「できるかな?」に登場しているような話に関連していることがないか調べてみるのだ。いや、本当は嘘で計画済みの伏線張りまくりの話である。もしかしたら、勘のいい方はもう話の風向きはもうおわかりかもしれない。
さて、今回分解するカメラはかなり前(といっても数年前)のモデルである。まずは、分解してみよう。
5.の写真でわかるように、CCD前部にはフィルターが着けてある。(当初はこれを赤外線フィルターだと考えていた。なので、このフィルターを外してやると、画質はとんでもないことになる。しかし、その上で赤外線投光器を装着すれば面白いカメラになりそうである。が、用途を間違えるととんでもないことになるので、今回はやらない。が、いつかやってみようとは思っている。もちろん、私は品行方正がモットーであるので、悪用はするわけがない。もちろんである。)と、書いたがその後、「これは赤外線とは逆のエイリアシング防止用のハイカットフィルタだろう」というご指摘を頂いた。フィルターが青色だったので、単純に赤外線カット用途かと思い込んでいたが、どうやら違うらしい。指摘の文章をそのまま、使わせていただくと「CCDは空間サンプリング素子であり、サンプリング周期(ピクセルのピッチ)よりも短い波長の光が入ると、エイリアシング(折り返しノイズ)を生じて擬似カラー、干渉縞を生じてしまいます。これを避けるためのハイカットフィルタです。」とある。その後、知人から頂いた資料(勉強しなおせ、ということだろう)を読むと、水晶板をだぶらせて2重像にすることにより、細かい解像ができないようにしているローパスフィルターであるようだ。空間周波数のローパスである。今回のCCDでは3層構造になっており、中央の層にのみ色がついている。反省がてら、次回にもう少し調べてみようと思う。
ところで、7.などの拡大画像で周辺部が丸くケラれているのがわかると思う。これは、
と同じく実体顕微鏡の接眼部からデジカメで撮影を行っているからである。デジカメはこういう時に何より重宝する。さて、デジカメと言えば、こちらも同じくCCDを用いているわけである。さて、8.の拡大画像を見ると、このカメラのCCDのカラーフィルターは補色方式(CMYG=シアン、イエロー、マゼンダ、グリーン)であることがわかる。原色タイプでないところを見ると、どうやら感度重視の製品であるようだ。また、この拡大画像などを眺めると、
で調べた液晶のフィルターと同じような構造であることがわかる。よくストライプ模様の服を着ている人をCCDビデオカメラで撮影すると、モアレが発生することがあるが、それはこういったフィルターの色の並びに起因しているわけである。フィルターの周期とストライプの模様が干渉してモアレが生じてしまうのである。 最近のものではソフト的にかなりの処理をしてモアレが出にくいようにしているし、CCDも高解像度化が進んでいるので、なおさら出にくい。私が使用している富士写真フィルムのFinePix700でそのようなモアレを出そうと思ってみたが、なかなか出なかった。むしろ、ピントを正確に合わせることができなかった。それでも、何とか白黒の縦線模様を撮影して、モアレを出してみたのが下の写真である。左がオリジナルで、右がそれに強調処理をかけたものである。
モアレが発生しているのがわかると思う。さてさて、こういう白黒ストライプをよく眺めてみれば、
で登場したこの画像を思い出すはずだ。そう両者ともまったく同じ斜線である。そもそも、前回作成したパターンは今回への伏線であったのである。白黒の縞模様を撮影しているのであるから、普通は白黒模様しか撮影されない。しかし、モアレが発生している場合というのは、CMYGからなる1画素の中でのさらに細かな位置情報が判るのである。先ほどのCCDの色フィルターの拡大写真のような配置になっていることを知っているのであるから、その配置も考慮の上処理してやれば良いのである。もちろん、白黒の2値からなる画像を撮影しているという前提条件は必要である。その前提条件さえつけてやれば、モアレが生じていることを逆に利用して、高解像処理ができるはずだ。
例えば、
Green | Magenda |
Yellow | Cyan |
という画素のGreenだけ出力が大きかったとすると、グレイ画像であるとの前提さえ入れてしまえば、1画素のさらに1/4の領域まで光が当たっている位置を推定できるということになる。もちろん、実際のカメラでも4色の間で演算をしてやり、ある程度の推定はしているだろう。しかし、前提条件を入れてやれば、より高解像度が出せるだろう。
ClearTextの場合は白黒2値の文字パターン、あるいはハーフトーンという前提条件をつけて液晶に出力を行った。今回は、白黒2値の文字パターン、あるいはハーフトーンという前提条件をつけて、CCDからの出力を解釈してやれば良いわけである。CCDカメラにおいては自然が自動的にカラーシフト処理をしてくれるのである。そのカラーシフト処理からオリジナルの姿を再計算してやれば良いわけである。もっとも、これらのことは光学系がきちんとしている場合の話である。
今回考えたような、そういった処理はもうやられていると思う。FinePix700でも撮影モードに
- カラー
- 白黒
うーん、白黒のほうがキレイなような気もするが、よく判らない。念の為、強調処理をかけてみる。もしかしたら、違いがわかるかもしれない。
うーん、これではますます違いがよくわからない。これは、次回(すぐにとは限らないが)に要再実験だ。ただ使っている感覚では、まずピントがきちんと合わないような気がする。うーん、難しそうだ。それに、今回の実験はローパスのフィルター部分をなくしたものでなければならなかったようにも思う。ならば、FinePix700を使うのはマズイ(直すのメンドクサイから)。どうしたものか。
1999-11-05[n年前へ]
■草迷宮・空間'99
ネコの目から見た世界
「猫の視点から世界を眺める」という本や漫画は実に多い。漱石の「我輩は猫である」を始め、大島弓子の「綿の国星」がそうだ。そして、今回のタイトルになっている内田善美の「草迷宮・草空間」もそうだ。
犬を擬人化して語られる物語もある。例えば、「のらくろ」を始めアニメの「名探偵ホームズ」もそうだ。しかし、私としては「猫の視点」で語られる物語に軍配を上げたい。どうも、犬の視点から語られる物語には、主観性が感じられないのである。好きではないのだ。
その猫と犬の違いは、ドラえもんとヤッターワンの違いといっても良いだろう。このニュアンスが伝わるかどうかは多いに疑問であるが。
さて、HOT WIRED JAPAN に
- 「ネコの視覚の再現ビデオ」(http://www.hotwired.co.jp/news/news/technology/story/3213.html )
ネコの視床にある177の神経細胞に電極を取り付け、神経細胞の興奮パターンからネコが見ている画像を再構成した、という研究報告である。
そのオリジナルの報告は
- InformationProcessing in the Visual System ( http://deas.harvard.edu/~gstanley/research/vision/vis.html)
せっかくなので、「できるかな?」でもネコが見ている世界モドキの画像を作成してみることにした。先のWEBを参考にして、モドキを作ってみる。以下の手順を納得する(あるいは納得しない)ためには、先のWEBを読むことが前提となる。
まずは、ネコの神経細胞の視野に対応する電極位置を確認してみる。
視野に対応する電極の位置。赤はその内部に正の反応を持ち、青はその外部に正の反応を持つ。(ここらへん、私の理解は少しアヤシイ) |
この画像から、赤と青に対応する部分を抽出してみる。
Red | Blue |
うーん、Blueの方はずいぶんと取りこぼしが多い。それは、赤は丁寧にやったんだけど、青は雑にやったからである。青は、あまり重要でない(と私が考えた)からである。その理由は赤と違ってあまり狭い空間分布を持たないからである。
次に、Redと(Blueを反転したもの)を足して(黒を正として)、ガウス分布のぼかしをかける。青で示された電極を反転させたのは、それが負の反応を持つ電極であるからだ。
その計算結果がネコの視覚モドキのフィルターである。
この画像と任意の画像をPhotoshopで「スクリーン演算」するのが、「できるかな?」的ネコ視覚フィルターである。
ためしに、適当な画像を見てみよう。海沿いにいる人物を「もしネコが見ていたら、どう見える?」という場合である。
こう見えるのだ(保証はしないけど)。
「ネコが私を見るとどうなるか?」と思ったことは、何回かあるが、まさかその答が手に入るとは思わなかった。科学、恐るべし、だ。
1999-11-13[n年前へ]
■やっぱり、ウニが好き !
Dr.フラーはウニの夢を見るか?
私は野球は特に好きでも嫌いでもないが、野球場でビールを飲むのは大好きだ。と、始めると
の間違いと思われるかもしれない。しかし、それは違う。今回は、ウニとドームハウスの共通点について、考えてみたい。ただ、かなりビールが脳みそにしみているせいか、少しドンデモ話になるかもしれない。そこは、「ビックエッグの力学」と共通である。 私の中では、野球観戦と言えば、ビールだ。野球にはビールが良く似合う。そして、今現在も目の前にはビールがある。そして、寿司がある。といっても、スーパーで買った安物である。二つ合わせても1000円にしかならない。
安物といっても、私の住んでいるのが港町だから安い、ということもある。何しろ、ほとんどのスーパーの魚売り場でイルカの肉なども置いてあるのだ。嘘ではない。ホントにホントである。私も、引っ越してきた当時はビックリしたが、本当である。アメリカの動物愛護団体が見たらびっくりの風景だろう。「イルカと人間はお友達」と言ってる人には見せられない風景だ。
あまりおいしそうではないので、私はまだ実際に味わってはいない。しかし、地元の人の中には「よく食べる」と言う人もいる。いつか、挑戦してみたい。
さて、上の写真で共通しているのはウニである。ウニと言えば、こんな姿をしている。
「海栗」と書いてウニと読むことが実に納得できる姿である。しかし、内面はもう少し違う。実は、ウニはドームにそっくりである。前回考えたドーム球場ではないが、ウニは実はドーム構造をしているのだ。「そんなことは当たり前じゃないか」と言う人もいるだろう。しかし、私はつい最近までそれを知らなかった。そもそも、骨があるとすら思っていなかったのである。
もしかしたら、私のようにウニの内面を知らない人もいるかもしれない(そんな人はいない、という声も聞こえそうだが)。そこで、ウニの骨の写真を示してみる。下に示すのが、色々なウニの骨だ。
実物はとてもきれい。日本古来の木工細工のような穴がとてもきれいである。 |
これは少し前に、宇宙科学研究所の黒谷氏の実験室を見学(ただ邪魔しただけという気もするのであるが)する機会があり、そのとき頂いたものである。最初に見たときは、「目からウロコ」であった。まさか、あの針の山の下にこんな頑丈な殻が存在しているとは、思わなかった。
写真ではわからないかもしれないが、骨には小さな穴が極めて規則的に開いている。それが、日本古来のとても出来がいい木工細工のようである。光に透かしてみると、うっとりするようなきれいさである。内部に強い光源でもおけば、プラネタリウムやミラーボールみたいに細い光線を放射する、きれいなアクセサリーができそうだ。
ところで、「何故、宇宙科学研究所の実験室にウニが?」と思われる方は、WEBで検索でもかけてみると良いかもしれない。「宇宙生物学」という面白い実験分野があるものだ。
例えば、無重力の中で生物がどのような挙動を示すか、などの研究をしたりするらしい。飛行機にのってそういう実験を繰り返すわけである。遊園地のフリーファールやバンジージャンプ、そして、ジェットコースターでさえ、駄目な私には地獄のような研究分野である。
さて、上の、ウニの骨の姿はまさにドームそのもの、とは思えないだろうか? そう、似ているのだ。 そっくりなのだ。試しに、このドームなどを見れば納得できるだろう。
これは、富士山頂の厳しい環境を耐えるために、極めて安定なドーム構造が用いられているのだ。三角形のパネルが組み合わさるドームハウスは極めて頑丈である。ウニも、同じように頑丈なドーム構造の骨格を持っているのである。レーダードームは富士山頂で頑張っているが、宇宙科学研究所のウニは色々なところへ連れて行かれて、厳しい実験に耐えているのである。
こういった、ドームと言えば、R.バックミンスター・フラー博士のドーム理論だろう。フラー博士とドームハウスのスケッチ図を示してみる。
|
よく、環境適応性の高さを謳うことの多いドームハウスであるが、もしかしたら、ウニがその祖先であるかもしれない。もしかしたら、フラー博士は「海の中でじっとたたずむウニの夢を見て」ドームハウスを思いついたのかもしれない。
アメリカ人であるフラー博士がウニを食べたとは思えない、という人も多いだろう。それは確かにその通りである。しかし、フラー博士はかなりの変人である。変人ならば、ウニを食べまくっていたとしても、おかしくはない。
普段は「何を馬鹿な発想だ」と思うことだろう。しかし、ドーム球場の野球を見ながら、脳みそがビールとウニで満たされてしまうと、「そうだ、フラー博士はウニが大好きなのだ!そうに違いない!」と確信してしまうのだ。
仮に、フラー博士がウニに影響されていないとしても、ウニはフラー博士がドーム理論を考えるずっと太古の昔から、ドーム構造をしていたのである。ならば、「元祖はやはりウニなのだ!」と言ってしまって良いだろう。太古から厳しい環境を耐えつづけてきたウニは、今や宇宙へ飛び出し、さらに厳しい環境の中で活躍しているのである。
1999-12-06[n年前へ]
■立体音感を考える
バーチャルサウンドソフトウェアを作ってみよう
立体感というものには何故か強く心惹かれるものがある。まして、それが人工的な立体感であるならば、なおさらである。それは、画像・映像であっても、音であっても同じだ。色覚なども同様なのだが、人間の感覚というものを人間自身の技術により再現できたりするのが、実に面白い。
何より、自分が実感できるというのが良い。結果を自分で感じることができるというのは、素晴らしいと思う。よくソフト技術者などで、「もう少し目に見えるものが作りたい」という人がいるが、それと同じである。
小・中学校などでも実感できる教材や授業というのがあれば素晴らしいと思う。最近のWEBを眺めていると、そういう先生方のグループも多いようだ。そういう先生は「えらいなぁ」とつくづく思う。今の学校の先生は、そういうことをすればするほど、仕事としては時間単価が下がってしまうのだろう。それでも、そういった先生方は、きっとそういうことは気にしてはいられないのだろう。ホントにエライ。
さて、立体感を実現するソフトであるが、そういった技術には色々なモノがある。音響の立体感の実現を目指す技術に関しても、古くから数多い技術がある。そういったものを追求しているWEBも多々あり、
「今日の必ずトクする一言(http://www.tomoya.com/)」の
- 山本式スーパーバイノーラルコンペンセーターのナゾ(その2、ソースを考える編)
- http://www.bekkoame.ne.jp/~jh6bha/higa9810.html#981013
- 山本式スーパーバイノーラルコンペンセーターのナゾ
- http://www.bekkoame.ne.jp/~jh6bha/higa9810.html#981008
- 山本式バーチャルサウンドシステムのナゾその2(原理解説編)
- http://www.bekkoame.ne.jp/~jh6bha/higa9804.html#980421
- 山本式バーチャルサウンドシステム(PATPEND.)のナゾ
- http://www.bekkoame.ne.jp/~jh6bha/higa9803.html#980307
また、そういったものを実現しようとする製品は昔から掃いて捨てるほどある。最近の製品では、
- ヤマハ、スピーカー間隔0でステレオ音場を実現するLSI
- http://www.watch.impress.co.jp/pc/docs/article/990122/yamaha.htm
- ヤマハ デジタルオーディオ用LSI『YSS901』
- http://www.yamaha.co.jp/news/99012101.html
私も出張などで新幹線などに乗っている際には、E-500などでヘッドホンで音楽を聴いていることが多い。そういう時には、先の「山本式スーパーバイノーラルコンペンセーター」などが欲しくなり、音の立体感などについて色々と考えてしまう。必要に迫られているせいか、立体音感については、私もとても興味を惹かれるのである。
というわけで、「できるかな?」でも立体音響について考えてみたいと思う。といっても、考えるだけでは面白くない。それに「ナントカの考え休むに至り」ともいう。私が考えるだけでは、何にもならないし、しょうがない。色々と実験をして遊んでみたい。
そのために、まずはいくつかの道具を作ってみることにした。
今回、作成するのは、山本式バーチャルサウンドシステムソフトウェア(名付けてYVSSS。略称が長いので、以降YVS3と称することにする。)である。先の「今日の必ずトクする一言(http://www.tomoya.com/)」の一連の話しに出てくるそれである。スピーカーマトリックスの程度を小さくしたものである。
バーチャルサウンドシステムソフトウェアというと仰々しいし、ものすごいソフトウェアに思えるかもしれないが、実はそんな大したモノではない。それどころか、実に簡単なモノである。実際には、Waveファイルを開いて、そのファイルの左チャンネル(L)、右チャンネル(R)に対して、
- R'= R - 1/3L
- L'= L - 1/3R
ここに、今回作成したソフトを置いておく。いつものことであるが、完成度はアルファ版以下である。
使い方を示しておく。まず、下が動作画面である。水平方向にスライダーがあるが、チャンネル同士の演算の係数を決めるものである。左端が0%であり、右端が100%である。
すなわち、スライダーが左端であれば、
- R'= R - 0 L = R
- L'= L- 0 R = L
- R'= R - L
- L'= L- R
Load_Convertボタンを押して、WAVファイルを選択し、変換することができる。その際、オリジナルのファイルは"*.org"という名前で保存される。
さて、このソフトを使って、
- 種ともこのアルバム「感傷」から「はい、チーズ!」
- THE POLICEのLive at the "Omni" Atlanta, Georgia During 1983 U.S.A Tourから"SoLonely"
試聴のやりかたは、Cd2wav32.exeを使い、CDからWAVファイルにする。そして、WaveMixPro(YVS3)を使って、バーチャルサウンドシステム構築する。そして、それをヘッドホーンで試聴するわけだ。適当にチャンネル同士の演算の係数を変化させ、聴いてみた。果たして、立体感は増しているか?
さて、試聴した結果であるが、「うーん。」という感じだ。
係数を大きくすると、まるで「カラオケ製造器」である。ボーカルが消えるだけである。しかも、聴衆が頭の真ん中に居座っているような感じである。つまり、立体感がむしろなくなってしまっている。「何故、オマエらはオレの頭の真ん中で拍手をするのだ」、と言いたくなる。頭が変になりそうである。
かといって、小さいとよく違いがわからない。困ったものである。
さてさて、まだまだ第一回目ではあるが、前途多難の気配であるのが心配なところだ。