hirax.net::Keywords::「画素」のブログ



1999-09-01[n年前へ]

画像に関する場の理論 

ポイントは画像形成の物理性だ!?

 今回は、
夏目漱石は温泉がお好き? - 文章構造を可視化するソフトをつくる- (1999.07.14)
の回と同じく、「可視化情報シンポジウム'99」から話は始まる。まずは、「可視化情報シンポジウム'99」の中の
ウェーブレット変換法と微積分方程式によるカラー画像の圧縮および再現性について
という予稿の冒頭部分を抜き出してみる。「コンピュータグラフィックスを構成する画素データをスカラーポテンシャルあるいはベクトルポテンシャルの1成分とみなし、ベクトルの概念を導入することで古典物理学の集大成である場の理論が適用可能であることを提案している」というフレーズがある。

 着目点は面白いし、この文章自体もファンタジーで私のツボに近い。しかしながら、肝心の内容が私の趣向とは少し違った。何しろ「以上により本研究では、古典物理学の場の理論で用いられるラプラシアン演算を用いることで、画像のエッジ抽出が行えることがわかった。」というようなフレーズが出てくるのである。うーん。
 私と同様の印象を受けた人も他にいたようで(当然いると思うが)、「エッジ強調・抽出のために画像のラプラシアンをとるのはごく普通に行われていることだと思うのですが、何か新しい事項などあるのでしょうか?」という質問をしていた人もいた。

 また、話の後半では、画像圧縮のために、ラプラシアンをかけたデータに積分方程式や有限要素法などを用いて解くことにより、画像圧縮復元をしようと試みていたが、これも精度、圧縮率、計算コストを考えるといま一つであると思う(私としては)。

 画像とポテンシャルを結びつけて考えることは多い。例えば、「できるかな?」の中からでも抜き出してみると、

などは画像とポテンシャルということを結びつけて考えているものである。(計算コストをかけて)物理学的な処理をわざわざ行うのであるから、物理学的な現象の生じる画像を対象として考察しなければもったいない、と思うのである。

 現実問題として、実世界において画像形成をを行うには物理学的な現象を介して行う以外にはありえない。「いや、そんなことはない。心理学的に、誰かがオレの脳みそに画像を飛ばしてくる。」というブラックなことを仰る方もいるだろうが、それはちょっと別にしておきたい。

 「できるかな?」に登場している画像を形成装置には、
コピー機と微分演算子-電子写真プロセスを分数階微分で解いてみよう-(1999.06.10)
ゼロックス写真とセンチメンタルな写真- コピー機による画像表現について考える - (99.06.06)
で扱ったコピー機などの電子写真装置や、
宇宙人はどこにいる? - 画像復元を勉強してみたいその1-(1999.01.10)
で扱ったカメラ。望遠鏡などの光学系や、
ヒトは電磁波の振動方向を見ることができるか?- はい。ハイディンガーのブラシをご覧下さい - (1999.02.26)
で扱った液晶ディスプレイなどがある。そのいずれもが、純物理学的な現象を用いた画像形成の装置である。

 例えば、プラズマディスプレイなどはプラズマアドレス部分に放電を生じさせて、電荷を液晶背面に付着させて、その電荷により発生する電界によって液晶の配向方向を変化させて、透過率を変化させることにより、画像を形成するのである。

プラズマアドレスディスプレイ(PALC)の構造
(画像のリンク先はhttp://www.strl.nhk.or.jp/publica/dayori/dayori97.05/doukou2-j.htmlより)
 これなどは、電荷がつくる電位とその電界が画像を形成するわけであるから、場の理論そのものである。従って、物理的な意味を持ってラプラシアンなどを導入することができるだろう。そうすれば、単なる輪郭強調などだけでなく、新たな知見も得られると思う。
 また、逆問題のようであるが電界・電荷分布測定などを目的として液晶のボッケルス効果を用いることも多い。液晶を用いて得られる画像から、電界分布や電荷分布を計測するわけである。これなども画像と場の理論が直に結びついている一例である。

 参考に、SHARPのプラズマアドレスディスプレイを示しておく。

SHARPのプラズマアドレスディスプレイ(PALC)
(画像のリンク先はhhttp://ns3.sharp.co.jp/sc/event/events/ele97/text/palc.htmより)

 また、電子写真装置などは感光体表面に電荷分布を形成し、その電位像をトナーという電荷粒子で可視化するのであるから、電磁場を用いて画像形成をしているわけである。だから、場の理論を持ちこむのは至極当然であり、有用性も非常に高いだろう。そういった視点で考察してみたのが、

である。

 同様に、画像圧縮に関しても、画像形成の物理性に着目することで実現できる場合も多いと思うのであるが、それは次回にしておく。

1999-10-07[n年前へ]

CCDカメラをバラせ! 

モアレは自然のClearText

 あまり、「できるかな?」では工作の話題が出ていない。いや、もしかしたら全然出ていないかもしれない。そこで、手元に8mmビデオのジャンクがあったので、こいつをバラしてみることにした。そして、これまで「できるかな?」に登場しているような話に関連していることがないか調べてみるのだ。いや、本当は嘘で計画済みの伏線張りまくりの話である。もしかしたら、勘のいい方はもう話の風向きはもうおわかりかもしれない。

 さて、今回分解するカメラはかなり前(といっても数年前)のモデルである。まずは、分解してみよう。

1 8mmビデオカメラのCCD&レンズ部分.
2. 方向を変えるとこんな感じ
3. 正面のレンズを外す
4. もっとばらす。中央にCCDチップ部分がある。
5. これがCCD部分。
6. CCD前部のフィルターを外す
7. CCD素子を正面から見ると
8. もっともっと拡大するとこうだ

 5.の写真でわかるように、CCD前部にはフィルターが着けてある。(当初はこれを赤外線フィルターだと考えていた。なので、このフィルターを外してやると、画質はとんでもないことになる。しかし、その上で赤外線投光器を装着すれば面白いカメラになりそうである。が、用途を間違えるととんでもないことになるので、今回はやらない。が、いつかやってみようとは思っている。もちろん、私は品行方正がモットーであるので、悪用はするわけがない。もちろんである。)と、書いたがその後、「これは赤外線とは逆のエイリアシング防止用のハイカットフィルタだろう」というご指摘を頂いた。フィルターが青色だったので、単純に赤外線カット用途かと思い込んでいたが、どうやら違うらしい。指摘の文章をそのまま、使わせていただくと「CCDは空間サンプリング素子であり、サンプリング周期(ピクセルのピッチ)よりも短い波長の光が入ると、エイリアシング(折り返しノイズ)を生じて擬似カラー、干渉縞を生じてしまいます。これを避けるためのハイカットフィルタです。」とある。その後、知人から頂いた資料(勉強しなおせ、ということだろう)を読むと、水晶板をだぶらせて2重像にすることにより、細かい解像ができないようにしているローパスフィルターであるようだ。空間周波数のローパスである。今回のCCDでは3層構造になっており、中央の層にのみ色がついている。反省がてら、次回にもう少し調べてみようと思う。

 ところで、7.などの拡大画像で周辺部が丸くケラれているのがわかると思う。これは、

と同じく実体顕微鏡の接眼部からデジカメで撮影を行っているからである。デジカメはこういう時に何より重宝する。さて、デジカメと言えば、こちらも同じくCCDを用いているわけである。

 さて、8.の拡大画像を見ると、このカメラのCCDのカラーフィルターは補色方式(CMYG=シアン、イエロー、マゼンダ、グリーン)であることがわかる。原色タイプでないところを見ると、どうやら感度重視の製品であるようだ。また、この拡大画像などを眺めると、

で調べた液晶のフィルターと同じような構造であることがわかる。よくストライプ模様の服を着ている人をCCDビデオカメラで撮影すると、モアレが発生することがあるが、それはこういったフィルターの色の並びに起因しているわけである。フィルターの周期とストライプの模様が干渉してモアレが生じてしまうのである。

 最近のものではソフト的にかなりの処理をしてモアレが出にくいようにしているし、CCDも高解像度化が進んでいるので、なおさら出にくい。私が使用している富士写真フィルムのFinePix700でそのようなモアレを出そうと思ってみたが、なかなか出なかった。むしろ、ピントを正確に合わせることができなかった。それでも、何とか白黒の縦線模様を撮影して、モアレを出してみたのが下の写真である。左がオリジナルで、右がそれに強調処理をかけたものである。

FinePix700で白黒の縦線模様を撮影した際のモアレ
(左上から右下へ斜めにモアレが出ている)
オリジナル
左に強調処理をかけたもの

 モアレが発生しているのがわかると思う。さてさて、こういう白黒ストライプをよく眺めてみれば、

で登場したこの画像を思い出すはずだ。
ノーマル
ノーマル斜線
カラーシフトを用いた斜線

 そう両者ともまったく同じ斜線である。そもそも、前回作成したパターンは今回への伏線であったのである。白黒の縞模様を撮影しているのであるから、普通は白黒模様しか撮影されない。しかし、モアレが発生している場合というのは、CMYGからなる1画素の中でのさらに細かな位置情報が判るのである。先ほどのCCDの色フィルターの拡大写真のような配置になっていることを知っているのであるから、その配置も考慮の上処理してやれば良いのである。もちろん、白黒の2値からなる画像を撮影しているという前提条件は必要である。その前提条件さえつけてやれば、モアレが生じていることを逆に利用して、高解像処理ができるはずだ。

 例えば、

CCDのCMYGからなる一画素
GreenMagenda
YellowCyan

という画素のGreenだけ出力が大きかったとすると、グレイ画像であるとの前提さえ入れてしまえば、1画素のさらに1/4の領域まで光が当たっている位置を推定できるということになる。もちろん、実際のカメラでも4色の間で演算をしてやり、ある程度の推定はしているだろう。しかし、前提条件を入れてやれば、より高解像度が出せるだろう。

 ClearTextの場合は白黒2値の文字パターン、あるいはハーフトーンという前提条件をつけて液晶に出力を行った。今回は、白黒2値の文字パターン、あるいはハーフトーンという前提条件をつけて、CCDからの出力を解釈してやれば良いわけである。CCDカメラにおいては自然が自動的にカラーシフト処理をしてくれるのである。そのカラーシフト処理からオリジナルの姿を再計算してやれば良いわけである。もっとも、これらのことは光学系がきちんとしている場合の話である。

 今回考えたような、そういった処理はもうやられていると思う。FinePix700でも撮影モードに

  • カラー
  • 白黒
の2種類があるので、もしかしたらそういう処理が含まれているのかもしれないと思う。それでは、実験してみよう。白黒の方がキレイに縞模様が撮影できているだろうか?
FinePix700で白黒の縦線模様を撮影した際のモアレ
(左上から右下へ斜めにモアレが出ている)
白黒モードで撮影
カラーモードで撮影

 うーん、白黒のほうがキレイなような気もするが、よく判らない。念の為、強調処理をかけてみる。もしかしたら、違いがわかるかもしれない。

上の画像に対して強調処理をかけたもの

 うーん、これではますます違いがよくわからない。これは、次回(すぐにとは限らないが)に要再実験だ。ただ使っている感覚では、まずピントがきちんと合わないような気がする。うーん、難しそうだ。それに、今回の実験はローパスのフィルター部分をなくしたものでなければならなかったようにも思う。ならば、FinePix700を使うのはマズイ(直すのメンドクサイから)。どうしたものか。

2000-04-09[n年前へ]

心に浮かぶハートマーク 

色覚の時空間特性で遊んでみよう

 4月である。「四月物語」の4月である。

で書いたように、私は4月だけは英語の勉強をしたくなるのである(何故なら、全然できないから)。そこで、ここのところ英語の先生のところに足繁く出向いている。その時に、信号機の例題を出されて「青信号」と言おうとして私は"ablue light"と言ってしまった。すると、「青信号は"green"だ -> The run signalis green.」と言われてしまった。しまった、確かにその通りだ。いや、英語でそう表現することに納得という話ではない。英語ではこうだと言われたら、私はそのまま頷くのみである。"Yes,sir"状態である。納得したのは、信号機の「現実の」色の話だ。そう言えば、日本でも信号機は「緑色」だった。試しに、信号機の一例を次に示してみる。
 
MacOS Xのファインダー上の「緑」信号

実は人にそう優しくないユーザーインターフェースの一例

 本当は「緑色」なのに、「何故、青信号と言われていたのだっけ?」と考えながら、帰り道に交差点、「緑」信号をじっと見ていた。すると、「緑」信号は消えて、黄信号になった。しかし、私の目にはその瞬間「赤」信号が見えたのである。
 私は夢を見ていたわけでも、予知能力があるわけでもむろんなくて、それは単なる錯覚である。「緑」信号が消えた瞬間に「赤」信号が見える、という錯覚である。

 私が見た「赤」信号機の錯覚を実感してもらうために、こんなアニメーションGIFを作ってみた。ソフトをレジストしてないが故の、SGという文字は気にしないでもらいたい。下の画像中央にある黒い点を見つめていて欲しい。すると、緑のハートマークが消えた瞬間から、赤いハートマークがおぼろげに見えるはずである。
 

白地に浮かぶ赤いハートマーク
(黒点を見つめること。)

 

 これは、色覚の時間特性による錯覚の一つである。実際に、赤いハートマークがあるわけではない。私の心の中にだけ、浮かぶハートマークである。

 その原因となる色覚の時間特性を示すグラフを以下に挙げる。これは色覚の時間特性を示すグラフの例である。色覚のインパルス応答のようなものである。ある色を見た後には、その色の反対色を感じるということを示している。
 

色覚の時間特性を示すグラフの例
朝倉書店 内川恵二著 色覚のメカニズム 色を見るしくみ より
 このような、色覚の時間特性により、緑色のハートマークを見た後に、赤いハートマークが心の中に見えたのである。ハートマークの黄色い縁取りの残像は青く見えるのだ。そして、同じように私の信号機の錯覚に繋がるのだ。

 このような錯覚というのはとて興味深いものである。視覚という「デバイスの特性」が「目に見えて実感できる」ことが特に面白い。以前、

で考えた「電子写真」の画像特性や、の時のCCDや液晶といったものの画像特性を考えたときにも何故だかその「デバイスの変なところ」というものには心惹かれるのである。何故なら、私は「短所は長所」でもあると思うからだ。いやもちろん、「長所は短所」というわけで、要は考え方と使い方次第、ということだ。

 さて、先の錯覚は色覚の時間特性によるものだった。それと全く同じような錯覚が、色覚の空間特性から得ることができる。そのような錯覚の一つにこのようなものである。それを下に示してみる。
 

白い線の交差部が赤く見える錯覚

 この有名な画像パターンを見れば、「白い線の交差部が赤く見える」はずだ。

 これは、色覚の空間特性によるものである。これを示すグラフの例を以下に示す。この場合もやはり色覚の時間特性のように、ある刺激があるとその周囲に反対の色の影響が表れる。例えば、周りに白が多いと、その部分は黒っぽく見える。赤色の周りは緑がかって見えるのである。逆に緑色のものの周りは赤く見えるのだ。
 そして、それをさらに進めると、周囲に赤色が少ない場所は、周りに比べて赤く見えるのである。上の画像で言えば、白の交差部は、赤の刺激が少ないので、赤の刺激を逆に感じるのである(ちょっと説明をはしょりすぎかな)。
 

色覚の空間特性を示すグラフの例
朝倉書店 内川恵二著 色覚のメカニズム 色を見るしくみ より

 今回は、このような色覚の空間特性をシミュレートしてみたい。道具は単純にPhotoshopだ。もう手作業でやってみるのだ。ネコの色覚で遊んだ

の時と同じである。
 
色覚の空間特性をシミュレートし、錯覚を生じさせてみる
 これがオリジナル画像。黒背景に白い線で格子模様が描かれている。
  白い(つまり光刺激が多い領域)からの影響を考える。先に示したグラフのように、光刺激がある箇所と少し離れたところではそれと逆の刺激を受けたような効果がある。
 そこで、まずは白い部分からの影響をガウス形状のボカシにより、真似してみる。ある画素から少し離れた所に影響が及ぶのをシミュレートするのである。
 白い部分からの影響(実際には、比較問題となるので黒い部分からの影響と言っても良いだろうか?)は「白と逆の方向、すなわち黒い方向」に働く。
 そこで、上の画像を階調反転させる。すなわち、ある画素から少し離れた所に元の明るさと逆の影響が及ぶことをシミュレートするのである。そしてさらに、階調のカーブを鋭くしてやる。
 
 上で計算したものとオリジナルの画像を加算してやる。これが、人間が感じる画像をシミュレートしたものである。
 白い格子の交差点部が黒く見えているのがわかると思う。といっても、もともとその部分は黒く見えていたとは思うが。

 下に、シミュレート画像とオリジナル画像を並べてみる。

シミュレートした画像
オリジナル画像

 このようにして、オリジナル画像を見たときに感じる錯覚をシミュレートできたことになる(もどきだけど)。

 さて、上では簡単のためにグレイスケールで遊んでみたが、最初に示した赤白の場合のようなカラーの例を示してみる。次に示す四角形の中央部は、右と左ではいずれも右の方が赤っぽく見えるはずである。緑に囲まれた領域は、本来の色に対して、緑と逆の赤色に見えるのである。上に示した白黒格子と全く同じ理屈である。
 

右と左ではいずれも右の方が赤っぽく見える

 さて、この右下の画像中の赤は通常の「赤」よりもさらに鮮やかな「赤」を実現していることになる。左下のものと同じ赤100%の色であるが、左よりももっと鮮やかに見えている筈だ。右下と比べると、左下の赤は落ち着いた赤色に見えてしまうのではないだろうか?
 この右下の赤、すなわち緑に囲まれた赤は、物理的にCRTあるいは液晶(今あなたがこのWEBページを見ているデバイス)などの表現可能領域を越えた、さらに鮮やかな赤色に見えているわけだ。ヒトの視覚のデバイス特性が故に鮮やかに見えることになる。

 さて、鮮やかな「赤」と言えば、「ポケモンチェック」によれば、日本民間放送連盟のガイドラインには

  1. 映像や光の点滅は、原則として1秒間に3回を超える使用を避けるとともに、次の点に留意する。
    1. 「鮮やかな赤色」の点滅は慎重に扱う。
    2. 前項1の条件を満たした上で1秒間に3回を超える点滅が必要なときには、5回を限度とし、かつ、画面の輝度変化を20パーセント以下に押さえる。加えて、2秒を超える使用は行わない。
  2. コントラストの強い画面の反転や、画面の輝度変化が20パーセントを超える急激な場面転換は、原則として1秒間に3回を超えて使用しない。
  3. 規則的なパターン模様(縞模様、渦巻き模様、同心円模様など)が、画面の大部分を占めることも避ける。
とあるらしい。私は「赤」と「緑」の細かいパターンというのは見ていると、何故だか「チカチカして」気持ちが悪くなるのである。かといって、「赤」と「緑」のパターンであっても、細かくなければクリスマス気分で好きなのである。その証拠にでは、その色使いを使っている位である。パターンが細かくない限りにおいては、緑と赤が鮮やかさを互いに引き立てて良い感じに見えるのである。

 しかし、その「赤」と「緑」パターンが細かくなると、何故だか不快なのだ。色覚の時空間特性を考えると、「赤」と「緑」の細かいパターンというのは、もしかしたら読む際に刺激が強すぎるのではないか、と想像してみたりする。根拠はたいしてないのだけれど。
 

2000-07-18[n年前へ]

モザイクの向こう 

隠しているから良いのです



 「できるかな?」への質問?で、同じような内容のメールを頂くことがよくある。その内の一つは、

感温液晶の入手先を教えて下さい。
というものである。何か不思議な気がするのだが、けっこう感温液晶を欲しいと思う人がいるらしい。しかも、そのような人はインテリア関係を扱う人が多い。「人のぬくもり」を感じさせるものを作りたい、というわけのである。これを逆に言えば、「人のぬくもり」を感じさせないものが世の中には溢れているということなのだろう。液晶という実に物理的なものを通して「人のぬくもり」を感じることができる、ということが実に不思議で同時に爽快でもある。

 さて、私自身は新宿の東急ハンズで感温液晶を購入したのだが、その人達のメールによれば、最近はどうも置いていないらしい。仕方がないので、

  • 日本書籍 後藤富治 村上 聡 著 おもしろ科学モノ情報 200選 2000年版
に載っていた情報を元に
 感温液晶シートですが、実験材料でなくて遊ぶのに
使うのでしたら、
光洋 03-3212-1571
日比谷パークビル9F
平日8:30-5:30
JR有楽町駅近く
にあるようです。
という返事を最近は出すことにしている。
 
    日本書籍 後藤富治 村上 聡 著 
    おもしろ科学モノ情報 200選 2000年版

 そういうわけで、こちらの感温液晶の入手方法に関するメールの方は良いのだが、もうひとつのよく頂くメールの内容がある。こちらの方はメールを頂いても、返事ができるわけでもなく、いつもそのままになっていた。その内容はと言えば、

画像処理と言えば、まずはAVのモザイクの消し方を研究して下さい。
というものである。AVのモザイクというと、あの映してはマズイ部分を隠すアノ画像処理のことだろう。本来のモザイクという言葉のモノだけではなくて、アノマズイ部分を隠す画像処理一般について、それをどうにかして欲しい、と言っているのだろうと思う。

 しかし、そう言われても困ってしまう。もちろん、私は「見えないもの」を「見える」ようにするのは大好きであるし、趣味でも仕事でも、「見える?見えない?」の境界線に興味を惹かれ、日夜考え続けている。だから、AVのモザイク〜マズイ部分を隠すアノ画像処理〜のようにわざわざ「見えない」ように細工をされてしまうと、それを何とか「見える」ようにしたいという気持ちが無い、と言ってしまうと嘘になるだろう。

 しかし、残念ながら、このAVのモザイクの件に関しては「見えない」方が良いと思っているのである。それは、私の好みの根幹に関わる部分なのであるが、ダラダラと言い訳を書いても仕方がない、やはりここはFAQに対しての答えを用意しておくべきだと考えて、ここに簡単な説明を書いておくことにした次第である。

 まずは、代表的なマズイ部分を隠すアノ画像処理の種類を示してみたい。次に示す画像は左から、

  1. オリジナル
  2. オリジナルに「モザイク」をかけたもの
  3. オリジナルに「ぼかし」をかけたもの
  4. オリジナルに「塗りつぶし」をかけたもの
である。呼び名は私が今適当に決めてみた。
 
代表的なマズイ部分を隠すアノ画像処理
オリジナル
狭義のモザイク
ぼかし
塗りつぶし

 この3つのマズイ部分を隠すアノ画像処理のなかから、今回は

  1. オリジナルに「モザイク」をかけたもの
  2. オリジナルに「ぼかし」をかけたもの
についてのみ、簡単にその内側を覗く努力をしてみたいと思う。「塗りつぶし」に関しては、今時のAVでは使われていそうにないし、ネット上に落ちている画像でもそんなに使われていないんじゃないかと想像(あくまで、想像で実体験ではない)されるので、今回は触れないことにした。いや、もちろん復元作業が面倒だということが一番の理由である。それでも、「塗りつぶし」の下に隠された部分をやっぱり見たいという人がいらっしゃれば、「欠損画像からの画像復元」というようなキーワードで論文を探してみると良いと思う。また、もし手に入らないという方がいらっしゃるならば、あなたが持っている「面白そうなビデオ」と私が持っている「論文」の物々交換をしてあげても良い、と思っている。
 

 さて、まずは「モザイク」に挑戦してみたい。試しに、ミロのヴィーナスのヌード画像に対して、「モザイク」をかけてみよう。次に示すのが、とあるヌード画像に対して「モザイク」をかけたものである。
 

とあるヌード画像に対して「モザイク」をかけたもの
オリジナル画像(GIF画像)
19kB
モザイク画像
1kB

 GIF画像ということで圧縮もかけてあるため、一概に比較はできないが、オリジナル画像が19kBであるのに対して、右の「モザイク」画像は1kBしかない。つまり、情報量がおよそ1/20であるわけだ。それもそのはず、上の「モザイク」画像は実はオリジナル画像を単に縮小したものを拡大表示してみたものである。情報量が少なくなるのも当然だろう。
 

「モザイク」画像は実はオリジナル画像を単に縮小したものと同じ
オリジナル画像(GIF画像)
19kB
左の画像を
縮小したもの(GIF画像)
1kB
左の画像を
単に拡大表示したもの
1kB

 それでは、画像の情報量が減ってしまっている場合に、元の画像を復元することはできないのだろうか?いや、ハッキリと言えばヌード画像に対して「モザイク」がかけられてしまったとしたら、その「モザイク」の向こうのヌード画像を拝むことはできないのだろうか?

 それが実はできるのである。その証拠に巷には「AVモザイク消し器」というものが溢れている。また、そんな大層な機械でなくても、巷には「モザイク」の向こうを見通すノウハウという秘伝が伝えられている。例えば、私がリサーチした限りでは、

  1. TVの前に半透明のシートを張る
  2. 目を薄開きにして、TV画面を見る
というような秘伝がある。実は、「AVモザイク消し器」もそれらの秘伝も同じとある簡単を用いているのである。その簡単な原理により、「モザイク」の向こうのヌード画像を拝むことができるのである。

 その原理とは「オリジナルの画像の性質を考える」ことである。先のオリジナルのヌード画像をじっくり見ればわかると思うが、ヌード画像というものは割合滑らかである。マッチョなヌード画像ならばいざしらず、少なくとも女性のヌード画像は普通滑らかな画像であるわけだ。当然である。だとしたら、その性質をフル活用してやれば、「モザイク」の向こうのヌード画像を拝むことができるのである。

 もう少しわかりやすく言うと、こんな感じだ。まずは、滑らかなグレイスケールの画像に「モザイク」をかけてみよう。
 

オリジナルの画像に、
「モザイク」をかけた画像
オリジナル
上の画像に「モザイク」をかけたもの

 すると、元のオリジナル画像は極めて滑らかな画像であるのに、下の「モザイク」をかけた画像は「モザイク」のせいで滑らかでなくなってしまっている。だとすれば、「モザイク」画像を滑らかにしてやれば、元のオリジナル画像っぽくなるのではないだろうか?周囲の画像を考えながら、滑らかな画像にすれば良いのではないだろうか?具体的に言えば、注目画素の周囲で平均値などを計算してやればよいのだろう。つまり、「ボカシ」をかけてやれば良いのである。「ボカシ」をかけると画像はソフトで滑らかになる。「モザイク」をかけた画像が滑らかでなくなってしまっているのを、「ボカシ」をかけることで滑らかにして、元の画像っぽくしてやれば良いのだ。

 先の秘伝

  1. TVの前に半透明のシートを張る
  2. 目を薄開きにして、TV画面を見る
や「AVモザイク消し器」もどれもこの原理を使ったものである(多分)。TVの前に半透明のシートを張れば、当然TVの画面はボケるし、目を薄開きにしてTVを見れば、やはり「まつ毛」などでTV画像に「ぼかし」がかかる。近眼の人であれば、目を薄開きにするとむしろハッキリとTVが見えてしまうかもしれないが、そうでなければ普通は「ぼかし」がかかるだろう。

 例えば、上の「モザイク」画像にぼかしをかけたものを次に示してみよう。「モザイク」画像にぼかしをかけることで、元のオリジナル画像に極めて近い画像になっていることがわかると思う。
 

オリジナルの画像に、
モザイクをかけた画像、
そしてモザイク画像にぼかしをかけたもの
オリジナル
上の画像にモザイクをかけたもの
モザイク画像にぼかしをかけたもの

 これが、いわゆるひとつの「モザイク」の向こうのヌード画像を拝む秘訣なのである。試しに、先のとあるヌード画像に対して「モザイク」をかけた画像を「ぼかす」ことで「モザイク」の向こうのヌード画像を拝んでみたのが次の画像である。「モザイク」画像よりはオリジナル画像っぽいことがわかると思う。
 

とあるヌード画像に対して「モザイク」をかけた画像を「ぼかす」と...
オリジナルオリジナル画像に
モザイクをかけたもの
モザイク画像に
ぼかしをかけたもの

 さて、それでは逆にオリジナルに「ぼかし」をかけることでマズイ部分を隠すアノ画像処理をした場合はどうだろうか?この場合は「モザイク」の向こうのヌード画像を拝むことはできるだろうか?

 といっても、こちらは以前

で扱っているので、ここでは詳しく書かない。ぼけた画像は例えば、
  • ウィーナ・フィルタ
  • ハイパス・フィルタ
などのフィルタ演算を行うことで、何とか画像復元できる。WindowsでもMacでもフリーソフトでウィーナ・フィルタがかけられるものもあるようなので、試して頂ければ良いと思う。

 と書くだけでも何なので、試しに、Photoshopのカスタムフィルタで簡単な「ボカシ復元用フィルタ」を作成してみたものをここにおいておく。Photoshopユーザは試してみると面白いかもしれない。

このカスタムフィルタの内容はごく簡単なオペレータ演算で、次の図に示すようなオペレータ演算子を用いたフィルタである。
 
カスタムフィルタを使った簡単な「ボカシ復元用フィルタ」

 試しにこのカスタムフィルタを用いて、とあるヌード画像に対してかけられた「ぼかし」画像の向こうのヌード画像を拝んでみたのが次の例である。ちなみにここでの「ぼかし」はPhotoshopでガウス「ぼかし」の半径4ピクセルの設定でフィルタをかけてみたものだ。
 

とあるヌード画像に対してかけられた
「ぼかし」画像の向こうのヌード画像を拝んでみた
オリジナルオリジナル画像に
ぼかしをかけたもの
ぼかし画像に
先のカスタムフィルタをかけたもの

 こんな簡単なカスタムフィルタでもとあるヌード画像の「ボカシ画像」を鮮鋭化できて、その「ぼかし」の向こうのヌード画像を拝むことができることが判ると思う。

 実際に、私がネット上で膨大な数のエロ画像、いや違った「ボカシ」画像だ、を収集し試した結果ではかなりの割合の画像に対して、驚くべき効果を挙げることができた。本WEBに訪れるような方のほとんどには当然の知識だとは思うが、もしもこういった処理をかけたことのない方がいらっしゃれば、是非一回挑戦しみてもらいたい。特に素人ヌードの「ぼかし」画像がお薦めである(あくまで復元効果の大きさに関してだけど)。

 さて、ここまで書いてから言うのはどうかと思うのだが、以前

でも書いたように、私は「素晴らしい芸術は完全な自由の中では生まれない」と思っている。それと同じで、制限の中で表現する方が実は素晴らしいものができると思っているのである。それは、私服の女子高生には心ときめかないが、制服の女子高生には思わず目を惹かれるのと同じである。完全に何でもありの私服だと実はそう簡単に輝かないのだが、制限のかかっている制服だと何故かとても輝いてしまうのと同じだ。私などは、通っていた高校が制服がなかったため、思わず同級生に「セーラー服を着て来てくれぇ」とリクエストをしてしまったくらいである。あれ、何の話だっけ...

 そう、つまりわざわざ隠してある部分を眺めてみることは良いとは思わないのである。隠してあるものは、隠しておいたままにしておいた方が良いのではないか、と思うのである。

 そう言えば、先ほど「ミロのヴィーナス」の画像用に表紙を使わせて頂いた細野不二彦のギャラリーフェイクの中では、主人公藤田が、

「ミロのヴィーナスは腕が隠されているからこそ、人々の心を捉えたんじゃないですかね」
というようなことを言う。私も本当にそう思う。
 
    細野不二彦 ギャラリーフェイク
    林檎を持つ女神 より

 「ミロのヴィーナス」の存在しない腕を想像することで、現実には作りえない理想の姿を、その像を見る人々は感じることができるのだろう。隠してあるからこそ、良いのである。

 あまりに緻密に描写した弟子に「言い仰せて何がある」と言ったのは松尾芭蕉だったはずだ。想像する余地を残して、現実よりもさらに大きいものを表現した方が良い、ということである。私も本当にその通りだと思う。ある一部分だけを切り取ってその部分だけを見てみて、後は想像力におまかせというのが、私も表現としては一番良いと思うのである。もちろん、全ての人の想像力を越えるものを表現する力があるというならばともかく、そんなことができないのならばわざと一部分だけを表現するのが一番良いと思うのである。

 いや、だからって別に私が変な想像をしまくりってわけじゃないとは思うけど。かといって、私が想像力とか好奇心が少ない方かと言われると...うーん...
 

2001-04-29[n年前へ]

ファイト!縦文字文化 

縦と横の解像度を考えよう


 今年も去年に引き続き英語研修を受けている。といっても、去年は毎日十五分の英語研修だったが、今年は週二日のものを二種類受けている。何事も、「一番弱いところを強くするのが一番」というわけで、それが私の場合は英語であるわけだ。いや、もちろん弱いところは数え切れないほどあるのだが、英語はもうどうしようもないくらいダメなのである。

 その英語研修を受ける中で、本当に実感するのが「頭の中でも英語で考えないとキツイ」ということである。頭の中で日本語で考えてから英語で喋ろうとすると、その「日本語→英語変換」のオーバーヘッドはすさまじくて、とても会話にならないのである。もちろん、当然その逆もしかりで「英語→日本語変換」なんかもやっていたら、あっというまに相手の喋るスピードについていけず、「ここはどこ?私はだれ?」状態になってしまう。
 

 もちろん、「頭の中で英語で考えられる位なら、そもそも苦労はせんのじゃぁ!」と叫びたくなることもしばしばあるわけで、実際のところ私にはどうしたら良いのか全然わからないのである。「頭の中に言いたいことは沢山あるけど、それを伝えられない状態」と「頭の中でたいしてものを考えることができない、それを伝えられる状態」とどっちかを選べと言われても困ってしまう。残念ながら、「英語で頭の中でビュンビュンと考えて、それが口からペラペラとでてくる」状態は私には遠い夢物語のようなのである。
 

 こんな苦労は、日本語人生一本やりだった私が英語を使う場合にはどうしても避けられない話なのであるが、そんな「私の苦労」と似たような話はコンピュータの世界にも実はある。例えば、「今日の必ずトクする一言」でもよく登場する「Windowsの日本語化のオーバーヘッドに関する一連の話」などがそうである。超漢字あたりであれば話は別なのかもしれないが、Windowsに限らずどんなOSであっても英語だけを使うときと、日本語のような言語を使うときではスピードが全くと言って良いほど違ってしまう。

 例えば、英語版のWindowsであれば最新型のPCでなくてもサクサク動くのであるが、これが日本語版のWindowsともなると、最新型のPCでなければカタツムリのようなスピードに変わってしまうのである。最新型のWindowsやMacOS***の推奨マシンスペックは○×○×です、とOSメーカーが言ったところで、それは英語圏での話で日本語人生の私のようなものにはそれは当てはまらないのだ。わずか100文字ほどのアルファベットですむ英語の場合と、約七千字ほどもある日本語を使う場合とでは文字・フォント処理のスピードが違ってしまうのは当たり前の話である。

 ところで、英語と日本語をコンピューターなどで扱う時の大変さというものは文字数だけの話なのだろうか?数が多いから大変なのは当たり前なのだが、それだけではないのではないだろうか。単に文字数が多いというだけではなくて、一つの文字当たりの情報量も日本語の方が遙かに多いと思うのである。例えば、アルファベットの中でも複雑な形をしている"M"と、日本語というか漢字の中でも結構複雑な形をしている「廳」を比べてみれば一目瞭然だろう。"M"よりも、「廳」の方がずっと複雑な形状をしている。

 漢字の文字数が多いということは、そのたくさんある文字を区別するためにも漢字という文字の形状自体が複雑にならざるをえないわけで、それはすなわち漢字一文字の情報量はアルファベット一文字の情報量よりも遥かに多いということだ。ということは、

  • 一文字辺りの情報量が多くて
  • しかも文字数が多い
という日本語(あるいは漢字などを用いる言語)の処理速度が低下するのはしょうがないのである。
 

 しかし、「PC内部での処理も大変ではあるが、それを外部に出すときも大変だろう」というのが今回の話のテーマである。モニタやプリンタに出力する時の大変さも英語と日本語では大違いで、しかも英語文化で考えると見えない落とし穴があるのではないだろうか、という話である。

 まず、文字を表示するスペースというのは大体決まっている。そんな限られた同じスペースの中に、一文字辺りの情報量が少ないアルファベットと多い漢字を同じように詰め込めるだろうか?先ほどの"M"「廳」を縮小して10pt程度にしてみると、その答えはすぐにわかる。アルファベットの"M"の方はちゃんと読めるとは思うが、漢字の「廳」の方がちゃんと識別できる環境の人がいるだろうか?PCの画面に表示されている「廳」はずいぶんと省略されたてしまっていたり、あるいは潰れてしまっていたりするはずである。

 つまりは、PCの内部でも漢字のような文字を扱うのは大変であるが、それを外部へ表示したりするのも実際問題大変なのである。英語圏のアルファベット文化から考えれば、10ptなんて大きくて読みやすいと思うのかもしれないが、漢字などを考えると今のモニタの解像度では10ptでも小さすぎるのである。逆にいえば、アルファベットなどを表示する時に比べて漢字などの文字を表示する時には、遥かに高い解像度のモニタが必要とされるのである。PC自体の能力だけではなくて、モニタなどの出力機器も遥かに高い能力が必要とされるわけだ。
 

 もちろん、それは漢字だけの話ではない。世界中の文字で当てはまるハズの話である。試しに、

から、六つの文字種を適当に選び、それぞれの文字種の中でも一番複雑な形状をしていた文字を選んでみたのが下の一覧である。
 
世界の文字
アラビア文字
ヒエログラフ
漢字
ラテン文字
マヤ文字
ロンゴロンゴ文字

 アラビア文字あたりはラテン文字であるアルファベットと同じ程度の複雑さであるが、その他の文字はやはり遥かにアルファベットよりも複雑な形状をしている。「この中の半分くらいは使われていない文字じゃねぇーか!」という声も聞こえてきそうな気もするが、そんな小さいことを気にしてはいけない、とにかくアルファベットは色々ある文字の中でも単純な形状をしていて、漢字は複雑な形状をしているのである。

 次に、それぞれの文字画像の複雑さの特徴を眺めるために、それぞれ二次元フーリエ変換をかけて、周波数空間に変換してみたものを示してみることにしよう。まずは、漢字の例を示して図の見方を説明してみたい。
 

漢字の文字画像を二次元フーリエ変換をかけて、周波数空間に変換したもの

 図の横・縦方向が実際の文字の横・縦方向に対応し、図の中で中央から外周方向に向かって低周波から高周波の成分の量を示している。強さは
小 ← 赤 黄 黄緑 青 紫 → 大の順番になっている。

 たとえば、この漢字の例だと
ちょうど縦・横方向の周波数成分が多くて、しかも高周波まで含んでおり、縦と横とで比べると、縦方向の方が多くて、高周波の量も多いことがわかる。
 
 

 上の説明に書いたように、こんな風に文字画像を周波数空間に変換すると、「漢字は縦と横の線が多い」ということがよくわかる。しかも、

の時に調べたように、漢字は「縦方向に周波数成分が多い」、すなわち言い換えれば「横方向の線が多い」こともわかるのである。
 

 さて、世界の文字六種に戻って、それぞれを周波数空間に変換して並べてみると、こんな感じになる。
 

世界の文字六種を周波数空間に変換してみると…
アラビア文字
ヒエログラフ
漢字
ラテン文字
マヤ文字
ロンゴロンゴ文字

 こうして六種の文字種を周波数空間に変換して眺めてみると、色々なことが判る。例えば、

  • アラビア文字はほとんど高周波を含まない
  • ヒエログラフは比較的高周波が少なく、方向性も持たない
  • 漢字に含まれる高周波成分はほとんどが縦・横方向のみであり、その中でも「縦方向に周波数成分が多い」、すなわち言い換えれば「横方向の線が多い」
  • アルファベットは低周波がメインであり、縦横では横方向の方が高周波を含んでいる、すなわち縦の線が多い
  • マヤ文字は一番高周波まで含んでおり、比較的方向性も少ない
  • ロンゴロンゴ文字はアラビア文字よりも高周波が多いが、それでも比較的低周波メインであり、方向性もない
などだ。やはり、漢字やマヤ文字をきれいに表示するためには、ラテン文字のアルファベットやアラビア文字を表示するよりも、ずっと高解像度の表示装置が必要となるのである。
 

 もちろん、ラテン文字が比較的高周波が少ないからといって今の表示装置で十分だというわけではなくて、ラテン文字でもより高解像度のディスプレイが必要とされている。例えば、液晶画面などで文字を多量に読むことを想定している電子ブックなどの用途のためには、

で調べたMicrosoftの「ClearType」などの技術がある。これは液晶のRGBの画素の配列が横方向に並んでいることを利用して、横方向の解像度を高める技術である。

 ということは、こういう技術は横方向の高周波成分が多いラテン文字などでは効果が大きく、またラテン文字自体が比較的高周波成分が少ないために、こういう技術を使えば必要十分ということになるのかもしれない。しかし、日本語(漢字)のようなもともと高周波成分が多くしかもそれが縦方向に多い、というようなものでは効果は比較的少ないことが考えられる。もちろん、それは液晶というデバイスの特徴によるもので仕方のない部分もあるのだが、もしかしたらもしかしたら日本語のような縦方向の高周波を再現しなければならない言語のことを意識していないせいかもしれない。

 こんなことは液晶などのモニタだけではなくて、一般的なプリンタもそうだ。例えば、インクジェットプリンタではエプソンのPM-900Cの仕様などを眺めてみても、標準で720×720dpiで、高画質モードでは1440×720dpiとなっている。それはレーザービームプリンタなどでも同じで、リコーのプリンター大百科からウルトラスムージングテクノロジーを見てみても、やはり横方向の解像度のみを高めて2400dpi×600dpiとなっている。やはり、プリンタなどの印字装置でも横方向の解像度を高めようとはするが、縦方向の解像度は低いままにしているのである。もちろん、縦方向の解像度を高くすると印字速度が遅くなってしまうという、プリンタの特性があるにしても、やはり日本語を印字するためには不利な設定となっているのである。日本人としては、解像度表示は縦方向を重視するべきで、横方向の解像度表示にダマされるべきではないのである。高解像度2400dpiなんて言われても、「ヘヘン、オレは縦文字文化の日本人だから関係ないんだもんね」くらいは言って欲しいわけである。
 

 実際のところ、せっかく日本語(漢字)を使うのだから、日本語の特性に応じたPCやモニタやプリンタがあっても良いのになぁ、と思う。いや、というより日本語の特性をもっと理解するところから始めなければならないのかもしれない。そうだ、私はまずは日本語の勉強から始めるべきなのだ。英語の勉強をしている場合ではないし、頭の中で英語で考えていたりすると、縦文字文化に合った発想ができなくなってしまうに違いないのである。って、英語学習から逃げてるだけだったりして…

 あぁ、しまったぁ。今回はホントに真面目な話になってしまったぞ、と。しかも、まるで国粋主義者みたいだし。
 



■Powered by yagm.net