hirax.net::Keywords::「文学論」のブログ



2000-02-27[n年前へ]

「文学論」と光学系 

漱石の面白さ

 前回、

さて、モナリザと言うと、夏目漱石と「モナリサ」にも言及しなければならないだろう。
と書いた。何しろという具合に、「できるかな?」では漱石が結構レギュラー出演している(させている?)のである。当然、「モナリザ」ときたら漱石を出演させないわけがない。

 その漱石は「永日小品(リンク先は青空文庫)」(リンク先は青空文庫)の「モナリサ」中で

「モナリサの唇には女性(にょしょう)の謎(なぞ)がある。原始以降この謎を描き得たものはダ・ヴィンチだけである。この謎を解き得たものは一人もない。」
と書いている。女性には興味がなかったとも言われ、ずっと付き添っていた男性との関係も噂されるダ・ヴィンチである。ここらへんは、果たしてどうか?とも思う。むしろ、新宿のホストクラブのホストの方が女性(にょしょう)の謎(なぞ)については詳しいのではないかとも私は考えたりもする。
 が、そんなことはどうでも良い。漱石はレオナルド・ダ・ビンチのモナリザに興味を持ち、小品を書き上げたのである。そこで、漱石とダ・ヴィンチの相似点を考えてみたい。

 レオナルド・ダ・ビンチの著作には「文学論」というものがある。漱石にも同じ名前の「文学論」がある。この「文学論」はこれまで読んだことがなかったのだが、

  • 「漱石の美術愛」推理ノート 新関公子 平凡社 ISBN4-582-82927-9
を読んで急に読みたくなった。それは、この本の中で
  • 遠近法
  • 漱石の文学論の「公式」
の関係について触れられていたからである。レオナルド・ダ・ビンチも遠近法についてはうるさかったが、漱石も何故か遠近法にうるさいとなれば、非常に面白い話である。そこで、図書館で漱石の「文学論」を借りてきて眺めてみた。

 これが、とても面白い。仮名遣いが古いため、なかなか目に入ってこないのであるが、とても面白い。これは絶対に文庫本にすべきである。眺めているだけでも面白い。

 まずは、冒頭のフレーズがいきなりこうである。

 およそ文学的内容の形式は(F+f)なることを要す。Fは焦点的印象又は観念を意味し、fはこれに付着する情緒を意味す。
 まるで、理系の教科書である。そして、目次(編)を大雑把にさらってみる。
  1. 文学的内容の分類
  2. 文学的内容の数量的変化
  3. 文学的内容の特質
  4. 文学的内容の相互関係
  5. 集合的F
 すごい。当時の文学論とは思えないような内容である。この「文学論」の中では先の公式(F+f)を軸として話が進んでいく。例えば、章のタイトルでいうと- 文学的Fと科学的Fとの比較一般 - といった感じである。
 また、「文学論」中では、例えば、浪漫派と写実派の違いについて数値的な比較を通じて述べられていたりする。実に「科学的」な思考による「文学論」である。いや本当に漱石は凄い。

 さて、中の文章を解説する力は私にはない。そこで、中の図表を示してみることにする。そこで適当に思うことなどを書いてみようと思う。

 次に示すのは、「文学論」の冒頭の方で「意識の焦点・波形」を説明した図である。
 

意識の焦点・波形

漱石全集第十一巻より

 この図は人間が何かを感じるときには焦点にピークがある、そして、その周りはぼやけたものが連続的に続いているということを示したものだ。これなど、

の時の「恋のインパルス応答」を彷彿とさせる。あの時の「恋のインパルス応答」を次に示してみる。
 
左:出会い(F)、右:それにより意識される恋心(f)

 この意識される恋心(f)は先の「意識の波形」と全く同じである。ある出来事(F)と、それに付着する情緒(f)を示したものとなるわけだ。付着する情緒(f)というのは中心が一番大きく、その周りにぼやけたものが繋がっているというわけである。人間の感じ方・情緒を光学系と結びつけているわけだ。
 いやはや、「恋のインパルス応答」と同じようなことを考える人はやはりいるものである。まさかそれが漱石だとは思いもしなかった。しかも時代を考えると凄まじい、としか言いようがない。

 そして、さらに次に示すのは

 およそ文学的内容の形式は(F+f)なることを要す。Fは焦点的印象又は観念を意味し、fはこれに付着する情緒を意味す。
ということを示す図である。先の - 「漱石の美術愛」推理ノート - ではこの図と遠近法の関連が述べられている。
 
「文学の焦点」

漱石全集第十一巻より

 ここで、縦軸は「時間」となっており、横軸は「色々な出来事」である。ある人が感じた「色々な出来事」を時間方向に収斂させていくと、そこには「作者自身の視点がある」というわけだ。これが漱石の言う「文学論」の中心である。

 この図などカメラや望遠鏡の光学系を彷彿とさせる。「光学系の一例」を以下に示す。
 

「光学系の一例」

 先の「文学の焦点」を示した図はレンズで光を焦点に集めるのと全く同じだ。いや、「焦点から光を投光する」のと同じと言った方が良いだろうか。以前、

で、
 景色に焦点を合わせて、フィルムに結像させるのがカメラだ。しかし、フィルムに写っているのは単なる景色ではない。カメラの光が集まる焦点にフィルムが位置していると思い込むとわからなくなる。逆から考えてみれば簡単に判るはずだ。カメラの視点にフィルムが位置しているのだ。フィルムに景色が写っているのではなく、フィルムが景色を選び、景色を切り取っているのである。

 写真に写っているのは、撮影者の視点なのである。写真を見れば、撮影者が、どこに立ち、何を見てるかが浮かび上がってくるはずである。フィルムに写っているのは撮影者自身なのだ。

と書いたのと全く同じである。その光学系には歪みもあるかもしれないし、色フィルターもかかっているかもしれない。しかし、とにかく焦点にはその人自身がいるのである。

 写真でも文章でもとにかく何であっても、色々感じたことを表現していく時、その焦点には表現者自身がいる。私の大好きなこの2000/2/25の日記なんか、実にそれを感じるのである。
 

2000-09-02[n年前へ]

もうすぐ二歳の「できるかな?」 

初心に帰ってみましょうか?


  「できるかな?」が始まったのは二年近く前の秋のことだった。

でも触れたが、当初(実は今も続いているが)は某社内の某サーバー内でこっそりと始めてみたのだった。それから二年あまりでずいぶんと色々な話が増えた。某社サーバー内でしかアップしていない
  • プリンタドライバーは仮免
  • 続 電子写真プロセスを分数階微分で解いてみよう
  • 続々 電子写真プロセスを分数階微分で解いてみよう
等の外部未公開の話も含めれば、もうすぐ200回近くになる。そして、公開場所の変化もあってずいぶんと話の傾向も変わってきた。最近では「ここのところの話題は何か変じゃないですか?hirabayashiさんどうかしたんですか?」とか、「大丈夫?hirabayashiくん?」などと言われる始末である。

 そして話が増えてきたせいか、自分自身でも「アレッ、あの話はどこにあったけ?」というように迷ってしまうことが多々ある。迷うどころか、最後まで見つからないこともしばしばあるのだ。そして、それは私でもない他の人であればましてやそうだろう。というわけで、

では簡単にそれまでの話の紹介をしたし、ではhirax.net内の全文検索機能を付けてみた。

 今回は、これまでの話題をもう一度自分で読み直して、その中から「自分のお気に入り」を調べてみたいと思う。そして、最近少し話題が変になってしまっている反省をして、もう一度初心に帰ってみようと思うのだ。

 まずは、1998年の話題からいくと

というあたりが、良い感じだ。京都の風物詩である「鴨川カップル」達が人目を気にしながら寄り添う合う姿を考えてみたものだ。後の「恋の力学」シリーズなどはここらへんから始まっていた、といっても良いだろう。そしてこの頃の[Scraps]系の話題としては、がある。少し前に、この「さなえちゃん」を描いた漫画の作者からメールを頂いたのがとても私には印象深かった。

 そして、1999年の上半期から選んでみると、まずは

というところだろう。ハードディスクの情報を可視化することで情報圧縮・エントロピーを考えてみた一話である。そして、同じような「可視化シリーズ」の一つであるはこの後「感温液晶はどこで売っていますか?」という質問メールを多々頂くことになった。そして、[Scraps]系のが私の「お気に入り」でもある。ここら辺から「できるかな?」の中に全然技術的な話題でない物が登場し初めたような気がする。

 そして、1999年の下半期はもう自分で言うのも何だが傑作揃いである。大体、書いているペースが自分でも驚くくらいのハイペースだ。月当たりの話の数を数えてみると、

  •  7月 9話
  •  8月 9話
  •  9月 8話
  • 10月 8話
  • 11月 11話
  • 12月 9話
という感じでいやもうビックリしてしまう。平均すると三日に一話である。どうも、本業が忙しいとそれに比例して制作ペースが増加するという、「恐怖の睡眠時間減少の法則」が成り立つようだ。

 この頃の「お薦めの話」はいっぱいある。例えば、

に始まった「文章可視化シリーズ」や、で始まった「ASCIIアートシリーズ」だろう。から始まる「江戸五色不動シリーズ」は江戸にロケまで行ったので、とても思い出深い話の一つである。しかも、妙な偶然のせいでまるで小説の中に迷い込んだような気持ちになったものだ。

 そして、WEBページを作る上では

などもどうしても外せない。そして、この後結構続くことになるという「恋の力学」シリーズもこの時期に始まっている。そして、この頃の一番人気が何と言ってもだろう。この「ミニスカート」系の話の流れは以降も続くことになるのが自分では意外でもあり、残念でもある。それはさておき、ナンセンス系ではなんてのも面白い話だと思う。そして、1999年の終わりはやはりこれが「お気に入り」の話である。また、[Scraps]系の話がこの時期にはやたらいっぱいあるのが面白いところだ。その内からいくつかピックアップするとこんな感じだろうか? さて、2000年上半期にもなると、すいぶんとペースも内容も落ち着いてしまう。その中でも、「恋の力学」シリーズに夏目漱石をトッピングしてみたという辺りは「文学と科学が合体」した話で、自分の中では書いてて結構面白かった話である。そして、ナンセンス系のもクダラナイところところが外せないと思う。そして、この辺りで始まり未だ継続中のは最近の変な流れを予感させるのが哀しいところである。

 さて、今回は2000年上半期までの話の中から「私の好きな話」を振り返ってみた。とはいえ、私の好きな話=他の人の好きな話ではないようだし、他の話も適当に眺めて頂いたら良いかなぁ(私が)、と思うのだった。
 

2001-08-07[n年前へ]

「ボケ」た背景で包み込め 

デジカメ画像をキレイにボカそう アルゴリズム編

 最近、新しいデジカメを物色中である。私はこれまではFinePix4700zを使っていたのだけど、そのFinePixが半年程度で壊れてしまった。というわけで、C-4040ZOOMがどんなものか期待しているところである。

 壊れたFinePixと言えば、そもそも壊れたFinePixは一台ではなかった。私はすでにFinePixを二台も買っているのだ。そして、もうすでに二台とも壊れてしまっているのである。連続殺人事件ならぬ、連続カメラ自殺事件なのである。

 まず、一台目に買ったFinePix700ははメキシコのティファナでポケットから落としたら、バッテリーから電源が供給されなくなった。もちろん、ACアダプターを使えば立派に動くのだけれど、それでは少しばかり機動性に欠けてしまう。まさか発電機を持ち歩くわけにはいかないし、コンセントの近くでしか撮影することができないとなると、それは非常に困ってしまう。そこで、すかさず二代目としてFinePix4700zを私は買った。ところが、買ってから半年位たったある日、今度は勤務先の駐車場でポケットから落としてしまった。すると、今度はファインダー視野がズームに連動しなくなって、なおかつレンズがまるでジョイスティックのようにあらゆる方向に曲がるようになってしまった。

 こんな風にデジカメはとっても壊れやすくて、半年毎にデジカメ出費を強いられる私に周囲は「落としたオマエが悪い」と非常に冷たいのである。残念なのだ。「そういうのは壊れたんじゃなくて、壊したんだ」と被害者である私をまるで加害者のように告発する人さえいるのである。連続カメラ自殺事件は実は他殺で、しかも犯人は私だと告発する輩さえいるのだ。ひどい話である。
 

 ところで、C-4040に期待しているのは、コンパクトで、レンズアダプターが使えて、レンズがF1.8と明るいことなのである。コンパクトなのは持ち歩くために必要だし、私はなんと言っても超広角デジカメが欲しいのだが、そんなデジカメはないので、ワイドコンバーターを付けたいのでレンズアダプターが必要なのである。明るいレンズの方は、うす暗い中でも撮影する時に重宝しそうなので、少し期待しているのである。
 

 ところで、この位明るいレンズであれば、もう少しぼかすことができるものだろうか?デジカメで写真を撮ってもどうしてもボケない。35mmフィルムを使っているカメラなどと比べるともう全然ボケない。もうほんとにボケない。

 例えば、35mmカメラで135mm F4.5開放のレンズなら、ピントの合ってない背景はこの位はボケる。これは京都の哲学の道近くにある吉田山で撮った写真だ。
 

35mmカメラで撮影した例 135mm F4.5?

 

 ピントが合っている位置以外は光がボケて、キレイなボケが発生する。どちらの写真も絞りは開放で撮影しているので、後ろの風景はほぼ丸くボケている。ぼかせばキレイというわけではないけれど、背景などがごちゃごちゃしている中で対象物だけを浮き上がらせたい場合には、「ボケ」させるととても良い感じになる。
 

 しかし、デジカメではそうそう簡単にボケた画像を撮影することはできない。35mmフィルムに比べて、CCDサイズが小さいからである。35mmカメラよりAPSカメラはもっとぼけなくて、それよりデジカメはさらにボケないのである。そんな様子を見るために、二台目として買ったFinePix4700zで「ボケ」を意識して撮影してみたものが下の写真である。手前の植物にピントが合って、奥の道の先はボケてはいるのだけれど、それでも先程の写真などとは比べものにならないほどわずかしかボケていない。
 

在りし日のFinePix4700zで「ボケ」を意識して撮影してみた写真
(昼過ぎの箱根山中で)

 ところで、このような画像の「ボケ」を考えるとき、「ボケ」た画像をシャープに復元しようという話は非常にポピュラーな話題である。例えば、本「できるかな?」でもこれまでに

といった感じで遊んできた。また、さらには「恋の形」を復元しようとしたとか、このようなアプローチを遥か昔に考えていた漱石の「文学論」を振り返ってみたりしたきたのである。しかし、これらはいずれも「ボケたデータを復元する」という問題であった。

 一方、この逆のアプローチである「シャープなデータをボケたデータにする」という問題も結構ポピュラーである。例えば、音楽をホールやライブハウス風にボケた音にするDSPはかなりの数のオーディオ装置に付けられている。これも、もともとはシャープな音声データが部屋の中でボケていく様子をシミュレートする回路である。また、画像に関する話題でも、ピント位置をずらした複数の画像から任意の「ボケ」画像を作成するといった話題もたまに見かける。

 そこで、「できるかな?」でもデジカメ画像を35mmカメラ風にキレイにぼかすことに挑戦してみることにした。今回は、まずはアルゴリズムを確認して、次回以降で簡単プログラムを作成してみることにしたい。

 まずは、似たようなソフトウェアがあるかどうか、Googleで適当なキーワードを使って検索をかけてみると、IrisFilter(http://www.reiji.net/iris/)というソフトウェアがあった。これは、「写真のぴんぼけを再現する」というフィルターだった。サンプル写真などを見てみると、これがなかなかきれいだった。例えば、早朝の御殿場の路上を「在りし日のFinePix4700z」で撮影した写真にこのフィルタをかけて、「ボケ」を加えてみたのが下の画像である。
 

Iris Filterでデジカメ画像を「ボケ」させたもの
オリジナル画像
Iris Filterで処理したもの

 ここではこんな六角形の絞り形状をを用いてみた。右の処理画像中の、車のテールランプや車の下部を眺めてみると、鋭いハイライト部が六角形に光っているのがわかだろう。確かに、「ボケ」がカメラの絞り形状になっていて、良い感じである。

 WEBページの記載によれば、このIris Filterは「フィルム特性曲線を利用し、レンズから通った光がフィルムを感光させる様子を再現しています」ということである。なんでも、特許も国内・USP共に出願済みということだが、特願2000-100042もU.S.PTO 09/772532も未だ公開にはなっていないようで、残念ながら特許の内容を読むことはできなない。

 このWEBページの記述の中で面白いのは、「データ上の数値をそのまま拡散させる従来のPhotoshopをはじめとした画像処理ソフトと違い、実際のフィルムに当たる光の量(露光量)を逆算し、その露光量をもってピントがずれている様子を再現します」という歌い文句でPhotoshopの「ガウスぼかし」と比較広告してある部分である。

 試しに、先の画像をIris Filterで「ボケ」を加えた画像と、Photoshopの「ガウスぼかし」とで「ボケ」を加えた画像を比較してみると、下の二枚の画像のようになる。確かにIrisFilterの売り文句通り、こうして比較してみるとPhotoshopガウスぼかしが写真の「ボケ」っぽくないのに対して、IrisFilterの「ボケ」が写真のそれっぽいことが良くわかる。
 

Iris Filterの処理画像(左)とPhotoshop ガウスぼかしで処理した画像(右)の比較
Iris Filterで処理したもの
Photoshop ガウスぼかしで処理したもの

 さて、お仕着せのソフトを使ってみるだけではなくて、自分でデジカメ画像をキレイに「ボケ」させてみることにしたい。というわけで、hirax.net風「ボケ」フィルターの動作を考えてみる。

 まずは、毎度のことだがオリジナル画像が「ボケ」る様子を計算する式は

逆フーリエ変換(  フーリエ変換( オリジナル画像 ) x フーリエ変換(ボケ具合 ) )
と表すことができる。詳しくは、「宇宙人はどこにいる?」の回でも読んでもらうことにして、簡単に言えば周波数領域でオリジナル画像とボケ具合を掛け算をしさえすれば良いのである。つまり、今回のデジカメ画像をぼかす場合だったら、
  1. デジカメ画像と「ボケ」具合をそれぞれフーリエ変換し周波数空間に変換
  2. 周波数空間で乗算を行う
  3. 逆フーリエ変換して実空間に戻す
とハイ!「ボケ」画像の出来上がり、というわけである。ボケ具合が小さい場合などは、このやり方よりもずっと計算量の小さいやり方はあるわけだけれど、とりあえずこのやり方はとても単純明解なので今回のように試しでやってみるにはとっても楽な方法なのである。また、ここでいうボケ具合というのは、こんな形状の「ボケ」具合のことである。
 

 じゃぁ、早速やってみようとなるわけだが、その前にもう一つ注意することがある。それは、RGB画像の数値というものは実は元々「明るさを対数変換した値」であるということなのである。人間の目も含めて世の中の大抵の材料は対数的な感度を持っている。例えば、人間の目に「2倍明るい」という場合に、光は「2倍明るい」というわけではない。その場合には指数的にX^2倍明るいのである(ここで、xの値はそれぞれのデバイスによって色々と違う)。その明るさをRGB画像の数値データにする時に、明るさの対数をとってLog[x,X^2]で2という数値として表しているわけだ。

 RGB画像の数値が「明るさを対数変換した値」だというようすの一例を示すと下の図のようになる。
 

RGB画像の数値というものは実は元々「明るさを対数変換した値」である
片対数軸で表した
横軸 = 0〜255の数値データ
縦軸 = エネルギー
線形軸で表した
横軸 = 0〜255の数値データ
縦軸 = エネルギー

 逆に明るさからRGB画像の数値データへの変換グラフは例えばこんな感じである。RGB数値で200と255と言っても実はその明るさは大違いであることがわかると思う。
 

 

 だから、この手の処理を行う際には、まずは指数変換してから処理を行い、そしてその後対数変換してやらなければならないわけだ。もちろん、今回のデジカメ画像をぼかす場合にも、RGB画像の数値をまずは指数変換した後、「ボケ」演算を行って、その演算結果を対数変換でRGB画像の数値に戻してやらなければならないのである。といっても、別に難しい話ではなくて画像を扱う装置だとごく当り前の話だ。

 そう、「ボケ」演算のhirax.net風レシピはたったこれだけ〜というわけで、早速このレシピに従ってhirax.net風デジカメ「ボケ」フィルターをかけてみたのが下の画像である。キレイな「ボケ」画像ができあがっていることが判ると思う。
 

hirax.net風デジカメ「ボケ」フィルター
キレイな「ボケ」画像のできあがり〜

 ところで、デジカメ画像のRGB画像の数値を指数変換したものに「ボケ」演算を行ったわけだけれど、もしRGB画像の数値そのものに対して「ボケ」演算を行ったら、どんな結果になるだろうか?つまり、「データ上の数値をそのまま拡散させる」やり方をしたら、どうなるのだろうか?そこで、試しにRGB画像の数値そのものに対して「ボケ」演算を行ってみるとこんな結果になる。
 

RGB画像の数値そのものに対して「ボケ」演算を行ってみた結果
キレイじゃない…

 何だかボンヤリとにじんだだけの「キレイじゃない」写真になってしまっている。それは、当り前である。本来2倍明るいものはX^2倍明るいわけで、すごく光の量は2倍どころでなく多いわけだ。それが広がる量を仮にRGB数値そのまま2倍として扱ってしまうと、その光の部分は薄暗くなってしまう。コントラストのはっきりしない、ぼんやりとした写真になってしまうわけだ。ちゃんと、X^2倍のデータとして扱ってやらなければならないわけである。

試しに、指数処理したものと線形処理をしたものとを並べてみるとその画像の違いがよくわかるだろう。
 

指数処理した画像(左)と線形処理をした画像(右)の比較
hirax.netレシピの
キレイなボケ画像(指数処理)
 

キレイじゃないボケ画像(線形処理)

 さて、今回はデジカメ画像の「ボケ」フィルターのhirax.net風レシピを確認してみた。次回(と言ってもいつになるか…)以降に、このレシピに従って実際にソフトを作成していこうと思う。
 

 ところで、「文学論」の中で漱石は「ボケ」は焦点的印象又は観念に付随する情緒を意味する、と言っている。それは、言い換えれば「何かの出来事をきっかけとして感じた怒り・悲しみ・喜びなどの感情がボケである」ということだ。そして、さらに言えば、写真で背景をぼかすということは、つまり「背景にある出来事が生みだした怒り・悲しみ・喜びを広く混ぜて包み込む」ということなのである。

 だから、何かを撮影する時に対象物の背景をぼかすということは、「背景にある出来事が生みだした怒り・悲しみ・喜びを広く混ぜて対象物を包み込んで、そして対象物を浮き上がらせる」ということなのかなぁ、とぼんやりと考えてみたりする。そんな写真は対象物を写しこんでいるのと同時に、それを包みこむ背景も写しこんでいるンだろうなぁ、と考えてみたりする。
 

2002-08-17[n年前へ]

Nグラムモデルとクラスター分析を用いた漢文古典テキストの比較研究 「般若心経」の異訳の比較を例に 

 師 茂樹。あー、漱石の「文学論」をどこかの出版社に文庫本にして欲しい。

2002-08-26[n年前へ]

CleType自主学習(仮) 

ちょっと真面目にClearType(仮)

- ちょっと真面目にClearType(仮) -
(2002.08.26〜)
  1. 楽しそうな「iMac」&「電子ブック」風ノートPC用スタンド -はじまり - (2002.08.26)
  2. 一本道か、分かれ道か - ドキュメントの縦横比について- (2002.08.29)
  3. 水平思考と垂直思考 - 文字の縦横解像度 - (2002.08.29)
  4. 細かくすると楽(粗く)になる? - ClearTypeの一番の秘密- (2002.09.09)

楽しそうな「iMac」&「電子ブック」風ノートPC用スタンド -はじまり - (2002.08.26)


 Lapvantageという楽しそうな会社を初めて知った。ノートPCをiMac風にするLapvantageDomeやPCを縦置きで使うためのLapvantagePortraitという、とても実用的でいて、それでいて明和電機のような面白い製品を作っている会社である。明和電機は兄弟が運営しているが、こちらのLapvantageの方はビアボーム親子がやっているらしい。iMac風スタンドの方は角度が振れないようのが(特にノートPCを立てられない)残念だが、Lapvantageの方はもう少しデザインがスマートであるならば今すぐにでも欲しくなる。
 

Lapvantage Products
Lapvantage Dome
Lapvantage Portrait

 複数の作業を切り替えながら作業をしたり、あるいはツールバーが多数出てくるようなソフトウェアを使って作業をする時には、左右に広いディスプレイが便利で使いやすい。しかし、単純に一つのドキュメントを読んだり、一つのドキュメントを書いたりする場合には上下に長いディスプレイを使うと、見通しがきいて考えをまとめやすくなる。気のせいか、頭の中の見通しがとても良くなるように感じたりする。だから、以前から横長の画面のノートPC(ToshibaPortege 320)を愛用していたりした私はノートPCの画面を横にして使ったり、縦にして使ったりと、画面を切り替えて使ってみたいと感じていた。AdobeAcrobat Readerであれば、画面を回転させて文章を読む機能があるので、これまでノートPCを回転させて電子ブックのようにして文章を読んだりすることもあった。 

 Lapvantage PortraitはPivotProのソフトウェア付きなので、Windowsの画面を自由自在に回転させることができる。だから、ノートPCを普通に横置きに使ってみたり、スタンドに載せて縦置きに切り替えて使ってみたり、と好きなように切り替えることができる。「これはなかなか便利そうだ」と思い、私も私も30日有効のPivotProのデモ版をインストールして使ってみることにした。

 そして、このソフトのインストールをきっかけにして

で調べたClearTypeに関して、ちょっと少し考えてみた。 (続く)

 

一本道か、分かれ道か - ドキュメントの縦横比について- (2002.08.29)


 前回書いたように、複数のことを考えるなら「左右に長いディスプレイ」が良くて、一つのドキュメントを読むなら「上下に長いディスプレイ」が良い。その理由を端的に言えば、「目が左右についているから」だと思う。

 まず、「目が左右に付いているので、あまりに大きい左右への目の動きは、目にとってとても非対称な作業であるから不自然」だ。だから、左右を眺めるときには自然と頭を左右に振ることになる。その頭を左右に振るという作業は、頭の中での何らかの切り替え作業を伴うような気がする。だから逆に、ツールパレットの切り替えのような「何らかの作業の切り替え」を伴う作業であれば、その左右へ視線を移動する(自然と頭も左右に動かす)ということはとても自然な行為になる。しかし、それは一つのドキュメントを読むような場合には、いたって不自然な行為になってしまう。だから、一つのドキュメントというのは本来「上下に長い=縦長」であるべきだと思う。

 そしてまた、「目が左右についているから」、人は上下方向を「一本道」に繋げて考える。例えば、絵画を眺めるとき、上に見える景色は多くの場合遠い景色で、下に見える景色は多くの場合近い景色だ。漱石の文学論の図を引くまでもなく、この「上下の遠さ、距離」というものを例えば時系列上の「一本道」に繋げるのは、いたって自然な連想だと思う。「遠い上」に見えるものは「遠い過去」で、下に来ればくるほど新しいことになる。それは、ドキュメントを読む場合に対応させて考えると、とても自然だ。それに対して、左右に並ぶものは決して「一本道」ではないのである。それは、「選択肢=分かれ道」であって、決して一つの道ではないのである。左右に並ぶものは「複数の何か」なのである。

 だから、一つのドキュメントは上下に並び、上下に長いべきなのである。ドキュメントの表示も同じく、縦に長いべきなのである。
 

「文学の焦点」

漱石 「文学論」より

 最近のPCであると、ディスプレイは通常横に長い。だから、本来縦に長くあるべきドキュメントを眺めようとする場合には、表示を90°回転させてやることもある。そうすると、本の一ページのようにして画面表示を眺めることができる。例えば、AcrobatReaderで表示画面を回転させたり、PivotProなど使ってPCの画面表示自体を回転させてやれば良いわけである。
 

Acrobat Readerで90°回転表示をする
回転させない場合
回転させた場合

 
PDF表示を90%回転させている例
縦長のドキュメントを読むことができる

 このように、ドキュメント表示のための縦横比については、単にディスプレイの表示を90°回転させてやれば問題は解決する。しかし、表示のためのもうひとつの条件、表示品質が問題になってくる。そもそも、液晶(二十世紀においてきたCRTは無視しよう)の解像度はまだま低くて、それを改善するための技術としてClearTypeやCool Fontがあるのだけれど、AdobeのCool Typeはともかく、Clear Typeの場合には表示が90°回転しているという情報をClearTypeが取り扱わない(知らない)ために、上手く動かなくなってしまう。ClearTypeにしてもCool Fontにしても、液晶のRGBのカラーフィルターの並び方を利用してやることで解像度を高めているわけで、その並びの変化(表示の回転)に対応できない場合には表示品質を大幅に落とすことになってしまう。

 次に、「ファイト!縦文字文化 -縦と横の解像度を考えよう - (2001.04.29)」で考察した、文字の解像度についてもう少しちゃんと考えてみることにする。



 

水平思考と垂直思考 - 文字の縦横解像度 - (2002.08.29)


 ドキュメントを表示させるためには、文字を表示させてやらなければならない。しかし、液晶ディスプレイの解像度は必要十分には高くないから、文字はつぶれてしまうことが多い。例えば、「現実問題春夏雪雹資本主義電計算機」なんて文字を表示させてみるとかなり潰れてしまい、非常に読みにくいのが判るはずである。これが、英語の"RealProblem seasons Snow capitalism Computer"なんて文字であれば、まだマシである。

 この日本語と英語の文字の解像度の差について考えてみる。比較例は下に示した、「漢字」と「英語」のテキストを用いることにする。
 

日本語と英語の文字の解像度
「漢字」
「英語」

 まずは、600dpiで20ptのMS Pゴシックのフォントを展開して上のような画像にした後に縦・横方向のそれぞれの解像度を考えてみる。ここでは、縦・横方向の黒い線(あるいは線でない部分)の太さ(幅)の分布を測ってみることにした(今回解析のために作成したソフトはここ(RunLength.lzh)においておく)。テキストのような二値の画像の「解像度特性」を計測するのであれば、このような解析にしなければならない。「ファイト!縦文字文化 -縦と横の解像度を考えよう - (2001.04.29)」でやったようなフーリエ解析は適切な方法ではないのである。

 下の図が縦・横方向の黒い線(あるいは線でない部分)の太さ(幅)の分布である。縦方向に計測した黒い線(あるいは線でない部分)の太さというのは、結局のところ横線の太さ(あるいは線の間隔)であり、横方向に計測した黒い線(あるいは線でない部分)の太さというのは、結局のところ縦線の太さ(あるいは線の間隔)ということになる。どれだけの細かさで「太さ」(あるいは「位置」)を描いてやらなければならないか、を示すグラフということになる。
 

600dpiで20ptのMS Pゴシックのフォントをビットマップに展開してみた場合
「漢字」の場合
「アルファベット」の場合

 「漢字」の場合には「Vertical 方向で計測した線の太さ(あるいは線の間隔)、すなわち横線の太さ(あるいは線の間隔)」が「縦線の太さ(あるいは線の間隔)」に比べて、大きく小さい方にシフトしていることが判ると思う。また、横線の量が縦線の量に比べてずっと多いことも判ると思う。後者は「数字文字の画像学 -縦書きと横書きのバーコード - (2000.01.21) 」で考えたことと全く同じで、「日本語は横線が多い」ということを端的に示している。そして、前者は「Vertical方向で計測した(すなわち横)線の太さ(あるいは線の間隔)」が縦のそれより大幅に小さいということは、「漢字」の解像度は縦方向に大幅に解像度が高い、ということを示している。漢字は縦書き文字故に鉛直思考志向なのである。

 一方、「アルファベット」の場合には、これも「数字文字の画像学 -縦書きと横書きのバーコード - (2000.01.21) 」で考えたことであるが、縦線と横線の量においてはむしろ縦線の方が多いことが判る。水平方向に対して情報量が多いのである。アルファベットは水平思考志向なのである。「アルファベット」の情報量はそのかなりの部分が縦線によるものなのである。そしてまた、線の太さ(あるいは間隔)は横線の方が細い(あるいは線間隔が短い)が、その横線であっても「漢字」の縦線程度の解像度であることが判る。「漢字」に比べて「アルファベット」の解像度は低いのである。

 ただし、文字の解像度を「線の太さ(あるいは間隔)の最小値」だけで論じることはできない。「適切な線の太さ(あるいは間隔)」にすることができるほどに解像度が十分高いか、ということも重要である。もし、そうでなかったら線が妙に太くなったり、細くなったりしてしまったり、あるいは、線の間隔が妙に近づいたり離れてしまったり、つまりは文字のプロポーションが崩れてしまったりするだろう。上の場合は600dpiで文字を表示させた場合の解析例だが、次に現在の液晶と同じような解像度(例えば)150dpiでこの文字を表示(展開)させてみる。こうすることでことで「適切な線の太さ(あるいは間隔)」にできていない様子を確認してみたい。
 
 
 



 

細かくすると楽(粗く)になる? - ClearTypeの一番の秘密- (2002.09.09)


 まずは、「現実問題春夏雪雹資本主義電計算機」という漢字と"RealProblem seasons Snow capitalism Computer"というアルファベットを現在の液晶と同じような解像度(例えば)150dpiでこの文字を表示(展開)させてみた。そして、前回と同じようにそのビットマップ画像の「縦・横方向の黒い線(あるいは線でない部分)の太さ(幅)の分布」を調べてみる。その結果が下のグラフである。また、前回に調べた、これよりも4倍程解像度が高い「600dpiで20ptのMSPゴシックのフォントをビットマップに展開してみた場合」をさらに下に比較用として示してみる。
 

150dpiの解像度で20ptの文字を出力してみた
「漢字」の場合
「アルファベット」の場合
600dpiで20ptのMS Pゴシックのフォントをビットマップに展開してみた場合
「漢字」の場合
「アルファベット」の場合

 150dpiでTrueTypeをビットマップに量子化した場合には、漢字・アルファベットの場合共に、縦・横方向とも600dpi単位で4,8pixelの太さ=150dpiで1,2ピクセル幅のパターンが発生していることが判る。このようなパターンは、600dpiで20ptのMSPゴシックのフォントをビットマップに展開してみた場合には見られなかったものである。つまり、、着目すべきは例えばアルファベットの場合、

  • 縦方向には幅10pixel(600dpi単位)=2.5pixel(150dpi単位)以下の高い周波数は存在していなかった
  • 横方向には幅13pixel(600dpi単位)≒3pixel(150dpi単位)以下の高い周波数は存在していなかった
ものが、150dpiで量子化した場合には
  • 縦・横方向共に幅4,8pixel(600dpi単位)=1,2pixel(150dpi単位)以下の高い周波数が生じている
ことであり、漢字の場合も全く同じように、
  • 縦方向には幅7pixel(600dpi単位)≒2pixel(150dpi単位)以下の高い周波数は存在していなかった
  • 横方向には幅11pixel(600dpi単位)≒2.5pixel(150dpi単位)以下の高い周波数は存在していなかった
ものが、150dpiで量子化した場合には
  • 縦・横方向共に幅4,8pixel(600dpi単位)=1,2pixel(150dpi単位)以下の高い周波数が非常に多く生じている
ことである。液晶の解像度が低いために、その低解像度で量子化する際に「幅の狭い高周波のパターン」(歪み)が生成されてしまっているのである。そのような高周波のパターンが生成されてしまった場合には、低解像度のディスプレイで表示するためには、ますます無理が発生してしまうことになる。「低解像度の表示系の解像度に合わせて量子化(ビットマップ化)してしまうと、ますますその表示系では表示しづらい高周波のパターンが生成されてしまい、結果として読みづらい」という現象が生じてしまうわけである。

 また、これらの文字の場合には本来18〜15≒12pixel(600dpi単位)の線幅・線間のパターンが多いわけであるが、それを150dpi単位( =600dpi単位で4pixel )で量子化してしまうと、場所により4/12 = 33%もの線幅・線間の位置の誤差が生じてしまうことになる。不必要に狭い幅のパターンが作成されたり、不必要に広い幅のパターンが作成されたりして、これでは文字の線が太くなったり細くなったり、線の位置が狂ったりしてしまい、見にくいことこのうえない。これはすべて、150dpiという低解像度で量子化してしまったためである。「低解像度の表示系の解像度に合わせて量子化(ビットマップ化)してしまうと、ますますその表示系では表示しづらい高周波のパターンが生成されてしまい、結果として読みづらい」という一見逆説的に思えてしまう(しかし当たり前の)現象が生じている。

 ところで、本題のClearTypeの場合には横方向(通常の液晶はRGBの3つのサブピクセルが横方向に並べられているから)の解像度を3倍だと仮想的に考えて、横方向を3倍の解像度で量子化を行うことになる。ここで、話の単純のために3倍≒4倍と思うことにすれば、つまりはClearTypeの場合には本来150dpiの解像度であるにも関わらず、サブピクセルを考えて600dpiの解像度で量子化している、ということである。それは結局上の二つのグラフの比較と同じであって、ClearTypeを使うと実は表示すべきパターンが「より表示しやすい低い周波数のパターン」になっているのである。それは、「文字の線が太くなったり細くなったり、線の位置が狂ったりしてしまう」ことがなく、目にとってはとても見やすいパターンになるだろう。この量子化の段階について触れている情報は見たことがないが、実はこの量子化の段階にClearTypeの隠された(しかし、一番重要な)メリットがあるように思う。また、アルファベットの場合にはHorizontal方向に振幅を持つパターン(=縦線)が支配的に多いため、Horizontal方向に仮想的に高解像度の量子化を行うことは非常にメリットを効果的に得られると考えるのが自然である。

 次に、このように量子化されたデータをClearTypeで表示する際の問題点・その解決方法について考えてみていくことにしたい。

 P.S.ちなみに解析ソフト(RunLength.lzh)をアップロードしました。
 



 
 
 



■Powered by yagm.net