2000-05-23[n年前へ]
■「ナンパ」における言語学
ヤバいことは後に言え!?
ある飲み会でのことだった。それぞれの頭の中にアルコールが充満した中で、話題は何故か「ビバリーヒルズ青春白書」であった。30代の人々が何故か「ビバリーヒルズ青春白書」を話題にしているのである。とりあえず、
「なんで奴らはあんなにパーティーをしまくるのだ?」というようなことを話していると、突然N氏が
「一体、いつ勉強をしておるのだ?」
「どうして、あんな深夜に女を部屋に連れ込めるんだ?」
「それは言語構造のせいでア〜ル。」と言い出したのである。そして長々とN氏が話し始めた内容は私にとって「目からウロコ」の内容であった。あまりにもったいないので、ここに書いておくことにしたい。その内容を発展させるならば、言語構造から「ビバリーヒルズ青春白書」の登場人物たちの行動原理を解析し、ついには文化論を説明することすらできるのである。
「英語の言語構造があやつらをナンパに駆り立てるのでア〜ル。」
なお、これから書く内容は、例え一人称であってもそれは私でなくN氏の意見である。「誘い」、言い換えれば「ナンパ」、について言語構造まで辿って考えを巡らせているのは私ではない。文化論などに考えを巡らせるのは仮に私であっても、「ナンパ」学に考えを巡らせているのはN氏である。以降、それを頭にインプットしておいて頂きたい。また、いつぞやも書いたが私の英語力は惨憺たるものである。なので、英語の表現についてはウソ八百である可能性が高いことも明記しておきたい。
それでは、まずはこんなシチュエーションを考えてみよう。登場人物は次の三人である。
- 花子 : 今回のマドンナ
- 太郎 : 東京の多摩地区にある大学に通う大学生
- ジョン : ビバリーヒルズ在住の大学生
さて、いきなりであるが、太郎とジョンは花子にアタック中である。今回は、大学の授業でレポートが出て、それをネタに彼らは花子へアタックをかけているのである。今夜、花子を自分の部屋へ連れ込もうとしているのである。そのために、彼らが花子に言った言葉はそれぞれこんな感じだ。
- 太郎 (日本語) : 今夜深夜まで、オレの部屋で、オレと一緒にレポートをやろうぜ。
- ジョン (英語) : How about making our reports in my room until late atthis night?
- 太郎 : 「今夜深夜まで」、「オレの部屋で」、「オレと一緒に」、「レポートをやろうぜ」。
- ジョン : 「ほらほらアレはどうかな」、「レポート書きだけどさ」、「ぼくの部屋でさ」、「深夜まで」
太郎の場合 :太郎 :
「今夜深夜まで」花子 :(花子 : いきなり、深夜までって何それ...ヤな感じ...) マイナス 20ポイント「オレの部屋で」(花子 : 深夜の次は、オレの部屋って「危険すぎ」じゃないの?) マイナス30ポイント「オレと一緒に」(花子 : アンタと一緒に何をするって言うのよ。何コイツ。もう絶対ダメ。) マイナス50ポイント「絶対ダメ。」太郎 : (お〜い、最後まで聞いてくれ...)
ジョンの場合 :これなら判るだろう。ジョンのズルいところは「肝心なこと」を後に言う点である。そして、太郎の失敗は「肝心なこと」を先に言ってしまった点である。とはいえ、これは日本語と英語の言語構造の違いであるから、太郎にはどうしようもないのである。そして、この英語の言語構造がジョンの花子へのアタックを成功させ、ビバリーヒルズ青春白書をやたら華やかなストーリーに仕立て上げたのである。ジョン :
「ほらほらアレはどうかな」花子 :(花子 : 一体何かしら...ジョンって結構シャイなのね。) プラス10ポイント「レポート書きだけどさ」(花子 : そうそうやらなきゃいけないのよね。ジョンって結構マジメなのね。) プラス20ポイント。「いいわよ。一緒にやる?」ジョン :「ぼくの部屋でさ(小声で)」
「深夜まで。(もっと、もっと小声で)」
この仮説の証拠は他にもある。例えば、「日本語の歌謡曲の歌詞は状況を説明するところから始まる」とよく言われる。そして、「英語の歌謡曲では状況なんか説明せず、気持ちをひたすら言いまくる」というのは良く言われるかどうかはしらないが、少なくとも私の印象はそうである。
例えば、「雨は夜更け過ぎに雪へと変わるだろう。」という極めて客観的かつ定量的な気象状況の説明から始まるのは山下達郎の「クリスマス・イヴ」であり、それが日本語の言語学的な特徴であり、日本の文化でもある。学生時代に気象学の試験で泣きそうになった私としては嬉しい限りである。
しかし、それが英語圏文化の一例であるワム!の"Last Christmas"になると、「去年のクリスマスに、キミにオレのハートをプレゼントしたね。このオレが。」で始まるのである。ここには客観性のカケラもない。このような文化の差を形成したのは、そもそも日本語と英語(遡ればラテン語だろうか)の言語構造の差が原因だったのである。
それを喝破したのがN氏の、
「それは言語構造のせいでア〜ル。」
「英語の言語構造があやつらをナンパに駆り立てるのでア〜ル。」
という言葉だったのだ。
というわけで、世界各国のさまざまな言語で
「今夜深夜まで、オレの部屋で、オレと一緒にレポートをやろうぜ」をどう言うのか調べてみたいと思う。その文章における語順を考えるならば、それぞれの文化を示す何かがそこにはあるはずである。そして、さらに言語チャンピオン「ナンパ」編を実施してみたい、と私は思う。
もしも、何語でも構わないし、各種言語で「今夜深夜まで、オレの部屋で、オレと一緒にレポートをやろうぜ」をどう言うか、ご存知の方がいらっしゃったならば、教えて頂けたら幸いである。ぜひ、私(jun@hirax.net)まで連絡して欲しい。
2002-02-03[n年前へ]
■映画のフィルムを並べたスクラップ
映画大好きの「元」少年少女達へ
先日、「お笑いパソコン日誌」で3次元画像ブラウザ「みょう絵」というものを知った。画像ファイルを日付や色の特徴などで三次元空間に並べてみる、というソフトだ。下の図がその「みょう絵」の動作画面だけれど、こんな風に三次元空間に配置された画像が散らばる中を「みゅぃーん」と動く感覚が結構気持ち良い。
で、その「みょう絵」をいじって
欲を言えば画像だけでなくて、色んな文章や音楽や気持ちとか、世の中のありとあらゆるものをこんな風にして眺めてみたいなぁ、と思った。あのころ撮影した写真や、眺めた景色や、読んだWEBサイトや…、とにかくありとあらゆるものを。と思った。すると、「お笑いパソコン日誌」のChic氏が
余談ですが、Windows XP はムービーファイルをサムネイル化してくれるんですが、あらゆるファイルをそうしてくれればいいのにと思ったり。と書いていた。それを読んで、「みょう絵」で一本の映画の中を覗いてみたいなぁ、と思ったのである。
映画が展開していくそのストーリーの時系列と、その中の色々な各舞台を三次元的に眺めてみたいと思ったのだ。そして、さらにはその映画の世界の中を三次元的に散策してみたいと思ったのである。
もちろん、それは映画の動画ファイルを静止画に展開して、それを「みょう絵」で開けばよいだけの話である。以前、動画ファイルを静止画に展開するアプリケーションを作ったこともある。
とはいえ、それを使って映画をキャプチャーしたファイルをそのまま静止画に展開するわけにはいかない。そんなことをしたら、ものスゴイ数の静止画ができてしまうからだ。1秒あたり約30枚もの静止画を含む動画をそのまま静止画に全部落としたら、一体どれだけのファイルができるだろうか?たった2分位の映画の予告編だって、展開したら何と3600枚である…。これだけの画像を読みこませたら、少なくとも私の遅いPCでは「みょう絵」がストライキを起こすことは確実だ。
そこで、映画の動画ファイルの中から、場面が変わるごとに一枚づつ静止画を抽出してみることにした。そうすれば、映画の中の色々な場面をそれぞれ一枚づつの画像として眺めることができる。そして、その画像を集めれば、その映画の色々な場面を一枚のノートにして見ることができるわけである。
というわけで、作ってみたのがこのAVI2Stillsである。いつものように、テキトーに仕立て上げただけだ。下の図がAVI2Stillsの動作画面である。ちなみに、この画面中で、TrigerLebelは場面変化を検出する感度を示すパラメータで、多分60位が適当だと思う。そして、SkipFrameは動画ファイルの中を何フレーム毎に調べていくかを示すパラメータである。展開スピードが気にならなければ1でも構わない。
このソフトができたところで、試しに - ロケット制作に憧れる少年達を描いた「遠い空の向こうに」"OctoberSky"( = 原作 "Rocket Boys"のアナグラム) - の中の各場面を抽出してみたのが下のスクラップである。予告編の中の各シーンが絵コンテのように抽出され、並べられていることが判ると思う。
こんな風に自分の好きな映画の場面を全部テキトーに抽出して、あとは「みょう絵」で眺めてみれば、その映画の世界を三次元的に散歩できるのである。というわけで、北村薫原作の映画「ターン」の予告編の世界を「みょう絵」で眺めてみたのが下の図である。
静止画では判りにくいけれど、立体的に配置された「映画空間」の中を散策してみるのは、やはりちょっと面白い。これで、欲を言えば各場面に近づくとその場面で流れていた音楽やセリフが聞こえてきたら、面白いと思う。それは、ムソルグスキーの「展覧会の絵」のようで気持ちが良いはずだ。そして、そうすれば気持ちが良いだけではなくて、今の「みょう絵」に足りない「画像だけではない何かをも眺めること」ができるわけだ。
またせっかくだから、「みょう絵」で眺めて終わりにするのも少しもったいないので、以前作った写真アルバム風のスクリーンセーバー"FilmStrip99"(手元のWindows2000では手直しが必要みたいだが…)で、白黒写真のコンタクトフィルム風のスクリーンセーバーを動かしてみた。それが下の画像である。映画のフィルムでなくて、写真のフィルム風だというところはご愛敬で許して欲しい。ちなみに、下の一連の画像は"SomeoneLike You"「恋する遺伝子」の予告編から変換したものである。
こんな風に自分の好きな映画の予告編などを使って自分用のスクリーンセーバーを作ってみるのも面白いと思う。今なら、たくさんの映画の予告編にオンラインでアクセスできるし、その予告編の動画ファイルがもしmov形式ならmov2aviを使って、それがもしrealvideo形式ならTinraを使えば、AVIファイルに変換できる。そして、今回のAVI2Stillsを使えば良いだけなのである。
ところで、こんな切り取った映画のフィルムを繋いだ一連のシーンといえば、ニューシネマパラダイスのラストシーンを思い出す。アルフレードの遺品、「主人公が覗き見ていた一連の場面」を繋いだシーンのフィルム、に主人公が涙したように、かつて少年少女だった映画大好きの人達がそれぞれ自分用のそんなスクラップフィルムを作ってみるのも面白いかも、と思う。そして、ふと思うことがあった時に眺めてみるのも、趣があるかも。
2002-04-24[n年前へ]
■視線のベクトルは未来に向くの?
マンガのストーリーの方向を顔向きで探る 前編
一年くらい前から、コンビニで300円ほどの安いコミックをたまに買うようになった。休日の早朝、コンビニで発泡酒とおつまみを買って、ついでにそんな安いコミックを買って、そして、ビールを飲みながらそれを読むのがワタシの休日のささやかな(だけど至高の)幸せなのである。そんな至高の幸せをかみしめるとある休日、286円の西岸良平の「三丁目の夕日」を読みながら、ワタシはふと思ったのである。
これまで、「できるかな?」では、様々な小説、例えば「星の王子さま」「明暗」「こころ」「草枕」「失楽園殺人事件」といった小説を色々と解析してきた。そして、その中の主人公達がどんな風に動いていくのかとか、作者が何を考えているかとか、あるいは、犯人は誰かであるのか、などを調べてきた。何でそんなことを考えるの、と人には聞かれそうだけれども、とにもかくにもワタシはそんなことを考えてきたのである。そして、さらにふと考えてみれば、ワタシの至高の幸せを支える素晴らしき286円のマンガ本に関して、ワタシはストーリー構造などを真剣に考えてみたり、調べてみたりしたことはなかったのである。イケナイ、イケナイ、こんなことでは「恩知らず」野郎としてワタシにはバチが当たってしまうに違いないのである。
そこで、今回「コミックの中のストーリー構造」について調べてみたい、と思う。コミックの中で主人公達がどのような方向へ進もうとしているのか、あるいはその歩みの中で主人公達は一体何を考えているのか、などについて少し調べてみることにしたのである。
これまで、小説中のストーリー構造や主人公達の動く方向を調べるときには、「特定の言葉や主人公達」が登場する位置を調べたり、あるいは他の言葉や登場人物との相関を調べたりしてきた。それでは、一体マンガのストーリー構造や主人公達の動く方向を調べるにはどうしたら良いだろうか?そんなものどうやって調べるの?と一瞬悩んでしまいそうではあるが、ちょっと考えてみればそれはとても簡単なのである。小説と違って、マンガでは登場人物達がちゃんと見えるカタチで描かれているのである。主人公達がどの方向を向いているかがちゃんと描かれているのである。そしてまた、主人公やその周りの人々や、ありとあらゆる人々がどんな方向を向いているかがもうありのままにちゃんと描かれているのである。
だったら話は実に簡単、マンガの中の登場人物達の向きを刻々調べてみれば、そのマンガのストーリーの中で主人公達がどちらへ向かって何を見ながら動いているかが判る、というわけだ。実に即物的でシンプルなアプローチである。
善は急げ、というわけで、早速今さっきまで読んでいた手元に掴んだままの西岸良平の「三丁目の夕日 ジングルベル」の中から、「霜ばしら」という短編を題材にして、その中の主人公の顔の向きを調べてみることにした。ある恋人同士の、とても楽しくて、そしてとても悲しい物語である。
まずは、マンガのコマ中の登場人物達の向きと角度の対応表を下の表のように定めた。登場人物がコマ中で右方向を向いているときに0度とし、正面方向(すわなち読者方向)を向いている時が90度。コマの左方向を向いていれば180度である。そして、280度では真後ろを向いているという具合である。
270 | ||
180 | 0 | |
90 |
このようにコマの中に登場する主人公達の向きを数値化することにして、話の冒頭から結末までの各コマ中での主人公(周平)とその恋人(アキちゃん)の向きを調べてみたのが下のグラフである。青色の四角が主人公で、赤色の三角がヒロインである。また、その二人が向かい合ってる場合には朱色の丸を方向=0の位置に書き入れてみた。グラフ中では水平軸がストーリーの時系列で、左端が話の冒頭であり、右端が話の結末、そして縦軸が「主人公達の向かう方向」である。また、ヒロインのアキちゃんが途中の2カ所にしか現れないのは少しばかり悲しいストーリーのせいだ。この「霜ばしら」は主人公とアキちゃんの涙を誘う悲しい物語なのである。
左端 = 話の冒頭 右端 = 話の結末 縦軸 = 主人公達の向かう方向 |
このグラフを少し眺めていると大体の特徴が見えてくるだろう。すなわち、
- 主人公達はほとんど45、135、235度の3方向しか向いていない
- それ以外の向き(例えば315度)を向く場合などは、ほとんどが「向き合っている」場合である
- そして、135度の方向を向いていることが圧倒的に多い。
しかし考えてみれば、これらの特徴はごく当たり前なのである。まずは、舞台やテレビと同じく、登場人物達は読者にお尻を向けるわけにはそうそういかない。読者に顔を見せずにお尻を向けていたら、誰が誰だかよく判らなくなってしまうに違いない。だから、登場人物達はあまり後ろを向くわけにはいかない。どうしても、主人公達は文字通り「前向き」にならざるをえない。もし、後ろを向くとしたら、それは文字通り登場人物達に「後ろを向かせる」何らかの強い意図に基づく場合以外ありえないに違いない。それが、例えば他の誰かと「向き合って」いる場合であったり、あるいは他の表現意図に基づくものであろう。
また、日本におけるマンガが右から左に読まれていくのであるから、読者の視線の動きの中では「右のコマ= 過去」「左のコマ = 未来」と時間感覚が成立している。マンガを読む私たちの視線のベクトルは右から左、過去から未来へと進んでいるのである。すなわち、「マンガの中の話の流れ= マンガの中の時間・因果の流れ」をスムーズにするためには、主人公達が過去なり未来なりのコマの方向を向くことで、時間の流れ=因果の流れをスムーズに受け継ぐのが自然だと考えられる。過去に発生した「何か」に応えた反応をするならば、主人公達は当然右を向くし、そうでないならば通常は時間の流れる先の向き= 左側を向くことになるだろう。
すると、マンガの中の登場人物達は読者に対して「前向き」であって、なおかつ時間の流れる方向に前向きの「左側」を向くのがごく自然である、ということになって、「コマの中の主人公達は135度の方向を向くことが圧倒的に多い」ということになるのだろう。まぁ、当たり前の話である。
そしてさらには、こんな風にも考えられる。「右<->左」方向は時間の流れに対する主人公達の向きであって、「前向き<->後ろ向き」は登場人物達が文字通り「前向きであるか」あるいは、あるいは「後ろ向きであるか」という「主人公達の内たる気持ちの向き」ではないだろうか、とも考えられるのである。
だから、例えばこの「霜ばしら」の結末の部分80コマ以降を見ると、45->135->225度という主人公のベクトルの変化がある。これは主人公が「過去に向かう向き(死んでしまったヒロインへを見る向き)→未来に向かう方向へ進む→未来に向かう(だけど、やはり亡くなってしまったヒロインをたまに振り返りながら)」というまさに主人公のベクトルを描き出しているのではないだろうか、と思うのである。そんな風に眺めてみれば、最後のコマの主人公の向きが「何かを振り返りながら、だけど未来へと歩いていく様子」をまさに映し出しているようにも見えるのである。ストーリーはここに書くわけにはいかないけれど、こんな想像も割と良い線をいってるのかもしれない、と思ってみたりするのだ。
こんな風に、単にマンガの登場人物の向きだけで主人公達の向かうベクトルを探る、なんていうことが乱暴なのはさらさら承知の上である。こんな人物の配置解析によるストーリー解析が的を射ているのか、あるいは的を外しまくっているのかは、ぜひこのマンガを読んで実際に判断してみてもらいたい、と思うのである。
さて、こんな風に舞台の右と左、上手と下手に対してどんな風に登場人物達が向かっていくのか、なんてことを考えるといろんな想像が広がってとても面白いのである。時間の進むベクトルであるLeftStage(舞台から見ると逆なんてことは言わずに)に消えていく登場人物達(例えば今回の話では恋人アキちゃんを亡くしてしまった主人公)は「残されたもの達」を連想させてみたり、あるいは、色んなものを眺める私たちの視線のベクトルは本当に未来に向いているのかな?などと色んな想像や空想を駆けめぐらせてみることも、それはそれでとても趣深いことだなぁと思うのである。
2002-08-26[n年前へ]
■CleType自主学習(仮)
ちょっと真面目にClearType(仮)
(2002.08.26〜)
- 楽しそうな「iMac」&「電子ブック」風ノートPC用スタンド -はじまり - (2002.08.26)
- 一本道か、分かれ道か - ドキュメントの縦横比について- (2002.08.29)
- 水平思考と垂直思考 - 文字の縦横解像度 - (2002.08.29)
- 細かくすると楽(粗く)になる? - ClearTypeの一番の秘密- (2002.09.09)
楽しそうな「iMac」&「電子ブック」風ノートPC用スタンド -はじまり - (2002.08.26)
Lapvantageという楽しそうな会社を初めて知った。ノートPCをiMac風にするLapvantageDomeやPCを縦置きで使うためのLapvantagePortraitという、とても実用的でいて、それでいて明和電機のような面白い製品を作っている会社である。明和電機は兄弟が運営しているが、こちらのLapvantageの方はビアボーム親子がやっているらしい。iMac風スタンドの方は角度が振れないようのが(特にノートPCを立てられない)残念だが、Lapvantageの方はもう少しデザインがスマートであるならば今すぐにでも欲しくなる。
複数の作業を切り替えながら作業をしたり、あるいはツールバーが多数出てくるようなソフトウェアを使って作業をする時には、左右に広いディスプレイが便利で使いやすい。しかし、単純に一つのドキュメントを読んだり、一つのドキュメントを書いたりする場合には上下に長いディスプレイを使うと、見通しがきいて考えをまとめやすくなる。気のせいか、頭の中の見通しがとても良くなるように感じたりする。だから、以前から横長の画面のノートPC(ToshibaPortege 320)を愛用していたりした私はノートPCの画面を横にして使ったり、縦にして使ったりと、画面を切り替えて使ってみたいと感じていた。AdobeAcrobat Readerであれば、画面を回転させて文章を読む機能があるので、これまでノートPCを回転させて電子ブックのようにして文章を読んだりすることもあった。
Lapvantage PortraitはPivotProのソフトウェア付きなので、Windowsの画面を自由自在に回転させることができる。だから、ノートPCを普通に横置きに使ってみたり、スタンドに載せて縦置きに切り替えて使ってみたり、と好きなように切り替えることができる。「これはなかなか便利そうだ」と思い、私も私も30日有効のPivotProのデモ版をインストールして使ってみることにした。
そして、このソフトのインストールをきっかけにして
で調べたClearTypeに関して、ちょっと少し考えてみた。 (続く)一本道か、分かれ道か - ドキュメントの縦横比について- (2002.08.29)
前回書いたように、複数のことを考えるなら「左右に長いディスプレイ」が良くて、一つのドキュメントを読むなら「上下に長いディスプレイ」が良い。その理由を端的に言えば、「目が左右についているから」だと思う。
まず、「目が左右に付いているので、あまりに大きい左右への目の動きは、目にとってとても非対称な作業であるから不自然」だ。だから、左右を眺めるときには自然と頭を左右に振ることになる。その頭を左右に振るという作業は、頭の中での何らかの切り替え作業を伴うような気がする。だから逆に、ツールパレットの切り替えのような「何らかの作業の切り替え」を伴う作業であれば、その左右へ視線を移動する(自然と頭も左右に動かす)ということはとても自然な行為になる。しかし、それは一つのドキュメントを読むような場合には、いたって不自然な行為になってしまう。だから、一つのドキュメントというのは本来「上下に長い=縦長」であるべきだと思う。
そしてまた、「目が左右についているから」、人は上下方向を「一本道」に繋げて考える。例えば、絵画を眺めるとき、上に見える景色は多くの場合遠い景色で、下に見える景色は多くの場合近い景色だ。漱石の文学論の図を引くまでもなく、この「上下の遠さ、距離」というものを例えば時系列上の「一本道」に繋げるのは、いたって自然な連想だと思う。「遠い上」に見えるものは「遠い過去」で、下に来ればくるほど新しいことになる。それは、ドキュメントを読む場合に対応させて考えると、とても自然だ。それに対して、左右に並ぶものは決して「一本道」ではないのである。それは、「選択肢=分かれ道」であって、決して一つの道ではないのである。左右に並ぶものは「複数の何か」なのである。
だから、一つのドキュメントは上下に並び、上下に長いべきなのである。ドキュメントの表示も同じく、縦に長いべきなのである。
漱石 「文学論」より |
最近のPCであると、ディスプレイは通常横に長い。だから、本来縦に長くあるべきドキュメントを眺めようとする場合には、表示を90°回転させてやることもある。そうすると、本の一ページのようにして画面表示を眺めることができる。例えば、AcrobatReaderで表示画面を回転させたり、PivotProなど使ってPCの画面表示自体を回転させてやれば良いわけである。
このように、ドキュメント表示のための縦横比については、単にディスプレイの表示を90°回転させてやれば問題は解決する。しかし、表示のためのもうひとつの条件、表示品質が問題になってくる。そもそも、液晶(二十世紀においてきたCRTは無視しよう)の解像度はまだま低くて、それを改善するための技術としてClearTypeやCool Fontがあるのだけれど、AdobeのCool Typeはともかく、Clear Typeの場合には表示が90°回転しているという情報をClearTypeが取り扱わない(知らない)ために、上手く動かなくなってしまう。ClearTypeにしてもCool Fontにしても、液晶のRGBのカラーフィルターの並び方を利用してやることで解像度を高めているわけで、その並びの変化(表示の回転)に対応できない場合には表示品質を大幅に落とすことになってしまう。
次に、「ファイト!縦文字文化 -縦と横の解像度を考えよう - (2001.04.29)」で考察した、文字の解像度についてもう少しちゃんと考えてみることにする。
水平思考と垂直思考 - 文字の縦横解像度 - (2002.08.29)
ドキュメントを表示させるためには、文字を表示させてやらなければならない。しかし、液晶ディスプレイの解像度は必要十分には高くないから、文字はつぶれてしまうことが多い。例えば、「現実問題春夏雪雹資本主義電計算機」なんて文字を表示させてみるとかなり潰れてしまい、非常に読みにくいのが判るはずである。これが、英語の"RealProblem seasons Snow capitalism Computer"なんて文字であれば、まだマシである。
この日本語と英語の文字の解像度の差について考えてみる。比較例は下に示した、「漢字」と「英語」のテキストを用いることにする。
まずは、600dpiで20ptのMS Pゴシックのフォントを展開して上のような画像にした後に縦・横方向のそれぞれの解像度を考えてみる。ここでは、縦・横方向の黒い線(あるいは線でない部分)の太さ(幅)の分布を測ってみることにした(今回解析のために作成したソフトはここ(RunLength.lzh)においておく)。テキストのような二値の画像の「解像度特性」を計測するのであれば、このような解析にしなければならない。「ファイト!縦文字文化 -縦と横の解像度を考えよう - (2001.04.29)」でやったようなフーリエ解析は適切な方法ではないのである。
下の図が縦・横方向の黒い線(あるいは線でない部分)の太さ(幅)の分布である。縦方向に計測した黒い線(あるいは線でない部分)の太さというのは、結局のところ横線の太さ(あるいは線の間隔)であり、横方向に計測した黒い線(あるいは線でない部分)の太さというのは、結局のところ縦線の太さ(あるいは線の間隔)ということになる。どれだけの細かさで「太さ」(あるいは「位置」)を描いてやらなければならないか、を示すグラフということになる。
「漢字」の場合には「Vertical 方向で計測した線の太さ(あるいは線の間隔)、すなわち横線の太さ(あるいは線の間隔)」が「縦線の太さ(あるいは線の間隔)」に比べて、大きく小さい方にシフトしていることが判ると思う。また、横線の量が縦線の量に比べてずっと多いことも判ると思う。後者は「数字文字の画像学 -縦書きと横書きのバーコード - (2000.01.21) 」で考えたことと全く同じで、「日本語は横線が多い」ということを端的に示している。そして、前者は「Vertical方向で計測した(すなわち横)線の太さ(あるいは線の間隔)」が縦のそれより大幅に小さいということは、「漢字」の解像度は縦方向に大幅に解像度が高い、ということを示している。漢字は縦書き文字故に鉛直思考志向なのである。
一方、「アルファベット」の場合には、これも「数字文字の画像学 -縦書きと横書きのバーコード - (2000.01.21) 」で考えたことであるが、縦線と横線の量においてはむしろ縦線の方が多いことが判る。水平方向に対して情報量が多いのである。アルファベットは水平思考志向なのである。「アルファベット」の情報量はそのかなりの部分が縦線によるものなのである。そしてまた、線の太さ(あるいは間隔)は横線の方が細い(あるいは線間隔が短い)が、その横線であっても「漢字」の縦線程度の解像度であることが判る。「漢字」に比べて「アルファベット」の解像度は低いのである。
ただし、文字の解像度を「線の太さ(あるいは間隔)の最小値」だけで論じることはできない。「適切な線の太さ(あるいは間隔)」にすることができるほどに解像度が十分高いか、ということも重要である。もし、そうでなかったら線が妙に太くなったり、細くなったりしてしまったり、あるいは、線の間隔が妙に近づいたり離れてしまったり、つまりは文字のプロポーションが崩れてしまったりするだろう。上の場合は600dpiで文字を表示させた場合の解析例だが、次に現在の液晶と同じような解像度(例えば)150dpiでこの文字を表示(展開)させてみる。こうすることでことで「適切な線の太さ(あるいは間隔)」にできていない様子を確認してみたい。
細かくすると楽(粗く)になる? - ClearTypeの一番の秘密- (2002.09.09)
まずは、「現実問題春夏雪雹資本主義電計算機」という漢字と"RealProblem seasons Snow capitalism Computer"というアルファベットを現在の液晶と同じような解像度(例えば)150dpiでこの文字を表示(展開)させてみた。そして、前回と同じようにそのビットマップ画像の「縦・横方向の黒い線(あるいは線でない部分)の太さ(幅)の分布」を調べてみる。その結果が下のグラフである。また、前回に調べた、これよりも4倍程解像度が高い「600dpiで20ptのMSPゴシックのフォントをビットマップに展開してみた場合」をさらに下に比較用として示してみる。
150dpiでTrueTypeをビットマップに量子化した場合には、漢字・アルファベットの場合共に、縦・横方向とも600dpi単位で4,8pixelの太さ=150dpiで1,2ピクセル幅のパターンが発生していることが判る。このようなパターンは、600dpiで20ptのMSPゴシックのフォントをビットマップに展開してみた場合には見られなかったものである。つまり、、着目すべきは例えばアルファベットの場合、
- 縦方向には幅10pixel(600dpi単位)=2.5pixel(150dpi単位)以下の高い周波数は存在していなかった
- 横方向には幅13pixel(600dpi単位)≒3pixel(150dpi単位)以下の高い周波数は存在していなかった
- 縦・横方向共に幅4,8pixel(600dpi単位)=1,2pixel(150dpi単位)以下の高い周波数が生じている
- 縦方向には幅7pixel(600dpi単位)≒2pixel(150dpi単位)以下の高い周波数は存在していなかった
- 横方向には幅11pixel(600dpi単位)≒2.5pixel(150dpi単位)以下の高い周波数は存在していなかった
- 縦・横方向共に幅4,8pixel(600dpi単位)=1,2pixel(150dpi単位)以下の高い周波数が非常に多く生じている
また、これらの文字の場合には本来18〜15≒12pixel(600dpi単位)の線幅・線間のパターンが多いわけであるが、それを150dpi単位( =600dpi単位で4pixel )で量子化してしまうと、場所により4/12 = 33%もの線幅・線間の位置の誤差が生じてしまうことになる。不必要に狭い幅のパターンが作成されたり、不必要に広い幅のパターンが作成されたりして、これでは文字の線が太くなったり細くなったり、線の位置が狂ったりしてしまい、見にくいことこのうえない。これはすべて、150dpiという低解像度で量子化してしまったためである。「低解像度の表示系の解像度に合わせて量子化(ビットマップ化)してしまうと、ますますその表示系では表示しづらい高周波のパターンが生成されてしまい、結果として読みづらい」という一見逆説的に思えてしまう(しかし当たり前の)現象が生じている。
ところで、本題のClearTypeの場合には横方向(通常の液晶はRGBの3つのサブピクセルが横方向に並べられているから)の解像度を3倍だと仮想的に考えて、横方向を3倍の解像度で量子化を行うことになる。ここで、話の単純のために3倍≒4倍と思うことにすれば、つまりはClearTypeの場合には本来150dpiの解像度であるにも関わらず、サブピクセルを考えて600dpiの解像度で量子化している、ということである。それは結局上の二つのグラフの比較と同じであって、ClearTypeを使うと実は表示すべきパターンが「より表示しやすい低い周波数のパターン」になっているのである。それは、「文字の線が太くなったり細くなったり、線の位置が狂ったりしてしまう」ことがなく、目にとってはとても見やすいパターンになるだろう。この量子化の段階について触れている情報は見たことがないが、実はこの量子化の段階にClearTypeの隠された(しかし、一番重要な)メリットがあるように思う。また、アルファベットの場合にはHorizontal方向に振幅を持つパターン(=縦線)が支配的に多いため、Horizontal方向に仮想的に高解像度の量子化を行うことは非常にメリットを効果的に得られると考えるのが自然である。
次に、このように量子化されたデータをClearTypeで表示する際の問題点・その解決方法について考えてみていくことにしたい。
P.S.ちなみに解析ソフト(RunLength.lzh)をアップロードしました。
2002-09-08[n年前へ]
■君の歌は僕の歌
竹内まりやの「平方根」
半年ほど前、TBSのテレビ番組「USO」で放映されていた「竹内まりやの歌の音程を下げると山下達郎の歌に聞こえる」という話を観た。なんでも、その話は「ネット上をにぎわしている情報」ということだったのだけれども、ワタシには全然知らない話題だった。だから、その放映されていた「音程を下げた竹内まりやの歌」を聴いて、とてもびっくりした。確かに「山下達郎の歌」に聞こえるのである。そして、それにビックリすると同時にとても新鮮に面白く感じたのだった。
山下達郎はワタシも好きだったりするし、しかも山下達郎は決して多作というわけではないので、「山下達郎が他人の曲をカバーをする新たな音源」をワタシが勝手に増やせるというのはとても魅力的である。そこで、ワタシは再生スピードを変えずに音程だけを変えることができるWinAmp + Pacemakerを使って、竹内まりやの「元気を出して」の音程を下げて、ワタシも山下達郎版「元気を出して」を作ってみることにした。それが下の二つのファイル、「元気を出して」の最後の部分の「オリジナル」と「音程を下げたもの」である。
- 竹内まりや 「元気を出して(オリジナル)」
- 竹内まりや 「元気を出して(音程を下げたもの)=山下達郎風」
そこで、次に調子に乗って今度は鬼束ちひろの「流星群」の音程を下げてみた。今度は山下達郎が歌う「流星群」が手に入れよう、と思ったわけだ。ワタシの手持ちの音源全曲に対して山下達郎化計画を発動しようとしたのである。科学、いや単に"WinAmp+ Pacemaker"の力で山下達郎多作化計画を発動しようとしたわけだ。
ところが、である。なんと「流星群」を歌っている歌手は今回は山下達郎には聞こえなかったのである。、そこには「流星群」をしみじみと歌いあげている平井堅がいたのだった。切々と「流星群」を歌い上げる平井堅の実に濃い顔がワタシの頭の中に確かに浮かんでしまうのだった。
- 鬼束ちひろ 「流星群(オリジナル)」
- 鬼束ちひろ 「流星群(音程を下げたもの)=平井堅風」
そこで、「竹内まりや、山下達郎、鬼束ちひろ、山下達郎」の歌を周波数を時系列的に眺めるスペクトログラムで比較・分析してみることにした。といっても、竹内まりやと山下達郎が「同じ言葉で歌っていて、なおかつ(本人の声以外の)バックミュージックが無いような音源」を手に入れるのが少し面倒だったので、今回は「声質」などを考察することはあきらめ、とりあえずはそれぞれの歌手の「歌い方」に注目してみることにした。
まずは、竹内まりやの「元気を出して」と山下達郎の"So Much In Love"をスペクトログラムで眺めてみる。縦軸が周波数軸で、上に行くほど高い周波数の声である。当然、下に行くほど低い声である。そして、横軸は時間軸で、左の方が時間的に先で、右の方が時間的に後になっている。結局、このスペクトログラムの中にはさまざまな倍音が白い線となって描かれているのである。
まず、このスペクトログラムを眺めていると、竹内まりやも山下達郎も「ほんの少しだけ不規則なビブラート」がとても多いことがわかる。歌のかなりの部分にビブラートがかかっていて、竹内まりやの歌のやわらかさを支えている(少なくともワタシにはそう聞こえる)。そして、それは山下達郎とも共通している特徴である。
また、それぞれのスペクトログラムの音の出し始め部をよく眺めてみるとちょうど「√」の形をした部分が数多く見られることに気づく。上に示した、竹内まりやの「元気を出して」のスペクトログラム中で青い矩形で囲った部分を見れば、そんな「√」形の部分があることが判るだろう。この「√(ルート)」形状は、「音の高さが連続的に変化している(一種のポルタメントのように)」ことを示しているわけだけれど、そんな√形状が竹内まりやと山下達郎の局の中に多いことが特に判りやすい部分を示したのが下のスペクトログラムだ。二人の歌の中にとてもよく似た√(root)マークがある(そして実はそれがとても数多くある)ことが判ると思う。
こうしてスペクトログラムを眺めてみると、竹内まりやと山下達郎の二人ともに、「ある音程の音を出すために、
- まず目的の音程よりも低いところから声を出し始め、
- しかも最初の一瞬は逆にほんのちょっとだけ下げて、
- と思ったら目的の音まで一直線に音程を上げて、
- そして、一定の音程をキープする
竹内まりや=山下達郎という答えが得られるわけなのである。つまり、竹内まりやの歌の音程を下げると山下達郎になると、この方程式から証明されるわけなのである。実に科学的な説明ではないだろうか……。
…それはさておき、鬼束ちひろと平井堅の場合は一体どうなのだろうか。歌の中で声にかけられるビブラートは「竹内まりやと山下達郎」とどう違うのだろうか、そしてまた声(ある音程の声)の出し始めの様子はどのようになっているだろうか?というわけで、次に鬼束ちひろの「流星群」と平井堅の「大きな古時計」のスペクトログラムを眺めてみる。
こうしてみると、もちろん鬼束ちひろや平井堅だって歌にビブラートをかけてはいる。しかし、先ほどの竹内まりやと山下達郎の場合と比べると、まるで人工的と言っても良いほどに規則正しいビブラートがかかっていることが判ると思う。また、ビブラートをかけていない部分では、実に一定な音程をキープしていることが判る。しかも、それぞれの音程で声を出し始める最初の部分では、その音程にいきなり「すっと入っている」のである。竹内まりやと山下達郎が「√」形状の声の出し方であるならば、鬼束ちひろと平井堅の場合は「電気回路の抵抗記号」のような声の出し方をするのである。そんな共通点がこの二人の間にはあったのである。鬼束ちひろの歌い方と平井堅の歌い方は実によく似ていたのである。だから、鬼束ちひろの歌の音程を下げると平井堅に聞こえたのかもしれない。誰でもカラオケに行って色んな歌手の歌を歌う機会があるだろうけれど、こんな風にスペクトログラム上のそれぞれの歌手の歌い方の特徴を意識しながら歌えば、もしかしたら面白いことだろう。誰もが平井堅や竹内まりやになりきれるかもしれない。
ところで、最近のカラオケはとっても賢いリモコンがついていて、「**年に流れていた曲」というような検索ができる。すると、同年代の人とカラオケに行くとその年代に共通する「あの頃の曲」をかけまくって、歌いまくることになる。自分たちだけに判る懐メロ、だけどそこにいる人達にとっては「懐メロ」ではなくて今でも生き生きとしている曲、が次々とかけられることになる。中学時代、高校時代、ずっと昔のあの頃に流れていたヒットソング、そこにいる人に共通するルーツの曲のオンパレードになる。そんな時には、誰かが入れた歌全てがいつの間にか全員の合唱に変わっていたりする。
同年代の人とカラオケは(特にそんなリモコンを使うときには)、まさに「他の人が歌う歌全てが自分の歌」、つまりは「君の歌は僕の歌」になる。、「元気を出して(オリジナル)」の最後の部分、竹内まりやの声を中央に、右から山下達郎の声が、左から薬師丸ひろ子の声が流れ溶け合っているのを聴きながら、そんな景色をを思い浮かべてみるのもきっと面白いんじゃないかと思う。