2000-06-28[n年前へ]
■カラープリンターの選手宣誓
ICCファイルを眺めてみよう その2
ここ数年間にわたって、報告会の前夜遅く(というより当日の朝近く)になると、インクジェットプリンターを並べて発表用のOHTを印刷しまくるという生活が続いていた。「PC使ってプレゼンのソフト使ってやればOHTを出力しなくて済むし楽なのに」と言う人がいるかもしれない。しかし、ただ単純にそう考える人は私は素人だと思う(その理由はいつかまた詳しく書く)。とにかくOHTは必要なのである。
そういう深夜に大量のOHTを印刷する際に、出力する枚数が数十枚ともなるとインクジェットプリンターでは時間がかかるし、とても大変なのである。かといって、レーザービームプリンターやコピー機はスピードは速いが、カラーのOHTの出力など汚くてできない。そこで、インクジェットプリンターを何台も並べてOHTを出力しまくるという手段に出ることが多い。OHTの出力作業を並列に行うわけだ。
しかし、そんな時にまた困るのがそれぞれのプリンターの色特性が違うということである。どのプリンターで出力するかどうかで、全然違う色に変わってしまうのだ。下手をすると「こんなのじゃ使えないぞぉ。やり直しだぁ。」というわけで、私の睡眠時間はさらに削られていくのである。
それぞれのカラープリンターの色特性が違うせいで、私の睡眠時間は減るし、腹は減るし、踏んだり蹴ったりなのであった。そういうわけで、私はプリンターの色特性は興味もあるし、恨みもずっと抱いていたのである。「それぞれのカラープリンターからどんな色の出力がされるのか」、というのは私にとってとても大きな問題だったのである。
と、前振りはここまでで本題に入ろう。前回、
で、また、「カラープロファイルで眺める各社のプリンターの性能比較」というような企画でもしてみようかな、とふと思うのであった。と書いた。今回はその「カラープロファイルで眺める各社のプリンターの色特性比較」を行ってみたいと思う。カラープロファイル・ファイルには「それぞれのカラープリンターからどんな色の出力がされるのか」という情報が書いてあるわけで、そういうことを知っておけばプリンターで出力するときに何かの役に立つはずだ。少なくとも、私の睡眠時間を減らさない程度には役に立つだろう。
そこで、今回は試しに4機種のレーザープリンターを選んで、それらのプリンター用のカラープロファイル・ファイルに書き込まれている「それぞれのカラープリンターからどんな色の出力がされるのか」という情報を比較してみることにした。カラープロファイル・ファイルの解析には
- GretagMacbeth ( http://www.gretagmacbeth.com/)
まずは、この二機種を比較してみよう。世界のhpと日本のキヤノンのカラーレーザービームプリンターである。選んだレーザービームプリンターの機種はHPLaserJet 4500とCanon LBP-2040である。
この写真を見ると実はこの二機種は瓜二つである。車で例えれば、TOYOTAのカローラとスプリンターのようにそっくりである。こういう場合、中身は同じであることが多い。カローラとスプリンターが実は中身は同じであるように、この機械もきっと中身は同じなのだろう(確かじゃないけど)。簡単に言えば、OEM製品である。
この二つのプリンター用のドライバーを各会社のWEBから入手し、カラープロファイル・ファイルを解析してみた。次に示すのが、カラープロファイル・ファイルの中に記載してあったHPLaserJet 4500(左)とCanon LBP-2040(右)の
- xy空間 ( 上段 )
- ab空間 ( 下段 )
こうしてみると、大幅に出力可能な色空間が違うことがわかる。中身は同じっぽいのに、出力できる色空間は異なるのである。本当ならば、面白いことだ(どっか解析方法を間違えたかもしれないが...)。ソフト処理の違いだろうか?
といっても、プリンター用のカラープロファイル・ファイルは結構複雑だし、「カラープロファイル・ファイルに書いてある内容」が必ずしも正しいとは限らないだろう。カラープロファイル・ファイルは単なるそれぞれのカラープリンターの選手宣誓であって、本当のことが書いてあるとは限らないと思う。どちらかが単にホラを吹いているということも考えられる。本来出力できないはずなのに、「いや、オレは出力できるッスよ。」とホラを吹いているということも考えられるわけだ。
同じようなことを、「勢いにのってる」Epsonと元祖富士XeroxのEpson LP-8500CとFujiXeroxColorLaserWind 3310について行ってみた結果が次である。ちなみに、FujiXeroxColorLaserWind 3310の写真が見つからなかったので、下の写真にはFujiXeroxColorLaserWind 3320PSのものを用いた。
こちらも、先のHP LaserJet 4500(左)とCanon LBP-2040(右)と同じく、瓜二つである。ということは、これもまた中身は同じモノなのだろう。
こちらの方の解析した「出力可能な色空間」が以下である。
この場合には、若干の違いはあるが大体同じであることがわかる。中身が同じで、ソフト部分のみ違うだけだと思うのであるから、当然とも言えるし、少し意外だとも言える。なぜ意外かというと、この二機種は実際に使ってみると結構出力が違うからである。もちろん、出力可能な領域だけでなくて、その内部でどう出力する色を振り分けるかということの方が実は一番重要だったりするので、「意外」というのは言い過ぎかもしれない。
また、EpsonのLP-8500Cの場合は印刷のモードに合わせて、ICCファイルが複数用意されていた。「それらの間の違い」、すなわち、「印刷モードが違う場合に出力される(あるいはメーカー側が意図している)色空間がどのように違うのか」などは、次回以降に考察してみたいと思う。
しかし、今回は書いているうちに内容が少しヘビーだと感じ始めた。私には色々な意味で結構難しい内容なのである。まるで空中分解してしまう飛行機のようであるが、ここらへんでいきなり終わりにしておきたい。というわけで、最後にLab空間でのそれぞれ四機種の「自己申告の」出力空間を重ね合わせたものを示してみる。
こうしてみると、Canon LBP-2040以外はどれも似たようなものである。まぁ、どれも同じ電子写真方式なのだから当たり前である。しかし、それでも少しずつ違うことが面白い。逆に、CanonLBP-2040はあまりに違いすぎて、私がどこかを間違えた可能性が大である。
さて、いきなり冒頭の話に戻る。私は気分的には「報告会 = 試合」だと思っている。自分の戦力のどこが強くてどこが弱いかを意識しながら、最善を尽くしたい、と思っているわけだ。さらに言えば、自分の戦力のどこが強くてどこが弱いかが判っていれば、例え勝てないにしても、善戦はできると思っている。だから、前回
icmファイル(カラープロファイルファイル)には、それぞれのディスプレイの出せる「色空間」が書かれている。言わば、それぞれのディスプレイの「守備範囲」が書かれている。それぞれのディスプレイにそれぞれの「守備範囲」がある。それぞれのディスプレイやプリンタ達の「ここの範囲ならまかせとけ」という範囲である。と書いたように「どんなことができるか」を知るのはとても大切だと思っている。カラープロファイル・ファイルには「何ができて、何をしようとしているか」が書いてあるわけで、それはちょうどプリンター達の「選手宣誓」のようなものである。当然、試合の前には「選手宣誓」が必要だろう。その守備範囲をちゃんと知ってさえいれば、「少ない戦力でも勝つこと」ができるかもしれない。
えっ、何を言いたいか判らないって?とりあえず、今回は「カラープロファイルで眺める各社のプリンターの性能比較」を始めるぞ、という私の「選手宣誓」である。話の本筋に入るのは次回以降ということにしておきたい。
2000-10-20[n年前へ]
■ツリー構造と色と2次元分解
忘れないようにメモ。
2001-02-19[n年前へ]
■ひとりで書いてるだけだから。
ヘッポコ文章を直したい
面白い情報を探しにと「お笑いパソコン日誌」を眺めていると、「ウエヤマの事件簿」の「他人の日記をオモチャにしよう!」が紹介されていた。「お笑いパソコン日誌」に〜『できるかな?』風ネタであります〜と紹介されてあった通り、実に私好みの話だった。ウエヤマ氏が「自分で書いてる日記の文章」を解析して、文字の出現頻度を調べてみたものである。
「できるかな?」は画像や科学の関連の話が多いように見える。しかし、実はそれだけではなくて文章や日記に関する話も多い。例えば、これまでに出てきた話を振り返ってみると、
に始まり、- 失楽園殺人事件の犯人を探せ- 文章構造可視化ソフトのバグを取れ - (1999.07.22)
- 「こころ」の中の「どうして?」-漱石の中の謎とその終焉 - (1999.09.10)
- 「星の王子さま」の秘密 - 水が意味するもの- (1999.11.15)
- 恋の力学 三角関係編 - 恋の三体問題- (1999.12.27)
- 恋の力学 恋の相関分析編- 「明暗」の登場人物達の行方 - (2000.04.01)
- 恋の力学 恋のグラフ配置編- 「明暗」の収束を見てみよう - (2000.04.02)
- WEBの世界の「力の法則」-「ReadMe!JAPAN」と「日記猿人」に見るWEBアクセス数分布 - (1999.12.04)
- WEBサイトの絆 - WEBの世界を可視化しよう- (2000.01.13)
そういったhirax.netの特長ならぬ特徴は私が書く文章が下手なせいなわけで、そんなヘッポコ文章から脱出するべく、私の書く文章の特徴を調べて反省してみることにした。もちろん、自分のヘッポコ文章だけを眺めてみてもしょうがない。他の素晴らしい文章を書く書き手と比較しなければならないだろう。そこで、今回はいくつかの文章を品詞解析し、その結果の特徴を調べることにする。そして、書き手による文章の特徴が眺めながら、私のヘッポコ文章の欠点を調べ、さらには誰もが思わず涙がこぼしてしまうような素晴らしい文章を書けるようになりたい、と思うのである。
さて、まずは目標を決めよう。私がヘッポコ文章を脱出してどんな文章を目指すかを、何より先に決めなくてはならない。となれば、あまりにも大それた目標ではあるのだが、やはり日本の文豪、夏目漱石は外せないだろう。そして、その教え子でもある寺田寅彦もやはり外すわけにはいかない。一応私も理系のはしくれ、日本の理系文章の流れを作ったこの二人を目標にしなくてなんとしよう。ヘッポコ文章を脱出していきなり、夏目漱石と寺田寅彦というところに無理があるが、そんなことを考えていては駄目なのである。「少年よ大志を抱け」とクラーク博士も言ったのである。もう少年と言うにはどう考えても年齢的に無理があるのだが、気持ちはまだまだ少年で目標は大きく持ってみたいと思うのである。
そして、もう一人の目標は「ちゃろん日記(仮)」をマイペースに書き続ける「ななゑ」さんである。私は彼女の書く文章を読むたびにとても素晴らしい理系的センスが感じ続けているのである。しかも、理系的でありつつも笑いと涙のペーソスたっぷりの「ちゃろん文体」という独自の確固とした文体を築いているところも尊敬していたりするのである。
というわけで、今回の文章の比較は
- 夏目漱石
- 寺田寅彦
- ちゃろん日記(仮) ななゑ
- 「できるかな?」 jun hirabayashi
- 夏目漱石
- 我が輩は猫である
- 坊ちゃん
- 寺田寅彦
- 科学について
- 自然と生物
- ちゃろん日記(仮)
- 1998(仮)11月上旬
- 1999(仮)6月上旬
- 「できるかな?」
ところで、形態素解析とはどのようなものだろうか。まずは、例を挙げよう。例えば、
私が好きな書き手達は、夏目漱石、寺田寅彦、ななゑさんです。という文章を茶筌で分解すると、
- 私 名詞-代名詞-一般
- が 助詞-格助詞-一般
- 好き 名詞-形容動詞語幹
- な 助動詞
- 書き手 名詞-一般
- 達 名詞-接尾-一般
- は 助詞-係助詞
- 、 記号-読点
- 夏目 名詞-固有名詞-人名-姓
- 漱石 名詞-固有名詞-人名-名
- 、 記号-読点
- 寺田 名詞-固有名詞-人名-姓
- 寅彦 名詞-固有名詞-人名-名
- 、 記号-読点
- ななゑ 名詞-固有名詞-人名-名
- さん 名詞-接尾-人名
- です 助動詞
- 。 記号-句点
- 読点
- 形容詞
- フィラー
- 感動詞
結構、同じ書き手による文章が同じような位置に配置されることがわかると思う。ちゃろん日記(仮)などは、二つの独立した文章がほとんど同じ位置に配置されている。もう、ちゃろん文体は安定しまくっていて完成されているのである。そしてまた、「文豪」夏目漱石の場合も、「我が輩は猫である」と「坊っちゃん」がかなり近い位置に配置されていることがわかる。
なるほど、結構書き手による特徴はこんないかにも雑な解析でも評価できるものなのかもしれない(あくまで「遊び」だけどね)。そして、形容詞の出現頻度などは、「雪だるまがいる景色」と「自然と生物」以外は大体同じようなものである。寺田寅彦の「自然と生物」は妙に形容詞の出現頻度が高いところが面白いところである。私の「雪だるまがいる景色」はあまり技術的な話ではなくて、確かに形容詞が多そうな話ではあるのだが、一体「自然と生物」はどうだっただろうか?
ちなみに、「できるかな?」からの二つの文章は共にフィラーが一個も出てこない。その他の6つの文章にはフィラーが出てくるのであるが、何故か「できるかな?」の二つの文章にはフィラーが含まれていないのである。この差がなければ、寺田寅彦の二編と「できるかな?」はかなり似た場所に位置するのであるが、このフィラーは特に違うのである。
さて、上の図ではフィラーと形容詞の出現頻度だけを眺めてみたが、読点、感動詞の出現頻度も加えて、クラスター分析を行ってみた。つまり、「読点・形容詞・フィラー・感動詞」の出現分布が似ているものを分類してみたわけである。クラスター分析にはExcelアドイン工房「早狩」の統計解析アドインを使用させて頂いた。ちなみに、クラスターの結合はウォード法を用い、非類似度計算法には標準化ユークリッド平方距離を使用した。その結果が下の図である。
このクラスター分析の結果を示す図は近い文章をまとめていったものを示している。つまり、文章の「近さ」あるいは「似ている度」を示しているのである。ちゃろん日記(仮)の二編は本当によく似ていて、また夏目漱石の書いた二編も互いに似ている。そして、それより「近い度」は低いが「新宿駅は電気羊の夢を見るか?」は「科学について」に近くて、「雪だるまがいる景色」は「自然と生物」に近い。おして、さらに似ているものを探せば、ちゃろんの二編と「新宿駅は電気羊の夢を見るか?」・「科学について」は似ているといえなくもない、さらに言えばその四編と夏目漱石の二編が似ている。
ここでは、四人の書き手がいるということが私には判っているので、あえて四つのクラスターに分解してみると、
1.
- 「雪だるま」がいる景色
- 自然と生物
- 新宿駅は電気羊の夢を見るか?
- 科学について
- ちゃろん日記1998(仮)11月上旬
- ちゃろん日記1999(仮)6月上旬
- 我が輩は猫である
- 坊ちゃん
しかし、その一方で考えてみれば寺田寅彦の名随筆と「できるかな?」のヘッポコ文章が「文体が近い」と解析されてしまっているわけなので、実はこの解析の信頼性はかなり低いと言わざるを得ないところもあるのである。いや、もしかしたら「文体は同じやけど、内容が全然違いますがな」というような冷たいアドバイスを解析結果は言わんとしているのかもしれないが、もうそれは哀しすぎる事実なので考えたくないのである。
さて、そう言えば一番最初の図で「できるかな?」と寺田寅彦の差はフィラーの出現分布だったわけであるが、「大学の講義における文科系の日本語と理科系の日本語-- 「フィラー」に注目して --」では、「聞き手への働きかけのあるフィラーが多いということは聞き手への配慮が大きいということにつながる」と書いてあった。ということは、フィラーの出現分布は聞き手への配慮に比例するというわけで、「できるかな?」の文章にフィラーが出てこない、ということは読み手に対する配慮がない、なんてことなのかなと思ってしまったりするのである。
そんなことを考え出すと、ホラどうせひとりで書いてるだけだから読み手のことなんか考えていないのさと、思わず涙がこぼれてしまうような哀しい気持ち、になったのである。う〜む、最初は誰もが思わず涙がこぼしてしまうような素晴らしい文章を書けるようになりたいと思ったったのに、何でこんな結論になるんだろう?
答え: それは文才がないからです。ハイ。
2002-03-09[n年前へ]
■ハーフトーン化プラグイン
前にも書いたような気もするけれど、書けー、と言われたのでここにメモ。
Photoshopでは「他の大抵のこともそうであるように」上手くハーフトーン化はできない。例えば、二値モードになってしまうのはとてもイヤなところ。で、Toneやhalftoneといったものはグレイスケールのままハーフトーン化ができて便利。特にToneなんかはアンチエイリアジングをかけたハーフトーンで画質も高い。
が、いずれもCMYKの分解には対応していない。AndromedaやVanDerLeeなんかもハーフトーンプラグインを出していてそれはそれで高機能なのだけれど、CMYK別に線数を変えて、アンチエイリアジングさせて…といった設定はできない。
でもって、案外良い線いっているのがGIMPのNewsprintプラグイン。オーバーサンプリングの具合も選択できるのも素晴らしいところだ。足りないところは、各色毎の線数を選べなかったりするところと、何と言ってもGIMPがCMYKに対応していないがゆえにCMYKモドキの変換になってしまうことだろうか。
(リンク)(リンク)(リンク)(リンク)(リンク)(リンク)
2002-03-12[n年前へ]
■今日の面白かったこと
以前、何かの榊原教授のセミナーを聴いたときになんとも上手い話し方をするなぁ、と感嘆したので、そういう人の説明を直接聴ける貴重な時間は忙しいときだからこそ、ということで東京へ。
「あれ?」とびっくりするくらい聴いている人は年輩の方が多いが、そんなことはおいておき、今日「そーいえば、そーだったっけなー」と思ったのは、メキシカンハットがガウス関数の微分という一言だった。「MexicanHatでWavelet変換をかけるときは、ガウスの微分に分解している。もし、ガウス関数で表されるような現象であれば、それはその微分に展開している」という物理的な意味として使うのに面白いかも、と思ったのだった。結果的には、その一言を聴くためだけに行ったようなものだけど、コストパフォーマンスは悪くないかな。