1999-06-10[n年前へ]
■コピー機と微分演算子
電子写真プロセスを分数階微分で解いてみよう
前回、
ゼロックス写真とセンチメンタルな写真- コピー機による画像表現について考える - (99.06.06)
の中で、電子写真プロセスは「画像のエッジ部分が黒くなり、そうでないソリッド部分は画像が飛びやすい... 画像のエッジ部分、すなわち、電位変化が大きく、電界強度の高い部分に対してトナーが現像されやすい... 」という文章がある。この脈絡は何か見覚えがないだろうか?そう、
分数階微分に基づく画像特性を考えてみたい-同じ年齢でも大違い-(1999.02.28)
の中の、「人間が画像を感じる特性というものは、画像強度と画像強度変化(画像強度の一階微分)の中間的なものであると言うことができるかもしれない。」という文脈と似ている。また、「ゼロックス...」の回での(昔の)電子写真の特徴、
- エッジ強調される。
- 細かいところはボケてしまう。
参考までに、以前の話のときに用いた画像を示しておく。
まずは、
ゼロックス写真とセンチメンタルな写真- コピー機による画像表現について考える - (99.06.06)
における(昔の)モノクロコピーを模したものである。
分数階微分に基づく画像特性を考えてみたい-同じ年齢でも大違い-(1999.02.28)
の際に解析した元画像と0.75階画像である。ただし、この解析は2次元解析ではなく、1次元における計算を回転させて、中心対称な画像を作成している。その理由は前回述べたので今回は述べない。
それでは、解析を始める。まずは、Photoshop5による「(昔の)コピー機シミュレーション」である
次が、分数階微分画像だ。今回もMathematicaを用いて計算している。検算が終了したら、Notebookも公開予定だ(実は検算が終了していないのだ...)。
胸を張って「似ている」と断言するつもりはないが、少しは似ているのではないだろうか。別に似るまでがんばっても良いのだが、この分野の話はあまりやりすぎるわけにはいかないのである。ということで、強引ではあるが、今回の話の結論は「アナログコピーはオリジナルコピーの0.75階微分だ」というところで終わらせてもらう。
今回は、コピー機によるコピーを微分演算子と結びつけてみたわけだが、複数回のコピーに適用してみると面白いだろう。例えば、孫コピーは0.75+0.75階微分=1.5階微分であるとかだ。
また、同じ現像プロセスといっても色々あるわけであるから、各現像方式により微分演算子の階は異なるのが適当だろう。例えば、この機械は0.8階微分(つまりほとんどエッジ現像)であるが、こちらの機種は0.05階微分(極めて元画像に近い)で再現性に優れる、などという論議もできるかもしれない。
ところで、某所で今回の話と似て非なる話がCoffeeBreakとして公開されている。しかし、そちらは一般公開されていない。というわけで、今回は分数階微分の第3話ではなく、第4話ということになる。STARWARS風に言えば、Episode4だ。STAR WARSのようなSF映画もそうであるが、こういった話は生物(なまもの)である。ずっと置いておくと腐ってしまう。「腐ってこそ美味い食べ物もある」、という反論も聞こえてきそうだが、そういったものは少数の例外である。味オンチの料理人の作ったものではあるが、どうか賞味期間内に味わって頂きたい。
1999-08-20[n年前へ]
■色空間の世界へ (色弱と色空間 その3)
Someday
今回は、
色を伝える時に、考え忘れていたこと(色弱と色空間 その1) - We can work it out! - (1999.08.09)
で行った計算を少し改良し、なおかつ色空間の世界を自由自在に動かしてみたいと思う。今回のメインは「立体グリグリ」のテストである。
まずは、前回と今回の計算の違いは、
- 前回はL,M,Sの各錐体の波長感度特性はRed,Green,Blueの単波長であるという仮定の元の計算
- 今回はL,M,Sの各錐体の波長感度特性はRed,Green,Blueの単波長とは異なるという条件での計算
- X= 0.412391R + 0.357584G + 0.180481B
- Y= 0.212639R + 0.715169G + 0.072192B
- Z= 0.019331R + 0.119195G + 0.950532B
- l = 0.16*X + 0.54*Y - 0.033*Z
- m = -0.16*X + 0.46*Y+0.033*Z
- s = Z
それでは、通常のRGB色空間と第1色盲(赤色盲)のRGB色空間を以下に示してみる。今回はMathematicaの出力をJavaAppletで動かすことができるLiveGraphics3Dを使用している。そのため、RGB色空間をグリグリ動かすことができる。それどころか、ステレオ画像にしてグリグリ動かすこともできる。ステレオ画像の見方は交差法である。ぜひ、試してもらいたい。
下のグラフの操作方法は
- 操作 = 作用
- マウス左ボタンドラッグ = 回転
- シフトキー + 垂直ドラッグ = ズームイン・アウト
- シフトキー + 水平ドラッグ = 垂直軸についての回転
- コントロールキー + 垂直ドラッグ = 焦点距離の変更
- マウス右ボタン垂直ドラッグ = 部品除去
- "s"キー = ステレオ画像作成
PageLiveGraphics3D
( http://www.nikonet.or.jp/spring/sanae/LiveGraphic3D/LiveGraphic3D.htm)
を参考にして欲しい。それでは、RGB色空間(ハリボテバージョン)を自由自在に動かしてみよう。
|
|
どうだろうか? RGB色空間を自由自在に動かせただろうか? 立体グリグリはできただろうか? 「ハリボテでつまらない」なんていう文句がある人もいるかもしれないが、気が向けば立方体の全面について描画を行うよう変更するつもりである。
こういった、Javaなどを使用した立体表現は表現力が非常に高い。しかし、読み手によっては必ず見れるとは限らないところが難しいところである。読み手を限定してしまう可能性が有る。それは、まさに色覚異常に関する問題と同じである。
TVが白黒放送からカラー放送に移行する当時は、カラー放送においても白黒TVでもきちんと識別できる色を考慮しながら放送しようとしていた、と聞く。白黒TVで観ている人が困らないようにである。しかし、現在はどうだろうか? 白黒TVで観ている人のことを考慮したTVなどほとんど無いのではないのではないか?
TV放送に限らずWEB、プレゼンテーションなどにおいて、最新の可能性と広い互換性を両立させていくためには、他の人を配慮する力が必要だと思う。そういう点においても非常に優れ、私がとても好きなWEBサイトが今日から一時停止してしまった。非常にさみしい。
それでは、今回の色空間自由自在はこんな所で終わりにしたい。
1999-08-25[n年前へ]
■インラインスケートの力学 (初心者編)
つま先立ちの180°ターン
今回は滑る道具の話である。シャレではないが、私はスキーが好きだ。そして、最近インラインスケートを始めた。使っている道具はこんなものである。
- Dynastar AssaultSuperior
- Hart FreeLaunch
- K2 BING AIR
Dynastar AssaultSuperior (右) Hart FreeLaunch (左) | K2 BING AIR |
それぞれの滑走接地部の長さはDynastar AssaultSuperiorが185cm程であり、Hart FreeLaunchが110cmである。K2BING AIRは26cm位だ。
Dynastar AssaultSuperiorの長さを1とすれば、Hart FreeLaunchは長さが0.6程度である。半分とは言わないが、かなり短い。75cmも違う。しかし、この程度の長さにしたくらいではそれほど不安定になるわけではない。特にHart FreeLaunchは安定性が抜群である。私もゲレンデで普通に滑っている限りでは、遅い方ではないと思うが、特に不安定になることはない。不安定だと感じるのは、コブ斜面で、なおかつ、雪が積もってコブの形状が見えない場所を滑る場合などである。それほど、安定感があるのである。
そして、スキー板が短いため、ターンのしやすさといったら素晴らしいものだ。1つのコブの上で、2回3回とターンが出来る。
さて、今回の本題のインラインスケートはと言うと、かなり接地長さが短いため、さすがにスキーに比べて不安定さを感じる。とはいえ、思ったよりも不安定ではなかった。(初心者の頃の)スキーで曲がる時のことまで考えたら、もしかしたら、スキーよりも転びにくいかもしれない。急角度のターンのしやすさといったら、Hart FreeLaunchの比ですらなく、瞬時の180°ターンなども簡単である(私は上手くないが)。
今回はインラインスケートにおける瞬時の180°ターンの力学について考察を行ってみたい。瞬時の180°ターンに必要なことは以下のようなものである。まず、前向きに進んでいる状態から瞬時に後ろ向きになって進む場合を考えてみる。状態の変化は以下のようなものだろう。
- 前向きに進んでいる。
- スケートを瞬時に回転させる。
- スケートが180°回転した、すなわち、反転したところでスケートの回転を停止させる。
- そのまま、後ろ向きになった状態で進行する。
- 前向きに進んでいる。
- スケートブーツの爪先で立つ。
- スケートブーツが勝手に180°回転し、反転したところでスケートブーツの回転が勝手に止まる。
- いつのまにか、後ろ向きになった状態で進行している。
まずは、足を回転させてみると、その回転軸は下の図で紫の円で示したような場所に位置することがわかる。土踏まずと中指の根元の中央辺りである。
誰がなんと言おうとこれは「足」 |
この図を「インラインスケートのブーツを履いた場合」で示したものを以下に示す。
それでは、つま先で立ってみよう。どういうものに近似できるだろうか?
何か見覚えがないだろうか? そう、台車の足部分である。ここまでくると判りやすい。台車の場合で考えれば、良く実感できる筈である。
それでは、簡単な力学計算をしてみる。「足の回転軸」と「地面に接触しているローラ部分」を拘束系の剛体問題と考えてみよう。インラインスケートのローラは「足の回転軸」と「地面に接触しているローラ部分」を結ぶ方向にはいくらでも回転できる。したがって、転がり摩擦を無視すれば、その方向に関しては「地面に接触しているローラ部分」は地面からは何の力も受けない。しかし、ローラは「足の回転軸」と「地面に接触しているローラ部分」を結ぶ方向と直行する方向には回転することができない。したがって、その方向へ地面から力を受けることになる。滑っている人の速度をVとすれば、「地面に接触しているローラ部分」が「足の回転軸」と「地面に接触しているローラ部分」を結ぶ方向と直行する方向に受ける力はVsinθである(シータは文字化けしそう...)。
もうここまでくれば、一目瞭然である。「インラインスケートを回転させる力」であるVsinθ(シータは文字化けしそう...)をグラフにすると以下のようになる。ここで、θ(シータは文字化けしそう...)がPiを過ぎたところで、-Vsinθ(シータは文字化けしそう...)になっていることに注意してもらいたい。
このグラフは縦軸が任意単位の「インラインスケートを回転させる力」を示しており、横軸がインラインスケートの回転軸に対する角度である。ちょっとでも、インラインスケートが回転軸に対して傾くと(θ(シータは文字化けしそう...)=0でなくなると)つま先を後ろへ向かせる方向へ力が働き急激に回転する。そして、つま先が真後ろを向き始めるとその力は弱くなる。つま先が真後ろを向いたところで、その力は0になり、もし回転しすぎると、また、真後ろへ戻す力が働く。そなわち、つま先が真後ろへ向いているのが非常に安定なわけである。
というわけで、インラインスケートで前進中に爪先立ちすると、何も考えなくてもちょうど180°回転してくれるというわけである。もちろん、後ろへ進んでいるときに回転したいならば、進行方向側のかかとで立てば良いわけである。
今回の話はひとまずこんなところである。
2000-01-08[n年前へ]
■着メロの音響工学
この着信音は誰のだ!? 立体音感その3
街中で携帯電話の着信音が鳴ると、周辺の人が一斉に自分のポケットを探る光景というのはよく見掛ける。それは、まるで「クイズ・ドレミファドン」のようである。そう「超・イントロクイズ」そのものなのだ。「このイントロはオレのか!?それとも!?」と皆が考えている瞬間である。
着メロのイントロが始まるや否や、腰の携帯電話に手をやる様子は「おまえは荒野のガンマンか!」とツッコみたくなる程である。
特に、私の勤務先などでは全員が同じPHSを持ち歩いているせいか、着信音が聞こえ始めると、みな自分のポケットを探り始める。もちろん、そのPHSの着信音は数種類ある。しかし、1500人程度の従業員がいるわけだから、1500人/ 数種類だけ同じ着信音があるわけだ。仮に15種類あるとしても、
1500(人) / 15(種類数) = 100(人/種類)つまり、自分と全く同じ着信音のPHSを持つ人が100人もいるのだ。世の中には「自分と同じ顔の人が七人いる」というが、職場に同じ着信音の人が100人もいるのである。これでは、着信音が鳴ると同時に多くの人がポケットを探るのも自然だろう。
もちろん、この解決策として、「着信音でなくてバイブレーターを使う」というものがあるわけだが、何故かその解決策は許されないらしい。不思議である。
さて、そもそも、何故自分の着信音を区別できないのだろうか? まず、その辺りから考えてみることにする。
着信音が鳴ったときに、「自分の着信音かどうか判断するための基準」は二つあるだろう。それは、
- 着信音の種類
- 着信音が鳴っている位置
着信音の鳴っている位置 = 自分の携帯電話の位置が成立するかどうか即座に判断できれば、着信音が同じでも「自分の着信音であるか」の判断が可能ということだ。
つまりは、「携帯電話の着信音という音源の定位」という問題を考えれば良いことになる。もし、「着信音の定位」が判れば、自分の携帯電話の着信音か他の人の着信音かどうかなんてことは考えなくて済むのだ。そう、今回は「立体音感」シリーズその3だったのである。
それでは、一体「着信音がどこで鳴っているのか、すなわち、着信音の定位」が判るためには何が必要なのだろうか?
前回、
で「音の立体感に関する因子」について- 音像定位の因子
- 両耳差因子 (音響信号)
- 音の強さ(振幅)の差
- 位相の差
- 周波数スペクトル因子
周波数スペクトル因子というのは、例えば、
の中の記述指を前方で鳴らしてみて下さい。 そしてすこしずつ手を頭の側方に、手と頭の距離を変えないようにして、移動してみて下さい。 音量がわずかに大きくなったこととある特定の中域および広域の音がより強調されることに気が付かれるでしょう。 この実験では、指を鳴らす動作は一定の音量と周波数を発生する音源として用いられたわけです。 耳は同一の音源が前方から来る場合と、側方から来る場合で全く違う音と聞き分け、頭脳にそれを登録します。 側方の音は若干大きく、また耳たぶのせいで高い周波数で聞こえます。にあるようなものである。
音波が人間の頭部を通過してくる間に音波の周波数分布が変化し、その変化具合で音波がやってきた方向を知ることができるというものだ(多分)。もちろん、位相分布も変化するだろうが、ここでは周波数分布しか考えない。
こういう音像定位の因子における「周波数スペクトル因子」を考える時に、もし音源の周波数スペクトルがごく狭いものだったらどうだろうか?つまり、単一の周波数しか含まない音源だったらどうだろうか?周波数スペクトルが変化するといっても、単一のスペクトルしか含んでいないのだから、振幅が変化する効果しかない。周波数スペクトルの分布は何ら変化しない。
ということは、「音像定位の因子における周波数スペクトル因子」が上手く作用しないことになってしまう。(もちろん、実際には非線形な効果が存在するだろうから、多少は周波数スペクトルも変化するとは思うが。)
これと全く同じことはまたしても「物理の散歩道」で触れられている。ロゲルギスト著の岩波新書「第四物理の散歩道」の「不規則なものの効用 三節」である。純音より不規則な音の方が「立体感」を得られるだろう、と書いている。
今回、「携帯電話の着信音の定位」を「着信音のスペクトル分布」という観点から調べてみることにする。携帯電話の着信音がどのような波形であるか、どのような周波数分布を持っているかを調べるのである。果たして、携帯電話の着信音の周波数分布はどうなっているのだろうか?(部品点数を考えれば、ほぼSin波か矩形波なのが当然だろうが...)
まずは手持ちの機種で着信音の波形とスペクトルを見てみることにした。使った機種を以下に示す。
それでは、着信音No4と着メロ「この木何の木」の波形とスペクトログラムを次に示す。それぞれのグラフ中で上は「時間vs周波数分布」を示すスペクトログラムであり、下は「時間vs強度」の波形グラフである。
まずこれが、着信音No.4の波形とスペクトログラムであり、
こちらが、「この木何の木」の波形とスペクトログラムだ。
どちらも周波数分布はそれほどブロードではない。すると、「音像定位の因子における周波数スペクトル因子」を用いた「立体音感」がうまく働かないかもしれない。ただし、着信音No.4に関しては時間的に変化しないが、着メロ「この木何の木」に関しては、当然だが時間的に変化していく。
この違いが果たして、「着信音の音像の定位」の判断を左右するものか、自分の耳で実験することにした。着信音No.4と着メロ「この木何の木」を鳴らした時に、どこから鳴っているように聞こえるか判断してみるのだ。
目をつぶり頭の周囲で着信音を鳴らし、その定位を判断してみた。すると、色々な着信音を聞いてみたがいずれも定位の判断がしづらかった。特に頭の前後の判断がしづらい。それは、着信音No.4と着メロ「この木何の木」でも同様であった。やはり、純音に近いと「音像定位の因子における周波数スペクトル因子」が働きづらいのかもしれない。
そして、着信音No.4と着メロ「この木何の木」だが、むしろ着信音No.4の方が判断をしやすかった。メロディだと音が変わるときに定位が変わるかのような感覚を受けた。そのため、判断をしにくかった。もちろん、これは私だけの感覚かもしれない。その辺りは被験者を増やして実験をしてみたい(再実験をする日が来るかどうかは大いに疑問であるが)。
また、もしかしたら着信音No.4の方が矩形波に近く、純音でないのが良かったのかもしれない。もしかしたら、の話だけれど。
もし、今回使った音を聞いてみたい人がいるならば、
これを聞いてみてもらいたい。ただし、サイズがでかいので要注意だ。あとバックグラウンドがうるさいのはハードディスクとファンの回転音である。困ったものだ。 最近多い「同時発声数が多い着メロ機能」というのも、使って実験すると面白そうだ。しかも、音が分厚いヤツがあると、案外良いモノかもしれないな、とうらやましく思ったりするのである。そして、着信音スピーカーがプアァで歪んでいる機種なんかが、色々な周波数成分を含んでいて、実は「着信音の定位」に関しては良かったりするのかもしれない、と考えたりする。しかし、こちらはチットモうらやましくないのであった。
2000-01-13[n年前へ]
■WEBサイトの絆
WEBの世界を可視化しよう
目に見えないものを実感できるものにしようと思うことは多い。「直接感じることが出来ないものを感じられる形にする」という作業とその結果には非常にわくわくさせられる。それは、きっと私だけではないと思う。
目に見えないものは色々ある。可視化して見てみたいものは多々あるのだが、以前、
の時に扱った、WEBのトポロジーなどもその最たるものである。WEBページはもちろん目に見えるわけではあるが、それらがどう繋がっているか、すなわち、WEB[= クモの巣(状の物);織物 ]そのものは目には見えない。ネットワークという目に見えない世界でWEBサイト同士がどう繋がっているか、それは企業のWEBサイト同士であれば企業間の繋がりを示すかもしれないし、公的機関のWEBであれば公的機関内部の繋がりが見えてくるかもしれない。そして、個人WEBであれば、個人どうしの繋がりが見えてくるだろう。そして、さらに考えを進めるならば、それが「WEBの繋がりだ」と端的に言い切ってしまっても良いと思う。
そういう色々なWEBサイト同士が互いに結びつき合う、つまりWEBそのものを今回は可視化してみたい。その結果はきっと「WEBサイトの絆」を私に見せてくれるはずだ。
例えば、ファイルシステムを可視化するものであれば、
- xcruise( http://tanaka-www.cs.titech.ac.jp/~euske/index-j.html )
そして、今回の本題のWEBサイトのHyperlink構造を可視化するソフトウェアも、少し探しただけでも結構ある。例えば、
- Site Manager
- ( http://www.sgi.com/software/sitemgr.html )
- HyperLINKWWW Visualization/Navigation
- ( http://www.acl.lanl.gov/%7Ekeahey/c3/navigate/navigate.html )
しかし、よく調べていないので間違っているかもしれないが、この辺りのソフト(appleを除く)はWEBサイト内のリンクのみに限られるようである。それでは、今回の目的とは違う。何しろ、今回知りたいのはWEBサイト同士のリンクの度合いである。WEBのトポロジーなのである。
そこで、もう少し探してみる。すると、今回の目的にかなり近い情報が
- Web構造の把握 宮久地博臣 都立科学技術大学大学院 平成9年度修士論文
- ( http://home2.highway.ne.jp/miyakuji/shuron.html )
やり方はどうしたら良いだろうか?宮久地氏と同じようにWeb Robotを作成して、データを集めるのが理想的だろう。しかし、「perl入門」を昨日やっと買ったばかりの私にはとても難しそうである。いや、もしそんなことをしたらとんでもないことになるに違いない。
そこで、perlのlwp-rgetを用いて各WEBの内容をローカルのPC内にダウンロードした上で、勉強がてらperlで解析を行うことにした。と、思ったのだが、lwp-rgetが上手く動いてくれない。まだドキュメントをちゃんと読んでいないせいだろうか?何故か、ダウンロードの途中で終了してしまう。仕方がないので、急遽作戦を変更し、ダウンロード作業はlwp-rgetではなくてwgetを用いることにした。
行った手順は以下のようになる。
- 5つのWEBサイトを広いWEB内から適当に選択する
- 選んだ各WEBサイト内のファイルについて、相互のハイパーリンクを抽出し、その数を解析する
- その結果を可視化する
以下に、解析を行った結果、すなわちサイトA,B,C,D,Eの相互に対するリンク数を示す。
↓から→へのリンク数 | |||||
0 | 2 | 0 | 27 | ||
1 | 0 | 13 | 273 | ||
20 | 2 | 0 | 43 | ||
0 | 11 | 0 | 285 | ||
1 | 1 | 1 | 1 | ||
合計 | 22 | 14 | 3 | 14 | / |
サイトE「日記猿人」へのリンクがムチャクチャ多いのは投票ボタンという形で、他のサイトからリンクがなされているからである。
さて、上の表からではWEBの絆を実感できないので、「WEBの絆」を3次元空間に可視化するJavaアプレットを以下に張り付けておく。WEBサイトが5つあるので、それぞれのサイトをピラミッド構造(四角柱状)に配置した。
各WEBサイトの表示色は、
- A = 赤
- B = 緑
- C = 青
- D = 黄
- E = 灰
それぞれのサイトから伸びる直線の長さは、そのサイトから他のサイトへ向かうリンク数に比例したものにしている。また、直線の太さもリンク数に比例させている。また、それぞれのWEBサイトを示す立方体の大きさは自分へ向かうリンク数に比例させている。ただし、サイトEの大きさはあまりにも巨大なため、リンク数に比例したものにはなっていない。また、サイトE、すなわち「日記猿人」、へのリンクは省略し、全てサイトEからの直線リンクを表示するだけにした。
さぁ、WEBサイトの構造を自分の目でみて、そしてグリグリ動かして見てもらいたい。このグラフの操作方法は
- 操作 = 作用
- マウス左ボタンドラッグ = 回転
- シフトキー + 垂直ドラッグ = ズームイン・アウト
- シフトキー + 水平ドラッグ = 垂直軸についての回転
- コントロールキー + 垂直ドラッグ = 焦点距離の変更
- マウス右ボタン垂直ドラッグ = 部品除去
- "s"キー = ステレオ画像作成
Java表示が上手く動かない人のために、静止画も一応張り込んでおく。
どうだろう?この5つのWEB間のWEB構造から何が見えるだろうか?こういう解析を数多くのサイトに行うと非常に面白い結果が得られそうである。特に「日記猿人」のようなコミュニティーに対して行うと興味深い結果が得られるはずだ。
私のような「日記猿人」の日記はほとんど読まない(サイトAに関しては大ファンであるが)人間にとっても興味深いのであるから、関係者にとってはきっと...の筈だ。
さて、今回はテストのためにごく少数(5つ)のWEBの解析を行ってみた。いつか、こういった解析を広い範囲で行い、そして、時系列的な変化をも調べようと思う。銀河のvoid構造が観測され、可視化されたものを見たときもとてもわくわくしたものだが、WEBの構造・変化ならばどうだろうか?
不思議なことに、そういうことを考えていると、「新宿都庁」と「思い出横町」が頭の中に浮かんできてしまうのは何故だろうか?押井守の影響だろうか。謎である。
そして、こうも思う。WEBネットワークの中でWEBサイトは何を感じているのだろうか?これらのWEBサイトはもしかしたら孤独を感じているのだろうか、それとも繋がりを感じているのだろうか?あの時のページの中の一フレーズがその答えの一つなのかもしれない。