hirax.net::Keywords::「ちゃろん日記」のブログ



2001-02-19[n年前へ]

ひとりで書いてるだけだから。 

ヘッポコ文章を直したい


   面白い情報を探しにと「お笑いパソコン日誌」を眺めていると、「ウエヤマの事件簿」の「他人の日記をオモチャにしよう!」が紹介されていた。「お笑いパソコン日誌」に〜『できるかな?』風ネタであります〜と紹介されてあった通り、実に私好みの話だった。ウエヤマ氏が「自分で書いてる日記の文章」を解析して、文字の出現頻度を調べてみたものである。

 「できるかな?」は画像や科学の関連の話が多いように見える。しかし、実はそれだけではなくて文章や日記に関する話も多い。例えば、これまでに出てきた話を振り返ってみると、

に始まり、と続く、「文学の世界を眺めてみよう」という話など、あるいは「WEBページで見かける文体の特徴を解析しよう」としたなど、あるいは「WEB日記の文化を眺めて見たい」というなどの話があった。「技術サイト」という分類をされることも多い本サイトではあるのだけど、非技術的な話に強引に技術的な話を持ち込みたくなったり、技術的な話なのに何故かとても私的で非技術的な話が入ってしまったりするのが、良くも悪くも「できるかな?」の特徴だろう。もちろん、良いことでは全然無いのだけれど、こうでも書かないと悲しい気分になってしまうので、「良くも悪くも」と書いているのである。

 そういったhirax.netの特長ならぬ特徴は私が書く文章が下手なせいなわけで、そんなヘッポコ文章から脱出するべく、私の書く文章の特徴を調べて反省してみることにした。もちろん、自分のヘッポコ文章だけを眺めてみてもしょうがない。他の素晴らしい文章を書く書き手と比較しなければならないだろう。そこで、今回はいくつかの文章を品詞解析し、その結果の特徴を調べることにする。そして、書き手による文章の特徴が眺めながら、私のヘッポコ文章の欠点を調べ、さらには誰もが思わず涙がこぼしてしまうような素晴らしい文章を書けるようになりたい、と思うのである。
 

 さて、まずは目標を決めよう。私がヘッポコ文章を脱出してどんな文章を目指すかを、何より先に決めなくてはならない。となれば、あまりにも大それた目標ではあるのだが、やはり日本の文豪、夏目漱石は外せないだろう。そして、その教え子でもある寺田寅彦もやはり外すわけにはいかない。一応私も理系のはしくれ、日本の理系文章の流れを作ったこの二人を目標にしなくてなんとしよう。ヘッポコ文章を脱出していきなり、夏目漱石と寺田寅彦というところに無理があるが、そんなことを考えていては駄目なのである。「少年よ大志を抱け」とクラーク博士も言ったのである。もう少年と言うにはどう考えても年齢的に無理があるのだが、気持ちはまだまだ少年で目標は大きく持ってみたいと思うのである。

 そして、もう一人の目標は「ちゃろん日記(仮)」をマイペースに書き続ける「ななゑ」さんである。私は彼女の書く文章を読むたびにとても素晴らしい理系的センスが感じ続けているのである。しかも、理系的でありつつも笑いと涙のペーソスたっぷりの「ちゃろん文体」という独自の確固とした文体を築いているところも尊敬していたりするのである。

 というわけで、今回の文章の比較は

  1. 夏目漱石
  2. 寺田寅彦
  3. ちゃろん日記(仮) ななゑ
  4. 「できるかな?」 jun hirabayashi
の四人の書き手の文章を適当に二つずつピックアップして、その文章を品詞解析して簡単に特徴を眺めてみることにした。各書き手に対して、それぞれピックアップした文章はである。なお、夏目漱石と寺田寅彦は「青空文庫」から入手した。そして、これらの文章を日本語形態素解析システム茶筌&perlで解析後、Excelでさらに解析・表示を行ってみることにしよう。

 ところで、形態素解析とはどのようなものだろうか。まずは、例を挙げよう。例えば、

私が好きな書き手達は、夏目漱石、寺田寅彦、ななゑさんです。
という文章を茶筌で分解すると、
  1. 私 名詞-代名詞-一般
  2. が 助詞-格助詞-一般
  3. 好き 名詞-形容動詞語幹
  4. な 助動詞
  5. 書き手 名詞-一般
  6. 達 名詞-接尾-一般
  7. は 助詞-係助詞
  8. 、 記号-読点
  9. 夏目 名詞-固有名詞-人名-姓
  10. 漱石 名詞-固有名詞-人名-名
  11. 、 記号-読点
  12. 寺田 名詞-固有名詞-人名-姓
  13. 寅彦 名詞-固有名詞-人名-名
  14. 、 記号-読点
  15. ななゑ 名詞-固有名詞-人名-名
  16. さん 名詞-接尾-人名
  17. です 助動詞
  18. 。 記号-句点
というようになる。このように各文章を品詞毎に分解して、その出現分布から特徴を調べてみるのである。なお、今回注目した品詞は
  1. 読点
  2. 形容詞
  3. フィラー
  4. 感動詞
の四つである。この四つを選んだ理由は、読点は明確な決まりがないだけに書き手の感覚が入りやすいと思われ、形容詞、フィラー・感動詞に関しては書き手の気持ちが素直に現れやすいと思われるからである。ちなみに、フィラーとはから引用すれば、「あのー」「えー」といった語句ということになる。まずは各文章が書き手によってどのくらい特徴づけられるかのイメージを掴むために、形容詞の出現頻度とフィラーの出現頻度を軸にとり、各文章を二次元の世界に配置してみた結果を図示してみよう。
 
形容詞の出現頻度とフィラーの出現頻度を軸にとって、
各文章を二次元の世界に配置した結果

 結構、同じ書き手による文章が同じような位置に配置されることがわかると思う。ちゃろん日記(仮)などは、二つの独立した文章がほとんど同じ位置に配置されている。もう、ちゃろん文体は安定しまくっていて完成されているのである。そしてまた、「文豪」夏目漱石の場合も、「我が輩は猫である」と「坊っちゃん」がかなり近い位置に配置されていることがわかる。

 なるほど、結構書き手による特徴はこんないかにも雑な解析でも評価できるものなのかもしれない(あくまで「遊び」だけどね)。そして、形容詞の出現頻度などは、「雪だるまがいる景色」と「自然と生物」以外は大体同じようなものである。寺田寅彦の「自然と生物」は妙に形容詞の出現頻度が高いところが面白いところである。私の「雪だるまがいる景色」はあまり技術的な話ではなくて、確かに形容詞が多そうな話ではあるのだが、一体「自然と生物」はどうだっただろうか?

 ちなみに、「できるかな?」からの二つの文章は共にフィラーが一個も出てこない。その他の6つの文章にはフィラーが出てくるのであるが、何故か「できるかな?」の二つの文章にはフィラーが含まれていないのである。この差がなければ、寺田寅彦の二編と「できるかな?」はかなり似た場所に位置するのであるが、このフィラーは特に違うのである。

 さて、上の図ではフィラーと形容詞の出現頻度だけを眺めてみたが、読点、感動詞の出現頻度も加えて、クラスター分析を行ってみた。つまり、「読点・形容詞・フィラー・感動詞」の出現分布が似ているものを分類してみたわけである。クラスター分析にはExcelアドイン工房「早狩」の統計解析アドインを使用させて頂いた。ちなみに、クラスターの結合はウォード法を用い、非類似度計算法には標準化ユークリッド平方距離を使用した。その結果が下の図である。
 

クラスター分析の結果

 このクラスター分析の結果を示す図は近い文章をまとめていったものを示している。つまり、文章の「近さ」あるいは「似ている度」を示しているのである。ちゃろん日記(仮)の二編は本当によく似ていて、また夏目漱石の書いた二編も互いに似ている。そして、それより「近い度」は低いが「新宿駅は電気羊の夢を見るか?」は「科学について」に近くて、「雪だるまがいる景色」は「自然と生物」に近い。おして、さらに似ているものを探せば、ちゃろんの二編と「新宿駅は電気羊の夢を見るか?」・「科学について」は似ているといえなくもない、さらに言えばその四編と夏目漱石の二編が似ている。

 ここでは、四人の書き手がいるということが私には判っているので、あえて四つのクラスターに分解してみると、

1.
    • 「雪だるま」がいる景色
    • 自然と生物
    2.
    • 新宿駅は電気羊の夢を見るか?
    • 科学について
    3.
    • ちゃろん日記1998(仮)11月上旬
    • ちゃろん日記1999(仮)6月上旬
    4.
    • 我が輩は猫である
    • 坊ちゃん
という風になる。やはり夏目漱石とちゃろん日記に関してはこんなチープなごく少数の品詞解析でも、「作者の文体が同じである」と解析されてしまうのである。なかなか、スゴイとは思わないだろうか?数多くの解析をしてみるのもなかなか面白いと思う。高校生のレポートくらいだったら、これで何とか書けそうである。

 しかし、その一方で考えてみれば寺田寅彦の名随筆と「できるかな?」のヘッポコ文章が「文体が近い」と解析されてしまっているわけなので、実はこの解析の信頼性はかなり低いと言わざるを得ないところもあるのである。いや、もしかしたら「文体は同じやけど、内容が全然違いますがな」というような冷たいアドバイスを解析結果は言わんとしているのかもしれないが、もうそれは哀しすぎる事実なので考えたくないのである。

 さて、そう言えば一番最初の図で「できるかな?」と寺田寅彦の差はフィラーの出現分布だったわけであるが、「大学の講義における文科系の日本語と理科系の日本語-- 「フィラー」に注目して --」では、「聞き手への働きかけのあるフィラーが多いということは聞き手への配慮が大きいということにつながる」と書いてあった。ということは、フィラーの出現分布は聞き手への配慮に比例するというわけで、「できるかな?」の文章にフィラーが出てこない、ということは読み手に対する配慮がない、なんてことなのかなと思ってしまったりするのである。

 そんなことを考え出すと、ホラどうせひとりで書いてるだけだから読み手のことなんか考えていないのさと、思わず涙がこぼれてしまうような哀しい気持ち、になったのである。う〜む、最初は誰もが思わず涙がこぼしてしまうような素晴らしい文章を書けるようになりたいと思ったったのに、何でこんな結論になるんだろう?

 答え: それは文才がないからです。ハイ。
 
 

2001-11-10[n年前へ]

泣ける話はコミカルに。 

 もう更新はされないのかもしれないけれど、ちゃろん日記なんかもコミカルで泣けるからとても好き。
 まさか、とは思うけど、今ならいるかもしれない知らない人のために。(リンク

2002-04-14[n年前へ]

WWWC 

 あまりツールの活用ができないワタシだけれど、WWWCをブックマーク代わりに「少しは」使ってみている。とはいえ、実は本当に好きなページはWWWCに入れていない。
 もう更新されないんだろうな、と思いつつも時折見に行く「ちゃろん日記」なんて、WWWCに入れるわけがない。
 そういえば、ニガシオが復活してた時もそうだった。見えないんだろうな、と思いながらも見に行ったその日偶然復活してた。なので、そこそこアナログなワタシはそんな偶然を信じて、大好きなページはWWWCには入れたくないのだった、と日記には書いておこう。

2002-10-19[n年前へ]

オンデマンド印刷 

 ワタシなら、自分用「ちゃろん日記」を作る、と思う。あー、絶対作って残したいー。DocuColorで海賊版(じゃないや私家版)を印刷しまくろうかな。

2003-09-04[n年前へ]

「俺」「僕」「わたし」「私」と「あたし」「わし」 

はてなダイアリーの一人称で眺める「WEB日記の立ち位置」


 WEB日記の起源は土佐日記に遡る。そう書く理由は、土佐日記がWEB日記と同じく他人に読まれることを前提とした「日記」であったというだけではない。WEB日記の流行がさまざまなシステム、例えば「さるさる日記」「エンピツ」といった比較的簡単で使いやすいシステム・道具に支えられているように、土佐日記もまた「ひらがな」という新しく使いやすいシステム・道具の支えがあってこそ出現した、というのが何より一番の理由である。

 そして、「土佐日記」に続く「蜻蛉日記」「和泉式部日記」「紫式部日記」「更級日記」といった、「土佐日記」後の日記文学を支えていったのが全て女性達だったのと同じく、それから千年後のWEB日記文学の黎明期を支えたのも「ちゃろん日記(仮)」「バブルの逆襲」「菜摘ひかるの性的冒険」といったよな女性達だったということもWEB日記の起源を土佐日記に遡らせたくなる理由の一つなのである。

 また、土佐日記が書かれたのが1000年以上も前であるにも関わらず、そういった「日記」と「女性」という不思議な繋がりを意識したのかしないのか、書き手である紀貫之が女性を装いながら日記を書くという「ネカマ」テクニックを先取りしていた、というのも実に先見の明がある。まるで、紀貫之が千年後のネットワーク社会を見通していたかのようなのである。というわけで、WEB日記の起源を土佐日記に求めてみるのもそう不自然な話というわけではないように思われる。


 千年前の土佐日記から続いてきた「他人に読まれることを前提とした日記」も、最近では他人のWEB日記にコメントを書きこむことができたり、他人のWEB日記に対し自分のWEB日記からコメントが自動的にされるようになってきたりと、少しづつ変わりつつあるようだ。他人に単に日記を読ませることができるというだけでなく、他人に日記の一部を書かせてみたり、他人の日記へ口をはさんだりするということが普通にできるとなれば、それは千年前に比べて大きく「道具」が発展すると言っても良いのかもしれない。だとすれば、道具の発展がそれを使うものの意識を変えていくことがしばしばあるように、WEB日記を支えるシステムが大きく変わっていくのであれば、WEB日記を書いている人達の意識がどのように変化していくかが非常に気になるところだ。他人に対して日記を公開するという意識、あるいは他人の日記の「公共性」への意識がどう変わっていくのかはとても気になるところである。

 そこで、WEB日記の書き手の意識を探るために、WEB日記システムの一つである「はてなダイアリー」のはてなダイアリー利用者に100の質問に答えた人達の中から50人を抽出し、次の2点、

  1. 家族・友人(他人)にはてなダイアリのURLを教えているか
  2. 他人の日記にコメントをつけたことがあるか
またそれに加えて
  • 日記の中で一人称には何を使っているか
  • 男性か女性か
にも着目してアンケート結果を眺めてみることにした。それにより、WEB日記の書き手の「日記を他人に公開する」という意識、および、「他人の日記に口を挟む」ということの意識を眺めてみたいと思う。そして、その人達の一人称を調べることで、その人達が
  • どのように自分を語っているか
  • どのように名乗っているか
を眺めてみたい。千年以上前に一人称の性別を偽りながら始まった「公開日記」の一人称が現在どうなっているのかを調べてみたいと思うのである。


 まずは、「性別と一人称の相関関係」を下に示してみる。このグラフは、男・女に対する各一人称の相関関係を示しており、縦軸の上方向が「男と相関が高い=男性がよく使っている」一人称であり、下方向が「女と相関が高い=女性がよく使っている」一人称であることを示している。

性別と一人称の相関関係
一人称
 このグラフを見ると、男性が使う順に「俺、僕、わたし、私、一人称無し、あたし・わし」となっているとか、「私」は「わたし」より女っぽいということが判る。もっとも、例えば菅原文太がよく使いそうな「ワシ」が、何故かとても「女っぽい」という結果になってしまっているが、だからといってそれは「実は菅原文太が女っぽかったのだ」なんていうことでは別になくて、単にサンプルとして抽出した50人のうち「ワシ」を使っていたのはただ一人だけで、しかもそれが男性ではなくて女性だったというだけの理由なのである。

 そして、次に示すグラフは「家族(友人)にはてなダイアリのURLを教えているか」ということに対する相関値(≒家族への距離)を縦軸にとり、「他人の日記にコメントをつけたことがあるか」ということに対する相関値(≒他人への距離)を横軸にとり、各一人称を配置させてみたものである。縦軸の「家族(友人)にはてなダイアリのURLを教えているか」という設問に関しては答えている人達が主に「家族へ日記を教えているか」という意識で答えているようだったので、ここでは縦軸は「家族への(日記の)距離」というように捉えてみた。そして、横軸の「他人の日記にコメントをつけたことがあるか」という設問は「他人の日記への距離」というように捉えてみた。

家族からの「距離」と他人への「距離」
グラフ

 このグラフを見ると、不思議なことに「家族に近い日記」の書き手は「他人の日記」に遠く、「家族から遠い日記」の書き手は「他人の日記」に近いということが判る。つまり、「家族への近さ」と「他人への近さ」は反比例するという不思議な関係がある。そして、女性は家庭に近く他人にはちょっと距離をおいているが、男性は家庭から遠く他人への距離が近い、なんていう姿も見えてくる。ありがちな男女像ではあるのだけれど、そんな像が見えてくるのである。

 とはいえ、男性であっても「俺」を一人称に使うような書き手はあまり他人の日記へ書き込みはしないとか、男性でも「僕」を使うような書き手は家族を近く意識しつつも同時に他人へも近い、なんていうことも判る。また、「私」と「わたし」は家族への距離は同じくらいであるにも関わらず、他人への距離は正反対の関係にあって「私」を使う人はあまり他人の日記へは書き込まないが、「わたし」を使う人はある程度他人の日記に書き込みをしているなんていうことも判るのである。

 人それぞれ自分を語る一人称が異なるように、それぞれの日記ももちろんそれぞれ立ち位置が異なっている。その立ち位置の違いの原因は書いている人達自体の違いということは当然あるに違いない。しかし、同時にその人達の日記を支えている道具の違いということもある程度は影響を与えているに違いないと想像する。そこで、今回ははてなダイアリの書き手50人を眺めてみたが、次回以降では違う日記システムの書き手達も眺めてみたいと思う。そして、道具が少しづつ変わっていく中で、その道具を使って書かれている日記が、あるいは何処かで生まれるだろう新たな日記文学が、どのように変わっていくのかを考えてみたいと思う。



■Powered by yagm.net