2009年8月15日土曜日

村田真さんのコラムが面白い

日本ソフトウェア科学会の学会誌「コンピュータソフトウェア」の2009年8月号に村田真さんがコラムを書かれている。これが面白い。

タイトルからしてふるっている。「盲亀浮木」。少なくとも私は、こんな言葉は聞いたことがなかった。元は仏教用語で、大海の底を這い回る盲目の亀が100年に1度水面に浮かび上がるとき、たまたま水面を漂う流木の、しかもそこに開いている穴から顔を出す、という喩えから転じて、物事が成就するのが極めてまれであるという意味となる。本来の仏教用語としての意味は浄土真宗親鸞会のページに詳しい。

村田さんは、元の説話のレベルにまで立ち戻って、この言葉を比喩として使っている。つまり、基礎理論を盲亀に、実際の応用を浮木に喩えて、基礎理論が実際の応用に役立つのが極めて稀である、と、話を始めているのである。こういう言葉が出てくる辺りがなんとも村田さんらしい。コラム執筆のときに四字熟語集をひっくり返してもそれこそ盲亀浮木だろうから、なんかの機会にこの言葉を知って、温めていたのではないか、と想像している。

村田さんが基礎理論と応用との関わりを語れるのは、もちろんRELAX NGという成功事例を持っておられるからだし、それが故にこのコラムには説得力がある。ただし、コラムに書かれていない話として、村田さんがもともと基礎理論肌の人であること(工学部ではなく理学部出身である)、RELAX NGに至るまでに構造化文書の問題に長く取り組まれていること(DBLPのページ。ご本人の談によれば1994年頃からSGMLに関わっていたらしい)は挙げておく必要があるだろう。RELAX NGという盲亀浮木は100%偶然から生まれたわけではないのである。

それにしても、自分の身を振り返ってみるとき、大学という環境にいながら浮木に出会うことがいかに難しいかを、改めて痛感する。概して、大学という環境は、実際の応用とは縁遠い。しかも自分は、決して好奇心旺盛なほうではなく、興味を持った数少ない対象を深く掘り下げていくほうが好きであり、他人と共同で研究をするのも苦手である。ただでさえ出会いにくい浮木に、ますます出会いにくくなっている。

先にリンクを張った浄土真宗親鸞会のページによれば、盲亀浮木の出典である「雑阿含経」では、説話の続きがあるらしい。亀が木の穴から顔を出すのはほとんどあり得ないことだが、まったくあり得ないことではない。人間に生まれるということは、さらにそれよりもあり得ないことであり、有り難いことである。基礎理論に関わっている人と実際の応用に関わっている人、どちらが多いかと言えば、実際の応用に関わっている人なのではないか。そういう意味で、基礎理論に関わりながら仕事ができているのは(盲亀浮木よりも確率は高いだろうが)有り難いことであると感謝しなければならないのだろう。

そんなことを考えつつ、自分が関心を持てる浮木がないか、アンテナをチェックする日々なのである。

2009年8月11日火曜日

大量のフィードを日々どうやって処理するか

昨年の10月に子供ができて以来、自宅でパソコンの前に座れる時間が極端に減っている。ほとんど座れない日も珍しくない。一方、パソコン仕事は自宅でも増えるばかりである。子供のデジカメ写真の整理、子供の動画の整理、インターネットラジオの録音の編集、メールの処理…とにかく時間が足りない。

そうすると、割を食って後回しになりがちなのが購読フィードのチェックである。

Webをあちこち手動で廻ってチェックするなんてかったるくてやってられん…という人なので、興味を惹いたページにRSSやAtomのフィードがあると、どんどんGoogle Readerに登録していた。その結果、Google Readerの統計によれば、現在1日の新着記事数は1,600前後らしい。時間が充分あってもチェックするのが一苦労な量である。ましてや、時間が足りない現在の状況では、未読はどんどんたまるばかりである。しかし、これをチェックしなければブログその他のネタも入ってこない。ここまで増えると、少々フィードの整理をしても焼け石に水である。実にジレンマだ。

最近 mehori さんが自身のRSS速読術なるものを披露されている。未読500件を5分でチェックされているということで、実に興味深い。が、自分はまだまだ修行が足りないのか、はたまたブラウザや通信速度が遅いのか、興味を惹く記事のピックアップだけに絞ってもとてもこのペースではチェックできない。

ただ、mehori さんの記事を踏まえて自分のフィードチェックの作業を考えてみると、記事が表示されるまでの時間や記事の本文に目を通す時間が相当かかっているような気がした。ならば、そこを減らしつつ、興味を惹く記事をチェックするにはどうすればいいか。

…というわけで、Google Readerをリスト表示にして、フィードのタイトルだけでチェックするようにしてみた。リスト表示の状態で、興味のありそうな記事にスターを付けた後、全部既読にしてしまう。その後スターのついた記事だけゆっくり読むという作戦である。Google Readerはスター付きアイテム(starred items)の中で独自の未読/既読管理が行われているので、こういう場合に大変都合が良い。

もちろん面白い記事を見逃す危険はあるけれど、そういう記事はソーシャルブックマークやTwitter、あるいはどこかのブログで誰かが取り上げてくれる可能性があるし、必要になったときにGoogle検索すれば引っかかってくれるだろう、と割り切った。ジレンマでストレスを溜め込むよりははるかにマシである。この辺り、Twitterのフォロー数が増えるにつれ、タイムライン上のつぶやきをすべてチェックできなくてもいいや、と割り切れるようになってきたのと対応しているかもしれない。

基本的にコレクター気質の強い人、モノが捨てられない人なので、こういう風に、情報を捨てることを意識的にやらねばならないなあ、と改めて感じたのであった。

2009年8月1日土曜日

正規表現と正則表現

今日はもう少し小ネタを続けてみよう。自分の講義ではしょっちゅうしゃべっているネタなのだが、とりあえず書いてみる。

regular expressionの日本語訳としては「正規表現」がよく知られているが、先日の投稿からも分かるように、自分は「正則表現」という訳を好んで使っている。ちなみにGoogleで検索してみると、「正規表現」は約2,450,000ページ、「正則表現」は約88,000ページと出た。Googleの検索結果が全てではないとはいえ、「正規表現」のほうが広く使われているのは間違いないだろう。

そのことを知った上で「正則表現」を使っているのには理由がある。学生時代の恩師である矢島脩三先生が講義の中で、この2つの訳について言及されたことがある。「regular の日本語訳は『正規』と『正則』の2通りがあるが、『正規』は normal の日本語訳としても広く使われている。だから『正則』のほうがよい」という趣旨であったように記憶している。学生ながらにこれを聞いてなるほどと思ったのだろう。未だにこの発言を覚えていて、「正則表現」を使い続けているのである。

HTML 5の勉強をせねば

某所でHTML 5について講演することになりそうである。まだ公表されていないので詳細は差し控えるが、構造化文書の動向について話してほしいと言うことだったので、今ならHTML 5だろう、と考えて、こちらからそのように提案させていただいた。

夏休みはこの辺りの勉強(というか調査)を集中的にやる必要がありそうだ。