枕草子 (My Favorite Things)

【第708回】 Rを薦める理由(2001年11月13日)

今日も往路あさま2号。このところRが凄い凄いと書いているが,東工大の間瀬さんのサイト間瀬ホームページからダウンロードしたWriting R Extensionsの和訳を斜め読みして,ますますその感を強くした。ドキュメントを1つ書くと,htmlとTeXのソースとRのhelp用のファイルを生成できるという仕組みはすばらしい。Knuthが文芸的プログラミングと言って,プログラムソースからドキュメントも生成できるようなコーディングを進めたことを思い出させる。

そもそも,研究の世界は公平であるべきである。誰でも追試ができ,論理によって検証されるというのが科学の前提である。しかし,実際には貧富の差が大きく影響していて,多くの科学研究は先進国だけのものとなっている。その中でも格差があって,日本でさえ,大学図書館の予算は乏しく,Journalの種類は少ないし,船便で最新のJournalが届くまでに欧米からは1ヶ月以上の遅れをとってしまう。最近はwebからダウンロードできるようになって,東京大学ではだいぶ状況は改善されたが,それでも米国の大学,例えばPenn State Univ.などに比べると圧倒的に図書館は貧弱である。研究費そのものも少ないので,ふんだんに試薬や器具,大型機器を必要とするような実験はやりにくい。途上国ではなおさら不利であることは説明の必要がないほどである。

実際にモノを消費する実験などでは,コストがかかるのはある程度仕方ない。しかし,ソフトウェアは使っても減らないのだ。しかも,ソフトウェアは,独立して存在するものではない。相互依存する関係なら金の動きはなくすというやり方もありうる。

ソフトウェアを商業ベースで開発するという市場主義は,国際的不平等に拍車をかける。寄付を募るくらいは別として,MathematicaとかMaple Vのような数式処理ソフトや,SPSSとかSASのような統計ソフトの信じられないほど高価な値段づけは,何かが間違っていると思う。統計にしろ,数学にしろ,理論そのものは論文として公開されるのだから,それをソフトウェアにインプリメントする対価として受け取る額としては異常である。理論を提示するときに何らかの検証はするはずだから,共同で利用されるようなオープンソースでフリーのプラットフォームがあって,論文発表と同時に研究者がそのプラットフォームへのインプリメントもするという慣行さえできてしまえば,数学や統計に関して,ソフトウェアは市場主義を脱却できるはずである。そうすれば,基本的に貧富の差による不平等は小さくなるだろう(ハードウェアの差はあるだろうが)。

数式処理に関してはEuler95MaTXがあるものの,Mathematicaとはまだかなりの開きがあるような気がする(もっとも,MaTXはMathematicaというよりもMatlabを意識して作られているようだし,Matlabとは遜色ないのかもしれない。普通の数値計算についてはMathematicaよりもEuler95やMaTXの方が簡単かもしれないが,ぼくはCで書くことが多いので評価する資格をもたない)。

しかし,統計ソフトのRは,普通に使う範囲の統計処理においてはSPSSやSASと遜色ないし,WindowsでもMac OSでも各種UNIX系OSでも動作するし,使われている数学的手法も新しいし,拡張性はずっと優れているし,オープンソースだし,これを共通プラットフォームにしない手はないと思う。たぶん,そう思っている人は世界にたくさんいるので,700以上のパッケージが既に集まっているのだろう。

おそらく,Rを講義で使うためのドキュメントを日本語で書いて公開するというだけでも,Rの普及に向けた貢献にはなるのではないか。社会統計学はその実践のつもりである。これからは,論文を書くための統計処理も,可能な限りRでやろうと思っている。そして,大抵の場合,それは可能である。

ついでに言えば,昨今はやりのGISやリモートセンシングもソフトウェアが高価すぎると思う。元々軍用のものを民生化したから高いのだろうけれど,ArcViewの値段など法外である。あれでは途上国の研究者は買えないだろう。リモートセンシングデータなど構築物ではないし,撮影許可を受けているわけではないのだから,公開されて当然のものだと思う。商業ベースでやっている現状は,何かおかしいのではないかと感じる。この世から戦争がなくなれば,地理情報などは公開できる性質のものだと思う。

今日は論文を打ち出しそびれてしまった。ミーティングはアフリカの植物利用の話と胎生期のビスフェノールA曝露の影響を調べたマウスの動物実験の話だった。面白いところもあった。

帰りは終電1本前…のつもりだったが,上野駅に着いてみたら新幹線が止まっていた。上野と大宮の間で停電したとかで,18:00頃からずっと不通なのだ。「新幹線をご利用の皆様には大変ご迷惑をおかけしました」なんてアナウンスをするものだから,復旧したのかと思いきや,まだまだ復旧見通しは立っていないということであった。日本語がおかしいぞ>JR東日本。

自宅に電話をしたら,明日の娘の保育参観は,妻が調査に行く前に途中までは出られるというのでお任せすることにして,研究室に泊まって講義準備を片付けることにした。しかし,なかなか簡単には気持ちを切り替えられないので,週刊アスキーを読んでしまったりして堕落しているのが現状なのだった。そうはいっても講義準備と来週のミーティングで紹介する論文を選ぶという作業をしなくてはならないのは確かなので,これからもう暫くそれらをやってから仮眠をとることにしよう。


前【707】(忙中有閑(2001年11月10〜12日) ) ▲次【709】(目が覚めてみると(2001年11月14日) ) ●枕草子トップへ