2013年6月4日火曜日

knitr package と RStudio (1)

 本日はR言語で分析するときに役立ちそうなツールのご紹介です。
(ちなみにこの話はロチェスター大学のJaeger先生に教わりました。Jaeger Lab.のブログにも
関連する投稿があるので興味のある方はこちらをクリックしてください。)

 あなたは、R言語を利用して分析する場合、出力結果をどのように保存していますか?容易に想像がつくのは、次の2パターンです。

パターンその1
 解析にRGui (R言語と同時にインストールされるインターフェイス)を使ってコンソール上に
コマンドを順番に入力していき、出力結果を表示させながら、分析を進めていく。
最後にコンソール上のすべてのコマンドと出力をコピー&ペーストで他のテキストエディタなどに
貼り付けてテキストファイルとして保存する。

パターンその2
 RScriptエディタを利用して、コマンドシンタックスのみをテキストファイルとして保存しておく。
出力結果が見たい場合は、その都度、コマンドシンタックスの必要個所を読み込んで分析を実施し、コンソール内の出力結果を読む。

 本ブログの管理人である「私」は主にパターンその2の方針を取っていました。しかし、どちらのやり方にも問題があります。

 パターンその1の方針をとると、保存したテキストにコマンドと出力が混在していて、必要な個所を見つけるのに時間がかかります。パターンその2の方針をとると、コマンドシンタックスのみが保存されているので、必要な個所は多少見つけやすくなります。しかし、出力を保存していないので、毎回RGuiを起動して出力を表示させる必要があります。そして、パターン1・2共通の問題としてグラフを別のファイルとして保存しなければならないということがあります。

 こういった問題を見直すと、分析結果を後からでも容易に見返すには、コメント、コマンドシンタックス、出力結果、グラフが一つのファイルに保存されて、かつそれぞれがすぐに区別できるように表示されていること」が大事だと気付きます。そして、これらを実現できるのがknitrというパッケージとRStudioというIDE(統合開発環境)です。

 knitrはR言語のパッケージの一つです。このパッケージが作られる前は、上記のような見やすい出力結果を表示するのにたくさんのパッケージを組み合わせて使う必要があったようなのですが、それらを一つのパッケージで実現することを目的に開発されたと、開発者のウエブページ(http://yihui.name/knitr/)で紹介されています。lme4と同じようにRGuiやCRANのウエブページからダウンロードしてインストールできます。

 RStudioはR言語の開発環境です。knitrパッケージに対応しており、あらかじめRにknitrをインストールしておくと、様々な形式(HTML, LaTeX, MarkDownなど)で出力するためのテンプレートをボタン一つで作ることができます。オープンソースなのでウエブページから無料でダウンロードできます。私はWindows版しか使っていませんが、Linux版やMac版もあるようです。


 では、どうやって使えばいいのか?次回は、HTMLで出力する方法を紹介します。

0 件のコメント:

コメントを投稿