2012年11月30日金曜日

初心者向けRを用いたデータ解析ミニチュートリアル

本ワークショップの3人の話題提供者は、全員、データ解析にR言語を用いています。
本日は、R言語の操作方法に関するミニチュートリアルの参加者を募集します。

 当初、本ワークショップでは、R言語による混合モデル解析について演習形式の内容を
企画しておりました。しかし、今回は時間の都合により、演習を行うことは難しそうです。
その代わりとして以下の二つを考えています。

1.仮想データによる解析の例を本ブログに掲載します。仮想データ、解析に必要な
コマンド、出力結果の読みとりまでを一通りお見せする予定です。

2.R言語の使用経験がなく、操作方法についていろいろと不安があるという方に
基本的な操作方法を学会開催中にお教えします。ただし以下のAとB両方に
当てはまる方のみを対象といたします。

  A. 学会にR言語をインストールしたPCを持ってこられる方
  B.  学会二日目に参加される方

 チュートリアルではデータの読み込み、混合モデルの解析コマンドの書き方などの
操作解説をします。参加者の方のデータの持ち込みには対応できませんので予め
ご了承ください。ご希望の方は管理人までメール(mixed.model.jp@gmail.com)をください。
学会開始5日前(12月8日)まで応募を受け付けます。

なお応募者が多数の場合は、勝手ながら参加者を限定させていただくことがありますが
何卒ご容赦ください。

2012年11月15日木曜日

論文誌でのLME使用率(1)

なぜ実験データを線形混合モデルで解析しなければならないのかという疑問は私を含めてたくさんの方がお持ちかと思います。

 統計学上の理由や実験計画上の理由が重要であることはもちろんです。それに加えて、実際どの程度この解析が論文の中で使われているのかも気になるところです。すでに多くの研究で線形混合モデルが使用されているならば、それらの論文の結果を適切に読みとるために、解析に関する知識が必要になります。また、文理解研究というフィールドの流れを把握するためにも、線形混合モデルの使用率は興味深いのではないでしょうか?
 
 そこで心理言語学の研究が取り上げられる海外の主要な論文誌における線形混合モデルの使用率を計算してみようかと思います。

 第1弾で取り上げる論文誌はJournal of Memory and Languageです。計算の対象となったのは2011年、2012年および2012年10月現在でIn Pressとして電子版のみが発行されている論文(全部で144本ありました)です。

 このうち、線形混合モデルを使用している論文が42本ありました。使用率は29%です。この値を見る限りではそんなに使用率が高いとは考えられませんね。

 つぎに研究内容について文理解研究かそれ以外かで分類してみました。その結果、文理解研究の論文がが52本、それ以外の研究領域(主に記憶研究でした)の論文が92本ありました。

 この分類ごとにもう一度線形混合モデルを使用している論文の数を計算してみました。すると、文理解研究の論文のうち線形混合モデルを使用している論文が29本ありました。使用率に直すと58%です。また、他の研究領域の論文で線形混合モデルを使用しているのは13本でした。使用率に直すとわずか14%でした。

 この結果から言えるのは、線形混合モデルの使用は研究領域によってばらつきがあること。そして文理解研究は比較的使用率が高いということです。ここ2年を見るかぎりで線形混合モデルを使用している論文が半数を超えています。とはいうものの線形混合モデルを使用していない論文も掲載されているので、線形混合モデルを使っていなければ「絶対に査読に通らない」とは言えないと思います。

 これから他の論文誌でも集計を行って、論文誌ごとの使用率のばらつきについてワークショップで報告できればと考えています。

2012年11月6日火曜日

Ito, Jincho, Minai, Yamane, & Mazuka (2012)


著者: Ito, K., Jincho, N., Minai, U., Yamane, N., & Mazuka, R.
論文タイトル: Intonation facilitates contrast resolution: Evidence from Japanese adults and 6-year olds
雑誌名: Journal of Memory and Language
号: 66(1)
ページ: 265-284

従属変数の種類: 注視頻度(カテゴリー、ターゲットの注視ありを1、なしを0とコーディング)
独立変数の種類:1,2,3はすべて固定因子
        1.抑揚(強調あり vs. 強調なし、カテゴリー)
        2.時間(60 msの時間窓の推移、連続量)
        3.試行順序(連続量)
                          
解析の種類: Mixed-effects logistic regression models
使っているソフトウエア: R lme4
その他メモ: 文提示中の時間推移を固定因子としており、時間推移による注視頻度の上昇および強調の有無による時間推移の違いの交互作用を検定している。

リンク: http://www.sciencedirect.com/science/article/pii/S0749596X11001008

2012年11月1日木曜日

t検定と分散分析の再確認

 本ブログでは、線形混合モデルについて議論することを目的としていますが、元々、実験的なアプローチに基づく心理言語学研究では、t検定と分散分析を主な統計ツールとして使ってきました。
そこで、t検定や分散分析の前提や計算の仕組み、使用上の注意などがとても分かりやすくまとめられている論文を紹介します。


著者: 近藤公久
論文タイトル: 有意差検定のしくみから考える 平均と分散から再確認
雑誌名: 日本音響学会誌
号: 68(8)
ページ: 397-402

リンク: http://www.asj.gr.jp/journal/04_contents/2011_08.html

 従来の解析と線形混合モデルとの違いを考えるヒントになるかもしれません。