カテゴリー別アーカイブ: 研究

2023年度LET関西支部秋季大会を終えて

はじめに

11月4日(土)に開催された2023年度外国語教育メディア学会(LET)関西支部秋季大会のシンポジウムに登壇したので,その雑感みたいなものを忘れないうちに(その日の夜はほぼ記憶を失いましたが)メモしておきたいと思います。私の資料はウェブに公開しているので,下記から御覧ください。

この資料の中のメインの話は以下の2つの書籍を読めばほとんど書いてあることなので,詳しい話はそちらをお読みください。

特に,私の話は結構端折っているので,本を読んでいただかないとつながりとかも分かりにくくなっていしまっていると今になって反省しています。

第二言語研究の思考法: 認知システムの研究には何が必要か

英語教育のエビデンス: これからの英語教育研究のために

ちなみに,下の本についてるAmazonのレビューは全く参考にならないので,レビューでこき下ろされているからといって買うのを躊躇しないでください(このブログ記事を読む人が私のこの記事の内容とAmazonのレビューで後者を参考にするとは思いたくないですけど)。

全体をざっくり

司会の浦野先生をはじめ,南先生,私と,3人とも言いたいことが結構あったなと思いましたし,それぞれに違うポイントを強調されていたのが(当然ですが)よかったなと思いました。浦野先生は,司会だから抑えめにされていたと思いますが,学会誌の投稿基準の話や追試,外的妥当性・内的妥当性の話など,外国語教育研究の大きなところの中で重要なところをピンポイントに指摘されていた印象です。南先生はとにかく実践研究を広めたい,もっと多くの人に実践研究に取り組んでもらうことで実践も研究も状況が良くなるという信念があるように感じました。

機材のトラブル等があって最後のディスカッションの時間が短くなってしまったことや,オンラインで参加された方に議論を届けられなかったことが非常に残念でした。あと何より私が残念だなと思ったのは,登壇者の南先生がマイクを持って質問者のところに行っていたことです。あれ,南先生がいい人だから自然と身体が動いてそうなりましたし,私も最初マイクを持って走り出そうとして南先生とぶつかりそうになったのですが,あの場にいた実行委員(運営委員を含めても良い)の中の誰もがその役割(シンポジウムを回す役割)を積極的に担おうとしなかったことは,端的に言って登壇者に失礼だったと思います。参加者としてあの場にいたから意識が向かなかったのかもしれませんが,さすがにシンポジウムの登壇者がやることではなかったと思います。そのこともあってか,南先生が議論になかなか加われていませんでした。私も登壇者だったのでなかなか南先生の代わりに誰かとその場で声をあげるほどの頭の余裕がその時はなくて何もできなかったのですが,後から冷静に振り返るととても心苦しかったです(途中から誰かが変わっていたかもしれませんが,記憶がそこはありません)。

フロアとのディスカッションで出た質問

私が覚えている限りの質問について,書いてまとめます。質問された方で私のまとめ方が異なるようでしたらご指摘ください。

実践研究と理論研究が相似系であること

私は探求の論理学の例で,アブダクションによる仮説形成と演繹的推論を用いた予測,そして実験から一般化するというプロセスを提示しましたが,そのプロセス自体は実践研究でも同じことなのではないかということでした(その前にも色々な話があったと思いますが)。それはそういうところもあるかなと思いましたが,アブダクションによる仮説形成時に理論的構成概念を扱うことを重視するという点は理論と実践の違いと言えるかもしれないと思いました。実践の時には構成概念の実在はそこまで重要視されないかなと思うので。

オルタナティブ・アプローチについて(※注)

SLAの話の中にいわゆる認知的「ではない」アプローチをとる研究が一切出てこなかったのですが,というコメントが有りました。私が認知的アプローチを取る研究者を代表して今回登壇したということを浦野先生が補足してくださいました。私がまず答えたのは,社会文化理論なり複雑系理論なり,Atkinson (2011)に収録されているような「オルタナティブ・アプローチ」で言われているように,認知的アプローチでは第二言語習得はわからないのだ,大事なものを捨象しているのだ,というようなものがもし仮に真であったとしても,そのアプローチを取る人たちが,認知的メカニズムを一切仮定しない第二言語習得理論を作ることはできないし,学習者の外側の要因がどれだけ重要であったとしても何からの認知的メカニズムを考えずに第二言語習得を研究することはできないというものです。あらゆる要因をすべて考慮して,全部を包括的に説明することを目指そうとというのは個人的には失敗だと思っています。let all the flowers bloomでは無理だったということを,少なくともメカニズムの探求をするのであればそれを認めた上で(まあ最初からそう思っていた人が多いと思いますが),説明する対象を限定した上でメカニズムの探求をする必要があるだろうというのが「思考法本」の中で書いてあることでもあります。

事例研究の積み重ねの重要性

医学の分野では,厳密なRCT実験ではない事例研究も全く意味がないわけではなく,それはそれで価値のあるものだと認識されているので,事例研究も…というような意見がありました。事例研究の話はこれまた寺沢さんのブログで言及されている話があるので(EBEE本の寺沢さんの5章の最後にも事例研究の話があったと思います),そちらをお読みいただくと良いと思います。

寺沢さんの話は,何を事例として取り上げるのかという選択が非常に重要で,その事例が何らかの形で理論構築なり他者なりに貢献できるような事例でなくては事例研究としての価値が低いということだと理解しています。私はそれ以外にもう一つ医療系と教育系で違う点があると思っています(これは懇親会で亘理先生とも話したことですが)。それは,介入の手順や測定の厳密性や標準化度合いです(これもEBEE本の中でPKテストが扱われる8章で述べられている話でもあります)。医療では,おそらく何らかの介入を行う際に,その手順が厳密に規定されていて,その効果を測る手段も標準化されていると思います。よって,そこのブレがない分だけ事例の共有が容易でしょう。しかしながら,言語教育において何かしらの介入指導の手順がどのくらい厳密に規定されていて,それがどれくらい標準的なものとして共有されているかというと,そこが難しいと思います。「ディクテーション」とか「英作文」とかそういうざっくりしたものは当然のこと,「間違い探しタスク」や「他己紹介」のように多くの人が内容を容易に思い浮かべることができる活動であったとしても,それをどう実施するかには多くの選択肢やバリエーションが存在しています。そして,そのバリエーションが有ることは何ら悪いことではないというか,文脈に即した活動にするためにそのバリエーションが有効に機能します。効果の測定についても,パフォーマンスで評価するにしても正確さ,流暢さ,複雑さを使って言語使用を仮に測定できたとしても,無数の指標からどれを選択するのかについて,合意形成はなされていませんし,あるタスクに固有の標準化されたルーブリックのようなものもないでしょう。これでは,仮に事例研究が多く行われていったとしてもそれを解釈するのは難しいように思います。

ただし,何をやったらどうなったのか,についての主観的な記述を蓄積していくことには意味があると思います。ある実践を行ったとき,その手順についての詳細な記述とそれを実施した教師がどういう主観的な見方をしたのか(うまくいったのか,うまくいかなかったのか),なぜそういう見方をしたのか,というようなものが蓄積されていけば,それはあとから参照する価値の高い資料になると思います。上の寺沢さんのブログでは量的な事例研究もあるので質的なものだけが事例研究だけではないと書いてあって,そこはとても大事な指摘です。量的な事例研究もありますが,教育系で理論に貢献しうる事例研究って結構難しそうだなと個人的には思っています。

おわりに

今回のシンポジウムに登壇することで,自分の考え方もより整理されたなと思います。ただ,発表自体はまだまだで,もっと伝え方を工夫しないとなかなか理解されないということも痛感しました。これは私の力不足です。意見論文をある程度の国際誌に載せるのが簡単じゃないのはよくわかっているのですが,そういうことしないと結局何も変わらないので,たくさんの人と議論を重ねながら,学界がいい方向に進んでいくといいなと思います。

なにをゆう たむらゆう。

おしまい。

注(2023年11月8日追記)

オルタナティブ・アプローチの話のところで,質問いただいた方からTwitterで補足・訂正をいただいたので追記します(直接メールももらいました)。

まず,私が質問を理解できていなかったことが原因で噛み合ったやりとりにならなかったこと,お詫び申し上げます。多分聞いてるときにバイアスがめちゃくちゃかかってしまっていたのだと思います。申し訳ございません。

さて,英語教育研究の中にオルタナティブ・アプローチがどう位置づけられるのかという話ですが,オルタナティブ・アプローチが今後何を目指していくのかによるのかなと思いました。認知的メカニズム以外の部分の言語習得のメカニズム的説明を目的としてやっていくのであれば,それはそれで意味があると思うので,やっていったらいいのではと思います。ただし,メカニズム的説明をやるのであれば,私が扱った批判というのはいわゆるオルタナティブ・アプローチの研究にも当てはまることだと思っています。

英語教育研究の中にどう位置づけられるのか,という話だと,「socialな側面を研究するスタディ」がどれだけ英語教育研究の「中で」やられているのかっていうと,ほとんどやられていないのではと個人的には思っています。英語教育学会に入っている人が,そういうところに興味があるのかっていうのもどうなんだろうなと個人的には思っています。だから意味がないということではなくて,だからこそ位置づけるって難しいなと言う話です。合意形成を得るのが難しそうなので。浦野先生が下記のツイート内で補足してくださっているように,”broad SLA research”と考えるとそこにはsocial SLAも入ってくるでしょうね。じゃあその”broad SLA research”と英語教育研究(外国語教育研究)がピッタリ重なるのかっていうとなんかそういう感じはしないな〜と個人的には思います。というのが私の個人的な理解ですね。

また,オルタナティブ・アプローチがメカニズム的説明を求めるのであれば,私の資料でいうと11枚目の浦野先生の作ったスペクトラムの中に英語教育研究を位置づけたものの中には入らないと思います。オルタナティブ・アプローチであったとしても,メカニズム的説明を求めるのであればそれは政策科学ではないからです。もしもオルタナティブ・アプローチがそうではなく意思決定の科学を目指すのであれば,あのスペクトラムの中の真ん中より右側に位置づけられるのかもしれません。

[宣伝] 言語テスト学会(JLTA)第26回全国研究大会でワークショップをやります

はじめに

言語テスト学会の第26回(2023年度)全国研究大会(9/9-10 @ 東北大学)で下記のタイトルでワークショップをやります(私のWSは10日午前です)。

Rを用いた一般化線形混合モデル(GLMM)の分析手法を身につける:言語研究分野の事例をもとに

過去の資料について

資料を準備している中で,私自身が最初にLME関係でウェブに上げた資料がslideshareにあり,それが有料版でないとダウンロードできないことに気づきました。そこで,その資料をそのままspeakerdeckにもアップロードしました。

2014年の資料なのでもう9年前になり,かなり古いですが,全く知らない人にとってはわかりやすいのかなと思います。

その後,2016年には下記のテクニカルレポートを書きました。

田村祐(2016)「外国語教育研究における二値データの分析-ロジスティック回帰を例に-」『外国語教育メディア学会中部支部外国語教育基礎研究部会2015年度報告論集』29–82. [リンク]

Rでロジスティック回帰をやる方法についてコードとともに解説したものです。このレポートをベースにしたワークショップも2019年に行いました。

田村祐(2019) 「統計ワークショップ」JACET英語語彙・英語辞書・リーディング研究会合同研究会. 早稲田大学. (2019年3月9日)[資料]

そして,2021年にはこれまでに書いたり話したりしたものよりももう少し違う視点からの講演も行いました。

今回の内容

今回のワークショップは,2019年にやったロジスティック回帰がメインですが,もう少し「泥臭く」,実際に出版された次の論文のデータを使って,下処理のところからモデリングのところまでをやる予定です。

Terai, M., Fukuta, J., & Tamura, Y. (2023). Learnability of L2 collocations and L1 influence on L2 collocational representations of Japanese learners of English. International Review of Applied Linguistics in Language Teachinghttps://doi.org/10.1515/iral-2022-0234 

この論文のデータはOSFで公開されているものですので,どなたでもアクセスできます。

Terai, M., Fukuta, J., & Tamura, Y. (2023, June 7). Learnability of L2 Collocations and L1 Influence on L2 Collocational Representations of Japanese Learners of English. https://doi.org/10.17605/OSF.IO/ZQE56

この研究の分析ではカテゴリカル変数は使っていないのですが,カテゴリカル変数も扱いたいなと思ったので,データは Terai et al. (2023)ですが,論文中に行っている分析とは異なる分析をする予定です。

当日使用する資料は下記のページにまとめています(当日ギリギリまで投影資料は微修正すると思います)。

https://github.com/tam07pb915/JLTA_2023_WS

投影資料を直接ウェブでご覧になりたい方は,下記のURLで投影資料をご覧いただけます。

https://tam07pb915.github.io/JLTA_2023_WS/

一応前半は理論編,後半は実践編となっていて,Rのコードをアウトプットに文章の解説を入れています。ごちゃごちゃして見にくいかもしれませんがご容赦ください。

今回のWSは3時間ですが,たぶんそれだけでは消化不良になると思うので,私が過去に公開している他の資料と合わせて読んでいただくと良いのではと思います。

おわりに

統計関係の話は専門家ではないのですが定期的にお声がけいただき,そのたびに勉強し(なおし)ているような気がします。

仙台までお越しになれないという方も,学会ウェブサイトにて動画が後日公開されるようですので,そちらをご覧いただければと思います。また動画が公開されましたらこのブログ記事にも追記します。

なにをゆう たむらゆう。

おしまい。

追記(2023年9月13日)

動画が公開されたようです。前後半に分かれています。

基礎研論集2015の論文に修正を加えました

むかしむかし,D2のときに,下記のテクニカルレポートを出しました。

田村祐(2016)「外国語教育研究における二値データの分析-ロジスティック回帰を例に-」『外国語教育メディア学会中部支部外国語教育基礎研究部会2015年度報告論集』29–82.

外国語教育研究って,二値データを扱うことが結構多いのにそれを全部割合だったりに変換して線形モデル使ってるけど,ロジスティック回帰したほうがよくないですか?という話を,Rのコードとサンプルデータとともに分析の流れを紹介したものです。

当時はまだまだコードとデータを共有するというのが一般的ではなく,researchmapの「資料公開」という場所にデータとコードを置いて,そのリンクをbit.lyをかませて論文中の附録としてつけて,読者が実際にコードを走らせながら分析を学べるようにしていました。とはいっても,私は統計の専門家ではないので,当時自分が学んだことをまとめたかったことと,分析の相談を受けた際に「これ読めばできます」と言って済ませたかったのでした。

最近,知り合いから,リンクが死んでるんだけど,どっかに移した?みたいな連絡を受けて,そんなはずはないけどなと思って確かめてみると,確かに論文中のリンクからはアクセスできなくなってしまいました。おそらくですが,researchmapの仕様変更でURLが変わってしまったためかと思われます。それはちょっとまずいなと思い,コードとデータをOSFに移行し,そちらのリンクを論文中に貼り付けたものを訂正版として,編集委員長にお願いして訂正版のPDFを公開してもらいました(bit.lyのリンク修正は有料でないとできなかったので断念。またOSFのほうが利便性高そうなので)。一応もとのPDFにもアクセス可能です。編集委員長様,迅速な対応ありがとうございました。

7年も前のコードで(D2が7年前という衝撃),当時学びたてだったdplyrなんかは今と書き方が異なる部分も多いので,おそらく今の環境では動かなくなってしまっているコードも結構あるのではと思いますが,それも全部書き直すだけの余裕はちょっとなかったので,それはしていません。ただ,読み直していたら表番号の参照がずれているのに気づき,それは直した上で後ろに正誤表をつけました。

何年ぶりかにファイルを開いたら,Word上での見た目がなぜか公開されているPDFファイルの見た目と異なり,ページの設定は同じはずなのに行送りが微妙にずれていたりして若干もとの論文とページ数が異なる箇所がありますが,内容は変わっていません。researchmapを見ると,コードは300件以上,論文中のサンプルスタディ1は600件以上のダウンロードがあり(この差はなんで?),LET中部のサイト上にある論文PDF自体も400件近くダウンロードされています。

おそらくですが,附録のリンクが機能せず,「なんやねん!しばくぞボケ!」ってなった方も100人くらいはいらっしゃるのではないかと思います。申し訳ありません。データとコードは私のresearchmapの「資料公開」にあります。また,OSFは以下のURLです(余談ですが,researchmapはURLに日本語が含まれているのでそれまじでやめてほしい)。

https://doi.org/10.17605/OSF.IO/2FS9B

別に引用はされないですけれども(そもそもこの論文が引用されていても通知も来ないしわからないと思います),今でも閲覧しようと思う人(まあ知り合いなんですが)がいるというのは,あのとき頑張ってよかったなぁとなんとなく思います。時間があったからできたことではあるのですけれど。

最近はRT(not retweet but reaction time)使う分析しかしていないので,ロジスティック回帰はやっていませんが(…とまで書いて,共著でロジスティック回帰使っている研究が先日リジェクトされたことを思い出したんですが),この論文のRコードのアップデートはなかなか難しそうなので,ロジスティック回帰やってる論文が出たらそのときはおそらくRのコードとデータも当然公開すると思いますので,そちらでご勘弁ください。

余談

LET中部支部は新しいウェブサイト(https://letchubu.org/)が動いているので,いずれ今の基礎研論集のページのURLも変わったりするのかなと思いつつ,これ全部移行するの業務委託とかじゃなく誰かがやるのだとしたら100万くらいもらっていいのではと思ったり(LET関西支部もウェブサイト再構築検討中ですが委託です)。

なにをゆう たむらゆう。

おしまい。

最近出た論文

2022年度にいくつか論文が出たので,ちょっとした宣伝です。

International Review of Applied Linguistics in Language Teachingの論文

この論文は最近といっても実際には春頃に出版されたものです。 概要は自分のウェブサイトに書いたのでそちらを引用します。

L2英語学習者が英語母語話者のように効率性を重視した数の一致処理を行っているかどうかについてを検討した論文で,Tamura et al. (2021)の追研究の位置づけです。Tamura et al. (2021)では,L2英語学習者は母語話者と違って,there | is/are | a | cat | and | とandを読んだ際に,複数一致の文(e.g., there are a cat and….)の読みが早くなる傾向が見られることを明らかにしました。そして,それは”A and B”のような等位接続名詞句は常に複数であるという明示的な知識の影響である可能性を指摘しました。今回は1つ目の実験で,there is/are |a cat and a dog| behind the sofa.のようにフレーズ単位での自己ペース読み課題を行い,単語単位の呈示ではなくフレーズ全体として等位接続名詞句をどう処理しているかを調査しました。結果として,やはりL2学習者は複数の読みが早くなることが明らかになり,there構文内の等位接続詞を複数として処理していることがわかりました。2つ目の実験ではTamura et al. (2021)同様に再度単語単位呈示での自己ペース読み課題を行いました。Tamura et al. (2021)では呈示順の影響が考慮されていなかったためです。例えば,andの後ろも名詞句が後続するとは限りません(e.g., there is a pen and it is broken)し,理論的にも,数の一致を再解釈する可能性があるとすれば2つ目の名詞句を処理した際であると仮定されています。したがって,Tamura et al. (2021)でandの時点で複数の読みが早くなった原因は,実験中にthere構文内に等位接続名詞句が生起する刺激文に晒されたことで複数一致の読みを予測するようになったからかもしれないからです。2つ目の実験の結果,there | is/are | a | catの段階では複数一致で遅れがみられ,直近の一致は単数で行う効率優先の処理が行われている可能性が示唆されました。ところが,この影響は実験が進むにつれて薄れていき,逆に実験が進むにつれて2つ目の名詞の領域で複数読み条件の読解時間が早くなる傾向があることが明らかになりました。これらの結果から,直近の動詞と名詞で数の一致を完結させる効率駆動型処理はL2英語学習者にも利用可能であることが示唆されました。しかしながら,2つ目の名詞句で一致を再解釈し直す現象はL2英語学習者に特有の現象であり,この原因として実験中に等位接続名詞句が埋め込まれたthere構文のインプットを受けることによって学習者の持つ等位接続名詞句は常に複数であるという明示的な知識が活性化され,それが言語処理に影響している可能性を指摘しました。

https://tamurayu.wordpress.com/2022/04/05/tamura-et-al-2022/

この論文は,もともと明示的知識・暗示的知識の枠組みで行っていた研究でしたが,研究を進めていくにしたがってそのフレームワークを使うよりも,第二言語の文処理研究として論文にするほうが話がスッキリすると考え直し,ほぼすべて書き直しました。第一言語話者と異なり,第二言語話者が持つ知識が文処理中にユニークな形で用いられているのではないかということを示唆したというところが面白いポイントかなと思っています。

オープンアクセスにはなっていませんが,著者原稿は上記の概要のページからダウンロードできますのでご興味がおありのかたはどうぞ。また,英語ですが,論文をできるだけ専門用語を使わずに説明したOASIS Summaryがありますので,そちらもお読みいただければと思います。

Journal of Psycholinguistic Researchの論文

この論文はつい最近出た論文で,私の博士論文研究の後続研究的な位置づけです(その博士論文の実験の研究はまだ査読中で,こっちが先に出ることになってしまったのですが…)。

関西大学に着任して,若手研究者育成研究費という学内研究費をいただいたので,それで行った研究です。関西大学に来てから始めたもので,また単著は久しぶりでした。内容としては,名詞の有生性階層というものを参照し,日本語と英語で名詞の複数形の許容される部分が異なるという点に着目してその複数形の習得について調査した研究です。

日本語には「たち」や「ら」といった複数形の標識がありますが,これらは主に有生名詞に付与するという特徴があり,無生名詞につく例はあまり多くありません(実際に日本語のコーパスを見てみると用例がないわけではありませんが非常に限定的です)。一方で,英語は有生名詞でも無生名詞でも複数形形態素が付与します。そこで,無生名詞の複数形の処理は有生名詞の複数形の処理よりも難しいのではないかという予測を立てました。この予測は,私の博士論文研究の結果の考察に一部依拠しています。

この研究で行った実験は,第二言語習得研究ではほとんど用いられていない特殊なものでした。参加者は,画面に表示された単語が1語が2語かをすばやく判断することが求められるというものです。母語話者を対象とした先行研究では複数形名詞を1語と判断するほうが,単数形名詞を1語と判断するよりも遅れることが明らかになっています。これは,複数形に付与される意味が1語という語数の判断に干渉するためだという解釈です。いわゆるストループ効果です。伝統的なストループ課題では,参加者は書かれている文字の色を答えるように指示されます。実験では,色を表す文字がその文字が示す色と異なる色で提示されたりします。

,のような感じですね。このように提示されると,のように,文字の色と文字が表す色が一致している場合よりも反応が遅れたり,あるいは判断を間違えてしまったりするというのがストループ効果の代表例です。これを数に応用したのが語数判断課題ということになります。

結果はどうだったかというと,有生名詞でも無生名詞でも複数形の判断は単数形の判断よりも遅れるという結果になりました。つまり,有生性は関係なかったということです(ズッコケ)。ちなみに,有生性の影響が見られなかったことについては,上述のように日本語でも無生名詞に複数形を表す「たち」や「ら」などが用いられるケースがあることに言及しています。

ただし,それはつまり複数形名詞が持つ意味を,言語処理中に第二言語学習者が用いている可能性が高いということでもありますので,少なくとも複数形の形態素を無視して単数形と同じように処理しているという可能性はないだろうということは言えるかなと思っています。数の一致処理は第二言語学習者にとって難しいとされていますが,その原因が複数形形態素の処理である可能性が低いのではないかということも論文の中では議論しています。ただし,今回の実験参加者に対して数の一致処理が求められる課題は行っていませんので,あくまで推測です。

ちょっとした裏話

実は,このJournal of Psycholinguistic Researchに載った論文は,国内の学会紀要で不採択となったものです。国内の査読のほうが厳しいのだなと勉強になりました。院生時代に,「落ちたら国際誌」というブログ記事を書いたことがあり,まさか自分がそういうことをする日がくるとは当時は思っていませんでした。普通,まずはチャレンジとして国際誌に論文を投稿し,不採択であったら,国際誌よりも通りやすいであろうとおそらく多くの人が思うであろう国内の学会紀要に出すと思います。その逆(国内落ちたら国際誌)は私の敬愛する福田パイセンくらいしか例を知りません(経験者の方いたらQuerie.meで教えて下さい)。ちなみに,私がブログ記事を書くきっかけになったのはある後輩の発言なのですが,その時は普通に国内誌に通ったので結果として「落ちたら国際誌」にはなりませんでした。

査読で不採択となるというのはそれ相応の理由があり,今回のケースも通らなかったことについては自分自身でも納得しています。査読のプロセスでいただいたコメントを元に加筆した部分も多くありますが,決定的な理由を改善する事はできなかったのでそこについては「ママ」で再投稿しました。Journal of Psycholinguistic Researchはそんなに査読が厳しくないので,それで通ってしまったという感じです。個人的にも,この論文がそこまで面白いとも自信があるとも思っていないですが(そういうのは一生かかっても書けないと思っています),とりあえず,出版されたこと自体についてはホッとしています。2019年にとった研究費の研究で,「成果」を必ず出さなければならず,論文がなかなか出ずに事務の方に毎年催促されていたので…。

この論文もオープンアクセスにはしていませんが,Springerはオンライン上であれば無料で論文が読めるシステムになっていますので,ダウンロードはできませんが,完成版の原稿は以下のURLから無料で読むことができます。

https://rdcu.be/cYGjZ

採択後の校正からオンライン公開までのプロセスがめちゃくちゃ早くてびっくりしたのですが,Journal of Psycholinguistic Researchの論文はしょっちゅうCorrectionが出ているイメージなので,ちょっと不安もありつつ,ツイッターで共有してくださっている方も何人かいらっしゃってありがたい気持ちです。

おわりに

私が第一著者ではないですが,私の敬愛する福田パイセン(2回目)が第一著者の論文も3月に出ました。

こちらはオープンアクセスになっていますので,どなたでも無料でお読みいただけます。Journal of Second Language Studiesは割と新しいジャーナルですが,このジャーナルで現在の”Most Read This Month”の論文となっています。個人的にはこれはめちゃくちゃ尖っていて多くの人に読まれてほしいやつですので,上の2つの論文よりはこちらをお読みください(余談ですが偶然にも”Most Cited”は私と福田パイセンの博士課程時代の指導教官である山下先生の論文です)。

なにをゆう たむらゆう。

おしまい。

[R] 1列だけの選択ならselect関数よりpull関数を使う

はじめに

dplyr使いの方で,select関数を使って特定の1列に対して何かしらの処理をするということをしたいときにエラーが出る人はpull関数を使いましょうという話です。ちなみに,$使えば問題は解決です。今回は,それ以外の方法で,というお話。

具体的になにをしようとしたか

私がどんな処理をしようとしたかについて少し触れておきます。ここはスキップしてもらっても構いません。

ある列の単語(1単語または2単語の英単語が入っている)の文字数をカウントするということをやろうとしていました。ピリオドが含まれていたり(e.g., “dogs.”),2語の場合は間に空白もあるので(e.g., “beautiful lake”,それらを除去して文字数を数える必要があります。そのためには,str_extract,str_replace, str_lengthなどの文字列処理関数を使う必要があります。しかし,これらの関数はベクトルを受け取って処理をするので,データフレームを渡してもエラーが出てしまうという問題に直面しました。

select関数の挙動

データフレームからある特定の列を引っ張ってくるというとき,もちろん$を使って,dat$wordのようにするのが一番簡単なのでそれでもいいのですけども,dplyr使いの方はselect関数を使っている方も多いのではと思います。ただし,select関数はデータフレームの中から特定の列を引っ張ってくると,それがたとえ1列であってもdata.frame型になります。

よって,処理に使う関数がベクトル型を要求するものだとエラーが発生することになるわけです。しかもやっかいなのは,「じゃあas.vector()関数」を噛ませればいいやんとやってみてもそれでは解決しないからです。理由はよくわかりません。

  dat %>% 
  select(word) %>% #wordという列に文字数カウントしたい文字列があるとする
  as.vector() %>%
  is.vector() #このコードではFALSEとなります

pull関数がすること

pull関数は,要するにdat$x1のように$を使って,またはdat[, x1]のように[,]を使ってデータフレームの中の特定の列を指定するのと同じ挙動をするということです(参考)。よって,pull関数の出力はベクトル型になります。

  dat %>% 
  pull(word) %>%
  is.vector() #このコードではTRUEとなります

というわけで,1列だけ持ってくるときに関数を使う場合はpull()関数を使いましょうというのが結論です。私は結局こういう感じで文字数カウントをしました。

  dat %>% 
  pull(word) %>%
  str_extract(.,"[^\\.]+") %>% #ピリオドを除去
  str_replace(.,pattern = "\\s",replacement = "") %>% #半角スペースを除去
  str_length()->rt_dat$length #文字数をカウント

$を使うと次のようになります。

  str_extract(dat$word,"[^\\.]+") %>% #ピリオドを除去
  str_replace(.,pattern = "\\s",replacement = "") %>% #半角スペースを除去
  str_length()-> dat$length #文字数をカウントしてlengthという列に入れる

$を使ったほうが行数が少なくなるので,そっちのほうがいいような気もしますが,工程の見やすさでいうとpull関数を使うほうが上かなという感じがします。

おわりに

もともと文字数はカウントしてあったのですが,ちょっと査読者の指摘でフィラー項目も入れて分析をやり直さないといけなくなってこういった処理が必要になりました。データ型って基本といえば基本なのですが,以外に気づかずにエラーで困ることもあるので,select関数の挙動について勉強になるいい機会でした。

ということで,pull関数とselect関数,場合によって使い分けましょう。

なにをゆう たむらゆう。

おしまい。

「業績的価値」が低く見積もられる論文を書く意味

はじめに

水曜の会議で,研究科の紀要への投稿が少ないみたいな話題が出ていました。私は(研究科の担当をしていないため)厳密には研究科委員会の構成員ではないのですが,慣例で学部教授会構成員は出るような感じなので大学院はこういう感じなのだなぁといつも思いながら話を聞いています。この話題に関しては思うところがちょっとあったので,Twitterに書いたことも含めて再構成してまとめておこうと思います。ちなみに,分野横断的に通じる話ではないと思いますので,私が所属しているのは外国語学部(そしてその上にあるのは外国語教育学研究科)であるということを念頭に以下をお読みください。

「業績的価値」

一応カッコ書きにしました。研究の価値を決めるための代理指標としては一定程度論文が掲載される媒体というのが機能している部分は否めないと思います。そして,そのことを研究者(または研究組織)の業績評価に使用している部分もあると思います。査読システム自体を全否定するほどラディカルな意見は私は持っていません。ただし,現状の査読システムは問題も多いとは思っています。今回はその話はしません。あくまで現状として,査読があるかないか,紀要であれば地方レベルか全国レベルか,国内誌か国際誌か,国際誌でいえばSJRはどれくらいかというような,それなりに研究者が持っていそうな(あるいは表立ってはいないけれども組織内で数値的に優劣がつけられていそうな)「業績的価値」が低いと考えられているような媒体へ投稿することにはどんな意味があるだろうか,そこに院生が投稿しようと思えるにはどうしたらいいのか,そういうことを書きます。

そもそも研究科の紀要とはどういったものか

ウェブで公開されている情報が少ないですが,編集規定は以下のようになっています

ポイントとしては,

  • 学生主体で刊行(院生協議会の会員は在籍院生に限られるという規約があります)
  • 研究科に在籍している院生しか投稿できない(費用が院生の学費から捻出されているという理由で修了生の投稿が認められなくなったらしいです)
  • 原稿のタイプは論文だけに限らず割と幅広い(実践報告や書評もある)
  • オンラインで公開されていない

あたりでしょうか。「5. 論文の掲載」の記述がややこしいですね。査読があるとは書いてありませんが,「掲載を許可される」というのは,拒否されることもあるというようにも読めます。ただし,院生の研究成果を報告する様式では「その他紀要等(査読なし)」のカテゴリに「【『千里への道』を含む】」とあります。したがって,無査読という扱いになっているのは間違いないでしょう。

院生にとってのメリット

さて,投稿する院生にとってどういうメリットがあるのかなと考えてみます。まず,論文を書いて出版するということの(私が考える)最も大きな動機は自分の研究を多くの人に届けたい(そしてそのことによって研究者コミュニティやもっと広く社会に貢献したい)ということがあると思います。そう考えると,インターネット上で公開されているかどうかというのは非常に大きな要素になります。学内紀要のようなものであっても,大学の学術レポジトリに登録されていればインターネットに接続した世界中の人たちがアクセスできるわけですから,たとえその「業績的価値」が低く見積もられたとしてもそこに投稿するメリットはあると言えるはずです。なんなら学部生とかに論文を探してこさせるとその多くは学内紀要みたいなものだったりすることもしばしばあります。そういうところに掲載されたものは読者側に価値判断をする力がないといけないことが多く,その判断力に乏しい学生が内容を鵜呑みにしてしまうと良くないという問題がありますが,これは今回の記事の内容からずれるので深堀りしません。

院生忙しい問題

これは特にうちの研究科に特有の問題である気もしますが,院生からすると「そんなとこに書いてる暇ない」というのがありそうな気がしています。フルタイム院生の数があまり多くないので,例えば私が名古屋大学大学院に所属していたときのように常時フルタイム院生が一定数いて,なおかつ毎日研究室に来るほど熱心な院生が多かった(ちなみに研究室に行くことを私の半径数メートル以内では「出勤」と言っていました)環境とは訳が違います。そういった環境なら,就活に求められる業績を目指しつつも,そのレベルではないなという論文を出す先としては無査読の媒体があればそこに出す選択を取れる院生もいました。また,フルタイムだからこそ,「なんか書いて出して」って言われたら書いて出せるくらいの余裕はありました。そして,それが『基礎研報告論集』であったわけです。

基礎研論集の話

名古屋大学大学院の学生の多くは外国語教育メディア学会中部支部に所属していました。私がちょうど入学する前くらいの当時の院生を中心に,その支部学会の研究部会として,「外国語教育基礎研究部会」というものが発足しました。部会の活動の一環として,毎年報告論集を発行しています。この報告論集は学会の所属とはまったく関係なく投稿を受け付けているので(というか部会の活動自体が学会員限定になっていないはず。昔の例会の発表は除く),過去の論集を見ると「え!この人が!」みたいなのがあったりします(2014年度報告論集)。とはいえ,投稿者の多くは名古屋大学大学院の学生が占めてきていたと思います。私も過去に部会長をやっていましたし,投稿の経験があります。過去に「キソケンとはなんだったか」という記事でこの組織がどういうものだったかというのを振り返って書いたりしているので気になる方はそちらをお読みいただくとして,論集に関してはこう書いていました。少し長いですが引用です。

…報告論集についても,「書きたいことを書いて載せられた」という点で自分にとっては良かったです。私は2014年度から2016年度まで,つまり私が博士後期課程に在籍している間は毎年1本を報告論集に投稿していました。キソケンの報告論集は査読なし扱いなので,査読なしだから出しても意味がないというように思う人もいるかもしれません。それはそれで有りだと思います。ただ,私にとってはだからこそ,「書いて残しておきたいもの」ではあるけれども「ジャーナル論文にするような性格のものではないようなもの」を書いて出すのにちょうどよい場所でした(そういうアイデアが当時割とあったとも言えます)。例えば,2014年度には「実験研究の過程と手法のよりよい理解のためにーマイクロリサーチ体験という試みー」と題した論文を出しました。これは,2014年度に静岡で行った学生向けのワークショップについてまとめたものです。マイクロリサーチ体験というのは,事前テスト-処遇-事後テスト-分析-結果-議論といった一連の流れをその場で実演し,研究の進め方についての理解を深めるというものでした。これは,キソケンのメンバーで行ったWSであったので基礎研論集に出したということもありますが,例えばどこかの学会誌に出そうとしたとしてもどの枠で出せばいいのかわかりません。ただ,どうしてもやって終わりではなく文章として形にしておきたかったのです。

2015年度は,「外国語教育研究における二値データの分析ーロジスティック回帰を例にー」というテクニカルレポートを書きました。これは,当時自分で勉強していたことをまとめたかったことと,Rのコードとともに残すことで自分の後輩にも読んでもらいたかったという意図がありました。院生時代にもデータ分析に関する相談を受けることは多く,その際に一般化線形モデルや一般化線形混合モデルを使ったらどうでしょうということがしばしばありました。そのときに,もちろんそれに関する書籍を紹介することもできましたし,グーグル検索すればロジスティック回帰に関する記事はたくさん見つけることができます。ただ,外国語教育研究の例で,Rのコードとともに,ということになるとなかなか例がありませんでした。そこで,「この論文がウェブで無料で公開されていますので読んでください」と言いたかったということです。これも,もちろんmethodological reviewというような形でジャーナルに投稿することもできたかもしれません。私にはその力はなかったというのもありますが,そこにリソースを割くよりも手っ取り早くpublishしたかったというのもあります。

2016年度は査読付き雑誌に2回落ちた論文を横流しする形で出したので,それまでのものとはやや性格は異なります。ただ,これも「教育実践について形になった論文をとにかく出したかった」ということと,同じような研究をやっている方々に読んでもらうためにオープンにウェブで公開したかったということが理由です。実際,自分も関わったプロジェクトに関する論文で引用したりもしました。草薙さんと共著で書いた「外国語教育研究における事後分析の危険性」という論文も,読まれる価値はあるけれども,学会誌等の投稿規定にはそぐわないだろうということがあって基礎研論集に書きました。

キソケンとはなんだったか

院生の業績ハードルもあがってる(下がってる?)

これは私たち(mid 30世代。いいですか私達がもうmid 30ですよ)世代よりも下の世代で顕著になってきているのかなと思います。海外の大学院でPh.Dをやっていて,院生時代から国際ジャーナルにどんどん論文を出している世代と同世代の国内の院生は結構プレッシャーに感じているところもあったりするんじゃないかなと思っています。昔(私が大学院生の頃とかそれより前も多分)なら院生で国内全国誌に通っていればとりあえずはまあ院生としてはいい方だという認識もあったように思います。ただ,今では院生でも国際雑誌に投稿するのは何も珍しくないことになってきているように思います(私も投稿自体は院生時代に何回かした経験があります)。そうなると,それが「当たり前」のような雰囲気になっているところがあるような気がします。ある意味では,国際誌投稿のハードルが下がっていると捉えることもできるとは思いますが,自分が院生時代にその環境だったらどうだっただろうと思うと,きついよねぇと思います。御存知の通り,どこに投稿するにせよ国際雑誌投稿は出版までにかかる査読のプロセスにかかる労力がすごいです。最近はOpen Data, Open Materialとか事前登録とか国際雑誌の基準自体もあがっていますから,そこに出そうと思ったら査読なしのところに出している余裕なんかあるかいなとなりますよね。

また,もしそこに出せなかったとしても,査読付きの国内誌や地方学会紀要に出すという判断も当然理解できます。特に,うちの研究科では博士号の審査にかかるときに「いいとこ」に載っていることが推奨されるので,査読なしの論文に手をかける暇なんてないでしょうね。私の記憶が正しければ,私が名古屋大学大学院国際開発研究科で博士号をとったときはそもそも博士論文の内容が査読付き雑誌に載った論文の内容に基づいていることすら要件ではなかったと思います。査読付き雑誌に2本?だったか論文が掲載されたことがあるというのは要件だったと思いますが。このことは私が着任した1年目か2年目に研究科委員会でも話題になったように記憶しています。要するに,「いいとこ」に載っている論文の内容がベースなら博士論文の質も担保されるでしょうというようなロジック。それ自体は私も十分理解できます。

それに加えて,上述のようにそもそもフルタイムの院生が少なく,博士号取得にかかる期間も長い人が多いわけですから,より一層とにかく学位取得に全エフォートを注ぎ込まないといけないという状況になっているのだと思います。そういう環境に身を置いていたら,そりゃあ査読なしで公開もされない学内紀要に投稿なんてしないという判断を責められないですよね。だってその仕組みをつくっているのは教員なんですから。

先輩・後輩の縦横つながり問題

また,そういう院生が自分の学位論文取得に注力せざるを得ない状況というのはもう一つ,縦の関係の意味でもあんまりよくないんだろうなと思います。院生時に論文を出版できるかどうかは,教員の引き上げかもしくは院生同士の切磋琢磨,この2つの要因が大きいのではと個人的に思っています。この中で後者の部分においては,(院生指導していないので実態はよくわかっていないですが),少なくとも自分が経験した大学院生活とはずいぶん違う環境なんだろうなとは思っています。フルタイムの院生が少ないと,そもそも院生同士のつながりがそこまで強固に形成されにくいんだと思います。私がいた名古屋にいた頃は「全寮制なんでしょ?」といじられるほどに縦横のつながりが外部からも認識されていたわけですが,おそらくうちの研究科にはそういうものはなさそうです。そうなると,先輩が後輩の面倒を見て論文の出版を後押しするみたいなことや,院生同士で「なんかネタない?」とか,「あれちょっと書いてまとめとこうや」みたいなことにもなりづらいんだと思います。

大学院を担当される先生方は授業担当という意味でも,学内のその他の業務担当という意味でも私のような若手(学内だと次の公募で私より下の方が来なかったらまだ私が当分は最若手では…?)よりも業務量が多いです。となると,そういう先生たちも学位論文指導以外の面で院生の研究をサポートするところまでできるというようにはあまり思えません(繰り返しますが実際に先生方がどうなさっているかは知りません)。また,教員側からしても投稿するメリットを学生になかなかアピールしづらかったり,そもそもそれを言いづらい(学位論文に注力してもらわないと困るわけなので)という現状もあると思います。

そもそも査読なし媒体自体の価値が見出しづらい?

メソ研論集も一時期すごい活気があったように思いますが,あれも投稿が集まりづらいのは時代なのかなぁと思ったりもします。もちろん,10年前くらいに今の私たちくらいの年齢でイケイケだった人たちが今や学内組織や学会組織を回す側になり,研究以外の業務で忙しくなってしまったので余裕がなくなってしまったというのもあるでしょう。メソ研論集や基礎研論集はそれでもインターネット上でオープンに公開されていますから,それでもなかなか集まらないとなったらインターネット上でも公開されていないものに投稿が集まらないなんて当然では?と思います。なんのために発行しているの?という媒体そのものの価値を見直さない限りは投稿も増えることは見込めないでしょう。私としては,上で自分の過去記事を引用したような部分が査読なし媒体の存在価値だと思っていますので,利用する機会がなくなったりはしないかなと思います。

ただし,やっぱり広く読まれるのは国際誌だと思っていて,例えば全国英語教育学会紀要(ARELE)に載ってもたいして引用されないですよね。自分のやった研究が学術コミュニティの議論に貢献しているのかなと思うので,よほど理由がなければ(あるいは国際誌に出すほどではないかぁという質のものでなければ)国際誌を基本的には目指してやるだろうなぁと思います。先日届いたARELEの編集後記に投稿数が減っているみたいなことが書いてありましたが,昔ならARELEに出していたようなものを国際誌に投稿するようになっているんだと思います。コロナで研究活動が滞っているということも原因としてなくはないでしょうが,今後も国内の紀要は全国誌・地方誌,査読ありなしに関わらず存在意義を突きつけられていくのではないでしょうか。

公開はまずい的議論

査読なしで公開することに関して,「やばいのが公開されたらやばい」というロジックで公開に後ろ向きな人がいるのだろうなぁとか,そういう議論がされてきたこともあるだろうなぁということは想像できます。つまり,公開しないのは質が低いから,みたいな話です。一理あるとは思いますが,別に査読がないからといって著者以外の誰も原稿に目を通さずに公開に至ることはないわけですし(「専門家の講評」があると編集規定に書かれていますし),教員や院生同士で投稿前の原稿をそれなりのレベルに引き上げるプロセスをすればいいだけでは?と個人的には思います。教員側にその余裕がないのであれば,院生同士が自主的に切磋琢磨しあえる環境を作るようにしていけばいいですし,それも難しいのであれば院生限定でしか投稿できない媒体を維持すること自体が難しいという結論になると思います。

さらに身もふたもないことを言えば,公開されたからといってそんなにたくさん「読まれない」とも思います。有名な研究者の書いたものならまだしもどこの者ともしれぬ院生が出した論文であれば,データベースに載ったりしない限りは研究者の目に引っかかることもあまりないでしょう。研究者の目に引っかからないということはつまり,厳しい目で読まれることもないわけですから,「こんなやべえ論文出してる組織やべえな」ってなることもあまりないように思います。多くの場合は,へーこんな研究やってる院生がいるのねーとか,ここの院生は頑張ってるねーくらいの感じで目次やアブストを眺めるくらいなんじゃないでしょうか。基礎研論集だってちゃんとダウンロードして中身読んだらこれ大丈夫か?みたいなのも見たことありますよ。それでどういう評判になっているかは私のところに聞こえてくることはないですけれども。

それに,審査のプロセスがあった上で「やばい」のがあったら審査した側の責任も問われるべきだと思いますが,無査読であれば(よほど倫理的にやばいみたいなのを覗いて)研究の質が低い・論文の質が低い,みたいなものの責任を負うのは執筆者自身でしょう(編集規定にも「応募論文に関する一切の責任は執筆者が負う」とあります)」。そのことで組織の評判が落ちることを気にするのであれば,やっぱり教員が介入するなり院生同士のネットワークを強化するなりして,院生の投稿を支援する仕組みづくりが欠かせないはずです。あとは,大学院の授業のタームペーパーとして論文のベースになりそうなものを求める授業があるかどうかということも院生の投稿を促すことにつながると思います。実際,名大ではそういうケースでMの院生がタームペーパーをもとに論文化することがありましたし,それは今でもおそらくそうなっていると思います。

おわりに

一言でまとめると,院生が「出してみようかな」と思える環境にそもそもなっていないというか,それを後押しする要素が欠けているということに尽きるのではないかと思います。よって,査読なしであっても院生が投稿しようと思うような媒体にすること(ウェブ公開)と,組織としてそれを支援する仕組みを作ること(教員のサポート&院生同士の切磋琢磨)が取り組むべき課題かなというのが私の結論です。

なにをゆう たむらゆう。

おしまい。

[R] 初心者向け pivot_longer関数で縦型変換

はじめに

以前(というかかなり昔),tidyrやdplyrについての記事を書きました。

どちらの記事を書いたときからもだいぶ月日が経っていて,dplyrのアップデート等もあって色々とやり方が変わっているのですが,自分自身が研究で分析をする際にアップデートしていたことをブログ記事には反映させられていないので,上の2本の記事のアップデート版のようなことを書いておこうと思います。

まずはサンプルデータ

#事前・事後・遅延事後でCAFのデータを取ってるというデザイン
pre.fluency <-rnorm(50,mean=10,sd=2)
pre.accuracy<-rnorm(50,mean=7,sd=2)
pre.complexity<-rnorm(50,mean=4,sd=2)
post.fluency<-rnorm(50,mean=14,sd=4)
post.accuracy<-rnorm(50,mean=10,sd=3)
post.complexity<-rnorm(50,mean=7,sd=2)
delayed.fluency<-rnorm(50,mean=12,sd=2)
delayed.accuracy<-rnorm(50,mean=8,sd=1)
delayed.complexity<-rnorm(50,mean=6,sd=1)

#それぞれの列を横にくっつける
dat<-cbind(pre.fluency,pre.accuracy,pre.complexity,post.fluency,post.accuracy,post.complexity,delayed.fluency,delayed.accuracy,delayed.complexity)
dat<-as.data.frame(dat) #データフレーム型に変換
dat$subject<-rep(1:50) #実験参与者のID列をつける

とりあえずこんな感じでいまデータを持ってるとする

head(dat)
##   pre.fluency pre.accuracy pre.complexity post.fluency post.accuracy
## 1    9.344978     3.921626      4.5778491    13.932376      2.241629
## 2    9.126920     7.307178      3.2309289    13.624622     12.813440
## 3   13.433524     6.048270      5.0082008     7.932601     11.832851
## 4   11.937755     5.859142      0.6414096    11.289177      7.009059
## 5    7.913083     5.748651      2.6099159    17.933721     10.765706
## 6    8.683515     4.363661      5.4608116    16.550468     16.483160
##   post.complexity delayed.fluency delayed.accuracy delayed.complexity subject
## 1        9.381369       10.628923         6.929672           7.923673       1
## 2        4.485729       14.456886         9.048825           5.306266       2
## 3        7.534226       13.031400         7.144670           7.781451       3
## 4        8.076248       12.390157         9.247418           6.244443       4
## 5        8.702016        9.604130         7.530200           5.927892       5
## 6        8.973912        8.060271         8.188526           6.458383       6

縦横変換

昔の縦横変換は,gatherでやっていました。現在は,pivot_関数を使います。その名の通り,縦長(long型)にするのがpivot_longer関数で,横長にするのがpivot_wider関数です。

library(dplyr)
dat %>%
  tidyr::pivot_longer(cols = 1:9)
## # A tibble: 450 × 3
##    subject name               value
##      <int> <chr>              <dbl>
##  1       1 pre.fluency         9.34
##  2       1 pre.accuracy        3.92
##  3       1 pre.complexity      4.58
##  4       1 post.fluency       13.9 
##  5       1 post.accuracy       2.24
##  6       1 post.complexity     9.38
##  7       1 delayed.fluency    10.6 
##  8       1 delayed.accuracy    6.93
##  9       1 delayed.complexity  7.92
## 10       2 pre.fluency         9.13
## # … with 440 more rows

colsのところでどの列をまとめるかという指定をします。ここの指定は,上のやり方だと数字で列指定(1列目から9列目)としています。この部分はc()関数を使って文字列で指定してもいいですし,列指定のときに使えるstarts_with()やcontains() なんかもできます。例えば,まあこれはあくまで偶然そうなだけですけど,ここではまとめたい1列目から9列目はすべて”y”で終わっているので,以下のようにすることもできます。

dat %>% 
  tidyr::pivot_longer(cols = ends_with("y"))
## # A tibble: 450 × 3
##    subject name               value
##      <int> <chr>              <dbl>
##  1       1 pre.fluency         9.34
##  2       1 pre.accuracy        3.92
##  3       1 pre.complexity      4.58
##  4       1 post.fluency       13.9 
##  5       1 post.accuracy       2.24
##  6       1 post.complexity     9.38
##  7       1 delayed.fluency    10.6 
##  8       1 delayed.accuracy    6.93
##  9       1 delayed.complexity  7.92
## 10       2 pre.fluency         9.13
## # … with 440 more rows

また,まとめたくない列を”!“で指定することもできるので,今回のようにまとめないでほしい列が少ないという場合については,次のようにも出来ます。

dat %>% 
  tidyr::pivot_longer(!subject)
## # A tibble: 450 × 3
##    subject name               value
##      <int> <chr>              <dbl>
##  1       1 pre.fluency         9.34
##  2       1 pre.accuracy        3.92
##  3       1 pre.complexity      4.58
##  4       1 post.fluency       13.9 
##  5       1 post.accuracy       2.24
##  6       1 post.complexity     9.38
##  7       1 delayed.fluency    10.6 
##  8       1 delayed.accuracy    6.93
##  9       1 delayed.complexity  7.92
## 10       2 pre.fluency         9.13
## # … with 440 more rows

「まとめる」という感覚がいまいちよくわからないなぁとか,どの列を「まとめ」て,どの列は「まとめ」なくていいのかというのがピンと来ない場合には,次のように考えてください。

分析の際に従属変数(応答変数)となる列をまとめる

さて,今の段階ではまとめた際の列名が”name”になっていて,数値の部分が”value”という列名になっていますよね。ここも次のように指定できます。

dat %>% 
  tidyr::pivot_longer(!subject, names_to = "variable", values_to = "score")
## # A tibble: 450 × 3
##    subject variable           score
##      <int> <chr>              <dbl>
##  1       1 pre.fluency         9.34
##  2       1 pre.accuracy        3.92
##  3       1 pre.complexity      4.58
##  4       1 post.fluency       13.9 
##  5       1 post.accuracy       2.24
##  6       1 post.complexity     9.38
##  7       1 delayed.fluency    10.6 
##  8       1 delayed.accuracy    6.93
##  9       1 delayed.complexity  7.92
## 10       2 pre.fluency         9.13
## # … with 440 more rows

ただ,今回のケースではまとめた列に”pre”, “post”, “delayed”というテスト実施時期(test)という要因と,“complexity”, “accuracy”, “fluency”という測定値の要因が混在していますね。よって,あまり”name”の列名を変えることは意味がありません。むしろ,この列を分割してそれぞれの列に名前をつける必要があります。この列分割をseparate関数で行うという点は私が以前ブログ記事を書いた際と同じです。というわけで,次のようにします。

dat %>% 
  tidyr::pivot_longer(!subject) %>% 
  tidyr::separate(name, c("test","measure"), sep = "\\.")
## # A tibble: 450 × 4
##    subject test    measure    value
##      <int> <chr>   <chr>      <dbl>
##  1       1 pre     fluency     9.34
##  2       1 pre     accuracy    3.92
##  3       1 pre     complexity  4.58
##  4       1 post    fluency    13.9 
##  5       1 post    accuracy    2.24
##  6       1 post    complexity  9.38
##  7       1 delayed fluency    10.6 
##  8       1 delayed accuracy    6.93
##  9       1 delayed complexity  7.92
## 10       2 pre     fluency     9.13
## # … with 440 more rows

これで,完璧ですね。と思いきや…!実はpivot_関数には”name_sep”という便利な引数があります。これはどういう時に使うかと言うと,まとめた際に一つの列に複数の要因が混在してしまうときに,それを指定した区切り文字によって分割するために使います。まさに上で起こった問題ですよね。テスト実施時期と測定値が一緒の列になっていたのをseparate関数で分割したわけですが,なんとseparateを使わなくても縦型に変換する段階で分割までできてしまいます。

dat %>% 
  tidyr::pivot_longer(!subject, names_to = c("test", "measure"), names_sep = "\\.", values_to = "score")
## # A tibble: 450 × 4
##    subject test    measure    score
##      <int> <chr>   <chr>      <dbl>
##  1       1 pre     fluency     9.34
##  2       1 pre     accuracy    3.92
##  3       1 pre     complexity  4.58
##  4       1 post    fluency    13.9 
##  5       1 post    accuracy    2.24
##  6       1 post    complexity  9.38
##  7       1 delayed fluency    10.6 
##  8       1 delayed accuracy    6.93
##  9       1 delayed complexity  7.92
## 10       2 pre     fluency     9.13
## # … with 440 more rows

このときのポイントは2点あります。1つは”names_to”で列名を2つ指定すること。縦型変換の際に列の分割もするので,ここでのnames_toの指定は分割後の列名とします。もう一つは,区切り文字は正規表現を受け付けるということ。区切り文字がドット(.)なので,ここでnames_sep= “.”としてしまうと,正規表現におけるドットだと認識されてしまいます。これでは任意の1文字ですので,列名がうまく分割されずに以下のようになってしまいます。

dat %>% 
  tidyr::pivot_longer(!subject, names_to = c("test", "measure"), names_sep = ".", values_to = "score")
## Warning: Expected 2 pieces. Additional pieces discarded in 9 rows [1, 2, 3, 4,
## 5, 6, 7, 8, 9].
## # A tibble: 450 × 4
##    subject test  measure score
##      <int> <chr> <chr>   <dbl>
##  1       1 ""    ""       9.34
##  2       1 ""    ""       3.92
##  3       1 ""    ""       4.58
##  4       1 ""    ""      13.9 
##  5       1 ""    ""       2.24
##  6       1 ""    ""       9.38
##  7       1 ""    ""      10.6 
##  8       1 ""    ""       6.93
##  9       1 ""    ""       7.92
## 10       2 ""    ""       9.13
## # … with 440 more rows

したがって,正規表現ではありませんよということを追記する必要があります。このことをエスケープするなんて言いますが,Rにおけるエスケープは “\\”です。一般的にはエスケープは”\“ですが,R上では2つ重ねないといけないことに注意が必要です。

おわりに

とりあえず,long型に変換する作業をこの記事では説明しました。少し長くなってしまったので,記述統計を出すという話はまた別の記事にしたいと思います。

なにをゆう たむらゆう。

おしまい。

追記(2022.03.16)

従属変数を3列待ちにしたい(横長にしたい)

よく考えたら,分析するときはcomplexity, accuracy, fluencyの3つの列があったほうが便利ですよね。ということで,その形に変形させましょう。ここで,横長に変換するためのpivot_wider関数を使います。“names_from”の引数で「分解」したい列を指定します。ここでは,accuracy, complexity, fluencyの入っている“measure”の列を「分解」して横長にするので,“measure”を指定します。あとは,横長にしたときに持ってくる数値がどこに入っているかを“values_from”の引数で指定します。これは“score”に入ってますから,これを指定すればいいですね。というわけで,次のようになります。

dat %>% 
  tidyr::pivot_longer(!subject, names_to = c("test", "measure"), names_sep = "\\.", values_to = "score") %>% 
  tidyr::pivot_wider(names_from = "measure", values_from="score")
## # A tibble: 150 × 5
##    subject test    fluency accuracy complexity
##      <int> <chr>     <dbl>    <dbl>      <dbl>
##  1       1 pre       10.1     10.0        3.97
##  2       1 post      15.8      8.50       9.81
##  3       1 delayed   15.5      8.59       4.67
##  4       2 pre       12.0      6.40       1.03
##  5       2 post       6.90    10.1        7.30
##  6       2 delayed   15.0      8.54       7.70
##  7       3 pre        9.07     8.49       2.78
##  8       3 post       7.11    10.2        8.55
##  9       3 delayed   10.7      7.97       5.54
## 10       4 pre       12.5      6.03       2.26
## # … with 140 more rows

もしも,fluency, accuracy, complexityなどの順番が気になる場合は,select関数で指定してください。

dat %>% 
  tidyr::pivot_longer(!subject, names_to = c("test", "measure"), names_sep = "\\.", values_to = "score") %>% 
  tidyr::pivot_wider(names_from = "measure", values_from="score") %>%
  dplyr::select(subject, test, complexity, accuracy, fluency)
## # A tibble: 150 × 5
##    subject test    complexity accuracy fluency
##      <int> <chr>        <dbl>    <dbl>   <dbl>
##  1       1 pre           3.97    10.0    10.1 
##  2       1 post          9.81     8.50   15.8 
##  3       1 delayed       4.67     8.59   15.5 
##  4       2 pre           1.03     6.40   12.0 
##  5       2 post          7.30    10.1     6.90
##  6       2 delayed       7.70     8.54   15.0 
##  7       3 pre           2.78     8.49    9.07
##  8       3 post          8.55    10.2     7.11
##  9       3 delayed       5.54     7.97   10.7 
## 10       4 pre           2.26     6.03   12.5 
## # … with 140 more rows

この変換後のデータを別の変数に保存するのを忘れずに!

dat2 <- dat %>% 
  tidyr::pivot_longer(!subject, names_to = c("test", "measure"), names_sep = "\\.", values_to = "score") %>% 
  tidyr::pivot_wider(names_from = "measure", values_from="score") %>%
  dplyr::select(subject, test, complexity, accuracy, fluency)

head(dat2)
## # A tibble: 6 × 5
##   subject test    complexity accuracy fluency
##     <int> <chr>        <dbl>    <dbl>   <dbl>
## 1       1 pre           3.97    10.0    10.1 
## 2       1 post          9.81     8.50   15.8 
## 3       1 delayed       4.67     8.59   15.5 
## 4       2 pre           1.03     6.40   12.0 
## 5       2 post          7.30    10.1     6.90
## 6       2 delayed       7.70     8.54   15.0

11/6に連続公開講座「データサイエンス時代の言語教育」(2)で講演します

2021年11月6日土曜日に,名古屋大学大学院人文学研究科英語教育分野主催の連続公開講座『データサイエンス時代の英語教育』(2)で『一般化線形混合モデルの実践 — 気をつけたい三つのポイント』というタイトルの講演をします。

名古屋大学大学院人文学研究科は私が所属していた研究科ではありませんが,大学院の再編があり私がお世話になった先生方が所属している研究科であり,私の後輩にあたる院生も人文学研究科に所属しています。そういう縁もあってお話をいただきました。私が統計の話をするというのはかなりハードルが高い(統計の専門家ではないですし知識と技術に自信があるわけでも正直ない)と思ったのですが,こういう機会をいただくことでまた自分の知識を更新し,さらにレベルアップする機会にもなると思ったので,お引き受けすることにしました。

フライヤーに要旨も載っていますが,私が名古屋大学大学院国際開発研究科博士後期課程に進学した2014年にNagoya.Rというイベントで『一般化線形混合モデル入門の入門』というタイトルで発表をしました。

ちょうど2012年に下記のレビュー論文が出ていて,それをもとにRでどうやってやるかというのをただただ紹介したみたいな感じでした。

Cunnings, I. (2012). An overview of mixed-effects statistical models for second language researchers. Second Language Research, 28(3), 369–382. https://doi.org/10.1177/0267658312443651

一般化線形混合モデルという発表タイトルでしたが,実際は一般化ではなく線形混合モデルのやり方で,私はその後の院生生活で,反応時間を扱う研究ではガンマ分布や逆正規分布,容認性判断のような二値データを扱うデータでは二項分布を使った一般化線形混合モデルを扱うようになっていきました。

7年前はそこまでウェブ上でも特に日本語では資料が多くなかったこともあり,分野を問わず上記のスライドシェアの資料は結構閲覧されていて,D2で学振の申請書を書いたときには「Googleで一般化線形混合モデルというキーワードで検索すると上に来るのは私の資料です」みたいなことを書いたこともありました(笑)

2016年にはおもにロジスティック回帰に焦点をあてたテクニカルレポートを書きました。

田村祐(2016)「外国語教育研究における二値データの分析-ロジスティック回帰を例に-」『外国語教育メディア学会中部支部外国語教育基礎研究部会2015年度報告論集』29–82. [リンク]

そして,このテクニカルレポートで書いた内容をもとにして2019年には統計のワークショップ講師をしたこともありました。

https://github.com/tam07pb915/JACET-SIG_GLMM-Workshop

そういった流れのなかで,一般化線形混合モデルのレビュー論文のようなものもいくつか新しく出版されているので,そうしたものをまとめた内容にしようと思っています。今回はワークショップではなく「講演」なので,ハンズオンで実際に分析ができるようになるということを目指すわけではなく,(1) 分析の方法,(2) 分析結果の報告,(3) 再現性の確保,という3つの観点から一般化線形混合モデルという分析の手法について話すつもりです。(3)の再現性については,昨今の再現可能性という問題を意識してのものであり,特にこの分析手法だけに当てはまるものではありません。ただ,自分が特に強い関心を持っているのであえて今回の話に盛り込むことにしました。特に,国内の学会紀要などはこういったデータ・マテリアルの公開・共有に関してガイドラインの設定がされていません。このことは今後の研究の発展を大きく阻害すると思いますので,そういったメッセージも入っています(資料はまだアウトライン程度しかできていませんが)。

資料ができたらこの記事の最後に資料へのリンクを追記する予定です。

参加申込は下記のURLから可能で,申込みの締め切りというのは特に設けられていないということです。

https://forms.gle/Ez4GmQC2JpS4j2R49

興味のある方はぜひご参加ください。よろしくお願いします。

なにをゆう たむらゆう。

おしまい。


2021.11.07 追記

当日の資料です。

『外国語学習での暗示的・明示的知識の役割とはなにか』を読みました

Photo by Vanessa Garcia on Pexels.com

はじめに

大修館書店から発売されている,下記の書籍についての記事です。

まず一言でこの本の感想を言うと,多くの人にこの本は「そのまま」読まれるべきではないと感じました。したがって,忖度なしで書きます。

また,以下の記事では私が読んで考えたことに加え,私を含めた4名の研究者で行ったこの本の読書会で話題にあがったことも含めます。読書会で議論になったことは,その都度そのように言及しますので,そうでない限りは私の主張であると考えてもらって構いません。

ちなみに,私は過去にこの本で取り上げられている暗示的・明示的知識(英語ならimplicit/explicitだと思いますけど日本語だと明示的・暗示的という人のほうが多いような)についていくつか記事を書いています。

どれも院生時代の記事ですが,私のスタンスというか立場,見方はこれらの記事に現れていると思いますのでぜひお読みください。また,本記事の以下の内容は,自己批判を多く含んでいます。それは,私が初めて「論文」というものを発表した時期にやっていた研究(2014-2015あたり)は明示的知識や暗示的知識といったものを対象としていて,測定や構成概念に対する認識の点であまりにもナイーブすぎたと思っているからです。

初学者には非推奨

もしも,「暗示的・明示的知識ってなんだろう?」とか,帯に書いてあるような「規則を知っていても使えないのはなぜ?」という疑問を持っている人がこの本を読もうとしているのを見かけたら,私は止めたほうがいいとアドバイスすると思います。なぜなら,そういった疑問は解決されるどころか余計に頭の中がこんがらがってしまうからです(理由は後述)。

そういった意味で,この本は批判的に検討できる者のみが読むべきだと思います。初学者が読むと余計にわけわからなくなってしまって悩んでしまうか,または逆に誤った知識を身につけてしまう可能性すらあるかもしれません。よって,学部や大学院生レベル,または研究職に従事しない方が手に取るべき本だとはあまり思えません。

なにがこの本の価値を下げているか

この本に対して私が否定的な印象をいだく理由を端的に言えば,この本は「だからだめだよSLA」の典型例だと思うからです。帯に「第二言語習得研究×認知心理学×脳科学」というように,この本に書かれていることがいかにも「科学的である」ような装いがありますし,真理・真実が明らかになっているかのような書き方がされている部分もあります。しかしながら,実際には曖昧性を多分に含んでいて,その最たるものは明示的知識とはなにか,暗示的知識とはなにかについて執筆者全員の定義が一致しておらず,その測定方法も違うからです。このことについては後述します。

つい先日,

第二言語習得研究(者)はなぜ「誤解」されたか

という記事を書きましたが,この記事で批判したことのいくらかも当てはまっている本ではないかと思います。

さて,本題です。本の中で気になるポイントを一つ一つ指摘していくときりがないくらいたくさんありますが,以下ではいくつかの論点にしぼって書きます。

論点1: 全体を統一する視点に欠ける

この本が全体を通して非常に残念な仕上がりになってしまったと感じる最も大きな理由は,各章の独立した論考をまとめて統一感をもたせる構成になっていないことでしょう。「はじめに」と「終章」はありましたが,本の意義のアピールが多く,全体を俯瞰的にまとめきれていたようには感じませんでした。このことは,何もこの本に限ったことではないと思います。他の分野の本がどうかはよくわかりませんが,私がこれまでに自分の研究に関わる専門書をそれなりの数読んできた印象は,多くの執筆者が各章に独立した論考を書いているパターンの書籍は質があまり高くないことが多いというものです(特に洋書)。一冊の中で扱われるトピックに多様性をもたせようとした結果,一冊の本のまとまりを欠いてしまうというのはしばしば見かけます。この本もそういう系統だというのが私の印象で,それだけであればそういう本のうちのone of themだということでスルーしていたかもしれません。

ただし,この本のテーマは一つの「概念」(明示的・暗示的を別個にカウントすれば2つ)です。暗示的・明示的知識という目に見えない概念を扱っています。それがこの本の各章に通底するテーマであるわけです。だからこそ,編者はこの本で言う「暗示的・明示的知識」が指すものを冒頭で(操作的定義も含めて)定義するべきであり,その定義に沿って各章の執筆者に執筆を依頼するか,または原稿を受け取った時点で章の間の記述の齟齬を解消するような修正作業を行うべきだったと思います。この点は読書会に参加した全員が同じような印象でした。

そういう調整がなされていないのは,すべての章で著者が独自に概念的・操作的定義を述べていることからも明らかです。結果として,第3章では暗示的知識の測定具として適切ではないと言われていた文法性判断課題が第5章や第6章では暗示的知識の測定具だとして論じられています。

百歩譲って,それが不可能である,つまり,暗示的・明示的知識を定義することは不可能であるという態度でこの本を世に送り出すのであれば,そのことを正直に書くべきでした。私がもしもこの本の編者に入っていたらそうすると思います(終章の151ページに測定具の問題への言及はありますが,全部読み終わって最後にそれ言われると詐欺っぽいので本来であれば先に言及するべきで,その意味では終章を読んでから各章を読むほうが良いでしょう)。なぜなら,この記事を執筆している2021年現在でも,研究者間ですら,暗示的知識と明示的知識がどのような測定具を用いて測定されるものであるかについての合意には至っていないからです。例えば,以下の論文は第3章(第二言語環境で日本語の文法知識はどのように発達していくかー文法項目の特徴と学習者の個人差の影響)で提示されるような明示的・暗示的知識の測定方法の分類とは異なり,時間制限つきの文法性判断課題なども暗示的知識の測定具としています(よってどちらかというとRod Ellisの分類に近い)。

Godfroid, A., & Kim, K. (2021). THE CONTRIBUTIONS OF IMPLICIT-STATISTICAL LEARNING APTITUDE TO IMPLICIT SECOND-LANGUAGE KNOWLEDGE. Studies in Second Language Acquisition, 43(3), 606-634. doi:10.1017/S0272263121000085

最新の研究ですらそういった状態なわけですから,そもそも明示的知識とはなんなのか,暗示的知識とはなんなのか,そしてそういった2種類の知識をどうやって測定仕分けるのか(より大きな問題は,そういう知識2つの実在を仮定して良いかどうか)ということについては科学的な真実があると言える状態でも,その確信度が高いと言えるような状態でもないというのが現状というのが,この文法知識の二元性というトピックを研究を初めたときから追いかけている(とはいっても研究のキャリアは修士をスタートとしてまだ10年ほどですが)私の現状認識です。

にもかかわらず,この本の「はじめに」では,次のような記述があります。

(前略)明示的知識と暗示的知識の区別はSLAの中心的課題であるが,同時に,問題もいくつか抱えている。たとえば,日本人の英語習得を扱った研究が少ないこと,研究対象が文法習得に限られていること,個人差や情意に関する研究がほとんどないこと,近接領域(たとえば,認知心理学や脳科学)の最新の手法を取り入れた研究が少ないこと,などである。本書の目的は,これらの問題点を網羅し,科学的証明を行うことにある。

はじめに iv

このパラグラフだけでツッコミどころはたくさんあって,なぜ日本人の英語習得を扱った研究が少ないとそれがSLAの問題となるのか,とか近接領域の最新の手法を取り入れていないとSLAの何がどう良くない状態になるのか,とか色々思うところはあります。また,たかだが本一冊で解決できる問題ではないだろうとも思いますが,それはおいておきます。それよりも私が驚いたのは,「科学的証明を行う」という記述です。「科学的証明」という言い方は私は人文科学の中では非常に強い主張だと思います。しかし残念ながら,「科学的証明」には失敗していると思います。全員が同じ概念なり現象なりを同じ方法で測定するというのは科学の最も基本的かつ重要な部分であると思いますが,それが成立していないからです。

一方で,1万歩くらい譲ってもう一度この本のタイトルを思い出してください。そうなんです。この本のタイトルは,『外国語学習での暗示的・明示的知識の役割とはなにか』であって,「暗示的・明示的知識とはなにか」ではありません。よって,この本は暗示的・明示的知識とはなんなのかの答えを与えるものではないのですと言われたら,まあそういう解釈もありえますよね,とは思います。ただ,そういう政治家みたいなことばの使い方は読者に対して不誠実だと思います。そしてそのことは,本の中で一切語られていないからこそ罪が重いです。本の冒頭または最後で暗示的・明示的知識というのは非常にcontroversialなトピックである,ということが明示的に書いてあり,その整理をある程度の紙幅を割いて試みた上で(この役割が第2章だったのかもしれませんが)の各章の内容であれば,私のこの本に対する評価は変わっていたと思います。

論点2: 用語・定義がカオス

知識,処理,意識

論点1と関連しますが,まずもってこの本は各章でそれぞれの著者がそれぞれの概念的定義で暗示的・明示的知識という用語を使っています。また,類似する概念である宣言的知識(declarative knowledge),手続き的知識(procedural knowledge)であったり,「手続き化」(procedualization),「自動化」(automatization)といった用語も含めて,それが何を指すのかも章ごとにばらつきがあります。また,「意図的」(intentional)という用語が「意識的」(conscious)という用語と同じような意味で使われているのではと思う箇所(pp.52-53あたり)もありました(意識という用語関連の整理については福田(2018)がわかりやすいです)。

例えば,第4章では語彙の知識という観点から暗示的・明示的知識についての議論がされています。p.58に 「手続き的知識の習得を促す…」とありますが,ここまでの流れで読むと「手続き的知識=暗示的知識」と読めると思います。つまり,暗示的知識=手続き的知識であり,この2つはinterchangableであるという使い方になってると解釈できると思います。しかしながら,これは第2章2.3節の「明示的・暗示的知識と宣言的・手続き的知識の関係」の内容や第9章の「第二言語習得研究で言うところの暗示的・明示的知識の区分と,脳科学で言うところの手続き・宣言的記憶の説明に多少ずれがある」(p.137)という記述と矛盾することになるのではないかと思います。

こうした用語が意味するもののズレが生じてしまう大きな原因として,「知識」(つまり脳内に保存されている情報)と「処理」(保存されている情報へのアクセス)を分けて議論できていないことが大きな問題(これはSLA全体に言える問題)なのではないかという話も読書会でありました。そして,「処理の話」と「意識の話」を切り分けることも重要です。

SLAでは,暗示的知識というのは母語話者が言語使用に用いるものであるという理解があります。言語学者でなければ,ほとんどの人間は自分の持っている言語の知識について意識することもありませんし,その情報へのアクセスを意識的にすることもないわけです。そして,第二言語学習者と比較して圧倒的な速さで言語の処理ができます。このことから,暗示的知識の概念的定義に速いことと無意識であることが含まれるようになりました。この章(第4章)のpp.53-54の最後の段落の記述を見ると,「学習者はjunctionの意味的表象に素早くアクセスする能力を有しているとみなすことができるだろう」とあります。こういう部分に,速い=無意識,という前提があることが現れています。「処理の話と意識の話」が混ざってしまっているわけです。つまり,持っている知識に対して,そのことを意識しているかどうか(自分がその知識を有していることを自分が認識しているかどうか)と,その知識にどれくらいのスピードでアクセスできるのかどうかということを分けて議論できていないように感じました。Tamura et al. (2016)で主張したように,スピードが早い=無意識,スピードが遅い=意識という単純な関係ではありません。

小学生の暗示的知識?

話をまた「はじめに」に戻します。この本の最初のページはこのように書いてあります。

(前略)たとえば,多くの小学6年生は,英語の疑問文における倒置の規則を知らないのにもかかわらず,英会話で”What color do you like?”, “What would you like?”, “Do you like soccer?”と正しく発話することができる。(中略)また,明示的知識はないが暗示的知識があると考えられるため,小学生が正しく英語を使うことができるということになる。

はじめに iii

端的に言いましょう。小学生が疑問文生成に必要な倒置の規則の暗示的知識を持っているわけありません。これはただの模倣です。仮に知識として持っているとすれば,Do you like X?で「Xが好きですか」という意味をなすというくらいのものでしょう。

こういうのを読むと,言語を「使う」の意味も多義的でコミュニケーションを難しくしているなと思います。これと同じような意味で,第6章のp.83には 「小学校英語教育の第一義的な目標は英語表現を使えるようになること(強調は筆者)」とあります。もしも小学生が暗示的知識を持っていて英語が使えるのであれば,第2章の「『使える』文法知識」について考えなくてもいいんじゃないでしょうか,となります。だって小学生でもう暗示的知識あるのですから。たしかに,小学生の言語習得はその他の章の議論と噛み合いません。なぜなら,2章では前提として多くの学習者がたどるプロセスとして「知る」->「使える」のようになっているからです。そうであれば,そうしたケースと比較して小学生がどういった学習のプロセスをたどるのか,どういった文法知識を持っているのかは議論すべきポイントです。

そしてp.84を読むわけですが,そこに書かれている内容は首をかしげるものでした。そもそもこの著者の言っている「文法知識」なるものは他の著者の言っている文法知識と指しているものが異なるように感じました。例えば,What X do you like?のX部分を様々に入れ替えて質問ができる,質問の内容を理解して答えることができる,といったとき,この小学生はいったいどのような文法の知識を持っているということになるのでしょうか。Wh句が前置されて疑問文が生成されるという知識?do挿入の知識?Xの要素を引き連れてwhを前に移動させるという知識?そうではなく,似た構造のインプットをたくさんうけることによって,構造的な類似性をヒントに構文を構築していくというような用法基盤モデルのような考え方を採用しているのであれば,そういった説明が必要でしょう。

論点3: 言語・テストが良くない

これは特に第5, 第6章の内容に関連するものですが,知識測定の道具として使用される刺激文の質が悪く,これでは測定したい知識が測れているかどうかも怪しいと思いました。

読書会で挙げられたことを1つ出せば,81ページにある刺激文の一覧をみると,

  • 正文: I have a cat.
  • 誤文: *I like animal.

となっていて,この項目で測定したいのは「名詞の単数形・複数形」となっています。正しくはI like animals.と複数形形態素がついていないといけないということでしょう。問題は2つあります。まず,このときの複数形形態素が欠如していることというのは,*I have two car.のような誤りとは訳が違います。なぜなら,後者の文であれば,「名詞が表すモノが複数なら-sをつける」という知識があれば対応できるでしょうが,I like animalに-sをつけるというのは,「種類を表す場合は裸の名詞の複数形(bare plurals)である」という知識が求められるからです。これは,単に複数=-sの知識とは言えません(名詞周りの知識ではあるのでそれも含めて複数形の知識という点で誤りではないですが,それでも対になってるとは言い難いと思います)。catは具体物を表しますが,animalは動物というカテゴリの名詞ですから,そういう意味でもこの2つは対になっているとは言えません。

2つ目の問題は,「名詞の単数形」が正文であり,「名詞の複数形」が誤文になっていることです。本来であれば,名詞の単数形について正文と誤文をつくり,名詞の複数形について正文と誤文をつくるべきでしょう。この章では文法性判断課題の正文への反応は「暗示的知識」を測っていて,誤文への反応は「明示的知識」という立場をとっています。そうなると,「単数形の知識」は暗示的知識しか測っていないし,「複数形の知識」は明示的知識しか測っていないことになります。

第6章でもこうした問題が散見されます。例えば,pp.88-89では動詞フレーズの獲得状況についての調査をした浦田他(2014)という研究が紹介されています。p.89の表1をみると,*I can play piano.という英文があります。これ以外の誤文はすべてcanの後ろに動詞がない(*I can soccer),動詞とcanの語順が異なる(I play can kendama.)など,canと動詞に焦点が当てられているものの,play pianoは「playの後ろに楽器が来る場合はtheがくる」という知識です。それって全然違うことなのでは?というのが読書会でも話題になりました。元論文を読むとTomaselloが引用されていたりして,用法基盤モデルの考え方を採用しているのだなと思いながら読めば,can VPみたいなものを見ているのかなとか思ったりもしました(それでもこの章の説明だけでは違和感を覚える人は少なくないはず)。4.2節の物井他(2015)も,正答率の低かった問題について「最初に,問題2については,rhinocerosesという児童に聞き慣れない語がふくまれていたことが原因である」と書いていて,文法性判断課題で未知語が含まれていたらその影響が出るのは当然で,そうなると語順の知識は測定できないのではと思います。元論文を読むと,以下のような記述があります。

rhinoceroses(サイ)という児童に馴染みのない単語を挿入しており,未知の単語と遭遇した場合に,その意味を推測しながら文の正誤を判断できるかを確認する意図があった。(p.88)

物井尚子・矢部やよい・折原俊一(2015)『外国語活動を経験した児童の語順に関する理解度調査 ―SVOに焦点をあてて―』千葉大学教育学部紀要, 63, 85-94.

ちなみに,このことが書いてあるのは結果部分の88ページであり,テスト作成部分には,未知語が入っているという説明は出てこず,次のように書いてあるのみです。

使用する単語についてであるが,Sは1・2人称に限定しI,youのみ, Vは外国語活動で使用頻度が高いと考えられるhave, eat,play,likeの4動詞,Oに用いる名詞はapples, baseball,lunch,pen,soccer,tennisに上位語のcolor,sportの8語,句動詞としてgo to school,get upの2種, 時間を表す前置詞を含む表現としてat six,at eightを用いた。(p.87)

物井尚子・矢部やよい・折原俊一(2015)『外国語活動を経験した児童の語順に関する理解度調査 ―SVOに焦点をあてて―』千葉大学教育学部紀要, 63, 85-94.

私の感覚からすると,テスト作成の段階の記述と言ってることが違うというのはありえないです。これはまあ本の批判ではないんですが。

第5, 第6章で紹介されている研究すべてに当てはまる指摘ですが,テストに使われる刺激文だけではなく,そもそも問題数が少なすぎるという問題もあります。小中学生に大量の項目のテストを行うことの実行可能性などを考慮すれば,問題数を増やすことが難しい事情は理解できます。しかしながら,文法性判断課題とはテストである以上,なにかを測定するためには測ろうとする文法のターゲットについて1つや2つの項目だけでは学習者が安定して判定を行えているのかどうかを判断することはかなり難しいといえます。ましてや二択の問題であるからなおさらです。「文法知識」というからには,1つの事例にだけ適用ができるものではなく,複数の事例に適用可能な規則であるはずです。そういうものを測ろうとするのであれば,1つや2つの項目に正しい回答をしただけでは,単に「それとほとんど同じ文を聞いたこと(見たこと)があった」という記憶だけでも正答にたどり着く可能性も十分にあります。また,5, 6章で出てくる「正答率」とは,1人の学習者の正答率ではなく,参加者全体の中で正答した学習者の割合であることも注意が必要でしょう。つまり,ここでは学習者個人ではなく,集団の問題となっているということです。

このことは,結果の解釈とも関わります。第5章の結果の考察については,そもそも二択の問題で5割を切っている部分の「伸び」になにか有益なものがあるようにはあまり思えません。さらに言えば学習者個人ではなく集団の話であるわけで,正答できる学習者の人数が増えた事をもって,学習が進んだというように解釈するのは少し違和感があります。

第6章でも同様に,

全体の正答率は5年生が44.5%,6年生は51.6%で,6年生のほうが高く,この差は統計的に有意であった。つまり,物井らの研究と同様,5年生よりも6年生のほうが全体として暗示的知識をより多く持っていることが明らかになった」(p.95)

とあります。ところが,p.89では,

GJTの分析では,正答率をチャンスレベル(当て推量で解答した際に期待される確率)と比較する場合が多い。GJTは提示された文が文法的かどうかを判断する二者択一のテストであるため,チャンスレベルは50%,(中略)したがって,GJTはでは正答率が50%よりも高いかどうかが重要である

という旨の記述があるのです。こういうことを書いておきながら,50%を下回っている正答率や50%をわずかに上回る程度の正答率に対して,「知識がある」という判定を下している。これはあきらかに矛盾していないでしょうか。全体の結果から「GJTで語順の正答率が5年生でも高い(特に正文)ことから,5年生でも語順に関する暗示的知識は身についている児童は多いことがわかる」(p.96)という結論も同意できません。カッコ内の「特に正文」という部分が絶妙に不誠実だと思いました。なぜなら,p.95の表2を見れば,非文とされている(10)過去形, (2)be動詞, (4)語順, (6)can, (8)want toの5項目の5年生の正答率をみると,語順の正答率はたったの32.1%しかないからです。これは他の非文の正答率25.6%~48.8%と比較しても高くない上に,50%を大幅に下回っています。そして正答率が「高い」と解釈されている正文反応の方を見ても,2択で答えられる問題(しかもたったの1回の反応)で,66.1%の学習者が正解したことをもって,暗示的知識は身についている児童は多いと結論づけるのはあまりにもナイーブすぎないでしょうか。言語の暗示的知識をもつ母語話者は正文を正文と判断することも,非文を非文だと判断することも暗示的知識を使ってやっていると思います。よって,本文に明示的に書かれてはいませんが,もし仮にGutiérrez (2013)をもってきて,非文への反応は暗示的知識なので,明示的知識は持っていないが暗示的知識はあると考える,というように言われてもちょっと納得がいきません。

場外戦: そもそも明示・暗示は厳密には教育には役に立たない

終章の3節「教育的な示唆」には,明示的・暗示的知識の測定が教育・指導上役に立つとして以下の3点が挙げられています。

  1. 暗示的知識は学習者が気づかない(意識できない)知識であるが,この暗示的知識の習得こそが学習上のゴールであると考える教員や研究者が多いため,暗示的知識が測定可能になったことは重要
  2. 明示的・暗示的知識の測定方法が確立してきた事によって,教育場面でも応用可能
  3. 明示的・暗示的知識の習得プロセスにおける諸要因の役割がわかりつつあるため,教師がフォーカスすべきところが明確になってきた。

まず1について。そもそも,今のSLAで仮定される暗示的知識というものが実際に人間の頭の中に実在すると仮定して,心理学的な考え方でそれを測定することができるという意味でいうと,「測定可能」になっていると言い切れるほどではないと思います。まだまだ不確実なことが多い状況で,あまり確定的な記述をすることは逆に教育現場に誤った理解を広めたり,そのことが教育現場に余計な軋轢を生んでしまうかもしれない可能性を危惧しています。

暗示的知識の習得プロセスを学習者に示す事ができるということの例として第8章が言及されていますが,この章で紹介されている単語学習は,まず単語を見せて訳語を思い出してもらい,その上で正解を見て到達度を「良い」「もう少し」「だめ」「全然だめ」という4段階で評定するものです。単語を学習せよという指示はしていないから意図的学習ではなく,「潜在記憶レベルの語彙学習」と書いてありますが,この学習で単語を覚えようとしないわけがないと思います。意図的学習と偶発的学習を比較して,ここでフィーチャーされている学習が後者の学習だと論じられていますが(p.128),本来の偶発的学習(意味理解を目的とした言語処理時に未知語の知識を獲得するような学習)とは明らかに異なります。また,この評定値があがっていくことが語彙の暗示的知識であるとすれば,それは4章で議論されたようなアクセスのスピードの速さを暗示的知識とする理論的枠組みともずれます。

こういうズレは,教育場面でのテストや測定と,研究としてのテストや測定に求められる厳密さが異なるということを意味していると思います。このことは,2番目の論点にも関わります。

2の教育場面での応用については,時間制限付きの文法性判断課題を用いたりelicited imitation(誤りの含まれた英文を復唱させ,復唱の際に誤りを直すかどうかで知識の有無を判定するテスト)をすることだと書かれています。ところが,その前の節(p.151)では,これまでのSLA研究で用いられてきた課題は問題点も指摘されているという記述もあります。そういうのを読んだあとで,「測定方法が確立してきた」(p.152)と言われると,え?本当に「確立」しているのでしょうか?と読者は疑問に思わないでしょうか。私は思いました。さらに,終章第2節でもたびたび,暗示的知識の測定具は実際の言語使用とは大きく異なるものであるという問題点も指摘されています。この点については私も「明示・暗示の測定と指導法効果研究」という記事の中で指摘しました。であるならば,そうした実際の使用場面からかけ離れたテストをしてまで暗示的知識を測定する必要が教育現場にあるのかどうかということは問いたいです。そのことが,英語の授業や指導においてどういったメリットを持つかを考えずに持ち込もうとすることは,私はSLA研究者は避けるべきだと思います。私個人としては,明示的知識と暗示的知識という概念は純粋な認知科学としての第二言語習得研究でのみ追究されるべきであり,指導現場への導入は少なくとも今の段階ではメリットがないと思っています。第二言語習得研究では,母語話者と第二言語学習者の差が生まれる要因を解明することが研究の大きな目的ですから,厳密な暗示的知識の測定具を開発することは必要なことです。詳しくは過去記事をお読みください。

3については,明示・暗示という知識の二元論を導入するまでもなく,言語学習というのは非常に時間のかかるプロセスです。そのことは知識の二元論という余剰な概念を持ち出すことで初めて可能になることではありません。であれば,シンプルに「言語学習とは時間のかかるものである」といえばいいだけではないでしょうか。

科学的というような装いで,その内実が非常に曖昧なものに教育場面での有用性があるように断定的に研究者が言ってしまうことのリスクは研究者が考えるべきでしょう。「先週やったよね?」と教員が学習者に言わなくなったとしても,教員同士で「あなたの期末テストって暗示的知識を測定するものじゃありませんよね?」「これは明示的知識しか反映されていない問題ではないでしょうか」みたいなカオスが生まれてしまわないことを願うばかりです。

おわりに

この記事では,『外国語学習での暗示的・明示的知識の役割とは何か』という本の内容について,いくつかの観点から批判的に検討しました。私の記事の内容についても,批判的な検討をよろしくお願いいたします。

なにをゆう たむらゆう。

おしまい。


2021.09.22.03:24 更新

読解上やや不自然な部分や読みづらい部分などについて,軽微な文言の加筆修正等を行いました。最初に公開したものと内容的な変更はありません。

第二言語習得研究(者)はなぜ「誤解」されたか

Photo by Matheus Bertelli on Pexels.com

はじめに

今日は,「外国語教育研究の再現可能性2021」というオンライン開催のシンポジウムに参加しました。久しぶりに,集中して興味深く全ての話を聞けたなと思うイベントでした。開催にあたっては登壇者・発表者の皆様と,運営をされたプロジェクトメンバーの方々にまずお礼申し上げます。

さて,この記事では第二言語習得研究者を自称する者として感想がてらに,前半のシンポジウムで批判にあがっていたことについて私見を述べます。

私の質問の意図

私はシンポジウム後のディスカッションで,以下のような内容(書いた内容を保存していなかったので覚えている限りの内容)の質問を登壇者の一人である柳瀬先生宛にしました。

モデルが真実ではないというのはそのとおりだと思いますが,そのことはモデル自体が有用でないということを意味しませんし,モデルの精度をあげていくという営み自体を否定しないと個人的には思いますがいかがでしょうか。

柳瀬先生の答え(として私が受け取ったものは),受け取る側がモデルとして提示されたものを真実だと思っている(ように見えるのがよくない)。ということと,モデル構築の方法としてナラティブのほうが良いと思っている,という2点だったと記憶しています。

まず,2点目については,そういうアプローチもあっていいだろうと思います。また,非常に狭義の第二言語習得(SLA)研究者からすれば,そもそも大半の研究はモデルすら構築できてませんけどねって言われるような気もしますが,そこは一旦置いておきます。私がこの記事で焦点を当てたいのは1点目です。

私が上記のような質問をした意図は,柳瀬先生の発表を聞いて,モデルを作ることやモデルそのものを科学的に追求するという営み自体が否定されているというように感じてしまったことに起因しています。私としては,そもそも科学というのは絶対的な真理にたどり着くための永遠の営みのようなものだと思っています。草薙さんの言葉で言えば可謬主義を受け入れています。というか,人文社会系の研究者であれば(もっといえば自然科学の研究者であっても),研究によって世の中の真理が明らかになる,真実が一つに決まる,と思っている人ってほとんどいないのではないかと思っています。

それにも関わらず,モデル(研究の成果の結果として構築された現実の近似)を世の中の真理として受け取っている人がいる(あるいはそうやって広く受け入れられてしまっている),と研究者が考えてしまうのはなぜかということが重要な問題なのではないかと思いました。

ディスカッションで私の質問をとりあげていただく前だったかあるいは草薙さんの発表のときだったかは記憶が曖昧ですが,SLAの教科書と言われるような本にはすべて科学的事実かのように記述されているというような内容の発言があったかと思います。

よって,SLA研究者がどうやって自分たちのことを認識しているかは別として,「外から」はそう見られているということは間違いなさそうです。そして,それは柳瀬先生も草薙さんにしても(私は柳瀬先生の過去の研究のことは存じ上げておりませんで亘理先生の話を聞いて知ったわけですが)どちらかというと「そっち寄りだった」人からそう思われている,ということです(草薙さんは私が博士課程の2年間文字通り毎日一緒にいて共同研究もたくさんやったのでよくわかっているつもりです)。

研究者・実践者双方に研究に対しての態度を改める必要あり

上記のような問題,つまり研究の知見と言われるようなものをどう捉えるのか,という点についての私の意見は短くまとめれば以下のツイートのようなものです。

以下では,便宜的に「研究者視点」「実践者視点」に分けて良くなかった点を考察します。これはそれぞれが別の人物であることを必ずしも意味しない(一人の人間として研究者であり実践者である可能性も当然あるという認識がある)ことは言及しておきます。

研究者がやってしまったこと

上述の「SLAの教科書と言われるような本にはすべて科学的事実かのように記述されている」みたいな発言(実際にそうかは置いておいて他の研究者からそう思われてしまうこと)は,SLAという研究分野を立ち上げ,そしてそれを研究として他の分野と同等の価値があるものだということを社会に認識してもらわなくてはいけなかったという先人たちの苦労の結果として起きてしまった不幸なのではないかと思います。

SLAは学際領域だっていうことがよく言われますが,それは私は「表面」で,「裏面」は研究として確立することに非常に苦労したし,研究,または学問としての体をなすために試行錯誤してきたのがこれまでの歴史だというようにも思っています。

その結果として,私達のやっていることはscienceなんだ,ということを周りにアピールする必要がありました。そうではないと,研究として認めてもらえないからです。そういう苦労の結果として,様々な学会が立ち上がり,多くの学術雑誌が誕生し,そしてこれまでにたくさんの研究者を世に送り出すことに成功しました。一方で,そういった「アピール」が,意図的であるかどうかは別として誤解を生んでしまった面もあると思います。

世間に自分たちのやった研究の成果を発表する際に,本来であれば,そこまで確定的なことを言うべきではない,結果の解釈には慎重になるべきところを,研究ではこういうことが明らかになっている,というようにしてしまったこともあるのではないかと思っています。これはもちろん私自身も過去にそういった過ちをしている可能性も認識した上で言っています。メタ分析だろうが同じことです。研究の結果の解釈には必ず留保がつくべきはずなのに,そこをもし丁寧に説明しようとするとそもそも紙幅の関係で無理だし読者にも「結局何がわかったの?」と思われてしまう。だからわかりやすくしようとした。結果として,誤解を生んでしまうような知見が広まってしまった可能性もあるのではないかと思います。

余談ですが,いまや胡散臭い語学系広告にも「第二言語習得」という言葉が権威付け的に使われるようになってしまったことも,真摯に第二言語習得研究をしている人たちが望まない結果だと思います。もう一つ余談をすると,自分が先人の苦労に乗っかって今の職業的地位と安定を得ていることに最大限のリスペクトを払った上であえていうのは,英語教育「学」や外国語教育「学」という「学問」へのこだわりは,中身のほうが追いつかずにここまで来てしまったのではないかというのも思っているということです。私達世代(より下)の使命は,このことについて一度立ち止まって考えることだと思います。

実践者がやってしまったこと

研究の知見を解釈する側の実践者の視点からいうと,「科学的」ということばに過剰な信頼を置いてしまったことを反省する必要があるのではないかと思います(これは教育実践者のみならず一市民としての科学リテラシーも絡むでしょう)。

「あすの授業に役に立つ」というのは,実践者にとって有益であることを表すスローガンのように用いられている風潮があると思いますが,私としては少なくとも学会発表や一論文レベルで,それがそのまま「あすの授業に役に立つ」研究ということはほとんどないんじゃないかと思います。授業を考えるヒントになる可能性はたくさんあると思いますが。即効性をもって「あすの授業に役に立つ」のは研究ではなく,授業のアイデアレベルのことではないでしょうか。

再現可能性を思考したプロジェクトの先に研究の蓄積がなされたうえで,「あすの授業に役に立つ」のではなく,より広く授業を考える際のなにかのタイミングでの意思決定の基準の一つになりうるような研究の知見を出す,というのは可能だと思いますし,それこそがプロジェクト(の目標ではないと思いますがその先の)目標になっているのではないかと思っています。そのことについては賛同します。

ここで強調したいのは,私は実践者を責めているわけではないということです。実践者の方々の多くが置かれている環境に,余裕がない,これが最も重大な,そして喫緊の課題でしょう。余裕がないからこそ「あすの授業に役に立つ」ことを求めてしまうわけです。本来なら,1週間先,1ヶ月先,1年先,自分の教えている学習者が自分の所属している教育機関を離れるとき,まで見据えて授業は考えるべきです。ところが,それができない。そんな余裕がないからです。そういう状況まで追い込まれたら,藁にもすがる思いで何かを「信じたい」と思うことは当然のように思います。私も8ヶ月間という短い間で,なおかつ担任ももっていませんでしたが,公立の中学校教員として勤務していたことがありました。その時を振り返ってみると,あの時より忙しかったことはこれまでの人生でないし,この先の人生でもおそらくないだろう,と確信を持って言えるほどには激務でした。もちろん経験がゼロだったので非効率な働き方をしていたと思いますし,手の抜きどころも全くわかりませんでした。むしろ,手を抜いたら絶対にいけないという強迫観念で,自分という人間のあらゆるリソースをすべて仕事に振り向けていたとすら思います。悲劇的なことは,そこまでやっても自分にとって満足のいく授業に到底及ばない出来だったことです。

本当に辛かった。だから私は,教育実践者を責めるつもりはありません。そのうえで敢えてここで言わなければいけないのが,「研究」というものはたった一つの真実を教えてくれるものとは限らないということです。研究者が,わかりやすさを重視した部分がある。そしてそのわかりやすさが受け入れられる環境が実践者側にあったのではないかと。このことは,間接的にですが今回のシンポジウムが扱っていた再現可能性のテーマに非常に大きく関連していると思います。

不確実さへの不寛容

これはなにも英語教育の分野に限らないことかもしれません。人間ははっきりしないことをはっきりさせたがる生き物なんじゃないかと思います。曖昧なことや不確実さのあることを受け入れることが難しい。なぜなら,それでは自分がどうすべきかわからないからです。しかしながら,世界は不確実さに満ちあふれているわけです。そこで,その世界の不確実さを多少ましにする,人々の不安を和らげようとする営みが研究と言ってもいいかもしれません。「多少ましにする」とはつまり,研究が明らかにしたことには必ず確からしさのグラデーションがあるということです。今受け入れられていることがのちに否定されるというようなことは起こりえます。研究者がやっている営みは,その現時点での確からしさを高める努力をすることと,その努力を続けていくことだと思っています。そのことをいくら研究者が認識していたとしても,研究者が発信する情報を受け取る側とそういった合意形成が取れていなければミスコミュニケーションが起こってしまいます。この状況こそが,私は解決されるべき根本的問題だという認識を持っています。

わかりやすさの弊害

とはいえ,世間の風潮としても,わかりやすいことは人々が最も価値を置いていることの一つではないかと思えるほどに,この世の中は(人々は)わかりやすさを求めているように思います。その態度が,わかりやすくないものにたいしての否定的な感情や排除を生んでいるように思うのです。だからこそ,わかりやすくない研究というのは金の無駄だと言われ,意味がないと思われてしまう。そう言われると研究者は,無駄なことに意味がある,と反論します。ところが,これはそもそもの前提の部分でずれているのではないかと思います。わかりにくさは無駄ではない,というのが一つ。そもそも世の中はわかりづらいものです。人間が何年もかけて一生懸命時間とお金と労力を費やしても謎だらけなわけです。つまり,そもそもわかりにくいものなのだ,という認識を共有すべきだと思います。研究のブレイクスルーというのは,このわかりにくい状況を一瞬にしてわかりやすいものに変えるものなんじゃないかという気もします。しかしながら,それはそんなに頻繁に起こるものではありません。

また,私達は短期的なものを重視しがちです。中長期的なことは見えづらいし想像が及びづらいからです。だからこそ,すぐに得られる結果(「目に見える成果」)を重視します。研究もそういう枠組みに絡み取られてしまっています。多くの研究者が,自分が貢献できる部分はその研究分野のゴールから見てものすっっっっっっごくちっぽけなものであることを自覚しているはずです。自分が生きているうちにはまず解明されないだろうなぁという大きな課題を前に,それを切り分けて,切り分けて,切り分けて,その一部を多くの研究者で分担しながら明らかにしようと試みています。だから本当は,一つの研究で世の中を変えることなんて殆どの場合無理だし,一人の研究者が生涯で変えることのできることも,世間一般の人の感覚からすればよほど小さいわけです。このことを理解してもらうのがすごく難しいのではないでしょうか。

おわりに

思考を垂れ流すように書いていたらずいぶんと話が大きくなってしまいました。私が言いたかったのは,「科学」や「研究」ということばに対する認識をすり合わせていく必要がありそうですね,ということです。いちおう未熟ながら研究者の端くれですので研究者目線の記述になってしまい,それが自己保身のように解釈されてしまう面もあったかもしれません。私としては,研究者がのらりくらりしていて良いわけではないですし,研究の知見を世の中に伝える際にわかりやすさは度外視していいとも思いません。人生をかけたプロジェクトに挑みつつ,真摯な態度で,慎重に話をするべきだと思います。こういうのはおそらくサイエンス・コミュニケーションということばで語られるものだと思いますので,そういった本をいくつかAmazonで注文した次第です。

なにをゆう たむらゆう。

おしまい。