英語4技能テストの選び方と使い方—妥当性の観点から—

学校側、先生側向けの選び方

タイトルは英語4技能試験と書いてありますが、実は英検、TOEIC、TEAPなどの技能試験だけでなく、他のさまざまな試験についても説明・検証しています。 さらにはテストの詳細な説明です。 英語を教えたりしている人でも、誰がどの技能試験を受けるべきかの判断を完全に理解している人はなかなかおらず把握しておきたい内容となります。

【英語専門家の意見!】大学入試 – 4技能外部試験はどれを選ぶ?も確認する。

はじめに

英語のテストは身近なものですが、あまり深く考えずに、作ったり、選んだり、使ったりしていることが多いようです。教員の立場では、小テスト、定期テストを自分で作ることもあるでしょう。模擬試験や実力テストなど、テスト機関が作成した民間試験(外部テスト)や教材会社のテストを選んで使うこともあるでしょうし、「全国学力・学習状況調査」や「高校生のための学びの基礎診断」を生徒に受けさせることもあるでしょう。入学試験担当者の立場では、自分たちでテストを作成することもあれば、民間試験を選んで使うこともあるでしょう。

テストを使う目的はいろいろあります。授業との関連では、テストの結果から生徒の理解度を把握し、成績をつける。入試との関連では、さまざまな情報とともに順位づけして、合否を決める。クラス分けテストでは、所属クラスを決める。単位認定に民間試験を使う場合には、民間試験の合格証明や一定以上のスコアに単位を与える。さらに、テスト後に返ってくるテストの結果を、学習や指導の改善にいかすことも、テストを使う目的に含まれます。

では、テストを選び、使う際には、皆さんはどんな点に気をつけているでしょうか。私の周りの教員や入学試験担当者に尋ねると、「時間がなく、テストについてあまり調べられていない」、「テストは専門でないが、分かる範囲でやっている」という答えがよく返ってきます。「テストは専門でない」という答えからは、テストを専門に扱う分野があると認識されていることがうかがえます。

第二言語としての英語や日本語などの言語のテストを専門に扱う学問分野は、「言語テスティング研究」と呼ばれます。言語テスティング研究は1960年代に本格的に始まった比較的若い分野です。とはいえ、多くの方が耳にしたことがあるかもしれない「第二言語習得研究」(第二言語がどのように習得されるかを調べる分野)も1960年代頃から始まりましたので、比較してもそれほど遅いわけではありません。

どちらも既に50年以上の積み上げがあります。言語テスティング研究は、「テストをどのように作り、使ったらよいか」、「テストの質をどう評価したらよいか」、「言語能力とは何で、テストでは何が測れるのか」などの問題に答えるために、さまざまな研究を重ねてきました。

本書は、言語テスティング研究でいわれていること、分かっていることを、分かりやすく提示することを目的としています。中でも、「英語テストを選び、使うこと」に重点をおいてまとめています。そうすることで、「テストを適切に選んで、有効に活用し、テストから教育を改善する」ための一視点を紹介できたらと思います。本書が、テストの選び方、使い方についての知識を含む、言語評価についてのリテラシー(language assessment literacy)を広める一助になることを願っています。

本書を読んでいただきたい方

この本は、英語のテストを選び、使うことが求められる方すべてに読んでいただきたい本です。
2017年に発表された、「中・高等学校教員養成課程外国語(英語)コア・カリキュラム」では、「学習評価の基礎」が重要事項として挙げられました。

「中・高等学校教員研修外国語(英語)コア・カリキュラム」でも、「評価に関する専門的知識」を身につけることが目標とされました。教員養成でも教員研修でも、評価は必須の知識となります。その知識の中には、小テストや定期テストなどを自分で作成して評価にいかす力だけでなく、既存のテストを適切に選び、結果を有効に活用する力も入っています。

例えば、「中・高等学校教員研修外国語(英語)コア・カリキュラム」の中には、「英語の外部資格・検定試験(4技能型)を活用した英語力の自己モニター」とあります。これは教員自身が、民間試験を受けて自分自身の英語力の伸びをたどっていくことが求められるという意味です。つまり、自身の英語力向上のために、適切なテストを選び、そのテスト結果を有効活用することが必要ということです。入試関係者も、説明責任を果たし、理由を説明できる形で英語4技能テストを適切に選ぶことが必要になります。

本書の特長と構成

本書は4つの章から成り立っています。第1章では、英語テストを選び、使う際に遭遇する悩みに触れ、テストについて持たれている誤解を解消していきます。第2章では、言語テスティング研究の成果にも少し触れます。テストを検討するときに最も重要な「妥当性(validity)」の捉え方や、その検証方法の理論について解説しています。第3章では、第2章で触れた「妥当性」の理論や検証方法を使って行った分析を、よく耳にするテストを中心に例として取り上げていきます。第4章では、英語テストを適切に選び、使うための実践方法や手順について説明しています。

第2・3章は、理解のために学問的な話も交えています。分かりやすく書くように努めましたが、複雑な概念だったり、専門用語を使う必要があったりするため、難しいと感じる方もいらっしゃると思います。その場合には、第2・3章を飛ばして、第4章を先に読み、気になる部分があったら第2・3章に戻るという読み方をされてください。そのような読み方をされる場合もあることを意識し、章間で繰り返しが見られることもありますが、ご了承いただければ幸いです。

1点ご留意いただきたいのは、本書は選ぶべきテストを具体的に伝える本ではないということです。テストを選び、使うのは、それぞれの状況に合わせて担当の方が行うことになります。選ぶための指針として、テスト選択と使用を適切に行うための方法と、それを支える言語テスティング研究の考え方をお伝えするのが本書の目的です。
なお、英語で書かれた文献についての記述は、それぞれの箇所に「筆者訳」などとは書いていませんが、筆者が訳しました。また本書は、安当性理論を詳しく知らない方でも理解できることを目的としているため、専門性の高い内容は、分かりやすさのために割愛しているところもあります。興味のある方は、本文の注に挙げた参考文献を読んでいただけると理解が深まります。加えて、本書で太字になっている語は「索引」に掲載され、下線がある語は「用語解説」に掲載されていますので、こちらもご参照ください。
2018年4月
小泉利恵

小泉 利恵 (著)
出版社: アルク (2018/4/11)、出典:出版社HP

目次

はじめに
第1章 テスト選択・使用の悩みと誤解
英語テストを選ぶ場面
大学入試のためにテストを選ぶ:大学側
大学入試のためにテストを選ぶ:高校側
その他の状況でテストを選ぶ
テストを選ぶときの悩み
大学入試選抜テスト選択の悩み
会話に出てきた注意したい用語・表現
英語テストを使う場面
「テストを使う」とは
テスト結果の使い方
テスト結果を使うときの悩み
スコアレポートに関連する悩み
テストを2回行ったときのテスト結果に関連する悩み
会話に出てきた注意したい用語・表現
言語テストへのよくある誤解
言語テストに対する誤認識
言語テストへの誤解を減らすために
まとめ
Column 1:4技能テストの利点と欠点

第2章 妥当性理論と妥当性検証
テストに必要な妥当性とその他の要素
妥当性とは?
妥当性の重要性
妥当性以外にテストに重要な要素
妥当性理論の概念とその要素
Messickによる妥当性の捉え方
妥当性の捉え方の変遷
Messickの妥当性の7つの特徴
Messickの妥当性の要素
Messickの妥当性検証
Messickの枠組みを使った妥当性検証の課題
Messickの枠組みを改善した研究者
1.要素のバランス関係で考える「テストの有用性」:Bachman and Palmer (1996)
2.妥当性を5つの観点から調べる「社会・認知的枠組み」:Weir (2005)
3.「論証に基づく枠組み」:Kane (1992)
Kaneの枠組みの修正
「評価使用の論証の枠組み」: Bachman and Palmer (2010)
6つの推論からなる「論証に基づく妥当性検証の枠組み」:Chapelle, Enright, and Jamieson (2008)
本書で使用する論証に基づく枠組み
Chapelle et al. (2008) Knoch and Chapelle (in press) toに基づいた枠組み
まとめ
Column 2:筆者の経験:言語テスティング研究や妥当性に関して

小泉 利恵 (著)
出版社: アルク (2018/4/11)、出典:出版社HP

第3章 4技能テストの妥当性検証
妥当性検証での推論の設定
妥当性検証における推論の組み合わせ
推論の組み合わせと妥当性の主張の関係
受容技能と発表技能での妥当性検証の違い
スピーキングテストの妥当性検証
個別検証:TSST
個別検証:GTEC CBT
個別検証:TOEFL iBT
ライティングテストの妥当性検証
個別検証:Criterion
個別検証:TOEFL iBT
個別検証:ケンブリッジ英語検定
リスニングテストの妥当性検証
リスニングテストでの枠組み
個別検証:VELC Test
個別検証:IELTS
個別検証:TOEIC
リーディングテストの妥当性検証
個別検証:英検
個別検証:台湾のテスト General English Proficiency Test
4技能テストの波及効果の検証
個別検証:TEAP
個別検証:IELTS
個別検証:大学入試への4技能テスト導入の波及効果
4技能テストのスコアレポートの検証
個別検証:GTEC for STUDENTSと英検
マイナスの証拠について
マイナスの証拠が出たときには
まとめ
Column 3多様な妥当性の捉え方に関して

第4章 テストを適切に選び、使う方法
テストを適切に選ぶ
テスト選びのステップ
テストの波及効果(Q1)
テストを使う目的(Q2)
測りたい言語能力/構成概念 (Q3)
多様な評価法とテストの利点(Q4.Q5)
既存のテストの入手可能性(Q6)
自分でテストを作る必要はあるか (Q7)
Q1.~Q7.に答えた後に
テスト選択時の悩み:解決編
大学側がテストを選ぶとき
テスト使用のステップ
テストの前後の指導時の留意点
テストスコア返却前と返却後の留意点
スコアレポートに含めるべき要素
テスト問題全面公開の利点と欠点
テストの誤差
平均への回帰
テスト使用時の悩み:解決編
スコアレポートを使うとき
テストを2回行ったテスト結果を使うとき
まとめ
Column 4:4技能テストが大学入試に導入されたときの波及効果の予測と、各利害関係者が取るべき行動
付録(Appendices)
用語解説
資料
参考文献
索引
終わりに

小泉 利恵 (著)
出版社: アルク (2018/4/11)、出典:出版社HP