これまで英語力を測るテストとして国内では、TOEICや英検がもてはやされてきました。
しかし、ウィズコロナの今、もしかしたら社会人におけるTOEICと英検の価値は、これから下がるかもしれません。
なぜなら、この2つの英語検定に変わる新たな勢力が台頭してきたからです。
それは、AIが採点を自動で行う「AIスピーキングテスト」です。
なぜ今、AIスピーキングテストの人気が急激に高まっているのでしょうか?
企業を中心に、TOEICのスコアを英語力の指標としてきた時代は、すでに過去のものになろうとしています。AIスピーキングテストの流行は、英語学習のあり方を根本から揺さぶっています。
今回は AIスピーキングテストの「今」を緊急レポートします。
おすすめのAIスピーキングテスト(&一般のスピーキングテスト)を知りたい方は、こちらにリストを作りましたので、以下をクリックしてください。
→英語スピーキングテスト【11選】AI・無料・有料おすすめテストはどれ?
なぜAIスピーキングテストは流⾏っているのか
英「会話」力を反映していないTOEIC
TOEICのスコアを上げることを目標に、英語学習に取り組んでいる人は数多くいます。
もしかしたら、あなたもその一人かもしれません。
なぜなら従来までは、企業が個人の英語力を測る指標としてTOEICのスコアを重視してきたからです。
企業は人員採用の基準として600点とか700点以上を求める傾向にあり、それに伴い大学でも授業とは別にTOEIC対策に力を入れるようになりました。
企業の英語研修においてもTOEICのスコアが目標として設定され、海外部門の人員選定にも当然ながらスコアが基準とされました。ビジネスシーンにおいて、TOEICのスコアは大きな影響力を及ぼしています。
気がつけば、いつのまにか英語を学ぶ日本人の大半は、TOEICの点数を上げようと血眼になって取り組むようになっていました。
その結果として、TOEICの点数アップばかりが目標となり、受験テクニックが大きくものを言うようになったのです。
私自身も以前にTOEICを受験した際は、少しでも点数を伸ばしたかったのでTOEIC塾に通ったことがあります(実際そのおかげで75点伸びました)。
ただし、TOEICのスコアが評価されるのは、基本的には日本国内に留まっています。
ご存知かもしれませんが、もともとTOEICは、日本人が発案し、TOEFLで定評のあるアメリカのETSに依頼して開発されたテストです。
日本生まれの英語力判定システムが世界スタンダードになることを目指してスタートしたものの、厳しい現実が待っていました。
日本以外では韓国の企業が広く採用していますが、それだけです。日本と韓国以外では、国際的にTOEICはほとんど知られていません。
TOEICでどれだけ高いスコアを出そうとも、日本と韓国を離れるとまったく通用しない、ということです。
さらにTOEICの問題は、英会話力を反映していないことです。
TOEIC900点をとっている人の多くも上級者ではない
TOEICはペーパーテストを前提としているため文法中心であり、英会話力の指標にはなりえません。テストで聞く・読むという力は測れても、実際に話せるとは限らないからです。
これは実際にAIスピーキングテスト「VERSANT」が公開しているデータを見れば明らかです。
英会話が話せる最低ラインがVERSANTの条件でいえば「47点」です。
スコア分布表を見ると、多くのTOEIC700点台、800点台の人たちがこの47点のラインに達していません。
更にVERSANTでは英会話力上級者の最低ラインを58点と定義していますが、こちらもグラフを見る限り、TOEIC900点台でも上級者はほとんどいません。
*実際に「TOEIC900点〜990点の平均は54点」とVERSANTに載っている。
それゆえに、現にいくら点数が高くても、実際にはまともな英会話をこなせない人が多いと、各方面から指摘されています。
「英会話力の指標にはならないけど、基礎力の把握や、そこまで点数を上げた努力の証が見られる」という、本来の目的ではない見方をする企業も多いです。
ウィズコロナの時代となり、企業では真の英会話力を求める動きが加速しています。それに伴い、「努力の証」などと言っている余裕はなくなりました。
もはやTOEICや英検ではなく、英会話力を指し示す新たな基準を求める声が高まっています。求められているのは「すぐに使える人材」かどうか、つまり英語スピーキング力の可視化です。
ウィズコロナの時代が求める英語力とは!?
リモートでプロセスが評価しづらくなった
否応(いやおう)なしにウィズコロナの時代を迎えた今、ビジネスシーンにおいてリモートワークの導入が大きく加速しました。
多くの企業でリモートワークが採用されたことにより、私たちのビジネス環境も大きく変化しました。なかでも企業が社員に下す評価基準が様変わりしたことは、深刻な影響を投げかけています。
リモートワークが普及したことにより、会社側としても目に見える成果のみでしか評価できなくなったため、プロセスではなく「成果こそが評価の基準」とされる傾向が強まっています。
同様に、英語の活用についても、コロナ以前と以後では比較にならないほど変わりました。
海外渡航が事実上できなくなり、Face to Faceのコミュニケーションが難しくなった今、リモートによる外国人スタッフとの協働やマネジメント、外国人客との交渉が求められています。
従来までは、通訳を入れれば問題なかったミーティングでも、Zoomミーティングとなれば全員が一度に会話できないため、通訳の回数が多くなればなるほど、相当な時間のロスになります。
そのため、英会話ができないことでZoom会議から外れる方も、少なくありません。
英語ができる人はますます活躍の機会が与えられ、できない人は活躍できなくなる現状がすでにあります。
また、日本語を通さずに英語で考える力がなければ、ライティングスピードも上がりません。メール一つ打つのに毎回google翻訳やDeepL翻訳を使うわけにはいかないでしょう。
ウィズコロナの時代に渇望(かつぼう)されているのは、英会話力に優れた人材です。
しかし、企業としても英会話力の高い人材の採用と育成を経営課題に据えながらも、それを実践する手立てが見つからず、手をこまねいているのが現状です。
だからこそ、英会話力を正確に測り、適切な評価を下せる指標が求められているのです。
それらの難しい要望をすべて適えるべく登場したのが、以下でご紹介するAIスピーキングテストです。
AIスピーキングテストの背景
これまで英会話力を測るためには、試験官が必要でした。試験官を相手に実際に英会話をこなさなければ、その人の英会話力を測る術がなかったためです。
しかし、これでは試験官の主観に左右される可能性があるため、公平性に欠け、正確な判定を望むには無理があります。さらに試験官を手配するための手間もかかれば、人を介することでコストが上乗せされ、受験料が跳ね上がるという悪循環を生みました。英検の2次面接がまさにこれです。
一方、TOEICスピーキングテストには直接英会話をかわす試験官はいないものの、採点自体は担当者が行っているため、個々の主観に左右されるという従来からの問題点を克服するには至っていません。
結局のところ、目には見えない英会話力を人の経験や感覚に頼って測ること自体に、問題があるということです。
このような背景から誕生したのが、AIを用いた英会話力の判定テストです。
AIは受験生全員のスコアを同一のルーティンを当てはめて弾き出すため、完全に公平です。大量のサンプルから評価を下すため、その正確性には信頼を寄せられます。
さらにAIが採点を行うことで、これまでの英語検定と比べてさまざまなメリットが生まれています。
AIスピーキングテストの3つのメリットとは
現在、各社から多くのAIスピーキングテストが開発され、提供されています。提供開始から、まだそれほどの日数は経過していないにもかかわらず、すでに多くの企業や個人がAIスピーキングテストを採用し、日を経るごとに人気が高まっています。
TOEIC一色に染まっていた国内事情にも、大きな変革が訪れているといえるでしょう。企業が個人の英語力を測る基準として、TOEICからAIスピーキングテストへと鞍替えする動きは加速しています。
AIスピーキングテストには、主として3つのメリットがあるからです。
– 1. 英会話力を客観的に数値化できる –
英会話力の可視化は、多くの企業や個人が求めていたことです。
この難題を、AIはいとも簡単に解決してみせました。AIが採点を自動的に処理することにより、主観に左右されることなく、誰であろうと公平に客観的に数値化することに成功したのです。
AIの強みは、大量のサンプルをもとに正確な英会話力を判定できることです。総合得点からは、「海外旅行が楽しめる・海外赴任ができる・ビジネス英会話ができる」等々のレベルに達していることが、はっきりと示されます。
さらに、ほとんどのAIスピーキングテストでは総合得点だけではなく、発音・流暢さ・語彙力などの項目ごとに数値化されます。
これにより、自分の弱点を客観的につかむことができ、改善に向けて努力できるようになります。
基本的に英会話力は、学習を続けていてもどの程度身についたのか、自分ではなかなかわからないものです。それだけにモチベーションを維持するのは大変です。でも、数値化することで新たな目標を設定しやすく、高いモチベーションを維持できるようになります。
企業にしても、自社で必要とされる英会話力をAIスピーキングテストのスコアをもとに計ればよいため、人員採用にしても、研修にしても、方針を立てやすくなります。
– 2. 手軽に受けられ、結果もすぐに出る –
これまではテストを受けるために、試験会場まで足を運ぶ必要がありました。そのため移動の手間もかかれば、交通費も発生します。
また、新型コロナウイルスが蔓延している今、たとえしっかりした感染対策が為されていようとも、不特定多数の受験生が集まる会場に赴くことにはリスクが伴います。
ところがAIスピーキングテストは、これらのリスクを完全に一掃しました。パソコンかスマホがあれば、どこにいても何時でも、思い立てばすぐに受験できるからです。
わざわざ試験会場に出向く必要はなく、自宅から受けられるため、感染リスクはゼロです。
大半のAIスピーキングテストは、アプリやwebページにアクセスするだけで始められ、AIが投げかけてくる質問に口頭で答えるだけです。
試験時間も短く、おおよそ10分程度ですべて終わります。これまでのようにテストに1時間も2時間もかけなくて済みます。
さらに優れているのは、判定結果が出るまでの時間です。これまではTOEICや英検等、結果が手元に届くまでに2週間、あるいは1ヶ⽉も待たされることが普通でした。
では、AIスピーキングテストは、何日ほどで結果が出ると思いますか?
AIスピーキングテストによって多少の違いはあるものの、おおよそ15分もあれば、結果を確認できます。
片や2週間から1ヶ月、片や15分です。どちらが望ましいかは、比べるまでもないでしょう。
このように AIスピーキングテストは、従来までのテストに比べて圧倒的に楽です。
しかも、公平性と正確性が担保されているとあっては、多くの英語学習者がAIスピーキングテストに流れるのは当然といえます。
– 3. 従来よりコストが低い –
AIを用いることで、試験官を雇う必要がなくなりました。テストの際のインタビューから採点までAIが自動的に対処するため、人件費を大幅にカットできます。
さらに、従来まではテストのスケジューリングにも多くの人が携わり、多大な人件費を要したものですが、そもそもAIを用いればスケジューリングさえ不要のため、会場費を含め、丸ごと経費を減らせます。
こうしたことから、既存のテストに比べてAIスピーキングテストは低コストで実施できるため、受験料の大幅な引き下げを可能にしました。
受験する側としては、受験料が安くなり、なおかつ手軽に受けられるとあって、まさに願ったり叶ったりです。結果として、従来に比べてテストを受ける頻度を高められるようになりました。
気軽に何度も受けることで自分の英会話力を、その都度確認できます。AIスピーキングを英語学習における羅針盤にできるようになった、ということです。
AIスピーキングテストが、英語学習のあり方を根本から変えようとしています。
ここまで、AIスピーキングテストの3つのメリットについて紹介しました。
これまで、「TOEICに代わる別の指標を!」と長らく言われていたものの、現実的には為し得ずにいました。IELTSやTOEICスピーキング、英検などでは、いずれもうまく代用できなかったのです。
なぜなら試験自体が場所や時間に縛られる、結果待ちが長い、価格が高いなど多種多様な課題を抱えていたためです。
しかし、それらの課題をすべて解決してみせたのがAIスピーキングテストです。
今後はAIスピーキングテストが、TOEICに代わって英語力の指標になっていくことは間違いありません。
そこで問題となるのが「どのAIスピーキングテストを選べばよいのか?」です。
今、人気のAIスピーキングテストはこれ!
英語教育業界においても、AIスピーキングテストの採用が急速に進んでいます。レアジョブやネイティブキャンプなどのオンライン英会話系、EgihCmayやトライズのようなコーチング系、プログリッツ・ESのようなアプリ系、その他にも法⼈向けにサービスを提供している企業も続々と増えています。
それぞれの企業ごとに、自社の英語教育サービスを充実させるためにはAIスピーキングテストの採用が欠かせない、と判断した結果です。
もっとも、ひとまとめに「AIスピーキングテスト」といっても、そのアルゴリズムやAIの活用方法はさまざまです。
採用する側としては、それら各種のAIスピーキングテストを比較しながら、ひとつを選ばなければいけません。
では、どのAIスピーキングテストが人気なのでしょうか?
各社が実際にどのAIスピーキングテストを採用したのかを眺めてみると、現時点でのAIスピーキングテストの勢力図が、はっきりと見えてきます。
国内において多くの顧客を獲得しているのは、3つのAIスピーキングテストに限られます。
イギリスに本社を置くピアソンで開発されたVERSANT、オンライン英会話の草分けとして知られる日本企業のレアジョブが開発したPROGOS、中国のchivox社が開発したCHIVOXの3つです。
それぞれのAIスピーキングテストについて、掘り下げてみましょう。
その1.最も有名なのはVERSANT
世界規模で見たとき、AIスピーキングテストの市場をリードしているのは、イギリスのロンドンに本部を置くピアソン社が開発したVERSANTです。
AIスピーキングテストの優秀さを認知させる上で、VERSANTが果たした役割は極めて大きいといえます。
高度な言語認識・自動採点システムを利用することで、スマホやパソコンがあれば日時や場所を問わず受験ができる手軽さに加えて、ビジネスで使える英語力を正確かつスピーディーに測定・分析できることは、世界に衝撃を与えました。
今やVERSANTは世界各地のグローバル企業で採用されることはもちろん、米国防総省などの世界中の政府機関においても、英語力を測るテストとして導入されています。
日本においても大手企業をはじめ、コーチング式英会話で有名なPROGRITやTORAIZにて、正式に採用されています。
VERSANTスピーキングテストにかかる時間は約20分です。その間、全63問の出題が為されます。ネイティブが話すナチュラルスピードで次々に流れる英語の質問に、英語で答えていくだけです。
英語力の目安となるスコアは、20~80点で採点されます。スコアはGlobal Scale of English(GSE)やCEFR(セファール)のスコア基準に準拠しています。CEFRとは、言語の習得状況を評価するために考案されたすべての言語に共通の「ものさし」のことで、ヨーロッパで作られました。
ですからVERSANTのスコアをCEFRと照らし合わせることで、自分の現在の英語力を正確に測れます。
VERSANTは「文章構文・語彙・流暢さ・発音」の4つの評価項目の合算として得点を出すため、それぞれの項目ごとに自分の得手不得手をはっきりと確認できます。
私も受けたことがありますが、TOEICスピーキングテストとは比較にならないほど早く、詳細で正確な英会話力が判定されることに驚きました。
受験をしてみた感想と結果はこちらを記事をご覧ください。
→英語試験【VERSANT】を受講、何点取れるか?
ただし、TOEICと同じで、どちらかといえばビジネスマン向けです。社会⼈、もしくは⼤学⽣が就職⽬的として個⼈で受けるのであれば、VERSANTがおすすめです。
VERSANTについての詳しい内容はこちらをご覧ください。
→英語資格試験【VERSANT】で目標設定を!日本人平均、海外赴任のスコア目安付き
その2. レアジョブが開発したPROGOS
AIスピーキングテストの世界標準になりつつあるVERSANTに対抗し、日本で生まれたのが、レアジョブが開発したPROGOSです。
VERSANTはCEFRに基づいてスコアを出していましたが、PROGOSではCEFRをベースとしながらも、日本人の英語能力に合わせて更に設定を細分化したCEFR-Jを基準にスコアを算出しています。
CEFR-Jでは全12段階にて英語の語彙や文法・表現のレベル付けを行っているため、「英語を使って何ができるか」を日本人向けにより細かく設定できるようになりました。
これにより VERSANTのスコアよりも、より細分化された目標設定ができます。英語の苦手な日本人に特化しただけあって、日本人の英語力に寄り添ったテストといえます。
テストにかかる時間は約20分、測定結果は最短2~3分で出されます。
総合評価の他に、「表現の幅・正確さ・流暢さ・やりとり・一貫性・音韻」の6つのスキルについて、レベルと評価が下されます。
料金設定もリーズナブルです。レアジョブでは人間が行うテストの価格は2980円ですが、PROGOSは500円で受けられます。
中央大学では全学生25,000人を対象としたプログラムとしてPROGOSの利用を始めており、法人も既に3200社以上が試しているようです。
レアジョブは今後、PROGOSは「3年後には年間のべ100万人受験を実現するサービス」として、普及と定着を目指すと発表しています。
日本生まれのAIスピーキングテストの動向がどうなっていくのか、今後に注目です!
その3.注目度ナンバー1の CHIVOX
世界規模の知名度においてVERSANTを激しく追い上げているのが、中国の企業が開発したCHIVOXです。
膨大な人口を擁する中国市場をほぼ独占しているだけに、利用者数ではすでにVERSANTを追い抜いているとも指摘されています。
中国の英語教育サービス市場では、約60%をCHIVOXが占有しています。上海市や江蘇省等の自治体が行う大学入試および高校入試においては、英語スピーキングテストの自動採点システムとして利用されるなどの実績を残しています。
中国以外でも132の国と地域で利用されており、グローバルでは1,000社以上に採用され、1億3,000万人を超える英語学習者にサービス提供が行われています。
CHIVOXの強みはオープンクエスチョンに対する回答を自動評価し、評価の正確性と安定性の両立を実現していることです。
「オープンクエスチョン」とは、口頭作文、絵を見て回答する問題、物語の要約等々、固定した回答が存在せず、回答の自由度が高い質問のことです。
オープンクエスチョンに対する回答を評価することは、音声評価技術にとって長いこと大きな課題でした。CHIVOX社では音声評価技術の研究開発を2011年から始め、広東省や遼寧省でのスピーキングテストの自動評価に関する実証実験を重ねることで、ついに課題をクリアしました。それが、CHIVOXです。
オープンクエスチョンに対する回答を、総合点ばかりでなく、「内容・発音・文法・流暢性」の項目別に評価できる多次元音声評価技術こそがCHIVOXです。
この「オープンクエスチョン」に強いという特徴は、他のAIスピーキングテストにはない活用法をCHIVOXに与えました。
次節で詳しく紹介します。
どのAIスピーキングテストを受けても同じ? 違いはあるの!?
その1.AIの優秀さは受験者数に左右される
日本国内においては、VERSANT・PROGOS・CHIVOXの3つのAIスピーキングテストが、市場拡大を狙って激しく凌ぎ合っています。
では、受験する側としては、どのAIスピーキングテストを選べばよいのでしょうか?
そもそも、3つのAIスピーキングテストに違いはあるのでしょうか?
3つとも最先端のAIを使って自動採点のシステムを作っていることには変わりがありません。ということは、どれを使っても、それほど大差はないようにも思えますが、本当のところはどうなのでしょうか?
たしかに現時点では、各テストを受けてみてとれたスコアをCEFRに照らし合わせてみれば、ほぼ同じ結果が得られることでしょう。
ただし、今後は正確性に大きな差が出てくる可能性があります。
なぜなら、AIの精度はディープラーニング(深層学習)に大きく依存するからです。「ディープラーニング」とは、十分なデータ量があれば、人間の力なしに機械が自動的にデータを分析することで特徴を抽出し、自ら学習する仕組みのことです。
つまり、人間は何をしなくてもAIが勝手に学習を深め、どんどん賢くなっていく、ということです。
ここで重要なのは、より豊富なデータをAIに提供することです。
たとえば、スタート時点ではほぼ実力が同じAIに対して、片や10万、片や1000万のデータを与えるとすれば、ディープランニングを終えた後には、双方のAIに大きな実力差が生まれます。10倍のデータを分析した後者のAIの方が、より正確性を増しているからです。
AIスピーキングテストで言えば「データ」とはすなわち、実際にそのAIスピーキングテストを受けた人の数です。
そうなると、3つのAIスピーキングテストのなかで、もっとも有利なのは間違いなくCHIVOXです。
中国市場をがっちり抑えているCHIVOXは、毎月6億回のテストを実施していると発表しています。これは、さすがに他とは桁違いのデータ数といえます。
VERSANTは毎月の受験者数を公表していないため詳細は不明ですが、全世界で実施されていることから、それなりの数は確保していると考えられます。それでも毎月、億単位に達するとは考えにくいものがあります。
PROGOSは国内市場だけに留まるため、受験者数ではVERSANTにもCHIVOXにも遠く及びません。3年後に年間のべ100万人を目指すとしていますが、たとえそれが実現したとしても、CHIVOXの月間6億回とは比較になりません。
今後、歳月を経るごとにCHIVOXのAIの精度はますます高くなると予想されます。その精度は、すでにGOOGLEを超えているとも指摘されています。
しかも、今この時点でも、CHIVOXは確実に進化を遂げています。まさに驚異的な進化スピードといえるでしょう。
これからも、AIスピーキングテストを目的とするAIが次々に開発されると予測されますが、恐らくCHIVOXに追いつくことは難しいと思われます。
その2.出題内容によって評価に違いが生じる
実はCHIVOXには、VERSANTやPROGOSと大きく異なることがあります。
それは、CHIVOX社が提供しているのはAIのエンジン部分だけであり、AIスピーキングテストとして完成品が引き渡されるわけではない、ということです。
そのため、AIスピーキングテストとして完成させるためには、購入側がテストを作る必要があります。
これには、余計な手間がかかるというデメリットが生じるものの、実はそれを補って余りあるメリットが存在します。
それは、購入した側が自社の対象とするユーザーに寄り添った出題を自由に組めることです。
VERSANTやPROGOSは出題を含めAIスピーキングテストとして完成しているため、導入を決めた企業が手を加える余地はありません。
ところがCHIVOXの場合は導入する企業によって、完成するAIスピーキングテストの形をいかようにも変えられるのです。
たとえば、出題を中学生や高校生、あるいは大学生向けにすることで、VERSANTやPROGOSとはまったく違ったAIスピーキングテストが誕生します。
VERSANTにしてもPROGOSにしても、基本的には対象は社会人のため、出題も社会人に焦点を合わせた内容になっています。そのため、中学生~大学生がテストを受けてみても、出題される内容が身近な話題ではないため、どうしてもピントがずれた感じを拭えません。
学生をターゲットとする企業がCHIVOXを導入すれば、こうした不具合を完璧になくせます。
実際に、教育機関や法⼈向けの海外研修の企画やコンサルティングを中心に、オンライン留学にてe-グローバル研修やオンライン英会話「ClassLive」を提供する株式会社ジージーでは、CHIVOXを導入することで初心者から大学生向けに完成させたAIスピーキングテストの提供を始めています。
また、オンライン英会話のネイティブキャンプでも、CHIVOXを活用することで、従来のテスト内容とは一線を画した親しみやすいオープンクエスチョン形式を中心とするAIスピーキングテストを完成させました。
導入する側の工夫次第で、どのようにでも化けるのがCHIVOXの利点です。
そうした技術を支えているのは、先に説明した「オープンクエスチョン評価」の精度です。オープンクエスチョンを判定できるからこそ、自由な出題が可能になったといえます。
このように、VERSANT・PROGOS・CHIVOXの3つは、スピーキングテストの採点をAIが自動的に行うことに変わりはないものの、それぞれの特色に基づいた違いを鮮明にしています。
つまり、3つのAIスピーキングテストには大きな差がある、ということです。
VERSANTであれば社会人向けの出題となるため、あくまでビジネス現場において、あなたの英語力はこの程度に使えますよと、評価されるに留まります。「海外旅行でどの程度役に立つのか、単語力がどの程度あるか?」のような評価は出てきません。
そのため、小学生〜高校生ぐらいに向いているかといえば、そうは思えません。
小学生〜高校生では、英語力が超初心者〜初心者の方がほとんどです。そのようなレベルの人に、ビジネス現場を元にした評価を下されても、意味をなしません。
ボキャブラリーや文法の知識が少ない初心者であっても、少しでも英語力の進展があれば点数や評価として反映されるAIテストが求められているはずです。
現時点では、その要望を完全に満たせるAIはCHIVOXだけです。
ですから結論として、社会人であればVERSANT、レアジョブのオンライン英会話をすでに始めているのであればPROGOS、小学生から大学生までの学生であればCHIVOXで開発しているAIスピーキングテスト(ネイティブキャンプやクラスライブで受講可能)がおすすめです。
次回は、注目度がずば抜けて高いCHIVOXについて、さらに深掘りしてみます。