JP7258627B2 - 採点支援装置、その方法、およびプログラム - Google Patents

採点支援装置、その方法、およびプログラム Download PDF

Info

Publication number
JP7258627B2
JP7258627B2 JP2019062727A JP2019062727A JP7258627B2 JP 7258627 B2 JP7258627 B2 JP 7258627B2 JP 2019062727 A JP2019062727 A JP 2019062727A JP 2019062727 A JP2019062727 A JP 2019062727A JP 7258627 B2 JP7258627 B2 JP 7258627B2
Authority
JP
Japan
Prior art keywords
correct
scoring support
support device
list
scoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019062727A
Other languages
English (en)
Other versions
JP2020160388A (ja
Inventor
哲 小橋川
寿昇 土橋
高雄 中村
亮 増村
歩相名 神山
裕司 青野
公誉 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Advanced Technology Corp
Nippon Telegraph and Telephone Corp
Original Assignee
NTT Advanced Technology Corp
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Advanced Technology Corp, Nippon Telegraph and Telephone Corp filed Critical NTT Advanced Technology Corp
Priority to JP2019062727A priority Critical patent/JP7258627B2/ja
Publication of JP2020160388A publication Critical patent/JP2020160388A/ja
Application granted granted Critical
Publication of JP7258627B2 publication Critical patent/JP7258627B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

特許法第30条第2項適用 ▲1▼ウェブサイト掲載日 2018年10月29日 ウェブサイトのアドレス 日本電信電話株式会社 ニュースリリース http://www.ntt.co.jp/news2018/1810/181029b.html https://resemom.jp/article/2018/10/29/47436.html https://ict-enews.net/2018/10/30ntt/ https://news.mynavi.jp/article/20181029-715377/ ▲2▼ウェブサイト掲載日 2018年11月01日 ウェブサイトのアドレス NTT R&Dフォーラム2018秋 https://labevent.ecl.ntt.co.jp/forum2018a/info/exhibit2/detail/F03.html https://labevent.ecl.ntt.co.jp/forum2018a/elements/pdf_jpn/F03_j.pdf ▲3▼展示日 2018年11月25日 展示会名 NTT R&Dフォーラム2018秋 開催場所 NTT武蔵野研究開発センタ ▲4▼ウェブサイト掲載日 2019年3月1日 ウェブサイトのアドレス エヌ・ティ・ティ・アドバンステクノロジ株式会社 ニュースリリース ウェブサイト https://www.ntt-at.co.jp/news/2019/detail/release190301.html ▲5▼ウェブサイト掲載日 2019年03月01日 ウェブサイトのアドレス NTTテクノクロス株式会社 ニュースリリース ウェブサイト https://www.ntt-tx.co.jp/whatsnew/2019/190301.html ▲6▼販売日 2019年03月04日 エヌ・ティ・ティ・アドバンステクノロジ株式会社 ウェブサイト https://www.ntt-at.co.jp/product/knoun/ ▲7▼販売日 2019年03月04日 NTTテクノクロス株式会社 ウェブサイト http://www.v-series.jp/speechrec/ ▲8▼販売日 2019年03月04日 株式会社文理 ウェブサイト https://bts.bunri.co.jp/Series/Details/10003
本発明は、問題文に対する音声回答の採点を支援する採点支援装置、その方法、およびプログラムに関する。
非特許文献1では、非母語話者モデルの音声認識結果に対して、母語話者モデルで音素を置換する文法で音声認識を行い、発音誤り候補を出力する。
張昊宇,齋藤大輔,峯松信明,小橋川哲、「日本人英語の発音多様性のモデル化と音素誤り自動検出への応用」、日本音響学会講演論文集、2-Q-4、2018年
従来技術を利用して、非母語話者の(学習言語の)音声回答に発音誤りがないかを採点する採点支援装置が考えられる。
しかしながら、従来技術では、問題に対する正しい回答(正解文)が一意に分かっている必要があるため、正解文に対応する読み上げ音声にしか適用できない。
本発明は、正解文ありきの読み上げ音声以外にも適用できる採点支援装置、その方法、およびプログラムを提供することを目的とする。
上記の課題を解決するために、本発明の一態様によれば、採点支援装置は、問題文に対する音声回答の音声認識結果と問題文に対応する少なくともひとつの正解文を含む正解文リストに対応する正解情報とを用いて、音声回答の評価を求める採点支援部を含む。
本発明によれば、正解文ありきの読み上げ音声以外にも適用できるため、学習教材の幅が拡がる。
第一実施形態に係る採点支援装置の機能ブロック図。 第一、第三~第六実施形態に係る採点支援装置の処理フローの例を示す図。 データの例を示す図。 第二実施形態に係る採点支援装置の機能ブロック図。 第二実施形態に係る採点支援装置の処理フローの例を示す図。 第三実施形態に係る採点支援装置の機能ブロック図。 第四~第六実施形態に係る採点支援装置の処理フローの例を示す図。
以下、本発明の実施形態について、説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<各実施形態のポイント>
第一実施形態では、正解文に含まれるキーワードと、音声認識結果に含まれるキーワードのみに絞り、その合致率を評点とする。
キーワードに基づく合致率の場合、音声認識結果に含まれるキーワードの中の一部の文字が異なるという小さな誤りで全体の評価が大きく下がってしまう。この課題を解決するために、第二実施形態では、文字単位での合致率を評点とする。
第一実施形態ではキーワード選定の方法の制御が難しい。そこで、第三実施形態では、出題者の意図に合わせた評価を行うため、正解文を正規表現として表現し、音声認識結果と正規表現との比較を行い、比較結果を評点とする。
第四実施形態では、正解文に対応するキーワード、正規表現等の準備コストを削減するため、音声認識結果と正解文との比較により、正解精度を評点とする。
教室等で使用するシーンを考えると、発話者が正しく発声していても、周囲の音声雑音による悪影響が生じる場合がある。そこで、第五実施形態では、挿入誤りを考慮しない認識率を評点とする。また、文頭、文末を除く文中の挿入誤りは、間違えの可能性があるので、挿入誤りを無視するのは、文頭・文末に絞る。加えて、長い文の場合は、文中の句と句に間が空く可能性があるので、句末・句頭間の挿入誤りを無視しても良い。
評点そのものを学習者に提示すると、雑音等による影響で不当に悪い点が付いた場合、採点支援装置に対して悪い印象を持ってしまう可能性がある。そこで、第七実施形態では、評点の範囲に応じて分類し、分類結果を評価結果として提示する。
<第一実施形態>
第一実施形態では、問題文に対する正解文を少なくともひとつ含む正解文リストに含まれるキーワードのみに絞り、音声認識結果との合致率を求め、求めた合致率を評点とする。
図1は第一実施形態に係る採点支援装置の機能ブロック図を、図2はその処理フローの例を示す図である。
第一実施形態に係る採点支援装置は、音声認識部110と、キーワード作成部120と、採点支援部130とを含む。
第一実施形態に係る採点支援装置は、正解文リストと回答音声を含む音声信号とを入力とし、回答音声に対する評価を行い、評点結果を出力する。
採点支援装置は、例えば、中央演算処理装置(CPU: Central Processing Unit)、主記憶装置(RAM: Random Access Memory)などを有する公知又は専用のコンピュータに特別なプログラムが読み込まれて構成された特別な装置である。採点支援装置は、例えば、中央演算処理装置の制御のもとで各処理を実行する。採点支援装置に入力されたデータや各処理で得られたデータは、例えば、主記憶装置に格納され、主記憶装置に格納されたデータは必要に応じて中央演算処理装置へ読み出されて他の処理に利用される。採点支援装置の各処理部は、少なくとも一部が集積回路等のハードウェアによって構成されていてもよい。採点支援装置が備える各記憶部は、例えば、RAM(Random Access Memory)などの主記憶装置、またはリレーショナルデータベースやキーバリューストアなどのミドルウェアにより構成することができる。ただし、各記憶部は、必ずしも採点支援装置がその内部に備える必要はなく、ハードディスクや光ディスクもしくはフラッシュメモリ(Flash Memory)のような半導体メモリ素子により構成される補助記憶装置により構成し、採点支援装置の外部に備える構成としてもよい。
<採点支援方法>
本実施系形態では、以下のように採点支援を行う。
(i)ある言語(以下、学習言語ともいう)を母国語としない話者(以下、非母語話者、または、学習者ともいう)に問題文を何らかの方法で提示する。例えば問題文を記載した紙を提示したり、ディスプレイ等の出力装置に問題文を表示する。
(ii)学習者が学習言語で問題文に対し発話により回答し、回答音声を収音する。
(iii)問題文に対する正解文と、回答音声を含む音声信号を音声認識した音声認識結果との合致率に基づき採点し、採点結果を学習者に何らかの方法で提示する。
例えば、問題文を「『私は貴方が好きです。』の英訳を答えよ。」とし、正解文を「I love you」とする。なお、正解文を少なくとも1つ含むリストを正解文リストと呼ぶ。問題文に対する正解文は1つとは限らないので、正解文リストは1つ以上の正解文を含む(図3参照)。例えば、正解文リストには、上述の正解文に加え「I like you」を正解文として加えてもよい。なお、問題文が複数ある場合には、問題文毎に正解文リストを用意する。
以下、上述の採点支援を実現するための各部の処理について説明する。
<音声認識部110>
入力: 回答音声を含む音声信号
出力: 音声認識結果(文または音声認識処理単位)
処理内容:
音声認識部110は、音声信号に対して、音声認識を行い(S110)、音声認識結果をテキストとして出力する。
音声認識としては様々な方法が考えられる。例えば、参考文献1の方式等を用いて、非母語話者音声に頑健な手法を用いても良い。
(参考文献1)増村亮,椛島優,森谷崇史,小橋川哲,山口義和,青野裕司,「ネイティブ日本語とネイティブ英語の音声データを活用した日本人英語向けニューラル音響モデルの検討」,日本音響学会講演論文集,1-2-2, 2018年
ここで出力される音声認識結果は、文または音声認識の処理単位に対応する文の一部である。この例では、音声認識結果を「I love you」とする(図3参照)。
<キーワード作成部120>
入力: 正解文リスト
出力: 正解文リストに対するキーワードリスト
処理内容:
キーワード作成部120は、正解文リストに含まれる正解文からキーワードを抽出し、キーワードリストを作成する。1つの正解文に対して1つのキーワードリストを作成し、1つのキーワードリストには1つ以上のキーワードが含まれる。この例では、キーワードリストは「love」というキーワードを含むリストとする(図3参照)。
キーワード抽出処理としては様々な方法が考えられる。例えば、ルールに基づきキーワードを抽出してもよい。以下、二つのルールを例示する。
(ルール1)名詞や前置詞、動詞等の所定の品詞をキーワードとして抽出するというルールを予め設定し、このルールに従い正解文からキーワードを抽出する。なお、品詞以外にも予め定めた少なくともひとつの言語属性を有することをルールとして予め設定してもよい。
(ルール2)予め抽出対象となるキーワードを設定しておき、正解文から設定したキーワードと一致するものを抽出する。
例えば、ルール1の場合、正解文に対して形態素解析を行い、形態素解析結果を元に、所定の品詞のみをキーワードとして抽出する。上述のルール1,2を組合せて、キーワードを抽出してもよい。
キーワード作成部120は、抽出したキーワードをリスト化し、キーワードリストを作成する。なお、キーワードリストに含まれるキーワードの総数が少ない場合には、シソーラスや同義語辞書を利用して、抽出したキーワードと同義語を新たなキーワードとし、キーワードリストに追加してもよい。また、学習者の視点では、音声認識として混同のし易い同音語を新たなキーワードとして扱っても良い。例えば、抽出したキーワードやその同義語に対する同音語を新たなキーワードとし、キーワードリストに追加してもよい。この場合、正解文や抽出したキーワード、その同義語等には発音記号等が付与されており、この発音記号等によって、同音語を取得できるものとする。
なお、問題文に対応する予め正解文リストが与えられている場合には、音声認識処理を行う前に、正解文から予めキーワードを抽出し、キーサードリストを作成しておいてもよい。このように、予めキーワードリストを作成しておくことで、採点支援の処理時間を低減することができる。
<採点支援部130>
入力: 音声認識結果、正解文リストに含まれる正解文毎のキーワードリスト
出力: 評点結果
処理内容:
採点支援部130は、音声認識結果と正解文毎のキーワードリストとを用いて、評点結果を求める(S130)。本実施形態では、採点支援部130は、音声認識結果と正解文毎のキーワードリストとの合致率を算出し、合致率に基づき評点を求める。例えば、図3の例では、音声認識結果が、キーワードリスト(1)に含まれるキーワードを全て含むため、算出した合致率は100%であり、評点を100点中100点としている。
なお、本実施形態では、減点による学習者のモチベーションの低下を防ぐために、音声認識結果におけるキーワードの出現順と評点とを無関係とする。
例えば、採点支援部130は、複数のキーワードリストに対して合致率を算出し、算出した合致率のうち最もよい合致率を評点結果として出力してもよい。
<効果>
本実施形態の場合、音声認識結果が正解文に対応するキーワードを含めばよいため、正解文ありきの読み上げ音声以外にも適用でき、学習教材の幅が拡がる。
また、従来技術では正解文に対応する発音情報が必要となるため、そのためのコストを要するが、本実施形態の構成であれば、不要である。また、従来技術では、正しく発音しないと評価されない減点方式に近いため学習者のモチベーションが低下しやすいが、本実施形態の構成であれば、多少誤ったとしても高く評点で評価してくれるため、学習者の意欲の維持が期待できる。さらに、正解文リストが複数の正解文を含む場合にも評価ができる。
<変形例>
本実施形態では、キーワード作成部120が正解文リストに含まれる正解文からキーワードを抽出し、キーワードリストを作成しているが、キーワード作成部120によらずに、別途正解文毎に予めキーワードリストを用意しておき、採点支援部130に与えてもよい。
本実施形態では、音声認識結果におけるキーワードの出現順と評点とを無関係としているが、音声認識結果におけるキーワードの出現順を考慮して評点を求めても良い。この場合、キーワードリストは出現順の情報を含む。例えば、キーワードリストに含まれるキーワードは出現順にリスト化され(キーワードリストに含まれるキーワードの順番が、正解文におけるキーワードの出現順に対応する)、採点支援部130は、キーワードリストに含まれる1つ以上のキーワードと音声認識結果との前方一致、後方一致のいずれかひとつ以上に基づく評価を求める。さらに、採点支援部130は、キーワードと音声認識結果との出現順を考慮した部分一致、完全一致のいずれかに基づく評価を求めてもよい。
本実施形態では、音声認識結果に対してキーワード抽出を行っていないが、キーワード抽出を音声認識結果に対して適用した上で、音声認識結果に対するキーワード抽出結果と、正解文に対するキーワード抽出結果を比較しても良い。例えば、音声認識結果の単語情報に含まれる品詞情報を用いてキーワード抽出を行ってもよい。この場合、採点支援装置は、回答文キーワード作成部140を含む(図1中、破線で示す)。例えば、回答文キーワード作成部140は、音声認識結果からキーワードを抽出し、回答文キーワードリストを作成する。このとき、予め設定したルールに基づいてキーワードを抽出してもよい。予め設定したルールとしては、本実施形態のキーワード作成部120で説明したルール1、ルール2等が考えられる。採点支援部130は、回答文キーワードリストと正解文に対応するキーワードリストに基づき、評価を求める。例えば、回答文キーワードリストに含まれるキーワードと正解文毎のキーワードリストに含まれるキーワードとの合致率を算出し、合致率に基づき評点を求める。このとき、出現順と評点と無関係としてもよいし、関連付けてもよい。
音声認識結果は、大文字化しないケースもあるため、正解文も含め、全て小文字化してマッチングしても良い。同様に、音声認識結果は、句読点、カンマ、ピリオド、エクスクラメーションマーク、クエスチョンマーク、アポストロフィー等の記号類を認識しないケースもあるため、正解文から上述の記号類を取り除いても良い。また、学習者のもモチベーション向上のため、回答文・正解文のキーワードとその同義語や同音語を同一に扱い、例えば、同義語や同音語があった場合には元のキーワードに入れ替えた上で合致率を計算しても良い。例えば、採点支援装置は、文字処理部150を含む(図1中、破線で示す)。文字処理部は、音声認識結果及び正解文リストを入力とし、予め設定された文字処理ルールに基づき、音声認識結果および正解文リストに対して処理を行う。例えば、文字処理ルールとしては上述のルールが考えられる。言い換えると、文字処理ルールは、(i)大文字を小文字に変換する、(ii)予め指定された記号を削除する、の少なくとも何れかを含む。
音声認識については、非母語話者の発音に対応した音声認識モデルを用いることで、学習者の発声モチベーションを上げても良い。例えば、非母語話者による音声データと対応する書き起こしテキスト(正解テキスト)の組を大量に記憶したデータベース(以下、非母語話者データベースともいう)を用意し、非母語話者データベースを参照し、非母語話者のデータ(非母語話者による音声データと対応する書き起こしテキスト)を利用して非母語話者の発音に対応した音声認識モデルを学習する。なお、音声認識モデルは、音声-テキスト対から学習した非母語話者音響モデルと、対応する言語のテキストから学習した言語モデルからなる。非母語話者データベースから非母語話者の発音に対応した音声認識モデルを学習してもよいし、母語話者による音声認識モデルを入力とし、母語話者による音声認識モデルをチューニングすることにより、非母語話者の発音に対応した音声認識モデルを作成してもよい。
学習者の意欲を高めるため、採点支援部130は、キーワードと音声認識結果との評価において、予め指定された文字数以下の違いを許容する構成としてもよい。例えば、発音誤りに相当する音声認識結果と正解文の2~3の文字単位の違いを許容し、正解とみなすようにしても良い。
本実施形態では、非母語話者の音声回答を採点し、評価結果を出力している。しかし、非母語話者の音声回答の採点に限定されるものではない。問題文が設定され、問題文に対応する正解文を含む正解文リストが与えられ、問題文に対する回答音声を入力とし、回答音声に対する評価を行い、評点結果を出力する構成であれば、どのような採点であってもよい。
<第二実施形態>
第一実施形態と異なる部分を中心に説明する。
第一実施形態の場合、キーワード単位で合致率を算出しているため、音声認識結果が誤認識を含み、キーワードの一部の文字が異なるという微妙な誤りで評価が大きく下がってしまう。本実施形態では、文字単位での合致率を評点とする。
図4は第二実施形態に係る採点支援装置の機能ブロック図を、図5はその処理フローの例を示す図である。
第一実施形態に係る採点支援装置は、音声認識部110と、キーワード作成部120と、採点支援部230と、文字単位分割部240とを含む。
<文字単位分割部240>
入力: 音声認識結果、キーワードリストに含まれるキーワード
出力: 音声認識結果の文字リスト、キーワードリストに含まれるキーワード毎の文字リスト
処理内容:
文字単位分割部240は、音声認識結果及びキーワードリストに含まれるキーワードを文字単位に分割し(S240)、文字単位のリスト(文字リスト)を作成する。
<採点支援部230>
入力: 音声認識結果の文字リスト、キーワード毎の文字リスト
出力: 評点結果
処理内容:
採点支援部230は、音声認識結果の文字リストとキーワード毎の文字リストとを用いて、評点結果を求める(S230)。本実施形態では、採点支援部230は、音声認識結果の文字リストをキーワード毎の文字リストと照合し、文字単位で合致率を算出する。なお、音声認識結果の文字リストのうちキーワードの文字リストの一部でも一致する部分を全て照合する。例えば動的計画法(DPマッチング)または前方一致または後方一致等といった方式で合致率を計算し(参考文献2)、最もよい合致率を評点結果としてもよい。
(参考文献2)中川聖一、伊藤立治、「拡張連続DP法の連続数字音声認識による評価」、電気学会論文誌C、1988年108巻10号p.834-841
採点支援部230は、算出した合致率を評点結果とする。正解文リストに含まれる正解文、さらに、正解文に対するキーワードリストに含まれるキーワード毎に合致率を算出するが、算出した合致率のうち最もよい合致率を評点結果としてもよい。
例えば、音声認識結果が「have」であり、音声認識結果の文字リストが「h」、「a」、「v」、「e」であり、キーワードが「love」であり、キーワードの文字リストが「l」、「o」、「v」、「e」の場合、4文字中2文字が合致し、合致率は50%であり、評点を100点中50点とする。
<効果>
このような構成により第一実施形態と同様の効果を得ることができる。さらに、微妙な誤りを反映した、より細かい採点を行うことができる。
<変形例>
本実施形態では、文字単位分割部240の入力をキーワードリストに含まれるキーワードとしているが、これに代えて、正解文リストに含まれる正解文を入力としてもよい(図4中、破線で示す)。その場合、文字単位分割部240は、正解文リストに含まれる正解文を文字単位に分割し、文字単位のリスト(文字リスト)を作成し、出力する。また、この場合、採点支援部230は、 音声認識結果の文字リスト、正解文毎の文字リストを入力とし、音声認識結果の文字リストを正解文毎の文字リストと照合し、文字単位で合致率を算出し、最もよい合致率を評点結果とする。この構成の場合、採点支援装置は、キーワード作成部120を含まなくともよい。
本変形例と第二実施形態とを組合せて、正解文毎の合致率とキーワード毎の合致率とを全て求め、最もよい合致率を評点結果としてもよい。
<第三実施形態>
第一実施形態と異なる部分を中心に説明する。
正解文からキーワードを抽出する方法では出題者の意図に合わせた評価が困難な場合がある。本実施形態では、正解文を正規表現として表現し、音声認識結果と正解文の正規表現と比較を行い、合致した際のスコアを評点とする。
正規表現としては、任意の正規表現を定義して用いてよい。
図6は第三実施形態に係る採点支援装置の機能ブロック図を、図2はその処理フローの例を示す図である。
第三実施形態に係る採点支援装置は、音声認識部110と、採点支援部330とを含む。
第三実施形態に係る採点支援装置は、正規表現の正解文リストと回答音声を含む音声信号とを入力とし、回答音声に対する評価を行い、評点結果を出力する。
<採点支援部330>
入力: 音声認識結果、正解文の正規表現を含む正解文リスト
出力: 評点結果
処理内容:
採点支援部330は、音声認識結果と正解文の正規表現を含む正解文リストとを用いて、評点結果を求める(S330)。本実施形態では、採点支援部330は、音声認識結果が正解文リストに含まれる正解文の正規表現にマッチするか否か(正解または不正解)で評点結果を求める。例えば、正解文の正規表現を「I love *」とし、音声認識結果が「I love you, too」の場合、音声認識結果が正解文の正規表現にマッチする(正解)ため、評点を100点中100点とする。
<第四実施形態>
第一実施形態と異なる部分を中心に説明する。
本実施形態では、第一実施形態、第二実施形態のキーワードや、第三実施形態の正規表現等の準備コストを削減するため、正解文リストに含まれる正解文そのものと音声認識結果との比較により、正解精度を求め評点とする。
図7は第四実施形態に係る採点支援装置の機能ブロック図を、図2はその処理フローの例を示す図である。
第四実施形態に係る採点支援装置は、音声認識部110と、採点支援部430とを含む。
<採点支援部430>
入力: 音声認識結果、正解文リスト
出力: 評点結果
処理内容:
採点支援部430は、音声認識結果と正解文を含む正解文リストとを用いて、評点結果を求める(S430)。採点支援部430は、音声認識結果に対して、正解文リストに含まれる正解文毎にマッチングを行い、正解精度を求め、評点とする。正解文とできるだけ合うよう動的計画法(DPマッチング)等の方式でマッチングを行う(参考文献2参照)。
なお、正解精度は、正解率や認識精度からなり、単語単位でも、文字単位でも良い。ただし、文字単位の方が正解精度が高くなるため、学習者の意欲を考慮すると、文字単位の方が望ましい。例えば、正解文が「I love you」であり、音声認識結果が「I have you」である場合、単語単位では3単語中2単語が一致しているので評点を100点中66点とし、文字単位では8文字中6文字が一致しているので評点を100点中75点とする事ができる。
また、似た発音の文字(例えば sh→s)の表を用意し、その差分は許容しても良い。
<第五実施形態>
第四実施形態と異なる部分を中心に説明する。
教室等で使用するシーンを考えると、発話者が正しく発声していても、周囲の音声雑音による悪影響があるため、挿入誤りを考慮しない認識率を評点とする。
図7は第五実施形態に係る採点支援装置の機能ブロック図を、図2はその処理フローの例を示す図である。
第五実施形態に係る採点支援装置は、音声認識部110と、採点支援部530とを含む。
<採点支援部530>
入力: 音声認識結果、正解文リスト
出力: 評点結果
処理内容:
採点支援部530は、音声認識結果と正解文を含む正解文リストとを用いて、評点結果を求める(S530)。採点支援部530は、音声認識結果に対して、正解文リストに含まれる正解文毎に挿入誤りを考慮せずにマッチングを行い、正解精度を求め、評点とする。第四実施形態と同様に正解文とできるだけ合うよう動的計画法(DPマッチング)等の方式でマッチングを行い、評点は、単語単位でも、文字単位でも良い。例えば、正解文が「I love you」であり、音声認識結果が「ah I la have you」である場合、「ah」、「la」は挿入誤りとして無視される。単語単位でも、文字単位でも正解精度は100%であり、評点を100点中100点とする。
<変形例>
挿入誤りは、文頭、文末に発生しやすく、発話文内の音声は、挿入誤りではなく、単なる間違い可能性がある。そのため、本変形例では、挿入誤りを無視するのは、文頭、文末に絞る。また、長い文(例えば、5単語以上)の場合は、文中の句と句に間が空く可能性があるので、句末・句頭間の挿入誤りを無視しても良い。
<採点支援部530>
入力: 音声認識結果、正解文リスト
出力: 評点結果
処理内容:
採点支援部530は、音声認識結果と正解文を含む正解文リストとを用いて、評点結果を求める(S530)。採点支援部530は、音声認識結果に対して、正解文リストに含まれる正解文毎に文頭、文末の挿入誤りを考慮せずにマッチングを行い、正解精度を求め、評点とする。なお、文頭、文末の位置については、正解文の最初の単語より前および最後の単語の後とすれば良い。例えば、正解文が「I love you」であり、音声認識結果が「ah I la have you」である場合、文頭の「ah」は挿入誤りとして無視され、文頭、文末を除く文中に位置する「la」は不正解として判定される。例えば、単語単位の場合、「ah」を無視し、評点を100点中50点とする。
なお、挿入誤りが文頭、文末の何れか一方にのみ生じる場合には、文頭、文末の何れか一箇所のみを考慮せずにマッチングを行う構成としてもよい。
<第六実施形態>
第四実施形態と異なる部分を中心に説明する。
学習者に評点そのものを提示すると、雑音等による影響で不当に悪い点が付いた場合、学習者が採点支援装置に対して悪い印象を持ってしまう。そこで、本実施形態では、評点そのものではなく、内部的に得た評点を所定のルールで分類し、分類結果を評価結果として提示する。
図7は第六実施形態に係る採点支援装置の機能ブロック図を、図2はその処理フローの例を示す図である。
第六実施形態に係る採点支援装置は、音声認識部110と、採点支援部630とを含む。
<採点支援部630>
入力: 音声認識結果、正解文リスト、分類テーブル
出力: 評点結果
処理内容:
採点支援部630は、音声認識結果と正解文を含む正解文リストとを用いて、評点結果を求める(S630)。採点支援部630は、音声認識結果に対して、正解文リストに含まれる正解文毎にマッチングを行い、内部的に得られたマッチング結果を分類テーブルに応じて分類し、分類結果を評価結果として出力する。
例えば、正解精度のレンジに応じて、以下の分類テーブルに基づき分類する。
Figure 0007258627000001
また、例えば、正規表現については、マッチングした正規表現に応じて、以下の分類テーブルに基づき分類する。
Figure 0007258627000002
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (18)

  1. 学習言語を母国語としない非母語話者の音声回答に発音誤りがないかを採点する採点支援装置であって、
    問題文に対する音声回答の音声認識結果と前記問題文に対応する少なくともひとつの正解文を含む正解文リストに対応する正解情報とを用いて、前記音声回答の評価を求める採点支援部を含み
    前記音声認識結果は、非母語話者の発音に対応した音声認識モデルによる前記音声回答の音声認識結果である、
    採点支援装置。
  2. 請求項1の採点支援装置であって、
    予め設定された文字処理ルールに基づき、前記音声認識結果および前記正解情報に対して処理を行う文字処理部を含み、
    前記文字処理ルールは、
    (i)大文字を小文字に変換する、
    (ii)予め指定された記号を削除する、
    の少なくともいずれを含む、
    採点支援装置。
  3. 請求項1から請求項の何れかの採点支援装置であって、
    前記採点支援部は、前記音声認識結果に含まれる挿入誤りを考慮せずに前記音声回答の評価を求める、
    採点支援装置。
  4. 請求項の採点支援装置であって、
    前記挿入誤りは、文頭、文末及び句末・句頭間のいずれか一箇所以上の挿入誤りである、
    採点支援装置。
  5. 請求項1から請求項の何れかの採点支援装置であって、
    前記正解情報は、前記正解文リストの前記正解文のひとつに対して少なくともひとつ以上の単語のリストで構成されるキーワードリストを含み、前記キーワードリストは、前記ひとつの正解文から抽出した単語と、抽出した単語に対応する同義語あるいは同音語との少なくとも何れかひとつをキーワードとして含み、
    前記採点支援部は、前記正解文リストに含まれる正解文に対して予め設定した、または、前記正解文リストに含まれる正解文から作成したキーワードリスト毎にキーワードと前記音声認識結果との、部分一致、完全一致、前方一致、後方一致のいずれかひとつ以上に基づく評価を求める、
    採点支援装置。
  6. 請求項1から請求項4の何れかの採点支援装置であって、
    前記正解情報は、前記正解文リストの前記正解文のひとつに対して少なくともひとつ以上の単語のリストで構成されるキーワードリストを含み、前記キーワードリストは、前記ひとつの正解文から抽出した単語と、抽出した単語に対応する同音語をキーワードとして含み、
    前記採点支援部は、前記正解文リストに含まれる正解文に対して予め設定した、または、前記正解文リストに含まれる正解文から作成したキーワードリストと前記音声認識結果とを用いて評価結果を求める、
    採点支援装置。
  7. 請求項5または6の採点支援装置であって、
    前記正解情報の前記キーワードリストは、ひとつの前記正解文における前記キーワードの出現順の情報を含むリストであり、
    前記採点支援部は、前記正解情報のキーワードリスト毎に前記音声認識結果と前記キーワードと前記キーワードの出現順に対する合致率を評価する、
    採点支援装置。
  8. 請求項5または6の採点支援装置であって、
    前記採点支援部は、前記音声認識結果におけるキーワードの出現順と評点とを無関係とする、
    採点支援装置。
  9. 請求項5から請求項8の何れかの採点支援装置であって、
    前記キーワードは、予め定められた少なくともひとつの言語属性を有する、
    採点支援装置。
  10. 請求項から請求項の何れかの採点支援装置であって、
    前記音声認識結果からキーワードを抽出し、回答文キーワードリストを作成する回答文キーワード作成部を含み、
    前記採点支援部は、前記回答文キーワードと前記正解情報のキーワードリストに基づいて評価を求める、
    採点支援装置。
  11. 請求項1から請求項の何れかの採点支援装置であって、
    前記採点支援部は、前記正解情報と前記音声認識結果を文字単位で照合した評価を求めるものであって、前記正解情報は、正解文リストまたはキーワードリストである、
    採点支援装置。
  12. 請求項1から請求項の何れかの採点支援装置であって、
    前記正解情報は、前記ひとつの正解文に対応するひとつ以上の正規表現を含み、前記採点支援部は、前記正解情報と前記音声認識結果とのマッチングを評価として求める、
    採点支援装置。
  13. 請求項1から請求項の何れかの採点支援装置であって、
    前記正解情報は、前記正解文リストである、
    採点支援装置。
  14. 請求項1から請求項1の何れかの採点支援装置であって、
    前記採点支援部は、前記正解情報と前記音声認識結果との評価において、予め指定された文字数以下の違いを許容する、
    採点支援装置。
  15. 請求項1から請求項1の何れかの採点支援装置であって、
    前記採点支援部は、求めた前記評価のうち最も良い評価を評価結果として出力する、
    採点支援装置。
  16. 請求項1から請求項1の何れかの採点支援装置であって、
    前記採点支援部は、求めた前記評価を所定の分類テーブルに応じて分類し、分類結果を評価結果として出力する、
    採点支援装置。
  17. 学習言語を母国語としない非母語話者の音声回答に発音誤りがないかを採点する採点支援方法であって、
    問題文に対する音声回答の音声認識結果と前記問題文に対応する少なくともひとつの正解文を含む正解文リストに対応する正解情報とを用いて、前記音声回答の評価を求める採点支援ステップを含み
    前記音声認識結果は、非母語話者の発音に対応した音声認識モデルによる前記音声回答の音声認識結果である、
    採点支援方法。
  18. 請求項1から請求項1の何れかの採点支援装置として、コンピュータを機能させるためのプログラム。
JP2019062727A 2019-03-28 2019-03-28 採点支援装置、その方法、およびプログラム Active JP7258627B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019062727A JP7258627B2 (ja) 2019-03-28 2019-03-28 採点支援装置、その方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019062727A JP7258627B2 (ja) 2019-03-28 2019-03-28 採点支援装置、その方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2020160388A JP2020160388A (ja) 2020-10-01
JP7258627B2 true JP7258627B2 (ja) 2023-04-17

Family

ID=72643224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019062727A Active JP7258627B2 (ja) 2019-03-28 2019-03-28 採点支援装置、その方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP7258627B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010197643A (ja) 2009-02-25 2010-09-09 Gifu Univ 対話型学習システム
JP2013020220A (ja) 2011-07-13 2013-01-31 Highware Co Ltd 音声認識装置、自動応答方法及び、自動応答プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010197643A (ja) 2009-02-25 2010-09-09 Gifu Univ 対話型学習システム
JP2013020220A (ja) 2011-07-13 2013-01-31 Highware Co Ltd 音声認識装置、自動応答方法及び、自動応答プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
張昊宇、外3名,"日本人英語の発音多様性のモデル化と音素誤り自動検出への応用",「日本音響学会 2018年 秋季研究発表会 [講演論文集] 講演要旨・講演論文CD-ROM」,日本,一般社団法人 日本音響学会,2018年08月29日,pp.1045-1048

Also Published As

Publication number Publication date
JP2020160388A (ja) 2020-10-01

Similar Documents

Publication Publication Date Title
US10176804B2 (en) Analyzing textual data
Oostdijk et al. Experiences from the spoken Dutch corpus project
JP6099746B2 (ja) 対応メディアコンテンツ部分の整合
US20110184723A1 (en) Phonetic suggestion engine
US9548052B2 (en) Ebook interaction using speech recognition
MacKenzie et al. Assessing the accuracy of existing forced alignment software on varieties of British English
JP7092953B2 (ja) エンドツーエンドモデルによる多言語音声認識のための音素に基づく文脈解析
US20140316764A1 (en) Clarifying natural language input using targeted questions
US11043213B2 (en) System and method for detection and correction of incorrectly pronounced words
TWI610294B (zh) 語音辨識系統及其方法、詞彙建立方法與電腦程式產品
US9594742B2 (en) Method and apparatus for matching misspellings caused by phonetic variations
US10997223B1 (en) Subject-specific data set for named entity resolution
US10896222B1 (en) Subject-specific data set for named entity resolution
Kurimo et al. Modeling under-resourced languages for speech recognition
Yılmaz et al. Building a unified code-switching ASR system for South African languages
Knill et al. Impact of ASR performance on free speaking language assessment
van Esch et al. Future directions in technological support for language documentation
Anastasopoulos Computational tools for endangered language documentation
Alsharhan et al. Evaluating the effect of using different transcription schemes in building a speech recognition system for Arabic
Modipa et al. Two sepedi-english code-switched speech corpora
JP7258627B2 (ja) 採点支援装置、その方法、およびプログラム
US11341961B2 (en) Multi-lingual speech recognition and theme-semanteme analysis method and device
Ng et al. Shefce: A Cantonese-English bilingual speech corpus for pronunciation assessment
Thatphithakkul et al. LOTUS-BI: A Thai-English code-mixing speech corpus
Rott et al. Speech-to-text summarization using automatic phrase extraction from recognized text

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190328

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20190424

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210603

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221101

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230405

R150 Certificate of patent or registration of utility model

Ref document number: 7258627

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150