JP2015011348A - 音声認識を用いた外国語スピーキング能力の訓練及び評価方法並びにその装置 - Google Patents

音声認識を用いた外国語スピーキング能力の訓練及び評価方法並びにその装置 Download PDF

Info

Publication number
JP2015011348A
JP2015011348A JP2014126355A JP2014126355A JP2015011348A JP 2015011348 A JP2015011348 A JP 2015011348A JP 2014126355 A JP2014126355 A JP 2014126355A JP 2014126355 A JP2014126355 A JP 2014126355A JP 2015011348 A JP2015011348 A JP 2015011348A
Authority
JP
Japan
Prior art keywords
user
foreign language
accuracy
audio signal
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014126355A
Other languages
English (en)
Inventor
キ−ヨン パク
Ki-Yon Park
キ−ヨン パク
ユン−クアン イ
Yun-Kuang Lee
ユン−クアン イ
ヒョン−ペ ジョン
Hyeon-Pe Jong
ヒョン−ペ ジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2015011348A publication Critical patent/JP2015011348A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

【課題】音声認識を用いた外国語スピーキング能力訓練及び評価方法に関するもので、より詳細には、コンピュータまたはその他の測定装置を用いて外国語スピーキング能力をユーザ自ら訓練して評価する方法を提供する。【解決手段】第1ユーザが発声した外国語音声信号が入力されるステップS310と、入力された音声信号をレコーディングするステップS320と、レコーディングされた音声信号を再生して第2ユーザに提供するステップS330と、提供された音声信号に対応するテキストデータが第2ユーザにより入力されるステップS340と、入力されたテキストデータと上記レコーディングされた音声信号とを比較して正確度を測定するステップS350と、測定された正確度による評価結果を上記第1ユーザに提供するステップS360と、を含むことを特徴とする。【選択図】図3

Description

本発明は、音声認識を用いた外国語スピーキング能力の訓練及び評価方法に関し、より詳細には、コンピュータまたはその他の測定装置を用いて外国語スピーキング能力をユーザが自ら訓練し、評価する方法に関する。
英語を含む多くの外国語教育過程においてスピーキング能力に対する重要度が大きくなることにより、これに関する教育需要が増えつつあり、国家英語能力評価試験(NEAT:National English Ability Test)などのような大規模なスピーキング能力評価試験も増えることになり、これにより訓練及び評価装置に関する需要が大きくなっている。
図1は、従来外国語スピーキング訓練または評価方法の一例として、(a)予め定められたスクリプト(script)を朗読する場合、(b)自由に発声し、音声認識システムが発声内容を自動で認識する場合を示す図面である。
先ず、図1の(a)に示すように、現在コンピュータ及びその他の補助装置を用いた外国語スピーキング訓練及び評価方法のうち、スクリプトが予め定められている場合は、ユーザがスクリプトをみて、それに従って朗読することにより音声信号が発生される。このように発生された音声信号を録音し、録音された信号と事前に格納されたスクリプトとを比較して定量的にスピーキング能力を評価することが一般的な方法であった。
しかし、このような場合は、スクリプトを予め用意しておき、読むということから、実際のスピーキングとは差があり、テストの有効性が低下する。
一方、上述のような問題点を解決するために、図1の(b)に示すように、自動音声認識システムを用いて、ユーザが発声した内容を自動で認識し、これを用いてスピーキング能力を評価する場合もあるが、現在の音声認識技術では、認識の結果が不正確であり、また若干の認識誤作動でもある場合には、最終の評価結果が大きく変わることもあるので、正確な評価が不可能であるという問題点があった。
特開2008−242437号公報
本発明は、上述した問題点を解決するためになされたものであって、本発明は、ユーザがスクリプトなしで先に自由に発声した後に、これを録音し、ユーザに直ちにまたは一定時間後に聞かせるようにし、ユーザはこれを聞いて自分が発声した内容をキーボードなどの入力装置を用いて直接タイピングし、このようにタイピングした文章と録音された発声文章とを互いに比較してスピーキング能力の評価を行う方法を提供する。
このような過程を通じて、上述した問題点を全て解決することができ、ユーザも自ら発声した内容を再び確認しながらテキストを作成するので、聞き取り能力が向上するだけでなく、自分の発音上の問題点を自ら認識することになり、教育効果をより高めることができる。
本発明の技術的課題を達成するために、本発明の一実施例は、音声認識を用いた外国語スピーキング能力の訓練及び評価方法において、第1ユーザが発声した外国語音声信号が入力されるステップと、上記入力された音声信号をレコーディングするステップと、上記レコーディングされた音声信号を再生して第2ユーザに提供するステップと、上記提供された音声信号に対応するテキストデータが上記第2ユーザにより入力されるステップと、上記入力されたテキストデータと上記レコーディングされた音声信号とを比較して正確度を測定するステップと、上記測定された正確度による評価結果を上記第1ユーザに提供するステップと、を含む。
上記第1ユーザは、上記音声認識を用いた外国語スピーキング能力訓練及び評価での被評価者であり、上記第2ユーザは、上記第1ユーザと同一のユーザであることが好ましい。
上記レコーディングされた音声信号を再生して第2ユーザに提供するステップは、上記入力された音声信号をレコーディングした直ちにまたは所定のn時間(nは、陽の実数)後に、上記第2ユーザに提供することが好ましい。
上記提供された音声信号に対応するテキストデータが入力されるステップは、上記提供された音声信号に対応する全体テキストが入力されるか、または音声認識モジュールが認識した音声信号のテキストのうちの誤りが含まれた一部テキストに対する修正データが入力されることが好ましい。
上記正確度を測定するステップは、上記レコーディングされた音声信号を、アナログ音声信号からデジタル音声信号である音声データに変換するステップと、上記入力されたテキストデータを発音記号で表示した文字列である発音列に変換するステップと、上記変換された発音列を上記変換された音声データと整列させるステップと、上記整列された発音列と音声データとを比較して上記発音列単位の正確度を定量的に測定するステップと、を含むことが好ましい。
上記正確度を定量的に測定するステップは、上記発音列の音声的特徴(phonetic feature)を用いて、上記音声的特徴が上記音声データに含まれているか否かに基づいて上記正確度を測定することがさらに好ましい。
上記正確度を定量的に測定するステップは、上記発音列の各音素に該当する信号自体をモデルとして定義し、上記音声データと上記定義されたモデルとの間の差をスコアで計算することにより、上記正確度を測定することがさらに好ましい。
一方、本発明の技術的課題を解決するために、本発明の他の実施例は、音声認識を用いた外国語スピーキング能力の訓練及び評価装置において、第1ユーザが発声した外国語音声信号が入力される音声信号受信部と、上記入力された音声信号をレコーディングする録音部と、上記レコーディングされた音声信号を再生して第2ユーザに提供する音声信号再生部と、上記提供された音声信号に対応するテキストデータが上記第2ユーザにより入力されるテキスト受信部と、上記入力されたテキストデータと上記レコーディングされた音声信号とを比較して正確度を測定する正確度測定部と、上記測定された正確度による評価結果を上記第1ユーザに提供する評価部と、を含む。
上記第1ユーザは、上記音声認識を用いた外国語スピーキング能力訓練及び評価での被評価者であり、上記第2ユーザは、上記第1ユーザと同一のユーザであることが好ましい。
上記音声信号再生部は、上記入力された音声信号をレコーディングした直ちにまたは所定のn時間(nは、陽の実数)後に、上記第2ユーザに提供することが好ましい。
上記テキスト受信部には、上記提供された音声信号に対応する全体テキストが入力されるか、または音声認識モジュールが認識した音声信号のテキストのうちの誤りが含まれた一部テキストに対する修正データが入力されることが好ましい。
上記正確度測定部は、上記レコーディングされた音声信号を、アナログ音声信号からデジタル音声信号である音声データに変換するADコンバータと、上記入力されたテキストデータを発音記号で表示した文字列である発音列に変換する発音列変換部と、上記変換された発音列を上記変換された音声データと整列させる整列部と、上記整列された発音列と音声データとを比較して上記発音列単位の正確度を定量的に測定するサブ正確度測定部と、を含むことが好ましい。
上記サブ正確度測定部は、上記発音列の音声的特徴(phonetic feature)を用いて、上記音声的特徴が上記音声データに含まれているか否かに基づいて上記正確度を測定することがさらに好ましい。
上記サブ正確度測定部は、上記発音列の各音素に該当する信号自体をモデルとして定義し、上記音声データと上記定義されたモデルとの間の差をスコアで計算することにより、上記正確度を測定することがさらに好ましい。
本発明に係る音声認識を用いた外国語スピーキング能力の訓練及び評価方法により、ユーザが、定められたスクリプトを読むのではなく、自由に発声するように誘導することで、実際のスピーキング能力を訓練することができ、またこれを評価することができ、ユーザが入力した文章と発声した音声信号とを自動で比較して、既存の音声認識システム上の誤作動による評価結果の誤りを防止することができる。
また、評価時に音声認識技術を用いて発声内容と文字列を音素単位で整列する方法を適用することができるので、ユーザの発声に対する流暢性評価、発音評価などがより正確に可能になる。
従来の外国語スピーキング訓練または評価方法の一例であって、(a)予め定められたスクリプトを朗読する場合、(b)自由に発声し、音声認識システムが発声内容を自動で認識する場合を示す図面である。 本発明の一実施例により、外国語スピーキング能力訓練及び評価装置を用いて自由に発声し、評価結果が提供される例示の図面である。 本発明の一実施例により、音声認識を用いた外国語スピーキング能力訓練及び評価方法を示すフローチャートである。 本発明の一実施例により、音声認識を用いた外国語スピーキング能力訓練及び評価装置を示す機能ブロック図である。 本発明の一実施例により、録音された音声データとテキストデータとを比較して正確度を測定する方法を説明するための図面である。
以下では、添付した図面に基づいて、本発明の実施例を本発明が属する技術分野で通常の知識を有する者が容易に実施できるように詳細に説明する。しかし、本発明は、様々の異なる形態で実現でき、ここで説明する実施例に限定されない。
本発明を明確に説明するために、説明と関係ない部分は図面から省略し、明細書全体にわたって同一または類似した部分については、同一または類似した図面符号をつける。
また、本明細書全体において、ある部分がある構成要素を「含む」とするときは、特に反対となる記載がない限り、他の構成要素を除外せず、他の構成要素をさらに含むことができることを意味する。
さらに、各図面の構成要素に参照符号を付加するに当たって、同一の構成要素については、たとえ他の図面に表示されても、できるだけ同一の符号を有するようにした。また、本発明を説明するに当たって、係わる公知構成または機能に関する具体的な説明が本発明の要旨をかえって不明にすると判断される場合は、その詳細な説明を省略する。
また、本発明の構成要素を説明するに当たって、第1、第2、A、B、(a)、(b)などの用語を用いることができる。このような用語は、その構成要素を他の構成要素と区別するためのものであって、その用語により当該構成要素の本質や順番または順序などが限定されない。ある構成要素が他の構成要素に「連結」、「結合」または「接続」されると記載された場合、その構成要素は、他の構成要素に直接的に連結または接続でき、さらに、各構成要素の間にまた他の構成要素が「連結」、「結合」または「接続」されることもできることを理解しなければならない。
本発明は、音声認識システムを用いて外国語スピーキング能力を訓練し、評価する方法に関するものであって、音声認識技術を用いてユーザが話した内容を文字に変換して外国語発声内容を自動で評価する過程において、音声認識技術の誤りを補うために、発声したユーザが、発声内容をキーボードなどの入力装置を用いて文字で入力するようにし、入力された文字データと録音された音声データとを比較してユーザの外国語能力を評価して、正確な評価結果をユーザに提供することにより、自ら訓練するようにする方法及び装置に関する。
以下では、様々な図面に基づいて本発明の音声認識を用いた外国語スピーキング能力の訓練及び評価方法をより詳細に説明する。
図2は、本発明の一実施例による外国語スピーキング能力訓練及び評価装置を用いて自由に発声し、評価結果の提供を受ける例示図面である。
先立って簡単に述べたように、従来の音声認識を用いた外国語スピーキング能力評価システムの場合は、ユーザが予め定められた文章をユーザが読むと、これによりユーザの発音能力またはイントネーションなどを評価したり、またはユーザが自由に発声する場合には自動音声認識を試みて、認識された結果が文法及び外国語語法に合うか否かを評価したりする方式であった。
前者の場合は、自由に話す能力に対する評価が不可能であり、後者の場合は、自動音声認識システムの誤りにより一貫性のある評価が不可能であるという短所があった。
したがって、図2に示すように、本発明では、ユーザが自由に発声するようにした後に、訓練及び評価装置によりこれを録音して再生し、ユーザは、録音された発声内容を聞いた後に当該文章を直接文字に変えてテキスト(text)を入力することになり、評価装置は、これに基づいて、前に録音された音声データに対する正確度を測定して、ユーザのスピーキング能力評価結果(result)を提供する。
上記のような方法により、ユーザは、定められたスクリプトなしで、自由に外国語スピーキングを訓練しながら、既存の自動音声認識システムの誤作動による評価システムの誤り発生の可能性を防止することができる。
さらに詳細な動作過程は、以下の図3及び図4に基づいて説明する。
図3は、本発明の一実施例により、音声認識を用いた外国語スピーキング能力訓練及び評価方法を示すフローチャートである。
図3を参考すると、本発明の訓練及び評価方法は、第1ユーザにより発声された外国語音声信号が入力されるステップ(S310)と、入力された音声信号をレコーディングするステップ(S320)と、レコーディングされた音声信号を再生して第2ユーザに提供するステップ(S330)と、提供された音声信号に対応するテキストデータが上記第2ユーザから入力されるステップ(S340)と、入力されたテキストデータと上記レコーディングされた音声信号とを比較して正確度を測定するステップ(S350)と、測定された正確度による評価結果を上記第1ユーザに提供するステップ(S360)と、を含む。
ここで、区分して記載した第1ユーザと第2ユーザは、同一のユーザであってもよく、他のユーザであってもよい。第2ユーザが自動化装置(例:自動音声認識システム)であってもよい。
通常、英語スピーキング能力評価の場合は、ユーザ(すなわち、被評価者)が与えられた環境にて自ら自由に発声し、評価者はこれを録音した後、事後にこれを聞いて、どれほど流暢に発声したのかを定量的に評価することになる。
本発明は、この過程で録音された音声ファイルを聞いて評価するステップを、コンピュータなどの自動化装置により自動で行われるようにすることに関するものであって、大きく5つのステップに分けると、(1)被評価者が、与えられた環境または任務に従って自由に発声するステップ、(2)発声する内容を録音するステップ、(3)録音された内容を被評価者に聞かせるステップ、(4)録音された内容を被評価者が聞き、キーボードなどの入力装置を用いてテキストに変換及び入力するステップ、(5)入力されたテキストと録音されたデータとを比較してスピーキング能力を自動で評価するステップから構成されることができる。
上述した被評価者が、録音された内容を聞き、キーボードなどの入力装置を用いてテキストに変換するステップでは、被評価者が初めから最後までの全体テキストを作成してもよく、または音声認識モジュールが認識した内容のうち、被評価者により誤りを含んだ一部分のみを修正するようにしてもよい。
このような多数のステップを経ることにより、ユーザは自分が発声した内容を再度確認する機会を得るだけでなく、全体の音声認識システムの認識及び変換の誤作動を防止することができるので、発音、イントネーションなどのスピーキング能力自体を評価することにおける正確度及び一貫性を大きく向上させることができる。
以下では、訓練及び評価装置を構成する細部モジュールの間の信号及びデータ伝達過程を具体的に説明する。
図4は、本発明の一実施例による音声認識を用いた外国語スピーキング能力訓練及び評価装置を示す機能ブロック図である。
図4を参考すると、本発明の訓練及び評価装置400は、第1ユーザが発声した外国語音声信号が入力される音声信号受信部410と、入力された音声信号をレコーディングする録音部420と、レコーディングされた音声信号を再生して第2ユーザに提供する音声信号再生部430と、提供された音声信号に対応するテキストデータを上記第2ユーザにより入力されるテキスト受信部440と、入力されたテキストデータと上記レコーディングされた音声信号とを比較して正確度を測定する正確度測定部450と、測定された正確度による評価結果を上記第1ユーザに提供する評価部460と、を含む。
訓練及び評価装置400を構成する細部モジュールの間のデータ伝達過程を説明すると、先ず、被評価者により外国語で発声された音声(voice)が音声信号受信部410に入力される。
音声信号受信部410は、これを録音部420に伝達し、録音部420では、入力された音声信号をレコーディングして、以後の正確度の測定及び評価のために正確度測定部450に伝達する。
一方、録音された音声信号は、音声信号再生部430により再び被評価者に提供されるが、このとき、音声信号を録音した直ちに被評価者に提供されてもよく、所定のn時間(nは、陽の実数)後に被評価者に提供されてもよい。
上述したように、録音された音声信号は、被評価者に提供されることができ、他のユーザ(または音声認識システム)に提供された後に、評価のための基礎資料として活用されることもできる。
その後、録音された音声(recorded voice)を聴取した被評価者は、提供された音声信号に対応する全体テキストを入力するか、または音声認識システムが認識した音声信号の全体テキストのうち、誤りが含まれた一部テキストに対する修正データを入力する方式でスクリプトテキストを入力し、訓練及び評価装置400内のテキスト受信部440が、これを受信する。
そして、テキスト受信部440は、テキストデータを正確度測定部450に伝達して音声信号評価の基礎資料として活用する。
正確度測定部450を構成する細部モジュールを説明すると、正確度測定部450は、録音された音声信号を、アナログ音声信号からデジタル音声信号である音声データに変換する ADコンバータ451と、入力されたテキストデータを発音記号で表示した文字列である発音列に変換する発音列変換部453と、変換された発音列を上記変換された音声データと整列させる(forced to align)整列部452と、整列された発音列と音声データとを比較して発音列単位の正確度を定量的に測定するサブ正確度測定部454と、を含むことができる。
最後に、上記のような役割を行う正確度測定部450の測定結果に応じて、発声に対する最終の評価結果が評価部460を通じて被評価者にフィードバックされる。
図5は、本発明の一実施例により録音された音声データとテキストデータとを比較して正確度を測定する方法を説明するための図面である。
ユーザが発声した音声信号(または変換された音声データ)とユーザが入力したテキストデータとを用いて、スピーキング能力を測定し、評価する具体的な方法は、次のような方法を用いることができる。
先ず、ユーザが入力したテキストデータを発音列に変換する。発音列とは、当該英文を発音記号で表示した文字列を意味する。
その後、このような発音列をユーザが発声した音声データと整列する(forced to align)。
上記の過程は、一般の音声認識システムを用いて、音声データのうちの当該発音列に該当する区間を正確に一致させる過程である。
ここで、上記のようにユーザが自ら発声内容を正確に文字列(text)に変えたので、上記の整列過程での誤差を大きく低減することができる。
発音列と音声信号が整列された状態になると、発音列単位で音声信号を分析し、ユーザがどれほど正確に当該発音列を発声したのかを定量的に測定できる状態になる。
このステップでは、発音列の音声的特徴(phonetic feature)を用いて当該特徴が音声信号に含まれているか否かなどを正確度を測定する手段として用いることができる。例えば、/b/、/d/、/g/のような有声音の場合、有声音の特徴が音声信号にあるか否かを用いることができる。
また他の方法により、個別の音声学的特徴以外にも各音素に該当する音声信号自体を、それぞれモデルとして定義し、現在ユーザの信号と格納されたモデルとの間の差をスコアで計算する方法もある。
図5を参考すると、入力されたテキスト520を発音列に変換し530、録音された音声データ510と互いに整列させた後に、各発音列(541b〜543b)に該当する区間において、音声信号のモデル(541a〜543a)の間の差をそれぞれのスコアで計算し、総合を集計することにより評価結果を算出することができる550。
このように、本発明による外国語スピーキング能力の訓練及び評価方法を用いると、ユーザが定められたスクリプトを読むのではなく、自由に発声するように誘導することにより、実際のスピーキング能力を訓練及び評価することができるとともに、ユーザが入力した文章と発声した音声信号とを自動で比較して自動音声認識誤作動による評価システムの誤りを防止する。
また、音声認識技術を用いて発声内容と文字列を音素単位で整列する方法を適用して、ユーザ発声に対する流暢性評価、発音評価などがより正確に可能となる効果がある。
以上では、本発明の実施例を構成する全ての構成要素が1つに結合されたり、結合されて動作するものとして説明したが、本発明がこのような実施例に限定されるものではない。すなわち、本発明の目的範囲内であれば、その全ての構成要素が一つ以上に、選択的に結合して動作することもできる。また、その全ての構成要素がそれぞれ1つの独立したハードウェアとして実現されることもでき、各構成要素の一部または全部が選択的に組み合わせられて、1つまたは複数のハードウェアで組み合わせられた一部または全部の機能を行うプログラムモジュールを有するコンピュータプログラムとして実現されることもできる。そのコンピュータプログラムを構成するコード及びコードセグメントは、本発明の技術分野の当業者により容易に推論できるものである。このようなコンピュータプログラムは、コンピュータが読み取り可能な格納媒体に格納され、コンピュータにより読み取られて実行されることにより、本発明の実施例を実現することもできる。コンピュータプログラムの格納媒体としては、磁気記録媒体、光記録媒体などが含まれ得る。
また、以上で記載した「含む」、「構成する」または「有する」などの用語は、特に反対の記載がない限り、当該構成要素が内在され得ることを意味するので、他の構成要素を除くのではなく、他の構成要素をさらに含むことができると解釈されなければならない。技術的、もしくは科学的な用語を含む全ての用語は、異なるように定義されない限り、本発明が属する技術分野で通常の知識を有する者によって一般的に理解されるのと同じ意味を有する。 辞書に定義されている用語のように一般的に使用される用語は、関連技術の文脈上の意味と一致するものとして解釈されるべきであり、本発明において明白に定義しない限り、理想的、もしくは過度に形式的な意味に解釈されない。
以上の説明は、本発明の技術思想を例示的に説明したことに過ぎず、本発明が属する技術分野で通常の知識を有する者であれば、本発明の本質的な特性から逸脱しない範囲で多様な修正及び変形が可能であることを理解できよう。従って、本発明に開示された実施例は本発明の技術思想を限定するものではなく、説明するためのものであって、このような実施例によって本発明の技術思想の範囲が限定されない。本発明の保護範囲は本発明の請求範囲によって解釈されるべきであり、それと同等な範囲内にある全ての技術思想は本発明の権利範囲に含まれるものとして解釈されなければならない。

Claims (14)

  1. 音声認識を用いた外国語スピーキング能力訓練及び評価方法において、
    第1ユーザが発声した外国語音声信号が入力されるステップと、
    前記入力された音声信号をレコーディングするステップと、
    前記レコーディングされた音声信号を再生して第2ユーザに提供するステップと、
    前記提供された音声信号に対応するテキストデータが前記第2ユーザにより入力されるステップと、
    前記入力されたテキストデータと前記レコーディングされた音声信号とを比較して正確度を測定するステップと、
    前記測定された正確度による評価結果を前記第1ユーザに提供するステップと、
    を含むことを特徴とする音声認識を用いた外国語スピーキング能力訓練及び評価方法。
  2. 前記第1ユーザは、前記音声認識を用いた外国語スピーキング能力訓練及び評価での被評価者であり、前記第2ユーザが、前記第1ユーザと同一のユーザであることを特徴とする請求項1に記載の音声認識を用いた外国語スピーキング能力訓練及び評価方法。
  3. 前記レコーディングされた音声信号を再生して第2ユーザに提供するステップは、
    前記入力された音声信号を、レコーディングした直ちにまたは所定のn時間(nは、陽の実数)後に、前記第2ユーザに提供することを特徴とする請求項1に記載の音声認識を用いた外国語スピーキング能力訓練及び評価方法。
  4. 前記提供された音声信号に対応するテキストデータが入力されるステップは、
    前記提供された音声信号に対応する全体テキストが入力されるか、または音声認識モジュールが認識した音声信号のテキストのうち、誤りが含まれた一部テキストに対する修正データが入力されることを特徴とする請求項1に記載の音声認識を用いた外国語スピーキング能力訓練及び評価方法。
  5. 前記正確度を測定するステップは、
    前記レコーディングされた音声信号を、アナログ音声信号からデジタル音声信号である音声データに変換するステップと、
    前記入力されたテキストデータを発音記号で表示した文字列である発音列に変換するステップと、
    前記変換された発音列を前記変換された音声データと整列するステップと、
    前記整列された発音列と音声データとを比較して前記発音列単位の正確度を定量的に測定するステップと、を含むことを特徴とする請求項1に記載の音声認識を用いた外国語スピーキング能力訓練及び評価方法。
  6. 前記正確度を定量的に測定するステップは、
    前記発音列の音声的特徴(phonetic feature)を用いて、前記音声的特徴が前記音声データに含まれているか否かに基づいて前記正確度を測定することを特徴とする請求項5に記載の音声認識を用いた外国語スピーキング能力訓練及び評価方法。
  7. 前記正確度を定量的に測定するステップは、
    前記発音列の各音素に該当する信号自体をモデルとして定義し、前記音声データと前記定義されたモデルとの間の差をスコアで計算することにより、前記正確度を測定することを特徴とする請求項5に記載の音声認識を用いた外国語スピーキング能力訓練及び評価方法。
  8. 音声認識を用いた外国語スピーキング能力訓練及び評価装置において、
    第1ユーザから発声された外国語音声信号が入力される音声信号受信部と、
    前記入力された音声信号をレコーディングする録音部と、
    前記レコーディングされた音声信号を再生して第2ユーザに提供する音声信号再生部と、
    前記提供された音声信号に対応するテキストデータが前記第2ユーザにより入力されるテキスト受信部と、
    前記入力されたテキストデータと前記レコーディングされた音声信号とを比較して正確度を測定する正確度測定部と、
    前記測定された正確度による評価結果を前記第1ユーザに提供する評価部と、
    を含むことを特徴とする音声認識を用いた外国語スピーキング能力訓練及び評価装置。
  9. 前記第1ユーザは、前記音声認識を用いた外国語スピーキング能力訓練及び評価での被評価者であり、前記第2ユーザが、前記第1ユーザと同一のユーザであることを特徴とする請求項8に記載の音声認識を用いた外国語スピーキング能力訓練及び評価装置。
  10. 前記音声信号再生部は、
    前記入力された音声信号を、レコーディングした直ちにまたは所定のn時間(nは、陽の実数)後に前記第2ユーザに提供することを特徴とする請求項8に記載の音声認識を用いた外国語スピーキング能力訓練及び評価装置。
  11. 前記テキスト受信部は、
    前記提供された音声信号に対応する全体テキストが入力されるか、または音声認識モジュールが認識した音声信号のテキストのうちの誤りが含まれた一部テキストに対する修正データが入力されることを特徴とする請求項8に記載の音声認識を用いた外国語スピーキング能力訓練及び評価装置。
  12. 前記正確度測定部は、
    前記レコーディングされた音声信号を、アナログ音声信号からデジタル音声信号である音声データに変換するADコンバータと、
    前記入力されたテキストデータを発音記号で表示した文字列である発音列に変換する発音列変換部と、
    前記変換された発音列を前記変換された音声データと整列する整列部と、
    前記整列された発音列と音声データとを比較して前記発音列単位の正確度を定量的に測定するサブ正確度測定部と、を含むことを特徴とする請求項8に記載の音声認識を用いた外国語スピーキング能力訓練及び評価装置。
  13. 前記サブ正確度測定部は、
    前記発音列の音声的特徴(phonetic feature)を用いて、前記音声的特徴が前記音声データに含まれているか否かに基づいて前記正確度を測定することを特徴とする請求項12に記載の音声認識を用いた外国語スピーキング能力訓練及び評価装置。
  14. 前記サブ正確度測定部は、
    前記発音列の各音素に該当する信号自体をモデルとして定義し、前記音声データと前記定義されたモデルとの間の差をスコアで計算することにより前記正確度を測定することを特徴とする請求項12に記載の音声認識を用いた外国語スピーキング能力訓練及び評価装置。
JP2014126355A 2013-06-26 2014-06-19 音声認識を用いた外国語スピーキング能力の訓練及び評価方法並びにその装置 Pending JP2015011348A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2013-0073987 2013-06-26
KR20130073987A KR20150001189A (ko) 2013-06-26 2013-06-26 음성인식을 이용한 외국어 말하기 능력의 훈련 및 평가 방법과 그 장치

Publications (1)

Publication Number Publication Date
JP2015011348A true JP2015011348A (ja) 2015-01-19

Family

ID=52304502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014126355A Pending JP2015011348A (ja) 2013-06-26 2014-06-19 音声認識を用いた外国語スピーキング能力の訓練及び評価方法並びにその装置

Country Status (2)

Country Link
JP (1) JP2015011348A (ja)
KR (1) KR20150001189A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108154735A (zh) * 2016-12-06 2018-06-12 爱天教育科技(北京)有限公司 英语口语测评方法及装置
JP2018180299A (ja) * 2017-04-13 2018-11-15 イー・エム・エス株式会社 単語習得訓練システム
CN110087129A (zh) * 2019-04-18 2019-08-02 平安科技(深圳)有限公司 视频节目配音效果评估方法、装置及计算机可读存储介质
CN111402924A (zh) * 2020-02-28 2020-07-10 联想(北京)有限公司 一种口语测评方法、设备及计算机可读存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020027394A1 (ko) * 2018-08-02 2020-02-06 미디어젠 주식회사 음소 단위 발음 정확성 평가 장치 및 평가 방법
WO2021221185A1 (ko) * 2020-04-27 2021-11-04 함승희 훈련 평가 시스템
KR102225435B1 (ko) 2020-08-13 2021-03-08 이창영 Stt 기반 언어구사 학습-훈련 시스템

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60201376A (ja) * 1984-03-26 1985-10-11 富士通株式会社 発声訓練機
JPS61184598A (ja) * 1985-02-12 1986-08-18 松下電器産業株式会社 発音練習装置
JPH06110494A (ja) * 1992-09-08 1994-04-22 Osaka Gas Co Ltd 発音学習装置
JPH10222190A (ja) * 1997-01-30 1998-08-21 Motorola Inc 発音測定装置および方法
JPH11143346A (ja) * 1997-11-05 1999-05-28 Seiko Epson Corp 語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体
JP2001265211A (ja) * 2000-01-14 2001-09-28 Atr Ningen Joho Tsushin Kenkyusho:Kk 外国語学習装置、外国語学習方法および媒体
JP2003162291A (ja) * 2001-11-22 2003-06-06 Ricoh Co Ltd 語学学習装置
JP2006126498A (ja) * 2004-10-28 2006-05-18 Tokyo Univ Of Science 英語の発音の学習を支援するためのプログラム、英語発音学習支援方法、英語発音学習支援装置、英語発音学習支援システム、及びプログラムを記録した記録媒体
US20090275005A1 (en) * 2005-11-18 2009-11-05 Haley Katarina L Methods, Systems, and Computer Program Products for Speech Assessment

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60201376A (ja) * 1984-03-26 1985-10-11 富士通株式会社 発声訓練機
JPS61184598A (ja) * 1985-02-12 1986-08-18 松下電器産業株式会社 発音練習装置
JPH06110494A (ja) * 1992-09-08 1994-04-22 Osaka Gas Co Ltd 発音学習装置
JPH10222190A (ja) * 1997-01-30 1998-08-21 Motorola Inc 発音測定装置および方法
JPH11143346A (ja) * 1997-11-05 1999-05-28 Seiko Epson Corp 語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体
JP2001265211A (ja) * 2000-01-14 2001-09-28 Atr Ningen Joho Tsushin Kenkyusho:Kk 外国語学習装置、外国語学習方法および媒体
JP2003162291A (ja) * 2001-11-22 2003-06-06 Ricoh Co Ltd 語学学習装置
JP2006126498A (ja) * 2004-10-28 2006-05-18 Tokyo Univ Of Science 英語の発音の学習を支援するためのプログラム、英語発音学習支援方法、英語発音学習支援装置、英語発音学習支援システム、及びプログラムを記録した記録媒体
US20090275005A1 (en) * 2005-11-18 2009-11-05 Haley Katarina L Methods, Systems, and Computer Program Products for Speech Assessment

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108154735A (zh) * 2016-12-06 2018-06-12 爱天教育科技(北京)有限公司 英语口语测评方法及装置
JP2018180299A (ja) * 2017-04-13 2018-11-15 イー・エム・エス株式会社 単語習得訓練システム
CN110087129A (zh) * 2019-04-18 2019-08-02 平安科技(深圳)有限公司 视频节目配音效果评估方法、装置及计算机可读存储介质
CN110087129B (zh) * 2019-04-18 2022-07-01 平安科技(深圳)有限公司 视频节目配音效果评估方法、装置及计算机可读存储介质
CN111402924A (zh) * 2020-02-28 2020-07-10 联想(北京)有限公司 一种口语测评方法、设备及计算机可读存储介质
CN111402924B (zh) * 2020-02-28 2024-04-19 联想(北京)有限公司 一种口语测评方法、设备及计算机可读存储介质

Also Published As

Publication number Publication date
KR20150001189A (ko) 2015-01-06

Similar Documents

Publication Publication Date Title
JP2015011348A (ja) 音声認識を用いた外国語スピーキング能力の訓練及び評価方法並びにその装置
US9196240B2 (en) Automated text to speech voice development
US6424935B1 (en) Two-way speech recognition and dialect system
JP4657736B2 (ja) ユーザ訂正を用いた自動音声認識学習のためのシステムおよび方法
US20100145698A1 (en) Systems and Methods for Assessment of Non-Native Spontaneous Speech
WO2021074721A2 (en) System for automatic assessment of fluency in spoken language and a method thereof
JP2016090900A (ja) 発話評価装置、発話評価方法及びプログラム
Pallett Performance assessment of automatic speech recognizers
JP2002040926A (ja) インターネット上での自動発音比較方法を用いた外国語発音学習及び口頭テスト方法
US20230230576A1 (en) Text-to-speech synthesis method and system, and a method of training a text-to-speech synthesis system
Zechner et al. Towards automatic scoring of non-native spontaneous speech
US20120219932A1 (en) System and method for automated speech instruction
US9361908B2 (en) Computer-implemented systems and methods for scoring concatenated speech responses
KR102225435B1 (ko) Stt 기반 언어구사 학습-훈련 시스템
US8870575B2 (en) Language learning system, language learning method, and computer program product thereof
GB2527242A (en) System and method for dynamic response to user interaction
Audhkhasi et al. Reliability-weighted acoustic model adaptation using crowd sourced transcriptions
KR101992370B1 (ko) 말하기 학습방법 및 학습시스템
Ai Automatic pronunciation error detection and feedback generation for call applications
Liao et al. A prototype of an adaptive Chinese pronunciation training system
KR102414626B1 (ko) 외국어 발음 훈련 및 평가 시스템
Gao et al. Spoken english intelligibility remediation with pocketsphinx alignment and feature extraction improves substantially over the state of the art
Díez et al. A corpus-based study of Spanish L2 mispronunciations by Japanese speakers
Proença et al. Children's Reading Aloud Performance: A Database and Automatic Detection of Disfluencies
Alsunaidi et al. Abjad: Towards interactive learning approach to arabic reading based on speech recognition

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170414

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180410

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20181218