JP2006048065A - 音声対話式言語指導法及び装置 - Google Patents
音声対話式言語指導法及び装置 Download PDFInfo
- Publication number
- JP2006048065A JP2006048065A JP2005237423A JP2005237423A JP2006048065A JP 2006048065 A JP2006048065 A JP 2006048065A JP 2005237423 A JP2005237423 A JP 2005237423A JP 2005237423 A JP2005237423 A JP 2005237423A JP 2006048065 A JP2006048065 A JP 2006048065A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- script
- input
- speaker
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000013515 script Methods 0.000 claims abstract description 136
- 238000011156 evaluation Methods 0.000 claims abstract description 20
- 230000004044 response Effects 0.000 claims description 28
- 238000009826 distribution Methods 0.000 claims description 11
- 230000009471 action Effects 0.000 claims description 4
- 238000011017 operating method Methods 0.000 abstract 2
- 238000010348 incorporation Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 24
- 238000012549 training Methods 0.000 description 13
- 230000007704 transition Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 8
- 230000002452 interceptive effect Effects 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 208000019505 Deglutition disease Diseases 0.000 description 1
- 206010013954 Dysphoria Diseases 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 230000009118 appropriate response Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/193—Formal grammars, e.g. finite state automata, context free grammars or word networks
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/06—Foreign languages
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
【解決手段】入力音声及び文法モデルから単語列の認識結果と単音列の認識結果を発生する言語指導及び言語評価のための自動音声認識器の操作方法であって、事前に選ばれたスクリプトの単語間及び文間に組み込んで、変更した文法モデルを形成するステップを含む。また、入力音声の正確さの指標をアプリケーションサブシステムからレッスンプログラムに入力し、オーディオ装置及び/又は映像装置を介して、レッスンプログラムを用いて、レッスンプログラムに入力された正確さに従った動作を取ることにより話者の読み上げの正確さを話者に示す。
【選択図】図3
Description
本発明によると、指導及び評価のための、特に言語の指導及び言語の流暢さの評価のための言語的コンテキスト感知式の音声認識を用いた指導システムが提供される。このシステムは、非ネーティブである利用者の強い外国アクセントを許容する一方、自然な音声対話式方法でレッスン、特に言語レッスンをしてその評価を与えることができる。レッスン資料と指導は、これに制限されるものではないが、ビデオ、オーディオ又は印刷された視覚的テキストを含めて、種々の方法で学習者に提示できる。例として、言語指導の特定された用途においては、ある指導は利用者になじみの言語でできる一方、会話及び対話の全体を目標言語、即ち指導言語で行うことができる。
本発明は添付の図面に関連した以下の詳細な記載を参照することによりよりよく理解されるであろう。
図1を参照すると、本発明による指導装置10のシステムブロック図が示されており、装置10の近くに位置する利用者12を指導するか、又は装置10から離れて位置する利用者12’を指導し電話14を介して通信する。ローカル利用者12はマイクロフォン16を通じてシステムと対話でき、スピーカー又はイヤホン18及び映像モニター(CRT)20を介して指導及びフィードバックされる。リモート利用者12’は、新聞広告などの刊行若しくは印刷されたテキスト22を通じて促され、又はなんらかの周知又は記憶されたテキストを用いることができる。リモート利用者の電話14はマルチプレクサー26を介して電話ネットワーク24を通じて結ばれる。ローカル利用者のマイクロフォン16もマルチプレクサー26に接続される。マルチプレクサー26の出力はプリアンプ28に接続され、ローパスフィルター30を介してアナログ−デジタル変換器32に接続される。この変換器32は、ワークステーション又は時分割計算機36内のデジタル信号処理(DSP)サブシステム34の一部である。DSPサブシステム34からの出力は、デジタル−アナログ変換器(DAC)38を介してアンプ40又は電話ネットワーク24のどちらか一方又は両方に供給される。これらのアンプ40及び電話ネットワーク24は夫々スピーカー18及び電話14に接続される。CRT20は一般的にワークステーション36の映像出力装置である。適当なDSPサブシステムとしては「ソニテックスピリット30(Sonitech Spirit 30)」DSPカードがあり、適当なワークステーションとしてはサンマイクロシステムズ(Sun Microsystems)のスパークステーション2ユニックスワークステーション(SPARCStation 2 UNIX workstation)がある。
RQS = 10 * (a*Tg/Tt + b*(Tn/[max(Tn,Tg)]) + c*W/(Rg + W)
ここで、
RQS は1から10のスケール上の朗読の質の得点(ここでは10のスケール因子を基にしている。)であり、
a,b,cはスケール因子で、その合計は1に等しく、特定の実施例では、a=0.25,b=0.25,c=0.5であり、
Wはテキスト中の単語の数であり、
Tg は「良好な」時間又は適切な文を朗読するのに使った時間であり、
Tt は初期及び最終休止を除いて朗読に使った全朗読時間であり、
Tn は最適朗読時間、即ち適切なネーティブ話し手による朗読時間であり、
Rg は文の「適切な」表現中、即ちTg 中に検出されたリジェクトの数である。
本発明は特定の実施例を参照して説明されてきた。他の実施例も本説明を参照の上では当業者には明らかとなるであろう。従って、この発明は添付の請求項により示されたもの以外には制限されることはないであろう。
1. 入力音声及び文法モデルから単語列の認識結果と単音列の認識結果を発生しモデルトレーナー、アプリケーションサブシステム及び自動音声認識器を備えた言語指導及び言語評価のための自動音声認識システムの操作方法であって、入力音声は、所定のスクリプトを読み上げるように話者に促したのに応じて話者により話された音声であり、該方法は、
モデルトレーナーにおいて、事前に選ばれたスクリプトから文法モデルを発生するステップ;
該モデルトレーナーにおいて、可能性のある非スクリプトの音声及び休止を表すアルト要素を、文法モデルにおいて事前に選ばれたスクリプトの単語間及び文間に組み込んで、変更した文法モデルを形成するステップ;
変更した文法モデルと共に自動音声認識器を用いて、入力音声から入力認識結果を発生するステップであって、前記入力認識結果は、前記変更した文法モデルにより許容された単語及びアルトの列の部分集合からなる前記ステップ;
アプリケーションサブシステムにおいて、入力認識結果を、事前に選ばれたスクリプト中に見いだされる単語の一つ、非スクリプトの音声及び沈黙として識別される列に分解するステップであって、入力認識結果中のアルトは、非スクリプトの音声及び沈黙に関連している前記ステップ;
該アプリケーションサブシステムにおいて、入力認識結果中のアルトの分布に基づいて入力音声の正確さを評価するステップであって、前記正確さは、入力音声の話者が読み上げるように促された事前に選ばれたスクリプトに対し、いかに良好に入力音声が一致しているかの尺度である前記ステップ;及び
アプリケーションサブシステム、オーディオ装置及び/又は映像装置から入力音声の正確さの指標を出力することで、いかに良好に話者が事前に選ばれたスクリプトを読み上げたかを話者に知らせるステップ
を含む上記方法。
2. アナログ-デジタル変換器にて入力音声をデジタル化し、デジタル化した入力音声をデジタルメモリに記憶するステップ;
文法モデルと変更した文法モデルをデジタルメモリに記憶するステップ;及び
デジタルコンピュータの音声認識器において、入力音声と記憶した文法モデルを比較するステップ
をさらに含む、第1項に記載の方法。
3. 入力音声に応じて、少なくとも3つの忍耐レベルに従って音声的及び意味的に的確な事前に選択したスクリプトを再度読み上げるようにオーディオ装置及び/又は映像装置を介して話者に促すステップをさらに含む、第1項に記載の方法。
4. 入力音声及び文法モデルから単語列の認識結果と単音列の認識結果を発生しモデルトレーナー、アプリケーションサブシステム及び自動音声認識器を備えた言語指導及び言語評価のための自動音声認識システムの操作方法であって、入力音声は、所定のスクリプトを読み上げるように話者に促したのに応じて話者により話された音声であり、該方法は、
モデルトレーナーにおいて、事前に選ばれたスクリプトから文法モデルを発生するステップ;
該モデルトレーナーにおいて、可能性のある非スクリプトの音声及び休止を表すアルト要素を、文法モデルにおいて事前に選ばれたスクリプトの単語間及び文間に組み込んで、変更した文法モデルを形成するステップ
変更した文法モデルと共に自動音声認識器を用いて、入力音声から入力認識結果を発生するステップであって、前記入力認識結果は、前記変更した文法モデルにより許容された単語及びアルトの列の部分集合からなる前記ステップ;
アプリケーションサブシステムにおいて、入力認識結果を、事前に選ばれたスクリプト中に見いだされる単語の一つ、非スクリプトの音声及び沈黙として識別される列に分解するステップであって、入力認識結果中のアルトは、非スクリプトの音声及び沈黙に関連している前記ステップ;
該アプリケーションサブシステムにおいて、入力認識結果中のアルトの分布に基づいて入力音声の正確さを評価するステップ;及び
アプリケーションサブシステム、オーディオ装置及び/又は映像装置から入力音声の正確さの指標を話者に出力するステップ
を含み、前記事前に選ばれたスクリプトが代替テキストを含み、
また、該方法が、モデルトレーナーにおいて代替テキストに対する双方向性の会話文法モデルを発生するステップであって、該双方向性の会話文法モデルが、代替フレーズの選択の前に置かれた第1の共通アルト要素と、代替フレーズの選択の後に置かれた第2の共通アルト要素を含み、音声的に正確だが意味的に不的確な代替応答を可能にするステップをさらに含む上記方法。
5. 長期の沈黙、長期のスクリプト外の音声、沈黙期間とスクリプト外の音声の期間を交互にもつ音声、及び休止又はスクリプト外の音声のない音声を含めた事象に対する複数の遷移弧としてアルト要素が構造化される、第4項に記載の方法。
6. 入力音声及び文法モデルから単語列の認識結果と単音列の認識結果を発生しモデルトレーナー、アプリケーションサブシステム及び自動音声認識器を備えた言語指導及び言語評価のための自動音声認識システムの操作方法であって、入力音声は、所定のスクリプトを読み上げるように話者に促したのに応じて話者により話された音声であり、該方法は、
モデルトレーナーにおいて、事前に選ばれたスクリプトから文法モデルを発生するステップ;
該モデルトレーナーにおいて、可能性のある非スクリプトの音声及び休止を表すアルト要素を、文法モデルにおいて事前に選ばれたスクリプトの単語間及び文間に組み込んで、変更した文法モデルを形成するステップ
変更した文法モデルと共に自動音声認識器を用いて、入力音声から入力認識結果を発生するステップであって、前記入力認識結果は、前記変更した文法モデルにより許容された単語及びアルトの列の部分集合からなる前記ステップ;
アプリケーションサブシステムにおいて、入力認識結果を、事前に選ばれたスクリプト中に見いだされる単語の一つ、非スクリプトの音声及び沈黙として識別される列に分解するステップであって、入力認識結果中のアルトは、非スクリプトの音声及び沈黙に関連し、
a)アプリケーションサブシステムの有限状態機械において、スクリプト化された単語、休止単音及びリジェクト単音について音声認識器による現在のセグメント出力を反復して調べるステップ;
b)アプリケーションサブシステムの有限状態機械において、現在のセグメントに対しリジェクト密度を求めるステップ;及び
c)アプリケーションサブシステムの有限状態機械において、もしリジェクト密度がリジェクト密度のしきい値を超えているならば、現在のセグメントをスクリプト外の音声として表すステップ
を含む前記ステップ;
アプリケーションサブシステムにおいて、入力認識結果中のアルトの分布に基づいて入力音声の正確さを評価するステップ;及び
アプリケーションサブシステム、オーディオ装置及び/又は映像装置から入力音声の正確さの指標を話者に出力するステップ
を含む上記方法。
7. 現在のセグメントのリジェクト密度を求めるステップが、前記有限状態機械において、所定数の連続したスクリプト化された単語に対する音声認識器により戻されたリジェクト単音の数を、リジェクト単音数と該所定数の連続したスクリプト化された単語数との和で除するステップを含む、第6項に記載の方法。
8. 入力音声及び文法モデルから単語列の認識結果と単音列の認識結果を発生しモデルトレーナー、アプリケーションサブシステム及び自動音声認識器を備えた言語指導及び言語評価のための自動音声認識システムの操作方法であって、入力音声は、所定のスクリプトを読み上げるように話者に促したのに応じて話者により話された音声であり、該方法は、
モデルトレーナーにおいて、事前に選ばれたスクリプトから文法モデルを発生するステップ;
該モデルトレーナーにおいて、可能性のある非スクリプトの音声及び休止を表すアルト要素を、文法モデルにおいて事前に選ばれたスクリプトの単語間及び文間に組み込んで、変更した文法モデルを形成するステップ
変更した文法モデルと共に自動音声認識器を用いて、入力音声から入力認識結果を発生するステップであって、前記入力認識結果は、前記変更した文法モデルにより許容された単語及びアルトの列の部分集合からなる前記ステップ;
アプリケーションサブシステムにおいて、入力認識結果を、事前に選ばれたスクリプト中に見いだされる単語の一つ、非スクリプトの音声及び沈黙として識別される列に分解するステップであって、入力認識結果中のアルトは、非スクリプトの音声及び沈黙に関連し、
a)アプリケーションサブシステムの有限状態機械において、スクリプト化された単語、休止音及びリジェクト単音について音声認識器による現在のセグメント出力を反復して調べるステップ;
b)アプリケーションサブシステムの有限状態機械において、現在のセグメントに対しリジェクト密度を求めるステップ;及び
c)アプリケーションサブシステムの有限状態機械において、もしリジェクト密度がリジェクト密度のしきい値を超えているならば、現在のセグメントをスクリプト外の音声として表すステップ
を含む前記ステップ;
アプリケーションサブシステムにおいて、入力認識結果中のアルトの分布に基づいて入力音声の正確さを評価するステップ;及び
アプリケーションサブシステム、オーディオ装置及び/又は映像装置から入力音声の正確さの指標を話者に出力することで、いかに良好に話者が所定のスクリプトを読み上げたかを話者に知らせるステップ
を含む上記方法。
9. 現在のセグメントに対するリジェクト指標を求めるステップが、所定数の連続したスクリプト化された単語に対し音声認識器により戻されたリジェクト単音数を合計するステップを含む、第8項に記載の方法。
10. 入力音声及び文法モデルから単語列の認識結果と単音列の認識結果を発生しモデルトレーナー、アプリケーションサブシステム及び自動音声認識器を備えた言語指導及び言語評価のための自動音声認識システムの操作方法であって、入力音声は、所定のスクリプトを読み上げるように話者に促したのに応じて話者により話された音声であり、該方法は、
モデルトレーナーにおいて、事前に選ばれたスクリプトから文法モデルを発生するステップ;
該モデルトレーナーにおいて、可能性のある非スクリプトの音声及び休止を表すアルト要素を、文法モデルにおいて事前に選ばれたスクリプトの単語間及び文間に組み込んで、変更した文法モデルを形成するステップ
変更した文法モデルと共に自動音声認識器を用いて、入力音声から入力認識結果を発生するステップであって、前記入力認識結果は、前記変更した文法モデルにより許容された単語及びアルトの列の部分集合からなる前記ステップ;
アプリケーションサブシステムにおいて、入力認識結果を、事前に選ばれたスクリプト中に見いだされる単語の一つ、非スクリプトの音声及び沈黙として識別される列に分解するステップであって、入力認識結果中のアルトは、非スクリプトの音声及び沈黙に関連し、
a)アプリケーションサブシステムの有限状態機械において、スクリプト化された単語、休止単音及びリジェクト単音について音声認識器による現在のセグメント出力を反復して調べるステップ;
b)前記有限状態機械において、現在のセグメントに対し休止指標を求めるステップ;及び
c)前記有限状態機械において、もし休止指標が休止指標のしきい値を超えているならば、現在のセグメントを有効(actionable)な休止として表すステップであって、該有効な休止は、自動音声認識器と話者の間の対話における交替点を表す前記ステップ
を含む前記ステップ;
アプリケーションサブシステムにおいて、入力認識結果中のアルトの分布に基づいて入力音声の正確さを評価するステップ;及び
アプリケーションサブシステム、オーディオ装置及び/又は映像装置から入力音声の正確さの指標を話者に出力することで、いかに良好に話者が所定のスクリプトを読み上げたかを話者に知らせるステップ
を含む上記方法。
11. アプリケーションサブシステムにおいて、現在のセグメントの言語的文脈及び所定のスクリプト中の現在のセグメントの位置に依存したしきい値として休止指標のしきい値を発生するステップであって、休止指標のしきい値が、所定のスクリプトの文の他のところの単語間よりも文及び主節の終わりにて小さい前記ステップをさらに含む、第10項に記載の方法。
12. 休止指標を求めるステップが、アプリケーションサブシステムにおいて、所定のスクリプトのうち所定数の連続した単語から音声認識器により戻された休止単音を合計するステップを含む、第10項に記載の方法。
13. 文法モデル及び所定のスクリプトを読み上げるように促された話者により話された入力音声から単語列の認識結果及び単音列の認識結果を作る自動音声認識器を用いて、話者の音声をトラッキングするためのシステムであって、
主題及び所定のスクリプトについて話者に情報を与え、かつ所定のスクリプトを読み上げるように話者に促すための提示手段;
提示手段の催促に応じて話された入力音声を電子的に取り込むための音声検出手段であって、取り込んだ入力音声はコンピュータメモリに記憶される前記手段;
取り込んだ入力音声を分析し、単語及びアルトを認識すべく訓練された認識モデルと単語及びアルトを含んだ文法に基づいて単語及びアルトの列を求める自動音声認識手段であって、求められた単語及びアルトは取り込んだ入力音声に対応し、単語は所定のスクリプトの一部として識別され、アルトは非スクリプトの音声及び休止を表す前記手段;
自動音声認識手段に接続され、前記列を受け取り、その結果から発声の完全性を評価し、所定のスクリプトの読み上げの正確さを求めるための音声評価手段であって、前記正確さは、いかに良好に入力音声が、入力音声の話者が読み上げるように促された所定のスクリプトに一致しているかの尺度である前記手段;及び
評価手段に接続され、もし読み上げが正確でないならば、所定のスクリプトを正しく読み上げるよう話者に指示する応答を行うための応答手段を備える前記システム。
14. 話者にとっては外国語で指導するために用いられる第13項に記載のシステムであって、応答手段が、ネイティブの発音及び該言語での音声の表現の例として可聴応答を発生するための手段を含む前記システム。
15. 読み上げ速度を測定するための手段をさらに含み、該手段が、
読み上げられた単語を計数して読み上げられた単語数を求めるための単語カウンター手段;
スクリプト化された単語の読み上げ時間を測定するためのタイマー手段;及び
読み上げられた単語数を、測定した経過時間で除するための第1デバイダー手段
を含む、第13項に記載のシステム。
16. 読み上げの質を測定して読み上げの質の得点(230)を得るための手段(192)をさらに含み、該手段が、
所定のスクリプト中の単語(195)を計数して所定のスクリプトの単語数を求めるための単語計数手段(194);
最適な読み上げ時間(197)を伝えるための伝達手段(196);
リジェクト単音(199)を計数してリジェクト単音の数を求めるための計数手段(198);
所定のスクリプトの読み上げ中に経過した総時間(201)を測定するための第1時間測定手段(200);
分析手段により許容可能と判断されたフレーズの読み上げ中に経過した良好時間(203)を測定するための第2時間測定手段(202);
第2時間測定手段から良好時間(203)を受け取り、第1時間測定手段から総時間(201)を受け取り、良好時間(203)を総時間(201)で除して第1の商(205)を得るための第1デバイダー手段(204);
伝達手段から最適読み上げ時間(197)を受け取り、最適読み上げ時間(197)と良好時間(203)のうちの最大である好適な最大値(211)を選択して出力するためのセレクター手段(210);
伝達手段(196)に接続されて最適読み上げ時間を受け取り、セレクター手段に接続されて好適な最大値を受け取り、最適読み上げ時間(197)を好適な最大値(211)で除して第2の商(213)を得るための第2デバイダー手段(212);
単語計数手段(194)に接続されて所定のスクリプトの単語数(195)を受け取り、計数手段(198)に接続されてリジェクト単音数(199)を受け取り、リジェクト単音数(199)と所定のスクリプトの単語数(195)とを合計し、質の値(219)を得るための合計手段(218);
合計手段(218)に接続されて質の値を受け取り、単語計数手段(194)に接続されて所定のスクリプトの単語数(195)を受け取り、所定のスクリプトの単語数(195)を質の値(219)で除して第3の商(221)を得るための第3デバイダー手段(220);及び
第1デバイダー手段(204)に接続されて第1得点成分(208)を受け取り、第2デバイダー手段(212)に接続されて第2得点成分(216)を受け取り、第3デバイダー手段(220)に接続されて第3得点成分(224)を受け取り、第1得点成分(208)、第2得点成分(216)及び第3得点成分(224)の重み付き合計として、読み上げの質の得点(230)を計算するための計算手段
を備える、第13項に記載のシステム。
17. 文法モデル及び所定のスクリプトを読み上げるように促された話者により話された入力音声から単語列の認識結果及び単音列の認識結果を作る自動音声認識器を用いて、話者の音声をトラッキングするためのシステムであって、
主題及び所定のスクリプトについて話者に情報を与え、かつ所定のスクリプトを読み上げるように話者に促すための提示手段;
提示手段の催促に応じて話された入力音声を電子的に取り込むための手段であって、取り込んだ入力音声はコンピュータメモリに記憶される前記手段;
取り込んだ入力音声を分析し、単語及びアルトを認識すべく訓練された認識モデルと単語及びアルトを含んだ文法に基づいて単語及びアルトの列を求める音声認識手段であって、求めた単語とアルトは取り込んだ入力音声に対応し、単語は所定のスクリプトの一部として識別され、アルトは非スクリプトの音声及び休止を表す前記手段;
分析手段に接続され、発声の完全性を評価し、所定のスクリプトの読み上げの正確さを求めるための手段;
評価手段に接続され、もし読み上げが正確でないならば、所定のスクリプトを正しく読み上げるよう話者に指示する応答を行うための応答手段;
読み上げの質を測定して読み上げの質の得点(230)を得るための手段(192)であって、
(a)所定のスクリプト中の単語(195)を計数して所定のスクリプトの単語数を求めるための単語計数手段(194);
(b)最適な読み上げ時間(197)を伝えるための伝達手段(196);
(c)リジェクト単音(199)を計数してリジェクト単音の数を求めるための計数手段(198);
(d)所定のスクリプトの読み上げ中に経過した総時間(201)を測定するための第1時間測定手段(200);
(e)分析手段により許容可能と判断されたフレーズの読み上げ中に経過した良好時間(203)を測定するための第2時間測定手段(202);
(f)第2時間測定手段から良好時間(203)を受け取り、第1時間測定手段から総時間を受け取り、良好時間(203)を総時間(201)で除して第1の商(205)を得るための第1デバイダー手段(204);
(g)伝達手段から最適読み上げ時間(197)を受け取り、最適読み上げ時間(197)と良好時間(203)のうちの最大である好適な最大値(211)を選択し出力するためのセレクター手段(210);
(h)伝達手段(196)から最適読み上げ時間を受け取り、セレクター手段から好適な最大値を受け取り、最適読み上げ時間(197)を好適な最大値(211)で除して第2の商(213)を得るための第2デバイダー手段(212);
(i)単語計数手段(194)から所定のスクリプトの単語数(195)を受け取り、計数手段(198)からリジェクト単音数(199)を受け取り、リジェクト単音数(199)と所定のスクリプトの単語数(195)とを合計し、質の値(219)を得るための合計手段(218);
(j)合計手段(218)から質の値を受け取り、単語計数手段(194)から所定のスクリプトの単語数(195)を受け取り、所定のスクリプトの単語数(195)を質の値(219)で除して第3の商(221)を得るための第3デバイダー手段(220);及び
(k)第1デバイダー手段(204)から第1得点成分(208)を受け取り、第2デバイダー手段(212)から第2得点成分(216)を受け取り、第3デバイダー手段(220)から第3得点成分(224)を受け取り、第1得点成分(208)、第2得点成分(216)及び第3得点成分(224)の重み付き合計として、読み上げの質の得点(230)を計算するための計算手段;
を含む前記手段(192)
を備え、前記計算手段が、
1)第1の商(205)を第1の重み付けパラメータ(a)で重み付けして第1得点成分(208)を得るための第1乗算手段(206);
2)第2の商(213)を第2の重み付けパラメータ(b)で重み付けして第2得点成分(216)を得るための第2乗算手段(214);
3)第3の商(221)を第3の重み付けパラメータ(c)で重み付けして第3得点成分(224)を得るための第3乗算手段(222);
4)第1得点成分(208)、第2得点成分(216)及び第3得点成分(224)を合計して得点合計(227)を出すための合計手段(226);及び
5)得点合計(227)を倍率(228)で重み付けして読み上げの質の得点(230)を得るための第4乗算手段
をさらに備える、前記システム。
18. 音声出力及びグラフィック出力と自動音声認識器とを用いて音声をトラッキングしかつ話者と対話するためのシステムであって、該自動音声認識器は、複数の所定の代替スクリプトを含んだ所定のスクリプトから読み上げるように促された後に話者が話した入力音声と文法モデルとから、単語列の認識結果と単音列の認識結果を作り、該システムは、
主題について話者に情報を提示し、複数の所定の代替スクリプトのうちの一つを読み上げるよう話者に促すための提示手段;
入力音声を電子的に取り込むための感知手段であって、取り込まれた入力音声はコンピュータメモリに記憶される前記感知手段;
取り込まれた入力音声を分析し、話者により話された入力音声に対応する入力認識結果を求めるための分析手段であって、該分析手段は単語及びアルトを認識すべく訓練された音声認識モデルと単語及びアルトを含んだ文法に基づいて入力認識結果を求め、求めた入力認識結果は取り込んだ入力音声に対応し、単語は所定のスクリプトの一部として識別され、アルトは非スクリプトの音声、休止及び/又は背景ノイズを表す前記分析手段;
分析手段に接続され、複数の所定の代替スクリプトのうちどの所定の代替スクリプトが入力認識結果に最もよく対応しているかを特定するための特定手段;
特定手段に接続され、発声の完全性を評価して特定された所定の代替スクリプトの読み上げの正確さを求めるための評価手段であって、該正確さは、入力音声が、入力音声の話者に読み上げるように促された所定のスクリプトといかに良好に一致しているかの尺度である前記評価手段;及び
評価手段に接続され、特定された所定の代替スクリプトの読み上げの正確さと、特定された所定の代替スクリプトの意味的な適切さとを話者に示す応答を、発声の完了の際に出力するための出力手段
を含む、前記システム。
19. 対話システムが、話者にとっては外国語による指導用であり、応答手段が、ネイティブの発音及び表現の例として可聴応答を発生するための手段を含む、第18項に記載のシステム。
20. 指標を出力するステップが、指標を間接的に出力するステップであり、
アプリケーションサブシステムからレッスンプログラムに指標を入力するステップ;及び
オーディオ装置及び/又は映像装置を介して、レッスンプログラムを用いて、レッスンプログラムに入力された正確さに従った動作を取ることにより話者の読み上げの正確さを話者に示すステップ
を含む、第1項に記載の方法。
12 利用者
14 電話
16 マイク
18 スピーカー
20 CRT
22 テキスト
24 電話ネットワーク
26 マルチプレクサー
34 デジタル信号処理(DSP)サブシステム
36 ワークステーション
42 フロントエンド信号処理システム
44 モデル探索器
46 HMMモデル
48 アプリケーションサブシステム
108 HMMトレーナー
112 音声認識器
Claims (1)
- 入力音声及び文法モデルから単語列の認識結果と単音列の認識結果を発生しモデルトレーナー、アプリケーションサブシステム及び自動音声認識器を備えた言語指導及び言語評価のための自動音声認識システムの操作方法であって、入力音声は、所定のスクリプトを読み上げるように話者に促したのに応じて話者により話された音声であり、該方法は、
モデルトレーナーにおいて、事前に選ばれたスクリプトから文法モデルを発生するステップ;
該モデルトレーナーにおいて、可能性のある非スクリプトの音声及び休止を表すアルト要素を、文法モデルにおいて事前に選ばれたスクリプトの単語間及び文間に組み込んで、変更した文法モデルを形成するステップ;
変更した文法モデルと共に自動音声認識器を用いて、入力音声から入力認識結果を発生するステップであって、前記入力認識結果は、前記変更した文法モデルにより許容された単語及びアルトの列の部分集合からなる前記ステップ;
アプリケーションサブシステムにおいて、入力認識結果を、事前に選ばれたスクリプト中に見いだされる単語の一つ、非スクリプトの音声及び沈黙として識別される列に分解するステップであって、入力認識結果中のアルトは、非スクリプトの音声及び沈黙に関連している前記ステップ;
該アプリケーションサブシステムにおいて、入力認識結果中のアルトの分布に基づいて入力音声の正確さを評価するステップであって、前記正確さは、入力音声の話者が読み上げるように促された事前に選ばれたスクリプトに対し、いかに良好に入力音声が一致しているかの尺度である前記ステップ;及び
アプリケーションサブシステム、オーディオ装置及び/又は映像装置から入力音声の正確さの指標を出力することで、いかに良好に話者が事前に選ばれたスクリプトを読み上げたかを話者に知らせるステップ
を含み、更に、
指標を出力するステップが、指標を間接的に出力するステップであり、
アプリケーションサブシステムからレッスンプログラムに指標を入力するステップ;及び
オーディオ装置及び/又は映像装置を介して、レッスンプログラムを用いて、レッスンプログラムに入力された正確さに従った動作を取ることにより話者の読み上げの正確さを話者に示すステップ
を含む方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US3285093A | 1993-03-12 | 1993-03-12 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1994520287A Division JP3899122B6 (ja) | 1993-03-12 | 1994-03-08 | 音声対話式言語指導のための方法及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006048065A true JP2006048065A (ja) | 2006-02-16 |
Family
ID=21867160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005237423A Withdrawn JP2006048065A (ja) | 1993-03-12 | 2005-08-18 | 音声対話式言語指導法及び装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US5634086A (ja) |
EP (1) | EP0692135B1 (ja) |
JP (1) | JP2006048065A (ja) |
KR (1) | KR100309207B1 (ja) |
AT (1) | ATE195605T1 (ja) |
DE (1) | DE69425564D1 (ja) |
WO (1) | WO1994020952A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023248520A1 (ja) * | 2022-06-20 | 2023-12-28 | オムロンヘルスケア株式会社 | 認知機能検査装置及び認知機能検査プログラム |
Families Citing this family (145)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6109923A (en) | 1995-05-24 | 2000-08-29 | Syracuase Language Systems | Method and apparatus for teaching prosodic features of speech |
DE69622439T2 (de) * | 1995-12-04 | 2002-11-14 | Jared C. Bernstein | Verfahren und vorrichtung zur ermittlung von kombinierten informationen aus sprachsignalen für adaptive interaktion in unterricht und prüfung |
IL120622A (en) * | 1996-04-09 | 2000-02-17 | Raytheon Co | System and method for multimodal interactive speech and language training |
GB9619165D0 (en) * | 1996-09-13 | 1996-10-23 | British Telecomm | Training apparatus and method |
WO1998014934A1 (en) | 1996-10-02 | 1998-04-09 | Sri International | Method and system for automatic text-independent grading of pronunciation for language instruction |
US6157913A (en) * | 1996-11-25 | 2000-12-05 | Bernstein; Jared C. | Method and apparatus for estimating fitness to perform tasks based on linguistic and other aspects of spoken responses in constrained interactions |
US5857173A (en) * | 1997-01-30 | 1999-01-05 | Motorola, Inc. | Pronunciation measurement device and method |
US5920838A (en) * | 1997-06-02 | 1999-07-06 | Carnegie Mellon University | Reading and pronunciation tutor |
JPH1152979A (ja) * | 1997-08-08 | 1999-02-26 | Fujitsu Ltd | 順序データの音声認識装置 |
US6125341A (en) * | 1997-12-19 | 2000-09-26 | Nortel Networks Corporation | Speech recognition system and method |
US5995932A (en) * | 1997-12-31 | 1999-11-30 | Scientific Learning Corporation | Feedback modification for accent reduction |
US6134529A (en) * | 1998-02-09 | 2000-10-17 | Syracuse Language Systems, Inc. | Speech recognition apparatus and method for learning |
JP3178426B2 (ja) * | 1998-07-29 | 2001-06-18 | 日本電気株式会社 | 自然言語対話システム及び自然言語対話プログラム記録媒体 |
KR100385892B1 (ko) * | 1998-09-10 | 2003-08-14 | 이에스피 평가 아카데미(주) | 외국어말하기평가시스템 |
US6380934B1 (en) * | 1998-11-30 | 2002-04-30 | Mitsubishi Electric Research Laboratories, Inc. | Estimating targets using statistical properties of observations of known targets |
US6353924B1 (en) * | 1999-02-08 | 2002-03-05 | Incert Software Corporation | Method for back tracing program execution |
US7062441B1 (en) | 1999-05-13 | 2006-06-13 | Ordinate Corporation | Automated language assessment using speech recognition modeling |
US6308151B1 (en) * | 1999-05-14 | 2001-10-23 | International Business Machines Corp. | Method and system using a speech recognition system to dictate a body of text in response to an available body of text |
US6468084B1 (en) * | 1999-08-13 | 2002-10-22 | Beacon Literacy, Llc | System and method for literacy development |
US7149690B2 (en) | 1999-09-09 | 2006-12-12 | Lucent Technologies Inc. | Method and apparatus for interactive language instruction |
EP1139318A4 (en) * | 1999-09-27 | 2002-11-20 | Kojima Co Ltd | PRONUNCIATION EVALUATION SYSTEM |
US7130800B1 (en) | 2001-09-20 | 2006-10-31 | West Corporation | Third party verification system |
US6401066B1 (en) | 1999-11-09 | 2002-06-04 | West Teleservices Holding Company | Automated third party verification system |
US7206746B1 (en) | 1999-11-09 | 2007-04-17 | West Corporation | Third party verification system |
JP3520022B2 (ja) | 2000-01-14 | 2004-04-19 | 株式会社国際電気通信基礎技術研究所 | 外国語学習装置、外国語学習方法および媒体 |
US7031923B1 (en) * | 2000-03-06 | 2006-04-18 | International Business Machines Corporation | Verbal utterance rejection using a labeller with grammatical constraints |
US6644973B2 (en) * | 2000-05-16 | 2003-11-11 | William Oster | System for improving reading and speaking |
US7047196B2 (en) | 2000-06-08 | 2006-05-16 | Agiletv Corporation | System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery |
US6850882B1 (en) | 2000-10-23 | 2005-02-01 | Martin Rothenberg | System for measuring velar function during speech |
US7792676B2 (en) * | 2000-10-25 | 2010-09-07 | Robert Glenn Klinefelter | System, method, and apparatus for providing interpretive communication on a network |
GB0030079D0 (en) * | 2000-12-09 | 2001-01-24 | Hewlett Packard Co | Voice exchanges with voice service systems |
AU2002231045A1 (en) * | 2000-12-18 | 2002-07-01 | Digispeech Marketing Ltd. | Method of providing language instruction and a language instruction system |
US7400712B2 (en) * | 2001-01-18 | 2008-07-15 | Lucent Technologies Inc. | Network provided information using text-to-speech and speech recognition and text or speech activated network control sequences for complimentary feature access |
US6523007B2 (en) * | 2001-01-31 | 2003-02-18 | Headsprout, Inc. | Teaching method and system |
US7664641B1 (en) | 2001-02-15 | 2010-02-16 | West Corporation | Script compliance and quality assurance based on speech recognition and duration of interaction |
US7739115B1 (en) | 2001-02-15 | 2010-06-15 | West Corporation | Script compliance and agent feedback |
US7191133B1 (en) * | 2001-02-15 | 2007-03-13 | West Corporation | Script compliance using speech recognition |
US8180643B1 (en) | 2001-02-15 | 2012-05-15 | West Corporation | Script compliance using speech recognition and compilation and transmission of voice and text records to clients |
US7966187B1 (en) | 2001-02-15 | 2011-06-21 | West Corporation | Script compliance and quality assurance using speech recognition |
US8095370B2 (en) | 2001-02-16 | 2012-01-10 | Agiletv Corporation | Dual compression voice recordation non-repudiation system |
WO2002071390A1 (en) * | 2001-03-01 | 2002-09-12 | Ordinate Corporation | A system for measuring intelligibility of spoken language |
KR20010044657A (ko) * | 2001-03-14 | 2001-06-05 | 김선래 | 말하기 능력 평가 시스템 |
US7403938B2 (en) * | 2001-09-24 | 2008-07-22 | Iac Search & Media, Inc. | Natural language query processing |
KR20030027990A (ko) * | 2001-09-27 | 2003-04-08 | 주식회사 아이티엔방송 | 음성 인식 시스템을 이용한 인터넷 영어 능력 평가 시스템및 그 방법 |
US7386453B2 (en) * | 2001-11-14 | 2008-06-10 | Fuji Xerox, Co., Ltd | Dynamically changing the levels of reading assistance and instruction to support the needs of different individuals |
US6819758B2 (en) | 2001-12-21 | 2004-11-16 | West Corporation | Method, system, and computer-readable media for performing speech recognition of indicator tones |
KR20020062564A (ko) * | 2001-12-29 | 2002-07-26 | 강선 | 인터넷상에서의 외국어 교정 방법 및 그 시스템 |
US6953343B2 (en) | 2002-02-06 | 2005-10-11 | Ordinate Corporation | Automatic reading system and methods |
US7024362B2 (en) * | 2002-02-11 | 2006-04-04 | Microsoft Corporation | Objective measure for estimating mean opinion score of synthesized speech |
US7016842B2 (en) * | 2002-03-26 | 2006-03-21 | Sbc Technology Resources, Inc. | Method and system for evaluating automatic speech recognition telephone services |
US6804331B1 (en) | 2002-03-27 | 2004-10-12 | West Corporation | Method, apparatus, and computer readable media for minimizing the risk of fraudulent receipt of telephone calls |
US6862343B1 (en) | 2002-03-27 | 2005-03-01 | West Corporation | Methods, apparatus, scripts, and computer readable media for facilitating secure capture of sensitive data for a voice-based transaction conducted over a telecommunications network |
JP2003308091A (ja) * | 2002-04-17 | 2003-10-31 | Pioneer Electronic Corp | 音声認識装置、音声認識方法および音声認識プログラム |
JP4224250B2 (ja) * | 2002-04-17 | 2009-02-12 | パイオニア株式会社 | 音声認識装置、音声認識方法および音声認識プログラム |
DE60327020D1 (de) * | 2002-05-27 | 2009-05-20 | Pioneer Corp | Vorrichtung, Verfahren und computerlesbares Aufzeichnungsmedium zur Erkennung von Schlüsselwörtern in spontaner Sprache |
US6937702B1 (en) | 2002-05-28 | 2005-08-30 | West Corporation | Method, apparatus, and computer readable media for minimizing the risk of fraudulent access to call center resources |
US7403967B1 (en) | 2002-06-18 | 2008-07-22 | West Corporation | Methods, apparatus, and computer readable media for confirmation and verification of shipping address data associated with a transaction |
US7693720B2 (en) | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
US7249011B2 (en) * | 2002-08-12 | 2007-07-24 | Avaya Technology Corp. | Methods and apparatus for automatic training using natural language techniques for analysis of queries presented to a trainee and responses from the trainee |
US6889147B2 (en) * | 2002-09-17 | 2005-05-03 | Hydrogenics Corporation | System, computer program product and method for controlling a fuel cell testing device |
US7752045B2 (en) * | 2002-10-07 | 2010-07-06 | Carnegie Mellon University | Systems and methods for comparing speech elements |
US7593842B2 (en) * | 2002-12-10 | 2009-09-22 | Leslie Rousseau | Device and method for translating language |
US7324944B2 (en) * | 2002-12-12 | 2008-01-29 | Brigham Young University, Technology Transfer Office | Systems and methods for dynamically analyzing temporality in speech |
US7171358B2 (en) * | 2003-01-13 | 2007-01-30 | Mitsubishi Electric Research Laboratories, Inc. | Compression of language model structures and word identifiers for automated speech recognition systems |
US20040138883A1 (en) * | 2003-01-13 | 2004-07-15 | Bhiksha Ramakrishnan | Lossless compression of ordered integer lists |
JP2006523918A (ja) * | 2003-04-17 | 2006-10-19 | ハイドロジェニクス コーポレイション | 燃料電池試験システムのための警報リカバリシステム及び方法 |
US7797146B2 (en) * | 2003-05-13 | 2010-09-14 | Interactive Drama, Inc. | Method and system for simulated interactive conversation |
US7421393B1 (en) | 2004-03-01 | 2008-09-02 | At&T Corp. | System for developing a dialog manager using modular spoken-dialog components |
US20040229954A1 (en) * | 2003-05-16 | 2004-11-18 | Macdougall Diane Elaine | Selective manipulation of triglyceride, HDL and LDL parameters with 6-(5-carboxy-5-methyl-hexyloxy)-2,2-dimethylhexanoic acid monocalcium salt |
US20080249779A1 (en) * | 2003-06-30 | 2008-10-09 | Marcus Hennecke | Speech dialog system |
US20050027523A1 (en) * | 2003-07-31 | 2005-02-03 | Prakairut Tarlton | Spoken language system |
US7524191B2 (en) * | 2003-09-02 | 2009-04-28 | Rosetta Stone Ltd. | System and method for language instruction |
US7386451B2 (en) * | 2003-09-11 | 2008-06-10 | Microsoft Corporation | Optimization of an objective measure for estimating mean opinion score of synthesized speech |
WO2005028715A1 (en) * | 2003-09-22 | 2005-03-31 | Hydrogenics Corporation | System and method for alarm recovery for an electrolyzer cell module |
CN1320482C (zh) * | 2003-09-29 | 2007-06-06 | 摩托罗拉公司 | 标识文本串中的自然语音停顿的方法 |
US20050144010A1 (en) * | 2003-12-31 | 2005-06-30 | Peng Wen F. | Interactive language learning method capable of speech recognition |
US7660715B1 (en) * | 2004-01-12 | 2010-02-09 | Avaya Inc. | Transparent monitoring and intervention to improve automatic adaptation of speech models |
US7412393B1 (en) * | 2004-03-01 | 2008-08-12 | At&T Corp. | Method for developing a dialog manager using modular spoken-dialog components |
JP3962763B2 (ja) * | 2004-04-12 | 2007-08-22 | 松下電器産業株式会社 | 対話支援装置 |
US20060008781A1 (en) * | 2004-07-06 | 2006-01-12 | Ordinate Corporation | System and method for measuring reading skills |
KR100701271B1 (ko) | 2004-08-20 | 2007-03-29 | 동아시테크주식회사 | 온라인 외국어 인터뷰 학습 및 평가 시스템과 그 시스템을이용한 인터뷰 학습 및 평가 방법 |
US8109765B2 (en) * | 2004-09-10 | 2012-02-07 | Scientific Learning Corporation | Intelligent tutoring feedback |
US20060057545A1 (en) * | 2004-09-14 | 2006-03-16 | Sensory, Incorporated | Pronunciation training method and apparatus |
US7873522B2 (en) * | 2005-06-24 | 2011-01-18 | Intel Corporation | Measurement of spoken language training, learning and testing |
US7640160B2 (en) | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US20070055514A1 (en) * | 2005-09-08 | 2007-03-08 | Beattie Valerie L | Intelligent tutoring feedback |
US8756057B2 (en) | 2005-11-02 | 2014-06-17 | Nuance Communications, Inc. | System and method using feedback speech analysis for improving speaking ability |
CN101366065A (zh) * | 2005-11-30 | 2009-02-11 | 语文交流企业公司 | 交互式语言教育系统和方法 |
US7526722B2 (en) * | 2005-12-29 | 2009-04-28 | Sap Ag | System and method for providing user help according to user category |
US7979798B2 (en) * | 2005-12-30 | 2011-07-12 | Sap Ag | System and method for providing user help tips |
KR100687441B1 (ko) * | 2006-03-16 | 2007-02-27 | 장성옥 | 외국어 음성 평가 방법 및 시스템 |
US7653543B1 (en) | 2006-03-24 | 2010-01-26 | Avaya Inc. | Automatic signal adjustment based on intelligibility |
US8171412B2 (en) * | 2006-06-01 | 2012-05-01 | International Business Machines Corporation | Context sensitive text recognition and marking from speech |
US7925508B1 (en) | 2006-08-22 | 2011-04-12 | Avaya Inc. | Detection of extreme hypoglycemia or hyperglycemia based on automatic analysis of speech patterns |
US7962342B1 (en) | 2006-08-22 | 2011-06-14 | Avaya Inc. | Dynamic user interface for the temporarily impaired based on automatic analysis for speech patterns |
US8073681B2 (en) * | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US20080201158A1 (en) | 2007-02-15 | 2008-08-21 | Johnson Mark D | System and method for visitation management in a controlled-access environment |
US8542802B2 (en) | 2007-02-15 | 2013-09-24 | Global Tel*Link Corporation | System and method for three-way call detection |
US8041344B1 (en) | 2007-06-26 | 2011-10-18 | Avaya Inc. | Cooling off period prior to sending dependent on user's state |
KR100943477B1 (ko) | 2007-07-10 | 2010-02-22 | 한국방송공사 | 말하기 능력 공증 시스템 및 그 방법 |
US20090087821A1 (en) * | 2007-09-27 | 2009-04-02 | Kuang Chien Computer Co., Ltd. | Digital language teaching system |
US8103503B2 (en) * | 2007-11-01 | 2012-01-24 | Microsoft Corporation | Speech recognition for determining if a user has correctly read a target sentence string |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US9020816B2 (en) * | 2008-08-14 | 2015-04-28 | 21Ct, Inc. | Hidden markov model for speech processing with training method |
KR20100022243A (ko) * | 2008-08-19 | 2010-03-02 | 현대자동차주식회사 | 블루투스를 이용한 외국어 학습 시스템 및 그 방법 |
US20100105015A1 (en) * | 2008-10-23 | 2010-04-29 | Judy Ravin | System and method for facilitating the decoding or deciphering of foreign accents |
TW201019288A (en) * | 2008-11-13 | 2010-05-16 | Ind Tech Res Inst | System and method for conversation practice in simulated situations |
US8630726B2 (en) * | 2009-02-12 | 2014-01-14 | Value-Added Communications, Inc. | System and method for detecting three-way call circumvention attempts |
US9225838B2 (en) | 2009-02-12 | 2015-12-29 | Value-Added Communications, Inc. | System and method for detecting three-way call circumvention attempts |
US8326637B2 (en) | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US8682241B2 (en) * | 2009-05-12 | 2014-03-25 | International Business Machines Corporation | Method and system for improving the quality of teaching through analysis using a virtual teaching device |
US9171541B2 (en) | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
US20110189646A1 (en) * | 2010-02-01 | 2011-08-04 | Amos Benninga | Pedagogical system method and apparatus |
WO2011152575A1 (ko) * | 2010-05-31 | 2011-12-08 | 주식회사 클루소프트 | 발음기관 애니메이션 생성 장치 및 방법 |
US9262941B2 (en) * | 2010-07-14 | 2016-02-16 | Educational Testing Services | Systems and methods for assessment of non-native speech using vowel space characteristics |
SG189182A1 (en) * | 2010-10-29 | 2013-05-31 | Anhui Ustc Iflytek Co Ltd | Method and system for endpoint automatic detection of audio record |
US11062615B1 (en) | 2011-03-01 | 2021-07-13 | Intelligibility Training LLC | Methods and systems for remote language learning in a pandemic-aware world |
US10019995B1 (en) | 2011-03-01 | 2018-07-10 | Alice J. Stiebel | Methods and systems for language learning based on a series of pitch patterns |
WO2013003749A1 (en) * | 2011-06-30 | 2013-01-03 | Rosetta Stone, Ltd | Statistical machine translation framework for modeling phonological errors in computer assisted pronunciation training system |
WO2013138633A1 (en) * | 2012-03-15 | 2013-09-19 | Regents Of The University Of Minnesota | Automated verbal fluency assessment |
JP6045175B2 (ja) * | 2012-04-05 | 2016-12-14 | 任天堂株式会社 | 情報処理プログラム、情報処理装置、情報処理方法及び情報処理システム |
WO2014005142A2 (en) | 2012-06-29 | 2014-01-03 | Rosetta Stone Ltd | Systems and methods for modeling l1-specific phonological errors in computer-assisted pronunciation training system |
US9076347B2 (en) * | 2013-03-14 | 2015-07-07 | Better Accent, LLC | System and methods for improving language pronunciation |
US9412362B2 (en) * | 2013-08-28 | 2016-08-09 | Verint Systems Ltd. | System and method for determining the compliance of agent scripts |
US9589564B2 (en) | 2014-02-05 | 2017-03-07 | Google Inc. | Multiple speech locale-specific hotword classifiers for selection of a speech locale |
US20150294580A1 (en) * | 2014-04-11 | 2015-10-15 | Aspen Performance Technologies | System and method for promoting fluid intellegence abilities in a subject |
US9412393B2 (en) | 2014-04-24 | 2016-08-09 | International Business Machines Corporation | Speech effectiveness rating |
WO2016044321A1 (en) | 2014-09-16 | 2016-03-24 | Min Tang | Integration of domain information into state transitions of a finite state transducer for natural language processing |
EP3195145A4 (en) | 2014-09-16 | 2018-01-24 | VoiceBox Technologies Corporation | Voice commerce |
WO2016061309A1 (en) | 2014-10-15 | 2016-04-21 | Voicebox Technologies Corporation | System and method for providing follow-up responses to prior natural language inputs of a user |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US10255913B2 (en) * | 2016-02-17 | 2019-04-09 | GM Global Technology Operations LLC | Automatic speech recognition for disfluent speech |
US10572961B2 (en) | 2016-03-15 | 2020-02-25 | Global Tel*Link Corporation | Detection and prevention of inmate to inmate message relay |
US9609121B1 (en) | 2016-04-07 | 2017-03-28 | Global Tel*Link Corporation | System and method for third party monitoring of voice and video calls |
US10331784B2 (en) | 2016-07-29 | 2019-06-25 | Voicebox Technologies Corporation | System and method of disambiguating natural language processing requests |
US10431112B2 (en) | 2016-10-03 | 2019-10-01 | Arthur Ward | Computerized systems and methods for categorizing student responses and using them to update a student model during linguistic education |
US10027797B1 (en) | 2017-05-10 | 2018-07-17 | Global Tel*Link Corporation | Alarm control for inmate call monitoring |
US10225396B2 (en) | 2017-05-18 | 2019-03-05 | Global Tel*Link Corporation | Third party monitoring of a activity within a monitoring platform |
US10860786B2 (en) | 2017-06-01 | 2020-12-08 | Global Tel*Link Corporation | System and method for analyzing and investigating communication data from a controlled environment |
US9930088B1 (en) | 2017-06-22 | 2018-03-27 | Global Tel*Link Corporation | Utilizing VoIP codec negotiation during a controlled environment call |
GB2568902B (en) * | 2017-11-29 | 2020-09-09 | Auris Tech Ltd | System for speech evaluation |
US11232798B2 (en) * | 2020-05-21 | 2022-01-25 | Bank Of America Corporation | Audio analysis system for automatic language proficiency assessment |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4276445A (en) * | 1979-09-07 | 1981-06-30 | Kay Elemetrics Corp. | Speech analysis apparatus |
US4380438A (en) * | 1981-08-31 | 1983-04-19 | Yugen Kaisha Batora Konsaruteingu | Automated study voice record/reproduction system |
US4641343A (en) * | 1983-02-22 | 1987-02-03 | Iowa State University Research Foundation, Inc. | Real time speech formant analyzer and display |
US4783803A (en) * | 1985-11-12 | 1988-11-08 | Dragon Systems, Inc. | Speech recognition apparatus and method |
CA1311059C (en) * | 1986-03-25 | 1992-12-01 | Bruce Allen Dautrich | Speaker-trained speech recognizer having the capability of detecting confusingly similar vocabulary words |
US4887212A (en) * | 1986-10-29 | 1989-12-12 | International Business Machines Corporation | Parser for natural language text |
JPH065451B2 (ja) * | 1986-12-22 | 1994-01-19 | 株式会社河合楽器製作所 | 発音訓練装置 |
US4862408A (en) * | 1987-03-20 | 1989-08-29 | International Business Machines Corporation | Paradigm-based morphological text analysis for natural languages |
US4852180A (en) * | 1987-04-03 | 1989-07-25 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech recognition by acoustic/phonetic system and technique |
US4860360A (en) * | 1987-04-06 | 1989-08-22 | Gte Laboratories Incorporated | Method of evaluating speech |
JPH0293597A (ja) * | 1988-09-30 | 1990-04-04 | Nippon I B M Kk | 音声認識装置 |
US5027406A (en) * | 1988-12-06 | 1991-06-25 | Dragon Systems, Inc. | Method for interactive speech recognition and training |
US5010495A (en) * | 1989-02-02 | 1991-04-23 | American Language Academy | Interactive language learning system |
US5033087A (en) * | 1989-03-14 | 1991-07-16 | International Business Machines Corp. | Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system |
US5075896A (en) * | 1989-10-25 | 1991-12-24 | Xerox Corporation | Character and phoneme recognition based on probability clustering |
JP2964507B2 (ja) * | 1989-12-12 | 1999-10-18 | 松下電器産業株式会社 | Hmm装置 |
US5148489A (en) * | 1990-02-28 | 1992-09-15 | Sri International | Method for spectral estimation to improve noise robustness for speech recognition |
US5329609A (en) * | 1990-07-31 | 1994-07-12 | Fujitsu Limited | Recognition apparatus with function of displaying plural recognition candidates |
US5268990A (en) * | 1991-01-31 | 1993-12-07 | Sri International | Method for recognizing speech using linguistically-motivated hidden Markov models |
US5199077A (en) * | 1991-09-19 | 1993-03-30 | Xerox Corporation | Wordspotting for voice editing and indexing |
CA2088080C (en) * | 1992-04-02 | 1997-10-07 | Enrico Luigi Bocchieri | Automatic speech recognizer |
US5333275A (en) * | 1992-06-23 | 1994-07-26 | Wheatley Barbara J | System and method for time aligning speech |
-
1994
- 1994-03-08 EP EP94910890A patent/EP0692135B1/en not_active Expired - Lifetime
- 1994-03-08 DE DE69425564T patent/DE69425564D1/de not_active Expired - Lifetime
- 1994-03-08 WO PCT/US1994/002542 patent/WO1994020952A1/en active IP Right Grant
- 1994-03-08 AT AT94910890T patent/ATE195605T1/de not_active IP Right Cessation
- 1994-03-08 KR KR1019950703880A patent/KR100309207B1/ko not_active IP Right Cessation
-
1995
- 1995-09-18 US US08/529,376 patent/US5634086A/en not_active Expired - Lifetime
-
2005
- 2005-08-18 JP JP2005237423A patent/JP2006048065A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023248520A1 (ja) * | 2022-06-20 | 2023-12-28 | オムロンヘルスケア株式会社 | 認知機能検査装置及び認知機能検査プログラム |
Also Published As
Publication number | Publication date |
---|---|
KR960701431A (ko) | 1996-02-24 |
DE69425564D1 (de) | 2000-09-21 |
KR100309207B1 (ko) | 2001-12-17 |
ATE195605T1 (de) | 2000-09-15 |
JPH08507620A (ja) | 1996-08-13 |
JP3899122B2 (ja) | 2007-03-28 |
WO1994020952A1 (en) | 1994-09-15 |
EP0692135A1 (en) | 1996-01-17 |
EP0692135B1 (en) | 2000-08-16 |
US5634086A (en) | 1997-05-27 |
EP0692135A4 (en) | 1997-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5634086A (en) | Method and apparatus for voice-interactive language instruction | |
US5791904A (en) | Speech training aid | |
EP0708958B1 (en) | Multi-language speech recognition system | |
US5995928A (en) | Method and apparatus for continuous spelling speech recognition with early identification | |
US8209173B2 (en) | Method and system for the automatic generation of speech features for scoring high entropy speech | |
US7840404B2 (en) | Method and system for using automatic generation of speech features to provide diagnostic feedback | |
WO2004061822A1 (en) | Speech recognition method | |
WO1994017508A1 (en) | Computerized system for teaching speech | |
JPH11143346A (ja) | 語学練習用発話評価方法およびその装置並びに発話評価処理プログラムを記憶した記憶媒体 | |
JP2002040926A (ja) | インターネット上での自動発音比較方法を用いた外国語発音学習及び口頭テスト方法 | |
Pallett | Performance assessment of automatic speech recognizers | |
CN102184654B (zh) | 诵读监督方法及装置 | |
WO2002091358A1 (en) | Method and apparatus for rejection of speech recognition results in accordance with confidence level | |
CN114627896A (zh) | 语音评测方法、装置、设备及存储介质 | |
US20230252971A1 (en) | System and method for speech processing | |
Hirschberg et al. | Generalizing prosodic prediction of speech recognition errors | |
JP3899122B6 (ja) | 音声対話式言語指導のための方法及び装置 | |
Barczewska et al. | Detection of disfluencies in speech signal | |
CA2158062C (en) | Method and apparatus for voice-interactive language instruction | |
Lea | What causes speech recognizers to make mistakes? | |
Audhkhasi | Automatic evaluation of fluency in spoken language | |
JP2001228890A (ja) | 音声認識装置 | |
WO2008083689A1 (en) | System and method for qur'an recitation rules |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060215 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20060512 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20060519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060811 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061018 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20061110 |