JP2002515136A - 言語命令のための発音をテキスト独立自動グレード付けする方法及びシステム - Google Patents
言語命令のための発音をテキスト独立自動グレード付けする方法及びシステムInfo
- Publication number
- JP2002515136A JP2002515136A JP51691198A JP51691198A JP2002515136A JP 2002515136 A JP2002515136 A JP 2002515136A JP 51691198 A JP51691198 A JP 51691198A JP 51691198 A JP51691198 A JP 51691198A JP 2002515136 A JP2002515136 A JP 2002515136A
- Authority
- JP
- Japan
- Prior art keywords
- model
- acoustic
- student
- sample
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 96
- 238000012549 training Methods 0.000 claims abstract description 63
- 238000011156 evaluation Methods 0.000 claims abstract description 33
- 238000009826 distribution Methods 0.000 claims description 36
- 238000012545 processing Methods 0.000 claims description 30
- 230000011218 segmentation Effects 0.000 claims description 30
- 238000013507 mapping Methods 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 23
- 238000013515 script Methods 0.000 claims description 16
- 230000007704 transition Effects 0.000 claims description 15
- 238000007476 Maximum Likelihood Methods 0.000 claims description 11
- 230000001419 dependent effect Effects 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000001755 vocal effect Effects 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 238000003066 decision tree Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 238000012417 linear regression Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims 2
- 244000309464 bull Species 0.000 claims 1
- 239000003292 glue Substances 0.000 claims 1
- 238000013519 translation Methods 0.000 claims 1
- 238000004321 preservation Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 15
- 239000011295 pitch Substances 0.000 description 12
- 238000013459 approach Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 8
- 239000000203 mixture Substances 0.000 description 5
- 239000000470 constituent Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000010845 search algorithm Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 241000287219 Serinus canaria Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 230000002226 simultaneous effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/04—Speaking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- General Health & Medical Sciences (AREA)
- Electrically Operated Instructional Devices (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
Claims (1)
- 【特許請求の範囲】 1. 自動音声処理システムにおいてコンピューター化音響セグメンテーション システムを用いて学生音声サンプルの発音を評価するための方法であって、 学生話者による口頭ワードシーケンスから成る前記学生音声サンプルを受け入 れる工程、 前記コンピューター化音響セグメンテーションシステムを操作し、前記セグメ ンテーションシステム内の音声音響モデルに基づいて前記学生音声サンプル内の サンプル音響単位を定める工程であって、前記音声音響モデルは、少なくとも1 人の話者からの訓練音声データを用いて設定され、前記訓練音声データは、前記 口頭ワードシーケンスを必ずしも含まない、前記工程、 前記サンプル音響単位の音長を測定する工程、及び サンプル音響単位の前記音長を模範音響単位の音長モデルと比較し、前記サン プル音響単位音長と模範音響単位音長の間の類似性を示す音長スコアーを計算す る工程、 を含む方法。 2. 前記模範音響単位の音長モデルが、少なくとも1人の模範話者からの音長 訓練音声データを用いて設定され、前記音長訓練データは、前記口頭ワードシー ケンスを必ずしも含まない、請求の範囲第1項記載の方法。 3. 各音響単位は、前記口頭ワードの言語における最長ワードよりも音長が短 い、請求の範囲第1項記載の方法。 4. 前記音長スコアーをグルードに写像する工程、及び 前記グレードを学生に提示する工程 をさらに含む、請求の範囲第1項記載の方法。 5. 前記音長スコアーをグレードに写像する工程が、 種々の熟達レベルの複数の言語学生から1セットの訓練音声サンプルを収集す る工程、 前記訓練音声サンプルの各々に対して、訓練音長スコアーを計算する工程、 前記訓練音声サンプルの各々に対して、人間グレーダーから少なくとも1つの 人間評価グレードを収集する工程、及び 前記人間評価グレードと前記訓練音長スコアーの間のエラー測定を最小にする ことにより、写像において使用される係数を調節する工程、 を含む、請求の範囲第4項記載の方法。 6. 写像工程が、 単独又は他の機械スコアーと結合された訓練音長スコアー、及び対応する人間 評価グレードから、線形又は非線形回帰により得られる写像関数を用いる工程、 を含み、 前記スコアーとグレードの全てが、学生音声の代表的訓練データベースに亘っ て収集される、請求の範囲第4項記載の方法。 7. 前記写像関数が、ニューラルネットで実現される非線形回帰により得られ 、このニューラルネットにより、機械スコアーから人間エキスパートグレードへ の任意の写像が可能になる、請求の範囲第6項記載の方法。 8. 写像工程が、パラメータが訓練音長スコアーを用いて設定された決定木又 はクラス確率木を用いる工程を含む、請求の範囲第4項記載の方法。 9. 前記音響セグメンテーションシステムを操作する工程が、 前記音声音響モデルの一つから訓練された隠れマルコフモデル(HMMs)を 通る経路を計算する工程であって、前記経路は、前記学生音声サンプルから観測 された音響特徴シーケンスを発生する最尤度を有し得るHMMsを通る許容経路 である前記工程、及び 前記経路から1音響単位の少なくとも1つの境界又は音長を決める工程、 を含む、請求の範囲第1項記載の方法。 10. 前記口頭ワードシーケンスが、既知スクリプトに従って話され、そして 、 経路計算工程が、HMMsを通る任意経路の許容度を定める際に前記スクリプ トを使用する工程を含む、請求の範囲第9項記載の方法。 11. 前記口頭ワードシーケンスが未知であり、経路計算工程が、前記口頭ワ ードシーケンスを決めるコンピューター化音声認識システムを操作する工程を含 む、請求の範囲第9項記載の方法。 12. 前記サンプル音響単位が音節であり、そして 少なくとも1つの音響単位の境界又は音長を決める工程が、 前記経路から少なくとも2つの単音の境界又は音長を抽出する工程、及び 少なくとも2つの単音の部分を結合し、音節音響単位の境界又は音長を得る工 程、 を含む、請求の範囲第9項記載の方法。 13. 少なくとも2つの単音の部分を結合する工程が、前記単音の一つから母 音単音の中心間の時間差を測定して音節音響単位の音長を得る工程を含む、請求 の範囲第12項記載の方法。 14. 前記サンプル音響単位が単音である、請求の範囲第1項記載の方法。 15. 前記サンプル音響単位が音節である、請求の範囲第1項記載の方法。 16. 前記模範音響単位の音長分布モデルが、話者標準化された音響単位の音 長モデルであり、音長測定工程が、 前記学生音声サンプルを分析し、学生話者標準化係数を決める工程、及び 前記学生話者標準化係数を用い、前記測定されたサンプル音響単位音長として 話者標準化音長を測定する工程、 を含み、それにより、比較工程が、前記話者標準化されたサンプル音響単位の音 長を、前記模範話者標準化された音響単位の音長分布モデルと比較する、請求の 範囲第1項記載の方法。 17. 前記学生話者標準化係数が、音声速度である、請求の範囲第16項記載 の方法。 18. 前記セグメンテーションシステムを操作する工程が、分析からサイレン スを有する文脈内の音響単位を除外する、請求の範囲第1項記載の方法。 19. 前記セグメンテーションシステムを操作する工程が、前記音響セグメン テーションシステムとして音声認識システムを操作する工程を含む、請求の範囲 第1項記載の方法。 20. 学生音声サンプルの発音を評価するためのシステムであって、前記学生 音声サンプルは、学生話者による口頭ワードシーケンスから成り、該システムは 、 少なくとも1人の話者からの訓練音声データを用いて設定された音声音響モデ ルであって、前記訓練音声データは、前記口頭ワードシーケンスを必ずしも含ま ない前記モデル、 前記音声音響モデルに基づいて前記学生音声サンプル内の音響単位を識別する よう構成されたコンピューター化音響セグメンテーションシステム、 前記サンプル音響単位の音長を測定するよう構成された音長抽出器、 模範音響単位の音長モデル、及び 前記サンプル音響単位の音長を模範音響単位の前記音長モデルと比較し、前記 サンプル音響単位の音長と模範音声内の音響単位の音長の間の類似性を示す音長 スコアーを計算するように構成された音長スコアラー、 を含むシステム。 21. 自動音声処理システムにおいて、学生音声サンプルの発音をグレード付 けするための方法であって、 学生話者による口頭ワードシーケンスから成る前記学生音声サンプルを受け入 れる工程、 1セットの訓練された音声モデルを操作し、前記音声サンプルから少なくとも 1つの事後確率を計算する工程であって、前記事後確率の各々は、前記学生音声 サンプルの特定部分が、前記音声サンプルの前記特定部分が与えられた特定の既 知モデルに対応する確率である前記工程、及び 前記事後確率から前記学生音声サンプルに対する発音の質の評価スコアー(こ こでは事後ベース評価スコアーという。)を計算する工程、 を含む方法。 22. 前記事後確率の各々は、前記特定既知モデルが前記学生音声サンプルの 前記特定部分を発生した尤度を、個々のモデルが前記音声サンプルの前記特定部 分を発生した尤度の総和で除することにより、モデル尤度から導出される、請求 の範囲第21項記載の方法。 23. 前記特定の既知モデルが、文脈依存モデルであり、そして 前記個々のモデルが、文脈依存又は文脈独立モデルである、請求の範囲第21 項記載の方法。 24. 前記訓練された音声モデルが、1セットの単音モデルを含み、 前記学生音声サンプルが、単音を含み、そして 前記音声モデルを操作する工程が、単音タイプqiの単音i内の各フレームyt に対するフレームベース事後確率を次式 により計算する工程を含み、ここで、p(yt|qi,...)は、単音タイプqi に対応するモデルに従ったフレームytの確率であり、 qについての総和は、全単音タイプに亘って取られ、そして P(qi)は、単音タイプqiの事前確率を表す、 請求の範囲第21項記載の方法。 25. フレームベース事後確率を計算する工程が、分子中の各単音タイプqi に対応する文脈依存モデルを使用し、それにより、前記p(yt|qi,...) は、文脈依存尤度p(yt|qi,ctxi)であり、ここで、ctxiは、文脈を 表す、請求の範囲第24項記載の方法。 26. 前記学生音声サンプルに対して前記事後ベース評価スコアーを計算する 工程が、前記単音i内の全フレームのフレームベース事後確率の対数平均を単音 iに対して計算する工程を含み、前記平均は、ここでは単音スコアーρiと称し 、これは、次式 により表され、ここで、総和は、前記単音iの全てのdiフレームに亘って取ら れる、請求の範囲第24項記載の方法。 27. 前記学生音声サンプルに対する前記事後ベース評価スコアーが、前記学 生音声サンプル内の各単音iに対する個々の単音スコアーρiの平均として次式により定義され、ここで、総和は、前記学生音声サンプル内の単音数に亘って取 られる、請求の範囲第26項記載の方法。 28. 各単音タイプに対応するモデルが、ガウシアン混合単音モデルである、 請求の範囲第24項記載の方法。 29. 各単音タイプに対応するモデルが、文脈独立単音モデルである、請求の 範囲第24項記載の方法。 30. 各単音タイプに対応するモデルが、隠れマルコフモデルである、請求の 範囲第24項記載の方法。 31. 前記音声サンプルの前記特定部分が単音である、請求の範囲第22項記 載の方法。 32. 前記事後ベース評価スコアーを、人間聴者により割り当てられ得るよう なグレードに写像する工程、及び 前記グレードを前記学生話者に提示する工程、 をさらに含む、請求の範囲第21項記載の方法。 33. 前記事後ベース評価スコアーをグレードに写像する前記工程が、 種々の熟達レベルの複数の言語学生から1セットの訓練音声サンプルを収集す る工程、 前記サンプルを聞く人間エキスパート聴者から、前記訓練サンプルの各々に対 する1セットの人間評価グレードを収集する工程、及び 人間エキスパートグレードと前記評価スコアーの間の二乗誤差を最小にするこ とにより、写像で使用される係数を調節する工程、 を含む、請求の範囲第32項記載の方法。 34. 前記学生音声サンプルが、音響特徴シーケンスから成り、 前記音声音響モデルの一つから1セットの訓練された隠れマルコフモデル(H MMs)を通る経路を計算する工程であって、前記経路は、前記音響特徴シーケ ンスを発生する最尤度を有し得るHMMsを通る許容経路である前記工程、及び 前記経路内の単音間の遷移を識別し、それにより単音を定める工程、 をさらに含む、請求の範囲第21項記載の方法。 35. 経路計算工程が、ヴィテルビ検索技術を用いて実行される、請求の範囲 第34項記載の方法。 36. 前記口頭ワードシーケンスが未知であり、経路計算工程が、前記口頭ワ ードシーケンスを決めるコンピューター化音声認識システムを用いて実行される 、請求の範囲第34項記載の方法。 37. サイレンスを有する文脈中のセグメントは、前記学生音声サンプルから 、及び前記音声モデルを訓練するのに使用される訓練データから除外される、請 求の範囲第21項記載の方法。 38. 学生音声サンプルの発音を評価するためのシステムであって、前記学生 音声サンプルは、学生話者による口頭ワードシーケンスから成り、該システムは 、 模範音声の訓練された音声音響モデル、及び 前記訓練された音声モデルを用いて前記音声サンプルから少なくとも1つの事 後確率を計算するように構成された音響スコアラーであって、前記音響スコアラ ーは、前記事後確率から前記学生サンプルの発音の質の評価スコアーを計算する ようにも構成され、前記事後確率の各々は、前記学生音声サンプルの特定部分が 、前記音声サンプルの前記特定部分が与えられた特定の既知モデルに対応する確 率である前記音響スコアラー、 を含む、システム。 39. クライアント/サーバー環境における発音訓練用システムであって、学 生にプロンプトを提示し且つ前記プロンプトにより引き出された学生音声を受け 入れるためのクライアント処理が存在し、前記システムは、 制御情報を前記クライアント処理に送り、前記学生に提示されるプロンプトを 指定し、且つ、前記提示されたプロンプトにより引き出された前記学生音声から 導出される音声サンプルを受け取るサーバー処理、並びに 前記学生音声サンプルを分析するための、前記サーバー処理によりインボーカ ブルな発音評価器、 を含むシステム。 40. 前記発音評価器が、訓練音声データを用いて設定され、そして 前記サーバー処理は、プロンプトを指定し、前記学生音声サンプルとして前記 訓練音声データ内に必ずしも無いワードシーケンスを引き出すように適応される 、請求の範囲第39項記載のシステム。 41. 前記サーバー処理が、通信チャンネルとは別の音声チャンネル上で前記 音声サンプルを受け取り、前記サーバー処理と前記クライアント処理は、前記通 信チャンネルを介して通信する、請求の範囲第39項記載のシステム。 42. 前記クライアント処理と前記サーバー処理が、2つの別々のコンピュー タープロセッサー上に配置され、ネットワークを介して通信する、請求の範囲第 39項記載のシステム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US2763896P | 1996-10-02 | 1996-10-02 | |
US93541497A | 1997-09-23 | 1997-09-23 | |
US08/935,414 | 1997-09-23 | ||
US60/027,638 | 1997-09-23 | ||
PCT/US1997/017888 WO1998014934A1 (en) | 1996-10-02 | 1997-10-01 | Method and system for automatic text-independent grading of pronunciation for language instruction |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006316196A Division JP2007171944A (ja) | 1996-10-02 | 2006-11-22 | 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002515136A true JP2002515136A (ja) | 2002-05-21 |
JP2002515136A5 JP2002515136A5 (ja) | 2005-03-10 |
JP4394752B2 JP4394752B2 (ja) | 2010-01-06 |
Family
ID=26702729
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP51691198A Expired - Lifetime JP4394752B2 (ja) | 1996-10-02 | 1997-10-01 | 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム |
JP2006316196A Ceased JP2007171944A (ja) | 1996-10-02 | 2006-11-22 | 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006316196A Ceased JP2007171944A (ja) | 1996-10-02 | 2006-11-22 | 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP1010170B1 (ja) |
JP (2) | JP4394752B2 (ja) |
AT (1) | ATE440359T1 (ja) |
DE (1) | DE69739545D1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006201491A (ja) * | 2005-01-20 | 2006-08-03 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
JP2007057692A (ja) * | 2005-08-23 | 2007-03-08 | Advanced Telecommunication Research Institute International | 音声処理装置、およびプログラム |
JP2007133008A (ja) * | 2005-11-08 | 2007-05-31 | Advanced Telecommunication Research Institute International | 音声認識装置、およびプログラム |
JP2007133031A (ja) * | 2005-11-08 | 2007-05-31 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
JP2009537850A (ja) * | 2006-05-16 | 2009-10-29 | 深チン大学 | 多種類言語に適用可能なコンピュータ使用による聾唖者の発音習得方法 |
KR20170045041A (ko) * | 2015-10-16 | 2017-04-26 | 삼성전자주식회사 | 음향 모델 입력 데이터의 정규화 장치 및 방법과, 음성 인식 장치 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105940395B (zh) * | 2014-01-31 | 2019-07-16 | 谷歌有限责任公司 | 生成文档的矢量表示 |
JP2020187713A (ja) * | 2019-05-13 | 2020-11-19 | 知記 松田 | Ai先生 |
CN112951277B (zh) * | 2019-11-26 | 2023-01-13 | 新东方教育科技集团有限公司 | 评测语音的方法和装置 |
JP2022045256A (ja) * | 2020-09-08 | 2022-03-18 | 株式会社Screenホールディングス | 教師データ作成支援装置、教師データ作成支援システムおよび教師データ作成支援方法 |
CN116071764B (zh) * | 2023-03-28 | 2023-07-14 | 中国人民解放军海军工程大学 | 基于原型网络的手写汉字识别方法、装置、设备及介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4799261A (en) * | 1983-11-03 | 1989-01-17 | Texas Instruments Incorporated | Low data rate speech encoding employing syllable duration patterns |
JPH07117809B2 (ja) * | 1984-02-02 | 1995-12-18 | 松下電器産業株式会社 | 発音練習装置 |
JPS61118799A (ja) * | 1984-11-14 | 1986-06-06 | 富士通株式会社 | 発声訓練装置 |
JPS62299899A (ja) * | 1986-06-19 | 1987-12-26 | 富士通株式会社 | よう音・直音言い分け評価方式 |
JP2739950B2 (ja) * | 1988-03-31 | 1998-04-15 | 株式会社東芝 | パターン認識装置 |
JP2704216B2 (ja) * | 1988-09-29 | 1998-01-26 | 日本電信電話株式会社 | 発音評価法 |
JP2834471B2 (ja) * | 1989-04-17 | 1998-12-09 | 日本電信電話株式会社 | 発音評価法 |
GB9223066D0 (en) * | 1992-11-04 | 1992-12-16 | Secr Defence | Children's speech training aid |
JP2775140B2 (ja) * | 1994-03-18 | 1998-07-16 | 株式会社エイ・ティ・アール人間情報通信研究所 | パターン認識方法、音声認識方法および音声認識装置 |
-
1997
- 1997-10-01 EP EP97945476A patent/EP1010170B1/en not_active Expired - Lifetime
- 1997-10-01 AT AT97945476T patent/ATE440359T1/de not_active IP Right Cessation
- 1997-10-01 JP JP51691198A patent/JP4394752B2/ja not_active Expired - Lifetime
- 1997-10-01 DE DE69739545T patent/DE69739545D1/de not_active Expired - Lifetime
-
2006
- 2006-11-22 JP JP2006316196A patent/JP2007171944A/ja not_active Ceased
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006201491A (ja) * | 2005-01-20 | 2006-08-03 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
JP2007057692A (ja) * | 2005-08-23 | 2007-03-08 | Advanced Telecommunication Research Institute International | 音声処理装置、およびプログラム |
JP2007133008A (ja) * | 2005-11-08 | 2007-05-31 | Advanced Telecommunication Research Institute International | 音声認識装置、およびプログラム |
JP2007133031A (ja) * | 2005-11-08 | 2007-05-31 | Advanced Telecommunication Research Institute International | 発音評定装置、およびプログラム |
JP2009537850A (ja) * | 2006-05-16 | 2009-10-29 | 深チン大学 | 多種類言語に適用可能なコンピュータ使用による聾唖者の発音習得方法 |
KR20170045041A (ko) * | 2015-10-16 | 2017-04-26 | 삼성전자주식회사 | 음향 모델 입력 데이터의 정규화 장치 및 방법과, 음성 인식 장치 |
KR102192678B1 (ko) | 2015-10-16 | 2020-12-17 | 삼성전자주식회사 | 음향 모델 입력 데이터의 정규화 장치 및 방법과, 음성 인식 장치 |
Also Published As
Publication number | Publication date |
---|---|
EP1010170A1 (en) | 2000-06-21 |
DE69739545D1 (de) | 2009-10-01 |
EP1010170B1 (en) | 2009-08-19 |
JP2007171944A (ja) | 2007-07-05 |
ATE440359T1 (de) | 2009-09-15 |
JP4394752B2 (ja) | 2010-01-06 |
EP1010170A4 (en) | 2008-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6055498A (en) | Method and apparatus for automatic text-independent grading of pronunciation for language instruction | |
JP2007171944A (ja) | 言語教育のために発音をテキスト独立に自動グレード付けする方法及びシステム | |
US8209173B2 (en) | Method and system for the automatic generation of speech features for scoring high entropy speech | |
JP2006048065A (ja) | 音声対話式言語指導法及び装置 | |
JPH10222190A (ja) | 発音測定装置および方法 | |
JP2002040926A (ja) | インターネット上での自動発音比較方法を用いた外国語発音学習及び口頭テスト方法 | |
JP5007401B2 (ja) | 発音評定装置、およびプログラム | |
Ahsiah et al. | Tajweed checking system to support recitation | |
Neumeyer et al. | Webgrader: a multilingual pronunciation practice tool | |
JP4753412B2 (ja) | 発音評定装置、およびプログラム | |
US11636858B2 (en) | Audio analysis system for automatic language proficiency assessment | |
Karhila et al. | HMM-based speech synthesis adaptation using noisy data: Analysis and evaluation methods | |
US11250874B2 (en) | Audio quality enhancement system | |
US11404051B2 (en) | Textual analysis system for automatic language proficiency assessment | |
CN113990288B (zh) | 一种语音客服自动生成部署语音合成模型的方法 | |
WO1994015330A1 (en) | Method and apparatus for automatic evaluation of pronunciation | |
JP5066668B2 (ja) | 音声認識装置、およびプログラム | |
JP2007133227A (ja) | ニューラルネット学習装置および感情判断装置 | |
JP2007133031A (ja) | 発音評定装置、およびプログラム | |
Landini | A Pronunciation Scoring System for Second Language Learners | |
JP2005221679A (ja) | 発話スタイル評価装置及び発話スタイル分類装置 | |
JP2005221679A6 (ja) | 発話スタイル評価装置及び発話スタイル分類装置 | |
Xu | Evaluation of English Pronunciation Interaction Quality Based on Deep Learning | |
Ellouze | Pitch and energy contribution in emotion and speaking styles recognition enhancement | |
JP2001228890A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040616 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060523 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20060822 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20061006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061122 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070529 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070926 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20071129 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20080925 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20090611 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090624 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090813 |
|
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20090813 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091016 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121023 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121023 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131023 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |