JP2016191739A - 発音誤り検出装置、方法およびプログラム - Google Patents
発音誤り検出装置、方法およびプログラム Download PDFInfo
- Publication number
- JP2016191739A JP2016191739A JP2015070328A JP2015070328A JP2016191739A JP 2016191739 A JP2016191739 A JP 2016191739A JP 2015070328 A JP2015070328 A JP 2015070328A JP 2015070328 A JP2015070328 A JP 2015070328A JP 2016191739 A JP2016191739 A JP 2016191739A
- Authority
- JP
- Japan
- Prior art keywords
- word
- phoneme
- speech recognition
- recognized
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000001514 detection method Methods 0.000 claims description 22
- 230000002596 correlated effect Effects 0.000 abstract 1
- 238000013500 data storage Methods 0.000 description 28
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】会議音声など任意の音声に対して音響モデルおよび言語モデルに基づく単語音声認識処理ならびに音響モデルに基づく音素音声認識処理を実行し、それぞれの結果を対応付けることにより発話者の発音誤りを検出する。
【選択図】図6
Description
音声データに対して音響モデルおよび言語モデルに基づく単語音声認識処理を実行する手段と、
前記音声データに対して音響モデルに基づく音素音声認識処理を実行する手段と、
前記単語音声認識処理の実行結果と、前記音素音声認識処理の実行結果とを対応付ける手段であって、前記単語音声認識処理の実行結果は少なくとも認識された単語と前記認識された単語の認識信頼度を含み、前記単語音声認識処理の実行結果は少なくとも認識された音素を含む、手段と、
予め定められた閾値以上の前記認識信頼度を持つ前記認識された単語(高スコア単語)と前記高スコア単語に対応付けられた前記音素音声認識処理の実行結果を抽出する手段と を備えたことを特徴とする。
前記カウントした音素誤り数、および前記誤り音素または前記誤り音素に係る単語を発音の誤り傾向データとして出力する手段と
をさらに備えたことを特徴とする。
対象単語の認識スコア/(対象単語の認識スコア+対立候補単語1の認識スコア+対立候補単語2の認識スコア+対立候補3の・・・) ・・・式(1)
式(1)に、上記例を当てはめると、「明日」を対象単語とした場合、−50,000/(−50,000+−10,000+−2,500)となり、単語「明日」の認識信頼度は、「0.8」となる。同様に、単語「芦屋」および「アキバ」の認識信頼度は、「0.16」、「0.04」となる。すなわち、単語「明日」が最も認識信頼度が高くなり、正解である可能性が最も高い単語として判断される。
Claims (7)
- 会議音声など任意の音声に対して音声認識処理を実行し、発音誤り検出を行なう装置であって、前記装置は、
音声データに対して音響モデルおよび言語モデルに基づく単語音声認識処理を実行する手段と、
前記音声データに対して音響モデルに基づく音素音声認識処理を実行する手段と、
前記単語音声認識処理の実行結果と、前記音素音声認識処理の実行結果とを対応付ける手段であって、前記単語音声認識処理の実行結果は少なくとも認識された単語と前記認識された単語の認識信頼度を含み、前記単語音声認識処理の実行結果は少なくとも認識された音素を含む、手段と、
予め定められた閾値以上の前記認識信頼度を持つ前記認識された単語(高スコア単語)と前記高スコア単語に対応付けられた前記音素音声認識処理の実行結果を抽出する手段と
を備えたことを特徴とする装置。 - 前記単語読み列と一致しない前記認識された誤り音素に対応する前記単語読み列の前、後、もしくは両方のいずれか、または全ての音素を含む音素を誤り音素として抽出する手段をさらに備えたことを特徴とする請求項1に記載の装置。
- 前記単語読み列と前記認識された音素とが置換関係にあり、前後の音素は正しく、その音素のみが誤っている音素、前記単語読み列には存在するが前記認識された音素には存在しない音素、および前記単語読み列に対して前記認識された音素が増えている音素のうちの少なくとも1つを誤り音素として抽出する手段をさらに備えたことを特徴とする請求項1または2に記載の装置。
- 前記誤り音素の数(音素誤り数)をカウントする手段と、
前記カウントした音素誤り数、および前記誤り音素または前記誤り音素に係る単語を発音の誤り傾向データとして出力する手段と
をさらに備えたことを特徴とする請求項2または3に記載の装置。 - 会議音声など任意の音声に対して音声認識処理を実行し、発音誤り検出を行なう方法であって、前記方法は、
音声データに対して音響モデルおよび言語モデルに基づく単語音声認識処理を実行するステップと、
前記音声データに対して音響モデルに基づく音素音声認識処理を実行するステップと、
前記単語音声認識処理の実行結果と、前記音素音声認識処理の実行結果とを対応付けるステップであって、前記単語音声認識処理の実行結果は少なくとも認識された単語と前記認識された単語の認識信頼度を含み、前記単語音声認識処理の実行結果は少なくとも認識された音素を含む、ステップと、
予め定められた閾値以上の前記認識信頼度を持つ前記認識された単語(高スコア単語)と前記高スコア単語に対応付けられた前記音素音声認識処理の実行結果を抽出するステップと
を備えたことを特徴とする方法。 - 会議音声など任意の音声に対して音声認識処理を実行し、発音誤り検出を行なう方法をコンピュータに実行させるプログラムであって、前記プログラムは、前記コンピュータによって実行されると、前記コンピュータに、
音声データに対して音響モデルおよび言語モデルに基づく単語音声認識処理を実行させ、
前記音声データに対して音響モデルに基づく音素音声認識処理を実行させ、
前記単語音声認識処理の実行結果と、前記音素音声認識処理の実行結果とを対応付けさせ、前記単語音声認識処理の実行結果は少なくとも認識された単語と前記認識された単語の認識信頼度を含み、前記単語音声認識処理の実行結果は少なくとも認識された音素を含み、
予め定められた閾値以上の前記認識信頼度を持つ前記認識された単語(高スコア単語)と前記高スコア単語に対応付けられた前記音素音声認識処理の実行結果を抽出させる
ことを特徴とするプログラム。 - 会議音声など任意の音声に対して音声認識処理を実行し、発音誤り検出を行なう方法をコンピュータに実行させるコンピュータ実行可能命令を記憶したコンピュータ可読記憶媒体であって、前記方法は、
音声データに対して音響モデルおよび言語モデルに基づく単語音声認識処理を実行するステップと、
前記音声データに対して音響モデルに基づく音素音声認識処理を実行するステップと、
前記単語音声認識処理の実行結果と、前記音素音声認識処理の実行結果とを対応付けるステップであって、前記単語音声認識処理の実行結果は少なくとも認識された単語と前記認識された単語の認識信頼度を含み、前記単語音声認識処理の実行結果は少なくとも認識された音素を含む、ステップと、
予め定められた閾値以上の前記認識信頼度を持つ前記認識された単語(高スコア単語)と前記高スコア単語に対応付けられた前記音素音声認識処理の実行結果を抽出するステップと
を備えたことを特徴とするコンピュータ可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015070328A JP6527000B2 (ja) | 2015-03-30 | 2015-03-30 | 発音誤り検出装置、方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015070328A JP6527000B2 (ja) | 2015-03-30 | 2015-03-30 | 発音誤り検出装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016191739A true JP2016191739A (ja) | 2016-11-10 |
JP6527000B2 JP6527000B2 (ja) | 2019-06-05 |
Family
ID=57245521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015070328A Active JP6527000B2 (ja) | 2015-03-30 | 2015-03-30 | 発音誤り検出装置、方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6527000B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019065263A1 (ja) * | 2017-09-26 | 2019-04-04 | 日本電信電話株式会社 | 発音誤り検出装置、発音誤り検出方法、プログラム |
WO2022246782A1 (en) * | 2021-05-28 | 2022-12-01 | Microsoft Technology Licensing, Llc | Method and system of detecting and improving real-time mispronunciation of words |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11250078A (ja) * | 1998-02-27 | 1999-09-17 | Fujitsu Ten Ltd | 音声認識機能付案内装置 |
JP2015049254A (ja) * | 2013-08-29 | 2015-03-16 | 株式会社日立製作所 | 音声データ認識システム及び音声データ認識方法 |
-
2015
- 2015-03-30 JP JP2015070328A patent/JP6527000B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11250078A (ja) * | 1998-02-27 | 1999-09-17 | Fujitsu Ten Ltd | 音声認識機能付案内装置 |
JP2015049254A (ja) * | 2013-08-29 | 2015-03-16 | 株式会社日立製作所 | 音声データ認識システム及び音声データ認識方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019065263A1 (ja) * | 2017-09-26 | 2019-04-04 | 日本電信電話株式会社 | 発音誤り検出装置、発音誤り検出方法、プログラム |
WO2022246782A1 (en) * | 2021-05-28 | 2022-12-01 | Microsoft Technology Licensing, Llc | Method and system of detecting and improving real-time mispronunciation of words |
Also Published As
Publication number | Publication date |
---|---|
JP6527000B2 (ja) | 2019-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107622054B (zh) | 文本数据的纠错方法及装置 | |
KR101255402B1 (ko) | 대안들의 목록을 사용하는 오인된 단어들의 다시 받아쓰기 | |
CN105632499B (zh) | 用于优化语音识别结果的方法和装置 | |
US6269335B1 (en) | Apparatus and methods for identifying homophones among words in a speech recognition system | |
US20150179173A1 (en) | Communication support apparatus, communication support method, and computer program product | |
JP2011002656A (ja) | 音声認識結果修正候補検出装置、音声書き起こし支援装置、方法及びプログラム | |
US11562743B2 (en) | Analysis of an automatically generated transcription | |
JP2007041319A (ja) | 音声認識装置および音声認識方法 | |
CN111951825A (zh) | 一种发音测评方法、介质、装置和计算设备 | |
EP3791388A1 (en) | Computer implemented method and apparatus for recognition of speech patterns and feedback | |
WO2002061728A1 (fr) | Dispositif de reconnaissance de phrases, procede de reconnaissance de phrases, programme et support | |
US20150179169A1 (en) | Speech Recognition By Post Processing Using Phonetic and Semantic Information | |
KR20160059265A (ko) | 신뢰도 측점 점수를 고려한 음향 모델 학습 방법 및 장치 | |
WO2020209957A1 (en) | Automated speech recognition confidence classifier | |
JP6148150B2 (ja) | 音響分析フレーム信頼度計算装置と音響モデル適応装置と音声認識装置とそれらのプログラムと、音響分析フレーム信頼度計算方法 | |
CN105632500B (zh) | 语音识别装置及其控制方法 | |
JP6527000B2 (ja) | 発音誤り検出装置、方法およびプログラム | |
JP2015087544A (ja) | 音声認識装置及び音声認識プログラム | |
JP6325770B2 (ja) | 音声認識誤り修正装置及びそのプログラム | |
JP2015099253A (ja) | 音声認識装置、音声認識方法、音声認識プログラム | |
WO2019163242A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
KR20120046627A (ko) | 화자 적응 방법 및 장치 | |
US20230117535A1 (en) | Method and system for device feature analysis to improve user experience | |
KR102299269B1 (ko) | 음성 및 스크립트를 정렬하여 음성 데이터베이스를 구축하는 방법 및 장치 | |
CN111048098B (zh) | 语音校正系统及语音校正方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190509 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6527000 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |