JP6527000B2 - 発音誤り検出装置、方法およびプログラム - Google Patents
発音誤り検出装置、方法およびプログラム Download PDFInfo
- Publication number
- JP6527000B2 JP6527000B2 JP2015070328A JP2015070328A JP6527000B2 JP 6527000 B2 JP6527000 B2 JP 6527000B2 JP 2015070328 A JP2015070328 A JP 2015070328A JP 2015070328 A JP2015070328 A JP 2015070328A JP 6527000 B2 JP6527000 B2 JP 6527000B2
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- word
- recognized
- speech recognition
- error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 44
- 238000001514 detection method Methods 0.000 title claims description 27
- 238000012545 processing Methods 0.000 claims description 23
- 238000006467 substitution reaction Methods 0.000 claims description 3
- 238000013500 data storage Methods 0.000 description 28
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Description
音声データに対して音響モデルおよび言語モデルに基づく単語音声認識処理を実行する手段と、
前記音声データに対して音響モデルに基づく音素音声認識処理を実行する手段と、
前記単語音声認識処理の実行結果と、前記音素音声認識処理の実行結果とを対応付ける手段であって、前記単語音声認識処理の実行結果は少なくとも認識された単語と前記認識された単語の認識信頼度を含み、前記単語音声認識処理の実行結果は少なくとも認識された音素を含む、手段と、
予め定められた閾値以上の前記認識信頼度を持つ前記認識された単語(高スコア単語)と前記高スコア単語に対応付けられた前記音素音声認識処理の実行結果を抽出する手段と を備えたことを特徴とする。
前記カウントした音素誤り数、および前記誤り音素または前記誤り音素に係る単語を発音の誤り傾向データとして出力する手段と
をさらに備えたことを特徴とする。
対象単語の認識スコア/(対象単語の認識スコア+対立候補単語1の認識スコア+対立候補単語2の認識スコア+対立候補3の・・・) ・・・式(1)
式(1)に、上記例を当てはめると、「明日」を対象単語とした場合、−50,000/(−50,000+−10,000+−2,500)となり、単語「明日」の認識信頼度は、「0.8」となる。同様に、単語「芦屋」および「アキバ」の認識信頼度は、「0.16」、「0.04」となる。すなわち、単語「明日」が最も認識信頼度が高くなり、正解である可能性が最も高い単語として判断される。
Claims (5)
- 会議音声など任意の音声に対して音声認識処理を実行し、発音誤り検出を行なう装置であって、前記装置は、
音声データに対して音響モデルおよび言語モデルに基づく単語音声認識処理を実行する手段と、
前記音声データに対して音響モデルに基づく音素音声認識処理を実行する手段と、
前記単語音声認識処理の実行結果と、前記音素音声認識処理の実行結果とを対応付ける手段であって、前記単語音声認識処理の実行結果は少なくとも認識された単語と前記認識された単語の認識信頼度を含み、前記音素音声認識処理の実行結果は少なくとも認識された音素を含む、手段と、
予め定められた閾値以上の前記認識信頼度を持つ前記認識された単語(高スコア単語)と前記高スコア単語に対応付けられた前記音素音声認識処理の実行結果を抽出する手段と、
前記認識された単語の単語読み列と一致しない前記認識された音素に対応する前記単語読み列の前、後、もしくは両方のいずれか、または全ての音素を含む音素を誤り音素として抽出する手段と、
前記誤り音素の数(音素誤り数)をカウントする手段と、
前記カウントした音素誤り数、および前記誤り音素または前記誤り音素に係る単語を発音の誤り傾向データとして出力する手段と
を備えたことを特徴とする装置。 - 前記単語読み列と前記認識された音素とが置換関係にあり、前後の音素は正しく、その音素のみが誤っている音素、前記単語読み列には存在するが前記認識された音素には存在しない音素、および前記単語読み列に対して前記認識された音素が増えている音素のうちの少なくとも1つを誤り音素として抽出する手段をさらに備えたことを特徴とする請求項1に記載の装置。
- 会議音声など任意の音声に対して音声認識処理を実行し、発音誤り検出を行なう方法であって、前記方法は、
音声データに対して音響モデルおよび言語モデルに基づく単語音声認識処理を実行するステップと、
前記音声データに対して音響モデルに基づく音素音声認識処理を実行するステップと、
前記単語音声認識処理の実行結果と、前記音素音声認識処理の実行結果とを対応付けるステップであって、前記単語音声認識処理の実行結果は少なくとも認識された単語と前記認識された単語の認識信頼度を含み、前記音素音声認識処理の実行結果は少なくとも認識された音素を含む、ステップと、
予め定められた閾値以上の前記認識信頼度を持つ前記認識された単語(高スコア単語)と前記高スコア単語に対応付けられた前記音素音声認識処理の実行結果を抽出するステップと、
前記認識された単語の単語読み列と一致しない前記認識された音素に対応する前記単語読み列の前、後、もしくは両方のいずれか、または全ての音素を含む音素を誤り音素として抽出するステップと、
前記誤り音素の数(音素誤り数)をカウントするステップと、
前記カウントした音素誤り数、および前記誤り音素または前記誤り音素に係る単語を発音の誤り傾向データとして出力するステップと
を備えたことを特徴とする方法。 - 会議音声など任意の音声に対して音声認識処理を実行し、発音誤り検出を行なう方法をコンピュータに実行させるプログラムであって、前記プログラムは、前記コンピュータによって実行されると、前記コンピュータに、
音声データに対して音響モデルおよび言語モデルに基づく単語音声認識処理を実行させ、
前記音声データに対して音響モデルに基づく音素音声認識処理を実行させ、
前記単語音声認識処理の実行結果と、前記音素音声認識処理の実行結果とを対応付けさせ、前記単語音声認識処理の実行結果は少なくとも認識された単語と前記認識された単語の認識信頼度を含み、前記音素音声認識処理の実行結果は少なくとも認識された音素を含み、
予め定められた閾値以上の前記認識信頼度を持つ前記認識された単語(高スコア単語)と前記高スコア単語に対応付けられた前記音素音声認識処理の実行結果を抽出させ、
前記認識された単語の単語読み列と一致しない前記認識された音素に対応する前記単語読み列の前、後、もしくは両方のいずれか、または全ての音素を含む音素を誤り音素として抽出させ、
前記誤り音素の数(音素誤り数)をカウントさせ、
前記カウントした音素誤り数、および前記誤り音素または前記誤り音素に係る単語を発音の誤り傾向データとして出力させる
ことを特徴とするプログラム。 - 会議音声など任意の音声に対して音声認識処理を実行し、発音誤り検出を行なう方法をコンピュータに実行させるコンピュータ実行可能命令を記憶したコンピュータ可読記憶媒体であって、前記方法は、
音声データに対して音響モデルおよび言語モデルに基づく単語音声認識処理を実行するステップと、
前記音声データに対して音響モデルに基づく音素音声認識処理を実行するステップと、
前記単語音声認識処理の実行結果と、前記音素音声認識処理の実行結果とを対応付けるステップであって、前記単語音声認識処理の実行結果は少なくとも認識された単語と前記認識された単語の認識信頼度を含み、前記音素音声認識処理の実行結果は少なくとも認識された音素を含む、ステップと、
予め定められた閾値以上の前記認識信頼度を持つ前記認識された単語(高スコア単語)と前記高スコア単語に対応付けられた前記音素音声認識処理の実行結果を抽出するステップと、
前記認識された単語の単語読み列と一致しない前記認識された音素に対応する前記単語読み列の前、後、もしくは両方のいずれか、または全ての音素を含む音素を誤り音素として抽出するステップと、
前記誤り音素の数(音素誤り数)をカウントするステップと、
前記カウントした音素誤り数、および前記誤り音素または前記誤り音素に係る単語を発音の誤り傾向データとして出力するステップと
を備えたことを特徴とするコンピュータ可読記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015070328A JP6527000B2 (ja) | 2015-03-30 | 2015-03-30 | 発音誤り検出装置、方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015070328A JP6527000B2 (ja) | 2015-03-30 | 2015-03-30 | 発音誤り検出装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016191739A JP2016191739A (ja) | 2016-11-10 |
JP6527000B2 true JP6527000B2 (ja) | 2019-06-05 |
Family
ID=57245521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015070328A Active JP6527000B2 (ja) | 2015-03-30 | 2015-03-30 | 発音誤り検出装置、方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6527000B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6840858B2 (ja) * | 2017-09-26 | 2021-03-10 | 日本電信電話株式会社 | 発音誤り検出装置、発音誤り検出方法、プログラム |
CN117083669A (zh) * | 2021-05-28 | 2023-11-17 | 微软技术许可有限责任公司 | 检测和改进单词实时误读的方法和系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11250078A (ja) * | 1998-02-27 | 1999-09-17 | Fujitsu Ten Ltd | 音声認識機能付案内装置 |
JP2015049254A (ja) * | 2013-08-29 | 2015-03-16 | 株式会社日立製作所 | 音声データ認識システム及び音声データ認識方法 |
-
2015
- 2015-03-30 JP JP2015070328A patent/JP6527000B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016191739A (ja) | 2016-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107622054B (zh) | 文本数据的纠错方法及装置 | |
CN105632499B (zh) | 用于优化语音识别结果的方法和装置 | |
US6985863B2 (en) | Speech recognition apparatus and method utilizing a language model prepared for expressions unique to spontaneous speech | |
JP4680714B2 (ja) | 音声認識装置および音声認識方法 | |
US20140019131A1 (en) | Method of recognizing speech and electronic device thereof | |
CN109979484B (zh) | 发音检错方法、装置、电子设备及存储介质 | |
US9799350B2 (en) | Apparatus and method for verifying utterance in speech recognition system | |
JP2011002656A (ja) | 音声認識結果修正候補検出装置、音声書き起こし支援装置、方法及びプログラム | |
US20120078630A1 (en) | Utterance Verification and Pronunciation Scoring by Lattice Transduction | |
CN111951825A (zh) | 一种发音测评方法、介质、装置和计算设备 | |
KR102199246B1 (ko) | 신뢰도 측점 점수를 고려한 음향 모델 학습 방법 및 장치 | |
CN102439660A (zh) | 基于置信度得分的语音标签方法和装置 | |
US20150179169A1 (en) | Speech Recognition By Post Processing Using Phonetic and Semantic Information | |
US11620992B2 (en) | Automated speech recognition confidence classifier | |
CN112331229A (zh) | 语音检测方法、装置、介质和计算设备 | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
JP6527000B2 (ja) | 発音誤り検出装置、方法およびプログラム | |
CN113053414A (zh) | 一种发音评测方法及装置 | |
US10553205B2 (en) | Speech recognition device, speech recognition method, and computer program product | |
JP2000352993A (ja) | 音声認識システム及びヒドン・マルコフ・モデルの学習方法 | |
KR20120046627A (ko) | 화자 적응 방법 및 장치 | |
KR20200036419A (ko) | 음성을 이용한 키워드 추출 방법 및 서버 | |
JP2009031328A (ja) | 音声認識装置 | |
JP6325770B2 (ja) | 音声認識誤り修正装置及びそのプログラム | |
KR102299269B1 (ko) | 음성 및 스크립트를 정렬하여 음성 데이터베이스를 구축하는 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190115 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190416 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190509 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6527000 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |