JP2017009842A - 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム - Google Patents
音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム Download PDFInfo
- Publication number
- JP2017009842A JP2017009842A JP2015126246A JP2015126246A JP2017009842A JP 2017009842 A JP2017009842 A JP 2017009842A JP 2015126246 A JP2015126246 A JP 2015126246A JP 2015126246 A JP2015126246 A JP 2015126246A JP 2017009842 A JP2017009842 A JP 2017009842A
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- sequence
- recognition result
- string
- pronunciation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Abstract
Description
まず、図1に、第1の実施の形態の音声認識結果出力装置のハードウェア構成図を示す。この図1に示すように、音声認識結果出力装置は、CPU1、ROM2、RAM3、マイクロホン部4、表示部6、操作部7及びHDD8を有している。CPUは、「Central Processing Unit」の略記である。ROMは、「Read Only Memory」の略記である。RAMは、「Random Access Memory」の略記である。HDDは、「Hard Disc Drive」の略記である。CPU1〜HDD部8は、それぞれバスライン9を介して相互に接続されている。
次に、第2の実施の形態の音声認識結果出力装置の説明をする。図5に、第2の実施の形態の音声認識結果出力装置のハードウェア構成図を示す。なお、この図5において、上述の第1の実施の形態と同じ動作を示す箇所には同じ符号を付し、重複した説明は省略する。図5に示すように、第2の実施の形態の音声認識結果出力装置は、CPU1、ROM2、RAM3、マイクロホン部4、表示部6、操作部7及びHDD8を有している。CPU1〜HDD部8は、それぞれバスライン9を介して相互に接続されている。
2 ROM
3 RAM
4 マイクロホン部
5 スピーカ部
6 表示部
7 操作部
8 HDD
9 バスライン
10 言語データベース
11 音響データベース
21 発音列取得部
22 第1の特徴量変換部
23 第1の表記列変換部
31 音声取得部
32 第2の特徴量変換部
33 第2の表記列変換部
40 デコーダ
Claims (7)
- 発音列を取得する発音列取得部と、
音声認識用の言語モデルを記憶した記憶部と、
前記発音列を発音列特徴ベクトルに変換する特徴量変換部と、
前記言語モデルを用いて、前記発音列特徴ベクトルを表記列に変換して出力する表記列変換部と
を有する音声認識結果出力装置。 - 前記発音列特徴ベクトルは、音響スコアベクトルであること
を特徴とする請求項1に記載の音声認識結果出力装置。 - 前記発音列特徴ベクトルは、音素状態音響スコアベクトルで、音素状態音響スコアベクトル列は発音列に該当する音素状態音響スコアの要素を他の音素状態音響スコアよりも高くしたベクトル列であること
を特徴とする請求項1に記載の音声認識結果出力装置。 - 音声認識用の音響モデルを記憶した他の記憶部と、
入力音声を取得する音声取得部と、
取得した音声の音声波形を、音声認識用の音声特徴ベクトルに変換する他の特徴量変換部と、
前記言語モデルと前記音響モデルを用いて、前記音声特徴ベクトルを表記列に変換する他の表記列変換部と、をさらに備えること
を特徴とする請求項1から請求項3のうち、いずれか一項に記載の音声認識結果出力装置。 - 前記音響モデルは、ガウス分布音響モデルであり、前記発音列特徴ベクトルは、発音列状態を表すガウス混合音響モデルの複数の次元の平均値を要素とすること
を特徴とする請求項4に記載の音声認識結果出力装置。 - 発音列取得部が、発音列を取得する発音列取得ステップと、
特徴量変換部が、取得した前記発音列を発音列特徴ベクトルに変換する特徴量変換ステップと、
表記列変換部が、音声認識用の言語統計情報を持つ言語モデルを用いて、前記発音列特徴ベクトルを表記列に変換して出力する表記列変換ステップと
を有する音声認識結果出力方法。 - コンピュータを、
発音列を取得する発音列取得部と、
取得した前記発音列を発音列特徴ベクトルに変換する特徴量変換部と、
音声認識用の言語統計情報を持つ言語モデルを用いて、前記発音列特徴ベクトルを表記列に変換して出力する表記列変換部として機能させること
を特徴とする音声認識結果出力プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015126246A JP6580882B2 (ja) | 2015-06-24 | 2015-06-24 | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム |
US15/182,987 US10535339B2 (en) | 2015-06-24 | 2016-06-15 | Recognition result output device, recognition result output method, and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015126246A JP6580882B2 (ja) | 2015-06-24 | 2015-06-24 | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017009842A true JP2017009842A (ja) | 2017-01-12 |
JP6580882B2 JP6580882B2 (ja) | 2019-09-25 |
Family
ID=57602688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015126246A Active JP6580882B2 (ja) | 2015-06-24 | 2015-06-24 | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10535339B2 (ja) |
JP (1) | JP6580882B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180127020A (ko) * | 2017-05-19 | 2018-11-28 | 한국전자통신연구원 | 자연어 대화체 음성 인식 방법 및 장치 |
US10319373B2 (en) | 2016-03-14 | 2019-06-11 | Kabushiki Kaisha Toshiba | Information processing device, information processing method, computer program product, and recognition system |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6580882B2 (ja) * | 2015-06-24 | 2019-09-25 | 株式会社東芝 | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム |
KR102434604B1 (ko) * | 2016-01-05 | 2022-08-23 | 한국전자통신연구원 | 개인화된 음성 인식을 수행하기 위한 음성 인식 단말, 음성 인식 서버 및 음성 인식 방법 |
US10043519B2 (en) * | 2016-09-02 | 2018-08-07 | Tim Schlippe | Generation of text from an audio speech signal |
JP2019159826A (ja) * | 2018-03-13 | 2019-09-19 | 富士通株式会社 | 表示制御プログラム、表示制御装置及び表示制御方法 |
JP7043081B2 (ja) * | 2019-05-23 | 2022-03-29 | 恒雄 新田 | 音声想起認識装置、装着具、音声想起認識方法及びプログラム |
US11735169B2 (en) * | 2020-03-20 | 2023-08-22 | International Business Machines Corporation | Speech recognition and training for data inputs |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006113569A (ja) * | 2004-10-15 | 2006-04-27 | Microsoft Corp | 音声認識システムの音響モデルから生成された合成入力を用いた自動音声認識システムのテストおよび調整 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4590692B2 (ja) * | 2000-06-28 | 2010-12-01 | パナソニック株式会社 | 音響モデル作成装置及びその方法 |
GB0028277D0 (en) * | 2000-11-20 | 2001-01-03 | Canon Kk | Speech processing system |
KR100486733B1 (ko) | 2003-02-24 | 2005-05-03 | 삼성전자주식회사 | 음소 결합정보를 이용한 연속 음성인식방법 및 장치 |
JP3984207B2 (ja) | 2003-09-04 | 2007-10-03 | 株式会社東芝 | 音声認識評価装置、音声認識評価方法、及び音声認識評価プログラム |
ES2237345B1 (es) | 2005-02-28 | 2006-06-16 | Prous Institute For Biomedical Research S.A. | Procedimiento de conversion de fonemas a texto escrito y sistema informatico y programa informatico correspondientes. |
JP5068225B2 (ja) | 2008-06-30 | 2012-11-07 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声ファイルの検索システム、方法及びプログラム |
US10019983B2 (en) | 2012-08-30 | 2018-07-10 | Aravind Ganapathiraju | Method and system for predicting speech recognition performance using accuracy scores |
US9728185B2 (en) * | 2014-05-22 | 2017-08-08 | Google Inc. | Recognizing speech using neural networks |
JP6580882B2 (ja) * | 2015-06-24 | 2019-09-25 | 株式会社東芝 | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム |
-
2015
- 2015-06-24 JP JP2015126246A patent/JP6580882B2/ja active Active
-
2016
- 2016-06-15 US US15/182,987 patent/US10535339B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006113569A (ja) * | 2004-10-15 | 2006-04-27 | Microsoft Corp | 音声認識システムの音響モデルから生成された合成入力を用いた自動音声認識システムのテストおよび調整 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10319373B2 (en) | 2016-03-14 | 2019-06-11 | Kabushiki Kaisha Toshiba | Information processing device, information processing method, computer program product, and recognition system |
KR20180127020A (ko) * | 2017-05-19 | 2018-11-28 | 한국전자통신연구원 | 자연어 대화체 음성 인식 방법 및 장치 |
KR102197387B1 (ko) * | 2017-05-19 | 2021-01-04 | 한국전자통신연구원 | 자연어 대화체 음성 인식 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP6580882B2 (ja) | 2019-09-25 |
US10535339B2 (en) | 2020-01-14 |
US20160379624A1 (en) | 2016-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6580882B2 (ja) | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
KR101056080B1 (ko) | 음운 기반의 음성 인식 시스템 및 방법 | |
JP4481035B2 (ja) | 単語間音素情報を利用した連続音声認識方法および装置 | |
US20130090921A1 (en) | Pronunciation learning from user correction | |
JP5310563B2 (ja) | 音声認識システム、音声認識方法、および音声認識用プログラム | |
JP6392012B2 (ja) | 音声合成辞書作成装置、音声合成装置、音声合成辞書作成方法及び音声合成辞書作成プログラム | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
JP6622681B2 (ja) | 音素崩れ検出モデル学習装置、音素崩れ区間検出装置、音素崩れ検出モデル学習方法、音素崩れ区間検出方法、プログラム | |
JP6127422B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP5180800B2 (ja) | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム | |
Kayte et al. | Implementation of Marathi Language Speech Databases for Large Dictionary | |
JP6631883B2 (ja) | クロスリンガル音声合成用モデル学習装置、クロスリンガル音声合成用モデル学習方法、プログラム | |
JP2015041081A (ja) | 定量的f0パターン生成装置及び方法、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
Gutkin et al. | Building statistical parametric multi-speaker synthesis for bangladeshi bangla | |
JPWO2016103652A1 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP2006012179A (ja) | 自然言語処理装置および自然言語処理方法 | |
JP6367773B2 (ja) | 音声強調装置、音声強調方法及び音声強調プログラム | |
JP2011180308A (ja) | 音声認識装置及び記録媒体 | |
JP2005250071A (ja) | 音声認識方法及び装置及び音声認識プログラム及び音声認識プログラムを格納した記憶媒体 | |
JP2006343405A (ja) | 音声理解装置、音声理解方法、単語・意味表現組データベースの作成方法、そのプログラムおよび記憶媒体 | |
JP6137708B2 (ja) | 定量的f0パターン生成装置、f0パターン生成のためのモデル学習装置、並びにコンピュータプログラム | |
JP6006674B2 (ja) | 音響モデル選択装置とその方法とプログラム | |
JP6023543B2 (ja) | 記号列変換方法とそれを用いた音声認識方法と、それらの装置とプログラムとその記録媒体 | |
Razavi et al. | Pronunciation lexicon development for under-resourced languages using automatically derived subword units: a case study on Scottish Gaelic |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20151102 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190306 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190730 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190829 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6580882 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |