JP5877823B2 - 音声認識装置、音声認識方法、およびプログラム - Google Patents
音声認識装置、音声認識方法、およびプログラム Download PDFInfo
- Publication number
- JP5877823B2 JP5877823B2 JP2013175117A JP2013175117A JP5877823B2 JP 5877823 B2 JP5877823 B2 JP 5877823B2 JP 2013175117 A JP2013175117 A JP 2013175117A JP 2013175117 A JP2013175117 A JP 2013175117A JP 5877823 B2 JP5877823 B2 JP 5877823B2
- Authority
- JP
- Japan
- Prior art keywords
- transition
- speech recognition
- special
- wfst
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
本実施の形態において、音声認識に用いるWFST内の単語間の境界位置に、単語を識別する情報を加え、その情報を用いて音声認識の結果を出力する音声認識装置1について説明する。
なお、図4のフローチャートでは、音声認識のバッチ処理を行う場合について説明したが、音声認識のリアルタイム処理を行う場合にも、同様に行うことができる。また、図4のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
101 WFST格納手段
102 音声信号受付手段
103 用語格納手段
104 音声認識手段
105 出力手段
Claims (8)
- 発話された音声を示す音声信号を受け付ける音声信号受付手段と、
入力を有し、出力を有しない遷移である一般遷移と、単語に関する用語を識別する特殊発音記号を有する遷移であり、当該単語の認識に用いられる1以上の一般遷移の組の次の遷移である特殊遷移と、各遷移によって接続される状態とを有する最適化済みのWFST(重み付き有限状態トランスデューサ)である音声認識WFSTを用いて、前記音声信号に対応する特殊遷移が有する特殊発音記号により識別される用語の列である音声認識結果情報を取得する音声認識手段と、
前記音声認識結果情報を出力する出力手段とを具備する音声認識装置。 - 発話された音声を示す音声信号を受け付ける音声信号受付手段と、
入力を有し、出力を有しない遷移である一般遷移と、単語に関する用語を識別する特殊発音記号を有する遷移であり、当該単語の認識に用いられる1以上の一般遷移の組の前の遷移である特殊遷移と、各遷移によって接続される状態とを有する最適化済みのWFST(重み付き有限状態トランスデューサ)である音声認識WFSTを用いて、前記音声信号に対応する特殊遷移が有する特殊発音記号により識別される用語の列である音声認識結果情報を取得する音声認識手段と、
前記音声認識結果情報を出力する出力手段とを具備する音声認識装置。 - 前記音声認識手段は、
前記特殊遷移を用いて、単語間の境界に関する情報をも含む音声認識結果情報を取得する、請求項1または2記載の音声認識装置。 - 前記単語に関する用語は、
当該単語に対応する用語であって、当該単語と発音が異なる用語である、請求項1から請求項3のいずれか一項記載の音声認識装置。 - 音声信号受付手段と、音声認識手段と、出力手段とを用いて処理される音声認識方法であって、
前記音声信号受付手段が、発話された音声を示す音声信号を受け付ける音声信号受付ステップと、
前記音声認識手段が、入力を有し、出力を有しない遷移である一般遷移と、単語に関する用語を識別する特殊発音記号を有する遷移であり、当該単語の認識に用いられる1以上の一般遷移の組の次の遷移である特殊遷移と、各遷移によって接続される状態とを有する最適化済みのWFST(重み付き有限状態トランスデューサ)である音声認識WFSTを用いて、前記音声信号に対応する特殊遷移が有する特殊発音記号により識別される用語の列である音声認識結果情報を取得する音声認識ステップと、
前記出力手段が、前記音声認識結果情報を出力する出力ステップとを具備する音声認識方法。 - 音声信号受付手段と、音声認識手段と、出力手段とを用いて処理される音声認識方法であって、
前記音声信号受付手段が、発話された音声を示す音声信号を受け付ける音声信号受付ステップと、
前記音声認識手段が、入力を有し、出力を有しない遷移である一般遷移と、単語に関する用語を識別する特殊発音記号を有する遷移であり、当該単語の認識に用いられる1以上の一般遷移の組の前の遷移である特殊遷移と、各遷移によって接続される状態とを有する最適化済みのWFST(重み付き有限状態トランスデューサ)である音声認識WFSTを用いて、前記音声信号に対応する特殊遷移が有する特殊発音記号により識別される用語の列である音声認識結果情報を取得する音声認識ステップと、
前記出力手段が、前記音声認識結果情報を出力する出力ステップとを具備する音声認識方法。 - コンピュータを、
発話された音声を示す音声信号を受け付ける音声信号受付手段、
入力を有し、出力を有しない遷移である一般遷移と、単語に関する用語を識別する特殊発音記号を有する遷移であり、当該単語の認識に用いられる1以上の一般遷移の組の次の遷移である特殊遷移と、各遷移によって接続される状態とを有する最適化済みのWFST(重み付き有限状態トランスデューサ)である音声認識WFSTを用いて、前記音声信号に対応する特殊遷移が有する特殊発音記号により識別される用語の列である音声認識結果情報を取得する音声認識手段、
前記音声認識結果情報を出力する出力手段として機能させるためのプログラム。 - コンピュータを、
発話された音声を示す音声信号を受け付ける音声信号受付手段、
入力を有し、出力を有しない遷移である一般遷移と、単語に関する用語を識別する特殊発音記号を有する遷移であり、当該単語の認識に用いられる1以上の一般遷移の組の前の遷移である特殊遷移と、各遷移によって接続される状態とを有する最適化済みのWFST(重み付き有限状態トランスデューサ)である音声認識WFSTを用いて、前記音声信号に対応する特殊遷移が有する特殊発音記号により識別される用語の列である音声認識結果情報を取得する音声認識手段、
前記音声認識結果情報を出力する出力手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013175117A JP5877823B2 (ja) | 2013-08-27 | 2013-08-27 | 音声認識装置、音声認識方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013175117A JP5877823B2 (ja) | 2013-08-27 | 2013-08-27 | 音声認識装置、音声認識方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015045668A JP2015045668A (ja) | 2015-03-12 |
JP5877823B2 true JP5877823B2 (ja) | 2016-03-08 |
Family
ID=52671241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013175117A Active JP5877823B2 (ja) | 2013-08-27 | 2013-08-27 | 音声認識装置、音声認識方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5877823B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102687184B1 (ko) | 2017-02-10 | 2024-07-19 | 삼성전자주식회사 | Wfst 디코딩 시스템, 이를 포함하는 음성 인식 시스템 및 wfst 데이터 저장 방법 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08248977A (ja) * | 1995-03-06 | 1996-09-27 | Fuji Xerox Co Ltd | 音声認識方法 |
JP3995175B2 (ja) * | 1998-04-22 | 2007-10-24 | 沖電気工業株式会社 | 自然言語解析のコスト決定装置 |
US7107205B2 (en) * | 2000-04-03 | 2006-09-12 | Xerox Corporation | Method and apparatus for aligning ambiguity in finite state transducers |
JP2006084942A (ja) * | 2004-09-17 | 2006-03-30 | Nippon Telegr & Teleph Corp <Ntt> | 変換情報生成方法、音素系列生成方法、音声認識方法、ならびにこれらの装置、及びプログラム |
JP4812029B2 (ja) * | 2007-03-16 | 2011-11-09 | 富士通株式会社 | 音声認識システム、および、音声認識プログラム |
JP5175325B2 (ja) * | 2010-11-24 | 2013-04-03 | 日本電信電話株式会社 | 音声認識用wfst作成装置とそれを用いた音声認識装置と、それらの方法とプログラムと記憶媒体 |
-
2013
- 2013-08-27 JP JP2013175117A patent/JP5877823B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015045668A (ja) | 2015-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017076222A1 (zh) | 语音识别方法及装置 | |
US8972260B2 (en) | Speech recognition using multiple language models | |
JP6400936B2 (ja) | 音声検索方法、音声検索装置、並びに、音声検索装置用のプログラム | |
US8271282B2 (en) | Voice recognition apparatus, voice recognition method and recording medium | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
CN110807093A (zh) | 语音处理方法、装置及终端设备 | |
US20170270923A1 (en) | Voice processing device and voice processing method | |
JP5068225B2 (ja) | 音声ファイルの検索システム、方法及びプログラム | |
JP2011107314A (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP5877823B2 (ja) | 音声認識装置、音声認識方法、およびプログラム | |
CN111640423A (zh) | 一种词边界估计方法、装置及电子设备 | |
JP4861941B2 (ja) | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム | |
JP5701348B2 (ja) | 音声認識装置、音声認識方法、およびプログラム | |
KR102067973B1 (ko) | 음소열의 편집 거리를 이용한 웨이크업 단어 선정 방법 | |
JP6347939B2 (ja) | 発話内重要語抽出装置とその装置を用いた発話内重要語抽出システムと、それらの方法とプログラム | |
CN113658581B (zh) | 声学模型的训练、语音处理方法、装置、设备及存储介质 | |
JP2016180918A (ja) | 音声認識システム、音声認識方法、プログラム | |
JP2011090483A (ja) | 情報処理装置およびプログラム | |
JP5164041B2 (ja) | 音声合成装置、音声合成方法、及びプログラム | |
JP2008293098A (ja) | 応答スコア情報生成装置、対話処理装置 | |
JP6179884B2 (ja) | Wfst作成装置、音声認識装置、音声翻訳装置、wfst作成方法、およびプログラム | |
TW201828279A (zh) | 語音識別方法及裝置 | |
JP6244731B2 (ja) | 情報処理装置及び情報処理プログラム | |
CN113763921B (zh) | 用于纠正文本的方法和装置 | |
CN112447169B (zh) | 一种词边界估计方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150609 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160126 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5877823 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |