JP6193726B2 - 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体 - Google Patents
音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体 Download PDFInfo
- Publication number
- JP6193726B2 JP6193726B2 JP2013226121A JP2013226121A JP6193726B2 JP 6193726 B2 JP6193726 B2 JP 6193726B2 JP 2013226121 A JP2013226121 A JP 2013226121A JP 2013226121 A JP2013226121 A JP 2013226121A JP 6193726 B2 JP6193726 B2 JP 6193726B2
- Authority
- JP
- Japan
- Prior art keywords
- wfst
- unigram
- common
- stage
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 19
- 238000003860 storage Methods 0.000 claims description 20
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 238000003786 synthesis reaction Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000007704 transition Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Description
図5に、この発明の音声認識装置200の機能構成例を示す。音声認識装置200は、上記した音声認識用WFST作成装置100で作成した第1段WFSTを記憶した第1段WFST記憶部19と、第2段WFSTを記憶した第2段WFST記憶部20と、音声認識部210とを具備する。
Claims (8)
- 複数の言語モデルに含まれる各単語について全言語モデルにおける当該単語の出現頻度の総和と全言語モデルにおける全単語の出現頻度の総和の比である共通ユニグラム値を計算し、当該共通ユニグラム値から共通ユニグラムWFSTを作成し、当該共通ユニグラム値と上記共通ユニグラムWFSTを出力する共通ユニグラムWFST作成部と、
上記共通ユニグラム値と上記共通ユニグラムWFSTを記憶する共通ユニグラムWFST記憶部と、
N個(N≧1)の音響モデルについて各音響モデルのWFSTとトライフォンWFSTと辞書WFSTと上記共通ユニグラムWFSTとを合成演算した音響モデルごとのWFSTを作成し、全ての上記音響モデルごとのWFSTを結合させて第1段WFSTを構成する第1段WFST作成部と、
上記共通ユニグラム値を入力として、複数の言語モデルのそれぞれを参照して各言語モデルごとのnグラム確率に対して上記共通ユニグラム値を除去したnグラム確率を算出して当該nグラム確率のWFSTを作成し、全ての言語モデルの上記各言語モデルのnグラム確率のWFSTを結合させて第2段WFSTを構成する第2段WFST作成部と、
を具備する音声認識用WFST作成装置。 - 複数の言語モデルに含まれる各単語について全言語モデルにおける当該単語のユニグラム確率の総和と全言語モデルにおける全単語のユニグラム確率の総和の比である共通ユニグラム値を計算し、当該共通ユニグラム値から共通ユニグラムWFSTを作成し、当該共通ユニグラム値と上記共通ユニグラムWFSTを出力する共通ユニグラムWFST作成部と、
上記共通ユニグラム値と上記共通ユニグラムWFSTを記憶する共通ユニグラムWFST記憶部と、
N個(N≧1)の音響モデルについて各音響モデルのWFSTとトライフォンWFSTと辞書WFSTと上記共通ユニグラムWFSTとを合成演算した音響モデルごとのWFSTを作成し、全ての上記音響モデルごとのWFSTを結合させて第1段WFSTを構成する第1段WFST作成部と、
上記共通ユニグラム値を入力として、複数の言語モデルのそれぞれを参照して各言語モデルごとのnグラム確率に対して上記共通ユニグラム値を除去したnグラム確率を算出して当該nグラム確率のWFSTを作成し、全ての言語モデルの上記各言語モデルのnグラム確率のWFSTを結合させて第2段WFSTを構成する第2段WFST作成部と、
を具備する音声認識用WFST作成装置。 - 請求項1又は2に記載した音声認識用WFST作成装置で作成した第1段WFSTを記憶した第1段WFST記憶部と、第2段WFSTを記憶した第2段WFST記憶部と、
上記第1段WFST記憶部と上記第2段WFST記憶部を参照して多段on-the-fly合成による音声認識を実行する音声認識部と、
を具備する音声認識装置。 - 複数の言語モデルに含まれる各単語について全言語モデルにおける当該単語の出現頻度の総和と全言語モデルにおける全単語の出現頻度の総和の比である共通ユニグラム値を計算し、当該共通ユニグラム値から共通ユニグラムWFSTを作成し、当該共通ユニグラム値と上記共通ユニグラムWFSTを出力する共通ユニグラムWFST作成過程と、
N個(N≧1)の音響モデルについて各音響モデルのWFSTとトライフォンWFSTと辞書WFSTと上記共通ユニグラムWFSTを合成演算した音響モデルごとのWFSTを作成し、全ての上記音響モデルごとのWFSTを結合させて第1段WFSTを構成する第1段WFST作成過程と、
上記共通ユニグラム値を入力として、複数の言語モデルのそれぞれを参照して各言語モデルごとのnグラム確率に対して上記共通ユニグラム値を除去したnグラム確率を算出して当該nグラム確率のWFSTを作成し、全ての言語モデルの上記各言語モデルのnグラム確率のWFSTを結合させて第2段WFSTを構成する第2段WFST作成過程と、
を備える音声認識用WFST作成方法。 - 複数の言語モデルに含まれる各単語について全言語モデルにおける当該単語のユニグラム確率の総和と全言語モデルにおける全単語のユニグラム確率の総和の比である共通ユニグラム値を計算し、当該共通ユニグラム値から共通ユニグラムWFSTを作成し、当該共通ユニグラム値と上記共通ユニグラムWFSTを出力する共通ユニグラムWFST作成過程と、
N個(N≧1)の音響モデルについて各音響モデルのWFSTとトライフォンWFSTと辞書WFSTと上記共通ユニグラムWFSTとを合成演算した音響モデルごとのWFSTを作成し、全ての上記音響モデルごとのWFSTを結合させて第1段WFSTを構成する第1段WFST作成過程と、
上記共通ユニグラム値を入力として、複数の言語モデルのそれぞれを参照して各言語モデルごとのnグラム確率に対して上記共通ユニグラム値を除去したnグラム確率を算出して当該nグラム確率のWFSTを作成し、全ての言語モデルの上記各言語モデルのnグラム確率のWFSTを結合させて第2段WFSTを構成する第2段WFST作成過程と、
を具備する音声認識用WFST作成方法。 - 請求項4又は5に記載した音声認識用WFST作成方法で作成した第1段WFSTと第2段WFSTを用いて多段on-the-fly合成による音声認識を実行する音声認識過程を、
含む音声認識方法。 - 請求項1又は2に記載した音声認識用WFST作成装置、請求項3に記載した音声認識装置、の何れかの装置の各部の機能を、コンピュータに実行させるためのプログラム。
- 請求項7に記載した何れかのプログラムを記録したコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013226121A JP6193726B2 (ja) | 2013-10-31 | 2013-10-31 | 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013226121A JP6193726B2 (ja) | 2013-10-31 | 2013-10-31 | 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015087556A JP2015087556A (ja) | 2015-05-07 |
JP6193726B2 true JP6193726B2 (ja) | 2017-09-06 |
Family
ID=53050410
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013226121A Expired - Fee Related JP6193726B2 (ja) | 2013-10-31 | 2013-10-31 | 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6193726B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683677B (zh) | 2015-11-06 | 2021-11-12 | 阿里巴巴集团控股有限公司 | 语音识别方法及装置 |
CN106356054A (zh) * | 2016-11-23 | 2017-01-25 | 广西大学 | 一种基于语音识别的农产品信息采集方法和系统 |
CN113011198B (zh) * | 2021-03-05 | 2022-07-22 | 北京嘀嘀无限科技发展有限公司 | 一种信息交互方法、装置及电子设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4956334B2 (ja) * | 2007-08-29 | 2012-06-20 | 株式会社東芝 | オートマトンの決定化方法、有限状態トランスデューサの決定化方法、オートマトン決定化装置及び決定化プログラム |
JP5888729B2 (ja) * | 2012-01-10 | 2016-03-22 | 国立研究開発法人情報通信研究機構 | 言語モデル結合装置、言語処理装置、およびプログラム |
JP6095588B2 (ja) * | 2013-06-03 | 2017-03-15 | 日本電信電話株式会社 | 音声認識用wfst作成装置、音声認識装置、音声認識用wfst作成方法、音声認識方法及びプログラム |
-
2013
- 2013-10-31 JP JP2013226121A patent/JP6193726B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015087556A (ja) | 2015-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5377889B2 (ja) | 言語処理装置およびプログラム | |
WO2017213055A1 (ja) | 音声認識装置及びコンピュータプログラム | |
JP6614639B2 (ja) | 音声認識装置及びコンピュータプログラム | |
CN107705787A (zh) | 一种语音识别方法及装置 | |
JPH0772840B2 (ja) | 音声モデルの構成方法、音声認識方法、音声認識装置及び音声モデルの訓練方法 | |
JP2010540976A (ja) | 自動音声認識の方法および装置 | |
JP2006243728A (ja) | 音素をテキストに変換する方法、そのコンピュータシステム、及びコンピュータプログラム | |
KR20220062349A (ko) | 디코딩 네트워크 구축 방법, 음성 인식 방법, 디바이스 및 장치, 및 저장 매체 | |
JP4930379B2 (ja) | 類似文検索方法、類似文検索システム及び類似文検索用プログラム | |
JP6095588B2 (ja) | 音声認識用wfst作成装置、音声認識装置、音声認識用wfst作成方法、音声認識方法及びプログラム | |
JP5249967B2 (ja) | 音声認識装置、重みベクトル学習装置、音声認識方法、重みベクトル学習方法、プログラム | |
JP2017009842A (ja) | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム | |
JP6193726B2 (ja) | 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体 | |
KR20120052591A (ko) | 연속어 음성인식 시스템에서 오류수정 장치 및 방법 | |
JP6301794B2 (ja) | オートマトン変形装置、オートマトン変形方法およびプログラム | |
JP5875569B2 (ja) | 音声認識装置とその方法とプログラムとその記録媒体 | |
JP6078435B2 (ja) | 記号列変換方法、音声認識方法、それらの装置及びプログラム | |
JP6558856B2 (ja) | 形態素解析装置、モデル学習装置、及びプログラム | |
JP5881157B2 (ja) | 情報処理装置、およびプログラム | |
JP4478088B2 (ja) | 記号列変換方法、音声認識方法、記号列変換装置とプログラム、記録媒体 | |
JP3950957B2 (ja) | 言語処理装置および方法 | |
JP4733436B2 (ja) | 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体 | |
JP6167063B2 (ja) | 発話リズム変換行列生成装置、発話リズム変換装置、発話リズム変換行列生成方法、及びそのプログラム | |
Pilar | Knowledge-driven subword grammar modeling for automatic speech recognition in tamil and kannada | |
JP6277659B2 (ja) | 音声認識装置および音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170810 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6193726 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |