JP2015087555A - 音声認識装置とその方法とプログラムとその記録媒体 - Google Patents
音声認識装置とその方法とプログラムとその記録媒体 Download PDFInfo
- Publication number
- JP2015087555A JP2015087555A JP2013226120A JP2013226120A JP2015087555A JP 2015087555 A JP2015087555 A JP 2015087555A JP 2013226120 A JP2013226120 A JP 2013226120A JP 2013226120 A JP2013226120 A JP 2013226120A JP 2015087555 A JP2015087555 A JP 2015087555A
- Authority
- JP
- Japan
- Prior art keywords
- wfst
- stage
- speech recognition
- acoustic model
- wfsts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】第1段WFSTと、第2段WFSTと、音声認識部とを具備する音声認識装置であって、音声認識部は、利用音響モデル情報記憶部と、結合WFST作成部と、探索部と、を備える。第1段WFSTは、N個の音響モデルのWFSTとトライフォンWFSTと辞書WFSTとユニグラムWFSTを合成したN個のWFSTである。第2段WFSTは、第1段WFSTに含まれないM個のWFSTである。結合WFST作成部は、利用音響モデル情報記憶部に記憶された音響モデル情報に対応する上記第1段WFSTに接続するための結合WFSTを作成する。探索部は、結合WFSTと第1段WFSTと第2段WFSTとを用いて多段on-the-fly合成によるWFST音声認識を行う。
【選択図】図1
Description
Claims (8)
- N個(N≧2)の音響モデルのWFSTとトライフォンWFSTと辞書WFSTとユニグラムWFSTを合成したN個の第1段WFSTと、
上記第1段WFSTに含まれない1個以上のWFSTの第2段WFST乃至第M段WFSTと、
上記第1段WFSTと上記第2段WFST乃至第M段WFSTを用いて複数の入力音声を音声認識する複数の音声認識部と、
を具備する音声認識装置であって、
上記音声認識部は、
上記N個の音響モデルを特定する音響モデル情報を記憶した利用音響モデル情報記憶部と、
上記利用音響モデル情報記憶部に記憶された音響モデル情報に対応する上記第1段WFSTに接続するための結合WFSTを作成する結合WFST作成部と、
上記結合WFSTと上記第1段WFSTと、上記第2段WFST乃至第M段WFSTの何れかとを用いて多段on-the-fly合成によるWFST音声認識を行う探索部と、
を備えることを特徴とする音声認識装置。 - 請求項1に記載した音声認識装置において、
上記第2段WFSTは、入出力シンボルが上記第1段WFSTと同じで且つ重みを持つWFSTであることを特徴とする音声認識装置。 - 請求項1又は2に記載した音声認識装置において、
上記結合WFSTの初期状態から各第1段WFSTの初期状態へ接続する遷移に出力シンボルとして音響モデル情報を示す記号が付加されると共に、第1段WFSTに縦続接続される第2段WFST乃至第M段WFSTの何れかの初期状態の前に新たな状態を追加し、当該新たな状態と上記初期状態との間の遷移の入出力シンボルに音響モデル情報を示す記号を付加したことを特徴とする音声認識装置。 - N個(N≧2)の音響モデルのWFSTとトライフォンWFSTと辞書WFSTとユニグラムWFSTを合成したN個の第1段WFSTと、当該第1段WFSTに含まれない1個以上のWFSTの第2段WFST乃至第M段WFSTとを用いて複数の入力音声を音声認識する複数の音声認識過程を、備える音声認識方法であって、
上記音声認識過程は、
利用音響モデル情報記憶部に記憶された音響モデル情報に対応する上記第1段WFSTに接続するための結合WFSTを作成する結合WFST作成ステップと、
上記結合WFSTと上記第1段WFSTと、上記第2段WFST乃至第M段WFSTの何れかとを用いて多段on-the-fly合成によるWFST音声認識を行う探索過程と、
を含むことを特徴とする音声認識方法。 - 請求項4に記載した音声認識方法において、
上記第2段WFSTは、入出力シンボルが上記第1段WFSTと同じで且つ重みを持つWFSTであることを特徴とする音声認識方法。 - 請求項4又は5に記載した音声認識方法において、
上記結合WFSTの初期状態から各第1段WFSTの初期状態へ接続する遷移に出力シンボルとして音響モデル情報を示す記号が付加されると共に、第1段WFSTに縦続接続される第2段WFST乃至第M段WFSTの何れかの初期状態の前に新たな状態を追加し、当該新たな状態と上記初期状態との間の遷移の入出力シンボルに音響モデル情報を示す記号を付加したことを特徴とする音声認識方法。 - 請求項1乃至3の何れかに記載した音声認識装置の各部の機能を、コンピュータに実行させるためのプログラム。
- 請求項7記載した何れかのプログラムを記録したコンピュータで読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013226120A JP5875569B2 (ja) | 2013-10-31 | 2013-10-31 | 音声認識装置とその方法とプログラムとその記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013226120A JP5875569B2 (ja) | 2013-10-31 | 2013-10-31 | 音声認識装置とその方法とプログラムとその記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015087555A true JP2015087555A (ja) | 2015-05-07 |
JP5875569B2 JP5875569B2 (ja) | 2016-03-02 |
Family
ID=53050409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013226120A Active JP5875569B2 (ja) | 2013-10-31 | 2013-10-31 | 音声認識装置とその方法とプログラムとその記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5875569B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683677A (zh) * | 2015-11-06 | 2017-05-17 | 阿里巴巴集团控股有限公司 | 语音识别方法及装置 |
US10714080B2 (en) | 2017-02-10 | 2020-07-14 | Samsung Electronics Co., Ltd. | WFST decoding system, speech recognition system including the same and method for storing WFST data |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5719997A (en) * | 1994-01-21 | 1998-02-17 | Lucent Technologies Inc. | Large vocabulary connected speech recognition system and method of language representation using evolutional grammer to represent context free grammars |
JP2000010587A (ja) * | 1998-06-23 | 2000-01-14 | Hitachi Ltd | 仮名入力電話音声認識装置 |
US20040034519A1 (en) * | 2000-05-23 | 2004-02-19 | Huitouze Serge Le | Dynamic language models for speech recognition |
JP2007233149A (ja) * | 2006-03-02 | 2007-09-13 | Nippon Hoso Kyokai <Nhk> | 音声認識装置及び音声認識プログラム |
JP5175325B2 (ja) * | 2010-11-24 | 2013-04-03 | 日本電信電話株式会社 | 音声認識用wfst作成装置とそれを用いた音声認識装置と、それらの方法とプログラムと記憶媒体 |
-
2013
- 2013-10-31 JP JP2013226120A patent/JP5875569B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5719997A (en) * | 1994-01-21 | 1998-02-17 | Lucent Technologies Inc. | Large vocabulary connected speech recognition system and method of language representation using evolutional grammer to represent context free grammars |
JP2000010587A (ja) * | 1998-06-23 | 2000-01-14 | Hitachi Ltd | 仮名入力電話音声認識装置 |
US20040034519A1 (en) * | 2000-05-23 | 2004-02-19 | Huitouze Serge Le | Dynamic language models for speech recognition |
JP2007233149A (ja) * | 2006-03-02 | 2007-09-13 | Nippon Hoso Kyokai <Nhk> | 音声認識装置及び音声認識プログラム |
JP5175325B2 (ja) * | 2010-11-24 | 2013-04-03 | 日本電信電話株式会社 | 音声認識用wfst作成装置とそれを用いた音声認識装置と、それらの方法とプログラムと記憶媒体 |
Non-Patent Citations (1)
Title |
---|
JPN6015034236; 大西 翼 Tasuku OONISHI: 'WFST音声認識デコーダにおけるon-the-fly合成の最適化処理 Optimization of On-the-Fly Com' 電子情報通信学会論文誌 (J92-D) 第7号 THE IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS (J 第J92-D巻、No.7, 20090701, p.1026-1035, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683677A (zh) * | 2015-11-06 | 2017-05-17 | 阿里巴巴集团控股有限公司 | 语音识别方法及装置 |
US11664020B2 (en) | 2015-11-06 | 2023-05-30 | Alibaba Group Holding Limited | Speech recognition method and apparatus |
US10714080B2 (en) | 2017-02-10 | 2020-07-14 | Samsung Electronics Co., Ltd. | WFST decoding system, speech recognition system including the same and method for storing WFST data |
Also Published As
Publication number | Publication date |
---|---|
JP5875569B2 (ja) | 2016-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3373293B1 (en) | Speech recognition method and apparatus | |
CN106688034B (zh) | 具有情感内容的文字至语音转换 | |
JP5554304B2 (ja) | オートマトン決定化方法、オートマトン決定化装置およびオートマトン決定化プログラム | |
JP5062171B2 (ja) | 音声認識システム、音声認識方法および音声認識用プログラム | |
JP6614639B2 (ja) | 音声認識装置及びコンピュータプログラム | |
JP7051919B2 (ja) | ストリーミングアテンションモデルに基づく音声認識復号化方法、装置、機器及びコンピュータ可読記憶媒体 | |
JP2015127758A (ja) | 応答制御装置、制御プログラム | |
KR20210138776A (ko) | 엔드-투-엔드 모델들에서 교차-언어 음성 인식을 위한 음소-기반 컨텍스트화 | |
JP4930379B2 (ja) | 類似文検索方法、類似文検索システム及び類似文検索用プログラム | |
JPH0772840B2 (ja) | 音声モデルの構成方法、音声認識方法、音声認識装置及び音声モデルの訓練方法 | |
US20130138441A1 (en) | Method and system for generating search network for voice recognition | |
CN116670757A (zh) | 用于简化的流式和非流式语音识别的级联编码器 | |
TWI420510B (zh) | 可調整記憶體使用空間之語音辨識系統與方法 | |
JP2015014774A (ja) | 音声認識用wfst作成装置、音声認識装置、音声認識用wfst作成方法、音声認識方法及びプログラム | |
JP2020154076A (ja) | 推論器、学習方法および学習プログラム | |
JP2011164336A (ja) | 音声認識装置、重みベクトル学習装置、音声認識方法、重みベクトル学習方法、プログラム | |
JP2013109061A (ja) | 音声データ検索システムおよびそのためのプログラム | |
JP5688761B2 (ja) | 音響モデル学習装置、および音響モデル学習方法 | |
WO2014020588A1 (en) | Method and apparatus for speech recognition | |
CN117063228A (zh) | 用于灵活流式和非流式自动语音识别的混合模型注意力 | |
JP5875569B2 (ja) | 音声認識装置とその方法とプログラムとその記録媒体 | |
JP6193726B2 (ja) | 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体 | |
US20040006469A1 (en) | Apparatus and method for updating lexicon | |
JPWO2018173943A1 (ja) | データ構造化装置、データ構造化方法およびプログラム | |
JP2007033671A (ja) | 音声認識システム、音声認識方法、および音声認識プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150825 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150917 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160119 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5875569 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |