JP2013171214A - 情報処理装置、およびプログラム - Google Patents
情報処理装置、およびプログラム Download PDFInfo
- Publication number
- JP2013171214A JP2013171214A JP2012035867A JP2012035867A JP2013171214A JP 2013171214 A JP2013171214 A JP 2013171214A JP 2012035867 A JP2012035867 A JP 2012035867A JP 2012035867 A JP2012035867 A JP 2012035867A JP 2013171214 A JP2013171214 A JP 2013171214A
- Authority
- JP
- Japan
- Prior art keywords
- class
- information
- transition
- state
- element information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007704 transition Effects 0.000 claims abstract description 126
- 238000012545 processing Methods 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims description 46
- 230000008569 process Effects 0.000 claims description 38
- 230000010365 information processing Effects 0.000 claims description 34
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 abstract description 14
- 238000013519 translation Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Abstract
【解決手段】3以上の状態情報と2以上の遷移情報とを有する第一WFSTを格納する第一WFST格納部11と、クラス識別子と1以上の要素情報とを有する2以上のクラス情報を格納しており、受け付けた状態識別子の状態からの遷移のクラスの2以上のクラス識別子に対応する2以上の要素情報を取得する要素情報取得部14と、2以上の要素情報をソートするソート部と、ソートした2以上の各要素情報に対応する遷移確率を取得する遷移確率取得部16と、2以上の各要素情報と遷移確率とを有する2以上の遷移情報を取得し、第二WFSTを取得する第二WFST構成部17と、第二WFSTを用いて処理を行う処理部18とを具備する。
【選択図】図1
Description
一方、音声やテキスト等のシステムへの入力に対して、種々のモデルに基づいて、最も尤もらしい解(音声認識結果や翻訳結果)を求めるデコーディングにおいては、重みつき有限状態トランスデューサ(以下、適宜「WFST」と言う。)に基づく手法が用いられる。WFSTは、種々のモデルを統一的な形式で表現し、それらを合成することにより全探索空間を構成し、当該全探索空間を最適化することにより非常に効率的な解探索処理が可能となるデータ構造である。
本実施の形態において、クラスN−gramモデルに対応するWFSTを処理し、音声認識処理、または機械翻訳処理等の予め決められた処理を行う情報処理装置について説明する。
11 第一WFST格納部
12 クラス情報格納部
13 受付部
14 要素情報取得部
15 ソート部
16 遷移確率取得部
17 第二WFST構成部
18 処理部
Claims (6)
- 状態を識別する状態識別子を含む3以上の状態情報と、状態から状態への遷移を示し、遷移のクラスを識別するクラス識別子と遷移する確率を示すクラス連鎖確率とを有する2以上の遷移情報とを有する第一の重みつき有限状態トランスデューサ(第一WFST)を格納している第一WFST格納部と、
クラス識別子と当該クラス識別子で識別されるクラスに属する1以上の要素情報とを有する2以上のクラス情報を格納しているクラス情報格納部と、
状態識別子を受け付ける受付部と、
前記受付部が受け付けた状態識別子で識別される状態からの遷移のクラスを識別する2以上のクラス識別子を前記第一WFST格納部から取得し、当該2以上の各クラス識別子に対応する2以上の要素情報を前記クラス情報格納部から取得する要素情報取得部と、
前記要素情報取得部が取得した2以上の要素情報をソートするソート部と、
前記ソート部がソートした2以上の各要素情報に対応するクラス連鎖確率を用いて、前記2以上の各要素情報の遷移確率を取得する遷移確率取得部と、
前記受付部が受け付けた状態識別子で識別される状態からの遷移を示す遷移情報として、前記ソート部がソートした2以上の各要素情報と、当該各要素情報の遷移確率とを有する2以上の遷移情報を取得し、第二の重みつき有限状態トランスデューサ(第二WFST)を取得する第二WFST構成部と、
前記第二WFST構成部が取得した第二WFSTを用いて、予め決められた処理を行う処理部とを具備する情報処理装置。 - 前記受付部は、
2以上の各状態識別子を、順次、受け付け、
前記要素情報取得部は、
前記受付部が状態識別子を受け付けた場合に、当該状態識別子で識別されるアクティブな状態からの遷移のクラスを識別する2以上のクラス識別子を前記第一WFST格納部から直ちに取得し、当該2以上の各クラス識別子に対応する2以上の要素情報を前記クラス情報格納部から取得し、
前記第二WFST構成部は、
前記受付部が受け付けた状態識別子で識別される状態からの遷移を示す遷移情報として、前記ソート部がソートした2以上の各要素情報と、当該各要素情報の遷移確率とを有する2以上の各遷移情報を、順次、動的に取得する請求項1記載の情報処理装置。 - 前記クラス情報は、
クラス識別子と、1以上の要素情報と、当該1以上の各要素情報の重みとを有し、
前記遷移確率取得部は、
前記ソート部がソートした2以上の各要素情報に対応するクラス連鎖確率と前記2以上の各要素情報に対応する重みとを用いて、前記2以上の各要素情報の遷移確率を取得する請求項1または請求項2記載の情報処理装置。 - 前記ソート部は、
前記要素情報取得部が取得した2以上の要素情報をヒープソートのアルゴリズムによりソートする請求項1から請求項3いずれか記載の情報処理装置。 - 前記受付部は、
音声情報を受け付け、当該音声情報を1以上の状態識別子に分割し、
前記処理部は、
前記受付部が受け付けた音声情報に対して、音声認識処理を行い、音声認識処理の結果を取得し、出力する請求項1から請求項4いずれか記載の情報処理装置。 - 記録媒体に、
状態を識別する状態識別子を含む3以上の状態情報と、状態から状態への遷移を示し、遷移のクラスを識別するクラス識別子と遷移する確率を示すクラス連鎖確率とを有する2以上の遷移情報とを有する第一の重みつき有限状態トランスデューサ(第一WFST)と、
クラス識別子と当該クラス識別子で識別されるクラスに属する1以上の要素情報とを有する2以上のクラス情報を格納しており、
コンピュータを、
状態識別子を受け付ける受付部と、
前記受付部が受け付けた状態識別子で識別される状態からの遷移のクラスを識別する2以上のクラス識別子を前記記録媒体から取得し、当該2以上の各クラス識別子に対応する2以上の要素情報を前記記録媒体から取得する要素情報取得部と、
前記要素情報取得部が取得した2以上の要素情報をソートするソート部と、
前記ソート部がソートした2以上の各要素情報に対応するクラス連鎖確率を用いて、前記2以上の各要素情報の遷移確率 を取得する遷移確率取得部と、
前記受付部が受け付けた状態識別子で識別される状態からの遷移を示す遷移情報として、前記ソート部がソートした2以上の各要素情報と、当該各要素情報の遷移確率とを有する2以上の遷移情報を取得し、第二の重みつき有限状態トランスデューサ(第二WFST)を取得する第二WFST構成部と、
前記第二WFST構成部が取得した第二WFSTを用いて、予め決められた処理を行う処理部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012035867A JP5881157B2 (ja) | 2012-02-22 | 2012-02-22 | 情報処理装置、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012035867A JP5881157B2 (ja) | 2012-02-22 | 2012-02-22 | 情報処理装置、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013171214A true JP2013171214A (ja) | 2013-09-02 |
JP5881157B2 JP5881157B2 (ja) | 2016-03-09 |
Family
ID=49265155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012035867A Active JP5881157B2 (ja) | 2012-02-22 | 2012-02-22 | 情報処理装置、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5881157B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683677A (zh) * | 2015-11-06 | 2017-05-17 | 阿里巴巴集团控股有限公司 | 语音识别方法及装置 |
CN108417222A (zh) * | 2017-02-10 | 2018-08-17 | 三星电子株式会社 | 加权有限状态变换器解码系统以及语音识别系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005257910A (ja) * | 2004-03-10 | 2005-09-22 | Nippon Telegr & Teleph Corp <Ntt> | 記号列変換方法及びその記号列変換方法を用いた音声認識方法、並びに記号列変換装置及びその記号列変換装置を用いた音声認識装置 |
JP2006084942A (ja) * | 2004-09-17 | 2006-03-30 | Nippon Telegr & Teleph Corp <Ntt> | 変換情報生成方法、音素系列生成方法、音声認識方法、ならびにこれらの装置、及びプログラム |
US20070192104A1 (en) * | 2006-02-16 | 2007-08-16 | At&T Corp. | A system and method for providing large vocabulary speech processing based on fixed-point arithmetic |
JP2011113043A (ja) * | 2009-11-30 | 2011-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 重み付き有限状態トランスデューサ作成装置、作成方法及びプログラム |
-
2012
- 2012-02-22 JP JP2012035867A patent/JP5881157B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005257910A (ja) * | 2004-03-10 | 2005-09-22 | Nippon Telegr & Teleph Corp <Ntt> | 記号列変換方法及びその記号列変換方法を用いた音声認識方法、並びに記号列変換装置及びその記号列変換装置を用いた音声認識装置 |
JP2006084942A (ja) * | 2004-09-17 | 2006-03-30 | Nippon Telegr & Teleph Corp <Ntt> | 変換情報生成方法、音素系列生成方法、音声認識方法、ならびにこれらの装置、及びプログラム |
US20070192104A1 (en) * | 2006-02-16 | 2007-08-16 | At&T Corp. | A system and method for providing large vocabulary speech processing based on fixed-point arithmetic |
JP2011113043A (ja) * | 2009-11-30 | 2011-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 重み付き有限状態トランスデューサ作成装置、作成方法及びプログラム |
Non-Patent Citations (1)
Title |
---|
JPN7015003590; I. L. Hetherington: 'A multi-pass, dynamic-vocabulary approach to real-time, large-vocabulary speech recognition' Proc. Interspeech , 20050904, pp. 545-548 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683677A (zh) * | 2015-11-06 | 2017-05-17 | 阿里巴巴集团控股有限公司 | 语音识别方法及装置 |
US10741170B2 (en) | 2015-11-06 | 2020-08-11 | Alibaba Group Holding Limited | Speech recognition method and apparatus |
US11664020B2 (en) | 2015-11-06 | 2023-05-30 | Alibaba Group Holding Limited | Speech recognition method and apparatus |
CN108417222A (zh) * | 2017-02-10 | 2018-08-17 | 三星电子株式会社 | 加权有限状态变换器解码系统以及语音识别系统 |
US10714080B2 (en) | 2017-02-10 | 2020-07-14 | Samsung Electronics Co., Ltd. | WFST decoding system, speech recognition system including the same and method for storing WFST data |
CN108417222B (zh) * | 2017-02-10 | 2024-01-02 | 三星电子株式会社 | 加权有限状态变换器解码系统以及语音识别系统 |
Also Published As
Publication number | Publication date |
---|---|
JP5881157B2 (ja) | 2016-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6960006B2 (ja) | 会話システムにおいて意図が不明確なクエリを処理する方法およびシステム | |
JP6058807B2 (ja) | 検索クエリ情報を使用する音声認識処理のための方法およびシステム | |
JP5459214B2 (ja) | 言語モデル作成装置、言語モデル作成方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
US8849665B2 (en) | System and method of providing machine translation from a source language to a target language | |
JP4901155B2 (ja) | 音声認識装置が使用するのに適した文法を生成するための方法、媒体、およびシステム | |
US9594744B2 (en) | Speech transcription including written text | |
JP6019604B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
US9972314B2 (en) | No loss-optimization for weighted transducer | |
KR20210138776A (ko) | 엔드-투-엔드 모델들에서 교차-언어 음성 인식을 위한 음소-기반 컨텍스트화 | |
CN108564944B (zh) | 智能控制方法、系统、设备及存储介质 | |
JP2013109061A (ja) | 音声データ検索システムおよびそのためのプログラム | |
JP2011164336A (ja) | 音声認識装置、重みベクトル学習装置、音声認識方法、重みベクトル学習方法、プログラム | |
JP2010139745A (ja) | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム | |
JP2012177815A (ja) | 音響モデル学習装置、および音響モデル学習方法 | |
JP5881157B2 (ja) | 情報処理装置、およびプログラム | |
JP5766152B2 (ja) | 言語モデル生成装置、その方法及びプログラム | |
JP6193726B2 (ja) | 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体 | |
JP2015084047A (ja) | 文集合作成装置、文集合作成方法および文集合作成プログラム | |
JP7348447B2 (ja) | テキストベースの話者変更検出を活用した話者ダイアライゼーション補正方法およびシステム | |
JP2004348552A (ja) | 音声文書検索装置および方法およびプログラム | |
JP5875569B2 (ja) | 音声認識装置とその方法とプログラムとその記録媒体 | |
Sproat et al. | Applications of lexicographic semirings to problems in speech and language processing | |
JP6179884B2 (ja) | Wfst作成装置、音声認識装置、音声翻訳装置、wfst作成方法、およびプログラム | |
US20220319494A1 (en) | End to end spoken language understanding model | |
US20240161729A1 (en) | Speech synthesis utilizing audio waveform difference signal(s) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151211 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5881157 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |