JP5961532B2 - 辞書・言語モデル圧縮方法とその装置とプログラム - Google Patents
辞書・言語モデル圧縮方法とその装置とプログラム Download PDFInfo
- Publication number
- JP5961532B2 JP5961532B2 JP2012249506A JP2012249506A JP5961532B2 JP 5961532 B2 JP5961532 B2 JP 5961532B2 JP 2012249506 A JP2012249506 A JP 2012249506A JP 2012249506 A JP2012249506 A JP 2012249506A JP 5961532 B2 JP5961532 B2 JP 5961532B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- dictionary
- entry
- language model
- change amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
Claims (5)
- 言語モデルの言語エントリを削除した場合のエントロピー変化量を1-gram確率にまで拡張して求め、辞書を構成する単語の1-gram確率に関するエントロピー変化量がしきい値以下の場合に該当する言語エントリを削除対象言語エントリとし、該当する単語を削除対象単語とするエントロピー変化量計算過程と、
上記削除対象言語エントリを上記言語モデルから削除する言語モデル圧縮処理過程と、
上記削除対象単語を上記辞書から削除する辞書圧縮処理過程と、
を備える辞書・言語モデル圧縮方法。 - 請求項1に記載した辞書・言語モデル圧縮方法において、
上記エントロピー変化量計算過程は、
言語モデルを参照してN-gram確率における或る言語エントリを削除した場合のエントロピー変化量を、上記言語エントリに対応する(N−1)-gramの言語エントリの確率にバックオフ係数αを乗じた確率を代用した場合の変化量として求め、当該エントロピー変化量が、しきい値以下である上記言語エントリを削除対象言語エントリとして言語モデル圧縮処理部に出力する処理を全ての言語エントリに対して行う言語エントリ削除ステップと、
辞書を参照し、上記言語モデルの1-gram確率の或る言語エントリを削除した場合のエントロピー変化量を、上記辞書の単語数の逆数を確率値として代用した場合の変化量として求め、当該エントロピー変化量が、しきい値以下である1-gram確率の言語エントリを上記削除対象言語エントリとすると共に、該当する単語を削除対象単語として辞書圧縮処理部に出力する処理を全ての1-gram確率に対して行う辞書単語削除ステップと、
を含むことを特徴とする辞書・言語モデル圧縮方法。 - 言語モデルの言語エントリを削除した場合のエントロピー変化量を1-gram確率にまで拡張して求め、辞書を構成する単語の1-gram確率に関するエントロピー変化量がしきい値以下の場合に該当する言語エントリを削除対象言語エントリとし、該当する単語を削除対象単語とするエントロピー変化量計算部と、
上記削除対象言語エントリを上記言語モデルから削除する言語モデル圧縮処理部と、
上記削除対象単語を上記辞書から削除する辞書圧縮処理部と、
を具備する辞書・言語モデル圧縮装置。 - 請求項3に記載した辞書・言語モデル圧縮装置において、
上記エントロピー変化量計算部は、
言語モデルを参照してN-gram確率における或る言語エントリを削除した場合のエントロピー変化量を、上記言語エントリに対応する(N−1)-gramの言語エントリの確率にバックオフ係数αを乗じた確率を代用した場合の変化量として求め、当該エントロピー変化量が、しきい値以下である上記言語エントリを削除対象言語エントリとして言語モデル圧縮処理部に出力する処理を全ての言語エントリに対して行う言語エントリ削除手段と、
辞書を参照し、上記言語モデルの1-gram確率の或る言語エントリを削除した場合のエントロピー変化量を、上記辞書の単語数の逆数を確率値として代用した場合の変化量として求め、当該エントロピー変化量が、しきい値以下である1-gram確率の言語エントリを上記削除対象言語エントリとすると共に、該当する単語を削除対象単語として辞書圧縮処理部に出力する処理を全ての1-gram確率に対して行う辞書単語削除手段と、
を備えることを特徴とする辞書・言語モデル圧縮装置。 - 請求項3又は4に記載した辞書・言語モデル圧縮装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012249506A JP5961532B2 (ja) | 2012-11-13 | 2012-11-13 | 辞書・言語モデル圧縮方法とその装置とプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012249506A JP5961532B2 (ja) | 2012-11-13 | 2012-11-13 | 辞書・言語モデル圧縮方法とその装置とプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014098760A JP2014098760A (ja) | 2014-05-29 |
JP5961532B2 true JP5961532B2 (ja) | 2016-08-02 |
Family
ID=50940820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012249506A Expired - Fee Related JP5961532B2 (ja) | 2012-11-13 | 2012-11-13 | 辞書・言語モデル圧縮方法とその装置とプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5961532B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11620435B2 (en) | 2019-10-10 | 2023-04-04 | International Business Machines Corporation | Domain specific model compression |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110705279A (zh) * | 2018-07-10 | 2020-01-17 | 株式会社理光 | 一种词汇表的选择方法、装置及计算机可读存储介质 |
CN109448706A (zh) * | 2018-12-12 | 2019-03-08 | 苏州思必驰信息科技有限公司 | 神经网络语言模型压缩方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10301596A (ja) * | 1997-04-24 | 1998-11-13 | Nippon Telegr & Teleph Corp <Ntt> | 統計的言語モデル圧縮方法 |
JP4947545B2 (ja) * | 2006-08-30 | 2012-06-06 | 株式会社国際電気通信基礎技術研究所 | 音声認識装置及びコンピュータプログラム |
-
2012
- 2012-11-13 JP JP2012249506A patent/JP5961532B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11620435B2 (en) | 2019-10-10 | 2023-04-04 | International Business Machines Corporation | Domain specific model compression |
Also Published As
Publication number | Publication date |
---|---|
JP2014098760A (ja) | 2014-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9934778B2 (en) | Conversion of non-back-off language models for efficient speech decoding | |
JP5331801B2 (ja) | 言語モデル先読み確率を計算する方法および装置 | |
JP5212910B2 (ja) | 音声認識装置、音声認識方法、および音声認識用プログラム | |
Arısoy et al. | Converting neural network language models into back-off language models for efficient decoding in automatic speech recognition | |
JP5434587B2 (ja) | 音声合成装置及び方法とプログラム | |
JP5790646B2 (ja) | パープレキシティ算出装置 | |
JP5961532B2 (ja) | 辞書・言語モデル圧縮方法とその装置とプログラム | |
JP5319141B2 (ja) | 言語モデルの枝刈り方法及び装置 | |
JP4822829B2 (ja) | 音声認識装置および方法 | |
JP6301794B2 (ja) | オートマトン変形装置、オートマトン変形方法およびプログラム | |
JP2015084047A (ja) | 文集合作成装置、文集合作成方法および文集合作成プログラム | |
KR102067973B1 (ko) | 음소열의 편집 거리를 이용한 웨이크업 단어 선정 방법 | |
JP5980101B2 (ja) | 音響モデル学習用テキスト作成装置とその方法とプログラム | |
JP6549064B2 (ja) | 音声認識装置、音声認識方法、プログラム | |
JP6353408B2 (ja) | 言語モデル適応装置、言語モデル適応方法、プログラム | |
JP7028203B2 (ja) | 音声認識装置、音声認識方法、プログラム | |
JP4194433B2 (ja) | 尤度算出装置および方法 | |
JP3969079B2 (ja) | 音声認識装置および方法、記録媒体、並びにプログラム | |
JP5349193B2 (ja) | 言語モデル圧縮装置、言語モデルのアクセス装置、言語モデル圧縮方法、言語モデルのアクセス方法、言語モデル圧縮プログラム、言語モデルのアクセスプログラム | |
JP6588933B2 (ja) | 言語モデル構築装置、その方法、及びプログラム | |
JP6121313B2 (ja) | ポーズ推定装置、方法、プログラム | |
JP6078435B2 (ja) | 記号列変換方法、音声認識方法、それらの装置及びプログラム | |
JP5610304B2 (ja) | モデルパラメータ配列装置とその方法とプログラム | |
JP5755603B2 (ja) | 言語モデル作成装置、言語モデル作成方法、プログラム | |
JP7160170B2 (ja) | 音声認識装置、音声認識学習装置、音声認識方法、音声認識学習方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160627 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5961532 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |