JP6003127B2 - 言語モデル作成プログラム及び言語モデル作成装置 - Google Patents
言語モデル作成プログラム及び言語モデル作成装置 Download PDFInfo
- Publication number
- JP6003127B2 JP6003127B2 JP2012062373A JP2012062373A JP6003127B2 JP 6003127 B2 JP6003127 B2 JP 6003127B2 JP 2012062373 A JP2012062373 A JP 2012062373A JP 2012062373 A JP2012062373 A JP 2012062373A JP 6003127 B2 JP6003127 B2 JP 6003127B2
- Authority
- JP
- Japan
- Prior art keywords
- morpheme
- reading
- extraction means
- extracting
- vowel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素から、前記第1の読みと読みが完全一致する第3の形態素を抽出する読み一致形態素抽出手段と、
前記第1の形態素と前記第3の形態素に対し共通に左側に接続できる第4の形態素を抽出する左接続形態素抽出手段と、
前記第4の形態素及び前記第1の形態素を順に並べたものと前記第4の形態素及び前記第3の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成プログラム。
形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素のうち、当該第2の形態素の読みの先頭から、前記第1の読みを削除したものが前記第1の形態素に接続できる形態素を第5の形態素として抽出する右接続形態素抽出手段と、
前記第1の形態素と前記第5の形態素に対し共通に左側に接続できる第6の形態素を抽出する左接続形態素抽出手段と、
前記第6の形態素、前記第1の形態素、前記第5の形態素の読みの先頭から前記第1の読みを削除したものを順に並べたものと前記第6の形態素及び前記第5の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成プログラム。
前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素から、前記第1の読みと読みが完全一致する第3の形態素を抽出する読み一致形態素抽出手段と、
前記第1の形態素と前記第3の形態素に対し共通に左側に接続できる第4の形態素を抽出する左接続形態素抽出手段と、
前記第4の形態素及び前記第1の形態素を順に並べたものと前記第4の形態素及び前記第3の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成装置。
前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素のうち、当該第2の形態素の読みから、前記第1の読みを削除したものが前記第1の形態素に接続できる形態素を第5の形態素として抽出する右接続形態素抽出手段と、
前記第1の形態素と前記第5の形態素に対し共通に左側に接続できる第6の形態素を抽出する左接続形態素抽出手段と、
前記第6の形態素、前記第1の形態素、前記第5の形態素の読みの先頭から前記第1の読みを削除したものを順に並べたものと前記第6の形態素及び前記第5の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成装置。
図1は、本発明の実施の形態に係る言語モデル作成装置の構成例を示す概略ブロック図である。
以下に、言語モデル作成装置1の動作を図1〜5を参照しつつ、(1)パターン1、(2)パターン2に分けて説明する。
図2(a)〜(d)は、言語モデル作成装置1のパターン1の動作例を説明するための図である。また、図4は、言語モデル作成装置1のパターン1の動作例を示すフローチャートである。
図3(a)〜(f)は、言語モデル作成装置1のパターン2の動作例を説明するための図である。また、図5は、言語モデル作成装置1のパターン2の動作例を示すフローチャートである。
以下、上に説明した言語モデル作成装置1によって得られた曖昧性含有形態素リスト112を用いて音声認識を行うための構成及び動作について説明する。
まず、音声認識装置3の音声情報受付手段4は、WAVファイル等の音声情報を受け付ける。
上記したパターン1又はパターン2により形態素の並びを抽出することで、母音が連続した場合に生じる曖昧性や、母音が認識されない場合に生じる曖昧性等を含有する形態素の並びを抽出することができ、これらを含む文を言語モデルに追加することで、母音の発声に伴う言語の曖昧性を考慮した言語モデルを作成することができる。
なお、本発明は、上記実施の形態に限定されず、本発明の要旨を逸脱しない範囲で種々な変形が可能である。例えば、単語の結合によって母音の結合が起こる場合としては、「パターン1」及び「パターン2」で説明した、助詞+動詞の組み合わせの他、名詞+助詞(「三重へ」と「三重」の曖昧性)、名詞+名詞、副詞+動詞、副詞+名詞、用言連用形+動詞、助詞+副詞、助詞+名詞(「を沖田」と「を北」の曖昧性)、助詞+形容詞等が挙げられる。
2 コーパス
3 音声認識装置
4 音声情報受付手段
5 特徴量抽出手段
6 デコーダ
7 曖昧性出力手段
8 テキスト情報出力手段
10 制御部
11 記憶部
12 通信部
60 音響モデル
61 単語辞書
62 言語モデル
100 母音形態素抽出手段
101 読み形態素抽出手段
102 一致形態素抽出手段
103 右接続形態素抽出手段
104 左接続形態素抽出手段
105 曖昧性含有形態素抽出手段
110 言語モデル作成プログラム
111 形態素解析辞書
112 曖昧性含有形態素リスト
Claims (4)
- コンピュータを、
形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素から、前記第1の読みと読みが完全一致する第3の形態素を抽出する読み一致形態素抽出手段と、
前記第1の形態素と前記第3の形態素に対し共通に左側に接続できる第4の形態素を抽出する左接続形態素抽出手段と、
前記第4の形態素及び前記第1の形態素を順に並べたものと前記第4の形態素及び前記第3の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成プログラム。 - コンピュータを、
形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素のうち、当該第2の形態素の読みの先頭から、前記第1の読みを削除したものが前記第1の形態素に接続できる形態素を第5の形態素として抽出する右接続形態素抽出手段と、
前記第1の形態素と前記第5の形態素に対し共通に左側に接続できる第6の形態素を抽出する左接続形態素抽出手段と、
前記第6の形態素、前記第1の形態素、前記第5の形態素の読みの先頭から前記第1の読みを削除したものを順に並べたものと前記第6の形態素及び前記第5の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成プログラム。 - 形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素から、前記第1の読みと読みが完全一致する第3の形態素を抽出する読み一致形態素抽出手段と、
前記第1の形態素と前記第3の形態素に対し共通に左側に接続できる第4の形態素を抽出する左接続形態素抽出手段と、
前記第4の形態素及び前記第1の形態素を順に並べたものと前記第4の形態素及び前記第3の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成装置。 - 形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記第1の形態素の先頭の母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素のうち、当該第2の形態素の読みから、前記第1の読みを削除したものが前記第1の形態素に接続できる形態素を第5の形態素として抽出する右接続形態素抽出手段と、
前記第1の形態素と前記第5の形態素に対し共通に左側に接続できる第6の形態素を抽出する左接続形態素抽出手段と、
前記第6の形態素、前記第1の形態素、前記第5の形態素の読みの先頭から前記第1の読みを削除したものを順に並べたものと前記第6の形態素及び前記第5の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012062373A JP6003127B2 (ja) | 2012-03-19 | 2012-03-19 | 言語モデル作成プログラム及び言語モデル作成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012062373A JP6003127B2 (ja) | 2012-03-19 | 2012-03-19 | 言語モデル作成プログラム及び言語モデル作成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013195685A JP2013195685A (ja) | 2013-09-30 |
JP6003127B2 true JP6003127B2 (ja) | 2016-10-05 |
Family
ID=49394705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012062373A Expired - Fee Related JP6003127B2 (ja) | 2012-03-19 | 2012-03-19 | 言語モデル作成プログラム及び言語モデル作成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6003127B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106023986B (zh) * | 2016-05-05 | 2019-08-30 | 河南理工大学 | 一种基于声效模式检测的语音识别方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0553597A (ja) * | 1991-06-12 | 1993-03-05 | Ricoh Co Ltd | 音声認識装置およびパターン比較方法 |
JPH0950292A (ja) * | 1995-05-31 | 1997-02-18 | Ricoh Co Ltd | 音声認識装置 |
JPH09116648A (ja) * | 1995-10-20 | 1997-05-02 | Meidensha Corp | 携帯用通信装置 |
JP4520555B2 (ja) * | 1999-09-09 | 2010-08-04 | クラリオン株式会社 | 音声認識装置および音声認識ナビゲーション装置 |
JP2001083982A (ja) * | 1999-09-09 | 2001-03-30 | Xanavi Informatics Corp | 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置 |
JP2003150188A (ja) * | 2001-08-31 | 2003-05-23 | Hiraiwa Tekkosho:Kk | 聴覚障害者用対話支援装置 |
JP3982289B2 (ja) * | 2002-03-13 | 2007-09-26 | 日産自動車株式会社 | 音声認識装置 |
JP2005189846A (ja) * | 2003-12-05 | 2005-07-14 | Ihm:Kk | 音声制御スクリーンシステム |
JP2005257954A (ja) * | 2004-03-10 | 2005-09-22 | Nec Corp | 音声検索装置、音声検索方法および音声検索プログラム |
JP4736478B2 (ja) * | 2005-03-07 | 2011-07-27 | 日本電気株式会社 | 音声書き起こし支援装置およびその方法ならびにプログラム |
JP2007333778A (ja) * | 2006-06-12 | 2007-12-27 | Toshiichi Shinshi | 商品売買システムとそれを実現するためのコンピュータプログラムとその方法 |
-
2012
- 2012-03-19 JP JP2012062373A patent/JP6003127B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013195685A (ja) | 2013-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5318230B2 (ja) | 認識辞書作成装置及び音声認識装置 | |
JP4791984B2 (ja) | 入力された音声を処理する装置、方法およびプログラム | |
JP5207642B2 (ja) | 語句として新たに認識するべき文字列を取得するためのシステム、方法及びコンピュータプログラム | |
JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
US8015011B2 (en) | Generating objectively evaluated sufficiently natural synthetic speech from text by using selective paraphrases | |
TWI532035B (zh) | 語言模型的建立方法、語音辨識方法及電子裝置 | |
US8504367B2 (en) | Speech retrieval apparatus and speech retrieval method | |
TW546631B (en) | Disambiguation language model | |
CN108140019B (zh) | 语言模型生成装置、语言模型生成方法以及记录介质 | |
JP6245846B2 (ja) | 音声認識における読み精度を改善するシステム、方法、およびプログラム | |
JP7092953B2 (ja) | エンドツーエンドモデルによる多言語音声認識のための音素に基づく文脈解析 | |
JP2012063536A (ja) | 端末装置、音声認識方法および音声認識プログラム | |
US20090138266A1 (en) | Apparatus, method, and computer program product for recognizing speech | |
GB2557714A (en) | Determining phonetic relationships | |
EP2595144B1 (en) | Voice data retrieval system and program product therefor | |
JP2017009842A (ja) | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム | |
JP2008243080A (ja) | 音声を翻訳する装置、方法およびプログラム | |
JP4758758B2 (ja) | 辞書作成装置および辞書作成プログラム | |
JP7110055B2 (ja) | 音声合成システム、及び音声合成装置 | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
JP2012003090A (ja) | 音声認識装置および音声認識方法 | |
JP2015084047A (ja) | 文集合作成装置、文集合作成方法および文集合作成プログラム | |
JP6003127B2 (ja) | 言語モデル作成プログラム及び言語モデル作成装置 | |
JP2013061591A (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP6619932B2 (ja) | 形態素解析装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160322 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160607 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6003127 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |