JP2013195685A - 言語モデル作成プログラム、言語モデル作成装置及び音声認識装置 - Google Patents
言語モデル作成プログラム、言語モデル作成装置及び音声認識装置 Download PDFInfo
- Publication number
- JP2013195685A JP2013195685A JP2012062373A JP2012062373A JP2013195685A JP 2013195685 A JP2013195685 A JP 2013195685A JP 2012062373 A JP2012062373 A JP 2012062373A JP 2012062373 A JP2012062373 A JP 2012062373A JP 2013195685 A JP2013195685 A JP 2013195685A
- Authority
- JP
- Japan
- Prior art keywords
- morpheme
- reading
- extraction means
- extracting
- ambiguity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】言語モデル作成装置1は、形態素解析辞書111から母音で始まる形態素Aを抽出する母音形態素抽出手段100と、形態素Aの読みから先頭の母音を削除した読みである読みaで読みが始まる形態素Bを形態素解析辞書100から抽出する読み形態素抽出手段101と、形態素Bから、読みaと読みが完全一致する形態素Cを抽出する読み一致形態素抽出手段102と、形態素Aと形態素Cに対し共通に左側に接続できる形態素Eを抽出する左接続形態素抽出手段104と、形態素E及び形態素Aを順に並べたものと形態素E及び形態素Cを順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段105とを有する。
【選択図】図1
Description
形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素から、前記第1の読みと読みが完全一致する第3の形態素を抽出する読み一致形態素抽出手段と、
前記第1の形態素と前記第3の形態素に対し共通に左側に接続できる第4の形態素を抽出する左接続形態素抽出手段と、
前記第4の形態素及び前記第1の形態素を順に並べたものと前記第4の形態素及び前記第3の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成プログラム。
形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素のうち、当該第2の形態素の読みの先頭から前記第1の読みを削除したものが前記第1の形態素の右側に接続できる形態素を、第5の形態素として抽出する右接続形態素抽出手段と、
前記第1の形態素と前記第5の形態素に対し共通に左側に接続できる第6の形態素を抽出する左接続形態素抽出手段と、
前記第6形態素、前記第1の形態素及び前記第5の形態素から前記第1の読みを削除したものを順に並べたものと前記第6の形態素及び前記第5の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成プログラム。
前記第1の形態素の読みから前記母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素から、前記第1の読みと読みが完全一致する第3の形態素を抽出する読み一致形態素抽出手段と、
前記第1の形態素と前記第3の形態素に対し共通に左側に接続できる第4の形態素を抽出する左接続形態素抽出手段と、
前記第4の形態素及び前記第1の形態素を順に並べたものと前記第4の形態素及び前記第3の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成装置。
前記第1の形態素の読みから前記母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素のうち、当該第2の形態素の読みの先頭から、前記第1の読みを削除したものが前記第1の形態素に接続できる形態素を第5の形態素として抽出する右接続形態素抽出手段と、
前記第1の形態素と前記第5の形態素に対し共通に左側に接続できる第6の形態素を抽出する左接続形態素抽出手段と、
前記第6形態素、前記第1の形態素及び前記第5の形態素から前記第1の読みを削除したものを順に並べたものと前記第6の形態素及び前記第5の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成装置。
前記特徴量抽出手段が抽出した前記特徴量を音響モデルに基づいて音素へ変換し、音素の並びを単語辞書に基づいて単語の候補へ変換し、単語の候補の並びを言語モデルに基づいて一の単語の並びに確定し、テキスト情報に変換するデコーダと、
前記単語の候補の並びが、前記[3]又は[4]に記載の言語モデル作成装置が抽出した前記曖昧性を含有する形態素の並びと一致した場合、当該単語の候補の並びに曖昧性がある旨を出力する曖昧性出力手段とを有する音声認識装置。
図1は、本発明の実施の形態に係る言語モデル作成装置の構成例を示す概略ブロック図である。
以下に、言語モデル作成装置1の動作を図1〜5を参照しつつ、(1)パターン1、(2)パターン2に分けて説明する。
図2(a)〜(d)は、言語モデル作成装置1のパターン1の動作例を説明するための図である。また、図4は、言語モデル作成装置1のパターン1の動作例を示すフローチャートである。
図3(a)〜(f)は、言語モデル作成装置1のパターン2の動作例を説明するための図である。また、図5は、言語モデル作成装置1のパターン2の動作例を示すフローチャートである。
以下、上に説明した言語モデル作成装置1によって得られた曖昧性含有形態素リスト112を用いて音声認識を行うための構成及び動作について説明する。
まず、音声認識装置3の音声情報受付手段4は、WAVファイル等の音声情報を受け付ける。
上記したパターン1又はパターン2により形態素の並びを抽出することで、母音が連続した場合に生じる曖昧性や、母音が認識されない場合に生じる曖昧性等を含有する形態素の並びを抽出することができ、これらを含む文を言語モデルに追加することで、母音の発声に伴う言語の曖昧性を考慮した言語モデルを作成することができる。
なお、本発明は、上記実施の形態に限定されず、本発明の要旨を逸脱しない範囲で種々な変形が可能である。例えば、単語の結合によって母音の結合が起こる場合としては、「パターン1」及び「パターン2」で説明した、助詞+動詞の組み合わせの他、名詞+助詞(「三重へ」と「三重」の曖昧性)、名詞+名詞、副詞+動詞、副詞+名詞、用言連用形+動詞、助詞+副詞、助詞+名詞(「を沖田」と「を北」の曖昧性)、助詞+形容詞等が挙げられる。
2 コーパス
3 音声認識装置
4 音声情報受付手段
5 特徴量抽出手段
6 デコーダ
7 曖昧性出力手段
8 テキスト情報出力手段
10 制御部
11 記憶部
12 通信部
60 音響モデル
61 単語辞書
62 言語モデル
100 母音形態素抽出手段
101 読み形態素抽出手段
102 一致形態素抽出手段
103 右接続形態素抽出手段
104 左接続形態素抽出手段
105 曖昧性含有形態素抽出手段
110 言語モデル作成プログラム
111 形態素解析辞書
112 曖昧性含有形態素リスト
Claims (5)
- コンピュータを、
形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素から、前記第1の読みと読みが完全一致する第3の形態素を抽出する読み一致形態素抽出手段と、
前記第1の形態素と前記第3の形態素に対し共通に左側に接続できる第4の形態素を抽出する左接続形態素抽出手段と、
前記第4の形態素及び前記第1の形態素を順に並べたものと前記第4の形態素及び前記第3の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成プログラム。 - コンピュータを、
形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素のうち、当該第2の形態素の読みの先頭から、前記第1の読みを削除したものが前記第1の形態素に接続できる形態素を第5の形態素として抽出する右接続形態素抽出手段と、
前記第1の形態素と前記第5の形態素に対し共通に左側に接続できる第6の形態素を抽出する左接続形態素抽出手段と、
前記第6形態素、前記第1の形態素及び前記第5の形態素から前記第1の読みを削除したものを順に並べたものと前記第6の形態素及び前記第5の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成プログラム。 - 形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素から、前記第1の読みと読みが完全一致する第3の形態素を抽出する読み一致形態素抽出手段と、
前記第1の形態素と前記第3の形態素に対し共通に左側に接続できる第4の形態素を抽出する左接続形態素抽出手段と、
前記第4の形態素及び前記第1の形態素を順に並べたものと前記第4の形態素及び前記第3の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成装置。 - 形態素解析辞書から母音で始まる第1の形態素を抽出する母音形態素抽出手段と、
前記第1の形態素の読みから前記母音を削除した読みである第1の読みで読みが始まる第2の形態素を前記形態素解析辞書から抽出する読み形態素抽出手段と、
前記読み形態素抽出手段が抽出した前記第2の形態素のうち、当該第2の形態素の読みから、前記第1の読みを削除したものが前記第1の形態素に接続できる形態素を第5の形態素として抽出する右接続形態素抽出手段と、
前記第1の形態素と前記第5の形態素に対し共通に左側に接続できる第6の形態素を抽出する左接続形態素抽出手段と、
前記第6形態素、前記第1の形態素及び前記第5の形態素から前記第1の読みを削除したものを順に並べたものと前記第6の形態素及び前記第5の形態素を順に並べたものの組み合わせを曖昧性を含有する形態素の並びとして抽出する曖昧性含有形態素抽出手段として機能させるための言語モデル作成装置。 - 音声情報から特徴量を抽出する特徴量抽出手段と、
前記特徴量抽出手段が抽出した前記特徴量を音響モデルに基づいて音素へ変換し、音素の並びを単語辞書に基づいて単語の候補へ変換し、単語の候補の並びを言語モデルに基づいて一の単語の並びに確定し、テキスト情報に変換するデコーダと、
前記単語の候補の並びが、請求項3又は請求項4に記載の言語モデル作成装置が抽出した前記曖昧性を含有する形態素の並びと一致した場合、当該単語の候補の並びに曖昧性がある旨を出力する曖昧性出力手段とを有する音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012062373A JP6003127B2 (ja) | 2012-03-19 | 2012-03-19 | 言語モデル作成プログラム及び言語モデル作成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012062373A JP6003127B2 (ja) | 2012-03-19 | 2012-03-19 | 言語モデル作成プログラム及び言語モデル作成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013195685A true JP2013195685A (ja) | 2013-09-30 |
JP6003127B2 JP6003127B2 (ja) | 2016-10-05 |
Family
ID=49394705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012062373A Expired - Fee Related JP6003127B2 (ja) | 2012-03-19 | 2012-03-19 | 言語モデル作成プログラム及び言語モデル作成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6003127B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106023986A (zh) * | 2016-05-05 | 2016-10-12 | 河南理工大学 | 一种基于声效模式检测的语音识别方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0553597A (ja) * | 1991-06-12 | 1993-03-05 | Ricoh Co Ltd | 音声認識装置およびパターン比較方法 |
JPH0950292A (ja) * | 1995-05-31 | 1997-02-18 | Ricoh Co Ltd | 音声認識装置 |
JPH09116648A (ja) * | 1995-10-20 | 1997-05-02 | Meidensha Corp | 携帯用通信装置 |
JP2001083983A (ja) * | 1999-09-09 | 2001-03-30 | Xanavi Informatics Corp | 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置 |
JP2001083982A (ja) * | 1999-09-09 | 2001-03-30 | Xanavi Informatics Corp | 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置 |
JP2003150188A (ja) * | 2001-08-31 | 2003-05-23 | Hiraiwa Tekkosho:Kk | 聴覚障害者用対話支援装置 |
JP2003271192A (ja) * | 2002-03-13 | 2003-09-25 | Nissan Motor Co Ltd | 音声認識装置 |
JP2005189846A (ja) * | 2003-12-05 | 2005-07-14 | Ihm:Kk | 音声制御スクリーンシステム |
JP2005257954A (ja) * | 2004-03-10 | 2005-09-22 | Nec Corp | 音声検索装置、音声検索方法および音声検索プログラム |
JP2006243575A (ja) * | 2005-03-07 | 2006-09-14 | Nec Corp | 音声書き起こし支援装置およびその方法ならびにプログラム |
JP2007333778A (ja) * | 2006-06-12 | 2007-12-27 | Toshiichi Shinshi | 商品売買システムとそれを実現するためのコンピュータプログラムとその方法 |
-
2012
- 2012-03-19 JP JP2012062373A patent/JP6003127B2/ja not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0553597A (ja) * | 1991-06-12 | 1993-03-05 | Ricoh Co Ltd | 音声認識装置およびパターン比較方法 |
JPH0950292A (ja) * | 1995-05-31 | 1997-02-18 | Ricoh Co Ltd | 音声認識装置 |
JPH09116648A (ja) * | 1995-10-20 | 1997-05-02 | Meidensha Corp | 携帯用通信装置 |
JP2001083983A (ja) * | 1999-09-09 | 2001-03-30 | Xanavi Informatics Corp | 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置 |
JP2001083982A (ja) * | 1999-09-09 | 2001-03-30 | Xanavi Informatics Corp | 音声認識装置、音声認識のためのデータを記録した記録媒体、および、音声認識ナビゲーション装置 |
JP2003150188A (ja) * | 2001-08-31 | 2003-05-23 | Hiraiwa Tekkosho:Kk | 聴覚障害者用対話支援装置 |
JP2003271192A (ja) * | 2002-03-13 | 2003-09-25 | Nissan Motor Co Ltd | 音声認識装置 |
JP2005189846A (ja) * | 2003-12-05 | 2005-07-14 | Ihm:Kk | 音声制御スクリーンシステム |
JP2005257954A (ja) * | 2004-03-10 | 2005-09-22 | Nec Corp | 音声検索装置、音声検索方法および音声検索プログラム |
JP2006243575A (ja) * | 2005-03-07 | 2006-09-14 | Nec Corp | 音声書き起こし支援装置およびその方法ならびにプログラム |
JP2007333778A (ja) * | 2006-06-12 | 2007-12-27 | Toshiichi Shinshi | 商品売買システムとそれを実現するためのコンピュータプログラムとその方法 |
Non-Patent Citations (1)
Title |
---|
JPN6016010799; 關本至: '近代ギリシア語の語頭母音の脱落について' 西洋古典學研究 Vol.2, 19540620, pp.96-102, 日本西洋古典学会 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106023986A (zh) * | 2016-05-05 | 2016-10-12 | 河南理工大学 | 一种基于声效模式检测的语音识别方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6003127B2 (ja) | 2016-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4791984B2 (ja) | 入力された音声を処理する装置、方法およびプログラム | |
US8036894B2 (en) | Multi-unit approach to text-to-speech synthesis | |
KR102375115B1 (ko) | 엔드-투-엔드 모델들에서 교차-언어 음성 인식을 위한 음소-기반 컨텍스트화 | |
US20090138266A1 (en) | Apparatus, method, and computer program product for recognizing speech | |
GB2557714A (en) | Determining phonetic relationships | |
JP5753769B2 (ja) | 音声データ検索システムおよびそのためのプログラム | |
JP5524138B2 (ja) | 同義語辞書生成装置、その方法、及びプログラム | |
JP2014232268A (ja) | 音声認識における読み精度を改善するシステム、方法、およびプログラム | |
Lileikytė et al. | Conversational telephone speech recognition for Lithuanian | |
JP2017009842A (ja) | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム | |
WO2015171154A1 (en) | Methods and apparatus for speech recognition using a garbage model | |
JP2019109278A (ja) | 音声合成システム、統計モデル生成装置、音声合成装置、音声合成方法 | |
JP2008243080A (ja) | 音声を翻訳する装置、方法およびプログラム | |
JPWO2011033834A1 (ja) | 音声翻訳システム、音声翻訳方法および記録媒体 | |
JP4758758B2 (ja) | 辞書作成装置および辞書作成プログラム | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
JP5160594B2 (ja) | 音声認識装置および音声認識方法 | |
Kayte et al. | Implementation of Marathi Language Speech Databases for Large Dictionary | |
JP2020060642A (ja) | 音声合成システム、及び音声合成装置 | |
JP2013061591A (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP6003127B2 (ja) | 言語モデル作成プログラム及び言語モデル作成装置 | |
KR101333194B1 (ko) | 통계 기반의 다중 발음 사전 생성 장치 및 방법 | |
JP2011007862A (ja) | 音声認識装置、音声認識プログラム、および音声認識方法 | |
Garner et al. | Translation and prosody in Swiss languages | |
JP2004294542A (ja) | 音声認識装置及びそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160322 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160523 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160607 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6003127 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |