JP2009163109A - 言語モデル生成装置及び音声認識装置 - Google Patents
言語モデル生成装置及び音声認識装置 Download PDFInfo
- Publication number
- JP2009163109A JP2009163109A JP2008002194A JP2008002194A JP2009163109A JP 2009163109 A JP2009163109 A JP 2009163109A JP 2008002194 A JP2008002194 A JP 2008002194A JP 2008002194 A JP2008002194 A JP 2008002194A JP 2009163109 A JP2009163109 A JP 2009163109A
- Authority
- JP
- Japan
- Prior art keywords
- corpus
- morpheme
- gram
- word
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】コーパスから形態素とクラスによるNグラム言語モデルを生成するNグラム言語モデル生成装置において、部分的に形態素とクラスにより系列化された第1のコーパスと、クラスに属する形態素集合の連鎖例を形態素列で記述した第2のコーパスと、第1のコーパスのクラス化列に、第2のコーパスの形態素列を埋め込み展開する単語系列展開手段とを備える。
【選択図】図2
Description
ところで、Nグラムモデルには多種のバリエーションがあるが、ここでは、特に本件と関連性のある2つの従来技術を以下に説明する。
本発明は、このような課題を解決するためになされたものである。
コーパスから形態素とクラスによるNグラム言語モデルを生成するNグラム言語モデル生成装置であって、
言語モデル生成目的の例文が部分的に形態素とクラスにより系列化された第1のコーパスと、
予め作成されたクラスに属する形態素集合の連鎖例を形態素列で記述した第2のコーパスと、
第1のコーパスのクラス化列に、第2のコーパスの形態素列を埋め込み展開する単語系列展開手段とを備える。
言語モデル生成目的の例文が部分的に形態素とクラスにより系列化された第1のコーパスと、
予め作成されたクラスに属する形態素集合の連鎖例を形態素列で記述した第2のコーパスと、
第1のコーパスのクラス化列に、第2のコーパスの形態素列を埋め込み展開する単語系列展開手段と、
単語系列展開手段の処理結果を格納する統合コーパスと、
統合コーパスを入力し、前接続と後接続の形態素が特殊表現または非特殊表現の同じ表現の接続の場合と異なる表現の接続の場合の異なる2つのバックオフ係数を格納する単語Nグラムを出力するNグラム辞書生成部と、
音声入力部でとり込まれた音声の認識を行うとき、前接の形態素により単語Nグラムに格納されたバックオフ係数を選択して認識する音声認識部と、音声認識結果を出力するデータ出力部を備える。
音声認識部で、音声入力部によりとり込まれた音声の認識を行うとき、前接の形態素により単語Nグラムに格納されたバックオフ係数を選択して認識するので、学習データ量の少ない単語列の言語尤度精度の低さを防ぐことができ、かつ、単語Nグラムと比較して言語制約が弱くなるということも防げ、さらに、特殊表現の形態素連鎖の中に一般の形態素が混合することを低減できる。
図2は、本発明の実施の形態1における言語モデル作成装置の構成図を示し、以下に説明する。第1コーパス101と第2コーパス102を特殊表現展開部103に入力する。特殊表現展開部103は、第1コーパス中にあるクラス化部分を別途入力した第2コーパス102の対応する部分に展開し、これを統合コーパス104に記録する。Nグラム辞書生成部105は統合コーパス104を入力し、単語Nグラム106を出力するものである。
第1コーパス101は、通話書き起こし作業者が作成した例文が格納されている記憶装置である。例文の格納形態は、各文をあらかじめ単語に相当する単位(以下、形態素)に分割をしておくことが望ましいが、例文をそのままで格納しておくことも可能であり、第1コーパス101から出力する際は、形態素解析などのフィルタを使用し、形態素に分割すれば良い。図3に1例を示す。発声の区切りごとに形態素の連鎖を構成する単位として格納されている。形態素は、表記、読み、品詞の3つ組から構成されている。クラス化部分が形態素連鎖に存在する場合は、3つ組みともクラス化文字列が記憶されており、部分的に形態素とクラスにより系列化されている。
このように構成することで、第1形態素列に「県内,けんない,名詞」がある場合は、第2形態素列として形態素「神奈川県,かながわけん,<県>」を含む形態素列のみ対象とすることができる。
図7は、本発明の実施の形態2における言語モデル作成装置の構成図を示し、以下に説明する。実施の形態1との違いは、第2コーパス102を構造判定部701に入力し、特定の形態素パターンのみ特殊表現展開部103に入力することにより、展開する形態素列を適切なパターンのみにするものである。
構造判定部701は、第2コーパス102に格納された形態素列をすべて探索し、連接する形態素の親子関係を調べる。(ここで形態素の親子関係とは、例えば、「神奈川県」の形態素に後接する市名形態素は「鎌倉市」と「藤沢市」の2つ以上が存在し、「鎌倉市」と「藤沢市」に前接する県名の形態素は「神奈川県」しかない場合に、この2つの連接する形態素は親子であるとする。)親子関係がないクラス化品詞をNG品詞ペアとしてピックアップし、NG品詞ペアカウントが全体の品詞ペアの一定割合を超える場合は、それらの品詞ペアを含む形態素列は除去する。このように構成することで、階層構造の強い形態素列のみを特殊表現展開部103に入力することができるため、不要な形態素列を展開しないためメモリ効率が良い。
図9は、本発明の実施の形態3における音声認識装置の構成図を示し、以下にその説明をする。言語モデル生成部分における実施の形態1との違いは、本発明の実施の形態3においては前接続と後接続の形態素が特殊表現または非特殊表現の同じ表現の接続の場合と異なる表現の接続の場合の2つのバックオフ係数を格納することである。音声認識時に、上記教科書では3グラムが存在しない場合は2グラムに、2グラムが存在しない場合は1グラムにバックオフする技術が紹介されている。一般的には上記教科書にあるようなバックオフスムージングのためのバックオフ係数を、より低位のNグラムの項目に格納しているが、Nグラム辞書生成部105において、これを、前接続と後接続の形態素が特殊表現または非特殊表現の同じ表現の接続の場合と異なる表現の接続の場合の2つのバックオフ係数を格納することが大きく異なる。これにより、前接形態素が同種である場合はバックオフ係数を大きく、異種である場合にはバックオフ係数を小さくすることで、混合誤りを低減できる。
Claims (4)
- コーパスから形態素とクラスによるNグラム言語モデルを生成するNグラム言語モデル生成装置であって、
言語モデル生成目的の例文が部分的に形態素とクラスにより系列化された第1のコーパスと、
予め作成されたクラスに属する形態素集合の連鎖例を形態素列で記述した第2のコーパスと、
第1のコーパスのクラス化列に、第2のコーパスの形態素列を埋め込み展開する単語系列展開手段と、
を備えることを特徴とする言語モデル生成装置。 - 第2のコーパスの形態素の階層構造を判定する構造判定手段を備え、
単語系列展開手段が形態素列の展開を行う際に、第1のコーパスのクラス化列を、構造判定手段からの階層構造の含有比率に基づき、第2のコーパスの形態素列に展開することを特徴とする前記請求項1に記載の言語モデル生成装置。 - 単語系列展開手段の処理結果を格納する統合コーパスと、
統合コーパスを入力し、単語Nグラムを出力するNグラム辞書生成部を備え、
Nグラム辞書生成部は、単語系列展開手段が第1のコーパスのクラス化列に、第2のコーパスの形態素列を埋め込み展開した結果の単語Nグラムに前接続と後接続の形態素が特殊表現または非特殊表現の同じ表現の接続の場合と異なる表現の接続の場合の異なる2つのバックオフ係数を格納することを特徴とする請求項1または2に記載の言語モデル生成装置。 - 言語モデル生成目的の例文が部分的に形態素とクラスにより系列化された第1のコーパスと、
予め作成されたクラスに属する形態素集合の連鎖例を形態素列で記述した第2のコーパスと、
第1のコーパスのクラス化列に、第2のコーパスの形態素列を埋め込み展開する単語系列展開手段と、
単語系列展開手段の処理結果を格納する統合コーパスと、
統合コーパスを入力し、前接続と後接続の形態素が特殊表現または非特殊表現の同じ表現の接続の場合と異なる表現の接続の場合の異なる2つのバックオフ係数を格納する単語Nグラムを出力するNグラム辞書生成部と、
音声入力部でとり込まれた音声の認識を行うとき、前接の形態素により単語Nグラムに格納されたバックオフ係数を選択して認識する音声認識部と、音声認識結果を出力するデータ出力部を備える音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008002194A JP5137588B2 (ja) | 2008-01-09 | 2008-01-09 | 言語モデル生成装置及び音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008002194A JP5137588B2 (ja) | 2008-01-09 | 2008-01-09 | 言語モデル生成装置及び音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009163109A true JP2009163109A (ja) | 2009-07-23 |
JP5137588B2 JP5137588B2 (ja) | 2013-02-06 |
Family
ID=40965772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008002194A Expired - Fee Related JP5137588B2 (ja) | 2008-01-09 | 2008-01-09 | 言語モデル生成装置及び音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5137588B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103871404A (zh) * | 2012-12-13 | 2014-06-18 | 北京百度网讯科技有限公司 | 一种语言模型的训练方法、查询方法和对应装置 |
WO2022254829A1 (ja) * | 2021-06-04 | 2022-12-08 | ソニーグループ株式会社 | 学習装置、学習方法及び学習プログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06118984A (ja) * | 1992-10-02 | 1994-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 日本語テキスト自動拡張方法 |
JP2001236088A (ja) * | 2000-02-22 | 2001-08-31 | Mitsubishi Electric Corp | 統計的言語モデル作成装置、統計的言語モデル作成方法及び統計的言語モデル作成プログラムが記述された記録媒体 |
JP2002287787A (ja) * | 2001-01-31 | 2002-10-04 | Microsoft Corp | 明確化言語モデル |
JP2004117647A (ja) * | 2002-09-25 | 2004-04-15 | Nippon Hoso Kyokai <Nhk> | クラス言語モデル生成方法、クラス言語モデル生成装置及びクラス言語モデル生成プログラム |
JP2006059105A (ja) * | 2004-08-19 | 2006-03-02 | Mitsubishi Electric Corp | 言語モデル作成装置及び方法並びにプログラム |
-
2008
- 2008-01-09 JP JP2008002194A patent/JP5137588B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06118984A (ja) * | 1992-10-02 | 1994-04-28 | Nippon Telegr & Teleph Corp <Ntt> | 日本語テキスト自動拡張方法 |
JP2001236088A (ja) * | 2000-02-22 | 2001-08-31 | Mitsubishi Electric Corp | 統計的言語モデル作成装置、統計的言語モデル作成方法及び統計的言語モデル作成プログラムが記述された記録媒体 |
JP2002287787A (ja) * | 2001-01-31 | 2002-10-04 | Microsoft Corp | 明確化言語モデル |
JP2004117647A (ja) * | 2002-09-25 | 2004-04-15 | Nippon Hoso Kyokai <Nhk> | クラス言語モデル生成方法、クラス言語モデル生成装置及びクラス言語モデル生成プログラム |
JP2006059105A (ja) * | 2004-08-19 | 2006-03-02 | Mitsubishi Electric Corp | 言語モデル作成装置及び方法並びにプログラム |
Non-Patent Citations (2)
Title |
---|
CSNJ200710007130; 花沢利行 他: '"統計言語モデルを用いた連続音声認識における単語グループ間バイグラムの削減"' 電子情報通信学会2006年総合大会講演論文集 情報・システム1 , 20060308, p.130 * |
JPN6011058792; 花沢利行 他: '"統計言語モデルを用いた連続音声認識における単語グループ間バイグラムの削減"' 電子情報通信学会2006年総合大会講演論文集 情報・システム1 , 20060308, p.130 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103871404A (zh) * | 2012-12-13 | 2014-06-18 | 北京百度网讯科技有限公司 | 一种语言模型的训练方法、查询方法和对应装置 |
CN103871404B (zh) * | 2012-12-13 | 2017-04-12 | 北京百度网讯科技有限公司 | 一种语言模型的训练方法、查询方法和对应装置 |
WO2022254829A1 (ja) * | 2021-06-04 | 2022-12-08 | ソニーグループ株式会社 | 学習装置、学習方法及び学習プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5137588B2 (ja) | 2013-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1575029B1 (en) | Generating large units of graphonemes with mutual information criterion for letter to sound conversion | |
JP6493866B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US8185376B2 (en) | Identifying language origin of words | |
US7966173B2 (en) | System and method for diacritization of text | |
US8392191B2 (en) | Chinese prosodic words forming method and apparatus | |
US20140324435A1 (en) | Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis | |
US11270687B2 (en) | Phoneme-based contextualization for cross-lingual speech recognition in end-to-end models | |
JP2000353161A (ja) | 自然言語生成における文体制御方法及び装置 | |
JP2001100781A (ja) | 音声処理装置および音声処理方法、並びに記録媒体 | |
US20070005345A1 (en) | Generating Chinese language couplets | |
EP2950306A1 (en) | A method and system for building a language model | |
WO2007097208A1 (ja) | 言語処理装置、言語処理方法および言語処理用プログラム | |
JP2010139745A (ja) | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム | |
JP4820240B2 (ja) | 単語分類装置及び音声認識装置及び単語分類プログラム | |
JP5623380B2 (ja) | 誤り文修正装置、誤り文修正方法およびプログラム | |
JP5137588B2 (ja) | 言語モデル生成装置及び音声認識装置 | |
JP2011065384A (ja) | 誤字脱字対応テキスト解析装置及び方法及びプログラム | |
JP2006031278A (ja) | 音声検索システムおよび方法ならびにプログラム | |
JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
Xuan et al. | A semi-supervised learning method for Vietnamese part-of-speech tagging | |
Vu et al. | Vietnamese automatic speech recognition: The flavor approach | |
GB2568902A (en) | System for speech evaluation | |
Sak | Integrating morphology into automatic speech recognition: morpholexical and discriminative language models for Turkish | |
JP4631076B2 (ja) | 音素単位セットを最適化する方法及びシステム | |
JP2003177786A (ja) | 言語モデル作成装置及びそれを利用した音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101109 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111031 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121016 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121113 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151122 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |