JP4758758B2 - 辞書作成装置および辞書作成プログラム - Google Patents
辞書作成装置および辞書作成プログラム Download PDFInfo
- Publication number
- JP4758758B2 JP4758758B2 JP2005371362A JP2005371362A JP4758758B2 JP 4758758 B2 JP4758758 B2 JP 4758758B2 JP 2005371362 A JP2005371362 A JP 2005371362A JP 2005371362 A JP2005371362 A JP 2005371362A JP 4758758 B2 JP4758758 B2 JP 4758758B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- dictionary
- words
- text data
- entropy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 150000001875 compounds Chemical class 0.000 claims abstract description 72
- 238000004364 calculation method Methods 0.000 claims description 49
- 238000004458 analytical method Methods 0.000 claims description 17
- 230000000877 morphologic effect Effects 0.000 claims description 5
- 238000000034 method Methods 0.000 description 24
- 230000000052 comparative effect Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000010365 information processing Effects 0.000 description 2
- 241000102542 Kara Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Images
Description
和田陽介、外3名、「大語彙連続音声認識における連鎖語の追加による語彙拡大の効果」、情報処理学会論文誌、社団法人情報処理学会、1999年、第40巻、第4号、p.1413−1420
[音声認識システムの構成]
図1は、本発明の実施形態に係る辞書作成装置を含む音声認識システムの構成を示す機能ブロック図である。音声認識システム1は、辞書作成処理と、この作成された辞書を用いた言語モデル作成処理と、この作成された言語モデルを用いた音声認識処理とを実行するものであって、図1に示すように、学習テキストDB10と、辞書作成装置20と、語彙DB(辞書)30と、言語モデル作成装置40と、言語モデル記憶手段50と、音響モデル記憶手段60と、音声認識装置70とを備える。
音響モデル記憶手段60は、大量の音声データの波形パターンに基づいて求められた、音声データ中の波形パターンと単語との関係を示す確率モデルの一種(音響的な特徴量)である音響モデルを音素ごとに記憶したものであって、HDD等の一般的な記録媒体である。なお、音響モデルは、例えば、隠れマルコフモデル(HMM)によるものである。
音響分析手段72は、入力装置Mから入力された音声から音素ごとの特徴量を抽出し、音響スコア計算手段73に出力するものである。ここで、音素ごとの特徴量とは、例えば、各個人で異なる声の性質を示す指標となるケプストラム距離である。また、入力装置Mは例えばマイクである。
図2は、図1に示した辞書作成装置の構成を示す機能ブロック図である。
辞書作成装置20は、学習テキストDB10から単語列を複数選択し、選択した複数の単語列の中から最適な単語列を複合語として辞書30に登録するために、図2に示すように、出現頻度計算手段21と、エントロピー計算手段22と、語彙更新手段(辞書更新手段)23と、判別手段24と、学習テキスト更新手段(テキストデータ更新手段)25とを備えている。
まず、エントロピー計算手段22に入力される単語ペア(複合語候補)について、N個のうちのi番目の単語ペアを、2つの単語とみなしたときに(前の単語をWord a、後ろの単語をWord bとみなしたときに)「ωai ωbi」で表記することとし、また、1つの単語とみなしたときに(combinationしたときに)「ci」で表記することとする。
次に、図3を参照(適宜図1参照)して、図1に示した音声認識システム1の動作について説明する。図3は、図1に示した音声認識システムの動作を示すフローチャートであって、(a)は言語モデル作成処理、(b)は音声認識処理を示している。
次に、図4を参照(適宜図2参照)して、辞書作成装置20の動作(音声認識システム1の言語モデル作成処理におけるステップS1の処理)について説明する。図4は、図2に示した辞書作成装置の動作を示すフローチャートである。前提として、辞書作成装置20には、追加すべき複合語の個数「M」が、予め図示しない入力手段によって入力されるか、または、図示しない記憶手段に記憶されている。
次に、図5を参照(適宜図2参照)して、辞書作成装置20の具体的な辞書作成例を説明する。図5は、図2に示した辞書作成装置の動作の具体例を示す説明図であって、(a)は更新前の学習テキストの例、(b)はエントロピーの差分の例、(c)は更新後の学習テキストの例を示している。
音声認識システム1(図1参照)において、音声認識装置70のマイクMに入力する評価データ(入力音声)は、2004年7月1日から2004年7月21日までに複数の男性により発声されたニュース文のうち、主としてアナウンサーと記者との対談500文(7,379単語)である。音声認識装置70によって、評価データ(入力音声)がテキストデータに変換されたときの単語認識率(単語正解精度)Accuracyは、式(7)で示される。
10 学習テキストDB
20 辞書作成装置
21 出現頻度計算手段
22 エントロピー計算手段
23 語彙更新手段(辞書更新手段)
24 判別手段
25 学習テキスト更新手段(テキストデータ更新手段)
30 語彙DB(辞書)
40 言語モデル作成装置
50 言語モデル記憶手段
60 音響モデル記憶手段
70 音声認識装置
71 発音単語記憶手段
72 音響分析手段
73 音響スコア計算手段
74 言語スコア計算手段
75 単語候補検索手段
76 テキストデータ変換手段
M 入力装置
D 出力装置
Claims (3)
- 音声認識に用いられる言語モデルを作成するための辞書に属する単語を用いた文章に対して形態素解析された結果である単語区切りが予め付与されたテキストデータに基づいて、前記辞書を更新して作成する辞書作成装置であって、
前記テキストデータに出現する連続した2つ以上の単語からなる単語列の前記テキストデータにおける出現頻度を、前記テキストデータにおける所定数の前記単語列についてそれぞれ計算する出現頻度計算手段と、
この出現頻度計算手段で計算された所定数の出現頻度のうち、当該出現頻度が上位で前記所定数より少ない第2の所定数の単語列について、前記テキストデータにおいて、1つの単語列を複数の単語ω ai ,ω bi とみなしたときのエントロピーH′(c i )と、1つの単語列を1つの単語c i とみなしたときのエントロピーH(c i )との差分ΔH(c i )を以下の式(5)で計算し、前記差分ΔH(c i )が前記第2の所定数の単語列の中で最大となる単語列を抽出するエントロピー計算手段と、
このエントロピー計算手段で抽出された単語列を1つの単語とみなした複合語として前記辞書に追加して、当該辞書を更新する辞書更新手段と、
前記辞書更新手段によって辞書に追加された複合語の個数が第3の所定数であるか否かを判別し、追加された前記複合語の個数が前記第3の所定数に達していない場合、前記テキストデータの更新を指示する判別手段と、
前記判別手段から更新を指示された場合、前記辞書更新手段で更新された辞書、または、前記エントロピー計算手段で抽出された単語列に基づいて、前記テキストデータに付与された前記単語区切りを更新するテキストデータ更新手段と、
を備えることを特徴とした辞書作成装置。
- 前記テキストデータは、前記単語区切りと共に、係り受け解析された結果である文節区切りをさらに予め付与され、
前記出現頻度計算手段は、前記単語列として、文節の境界を含まないものを選択することを特徴とする請求項1に記載の辞書作成装置。 - 音声認識に用いられる言語モデルを作成するための辞書に属する単語を用いた文章に対して形態素解析された結果である単語区切りが予め付与されたテキストデータに基づいて、前記辞書を更新して作成するために、コンピュータを、
前記テキストデータに出現する連続した2つ以上の単語からなる単語列の前記テキストデータにおける出現頻度を、前記テキストデータにおける所定数の前記単語列についてそれぞれ計算する出現頻度計算手段、
この出現頻度計算手段で計算された所定数の出現頻度のうち、当該出現頻度が上位で前記所定数より少ない第2の所定数の単語列について、前記テキストデータにおいて、1つの単語列を複数の単語ω ai ,ω bi とみなしたときのエントロピーH′(c i )と、1つの単語列を1つの単語c i とみなしたときのエントロピーH(c i )との差分ΔH(c i )を以下の式(5)で計算し、前記差分ΔH(c i )が前記第2の所定数の単語列の中で最大となる単語列を抽出するエントロピー計算手段、
このエントロピー計算手段で抽出された単語列を1つの単語とみなした複合語として前記辞書に追加して、当該辞書を更新する辞書更新手段、
前記辞書更新手段によって辞書に追加された複合語の個数が第3の所定数であるか否かを判別し、追加された前記複合語の個数が前記第3の所定数に達していない場合、前記テキストデータの更新を指示する判別手段、
前記判別手段から更新を指示された場合、前記辞書更新手段で更新された辞書、または、前記エントロピー計算手段で抽出された単語列に基づいて、前記テキストデータに付与された前記単語区切りを更新するテキストデータ更新手段、
として機能させることを特徴とする辞書作成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005371362A JP4758758B2 (ja) | 2005-12-26 | 2005-12-26 | 辞書作成装置および辞書作成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005371362A JP4758758B2 (ja) | 2005-12-26 | 2005-12-26 | 辞書作成装置および辞書作成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007171724A JP2007171724A (ja) | 2007-07-05 |
JP4758758B2 true JP4758758B2 (ja) | 2011-08-31 |
Family
ID=38298345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005371362A Active JP4758758B2 (ja) | 2005-12-26 | 2005-12-26 | 辞書作成装置および辞書作成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4758758B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4446313B2 (ja) | 2006-12-15 | 2010-04-07 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声処理用の辞書に登録するべき新規語句を検索する技術 |
JP4645708B2 (ja) * | 2008-09-10 | 2011-03-09 | 株式会社デンソー | コード認識装置および経路探索装置 |
US20110144969A1 (en) | 2009-12-11 | 2011-06-16 | International Business Machines Corporation | High-Frequency Entropy Extraction From Timing Jitter |
JP6276516B2 (ja) * | 2013-05-08 | 2018-02-07 | 日本放送協会 | 辞書作成装置、及び辞書作成プログラム |
JP6300394B2 (ja) * | 2013-05-15 | 2018-03-28 | 日本放送協会 | 誤り修正モデル学習装置、及びプログラム |
CN110134767B (zh) * | 2019-05-10 | 2021-07-23 | 云知声(上海)智能科技有限公司 | 一种词汇表的筛选方法 |
JP2020201363A (ja) * | 2019-06-09 | 2020-12-17 | 株式会社Tbsテレビ | 音声認識テキストデータ出力制御装置、音声認識テキストデータ出力制御方法、及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3441400B2 (ja) * | 1998-06-04 | 2003-09-02 | 松下電器産業株式会社 | 言語変換規則作成装置、及びプログラム記録媒体 |
-
2005
- 2005-12-26 JP JP2005371362A patent/JP4758758B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2007171724A (ja) | 2007-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4791984B2 (ja) | 入力された音声を処理する装置、方法およびプログラム | |
JP5207642B2 (ja) | 語句として新たに認識するべき文字列を取得するためのシステム、方法及びコンピュータプログラム | |
JP5040909B2 (ja) | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム | |
KR100486733B1 (ko) | 음소 결합정보를 이용한 연속 음성인식방법 및 장치 | |
TWI532035B (zh) | 語言模型的建立方法、語音辨識方法及電子裝置 | |
Wang et al. | Complete recognition of continuous Mandarin speech for Chinese language with very large vocabulary using limited training data | |
Kumar et al. | Development of Indian language speech databases for large vocabulary speech recognition systems | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
US20090138266A1 (en) | Apparatus, method, and computer program product for recognizing speech | |
JP2002258890A (ja) | 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体 | |
JP6245846B2 (ja) | 音声認識における読み精度を改善するシステム、方法、およびプログラム | |
JP4758758B2 (ja) | 辞書作成装置および辞書作成プログラム | |
US20130080155A1 (en) | Apparatus and method for creating dictionary for speech synthesis | |
KR101747873B1 (ko) | 음성인식을 위한 언어모델 생성 장치 및 방법 | |
JP3415585B2 (ja) | 統計的言語モデル生成装置、音声認識装置及び情報検索処理装置 | |
JP2013125144A (ja) | 音声認識装置およびそのプログラム | |
JP5819147B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP4532862B2 (ja) | 音声合成方法、音声合成装置および音声合成プログラム | |
JP4764203B2 (ja) | 音声認識装置及び音声認識プログラム | |
Pellegrini et al. | Automatic word decompounding for asr in a morphologically rich language: Application to amharic | |
JP5124012B2 (ja) | 音声認識装置及び音声認識プログラム | |
JP2011007862A (ja) | 音声認識装置、音声認識プログラム、および音声認識方法 | |
JP6276516B2 (ja) | 辞書作成装置、及び辞書作成プログラム | |
JP2004309928A (ja) | 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム | |
KR101777141B1 (ko) | 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080606 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110603 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4758758 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140610 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |