JP2999768B1 - 音声認識誤り訂正装置 - Google Patents

音声認識誤り訂正装置

Info

Publication number
JP2999768B1
JP2999768B1 JP11056910A JP5691099A JP2999768B1 JP 2999768 B1 JP2999768 B1 JP 2999768B1 JP 11056910 A JP11056910 A JP 11056910A JP 5691099 A JP5691099 A JP 5691099A JP 2999768 B1 JP2999768 B1 JP 2999768B1
Authority
JP
Japan
Prior art keywords
correction
morpheme
distance
dependency
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11056910A
Other languages
English (en)
Other versions
JP2000250589A (ja
Inventor
開 石川
英一郎 隅田
Original Assignee
株式会社エイ・ティ・アール音声翻訳通信研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社エイ・ティ・アール音声翻訳通信研究所 filed Critical 株式会社エイ・ティ・アール音声翻訳通信研究所
Priority to JP11056910A priority Critical patent/JP2999768B1/ja
Application granted granted Critical
Publication of JP2999768B1 publication Critical patent/JP2999768B1/ja
Publication of JP2000250589A publication Critical patent/JP2000250589A/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

【要約】 【課題】 訂正箇所の特定を行うことができ誤り訂正の
変換処理を行う。 【解決手段】 音声認識誤り訂正装置10は音声認識結
果の入力文に対して構造解析して解析木形式の依存構造
を生成し、各係り受けに対して係り受けに対する用例単
語と入力単語との間の意味的距離を計算ししきい値より
も大きい係り受けを含む訂正箇所を抽出する。用例文か
ら訂正箇所の文字列に編集距離の近い文字列を含む用例
文を検索し、検索された用例文の形態素列から訂正箇所
に対応する形態素部分列を抽出し訂正箇所の形態素部分
列と置き換えることにより入力文の形態素列を訂正して
訂正候補の形態素列を得る。変換辞書を用いて訂正前後
の認識結果の形態素列を音素列に変換し、訂正前の認識
結果の音素列に対する訂正候補の音素列の音韻的距離を
計算し小さい音韻的距離の訂正候補を残し、再計算され
た意味的距離がしきい値以下である訂正候補を誤り訂正
結果とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、発声音声文の音声
信号を音声認識し、その音声認識結果に対して誤り訂正
処理を行う音声認識誤り訂正装置に関する。
【0002】
【従来の技術】例えば、音声翻訳装置では、翻訳モジュ
ールは音声認識工程に帰因するエラーを含む発話を受け
入れる必要がある。従って、強力なエラー処理のフレー
ムワークの開発が、音声翻訳システムの性能を向上させ
る上で極めて重要である。
【0003】例えば、従来技術文献1「H.Saito et a
l.,”Parsing Noisy Sentences”,Proceedings of COLI
NG '88,pp.561-566,1988年」においては、音素列に対し
て誤り部分の正解仮説を生成し、構文解析結果に基づく
仮説の検証を行なうが、訂正可能な領域が局所的である
という問題点があった。
【0004】この問題点を解決するために、従来技術文
献2「脇田由実ほか,”意味的類似性を用いた後処理的
な音声認識正解部分特定法と音声翻訳手法への導入”,
人工知能学会音声言語情報処理研究会,17−4,19
97年7月18日」において、話し言葉を音声認識した
場合の誤り文の解析を目的として、音声認識処理後の結
果文から正解部分のみを特定する方法が提案されてい
る。この方法では、話し言葉の文法記述が困難であるこ
とと、音声認識用の言語処理が文の局所的な部分のみ制
約をかけていることを考慮し、用例に依存した単語間の
意味的距離と意味的距離の近さから決定された単語間の
依存関係とを用いて、音声認識の際の言語的な制約範囲
と比べてより大局的な範囲での表現の自然性を判断する
ことにより正解部分を特定している。この方法では、特
開平6−274192号公報において開示された言語構
成素境界パーザ(Constituent Boundary parser;以
下、CBパーザという。)を用いて各局部的な部分木に
ついて計算されたその意味的距離に従って判断された発
話中の高信頼部分のみを翻訳するものである。
【0005】しかしながらこの方法では、発話全体に対
する翻訳部分の再現率が低く、また翻訳が出力されない
場合がある。また、意味的距離を用いて正解部分の特定
を行なうが、認識誤りを訂正する枠組がないという問題
点があった。
【0006】この問題点を解決するために、本特許出願
人は、特願平10−275323号の特許出願におい
て、発声音声文の音声信号を音声認識し、その音声認識
結果に対して誤り訂正処理を行う音声認識誤り訂正装置
を開示している。この従来例の音声認識誤り訂正装置で
は、所定の用例文に対して所定の構造解析処理を行って
得られた用例解析木を格納する記憶手段と、上記音声認
識結果に対して所定の構造解析処理を行って入力解析木
を生成して出力する構造解析処理手段と、上記構造解析
処理手段から出力される入力解析木と、上記記憶手段に
格納された用例解析木とに基づいて、入力解析木の部分
木である各入力部分木と、用例解析木の部分木である各
用例部分木との間で音韻的に近接する部分木対を検索し
て、入力解析木と用例解析木との間の互換可能な構造に
基づいて誤り訂正処理を行って入力解析木の誤り訂正結
果を出力する誤り訂正処理手段と、上記誤り訂正処理手
段から出力される誤り訂正結果を含む発声音声文全体に
対して、単語間の類語の概念階層における位置関係に依
存して計算される意味的距離を計算することにより文全
体の大局的な妥当性を判断し、計算された意味的距離が
所定のしきい値以下のときに誤り訂正結果を含む発声音
声文の解析木を出力する意味的距離計算処理及び出力手
段とを備えたことを特徴としている。
【0007】
【発明が解決しようとする課題】しかしながら、従来例
の音声認識誤り訂正装置においては、解析木データを用
いて誤り訂正を行なうが、用例と認識結果の解析木を照
合する際、認識誤りのために構造の不一致が生じると、
適切な句構造での訂正が妨げられ、誤り訂正の変換処理
を行うことができないという問題点があった。
【0008】本発明の目的は以上の問題点を解決し、さ
らに従来例に比較して訂正箇所の特定を行うことができ
る音声認識誤り訂正装置を提供することにある。
【0009】
【課題を解決するための手段】本発明に係る請求項1記
載の音声認識誤り訂正装置は、発声音声文の音声信号を
音声認識し、その音声認識結果の入力文に対して誤り訂
正処理を行う音声認識誤り訂正装置において、学習用テ
キストデータに基づいて所定の形態素解析を予め行って
得られた品詞付き形態素列を含む用例文を記憶する記憶
手段(22)と、上記音声認識結果の入力文に対して所
定の構造解析処理を行って解析木形式の依存構造を生成
し、この際、各係り受けに対して、係り受けに対する用
例単語と入力単語との間の意味的距離を計算し、上記生
成された依存構造のすべての係り受けのうち、計算され
た意味的距離が所定の第1のしきい値よりも大きい係り
受けを含む訂正箇所を抽出する抽出手段(S1−S5)
と、上記記憶手段(22)に記憶された用例文から、上
記抽出手段(S1−S5)によって抽出された訂正箇所
の文字列との間の編集距離の比が所定の第2のしきい値
以下である文字列を含む用例文を検索し、検索された用
例文の形態素列から上記訂正箇所に対応する形態素部分
列を抽出し、抽出した用例文中の形態素部分列を上記訂
正箇所の形態素部分列と置き換えることにより、入力文
の形態素列を訂正して訂正候補の形態素列を得る検索置
換手段(S6,S7)と、単語から音素列への所定の変
換辞書を用いて、上記検索置換手段(S6,S7)によ
る訂正前の認識結果の形態素列を音素列に変換するとと
もに、上記検索置換手段(S6,S7)による訂正候補
の形態素列を音素列に変換し、訂正前の認識結果の音素
列に対する訂正候補の音素列の編集距離の比を表す音韻
的距離を計算し、音韻的距離が所定の第3のしきい値よ
り小さい訂正候補のみを残す選別手段(S8)と、上記
選別手段(S8)によって残った訂正候補に対して上記
構造解析処理を行って解析木形式の依存構造を生成し、
この際、各係り受けに対して、係り受けに対する用例単
語と入力単語との間の意味的距離を再計算し、再計算さ
れた意味的距離が上記第1のしきい値以下であるとき
に、当該訂正候補を誤り訂正結果として出力する再計算
手段(S9−S11,S13)とを備えたことを特徴と
する。
【0010】また、請求項2記載の音声認識誤り訂正装
置は、請求項1記載の音声認識誤り訂正装置において、
上記再計算された意味的距離が上記第1のしきい値を超
えるときに、上記抽出手段(S5)と、上記検索置換手
段(S6,S7)と、上記選別手段(S8)と、上記再
計算手段(S9−S11,S13)の処理を繰り返す再
帰的訂正手段をさらに備えたことを特徴とする。
【0011】
【発明の実施の形態】以下、図面を参照して本発明に係
る実施形態について説明する。
【0012】図1は、本発明に係る一実施形態である音
声認識誤り訂正装置の構成を示すブロック図であり、図
2は、図1の音声認識誤り訂正装置10によって実行さ
れる音声認識誤り訂正処理を示すフローチャートであ
る。本実施形態の音声認識誤り訂正装置は、音声認識装
置2と、音声認識誤り訂正装置10とを備えて構成さ
れ、音声認識誤り訂正装置10は図2の音声認識誤り訂
正処理を実行し、特に、従来例に比較して、訂正箇所特
定処理(ステップS5)、用例文検索処理(ステップS
6)及び訂正箇所との対応付け及び形態素列の置換処理
(ステップS7)を実行することを特徴としている。本
実施形態では、テキストコーパス中の用例文を、解析木
でなく形態素列で照合する訂正手法を用いる。本手法に
よれば、用例を構造に依存しない形態素列によって照合
するので、用例のより柔軟な照合が可能である。
【0013】図1において、音声認識の後誤り訂正の対
象となり得る発声音声(日本語又は英語などの自然言語
文からなる)はマイクロホン1に入力されて、音声信号
に変換された後、音声認識装置2に入力される。音声認
識装置2は、例えば特開平9−134192号公報で開
示されたような公知の音声認識装置であって、入力され
る音声信号をA/D変換した後LPC分析を行って音響
的特徴パラメータを抽出した後、音素隠れマルコフモデ
ル(音素HMM)を用いて音素列を特定し、かつ所定の
統計的言語モデルを用いて単語列からなる自然言語文の
音声認識結果を得て音声認識誤り訂正装置10に出力す
る。これに応答して、音声認識誤り訂正装置10は、タ
グ付き形態素列データメモリ22内の品詞タグ付き形態
素列データと、単語音素変換辞書メモリ23内の単語音
素変換辞書とに基づいて、図2の音声認識誤り訂正処理
を実行して、構造解析結果のタグを含み訂正候補で訂正
された音声認識結果を出力する。
【0014】次いで、図2を参照して、音声認識誤り訂
正装置10によって実行される音声認識誤り訂正処理に
ついて詳細に説明する。
【0015】まず、図2の処理の流れについて簡単に説
明する。ステップS1乃至S3の意味的訂正判断処理で
は、まず入力された音声認識結果を公知のCBパーザを
用いて構造解析し、解析木構造を得る。この際、構造の
各ノード及び構造全体に対し、意味的距離が計算され、
得られた構造全体に対する意味的距離が所定のしきい値
Θよりも小さい場合(ステップS3でNO)、誤り訂正
は不要と判断して構造解析結果の依存構造を含む入力文
を音声認識結果として出力する(ステップS4)。一
方、得られた構造全体に対する意味的距離が所定のしき
い値Θよりも大きい場合(ステップS3でYES)、し
きい値Θを超える意味距離を持つすべての部分構造を抽
出し、その部分構造が含む形態素列を訂正箇所とする
(ステップS5)。次いで、ステップS6乃至S8の形
態素列訂正処理では、まず、類似文字列検索によりテキ
ストコーパス中から似た文字列を含む用例文を検索し
(ステップS6)、この検索された用例文の形態素列か
ら、訂正箇所の形態素列に対応する部分を抽出し、この
部分に関して認識結果の形態素列を置換することで訂正
候補を得る(ステップS7)。この訂正候補の認識結果
に対する音韻的距離を計算し、計算された音韻的距離が
所定のしきい値Δより小さな候補のみを残す(ステップ
S8)。さらに、ステップS9乃至S11の訂正候補の
妥当性判断処理では、ステップS8で残った訂正候補に
対してステップS1乃至S3の処理と同様に構造解析を
行い、訂正候補に対する解析木構造を得る。訂正候補の
中で、構造全体に対する意味的距離の値が所定のしきい
値Θより小さいものが存在した場合、それら全ての候補
は誤りを回復したものとみなし、音韻的距離が最小のも
のを最終的な誤り訂正結果として終了する(ステップS
11及びS13)。候補中に条件を満たすものが存在し
ない場合(ステップS11でYES)、処理回数のチェ
ックを行った(ステップS12)後ステップS5に戻
り、それぞれの訂正候補から再帰的に訂正を試みる。
【0016】図2のステップS1において、構造解析及
び意味的距離計算処理を実行する。この処理では、音声
認識装置2から入力された音声認識結果(自然言語の文
字列)を公知のCBパーザ(上述の従来技術の項で説明
したものであって、特開平6−274192号公報にお
いて開示されている。)を用いて形態素解析処理を含む
構造解析処理を実行し、CBパーザは、入力文に対して
依存関係を適用し、ボトムアップに多分木の解析木形式
を有する依存構造を作成する。同時に、依存構造の各係
り受けに対して、意味的距離が計算される。この意味的
距離は、構造解析のときに用いる各言語パターンに対し
て予め格納された用例単語と入力単語との間の意味的距
離であり、シソーラスの意味情報(例えば、従来技術文
献3「大野晋ほか編集,”角川類語新辞典”,角川書
店,1981発行」において定義されたものを使用す
る。)に基づいて計算される。適切な係り受けである場
合、この意味的距離が小さな値をとる。このため、係り
受けの妥当性の指標とすることができる。
【0017】ここで、解析木は、文の形態素列に対し
て、構造解析の際に照合された言語パターン及びその属
性値、計算された意味的距離が添付され、言語パターン
による係り受けをノードとし、形態素を終端記号に持つ
木構造をなす。解析木には、解析木中の各ノードを頂点
とし、終端記号を下位構造(底辺)に持つような部分構
造、すまわち閉じた部分木が含まれる。従って、解析木
がそれ自身の頂点を含めてN個のノードを持つ場合、解
析木に含まれる閉じた部分木の数もNである。ここで部
分木には解析木全体自身も含まれる。
【0018】また、言語パターンの意味的距離について
説明する。言語パターンに関する意味的距離は、言語パ
ターンの各変項について、入力単語と用例単語の意味的
距離を計算し、計算された単語間の意味的距離に重みを
乗じて累積した値である。単語間の意味的距離は、単語
間の類語の概念階層における位置関係に依存して0から
1までの値を与える。2つの単語が全く同じ概念に属し
ていれば意味的距離は0であり、全く関係のない概念で
あれば1となる。単語間の意味的距離は概念階層におけ
る位置を示した類語コードに基づいて計算される。この
類語コードは上述のように、ステップS1の処理で付加
される。
【0019】以下、単語間の意味的距離の計算方法の具
体例について説明する。言語パターンにおける入力単語
と用例単語との意味的距離計算は、変項を具体化する中
心単語について行う。言語パターン”X at Y”(動詞
句)は”leaves verb-propn Kyoto at eleven a.m.”と
照合する場合、変項X、Yを具体化する文字列は、それ
ぞれ、”leaves verb-propn Kyoto”と”eleven a.m.”
である。各言語パターンには中心語句となるべき部分が
指定されており、例えば、”X verb-propn Y”では
X、”X a.m.”では”a.m.”と指定されている。従っ
て、”leaves verb-propn Kyoto”と”eleven a.m.”の
中心単語は”leaves”と”a.m.”であり、”X atY”に
おける意味的距離計算の入力となる。
【0020】言語パターン”X at Y”(動詞句)は、変
項X、Yを具体化する用例として、「X=present,Y
=conference,」、「X=arrive,Y=p.m.」などを、
例えば言語パターン検索テーブルに予め記憶されていた
とする。このとき、入力単語(X=leaves, Y=a.
m.)と用例単語(X=arrive, Y=p.m.,)の距離
は、変項Xに関する”leaves”と”arrive”の距離を
0.33とし、変項Yに関する”a.m.”と”p.m.”の距
離を0.00とすれば、変項XとYの重みを一律に0.
5とすれば入力とこの用例の距離は
【数1】 0.33×0.5+0.00×0.5=0.17 と計算することができる。ここで、言語パターンの用例
単語のすべてについて入力単語との距離を計算し、最小
の距離を、入力単語と用例単語との距離とする。
【0021】図2のステップS1の処理における構造解
析の結果得られた最尤構造を以降の処理における入力解
析木とする。解析木は、入力文の形態素列に対して、構
造解析の際に照合された言語パターン及びその属性値、
計算された意味的距離が添付され、言語パターンによる
係り受けをノードとし、形態素を終端記号に持つ木構造
を有する。
【0022】次いで、図2のステップS2において、計
算された意味的距離の値を所定のしきい値Θと比較し、
得られた構造全体に対する意味的距離がしきい値Θより
も小さい場合(ステップS3のNO)、誤り訂正は不要
と判断し、ステップS4で構造解析結果の解析木を含む
入力文の形態素列を音声認識結果として出力して当該音
声認識誤り訂正処理を終了する。一方、得られた構造全
体に対する意味的距離がしきい値Θよりも大きい場合
(ステップS3のYES)、誤り訂正が必要と判断し、
ステップS5以降の処理を実行する。
【0023】図2のステップS5では、訂正箇所特定処
理を実行する。この処理では、しきい値Θを超える意味
的距離を持つすべての部分構造を抽出し、その部分構造
が含む形態素列を訂正箇所とする。すなわち、構造解析
の結果得られた依存構造と意味的距離に基づいて、訂正
箇所の特定を行う。依存構造の各係り受けに対する意味
的距離は、値が小さければ依存関係が妥当であると信頼
できる。それゆえ、訂正箇所としては、逆に信頼性の低
い依存関係を含む部分を特定すればよい。まず、依存構
造の全ての係り受けのうちしきい値Θよりも大きな意味
的距離を持つ係り受けを信頼性が低いものとし、これら
の係り受けより上位の部分構造をすべて取り出す。そし
て、これらの部分構造それぞれに対応する形態素部分列
を訂正箇所とする。なお、本実施形態において、形態素
列と単語列との間で特に区別はしていない。また、形態
素列に対応した文字列とは、各形態素を構成する文字列
を形態素列の並び順に接続して得られる文字列のことで
ある。
【0024】ここで、訂正箇所特定処理について、図3
を参照して、具体例を挙げて説明する。図3において、
“認識結果”では、ステップS1における入力文の具体
例を示す。ここで、“いずれの戦”の部分が認識誤りで
あり、正解は“いずれも税”である。この入力文に対し
て、ステップS1の処理の結果、“形態素解析の結果”
に示す形態素列を得て、これに対する解析木形式の“依
存構造”を得る。図3では、依存構造を木構造で表現
し、各係り受けa,b,c,d,e,f,g,hに対し
て計算された意味的距離の値を横に数値で示す。
【0025】ここで、意味的距離のしきい値Θが0.3
である場合、依存構造の全ての係り受けのうち、しきい
値Θよりも大きな意味的距離を持つのは係り受けcであ
る。cより上位のすべての部分構造は、c,d,f,
g,hをそれぞれ頂点に持つ部分構造である。これに対
する形態素列として、“訂正箇所”に示す(A1)−
(A5)のような形態素部分列を得る。例えば、(A
1)の形態素部分列(8,10)は、形態素列の始点と
終点を“形態素解析の結果”における形態素番号を用い
て示しており、具体的に“戦サービス料”を表わす。
【0026】次いで、図2のステップS6では、タグ付
き形態素列データメモリ22内のタグ付き形態素列デー
タを参照して用例文検索処理を実行する。ここで、タグ
付き形態素列データは、以下のように生成されたもので
ある。所定の自然言語の発声発話文を書き下したテキス
トデータは、学習用テキストデータメモリ21に格納さ
れ、当該テキストデータは、公知の形態素解析処理(例
えば、特開平8−044740号公報で開示されてい
る。)を用いて形態素解析装置20によって、タグ付き
形態素列データに変換された後、タグ付き形態素列デー
タメモリ22に格納される。具体例として、テキストデ
ータ“もしもしわたし田中弘子といいますがそちらのホ
テルの予約したいのですが”に対して生成されるタグ付
き形態素列データを以下に示す。
【0027】
【表1】 タグ付き形態素列データの一例 ―――――――――――――――――――――――――――――――――― (:MORPH((:WORD”もしもし”:REG-EXP”もしもし”:POS感動詞:ATTRIBUTE NIL:S EM-CODE(789):COMPOUND NIL)(:WORD”わたし”:REG-EXP”私”:POS代名詞:ATTRI BUTE NIL:SEM-CODE(501):COMPOUND NIL)(:WORD”田中”:REG-EXP”田中”:POS普 通名詞:ATTRIBUTE NIL:SEM-CODE(822):COMPOUND NIL)(:WORD”弘子”:REG-EXP” 弘子”:POS普通名詞:ATTRIBUTE NIL:SEM-CODE(822):COMPOUND NIL)(:WORD”と” :REG-EXP”と”:POS格助詞:ATTRIBUTE NIL:SEM-CODE NIL:COMPOUND NIL)(:WORD ”いい”:REG-EXP”言う”:POS本動詞:ATTRIBUTE((:CONJ-FORM.連用)):SEM-CODE (822340):COMPOUND NIL)(:WORD”ます”:REG-EXP”ます”:POS助動詞:ATTRIBUTE ((:CONJ-FORM.基本)):SEM-CODE NIL:COMPOUND NIL)(:WORD”が”:REG-EXP”が” :POS接続助詞:ATTRIBUTE NIL:SEM-CODE NIL:COMPOUND NIL)(:WORD”そちら”:RE G-EXP”そちら”:POS代名詞:ATTRIBUTE NIL:SEM-CODE(503109101):COMPOUND NIL )(:WORD”の”:REG-EXP”の”:POS連体助詞:ATTRIBUTE NIL:SEM-CODE NIL:COMPO UND NIL)(:WORD”ホテル”:REG-EXP”ホテル”:POS普通名詞:ATTRIBUTE NIL:SEM -CODE(729):COMPOUND NIL)(:WORD”の”:REG-EXP”の”:POS連体助詞:ATTRIBUTE NIL:SEM-CODE NIL:COMPOUND NIL)(:WORD”予約する”:REG-EXP”予約する”:PO S本動詞:ATTRIBUTE((:CONJ-FORM.連用)):SEM-CODE(448):COMPOUND NIL)(:WORD” たい”:REG-EXP”たい”:POS助動詞:ATTRIBUTE((:CONJ-FORM.基本)):SEM-CODE N IL:COMPOUND NIL)(:WORD”のです”:REG-EXP”のです”:POS助動詞:ATTRIBUTE(( :CONJ-FORM.基本)):SEM-CODE NIL:COMPOUND NIL)(:WORD”が”:REG-EXP”が”:P OS接続助詞:ATTRIBUTE NIL:SEM-CODE NIL:COMPOUND NIL))) ――――――――――――――――――――――――――――――――――
【0028】図2のステップS6の用例文検索処理で
は、タグ付き形態素列データメモリ22内の用例文の中
から、訂正箇所の形態素部分列に音韻的に近い形態素列
を含む用例文を検索する。ここで、音韻的な近さを文字
列の編集距離によって近似することにより、訂正箇所の
文字列とテキストコーパスの文字列間の誤りを許した照
合の問題に帰着する。本実施形態では、訂正箇所の文字
列に対して、編集距離の比が所定のしきい値δ以下の文
字列を含む用例文を検索する。
【0029】具体的には、形態素列データ中のすべての
用例文に対して文字列を生成し、これに対して訂正箇所
の形態素部分列から生成された文字列を検索要求とした
類似文字列検索を行う。文字列の生成方法として、例え
ば上記のタグ付き形態素列データから、“:REG-EXP”の
要素のみを抜き出して並べることにより、文字列“もし
もし私田中弘子と言うますがそちらのホテルの予約する
たいのですが”を得る。一方、訂正箇所として得られた
形態素部分列からも同様にして文字列を得る。訂正箇所
に対して得られた文字列を検索要求として、形態素列デ
ータのすべての用例の文字列に対して、類似文字列検索
を、公知の類似文字列検索方法(例えば、従来技術文献
4「Y.Lepage,”String Approx
imate Pattern−Matching”,情
報処理学会第55回全国大会講演論文集,Vol.3,
pp.139−140,1997年」や特開平10−1
34085号公報参照。)を用いて実行する。このと
き、編集距離のしきい値として訂正箇所の文字列の長さ
と、所定のしきい値δの積の値を用いる。これにより、
訂正箇所の文字列に対して、編集距離の比がしきい値δ
以下の文字列を含む用例文が検索される。
【0030】次いで、図2のステップS7で訂正箇所の
対応付け及び形態素列の置換処理を実行する。この処理
では、ステップS6で検索された各用例文から、認識結
果の訂正箇所に対応する形態素部分列を抽出する。ここ
では、用例文の可能な形態素部分列のうち、訂正箇所に
対して形態素部分列の編集距離が最小となるものをDP
マッチング法によって求める。具体的には、用例文の形
態素列から切り出されるすべての可能な形態素部分列に
対して、訂正箇所の形態素列との間の形態素に関する編
集距離を計算し、このうち最小の値を持つ形態素列部分
を用例文中の訂正箇所に対応する部分とする。このよう
にして得られた用例文の形態素部分列を認識結果の訂正
部分と置き換えることにより、訂正候補の形態素列が得
られる。
【0031】さらに、ステップS8の訂正候補の音韻的
選別処理では、訂正前の認識結果の形態素列を単語音素
変換辞書メモリ23内の単語音素変換辞書を参照して形
態素列から音素列への変換処理を行って訂正前の認識結
果の音素列を得るとともに、訂正候補の形態素列を単語
音素変換辞書メモリ23内の単語音素変換辞書を参照し
て形態素列から音素列への変換処理を行って訂正候補の
音素列を得る。そして、訂正前の認識結果の音素列に対
する訂正候補の音素列の編集距離の比を音韻的距離と定
義し、訂正候補の認識結果に対する音韻的距離が所定の
しきい値Δより小さな訂正候補(すなわち、音韻的に近
接又は類似している訂正候補)のみを残す。これによ
り、訂正候補の中で元の認識結果に音韻的に近いものだ
けが得られる。ここで、編集距離とは、公知の通り、入
力音素列に対して、用例の音素列を得るために、音素を
削除、挿入又は置換する操作を行うときの処理操作の数
の和をいう。
【0032】単語音素変換辞書メモリ23は、単語から
音素列に変換するためのそれらの対の複数のデータが格
納される。この一例を以下に示す。左側の単語の表現形
に対する音素列が、右側に記述されている。
【0033】
【表2】 ―――――――――――――――――――――――――――――――――― 10340 [そして] s o sh i t e {|−} # そして|ソシテ|そして|接続詞|||| ―――――――――――――――――――――――――――――――――― 10341 [両日] r j o o zh i ts u {|−} # 両日|リョウジツ|両日|普通名詞|||| ―――――――――――――――――――――――――――――――――― 10342 [とも] t o m o {|−} # とも|トモ| とも|普通名詞|||| ―――――――――――――――――――――――――――――――――― 10343 [てくださっ] t e k u d a s a q # てくださっ|テクダサッ|てくださる|助動詞|特殊ラ|た|| ―――――――――――――――――――――――――――――――――― 10344 [ぐらい] g u r a i {|−} # ぐらい |グライ|ぐらい|副助詞|||| ―――――――――――――――――――――――――――――――――― 10345 [参り] m a i r i {|−} # 参り|マ イリ|参る|本動詞|五段ラ|連用|| ―――――――――――――――――――――――――――――――――― 10346 [京都観光ホテル] k j o o t o k a ng k o o h o t e r u {|−} # 京都観光 ホテル |キョウトカンコウホテル|京都観光ホテル|普通名詞|||| ―――――――――――――――――――――――――――――――――― 10347 [フロント] h u r o ng t o {|−} # フロント|フロント|フロント|普通名詞|||| ―――――――――――――――――――――――――――――――――― 10348 [日曜日] n i ch i j o o b i {|−} # 日曜日|ニチヨウビ|日曜日|普通名詞||||<一部> ――――――――――――――――――――――――――――――――――
【0034】次いで、ステップS9及びS10では、訂
正候補で訂正された音声認識結果に対して、ステップS
1及びS2と同様に、構造解析及び意味的距離計算処
理、並びに計算された意味的距離の値としきい値との比
較処理を実行する。すなわち、訂正候補の妥当性判断を
行い、ステップS8で残った訂正候補に対してステップ
S1と同様に構造解析を行い、解析木構造を有する音声
認識結果の訂正候補を得る。そして、訂正候補の中で、
構造全体に対する意味的距離の値がしきい値Θより小さ
いものが存在した場合(ステップS11でNO)、それ
ら全ての候補は誤りを回復したものとみなし、音韻的距
離が最小のものを最終的な訂正結果とし、構造解析結果
の依存構造を含む音声認識結果の訂正結果を出力して当
該音声認識誤り訂正処理を終了する。一方、訂正候補中
に条件を満たすものが存在しない場合(ステップS11
でYES)、ステップS12でステップS5以降の処理
回数が所定のしきい値回数(例えば、2,3回程度)以
下であるか否かが判断され、YESであれば、ステップ
S5に戻り、上記の処理を繰り返す。一方、NOであれ
ば、さらに繰り返しても回答が収束せず、訂正候補を得
ることができないと判断して、ステップS4で構造解析
結果の依存構造を含む、入力文を音声認識結果として出
力する。
【0035】すなわち、ステップS5乃至S8で音韻的
に認識結果に近い訂正候補が得られても、ステップS9
乃至S11で、意味的距離の観点で誤りが回復したと判
断されなければ訂正結果としては認めない。このような
訂正候補の中には、単に訂正が間違いであるものの他
に、訂正は正しく部分的には誤りが回復したが、訂正箇
所以外にさらに誤りが存在するために完全には回復して
いないものも含まれる。このような後者の候補に対して
は、さらに誤り訂正を繰り返すことで完全な回復が見込
まれる。このため、訂正候補中に意味的距離の条件を満
たすものが存在しない場合、ステップS5に戻り、それ
ぞれの訂正候補から再帰的に訂正を試みる。
【0036】以上の実施形態において、音声認識装置2
と音声認識誤り訂正装置10と形態素解析装置20と
は、例えばデジタル計算機などの中央演算処理装置で構
成され、また、学習用テキストデータメモリ21とタグ
付き形態素列データメモリ22と単語音素変換辞書メモ
リ23とは、例えば、ハードディスクメモリなどの記憶
装置で構成される。
【0037】以上の実施形態においては、日本語に関す
る処理を例示しているが、本発明はこれらの言語に限ら
ず、他の種々の自然言語に適用することができる。
【0038】
【実施例】本発明者は、本実施形態の手法の有効性を確
認するために、本実施形態の手法を音声翻訳システムに
組み込んで翻訳実験を行った。すなわち、実験で用いた
システムは、図1のシステムにおいて音声認識装置2と
音声認識誤り訂正装置10との間に機械翻訳装置が挿入
された音声翻訳システムとなる。入力は日英翻訳システ
ムで学習済みの旅行会話データのうち日本語337文を
用いた。学習用テキストコーパスは、同様に旅行会話デ
ータのうち入力文を含んだ異なり15,264文を用い
た。ここで、意味的距離に対するしきい値Θは1.0
を、音韻的距離に対するしきい値Δは0.3を、類似文
字列検索に対するしきい値δは0.3を用いた。
【0039】まず、訂正必要性判断と認識誤りの関係を
表3に示す。ステップS3の訂正必要性判断において、
音声認識結果が正しいものに対しては、91%の精度で
訂正が不要と判断し、認識誤りのある入力に対しては、
59%の精度で訂正が必要と判断している。さらに、訂
正が必要と判断されたものに対して、訂正結果が出力さ
れたのは認識誤りのある入力のうち27%であり、正し
いにも関わらず訂正が必要と判断された入力に対しては
訂正は得られていない。
【0040】
【表3】 訂正必要性判断と認識誤りの関係(全337入力文) ―――――――――――――――――――――――――――――――――― 誤った入力 正しい入力 224 93 ―――――――――――――――――――――――――――――――――― 訂正必要153 145(59%) 8(9%) ―――――――――――――――――――――――――――――――――― (訂正出力66) 66(27%) 0(0%) ―――――――――――――――――――――――――――――――――― 訂正不要184 99(41%) 85(91%) ――――――――――――――――――――――――――――――――――
【0041】次に、翻訳結果の評価について述べる。翻
訳結果に対する評価基準として、以下に示すような、情
報伝達に着目した4段階の基準を用いた。
【0042】
【表4】 翻訳結果の評価基準 ―――――――――――――――――――――――――――――――――― 評価A(完全)原言語正解分と完全に同じ意味にとれる。 ―――――――――――――――――――――――――――――――――― 評価B(十分)原言語正解分とほぼ同じ意味にとれる。 ―――――――――――――――――――――――――――――――――― 評価C(部分)原言語正解文の主要情報が部分的には伝わる。 ―――――――――――――――――――――――――――――――――― 評価D(不適)原言語正解文の主要情報が伝わらない/誤解が生じる。 ――――――――――――――――――――――――――――――――――
【0043】入力337文の音声認識結果に対して、直
接翻訳処理した結果と、本実施形態の手法を用いた結果
を評価した結果を以下に示す。
【0044】
【表5】 本実施形態の装置による翻訳結果(全337入力文) ―――――――――――――――――――――――――――――――――― 訂正なし 訂正あり ―――――――――――――――――――――――――――――――――― 翻訳率 64%(217) 74%(249) ―――――――――――――――――――――――――――――――――― 評価A 41%(139) 54%(185) 評価B 11%(38) 10%(34) 評価C 12%(40) 9%(30) 評価D 25%(85) 18%(61) 該当なし 10%(35) 8%(27) ――――――――――――――――――――――――――――――――――
【0045】訂正によって評価Aへ回復したものが多
く、翻訳率(評価ABCの合計)も64%から74%に
向上していることが分かる。さらに訂正の出力が得られ
た66文のみに関して、比較してみると、以下のように
なる。
【0046】
【表6】 訂正の得られた66入力文に関する比較 ―――――――――――――――――――――――――――――――――― 訂正なし 訂正あり ―――――――――――――――――――――――――――――――――― 翻訳率 45%(30) 94%(62) ―――――――――――――――――――――――――――――――――― 評価A 5%(3) 74%(49) 評価B 20%(13) 14%(9) 評価C 21%(14) 6%(4) 評価D 42%(28) 6%(4) 該当なし 12%(8) 0%(0) ――――――――――――――――――――――――――――――――――
【0047】訂正の得られた入力文は、訂正前の翻訳率
が45%であり、全入力文に対する値64%よりもかな
り低い。これに対して訂正後は94%と高い値を得てい
る。この結果は、比較的誤りのひどい入力に対しても本
実施形態の手法が有効であり、適切な訂正結果が得られ
ることを示している。
【0048】次いで、従来例の装置との比較について説
明する。本実施形態では、解析木データを用いる従来例
の装置の問題を解決するために、用例を構造を持たない
形態素列として照合する手法を検討した。その他の相違
点として、訂正箇所の特定、及び再帰的訂正処理が挙げ
られる。これらのうち、訂正箇所の特定に関しては、従
来例の装置ですべての部分構造を考慮していたのに比
べ、意味的距離の観点で訂正箇所を絞り込むことによ
り、訂正候補の作成における計算コストを削減すること
が可能となった。また、再帰的訂正処理により、複数箇
所の誤りを持つ入力が複数回の訂正処理で回復されるこ
とも確認された。しかしながら、今回の評価の中では、
訂正結果の得られる発話数は、認識誤りに対して訂正処
理が行われたうちの約5割程度であり、従来例の装置で
の結果との間で大きな差は認められなかった。その理由
として、用例中に認識結果の正解が含まれる実験条件で
は、認識結果と用例の照合において、どちらの手法でも
正解との対応がある程度保証されるため、性能に差が出
ないと考えられる。
【0049】以上説明したように、本実施形態によれ
ば、テキストコーパス中の用例文を、解析木でなく形態
素列で照合する訂正方法を用いたので、用例を構造に依
存しない形態素列によって照合するので、用例のより柔
軟な照合が可能である。すなわち、意味的な観点で誤り
訂正が可能であって、従来例の装置と同様の誤り訂正の
精度で音声認識誤り訂正を行うことができる。また、再
計算された意味的距離が所定のしきい値Θよりも大きい
ときに、再度ステップS5からの処理を実行するので、
複数箇所の誤りの再帰的な訂正が可能である。
【0050】
【発明の効果】以上詳述したように本発明に係る請求項
1記載の音声認識誤り訂正装置によれば、発声音声文の
音声信号を音声認識し、その音声認識結果の入力文に対
して誤り訂正処理を行う音声認識誤り訂正装置におい
て、学習用テキストデータに基づいて所定の形態素解析
を予め行って得られた品詞付き形態素列を含む用例文を
記憶する記憶手段(22)と、上記音声認識結果の入力
文に対して所定の構造解析処理を行って解析木形式の依
存構造を生成し、この際、各係り受けに対して、係り受
けに対する用例単語と入力単語との間の意味的距離を計
算し、上記生成された依存構造のすべての係り受けのう
ち、計算された意味的距離が所定の第1のしきい値より
も大きい係り受けを含む訂正箇所を抽出する抽出手段
(S1−S5)と、上記記憶手段(22)に記憶された
用例文から、上記抽出手段(S1−S5)によって抽出
された訂正箇所の文字列との間の編集距離の比が所定の
第2のしきい値以下である文字列を含む用例文を検索
し、検索された用例文の形態素列から上記訂正箇所に対
応する形態素部分列を抽出し、抽出した用例文中の形態
素部分列を上記訂正箇所の形態素部分列と置き換えるこ
とにより、入力文の形態素列を訂正して訂正候補の形態
素列を得る検索置換手段(S6,S7)と、単語から音
素列への所定の変換辞書を用いて、上記検索置換手段
(S6,S7)による訂正前の認識結果の形態素列を音
素列に変換するとともに、上記検索置換手段(S6,S
7)による訂正候補の形態素列を音素列に変換し、訂正
前の認識結果の音素列に対する訂正候補の音素列の編集
距離の比を表す音韻的距離を計算し、音韻的距離が所定
の第3のしきい値より小さい訂正候補のみを残す選別手
段(S8)と、上記選別手段(S8)によって残った訂
正候補に対して上記構造解析処理を行って解析木形式の
依存構造を生成し、この際、各係り受けに対して、係り
受けに対する用例単語と入力単語との間の意味的距離を
再計算し、再計算された意味的距離が上記第1のしきい
値以下であるときに、当該訂正候補を誤り訂正結果とし
て出力する再計算手段(S9−S11,S13)とを備
える。従って、本発明によれば、学習用テキストデータ
であるテキストコーパス中の用例文を、解析木でなく形
態素列で照合する訂正方法を用いたので、用例を構造に
依存しない形態素列によって照合するので、用例のより
柔軟な照合が可能である。すなわち、意味的な観点で誤
り訂正が可能であって、従来例の装置と同様の誤り訂正
の精度で音声認識誤り訂正を行うことができる。
【0051】また、請求項2記載の音声認識誤り訂正装
置によれば、請求項1記載の音声認識誤り訂正装置にお
いて、上記再計算された意味的距離が上記第1のしきい
値を超えるときに、上記抽出手段(S5)と、上記検索
置換手段(S6,S7)と、上記選別手段(S8)と、
上記再計算手段(S9−S11,S13)の処理を繰り
返す再帰的訂正手段をさらに備える。従って、本発明に
よれば、複数箇所の誤りの再帰的な訂正が可能である。
【図面の簡単な説明】
【図1】 本発明に係る一実施形態である音声認識誤り
訂正装置の構成を示すブロック図である。
【図2】 図1の音声認識誤り訂正装置10によって実
行される音声認識誤り訂正処理を示すフローチャートで
ある。
【図3】 図2の訂正箇所特定処理の一例を説明するた
めの説明図である。
【符号の説明】
1…マイクロホン、 2…音声認識装置、 10…音声認識誤り訂正装置、 20…形態素解析装置、 21…学習用テキストデータメモリ、 22…タグ付き形態素列データメモリ、 23…単語音素変換辞書メモリ。
フロントページの続き (56)参考文献 特公 平7−69710(JP,B2) 特許2950823(JP,B1) 情報処理学会研究報告[音声言語情報 処理]Vol.98,No.49,98−SL P−21−4,「文字連鎖の統計的情報を 利用した音声認識誤り訂正手法」p.47 −54,(1998/5/29発表) 情報処理学会日本文入力方式研究会資 料,Vol.19,「音声入力における誤 認識訂正処理」p.19,1.1−19. 1.8,(1984/12/5) 情報処理学会第41回(平成2年後期) 全国大会講演論文集(3),2S−7, 「音声言語翻訳のための日本語解析」, p.3−127〜3−128,(平成2年) H.Saito et al.,”P arsing Noisy Sente nces”,Proceedings of COLING’88,pp.561− 566,1988年 脇田由実ほか,「意味的類似性を用い た後処理的な音声認識正解部分特定法と 音声翻訳手法への導入」,人工知能学会 音声言語情報処理研究会,17−4,1997 年7月18日 (58)調査した分野(Int.Cl.7,DB名) G10L 3/00 561 G10L 3/00 537 G06F 17/27 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 発声音声文の音声信号を音声認識し、そ
    の音声認識結果の入力文に対して誤り訂正処理を行う音
    声認識誤り訂正装置において、 学習用テキストデータに基づいて所定の形態素解析を予
    め行って得られた品詞付き形態素列を含む用例文を記憶
    する記憶手段(22)と、 上記音声認識結果の入力文に対して所定の構造解析処理
    を行って解析木形式の依存構造を生成し、この際、各係
    り受けに対して、係り受けに対する用例単語と入力単語
    との間の意味的距離を計算し、上記生成された依存構造
    のすべての係り受けのうち、計算された意味的距離が所
    定の第1のしきい値よりも大きい係り受けを含む訂正箇
    所を抽出する抽出手段(S1−S5)と、 上記記憶手段(22)に記憶された用例文から、上記抽
    出手段(S1−S5)によって抽出された訂正箇所の文
    字列との間の編集距離の比が所定の第2のしきい値以下
    である文字列を含む用例文を検索し、検索された用例文
    の形態素列から上記訂正箇所に対応する形態素部分列を
    抽出し、抽出した用例文中の形態素部分列を上記訂正箇
    所の形態素部分列と置き換えることにより、入力文の形
    態素列を訂正して訂正候補の形態素列を得る検索置換手
    段(S6,S7)と、 単語から音素列への所定の変換辞書を用いて、上記検索
    置換手段(S6,S7)による訂正前の認識結果の形態
    素列を音素列に変換するとともに、上記検索置換手段
    (S6,S7)による訂正候補の形態素列を音素列に変
    換し、訂正前の認識結果の音素列に対する訂正候補の音
    素列の編集距離の比を表す音韻的距離を計算し、音韻的
    距離が所定の第3のしきい値より小さい訂正候補のみを
    残す選別手段(S8)と、 上記選別手段(S8)によって残った訂正候補に対して
    上記構造解析処理を行って解析木形式の依存構造を生成
    し、この際、各係り受けに対して、係り受けに対する用
    例単語と入力単語との間の意味的距離を再計算し、再計
    算された意味的距離が上記第1のしきい値以下であると
    きに、当該訂正候補を誤り訂正結果として出力する再計
    算手段(S9−S11,S13)とを備えたことを特徴
    とする音声認識誤り訂正装置。
  2. 【請求項2】 上記再計算された意味的距離が上記第1
    のしきい値を超えるときに、上記抽出手段(S5)と、
    上記検索置換手段(S6,S7)と、上記選別手段(S
    8)と、上記再計算手段(S9−S11,S13)の処
    理を繰り返す再帰的訂正手段をさらに備えたことを特徴
    とする請求項1記載の音声認識誤り訂正装置。
JP11056910A 1999-03-04 1999-03-04 音声認識誤り訂正装置 Expired - Fee Related JP2999768B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11056910A JP2999768B1 (ja) 1999-03-04 1999-03-04 音声認識誤り訂正装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11056910A JP2999768B1 (ja) 1999-03-04 1999-03-04 音声認識誤り訂正装置

Publications (2)

Publication Number Publication Date
JP2999768B1 true JP2999768B1 (ja) 2000-01-17
JP2000250589A JP2000250589A (ja) 2000-09-14

Family

ID=13040625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11056910A Expired - Fee Related JP2999768B1 (ja) 1999-03-04 1999-03-04 音声認識誤り訂正装置

Country Status (1)

Country Link
JP (1) JP2999768B1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710904A (zh) * 2018-11-13 2019-05-03 平安科技(深圳)有限公司 基于语义解析的文本准确率计算方法、装置、计算机设备
CN114530145A (zh) * 2020-11-23 2022-05-24 中移互联网有限公司 语音识别结果纠错方法及装置、计算机可读存储介质

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6233561B1 (en) * 1999-04-12 2001-05-15 Matsushita Electric Industrial Co., Ltd. Method for goal-oriented speech translation in hand-held devices using meaning extraction and dialogue
EP1471502A1 (en) * 2003-04-25 2004-10-27 Sony International (Europe) GmbH Method for correcting a text produced by speech recognition
US8725505B2 (en) * 2004-10-22 2014-05-13 Microsoft Corporation Verb error recovery in speech recognition
JP5044783B2 (ja) * 2007-01-23 2012-10-10 国立大学法人九州工業大学 自動回答装置および方法
JP5404563B2 (ja) * 2010-09-10 2014-02-05 三菱電機株式会社 検索装置
US9246978B2 (en) * 2013-11-11 2016-01-26 Mitsubishi Electric Research Laboratories, Inc. Method for determining hidden states of systems using privacy-preserving distributed data analytics
US9471810B2 (en) * 2015-03-09 2016-10-18 Mitsubishi Electric Research Laboratories, Inc. Method and system for determining hidden states of a machine using privacy-preserving distributed data analytics and a semi-trusted server and a third-party

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
H.Saito et al.,"Parsing Noisy Sentences",Proceedings of COLING’88,pp.561−566,1988年
情報処理学会日本文入力方式研究会資料,Vol.19,「音声入力における誤認識訂正処理」p.19,1.1−19.1.8,(1984/12/5)
情報処理学会研究報告[音声言語情報処理]Vol.98,No.49,98−SLP−21−4,「文字連鎖の統計的情報を利用した音声認識誤り訂正手法」p.47−54,(1998/5/29発表)
情報処理学会第41回(平成2年後期)全国大会講演論文集(3),2S−7,「音声言語翻訳のための日本語解析」,p.3−127〜3−128,(平成2年)
脇田由実ほか,「意味的類似性を用いた後処理的な音声認識正解部分特定法と音声翻訳手法への導入」,人工知能学会音声言語情報処理研究会,17−4,1997年7月18日

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710904A (zh) * 2018-11-13 2019-05-03 平安科技(深圳)有限公司 基于语义解析的文本准确率计算方法、装置、计算机设备
CN109710904B (zh) * 2018-11-13 2023-11-14 平安科技(深圳)有限公司 基于语义解析的文本准确率计算方法、装置、计算机设备
CN114530145A (zh) * 2020-11-23 2022-05-24 中移互联网有限公司 语音识别结果纠错方法及装置、计算机可读存储介质
CN114530145B (zh) * 2020-11-23 2023-08-15 中移互联网有限公司 语音识别结果纠错方法及装置、计算机可读存储介质

Also Published As

Publication number Publication date
JP2000250589A (ja) 2000-09-14

Similar Documents

Publication Publication Date Title
US6983239B1 (en) Method and apparatus for embedding grammars in a natural language understanding (NLU) statistical parser
JP5040909B2 (ja) 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム
US6349282B1 (en) Compound words in speech recognition systems
US7529657B2 (en) Configurable parameters for grammar authoring for speech recognition and natural language understanding
US7072826B1 (en) Language conversion rule preparing device, language conversion device and program recording medium
US7379870B1 (en) Contextual filtering
US20040220809A1 (en) System with composite statistical and rules-based grammar model for speech recognition and natural language understanding
US6963831B1 (en) Including statistical NLU models within a statistical parser
JPH08278794A (ja) 音声認識装置および音声認識方法並びに音声翻訳装置
EP1475779B1 (en) System with composite statistical and rules-based grammar model for speech recognition and natural language understanding
JP2999768B1 (ja) 音声認識誤り訂正装置
Schwartz et al. Hidden understanding models for statistical sentence understanding
Gao et al. MARS: A statistical semantic parsing and generation-based multilingual automatic translation system
JP2950823B1 (ja) 音声認識誤り訂正装置
JP3441400B2 (ja) 言語変換規則作成装置、及びプログラム記録媒体
JP3059413B2 (ja) 自然言語理解装置及び自然言語理解システム
JP3027557B2 (ja) 音声認識方法及び装置、並びに音声認識処理プログラムを記録した記録媒体
Hockey et al. Comparison of grammar-based and statistical language models trained on the same data
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
EP0469485B1 (en) Language processing system using an expanded LR parser
Giachin et al. Linguistic processing in a speech understanding system
Glücksmannová Spontaneous speech reconstruction
Nasr et al. Integrating a POS tagger and a chunker implemented as weighted finite state machines
Bentum et al. A speech recognizer for subtitling Frisian/Dutch council meetings
Ishikawa et al. Example-based error recovery method for speech translation: repairing sub-trees according to the semantic distance

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees