JP2004264464A - 特定分野辞書を利用した音声認識誤り訂正システム - Google Patents
特定分野辞書を利用した音声認識誤り訂正システム Download PDFInfo
- Publication number
- JP2004264464A JP2004264464A JP2003053540A JP2003053540A JP2004264464A JP 2004264464 A JP2004264464 A JP 2004264464A JP 2003053540 A JP2003053540 A JP 2003053540A JP 2003053540 A JP2003053540 A JP 2003053540A JP 2004264464 A JP2004264464 A JP 2004264464A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- natural language
- error correction
- language sentence
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】本発明では、入力された音声データの認識結果から文章の話題を自動的に抽出すると共に、抽出した話題より当該分野の特定分野辞書を用いて解析するか否かの制御を自動的に行うことにより、どのような文章に対しても誤り訂正の精度を向上させる。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、抽出した話題の情報により適切な分野に特化した特定分野辞書を選定し、この選定した特定分野辞書と基本辞書を用いて自然言語文を解析することにより誤り訂正の精度を向上させる音声認識誤り訂正システムに関する。
【0002】
本発明は、音声データを入力しコンピュータで取り扱うことのできる文字コードに変換する音声認識処理に適用可能である。具体的には、会議の議事録作成システムや映画の発話文を認識し字幕データを作成するシステム、音声対話案内システムや音声対話コマンド入力システムなど音声入力とする各種コンピュータシステムに適用可能である。また、音声認識後に、出力したコンピュータで取り扱うことのできる文字コードに対して、更に高度な解析を行う、音声入力かな漢字変換や音声対話機械翻訳システムなどの音声入力部としても適用可能である。
【0003】
【従来の技術】
従来の音声認識誤りを訂正するシステムにおいては、音声認識手段の認識結果となる自然言語文に対して、あらかじめ作成しておいた単語の表記を格納した単語表記辞書と文字列照合処理を行い、認識結果となる自然言語文の部分文字列が単語として存在するかという判断をもって検証していた。
【0004】
更に、高度な音声認識結果の誤り訂正を行うシステムにおいては、音声認識手段の認識結果となる自然言語文に対して、この文がどのような単語列で構成されているかを判別する形態素解析処理を行うことで、認識結果となる自然言語文を構成する単語列の候補をより明確にする。このことで、前記従来の認識結果となる自然言語文と単語表記辞書との単純な文字列照合より、正確に誤り訂正候補となる単語を絞り込むことが可能となり、誤り訂正の精度を向上していた。
【0005】
また、更に高度な音声認識結果の誤り訂正を行うシステムにおいては、音声認識手段の認識結果となる自然言語文が医学分野や機械技術分野など汎用的な用語のほかにその分野以外では利用される可能性が極めて低い当該分野に特化した数多くの専門的な単語を多く含む特定分野の文章を解析する場合においては、一般的な単語を登録している基本辞書と当該分野に特化した単語を登録している特定分野辞書と呼ばれる2種類の辞書を用いて解析を行うことにより解析していた。また複数の特定分野に関連する自然言語文章を解析する際には、該当する複数分野の各々に対する特定分野辞書と基本辞書を用いて解析を行っていた。
【0006】
【発明が解決しようとする課題】
本発明が解決しようとする課題は、音声として入力されたデータを正確に認識することにある。本発明は、そのための一手段である音声認識結果の誤り訂正の精度を向上させることを目的とする。誤り訂正の精度を向上させるには、認識誤りの文字を限定するとともに正解となる文字の候補を絞り込む必要がある。そのためには、音声認識手段の認識結果となる自然言語文の解析精度を向上させる必要がある。
【0007】
自然言語文の解析においては、まず入力となる文がどのような単語列で構成されているかを判別する形態素解析処理を行う。形態素解析処理は、辞書に登録された単語の表記と文の文字列を比較する表記照合を行い、文を構成する単語列の候補を抽出し、その後、辞書に登録された単語の解析に必要な文法情報により、単語間の接続性を判定する単語接続判定を行うことで、文がどのような単語列で構成されているかを判別している。この際、特定分野に特化した単語で辞書に登録されていない単語が出現すると、表記照合で既に誤りとなり正しい形態素解析の結果が得られることは無い。そこで、特定分野に特化した自然言語文の解析を行うためには、当該分野に特化した単語をあらかじめ辞書に登録しておかなければ解析精度の向上は望めない。
【0008】
ところが、1つの辞書に一般的に用いられる基本的な単語と特定分野にしか用いられない特定分野に特化した単語を登録すると、特定分野に特化した自然言語文の解析精度は向上するが、基本的な自然言語文を解析しようとする際にも、特定分野に特化した単語が出現する可能性があり、基本的な自然言語文の解析精度を低減させるという反作用を引き起こしてしまう。
【0009】
更には、 特定分野に特化した単語を追加することで辞書に存在する単語数を増加させると共に、形態素解析処理における表記照合における文を構成する単語列の候補を増加させるので、この2種類の情報を入力として行われる単語接続判定の入力情報数を増加させるため、処理時間が伸張するという問題が生じていた。
【0010】
これらの問題点は、登録する特定分野の数を増やせば増やすほど顕著に表れるので、1つの辞書に数多くの特定分野に特化した単語を登録すれば、解析精度と解析速度が低減するという問題点は更に表れるという問題点があった。
【0011】
更には辞書のメンテナンスを実施する場合においても、単語接続判定の基情報となる単語の解析に必要な文法情報には単語間の2項関係や3項関係などの登録が必要な場合もあり、1つの辞書に多くの単語が出現する場合、2項関係や3項関係などの登録が必要な単語の組み合わせも増加するという問題点も生じていた。
【0012】
一般的な単語を登録している基本辞書と当該分野に特化した単語を登録している特定分野辞書と呼ばれる2種類の辞書を用いて解析を進める場合であるが、この場合、特定分野辞書を使うか否か、特定分野辞書を使う場合においてもどの特定分野辞書を使うかを自動的に判別することはなく、当該システムを利用する人が指定しなければならなかった。そのため、当該システムを利用する人が指定するのを忘れた場合や、正しい指定を行わなかった場合には、著しく解析精度が低下するという問題点が生じていた。
【0013】
また、ある特定分野に対して記載されている文書においても、文書中には一般的なこの問い記載されている部分や、比喩表現などで記載されその部分については異なる分野の単語が多々使用される部分なども存在する場合もあり、一概に特定分野に対して記載されている文書に対して、当該分野の特定分野辞書を用いて解析を行っても解析精度が向上する訳ではない。そのため、文章中の各部分に対して適切な特定分野辞書を用いれば解析精度を向上させることは可能であるが、その都度特定分野辞書を切り替えることは面倒な作業であり、実質的には困難であった。
【0014】
また、人間の会話を解析する場合などにおいては、一般的にその話題は特定の分野だけで収まらず刻々と変化していく。このようにリアルタイムで処理を実施しなければならない場合には、複数の特定分野辞書をその都度切り替えることは不可能であった。
【0015】
【課題を解決するための手段】
上記課題を解決するための手段を次のように構成した。
特許を受けようとする第1発明は、音声データを入力とし、コンピュータで取り扱うことのできる文字コードの列に変換するとき、その認識結果である自然言語文を、各々の文字毎の認識正解率と、各々の文字毎の認識正解率順に複数の候補を出力することを特徴とする音声認識手段と、基本的な単語を知識として単語の表記と解析に必要な文法情報を保持する基本辞書と、話題となる分野を定義しその各々の分野に特化した単語の表記と解析に必要な単語の文法情報を保持する複数の特定分野辞書群とを有することを特徴とする誤り訂正辞書と、前記誤り訂正辞書中の基本辞書に登録されている単語において、表記情報と解析に必要な文法情報を登録するだけでなく、話題となる分野と関連する単語においては加えて話題認知ポイントを登録することを特徴とする基本辞書と、前記音声認識手段の認識結果である自然言語文を解析するにおいて、前記誤り訂正辞書を用いて解析対象となる自然言語文の文法的な解析を進める際に十分な解析成功率が得られなかった場合は、前記音声認識手段が出力した各々の文字毎の認識正解率の低いものから順に文字置き換えを行いつつ、解析を進めることを特徴とする自然言語文解析手段と、前記自然言語文解析手段を用いて解析するにおいて、前記基本辞書を用いて解析対象となる自然言語文の文法的な解析を進めるときに、前記基本辞書に登録された話題認知ポイントを用いて解析対象となる自然言語文の話題抽出処理を実行することを特徴とする自然言語文の話題抽出手段と、前記話題抽出手段が抽出した話題の情報より前記特定分野辞書群の中から適切な分野に特化した特定分野辞書を選定し、この選定した特定分野辞書と基本辞書を用いて自然言語文を解析することにより、誤り訂正候補の中から選定して訂正する誤り訂正手段とを備え、前記音声認識手段の認識結果である自然言語文中の誤り訂正処理を実施するに際して前記自然言語文解析手段を用いて自然言語文の文法的な解析と自然言語文の話題抽出をし、その抽出した話題の情報より前記特定分野辞書群の中から適切な分野に特化した特定分野辞書を選定し、この選定した特定分野辞書と基本辞書を用いて自然言語文を解析して、訂正手段により誤り訂正候補の中から選定して誤り訂正することにより、誤り訂正の精度を向上させるようにしたことを特徴とする特定分野辞書を利用した音声認識誤り訂正システムである。
【0016】
特許を受けようとする第2発明は、特定分野辞書を利用した音声認識誤り訂正システムにおいて、音声データを入力とし、コンピュータで取り扱うことのできる文字コードの列に変換するとき、その認識結果である自然言語文を、各々の文字毎の認識正解率と、各々の文字毎の認識正解率順に複数の候補を出力することを特徴とする音声認識手段である。
【0017】
特許を受けようとする第3発明は、特定分野辞書を利用した音声認識誤り訂正システムにおいて、基本的な単語を知識として単語の表記と解析に必要な文法情報を保持する基本辞書と、話題となる分野を定義し、その各々の分野に特化した単語の表記と解析に必要な単語の文法情報を保持する複数の特定分野辞書群とを有することを特徴とする誤り訂正辞書である。
【0018】
特許を受けようとする第4発明は、特定分野辞書を利用した音声認識誤り訂正システムにおいて、請求項3に記載する誤り訂正辞書中の基本辞書に登録されている単語について、表記情報と解析に必要な文法情報を登録するだけでなく、話題となる分野と関連する単語を加えた話題認知ポイントを登録することを特徴とする基本辞書である。
【0019】
特許を受けようとする第5発明は、特定分野辞書を利用した音声認識誤り訂正システムにおいて、第2発明に記載の音声認識手段の認識結果である自然言語文を解析するに当たり、第3発明に示す誤り訂正辞書を用いて解析対象となる自然言語文の文法的な解析を進め、それでも十分な解析成功率が得られなかった場合は、第2発明に記載の音声認識手段が出力した各々の文字毎の認識正解率の低いものから順に文字置き換えを行いつつ解析を進めることを特徴とする自然言語文解析手段である。
【0020】
特許を受けようとする第6発明は、特定分野辞書を利用した音声認識誤り訂正システムにおいて、第5発明に記載の自然言語文解析手段を用いて解析するに当たり、第4発明に示す基本辞書を用いて解析対象となる自然言語文の文法的な解析を進めると共に、第4発明に示す基本辞書に登録された話題認知ポイントを用いて解析対象となる自然言語文の話題抽出処理を実行することを特徴とする自然言語文の話題抽出手段である。
【0021】
特許を受けようとする第7発明は、特定分野辞書を利用した音声認識誤り訂正システムにおいて、第2発明に記載の音声認識手段の認識結果である自然言語文中の誤り訂正処理を実施するに当たり、第6発明に示す話題抽出手段が抽出した話題の情報により第3発明に示す特定分野辞書群の中から適切な分野に特化した特定分野辞書を選定し、この選定した特定分野辞書と基本辞書を用いて自然言語文を解析することにより、誤り訂正の精度を向上させるようにしたことを特徴とする特定分野辞書を利用した音声認識誤り訂正システムである。
【0022】
【実施例】
以下、図面を参照して、本発明に係わる特定分野辞書を利用した音声認識誤り訂正システムの実施例について説明する。なお本実施例は、音声データを入力とし、その認識結果である自然言語文の誤り訂正結果を出力する処理を行うものである。
【0023】
図1は、本発明の実施例に係る特定分野辞書を利用した音声認識誤り訂正システムを示す説明図である。音声認識手段1に音声データが入力されると、音声認識手段1ではその認識結果である自然言語文2を出力する。出力される自然言語文2は、自然言語文2の各々の文字に対して、認識正解率と共に各々の文字毎の認識正解率順に複数の候補を出力する。
【0024】
次に、自然言語文2は音声認識の誤り訂正システム3に入力される。入力された自然言語文2は、まず自然言語文解析手段31によって文法的な解析を行い、自然言語文2を単語列に置き換える処理を行う。この解析は、誤り訂正辞書32中の基本辞書321のみを用いて行う。
【0025】
この解析処理を実行している最中に十分な解析成功率が得られなかった場合には、自然言語文2中に含まれる最も認識正解率の低い文字を第2の候補文字に置き換えて、再び文法的な解析を行う。認識正解率の低い文字を第2の候補文字に置き換えても十分な解析成功率が得られなかった場合は、次に認識正解率の低い文字を第2の候補文字に置き換えて再解析を行う。このように解析処理において十分な解析成功率が得られるまで、認識正解率の低い順に文字を第2の候補、第3の候補の候補と置き換えて解析を行う。
【0026】
自然言語文解析手段31では、自然言語文2を単語列に置き換える処理を行うと同時に、話題抽出手段311によって、基本辞書から自然言語文2を構成する単語候補についている話題認知ポイントを読み込み、解析対象となる自然言語文2がどのような話題の文かを認知する。
【0027】
話題抽出手段311によって認知された自然言語文2の話題は辞書制御手段33に伝えられる。辞書制御手段33では伝えられた話題情報より、誤り訂正辞書32および自然言語文解析手段31を制御し、基本辞書321および特定分野辞書322で話題と一致する特定分野辞書322を用いて解析を実行するように制御する。
【0028】
そして、基本辞書321および話題と一致する特定分野辞書322を用いて、再度自然言語文2の解析処理を行う。このときも認識正解率の低い文字を第2の候補文字に置き換えても十分な解析成功率が得られなかった場合は、次に認識正解率の低い文字を第2の候補文字に置き換えて再解析を行う。このように解析処理において十分な解析成功率が得られるまで、認識正解率の低い順に文字を第2の候補、第3の候補の候補と置き換えつつ文法的な解析を成功するまで実行する。
【0029】
ここで、第2の候補、第3の候補と文字を置き換えた箇所と置き換えた文字を誤り訂正候補34として出力する。出力された誤り訂正候補34は、誤り訂正手段35により、音声認識手段1での正解率と解析の精度とをパラメータとして総合的に判断し、誤り訂正結果4として出力する。
【0030】
次に、図示の本発明に係わる特定分野辞書を利用した音声認識誤り訂正システムの実施例を用いて、音声認識手段1に入力される具体的な音声データ事例にして説明する。
【0031】
図2は、音声認識手段1に入力音声データ「とうほくにいったときざしきわらしをみた(東北に行ったとき座敷童を見た)」5が入力された場合を例に、上記の実施例に示す特定分野辞書を利用した音声認識誤り訂正システムによる処理で、入力音声データ5がどのように処理されかを、そのデータ遷移により示した図である。
【0032】
入力音声データ5を音声認識手段1に入力すると、音声情報の認識処理が実行され、自然言語文2として、21に示す結果を出力する。この自然言語文21では、「とおほく」の“お”が“う”の可能性がありその確かさの割合は50:50であること、「いった」の“いっ””が“い”の可能性があり、その確かさの割合は70:30であること、「わたし」の“た”が“ら”の可能性があり、その確かさの割合は60:40であること、以上3箇所が曖昧であるとの解析結果が得られたことを示している。
【0033】
次に、この自然言語文21に対して、自然言語文解析手段31を用いて解析処理を行う。この解析処理には、誤り訂正辞書32中の基本辞書321のみを用いる。
【0034】
この解析処理では、まず「とおほく」に対して基本辞書321を検索すると存在しない。更に、自然言語文21に存在する第2の候補である“お”を“う”に置き換え「とうほく」で検索すると“東北”と基本辞書321中に存在する。よって、誤り訂正候補341に「とおほく」と「とうほく」の解析結果の確かさは10と90であることを出力する。
【0035】
次に、「に」を助詞と判定する。ここは音声認識手段1の認識結果である自然言語文21と自然言語文解析手段31の解析結果とも特に問題ないので、そのまま「に」と判定する。
【0036】
次に、「いった」対して基本辞書321を検索すると「言った」「行った」などが検索される。このとき、直前の語が助詞の“に”であり、その前の語が「東北」と場所名の単語なので、「言った」より「行った」のほうが、優先順位が高いと判断され、解析は正常に行われる。更に、自然言語文21に存在する第2の候補である「いた」に対しても同様に解析が行われ“居た”が最有力候補と判断され、解析は正常に行われる。このように、「いった」、「いた」双方とも解析が正常に行われる。よって、誤り訂正候補341に「いった」と「いた」の解析結果による確かさは90と90であることを出力する。
【0037】
次に、「ときに」については、「時に」と解析され、解析結果とも特に問題ないので、そのまま「ときに」と判定する。
【0038】
次に「ざしき」については、「座敷」と解析され、解析結果とも特に問題ないので、そのまま「ざしき」と判定する。
【0039】
次に、「わたし」に対して基本辞書321を検索すると「私」「渡し」などが検索される。このとき、直前の語が名詞の「ざしき(座敷)」であり、「私」でも「渡し」でも接続性に問題はないものの、解析結果に疑問がある。更に、自然言語文21に存在する第2の候補である「わらし」に対しても解析を行う。この場合、基本辞書321に「わらし」はない。よって、誤り訂正候補341に「わたし」と「わらし」の解析結果による確かさは40と10であることを出力する。
【0040】
次に、「をみた」については、助詞「を」と「見た」動詞と解析され、解析結果とも特に問題ないので、そのまま「をみた」と判定する。
【0041】
ここで、「とうほく」という単語に対して、基本辞書321には特定分野として「東北地方」を示す認知ポイントがついていることより、話題抽出手段311では、この文の話題が「東北地方」であると判断し、辞書制御手段33に伝える。辞書制御手段33では、誤り訂正辞書32中の特定分野辞書322の中から東北地方に関する特定分野辞書322を検出し、自然言語文改姓手段31の解析処理に基本辞書321と東北地方に関する特定分野辞書322を利用するように制御する。そして、この自然言語文21に対して、自然言語文解析手段31を用いて解析処理を行う。
【0042】
基本辞書321と東北地方に関する特定分野辞書322を利用した再度の解析においても、自然言語文解析手段31の解析処理は、上記の
【0033】から
【0036】までは同様の処理となる。
【0043】
次の、「ざしき」および「わたし」についてであるが、「わたし」中の“た”を“ら”に置き換えた「わらし」を解析すると、東北地方に関する特定分野辞書322には、「ざしきわらし(座敷童)」が存在し、解析は正常に行われる。よって、誤り訂正候補342に「ざしきわたし」と「ざしきわらし」の解析結果による確かさは40と90であることを出力する。
【0044】
次に、「をみた」については、助詞「を」と「見た」動詞と解析され、解析結果とも特に問題ないので、そのまま“をみた”と判定する。以上で、基本辞書321と東北地方に関する特定分野辞書322を利用した再度の解析における誤り訂正候補342が完成する。
【0045】
誤り訂正手段35では、誤り訂正候補342に出力された解析結果による確かさと、自然言語文21中に出力された音声認識結果の確かさの割合を総合的に判断し、誤り訂正を行う。
【0046】
まず、「とおほく」と「とうほく」であるが、音声認識の結果が50:50の均等であり、解析結果による確かさが10と90と明らかな差がついているので「とうほく」を採択する。次に「いった」と「いた」では、音声認識の結果が70:30であり、解析結果による確かさは90と90と均等なので、「いった」を採択する。次に「ざしきわたし」と「ざしきわらし」であるが、音声認識の結果が60:40と“た”のほうが少々優勢であるが、東北地方に関する特定分野辞書322を用いた解析結果による確かさは30:70と“ら”のほうが優勢なので、「ざしきわらし」を採択する。
【0047】
以上で、入力音声データ5に対して、本発明の特定分野辞書を利用した音声認識誤り訂正システムを適用した結果得られた誤り訂正結果4として、「とうほくにいったときざしきわらしをみた(東北に行ったとき座敷童を見た)」41を得ることができる。
【0048】
【発明の効果】
以上のように、本発明の特定分野辞書を利用した音声認識誤り訂正システムを用いれば、音声認識手段1での認識結果に曖昧性や誤りがあっても、その個所を限定すると共に訂正することが可能となる。また特定分野辞書322を用いることで、幅広い分野の話題に対する誤り訂正を高い精度で実現することが可能となる。
更には、入力音声データの話題を自動的に認識できるため、話題が頻繁に変更する会話文などを誤り訂正の対象としても十分な精度で、誤りを訂正することが可能となる。
【図面の簡単な説明】
【図1】本発明の特定分野辞書を利用した音声認識誤り訂正システムを適用した場合のシステム構成の一例を示した図である。
【図2】図1に示す特定分野辞書を利用した音声認識誤り訂正システムを適用した場合のデータの遷移の一例を示した図である。
【符号の説明】
1: 音声認識手段
2: 自然言語文
21: 自然言語文の一例
3: 音声認識の誤り訂正システム
31: 自然言語文解析手段
311: 話題抽出手段
32: 誤り訂正辞書
321: 基本辞書
322: 特定分野辞書
33: 辞書制御手段
331: 辞書制御手段の出力結果の一例
34: 誤り訂正候補
341: 誤り訂正候補の一例
342: 誤り訂正候補の一例
35: 誤り訂正手段
4: 誤り訂正結果
41: 誤り訂正結果の一例
5: 入力音声データの一例
Claims (7)
- 音声データを入力とし、コンピュータで取り扱うことのできる文字コードの列に変換するとき、その認識結果である自然言語文を、各々の文字毎の認識正解率と、各々の文字毎の認識正解率順に複数の候補を出力することを特徴とする音声認識手段と、
基本的な単語を知識として単語の表記と解析に必要な文法情報を保持する基本辞書と、話題となる分野を定義しその各々の分野に特化した単語の表記と解析に必要な単語の文法情報を保持する複数の特定分野辞書群とを有することを特徴とする、誤り訂正辞書と、
前記誤り訂正辞書中の基本辞書に登録されている単語において、表記情報と解析に必要な文法情報を登録するだけでなく、話題となる分野と関連する単語においては加えて話題認知ポイントを登録することを特徴とする基本辞書と、
前記音声認識手段の認識結果である自然言語文を解析するにおいて、前記誤り訂正辞書を用いて解析対象となる自然言語文の文法的な解析を進める際に十分な解析成功率が得られなかった場合は、前記音声認識手段が出力した各々の文字毎の認識正解率の低いものから順に文字置き換えを行いつつ、解析を進めることを特徴とする自然言語文解析手段と、
前記自然言語文解析手段を用いて解析するにおいて、前記基本辞書を用いて解析対象となる自然言語文の文法的な解析を進めるときに、前記基本辞書に登録された話題認知ポイントを用いて解析対象となる自然言語文の話題抽出処理を実行することを特徴とする自然言語文の話題抽出手段と、
前記話題抽出手段が抽出した話題の情報より前記特定分野辞書群の中から適切な分野に特化した特定分野辞書を選定し、この選定した特定分野辞書と基本辞書を用いて自然言語文を解析することにより、誤り訂正候補の中から選定して訂正する誤り訂正手段とを備え、
前記音声認識手段の認識結果である自然言語文中の誤り訂正処理を実施するに際して前記自然言語文解析手段を用いて自然言語文の文法的な解析と自然言語文の話題抽出をし、その抽出した話題の情報より前記特定分野辞書群の中から適切な分野に特化した特定分野辞書を選定し、この選定した特定分野辞書と基本辞書を用いて自然言語文を解析して、訂正手段により誤り訂正候補の中から選定して誤り訂正することにより、誤り訂正の精度を向上させるようにしたことを特徴とする特定分野辞書を利用した音声認識誤り訂正システム。 - 特定分野辞書を利用した音声認識誤り訂正システムにおいて、
音声データを入力とし、コンピュータで取り扱うことのできる文字コードの列に変換するとき、その認識結果である自然言語文を、各々の文字毎の認識正解率と、各々の文字毎の認識正解率順に複数の候補を出力することを特徴とする音声認識手段。 - 特定分野辞書を利用した音声認識誤り訂正システムにおいて、
基本的な単語を知識として単語の表記と解析に必要な文法情報を保持する基本辞書と、話題となる分野を定義し、その各々の分野に特化した単語の表記と解析に必要な単語の文法情報を保持する複数の特定分野辞書群とを有することを特徴とする誤り訂正辞書。 - 特定分野辞書を利用した音声認識誤り訂正システムにおいて、
請求項3に記載する誤り訂正辞書中の基本辞書に登録されている単語について、表記情報と解析に必要な文法情報を登録するだけでなく、話題となる分野と関連する単語を加えた話題認知ポイントを登録することを特徴とする基本辞書。 - 特定分野辞書を利用した音声認識誤り訂正システムにおいて、
請求項2に記載の音声認識手段の認識結果である自然言語文を解析するに当たり、請求項3に示す誤り訂正辞書を用いて解析対象となる自然言語文の文法的な解析を進め、それでも十分な解析成功率が得られなかった場合は、請求項2に記載の音声認識手段が出力した各々の文字毎の認識正解率の低いものから順に文字置き換えを行いつつ解析を進めることを特徴とする自然言語文解析手段。 - 特定分野辞書を利用した音声認識誤り訂正システムにおいて、
請求項5に記載の自然言語文解析手段を用いて解析するに当たり、請求項4に示す基本辞書を用いて解析対象となる自然言語文の文法的な解析を進めると共に、請求項4に示す基本辞書に登録された話題認知ポイントを用いて解析対象となる自然言語文の話題抽出処理を実行することを特徴とする自然言語文の話題抽出手段。 - 特定分野辞書を利用した音声認識誤り訂正システムにおいて、
請求項2に記載の音声認識手段の認識結果である自然言語文中の誤り訂正処理を実施するに当たり、請求項6に示す話題抽出手段が抽出した話題の情報により請求項3に示す特定分野辞書群の中から適切な分野に特化した特定分野辞書を選定し、この選定した特定分野辞書と基本辞書を用いて自然言語文を解析することにより、誤り訂正の精度を向上させるようにしたことを特徴とする特定分野辞書を利用した音声認識誤り訂正システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003053540A JP2004264464A (ja) | 2003-02-28 | 2003-02-28 | 特定分野辞書を利用した音声認識誤り訂正システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003053540A JP2004264464A (ja) | 2003-02-28 | 2003-02-28 | 特定分野辞書を利用した音声認識誤り訂正システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004264464A true JP2004264464A (ja) | 2004-09-24 |
Family
ID=33118113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003053540A Pending JP2004264464A (ja) | 2003-02-28 | 2003-02-28 | 特定分野辞書を利用した音声認識誤り訂正システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004264464A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100622019B1 (ko) | 2004-12-08 | 2006-09-11 | 한국전자통신연구원 | 음성 인터페이스 시스템 및 방법 |
JP2007047488A (ja) * | 2005-08-10 | 2007-02-22 | Nippon Telegr & Teleph Corp <Ntt> | 対話方法、対話装置、対話プログラムおよび記録媒体 |
JP2017167247A (ja) * | 2016-03-15 | 2017-09-21 | パナソニックIpマネジメント株式会社 | 誤認識訂正方法、誤認識訂正装置及び誤認識訂正プログラム |
JP2018040904A (ja) * | 2016-09-06 | 2018-03-15 | トヨタ自動車株式会社 | 音声認識装置および音声認識方法 |
CN112232055A (zh) * | 2020-10-28 | 2021-01-15 | 中国电子科技集团公司第二十八研究所 | 一种基于拼音相似度与语言模型的文本检测与纠正方法 |
JP2021513103A (ja) * | 2018-02-01 | 2021-05-20 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | オーディオ情報の処理方法、装置、記憶媒体並びに電子装置 |
US20220246142A1 (en) * | 2020-01-29 | 2022-08-04 | Interactive Solutions Corp. | Conversation analysis system |
-
2003
- 2003-02-28 JP JP2003053540A patent/JP2004264464A/ja active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100622019B1 (ko) | 2004-12-08 | 2006-09-11 | 한국전자통신연구원 | 음성 인터페이스 시스템 및 방법 |
JP2007047488A (ja) * | 2005-08-10 | 2007-02-22 | Nippon Telegr & Teleph Corp <Ntt> | 対話方法、対話装置、対話プログラムおよび記録媒体 |
JP4589843B2 (ja) * | 2005-08-10 | 2010-12-01 | 日本電信電話株式会社 | 対話方法、対話装置、対話プログラムおよび記録媒体 |
JP2017167247A (ja) * | 2016-03-15 | 2017-09-21 | パナソニックIpマネジメント株式会社 | 誤認識訂正方法、誤認識訂正装置及び誤認識訂正プログラム |
US10535337B2 (en) | 2016-03-15 | 2020-01-14 | Panasonic Intellectual Property Management Co., Ltd. | Method for correcting false recognition contained in recognition result of speech of user |
JP2018040904A (ja) * | 2016-09-06 | 2018-03-15 | トヨタ自動車株式会社 | 音声認識装置および音声認識方法 |
JP2021513103A (ja) * | 2018-02-01 | 2021-05-20 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | オーディオ情報の処理方法、装置、記憶媒体並びに電子装置 |
JP7071514B2 (ja) | 2018-02-01 | 2022-05-19 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | オーディオ情報の処理方法、装置、記憶媒体並びに電子装置 |
US11475894B2 (en) | 2018-02-01 | 2022-10-18 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for providing feedback information based on audio input |
US20220246142A1 (en) * | 2020-01-29 | 2022-08-04 | Interactive Solutions Corp. | Conversation analysis system |
US11881212B2 (en) * | 2020-01-29 | 2024-01-23 | Interactive Solutions Corp. | Conversation analysis system |
CN112232055A (zh) * | 2020-10-28 | 2021-01-15 | 中国电子科技集团公司第二十八研究所 | 一种基于拼音相似度与语言模型的文本检测与纠正方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3971373B2 (ja) | ルールベース方式と翻訳パターン方式とを混合したハイブリッド自動翻訳装置 | |
Rashwan et al. | A stochastic Arabic diacritizer based on a hybrid of factorized and unfactorized textual features | |
CN111753531A (zh) | 一种基于人工智能的文本纠错方法、装置、计算机设备及存储介质 | |
CN112699665B (zh) | 一种安全报告文本的三元组抽取方法、装置及电子设备 | |
Wu et al. | Efficient disfluency detection with transition-based parsing | |
Schaefer et al. | A two-step approach for automatic OCR post-correction | |
US6944588B2 (en) | Method and apparatus for factoring unambiguous finite state transducers | |
US6961693B2 (en) | Method and apparatus for factoring ambiguous finite state transducers | |
CN110826301B (zh) | 标点符号添加方法、系统、移动终端及存储介质 | |
JP2004264464A (ja) | 特定分野辞書を利用した音声認識誤り訂正システム | |
KR100617318B1 (ko) | 2단계 구문분석을 통한 자동 번역 장치 및 방법 | |
US7107205B2 (en) | Method and apparatus for aligning ambiguity in finite state transducers | |
Recski | Hungarian noun phrase extraction using rule-based and hybrid methods | |
US6952667B2 (en) | Method and apparatus for extracting infinite ambiguity when factoring finite state transducers | |
US6965858B2 (en) | Method and apparatus for reducing the intermediate alphabet occurring between cascaded finite state transducers | |
JP4220151B2 (ja) | 音声対話装置 | |
Ryu et al. | Transformer‐based reranking for improving Korean morphological analysis systems | |
US6760636B2 (en) | Method and apparatus for extracting short runs of ambiguity from finite state transducers | |
US6959273B2 (en) | Method and apparatus for factoring finite state transducers with unknown symbols | |
Manohar et al. | Spellchecker for Malayalam using finite state transition models | |
JPH11328316A (ja) | 文字認識装置、方法及び記憶媒体 | |
Saini et al. | Shahmukhi to Gurmukhi transliteration system | |
CN113033188B (zh) | 一种基于神经网络的藏文语法纠错方法 | |
JP2004259237A (ja) | 自然言語解析における自動話題認知解析システム | |
JPS6229796B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060301 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20060530 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060530 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081028 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090512 |