JPWO2012131822A1 - 音声認識結果整形装置、音声認識結果整形方法及びプログラム - Google Patents
音声認識結果整形装置、音声認識結果整形方法及びプログラム Download PDFInfo
- Publication number
- JPWO2012131822A1 JPWO2012131822A1 JP2013506858A JP2013506858A JPWO2012131822A1 JP WO2012131822 A1 JPWO2012131822 A1 JP WO2012131822A1 JP 2013506858 A JP2013506858 A JP 2013506858A JP 2013506858 A JP2013506858 A JP 2013506858A JP WO2012131822 A1 JPWO2012131822 A1 JP WO2012131822A1
- Authority
- JP
- Japan
- Prior art keywords
- word
- data
- string
- recognition result
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
Abstract
音声データを音声認識した結果である文字列データを参照し、前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する認識結果出力手段(106)を有する音声認識結果整形装置(10)を提供する。
Description
本発明は、音声認識結果整形装置、音声認識結果整形方法及びプログラムに関する。
音声データを音声認識した結果には、認識誤りが含まれる可能性がある。このような認識誤りが含まれた文章は意味が通じないものとなる可能性があるので、当該不都合を改善する技術が望まれる。
特許文献1には、音声認識部と、GWPP計算処理部と、単語削除部と、しきい値記憶部と、再スコアリング部とを有する音声認識装置が記載されている。
当該音声認識装置は次のように動作する。すなわち、音声認識部は、音響モデル及び言語モデルを用いた統計的手法により音声認識を行い、所定の個数の仮説を出力する。GWPP計算処理部は、音声認識部より送られたN個の仮説の各々に含まれる単語各々について信頼尺度を算出し、各単語にその値を付与して単語削除部に出力する。単語削除部は、N個の仮説中の各単語に付与された信頼尺度の値が、しきい値記憶部に記憶されたしきい値よりも低い値であったときに、当該単語を仮説より削除する。しきい値記憶部は、単語を削除する際に参照するしきい値を格納する。再スコアリング部は、単語削除部より送られてきたN個の仮説各々について、各単語の信頼尺度の積を算出し、その値が最も大きな仮説を出力する。
特許文献2には、音声認識装置によって認識された認識結果文から認識誤り箇所を検出する第1ステップと、予め用意した用例コーパスから第1ステップによって認識誤り箇所が検出された認識結果文に類似する用例文を検索し、検索した各用例文から認識誤り箇所に対応する代替候補を抽出する第2ステップと、第2ステップで抽出された各代替候補から最適候補を選択する第3ステップと、を備えている音声認識における認識誤り箇所の訂正方法が開示されている。
特許文献3には、入力されたテキスト中の述語または動作性名詞についての項構造を出力する言語処理装置であって、述語または動作性名詞とそれ以外の単語または単語属性間の係り受け状態を述語または動作性名詞とそれ以外の単語との格関係へ変換する規則を記憶した格変換規則記憶手段と、テキストの係り受け状態及び格変換規則記憶手段の格関係へ変換する規則を適用して、入力されたテキストを述語及び動作性名詞の項構造へ変換して出力する格変換手段と、を備えることを特徴とする言語処理装置が開示されている。
特許文献4には、日本語文字列中の単語の表記を自動的に訂正する装置の単語訂正方法において、文書作成者が訂正したい単語の情報を保持する手段と、該訂正情報を登録する手段と、活用語尾や助動詞などの基本用語について、訂正に必要な情報を保持する手段と、入力された日本語文書に対し、日本語単語辞書を用いて単語分割および品詞活用認定を行う手段と、該訂正情報保持手段で指示された訂正対象単語を検出する手段と、単語の訂正を行う手段とを備え、予め文書作成者は、訂正情報保持手段を用いて訂正対象単語と置換単語とを指定し、活用語尾や助動詞等の付属語について置換後の品詞活用に応じた見出しを基本用語訂正情報保持手段に格納しておき、該単語分割・品詞活用認定手段で行った単語分割および品詞活用認定の結果と訂正対象単語とを照合して一致する箇所を検出し、検出した箇所について訂正対象単語を置換単語と置換するとともに、その訂正対象単語に付随する付属語を、基本用語訂正情報保持手段を検索して置換する日本語文書の単語訂正方法が開示されている。
J. Lafferty, A. McCallum, and F. Pereira.Conditional random fields: Probabilistic models for segmenting and labeling sequence data, In Proc. of ICML, pp.282-289, 2001.
特許文献1に開示の音声認識装置は、単語削除部にて音声認識により得られた仮説の各単語について信頼尺度に基づき単語単位で削除の判定を行い、さらに、再リスコアリング部にて単語が削除された仮説に対して再リスコアリングを行って、最尤の仮説を選択、出力している。このため、削除されるのは、信頼尺度により誤りと判定された単語そのもの、もしくは1つの仮説全体となる。よって、最終的に再リスコアリング部により出力された仮説も、元の認識結果から信頼尺度により認識誤りと判定された単語のみが除かれた文であり、その単語が削除されたことにより、例えば付属語が連続するなど、日本語として不自然な文となったり、文意が通らない文となったりすることがある。
また、特許文献4に開示の単語訂正方法は、事前に訂正すべき単語を指定した訂正情報を参照して、入力文から置換単語を検出する。また、入力文中に含まれる同一の単語に対しては、同一の処理が行われる。このように、特許文献4に開示の技術の場合、訂正内容の幅が狭小になってしまうため、十分な訂正が行えない。特許文献2及び3に記載の技術においても、訂正の内容は十分なものといえない。
そこで、本発明では、音声データを音声認識した結果である文字列データを、適切に整形する手段を提供することを課題とする。
本発明によれば、音声データを音声認識した結果である文字列データを参照し、前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する認識結果出力手段を有する音声認識結果整形装置が提供される。
また、本発明によれば、音声データを音声認識した結果である文字列データを参照し、前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する認識結果出力手段としてコンピュータを、機能させるためのプログラムが提供される。
また、本発明によれば、音声データを音声認識した結果である文字列データを参照し、前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する処理を、コンピュータが行う音声認識結果整形方法が提供される。
また、本発明によれば、音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを参照し、前記認識結果信頼度に基づいて、前記文字列データから除去する低信頼度単語列を決定するとともに、当該低信頼度単語列の前後に位置する単語列である除去検討単語列を前記文字列データから除去もしくは他のデータに置換するか否か決定する変換単語決定手段と、前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段と、を有する音声認識結果整形装置が提供される。
また、本発明によれば、音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを参照し、前記文字列データを文節ごとに分割するとともに、前記文節ごとに、他の文節との係り受け関係を判断する単語依存度算出手段と、前記認識結果データを参照し、前記認識結果信頼度に基づいて、前記文字列データから除去する低信頼度単語列及び当該低信頼度単語列を含む文節を前記文字列データから除去するよう決定するとともに、当該文節が係り受け先である文節を前記文字列データから除去もしくは他のデータに置換するよう決定する変換単語決定手段と、前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段と、を有する音声認識結果整形装置が提供される。
本発明によれば、音声データを音声認識した結果である文字列データを、適切に整形することが可能となる。
上述した目的、および、その他の目的、特徴および利点は、以下に述べる好適な実施の形態、および、それに付随する以下の図面によって、さらに明らかになる。
本実施形態の音声認識結果整形装置の機能ブロック図の一例である。
本実施形態の音声認識結果整形方法の処理の流れの一例を示したフローチャートである。
本実施形態の作用効果を説明するための図である。
本実施形態の作用効果を説明するための図である。
以下、本発明の実施の形態について図面を用いて説明する。
なお、本実施形態の各部は、任意のコンピュータのCPU、メモリ、メモリにロードされたプログラム(あらかじめ機器を出荷する段階からメモリ内に格納されているプログラムのほか、CD等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムも含む)、そのプログラムを格納するハードディスク等の記憶ユニット、ネットワーク接続用インタフェースを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、機器にはいろいろな変形例があることは、当業者には理解されるところである。
また、本実施形態の説明において利用する機能ブロック図は、ハードウエア単位の構成ではなく、機能単位のブロックを示している。これらの図においては、本実施形態の各装置は1つの機器により実現されるよう記載されているが、その実現手段はこれに限定されない。すなわち、物理的に分かれた構成であっても、論理的に分かれた構成であっても構わない。
図1を参照すると、本実施形態の音声認識結果整形装置10は、認識結果記憶手段101と、単語依存度算出モデル記憶手段102と、単語依存度算出手段103と、変換ルール記憶手段104と、変換単語決定手段105と、認識結果出力手段106とを有する。以下、各手段について説明する。
認識結果記憶手段101は、認識結果データを保持する。認識結果データは、音声データを音声認識した結果である文字列データ(以下、単に「文字列データ」という)を含む。文字列データは単語列(1つ以上の単語)ごとに分割され、各単語列には音声認識の認識結果信頼度が対応付けられている。なお、音声認識結果整形装置10は、音声データを取得し、音声認識する音声認識手段をさらに有してもよい(図示せず)。そして、当該音声認識手段が生成した認識結果データを、認識結果記憶手段101に保持させてもよい。音声認識手段は従来技術に準じて実現することができる。
なお、認識結果記憶手段101は、その他、各単語列に対する形態素情報や、文字列データを構文解析した結果情報、具体的には、文字列データを文節に分解した結果を示す情報や、文節ごとに、他の文節との係り受け関係を示した情報や、単語列ごとに自立語か付属語かを示した情報などを記憶してもよい。これらの情報は、従来技術を利用して、コンピュータが自動で解析することができる。音声認識結果整形装置10は、これらの情報を解析する手段を備えておき(図示せず)、認識結果データである文字列データを取得すると、従来技術を利用して当該文字列データを自動で解析し、解析結果を、認識結果記憶手段101に保持させてもよい。
単語依存度算出モデル記憶手段102は、単語列ごとに、他の単語列との結びつき度合を示す単語依存度を判断するための情報を記憶している。例えば、単語依存度算出モデル記憶手段102は、隣接する単語列との文脈の依存関係を数値化した単語依存度を求めるための単語依存度算出モデルを記憶してもよい。また、単語依存度算出モデル記憶手段102は、文節同士の係り受け関係を基に単語依存度を求めるための単語依存度算出モデルを記憶してもよい。
単語依存度算出モデルとしては、例えば、識別モデルや単語列の属性に基づく関数等が考えられる。以下、単語依存度算出モデルの例を示す。
「単語依存度算出モデル1」:一例としては、数1のように、単語列の属性に基づいて求めるモデルが考えられる。すなわち、ある単語列Wiが付属語である場合には1、自立語である場合には0とする関数を含むモデルである。
「単語依存度算出モデル2」:別の一例としては、係り受け先の文節の有無に基づいて単語依存度を求める単語依存度算出モデルも考えられる。例えば、「想定の範囲」という単語列があったとき、「想定の」は「範囲」に掛かる連体修飾節である。この時、「想定」および「の」は係り受け元の文節(単語列)が存在しないため単語依存度を0、「範囲」は係り受け元の文節が存在するため、単語依存度を1と設定するモデルである。
上述の2つの例では、単語依存度を{0、1}の二値(離散値)で表現したが、単語依存度を連続値で表現することも考えられる。例えば、CRF(非特許文献1)などの識別モデルを扱うことが考えられる。すなわち、隣接単語列が削除されたときに当該単語列が削除もしくは置換されるかのラベルが付与された学習データを用意し、これらを用いて単語列の表記や品詞などを素性とする識別モデルを学習することで、入力のテキスト(認識結果)の各単語列について、隣接単語列が削除もしくは置換されたときに当該単語列が削除もしくは置換される尤度(確率)を算出可能となる。
単語依存度算出手段103は、文字列データに含まれる単語列ごとに、他の単語列との結びつき度合を示す単語依存度を算出する。単語依存度算出手段103は、単語依存度算出モデル記憶手段102に記憶された単語依存度算出モデルを参照して、各単語列の単語依存度を求める。
例えば、単語依存度算出モデルが上述の数1の場合は、単語依存度算出手段103は、単語列ごとに自立語であるか付属語であるかを判断し、付属語である場合は1(単語依存度)、自立語である場合は0(単語依存度)を出力して、各単語列に対応付ける。その他、単語依存度算出手段103は、単語列ごとに当該単語列を含む文節と係り受け関係にある、係り受け元の文節があるか否か求め、係り受け元(の文節)がある場合には1(単語依存度)、係り受け元(の文節)がない場合には0(単語依存度)を出力して、各単語列に対応付ける。この時、各単語列に、係り受け元の文節を特定する情報を付与してもよい。なお、単語依存度算出手段103は、認識結果記憶手段101に記憶されている情報を利用して、単語情報、具体的には、各単語列が自立語であるか付属語であるかや、文節の係り受け関係などを求めることができる。
変換ルール記憶手段104は、文字列データから単語列を除去もしくは他のデータに置換するか否かを判定するルールを記述した変換ルールを記憶する。変換ルールは大きく2つに分けることができる。
「変換ルール1」:認識結果信頼度が所定値(設計的事項)より低い単語列である低信頼度単語列を、認識結果データである文字列データから除去もしくは他のデータに置換する。なお、認識結果信頼度は0から1の値を取り、前記所定値は予め別のデータにて求めた最適な値を用いてもよい。
「変換ルール2」:所定の条件を満たす場合、低信頼度単語列の前後に位置する単語列である除去検討単語列を除去もしくは他のデータに置換する。
なお、「低信頼度単語列の前後に位置する」とは、文字列データにおいて、低信頼度単語列の前後に位置することを意味する。
変換ルール2の具体例としては、次のようなものが考えられる。
「変換ルール2−1」:低信頼度単語列が自立語である場合、すなわち、単語依存度が1のとき、当該低信頼度単語列の後ろに位置する除去検討単語列が付属語列ならば、当該除去検討単語列を除去もしくは他のデータに置換する。
「変換ルール2−2」:低信頼度単語列が付属語である場合、すなわち、単語依存度が0のとき、当該低信頼度単語列の前に位置する除去検討単語列が付属語列(1つ以上の付属語が連続した列)ならば、当該除去検討単語列を除去もしくは他のデータに置換する。
「変換ルール2−3」:低信頼度単語列が付属語である場合、すなわち、単語依存度が0のとき、当該低信頼度単語列の後ろに位置する除去検討単語列が付属語列(1つ以上の付属語が連続した列)ならば、当該除去検討単語列を除去もしくは他のデータに置換する。
上記変換ルール1、2、2−1乃至2−3は、単語依存度算出モデル1を適用することを前提にしたものである。単語依存度算出モデル2を適用した場合、変換ルールは以下のように読み替えられる。
「変換ルール1´」:認識結果信頼度が所定値(設計的事項)より低い単語列である低信頼度単語列を含む文節を、認識結果データである文字列データから除去もしくは他のデータに置換する。なお、認識結果信頼度は0から1の値を取り、前記所定値は予め別のデータにて求めた最適な値を用いてもよい。
「変換ルール2´」:低信頼度単語列を含む文節を係り受け先の文節とする文節に含まれる単語列を除去もしくは他のデータに置換する。
変換単語決定手段105は、変換ルール記憶手段104が保持する変換ルールに基づいて、認識結果記憶手段101が保持する文字列データから、所定の単語列を除去もしくは他のデータに置換するか否かを決定する。具体的には二段階で処理を行う。
変換単語決定手段105は、まず、以下の段階1の処理を行う。
「段階1」:変換ルール1に従い、認識結果信頼度が所定値(設計的事項)より低い単語列(低信頼度単語列)を特定し、当該低信頼度単語列を文字列データから除去もしくは他のデータに置換するよう決定する。
例えば、変換単語決定手段105は、予め、上記所定値を保持しておき、当該所定値と、文字列データに含まれる各単語列に対応付けられた認識結果信頼度とを大小比較していくことで、低信頼度単語列を特定する。そして、特定した低信頼度単語列を、文字列データから除去もしくは他のデータに置換するよう決定する。
段階1の処理の後、変換単語決定手段105は、以下の段階2の処理を行う。
「段階2」:変換ルール2に従い、所定の条件を満たす場合、低信頼度単語列の前後に位置する単語列である除去検討単語列を除去もしくは他のデータに置換するよう決定する。
例えば、変換単語決定手段105は、低信頼度単語列が自立語か付属語かを単語依存度より判断し、自立語である場合には、上記変換ルール2−1を適用して、以下の処理を行う。すなわち、変換単語決定手段105は、低信頼度単語列の後ろの除去検討単語列が付属語列か否かを判断し、付属語列である場合には、当該除去検討単語列を除去もしくは他のデータに置換するよう決定する。そして、低信頼度単語列の後ろの除去検討単語列が自立語である場合には、当該除去検討単語列は除去もしくは他のデータに置換せず、そのまま文字列データに残すことを決定する。なお、かかる場合、低信頼度単語列の前の除去検討単語列は処理対象外である。すなわち、そのまま文字列データに残される。
一方、低信頼度単語列が付属語列である場合には、変換単語決定手段105は上記変換ルール2−2及び2−3を適用して、以下の処理を行う。すなわち、変換単語決定手段105は、低信頼度単語列の前及び後ろの除去検討単語列各々が付属語列か否かを判断し、付属語列である場合には、その除去検討単語列を除去もしくは他のデータに置換するよう決定する。そして、除去検討単語列が自立語である場合には、当該除去検討単語列は除去もしくは他のデータに置換せず、そのまま文字列データに残すことを決定する。
なお、上記段階1及び2は、単語依存度算出モデル1を適用することを前提にしたものである。単語依存度算出モデル2を適用した場合、変換単語決定手段105は、以下の二段階で処理を行う。
「段階1´」:変換ルール1´に従い、認識結果信頼度が所定値(設計的事項)より低い単語列である低信頼度単語列を含む文節を、認識結果データである文字列データから除去もしくは他のデータに置換するよう決定する。
例えば、変換単語決定手段105は、予め、上記所定値を保持しておき、当該所定値と、文字列データに含まれる各単語列に対応付けられた認識結果信頼度とを大小比較していくことで、低信頼度単語列を特定する。その後、低信頼度単語列を含む文節を特定し、特定した文節を、文字列データから除去もしくは他のデータに置換するよう決定する。
段階1´の処理の後、変換単語決定手段105は、以下の段階2´の処理を行う。
「段階2´」:変換ルール2´に従い、低信頼度単語列を含む文節を係り受け先の文節とする文節に含まれる単語列を除去もしくは他のデータに置換するよう決定する。
例えば、変換単語決定手段105は、認識結果記憶手段101が保持する情報を利用して、低信頼度単語列を含む文節を係り受け先の文節とする文節を特定し、当該文節に含まれる単語列を除去もしくは他のデータに置換するよう決定する。なお、除去もしくは置換される単語列は、1単語であっても複数単語であってもよい。
認識結果出力手段106は、認識結果データの文字列データを基に、変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する。なお、置換するデータ、すなわち、置換される単語列に代えて新たに文字列データに追加するデータは、1つまたは複数の単語であってもよいし、句読点や「*」などの記号や改行、空白文字、数字等でもよい。
認識結果出力手段106による出力手段は特段制限されず、ディスプレイ、印刷装置、スピーカなどのあらゆる出力装置を利用することができる。
次に、図2及び3を用いて、本実施形態の動作例を説明する。
ここでは、単語依存度算出手段103は単語依存度算出モデル1に基づいて単語依存度を算出する。また、変換単語決定手段105は、変換ルール1、2、2−1乃至2−3に基づき、所定の処理を実行する。
図3において「認識」として示す文章は、「正解」として示す文章の音声データを音声認識した結果(文字列データ)である。当該文字列データは、縦線で示されるように、単語列ごとに分割されている。
図3において「正解」及び「認識」として示す文章を比較すると、「期初」を「記帳」と間違って音声認識したことが分かる。かかる場合、音声認識結果の文章全文は「売上高はほぼ記帳の想定の範囲に収まった。」と理解不能な文章となっている。本実施形態によれば、当該文字列データを以下のように整形する。
まず、単語依存度算出手段103は、単語依存度算出モデル1に基づいて単語依存度を算出する(図2のS201)。
具体的には、単語列ごとに自立語か付属語かを判断し、付属語である場合には1、自立語である場合には0を当該単語列に対応付ける。結果、図3に示すような単語依存度のデータが作成される。
その後、変換単語決定手段105は、変換ルール1に従い、認識結果信頼度が所定値(設計的事項)より低い単語列(低信頼度単語列)を特定し、当該低信頼度単語列を文字列データから除去するよう決定する(図2のS202)。
具体的には、ここでは、変換単語決定手段105は予め所定値「0.5」を保持しているとする。変換単語決定手段105は、所定値「0.5」と、文字列データに含まれる各単語列に対応付けられた認識結果信頼度とを大小比較していき、所定値より小さい認識結果信頼度が対応付けられている「記帳」(認識結果信頼度:0.3)を、低信頼度単語列として特定する。そして、変換単語決定手段105は、低信頼度単語列である「記帳」を文字列データから除去するよう決定する。
その後、変換単語決定手段105は、変換ルール2に従い、所定の条件を満たす場合、低信頼度単語列の前後に位置する単語列である除去検討単語列を除去するよう決定する(図2のS203)。
具体的には、変換単語決定手段105は、まず、低信頼度単語列である「記帳」の単語依存度を参照する。ここで、変換単語決定手段105は、「記帳」の単語依存度は1であることから「自立語」と判断する。すると、変換単語決定手段105は変換ルール2−1に従い、「記帳」(低信頼度単語列)の後ろに位置する除去検討単語列「の」が付属語か否かを判断する。ここで、単語依存度が0であるため、「付属語」と判断する。そして、変換単語決定手段105は、変換ルール2−1に従い、除去検討単語列「の」を除去すると決定する。
その後、認識結果出力手段106は、文字列データから、図2のS202及びS203で変換単語決定手段105が除去すると決定した単語列を除去した整形後文字列データを作成し、出力する(図2のS204)。
具体的には、認識結果出力手段106は、図3に「認識」として示す文字列データ「売上高はほぼ記帳の想定の範囲に収まった。」から、変換単語決定手段105が除去すると決定した「記帳」及び「の」を除去し、図3に「認識結果」として示すように、整形後文字列データ「売上高はほぼ想定の範囲に収まった。」を作成して、出力する。
ここで、S203においては、S203で除去すると決定した除去検討単語列の前後に位置する単語列を新たな除去検討単語列とし、変換ルール2、2−1乃至2−3を利用して、同様の処理を行うこともできる。なお、かかる場合、これらの変換ルールに含まれる「低信頼度単語列」の文言は、「除去すると決定した除去検討単語列」と読み替える。
具体的には、変換単語決定手段105は、上記S203で除去すると決定した除去検討単語列「の」の前後に位置する単語列を、新たな除去検討単語列とし、まず、S203で除去すると決定した除去検討単語列「の」の単語依存度を参照し、変換単語決定手段105は「付属語」と判断する。すると、変換単語決定手段105は変換ルール2−3に従い、「の」の後ろに位置する除去検討単語列「想定」の単語依存度を求め、変換単語決定手段105は「自立語」と判断する。そして、変換単語決定手段105は、変換ルール2−3に従い、除去検討単語列「想定」を除去しないよう決定する。なお、除去すると決定した除去検討単語列「の」の前に位置する「記帳」はすでに除去することが決定しているので、除去検討単語列から外すことができる。
次に、図4を用いて、本実施形態の他の動作例を説明する。
ここでは、単語依存度算出手段103は単語依存度算出モデル2に基づいて単語依存度を算出する。また、変換単語決定手段105は、変換ルール1´及び2´に基づき、所定の処理を実行する。
図4において「認識」として示す文章は、「正解」として示す文章の音声データを音声認識した結果(文字列データ)である。当該文字列データは、縦線で示されるように、単語列ごとに分割されている。また、カッコで示すように、文節ごとに分割されている。さらに、矢印で示すように、文節同士の係り受け関係が示されている。例えば、文節「売上高は」は、文節「収まった」を係り受け先とすることが示されている。
図4において「正解」及び「認識」として示す文章を比較すると、「期初」を「記帳」と間違って音声認識したことが分かる。かかる場合、音声認識結果の文章全文は「売上高はほぼ記帳の想定の範囲に収まった。」と理解不能な文章となっている。本実施形態によれば、当該文字列データを以下のように整形する。
まず、単語依存度算出手段103は、単語依存度算出モデル2に基づいて単語依存度を算出する。
具体的には、単語依存度算出手段103は、文節ごとに、係り受け元の文節の有無を判断し、係り受け元がある文節に含まれる単語列の単語依存度を1、係り受け元の文節が存在しない文節に含まれる単語列の単語依存度を0とする。結果、図4に示すような単語依存度のデータが作成される。
その後、変換単語決定手段105は、変換ルール1´に従い、認識結果信頼度が所定値(設計的事項)より低い単語列(低信頼度単語列)を特定し、当該低信頼度単語列を含む文節を文字列データから除去するよう決定する。
具体的には、ここでは、変換単語決定手段105は予め所定値「0.5」を保持しているとする。変換単語決定手段105は、所定値「0.5」と、文字列データに含まれる各単語列に対応付けられた認識結果信頼度とを大小比較していき、所定値より小さい認識結果信頼度が対応付けられている「記帳」(認識結果信頼度:0.3)を、低信頼度単語列として特定する。そして、変換単語決定手段105は、低信頼度単語列である「記帳」を含む文節「記帳の」を、文字列データから除去するよう決定する。
その後、変換単語決定手段105は、変換ルール2´に従い、低信頼度単語列を含む文節を係り受け先の文節とする文節に含まれる単語列を除去するよう決定する。
具体的には、変換単語決定手段105は、文節「記帳の」を係り受け先の文節とする文節があるかを単語依存度より判定する。ここでは、文節「記帳の」の単語依存度は0であるため、これを係り受け先の文節とする文節はない。そこで、変換単語決定手段105は、変換ルール2´に従い、他の文節は除去せず、そのまま文字列データに残すことを決定する。
その後、認識結果出力手段106は、文字列データから、変換単語決定手段105が除去すると決定した単語列を除去した整形後文字列データを作成し、出力する。
具体的には、認識結果出力手段106は、図4に「認識」として示す文字列データ「売上高はほぼ記帳の想定の範囲に収まって」から、変換単語決定手段105が除去すると決定した単語列「記帳」及び「の」を除去し、図4に「認識結果」として示すように、整形後文字列データ「売上高はほぼ想定の範囲に収まった。」を作成して、出力する。
本実施形態は、認識結果データである文字列データが英語である場合も同様に処理することができる。
なお、本実施形態の音声認識結果整形装置は、以下のプログラムをコンピュータにインストールすることで実現することができる。
音声データを音声認識した結果である文字列データを参照し、前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する認識結果出力手段、
としてコンピュータを、機能させるためのプログラム。
としてコンピュータを、機能させるためのプログラム。
認識結果及び認識結果信頼度を入力とし、
隣接する単語列との文脈の依存関係を示す単語依存度算出手段、
単語依存度を算出する単語依存度算出モデルを記憶した単語依存度算出モデル記憶手段、
単語列を削除もしくは置換する際に、その単語列を変換するルールを記述した変換ルール記憶手段、
認識結果信頼度と単語依存度と変換ルールに従って、出力表記を決定する変換単語決定手段、
としてコンピュータを機能させるためのプログラム。
隣接する単語列との文脈の依存関係を示す単語依存度算出手段、
単語依存度を算出する単語依存度算出モデルを記憶した単語依存度算出モデル記憶手段、
単語列を削除もしくは置換する際に、その単語列を変換するルールを記述した変換ルール記憶手段、
認識結果信頼度と単語依存度と変換ルールに従って、出力表記を決定する変換単語決定手段、
としてコンピュータを機能させるためのプログラム。
コンピュータを、
音声データを音声認識した結果である文字列データを保持する認識結果記憶手段、
前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する認識結果出力手段、
として機能させるためのプログラム。
音声データを音声認識した結果である文字列データを保持する認識結果記憶手段、
前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する認識結果出力手段、
として機能させるためのプログラム。
コンピュータを、
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持する認識結果記憶手段、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列を前記文字列データから除去するよう決定するとともに、当該単語列の前後に位置する単語列である除去検討単語列を前記文字列データから除去もしくは他のデータに置換するか否か決定する変換単語決定手段、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段、
して機能させるためのプログラム。
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持する認識結果記憶手段、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列を前記文字列データから除去するよう決定するとともに、当該単語列の前後に位置する単語列である除去検討単語列を前記文字列データから除去もしくは他のデータに置換するか否か決定する変換単語決定手段、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段、
して機能させるためのプログラム。
コンピュータを、
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持する認識結果記憶手段、
前記文字列データを文節ごとに分割するとともに、前記文節ごとに、他の文節との係り受け関係を判断する単語依存度算出手段、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列が含まれる文節を前記文字列データから除去するよう決定するとともに、当該文節が係り受け先である文節に含まれる単語列を前記文字列データから除去もしくは他のデータに置換するよう決定する変換単語決定手段、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段、
として機能させるためのプログラム。
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持する認識結果記憶手段、
前記文字列データを文節ごとに分割するとともに、前記文節ごとに、他の文節との係り受け関係を判断する単語依存度算出手段、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列が含まれる文節を前記文字列データから除去するよう決定するとともに、当該文節が係り受け先である文節に含まれる単語列を前記文字列データから除去もしくは他のデータに置換するよう決定する変換単語決定手段、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段、
として機能させるためのプログラム。
本実施形態の音声認識結果整形装置、音声認識結果整形方法及びプログラムによれば、音声データを音声認識した結果である文字列データを、適切に整形することが可能となる。結果、音声データを音声認識した結果である文字列データを、自然な日本語の文章に変換することができる。
なお、上記説明によれば、以下の発明の説明もなされている。
<発明1>
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持する認識結果記憶手段と、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列を前記文字列データから除去するよう決定するとともに、当該単語列の前後に位置する単語列である除去検討単語列を前記文字列データから除去もしくは他のデータに置換するか否か決定する変換単語決定手段と、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段と、
を有する音声認識結果整形装置。
<発明2>
発明1に記載の音声認識結果整形装置において、
前記認識結果データに含まれる単語列ごとに、他の単語列との結びつき度合を示す単語列依存度を判断する単語依存度算出手段をさらに有し、
前記変換単語決定手段は、前記単語列依存度を利用して、前記除去検討単語列を除去もしくは他のデータに置換するか否かを決定する音声認識結果整形装置。
<発明3>
発明2に記載の音声認識結果整形装置において、
前記変換単語決定手段は、除去もしくは他のデータに置換するよう決定した前記除去検討単語列の前後に位置する単語列を新たな除去検討単語列とし、前記文字列データから除去もしくは他のデータに置換するか否か決定する音声認識結果整形装置。
<発明4>
発明2または3に記載の音声認識結果整形装置において、
前記単語依存度算出手段は、単語列ごとに自立語か付属語かを判断し、
前記変換単語決定手段は、前記低信頼度単語列が自立語及び付属語のいずれであるか、及び、当該低信頼度単語列の前後に位置する前記除去検討単語列が自立語及び付属語のいずれであるか、に基づいて、当該除去検討単語列を除去もしくは他のデータに置換するか否かを決定する音声認識結果整形装置。
<発明5>
発明4に記載の音声認識結果整形装置において、
前記変換単語決定手段は、前記低信頼度単語列が自立語である場合、当該低信頼度単語列の後ろに位置する前記除去検討単語列が付属語か否かを判断し、付属語である場合は、当該除去検討単語列を除去もしくは他のデータに置換するよう決定する音声認識結果整形装置。
<発明6>
発明4または5に記載の音声認識結果整形装置において、
前記変換単語決定手段は、前記低信頼度単語列が付属語である場合、当該低信頼度単語列の前後に位置する前記除去検討単語列が付属語か否かを判断し、付属語である場合は、当該除去検討単語列を除去もしくは他のデータに置換するよう決定する音声認識結果整形装置。
<発明7>
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持する認識結果記憶手段と、
前記文字列データを文節ごとに分割するとともに、前記文節ごとに、他の文節との係り受け関係を判断する単語依存度算出手段と、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列が含まれる文節に含まれる単語列を前記文字列データから除去するよう決定するとともに、当該文節が係り受け先である文節に含まれる単語列を前記文字列データから除去もしくは他のデータに置換するよう決定する変換単語決定手段と、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段と、
を有する音声認識結果整形装置。
<発明8>
コンピュータを、
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持する認識結果記憶手段、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列を前記文字列データから除去するよう決定するとともに、当該単語列の前後に位置する単語列である除去検討単語列を前記文字列データから除去もしくは他のデータに置換するか否か決定する変換単語決定手段、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段、
として機能させるためのプログラム。
<発明9>
コンピュータを、
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持する認識結果記憶手段、
前記文字列データを文節ごとに分割するとともに、前記文節ごとに、他の文節との係り受け関係を判断する単語依存度算出手段、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列が含まれる文節を前記文字列データから除去するよう決定するとともに、当該文節が係り受け先である文節に含まれる単語列を前記文字列データから除去もしくは他のデータに置換するよう決定する変換単語決定手段、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段、
として機能させるためのプログラム。
<発明10>
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持しておき、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列を前記文字列データから除去するよう決定するとともに、当該単語列の前後に位置する単語列である除去検討単語列を前記文字列データから除去もしくは他のデータに置換するか否か決定する変換単語列決定ステップと、
前記認識結果データを基に、前記変換単語決定ステップで除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力ステップと、
をコンピュータが実行する音声認識結果整形方法。
<発明11>
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持しておき、
前記文字列データを文節ごとに分割するとともに、前記文節ごとに、他の文節との係り受け関係を判断する単語依存度算出ステップと、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列が含まれる文節を前記文字列データから除去するよう決定するとともに、当該文節が係り受け先である文節に含まれる単語列を前記文字列データから除去もしくは他のデータに置換するよう決定する変換単語決定ステップと、
前記認識結果データを基に、前記変換単語決定ステップで除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力ステップと、
をコンピュータが実行する音声認識結果整形方法。
<発明12>
音声データを音声認識した結果である文字列データを保持する認識結果記憶手段と、
前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する認識結果出力手段と、
を有する音声認識結果整形装置。
<発明13>
発明12に記載の音声認識結果整形装置において、
前記認識結果出力手段は、
前記認識誤りの単語列が自立語である場合、その後に位置する付属語列を前記文字列データから除去もしくは他のデータに置換した前記整形後文字列データを出力し、
前記認識誤りの単語列が付属語である場合、その前及び後に位置する付属語列を前記文字列データから除去もしくは他のデータに置換した前記整形後文字列データを出力する音声認識結果整形装置。
<発明14>
発明12または13に記載の音声認識結果整形装置において、
前記文字列データに含まれる単語列ごとに、他の単語列との結びつき度合を示す単語列依存度を判断する単語依存度算出手段と、
前記単語列依存度を利用して、前記認識誤りの単語列の前後に位置する単語列を、前記文字列データから除去もしくは他のデータに置換するか否かを決定する変換単語決定手段と、
をさらに有し、
前記認識結果出力手段は、前記変換単語決定手段の決定内容に従い、前記整形後文字列データを作成する音声認識結果整形装置。
<発明15>
コンピュータを、
音声データを音声認識した結果である文字列データを保持する認識結果記憶手段、
前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する認識結果出力手段、
として機能させるためのプログラム。
<発明16>
音声データを音声認識した結果である文字列データを保持しておき、
前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する処理を、コンピュータが行う音声認識結果整形方法。
<発明1>
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持する認識結果記憶手段と、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列を前記文字列データから除去するよう決定するとともに、当該単語列の前後に位置する単語列である除去検討単語列を前記文字列データから除去もしくは他のデータに置換するか否か決定する変換単語決定手段と、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段と、
を有する音声認識結果整形装置。
<発明2>
発明1に記載の音声認識結果整形装置において、
前記認識結果データに含まれる単語列ごとに、他の単語列との結びつき度合を示す単語列依存度を判断する単語依存度算出手段をさらに有し、
前記変換単語決定手段は、前記単語列依存度を利用して、前記除去検討単語列を除去もしくは他のデータに置換するか否かを決定する音声認識結果整形装置。
<発明3>
発明2に記載の音声認識結果整形装置において、
前記変換単語決定手段は、除去もしくは他のデータに置換するよう決定した前記除去検討単語列の前後に位置する単語列を新たな除去検討単語列とし、前記文字列データから除去もしくは他のデータに置換するか否か決定する音声認識結果整形装置。
<発明4>
発明2または3に記載の音声認識結果整形装置において、
前記単語依存度算出手段は、単語列ごとに自立語か付属語かを判断し、
前記変換単語決定手段は、前記低信頼度単語列が自立語及び付属語のいずれであるか、及び、当該低信頼度単語列の前後に位置する前記除去検討単語列が自立語及び付属語のいずれであるか、に基づいて、当該除去検討単語列を除去もしくは他のデータに置換するか否かを決定する音声認識結果整形装置。
<発明5>
発明4に記載の音声認識結果整形装置において、
前記変換単語決定手段は、前記低信頼度単語列が自立語である場合、当該低信頼度単語列の後ろに位置する前記除去検討単語列が付属語か否かを判断し、付属語である場合は、当該除去検討単語列を除去もしくは他のデータに置換するよう決定する音声認識結果整形装置。
<発明6>
発明4または5に記載の音声認識結果整形装置において、
前記変換単語決定手段は、前記低信頼度単語列が付属語である場合、当該低信頼度単語列の前後に位置する前記除去検討単語列が付属語か否かを判断し、付属語である場合は、当該除去検討単語列を除去もしくは他のデータに置換するよう決定する音声認識結果整形装置。
<発明7>
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持する認識結果記憶手段と、
前記文字列データを文節ごとに分割するとともに、前記文節ごとに、他の文節との係り受け関係を判断する単語依存度算出手段と、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列が含まれる文節に含まれる単語列を前記文字列データから除去するよう決定するとともに、当該文節が係り受け先である文節に含まれる単語列を前記文字列データから除去もしくは他のデータに置換するよう決定する変換単語決定手段と、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段と、
を有する音声認識結果整形装置。
<発明8>
コンピュータを、
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持する認識結果記憶手段、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列を前記文字列データから除去するよう決定するとともに、当該単語列の前後に位置する単語列である除去検討単語列を前記文字列データから除去もしくは他のデータに置換するか否か決定する変換単語決定手段、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段、
として機能させるためのプログラム。
<発明9>
コンピュータを、
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持する認識結果記憶手段、
前記文字列データを文節ごとに分割するとともに、前記文節ごとに、他の文節との係り受け関係を判断する単語依存度算出手段、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列が含まれる文節を前記文字列データから除去するよう決定するとともに、当該文節が係り受け先である文節に含まれる単語列を前記文字列データから除去もしくは他のデータに置換するよう決定する変換単語決定手段、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段、
として機能させるためのプログラム。
<発明10>
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持しておき、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列を前記文字列データから除去するよう決定するとともに、当該単語列の前後に位置する単語列である除去検討単語列を前記文字列データから除去もしくは他のデータに置換するか否か決定する変換単語列決定ステップと、
前記認識結果データを基に、前記変換単語決定ステップで除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力ステップと、
をコンピュータが実行する音声認識結果整形方法。
<発明11>
音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを保持しておき、
前記文字列データを文節ごとに分割するとともに、前記文節ごとに、他の文節との係り受け関係を判断する単語依存度算出ステップと、
前記認識結果データを参照し、認識結果信頼度が所定値より低い単語列である低信頼度単語列が含まれる文節を前記文字列データから除去するよう決定するとともに、当該文節が係り受け先である文節に含まれる単語列を前記文字列データから除去もしくは他のデータに置換するよう決定する変換単語決定ステップと、
前記認識結果データを基に、前記変換単語決定ステップで除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力ステップと、
をコンピュータが実行する音声認識結果整形方法。
<発明12>
音声データを音声認識した結果である文字列データを保持する認識結果記憶手段と、
前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する認識結果出力手段と、
を有する音声認識結果整形装置。
<発明13>
発明12に記載の音声認識結果整形装置において、
前記認識結果出力手段は、
前記認識誤りの単語列が自立語である場合、その後に位置する付属語列を前記文字列データから除去もしくは他のデータに置換した前記整形後文字列データを出力し、
前記認識誤りの単語列が付属語である場合、その前及び後に位置する付属語列を前記文字列データから除去もしくは他のデータに置換した前記整形後文字列データを出力する音声認識結果整形装置。
<発明14>
発明12または13に記載の音声認識結果整形装置において、
前記文字列データに含まれる単語列ごとに、他の単語列との結びつき度合を示す単語列依存度を判断する単語依存度算出手段と、
前記単語列依存度を利用して、前記認識誤りの単語列の前後に位置する単語列を、前記文字列データから除去もしくは他のデータに置換するか否かを決定する変換単語決定手段と、
をさらに有し、
前記認識結果出力手段は、前記変換単語決定手段の決定内容に従い、前記整形後文字列データを作成する音声認識結果整形装置。
<発明15>
コンピュータを、
音声データを音声認識した結果である文字列データを保持する認識結果記憶手段、
前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する認識結果出力手段、
として機能させるためのプログラム。
<発明16>
音声データを音声認識した結果である文字列データを保持しておき、
前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する処理を、コンピュータが行う音声認識結果整形方法。
この出願は、2011年3月30日に出願された日本特許出願特願2011−075257号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
Claims (10)
- 音声データを音声認識した結果である文字列データを参照し、前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する認識結果出力手段を有する音声認識結果整形装置。
- 請求項1に記載の音声認識結果整形装置において、
前記認識結果出力手段は、
前記認識誤りの単語列が自立語である場合、その後に位置する前記付属語列を前記文字列データから除去もしくは他のデータに置換した前記整形後文字列データを出力し、
前記認識誤りの単語列が付属語である場合、その前及び後に位置する前記付属語列を前記文字列データから除去もしくは他のデータに置換した前記整形後文字列データを出力する音声認識結果整形装置。 - 請求項1または2に記載の音声認識結果整形装置において、
前記文字列データに含まれる単語列ごとに、他の単語列との結びつき度合を示す単語列依存度を判断する単語依存度算出手段と、
前記単語列依存度を利用して、前記認識誤りの単語列の前及び/又は後に位置する単語列を、前記文字列データから除去もしくは他のデータに置換するか否かを決定する変換単語決定手段と、
をさらに有し、
前記認識結果出力手段は、前記変換単語決定手段の決定内容に従い、前記整形後文字列データを作成する音声認識結果整形装置。 - 音声データを音声認識した結果である文字列データを参照し、前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する認識結果出力手段、
としてコンピュータを機能させるためのプログラム。 - 音声データを音声認識した結果である文字列データを参照し、前記文字列データの中に含まれる認識誤りの単語列を前記文字列データから除去するとともに、前記認識誤りの単語列の前及び/又は後に付属語列が位置する場合には、少なくとも一方の前記付属語列を、前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、出力する処理を、コンピュータが行う音声認識結果整形方法。
- 音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを参照し、前記認識結果信頼度に基づいて、前記文字列データから除去する低信頼度単語列を決定するとともに、当該低信頼度単語列の前後に位置する単語列である除去検討単語列を前記文字列データから除去もしくは他のデータに置換するか否か決定する変換単語決定手段と、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段と、
を有する音声認識結果整形装置。 - 請求項6に記載の音声認識結果整形装置において、
前記認識結果データに含まれる単語列ごとに、他の単語列との結びつき度合を示す単語列依存度を判断する単語依存度算出手段をさらに有し、
前記変換単語決定手段は、前記単語列依存度を利用して、前記除去検討単語列を除去もしくは他のデータに置換するか否かを決定する音声認識結果整形装置。 - 請求項7に記載の音声認識結果整形装置において、
前記変換単語決定手段は、前記低信頼度単語列が自立語である場合、当該低信頼度単語列の後ろに位置する前記除去検討単語列が付属語か否かを判断し、付属語である場合は、当該除去検討単語列を除去もしくは他のデータに置換するよう決定する音声認識結果整形装置。 - 請求項7または8に記載の音声認識結果整形装置において、
前記変換単語決定手段は、前記低信頼度単語列が付属語である場合、当該低信頼度単語列の前後に位置する前記除去検討単語列が付属語か否かを判断し、付属語である場合は、当該除去検討単語列を除去もしくは他のデータに置換するよう決定する音声認識結果整形装置。 - 音声データを音声認識した結果である文字列データであって、単語列ごとに分割され、各単語列に認識結果信頼度が対応付けられている認識結果データを参照し、前記文字列データを文節ごとに分割するとともに、前記文節ごとに、他の文節との係り受け関係を判断する単語依存度算出手段と、
前記認識結果データを参照し、前記認識結果信頼度に基づいて、前記文字列データから除去する低信頼度単語列及び当該低信頼度単語列を含む文節を前記文字列データから除去するよう決定するとともに、当該文節が係り受け先である文節を前記文字列データから除去もしくは他のデータに置換するよう決定する変換単語決定手段と、
前記認識結果データを基に、前記変換単語決定手段が除去もしくは他のデータに置換するよう決定した単語列を前記文字列データから除去もしくは他のデータに置換した整形後文字列データを作成し、前記音声データの音声認識の結果として出力する認識結果出力手段と、
を有する音声認識結果整形装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011075257 | 2011-03-30 | ||
JP2011075257 | 2011-03-30 | ||
PCT/JP2011/006627 WO2012131822A1 (ja) | 2011-03-30 | 2011-11-29 | 音声認識結果整形装置、音声認識結果整形方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2012131822A1 true JPWO2012131822A1 (ja) | 2014-07-24 |
Family
ID=46929665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013506858A Pending JPWO2012131822A1 (ja) | 2011-03-30 | 2011-11-29 | 音声認識結果整形装置、音声認識結果整形方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20140074475A1 (ja) |
JP (1) | JPWO2012131822A1 (ja) |
WO (1) | WO2012131822A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150309987A1 (en) * | 2014-04-29 | 2015-10-29 | Google Inc. | Classification of Offensive Words |
JP6604836B2 (ja) * | 2015-12-14 | 2019-11-13 | 株式会社日立製作所 | 対話テキスト要約装置及び方法 |
KR20210047173A (ko) * | 2019-10-21 | 2021-04-29 | 엘지전자 주식회사 | 오인식된 단어를 바로잡아 음성을 인식하는 인공 지능 장치 및 그 방법 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5521816A (en) * | 1994-06-01 | 1996-05-28 | Mitsubishi Electric Research Laboratories, Inc. | Word inflection correction system |
EP0849723A3 (en) * | 1996-12-20 | 1998-12-30 | ATR Interpreting Telecommunications Research Laboratories | Speech recognition apparatus equipped with means for removing erroneous candidate of speech recognition |
WO2002061728A1 (fr) * | 2001-02-01 | 2002-08-08 | Matsushita Electric Industrial Co., Ltd. | Dispositif de reconnaissance de phrases, procede de reconnaissance de phrases, programme et support |
US7565282B2 (en) * | 2005-04-14 | 2009-07-21 | Dictaphone Corporation | System and method for adaptive automatic error correction |
US20060293889A1 (en) * | 2005-06-27 | 2006-12-28 | Nokia Corporation | Error correction for speech recognition systems |
US20070094022A1 (en) * | 2005-10-20 | 2007-04-26 | Hahn Koo | Method and device for recognizing human intent |
JP2007233823A (ja) * | 2006-03-02 | 2007-09-13 | Advanced Telecommunication Research Institute International | 自動要約装置及びコンピュータプログラム |
US8751226B2 (en) * | 2006-06-29 | 2014-06-10 | Nec Corporation | Learning a verification model for speech recognition based on extracted recognition and language feature information |
US7813929B2 (en) * | 2007-03-30 | 2010-10-12 | Nuance Communications, Inc. | Automatic editing using probabilistic word substitution models |
JP4962416B2 (ja) * | 2008-06-03 | 2012-06-27 | 日本電気株式会社 | 音声認識システム |
-
2011
- 2011-11-29 US US14/008,752 patent/US20140074475A1/en not_active Abandoned
- 2011-11-29 WO PCT/JP2011/006627 patent/WO2012131822A1/ja active Application Filing
- 2011-11-29 JP JP2013506858A patent/JPWO2012131822A1/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2012131822A1 (ja) | 2012-10-04 |
US20140074475A1 (en) | 2014-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105917327B (zh) | 用于将文本输入到电子设备中的系统和方法 | |
CN108140019B (zh) | 语言模型生成装置、语言模型生成方法以及记录介质 | |
JP5599662B2 (ja) | 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法 | |
JP5440815B2 (ja) | 情報分析装置、情報分析方法、及びプログラム | |
US8335683B2 (en) | System for using statistical classifiers for spoken language understanding | |
JP5071373B2 (ja) | 言語処理装置、言語処理方法および言語処理用プログラム | |
JP5440177B2 (ja) | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
CN111859921A (zh) | 文本纠错方法、装置、计算机设备和存储介质 | |
JP6737025B2 (ja) | 符号化プログラム、検索プログラム、符号化装置、検索装置、符号化方法、及び検索方法 | |
US9135326B2 (en) | Text mining method, text mining device and text mining program | |
US20170075879A1 (en) | Detection apparatus and method | |
WO2012131822A1 (ja) | 音声認識結果整形装置、音声認識結果整形方法及びプログラム | |
KR100617318B1 (ko) | 2단계 구문분석을 통한 자동 번역 장치 및 방법 | |
KR101663038B1 (ko) | 개체의 표면형 문자열 용례학습기반에 의한 텍스트에서의 개체 범위 인식 장치 및 그 방법 | |
CN111858894A (zh) | 语义缺失的识别方法及装置、电子设备、存储介质 | |
JP2001229180A (ja) | コンテンツ検索装置 | |
US11842152B2 (en) | Sentence structure vectorization device, sentence structure vectorization method, and storage medium storing sentence structure vectorization program | |
JP5623380B2 (ja) | 誤り文修正装置、誤り文修正方法およびプログラム | |
JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
US8977538B2 (en) | Constructing and analyzing a word graph | |
JP4047900B1 (ja) | 係り受け解析装置及びそのプログラム | |
JP2009176148A (ja) | 未知語判定システム、方法及びプログラム | |
US20180033425A1 (en) | Evaluation device and evaluation method | |
JP2004157337A (ja) | トピック境界決定方法及び装置及びトピック境界決定プログラム | |
US20220028391A1 (en) | Method for processing a video file comprising audio content and visual content comprising text content |