JP4512417B2 - 認識システム及び認識方法 - Google Patents

認識システム及び認識方法 Download PDF

Info

Publication number
JP4512417B2
JP4512417B2 JP2004142782A JP2004142782A JP4512417B2 JP 4512417 B2 JP4512417 B2 JP 4512417B2 JP 2004142782 A JP2004142782 A JP 2004142782A JP 2004142782 A JP2004142782 A JP 2004142782A JP 4512417 B2 JP4512417 B2 JP 4512417B2
Authority
JP
Japan
Prior art keywords
candidate
relevance
recognition
words
relevance ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004142782A
Other languages
English (en)
Other versions
JP2005326505A (ja
Inventor
直信 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2004142782A priority Critical patent/JP4512417B2/ja
Publication of JP2005326505A publication Critical patent/JP2005326505A/ja
Application granted granted Critical
Publication of JP4512417B2 publication Critical patent/JP4512417B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

本発明は、入力データをテキストデータとして認識する認識システム及び認識方法に関する。
従来の技術では、端末装置から入力データ(例えば、音声データ、画像データ)を受信し、認識結果をテキストデータとして送信する認識システムでは、認識結果の候補を複数送信する場合、認識システムで予め定められた数の候補を送信する。その他、複数候補間の類似度に応じて認識に使用する候補数を決定する技術は開示されているが(例えば、特許文献1参照)、この場合でも、認識結果として送信する候補数は予め定められていた。
特開2003−141449号公報
このように、従来の技術では、認識結果の確度である適合率に関係なく必ず同じ数の候補を端末装置へ送信する。このため、ネットワークを介して認識システムと端末装置とが接続される場合、第1候補の適合率が大きな語句であっても、その他の候補(第2候補、第3候補、…)のような必要性の低いデータをも送信することとなり、余計な通信料が発生してしまう。
そこで、本発明は、上記の課題に鑑み、送信データ量の効率化を図り、通信コストを削減する認識システム及び認識方法を提供することを目的とする。
上記目的を達成するため、本発明の第1の特徴は、(イ)端末装置から受信した入力データに対して複数の候補語句を提示し、複数の候補語句それぞれに対して入力データとの適合度合いを示す適合率を対応付けて認識する認識手段と、(ロ)複数の候補語句に対する適合率の中で、最も高い適合率に応じて、端末装置へ送信する候補語句の数を決定する候補数算出手段と、(ハ)適合率の高い順番から、候補数算出手段によって決定された数の候補語句をテキストデータとして端末装置へ送信する送信手段とを備える認識システムであることを要旨とする。ここで、「適合率」とは、入力データが音声データである場合、音声データ(音声波形)から抽出した音素(読み)と辞書内の語句がどれくらい適合しているかを示す割合であり、値が大きいほど確度は大きい。
第1の特徴に係る認識システムによると、適合率に応じて送信する候補語句の数が変化するため、送信データ量の効率化を図り、通信コストを削減することができる。
又、第1の特徴に係る認識システムにおける候補数算出手段は、最も高い適合率と、予め算出された、複数の候補語句の中で最も高い適合率を有する第1候補語句の適合率の平均値とを比較することにより、送信する候補語句の数を決定してもよい。この認識システムによると、過去に算出された適合率の平均値に応じて、送信する候補語句の数を決定するため、より妥当な候補語句の数を決定することができる。
又、第1の特徴に係る認識システムは、認識手段から受信した認識結果のテキストデータと、端末装置による修正後のテキストデータとを照合し、端末装置によって修正された修正語句を抽出する修正箇所抽出手段とを更に備え、候補数算出手段は、修正前の語句の適合率と修正後の語句の候補順位とに基づき、複数の候補語句の中で最も高い適合率を有する第1候補語句の適合率の平均値を算出し、平均値を用いて送信する候補語句の数を決定してもよい。ここで、「候補順位」とは、複数の候補語句の中で、何番目に高い適合率を有する候補語句であるかを示す順位である。この認識システムによると、修正後のデータから、送信する候補語句の数の決定に用いる適合率を算出することにより、より妥当な候補語句の数を決定することができる。
又、第1の特徴に係る認識システムにおいて、入力データは、音声データであってもよい。この認識システムによると、携帯電話などから入力された音声波形をテキスト文書に変更することができる。
本発明の第2の特徴は、(イ)端末装置から受信した入力データに対して複数の候補語句を提示し、複数の候補語句それぞれに対して入力データとの適合度合いを示す適合率を対応付けて認識するステップと、(ロ)複数の候補語句に対する適合率の中で、最も高い適合率に応じて、端末装置へ送信する候補語句の数を決定するステップと、(ハ)適合率の高い順番から、候補数算出手段によって決定された数の候補語句をテキストデータとして端末装置へ送信するステップとを含む認識方法であることを要旨とする。
第2の特徴に係る認識方法によると、適合率に応じて送信する候補語句の数が変化するため、送信データ量の効率化を図り、通信コストを削減することができる。
本発明によると、送信データ量の効率化を図り、通信コストを削減する認識システム及び認識方法を提供することができる。
次に、図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一または類似の部分には、同一または類似の符号を付している。ただし、図面は模式的なものであることに留意すべきである。
(認識システム)
本実施形態に係る認識システムは、端末装置から音声データを受信し、適合率から算出された候補数分の候補語句をテキストデータとして送信する。又、端末装置から修正後のデータを受信し、修正前の語句の適合率及び修正後の語句の候補順位とに基づいて、候補語句の数を算出する。
本実施形態に係る認識システム1は、図1に示すように、ユーザインタフェース10と、認識エンジン20と、辞書30と、修正箇所抽出部40と、認識結果格納部50と、候補数算出部60とを備える。
ユーザインタフェース10は、認識システム1と端末装置とを接続するインタフェースである。ここで、端末装置とは、通信ネットワーク(例えば、インターネット)を介して、認識システム1に接続可能な機器を指し、例えば、PC、携帯電話、ノートパソコン、PHS、PHS、PDA、電子手帳等が使用可能である。又、端末装置は音声データを入力する手段、テキストデータを表示する手段を有する。又、ユーザインタフェース10は、端末装置から音声データを受信する受信手段、及び、後述する候補数算出部60によって決定された数の候補語句及び認識結果をテキストデータとして端末装置へ送信する送信手段を構成する。又、ユーザインタフェース10は、端末装置から修正後のテキストデータを受信する。
認識エンジン(認識手段)20は、ユーザインタフェース10を介して受信した音声データと辞書30に格納されている語句データとを照合し、入力データに対して複数の候補語句を提示する。又、認識エンジン20は、複数の候補語句それぞれに対して入力データとの適合度合いを示す適合率を対応付けて認識する。又、認識エンジン20は、認識結果の適合率と候補語句(認識結果を含む)を認識結果格納部50へ送信する。
辞書30は、音声波形から抽出した音素に対応する語句データを保持する。又、辞書30は、自立語、付属語、その接続関係情報を含む。
修正箇所抽出部(修正箇所抽出手段)40は、認識エンジン20から受信した認識結果のテキストデータと、ユーザインタフェース10から受信した端末装置による修正後のテキストデータとを照合して、修正語句を抽出する。
認識結果格納部50は、適合率格納部51と語句単位候補格納部52を有する。適合率格納部51は、認識結果の適合率を格納し、候補格納部52は候補語句(認識結果を含む)を格納する。
候補数算出部(候補数算出手段)60は、適合率格納部51に格納されている複数の候補語句の中で最も高い適合率と、予め算出された、複数の候補語句の中で最も高い適合率を有する第1候補語句の適合率の平均値とを比較することにより、送信する候補語句の数を決定する。又、候補数算出部60は、修正箇所抽出部40によって抽出された修正前の語句の適合率と修正後の語句の候補順位とに基づき、複数の候補語句の中で最も高い適合率を有する第1候補語句の適合率の平均値を算出し、この平均値を用いて送信する候補語句の数を決定する。
又、本実施形態に係る認識システム1は、処理制御装置(CPU)を有し、認識エンジン20、修正箇所抽出部40、候補数算出部60などをモジュールとしてCPUに内蔵する構成とすることができる。これらのモジュールは、パーソナルコンピュータ等の汎用コンピュータにおいて、所定のプログラム言語を利用するための専用プログラムを実行することにより実現することができる。
又、辞書30、認識結果格納部50は、それぞれ語句データ、認識結果データを保存する記録媒体である。記録媒体は、例えば、RAM、ROM、ハードディスク、フレキシブルディスク、コンパクトディスク、ICチップ、カセットテープなどが挙げられる。このような記録媒体によれば、データの保存、運搬、販売などを容易に行うことができる。
又、図示していないが、認識システム1は、認識処理、修正箇所抽出処理、候補数算出処理などを処理制御装置(CPU)に実行させるための認識プログラムを保存するプログラム保持部を備えてもよい。プログラム保持部は、例えば、RAM、ROM、ハードディスク、フレキシブルディスク、コンパクトディスク、ICチップ、カセットテープなどの記録媒体である。このような記録媒体によれば、認識プログラムの保存、運搬、販売などを容易に行うことができる。
(認識方法)
次に、本実施形態に係る認識方法について、図2及び図3を用いて説明する。
まず、本実施形態に係る認識システムを使用したメール文作成を例にとり、音声データからテキスト文書を作成する手順について、図2を用いて説明する。
(イ)ステップS101において、ユーザインタフェース10は、端末装置から受信した音声データを認識エンジン20へ送信する。音声データを受信した認識エンジン20は、ステップS102において、辞書30の語句データと照合し、入力データに対して複数の候補語句を提示する。又、認識エンジン20は、複数の候補語句それぞれに対して入力データとの適合度合いを示す適合率を対応付けて認識する。そして、ステップS103において、認識エンジン20は、認識結果を修正箇所抽出部40へ送信する。そして、ステップS104において、修正箇所抽出部40は、認識結果を格納する。
(ロ)又、認識エンジン20は、ステップS105において、認識結果の適合率(第1候補のもの)を適合率格納部51へ、ステップS108において、候補語句(認識結果を含む)を候補格納部52へそれぞれ語句単位に送信する。ここで、「第1候補」とは、複数の候補語句の中で、最も適合率の高い語句を指す。又、「語句単位」とは、語句の区切りであり、文節毎でもよく、一文字毎でもよい。そして、ステップS106において、適合率格納部51は、受信した適合率を格納し、ステップS109において、候補格納部52は、受信した候補語句(認識結果を含む)を格納する。
(ハ)次に、ステップS107において、適合率格納部51は、格納した適合率を語句単位に候補数算出部60へ送信し、候補数算出部60は、ステップS110において、受信した適合率に応じて、対応する候補語句の数を語句単位に決定する。この候補数算出処理は後に詳述する。そして、ステップS111において、語句単位候補数(認識結果を含む)を候補格納部52へ送信する。
(ニ)ステップS112において、候補格納部52は、受信した指定候補数を格納する。そして、ステップS113において、語句単位に指定された数だけ候補語句(認識結果を含む)をユーザインタフェース10へ送信する。ユーザインタフェース10は、候補語句(認識結果を含む)を端末装置へ送信する。
(ホ)一方、端末装置では、認識結果から誤認識箇所があると、まず候補を表示し、候補の中に意中の語句があった場合、それを選択して修正する。意中の語句がなかった場合は、キー操作により修正を行い、メール送信を行う。修正されたテキストデータはメールとして送信されるが、同時に認識システム1へも送信される。ステップS114において、ユーザインタフェース10は、修正後データを修正箇所抽出部40へ送信する。
(へ)次に、ステップS115において、修正箇所抽出部40は、端末装置によって修正(候補選択を含む)もしくは修正なしで送信したテキストデータと、以前に認識エンジン20によって認識された認識結果のテキストデータ(ステップS104において格納されたデータ)とを照合して修正語句を抽出する。そして、修正箇所抽出部40は、ステップS116において、修正前語句を適合率格納部51へ送信し、ステップS119において、修正後語句及び修正がなかった語句を候補格納部52へ送信する。
(ト)適合率格納部51は、ステップS117において、受信した修正前語句の適合率を抽出し、ステップS118において、適合率を候補数算出部60へ送信する。又、候補格納部52は、ステップS120において、受信した修正後語句の候補順位を抽出し、ステップS121において、候補順位を候補数算出部60へ送信する。そして、ステップS122において、候補数算出部60は、修正前の語句の適合率と修正後の語句の候補順位とに基づき、複数の候補語句の中で最も高い適合率を有する第1候補語句の適合率の平均値を算出する。この第1候補語句の適合率の平均値は、修正後の語句の候補順位別に算出され、候補数を決定する際の比較対象となるので、以下の説明において「比較適合率」と呼ぶ。この比較適合率算出処理は、後に詳述する。
次に、候補数算出部60の処理について、図3を用いて説明する。具体的には、図2におけるステップS110及びステップS122について説明する。
尚、図3では、図2のステップS110において決定する候補語句の数は、1、2、3、それ以上(任意に規定)の4パターンとし、図2のステップS122における比較適合率の算出方法は、第1候補(第1順位の候補語句)が正しい認識結果であった場合の第1候補の適合率の平均値、第2候補(第2順位の候補語句)が正しい結果であった場合の第1候補の適合率の平均値、第3候補(第3順位の候補語句)が正しい結果であった場合の第1候補の適合率の平均値をそれぞれ候補数算出の閾値として採用しているが、これらは一例であり、そのロジックは候補数を決定できるものであれば、何でもよい。
(イ)まず、ステップS201において、候補数算出部60へデータが入力されると、ステップS202において、そのデータ種別が比較適合率の算出であるのか(図2のステップS122の場合)、候補数の要求であるのか(図2のステップS110の場合)を判別する。
(ロ)そして、ステップS202において、比較適合率の算出である場合、ステップS203へ進み、修正後語句の候補順位を判別する。候補順位が4番以降であった場合は、処理を終了し、候補順位が1番、2番、3番であった場合は、それぞれステップS204、S208、S212へ進む。
(ハ)ステップS204において、Rに第1候補が正しい認識結果である場合の適合率を格納し、ステップS205において、Nに現在まで第1候補が正しい認識結果であった総サンプル数を格納する。尚、ここで第1候補が正しい認識結果である場合の適合率とは、現在まで第1候補が正しい認識結果となった場合の適合率の平均値である。よって、ステップS206において、上記R、Nから第1候補である適合率を以下の式で算出できる。
第1候補が正しい認識結果となる適合率=
(N×R+今回取得の適合率)/(N+1)… 式(1)
式(1)中の今回取得の適合率とは、今回の認識で第1候補となった語句の適合率のことである。又、ステップS207において、総サンプル数は今回取得のデータがカウントアップされるのでN+1となる。
(ニ)ステップS208〜211においても、ステップS204〜207と同様に、Rに第2候補に修正される場合の適合率を格納し、Nに現在まで第2候補に修正された総サンプル数を格納する。但し、この場合、今回取得の適合率とは、今回の認識で第2候補となった語句の適合率ではなく、第1候補の適合率である。ステップS212〜215においても、ステップS208〜211と同様の処理を行う。このように、第2候補、第3候補が正しい認識結果となる場合の適合率も第1候補が正しい認識結果となる適合率と同じ式で算出でき、算出後、総サンプル数をカウントアップして処理を終了する。
(ホ)一方、ステップS202において、入力されたデータが候補数の要求である場合、ステップS216へ進み、入力された適合率が第1候補の適合率より大きいか否か判断する。ここで使用される第1候補の適合率とは、ステップS206において算出された適合率である。ステップS216において大きい場合はステップS217へ進み、候補数を1とする。ステップS216において小さい場合は、ステップS218へ進み、第2候補の適合率と比較する。ここで使用される第2候補の適合率とは、ステップS210において算出された適合率である。ステップS218において大きい場合はステップS219へ進み、候補数を2とする。ステップS218において小さい場合は、ステップS220へ進み、第3候補の適合率と比較する。ここで使用される第3候補の適合率とは、ステップS214において算出された適合率である。ステップS220において大きい場合は、ステップS221へ進み、候補数を3とする。ステップS221において小さい場合は、ステップS222へ進み、候補数を任意に規定した固定値とする。
(へ)その後、ステップS223において、決定された候補数を候補格納部52へ送信して処理を終了する。
(作用及び効果)
本実施形態に係る認識システム及び認識方法は、複数の候補語句に対する適合率の中で、最も高い適合率に応じて、端末装置へ送信する候補語句の数を決定することができる。このため、送信データ量の効率化を図り、通信コストを削減することができる。
このように、認識結果の適合率が高い場合は誤認識している可能性が小さいため、候補数を少なく(0でもよい)し、適合率が低い場合は誤認識している可能性が大きいため、候補数を多くするというロジックを採用することにより、候補数の最適化を図ることができる。
又、本実施形態に係る認識システム及び認識方法は、最も高い適合率と、予め算出された、複数の候補語句の中で最も高い適合率を有する第1候補語句の適合率の平均値とを比較することにより、送信する候補語句の数を決定することができる。このため、過去に算出された適合率の平均値に応じて、送信する候補語句の数を決定するため、より妥当な候補語句の数を決定することができる。
又、本実施形態に係る認識システム及び認識方法は、認識手段から受信した認識結果のテキストデータと、端末装置による修正後のテキストデータとを照合し、端末装置によって修正された修正語句を抽出することができる。このため、修正前の語句の適合率と修正後の語句の候補順位とに基づき、比較適合率を変化させることができる。
又、本実施形態に係る認識システム及び認識方法は、入力データとして音声データを用いるため、携帯電話などから入力された音声波形をテキスト文書に変更することができる。
(その他の実施形態)
本発明は上記の実施形態によって記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施形態、実施例及び運用技術が明らかとなろう。
例えば、本実施形態において、入力データとして音声データを用いて説明したが、これに限らず画像データなど他のデータでもよい。
又、認識エンジン20、修正箇所抽出部40、候補数算出部60をモジュールとして一つのCPUに備えてもよいと説明したが、それぞれ異なるCPUに備えられ、異なる装置としてもよい。その場合、複数の装置間をバスなどで接続するものとする。
このように、本発明はここでは記載していない様々な実施形態等を含むことは勿論である。従って、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
本実施形態に係る認識システムの構成ブロック図である。 本実施形態に係る認識方法を示すフローチャートである。 本実施形態に係る認識方法における候補数算出方法を示すフローチャートである。
符号の説明
1 認識システム
10 ユーザインタフェース
20 認識エンジン
30 辞書
40 修正箇所抽出部
50 認識結果格納部
51 適合率格納部
52 候補格納部
60 候補数算出部

Claims (4)

  1. 端末装置から受信した入力データに対して複数の候補語句を提示し、複数の候補語句それぞれに対して前記入力データとの適合度合いを示す適合率を対応付けて認識する認識手段と、
    前記複数の候補語句に対する適合率の中で、最も高い適合率が、前記最も高い適合率を有する第1候補語句が現在までに正しい認識結果であった場合の前記適合率の平均値と、前記第1候補語句が現在までに正しい認識結果であった回数とを乗じた値に、前記認識手段により今回認識された前記最も高い適合率を加算し、前記加算によって得られた値を前記第1候補語句が現在までに正しい認識結果であった回数に1を加えた値で除算することにより、比較適合率を算出し、前記認識手段により今回認識された前記最も高い適合率が前記比較適合率より大きい場合に、送信する候補語句の数を1つに決定し、前記最も高い適合率が、前記比較適合率以下である場合に、送信する候補語句の数を複数に決定する候補数算出手段と、
    前記候補数算出手段によって決定された数の候補語句を、前記適合率の高い順に、テキストデータとして前記端末装置へ送信する送信手段と
    を備えることを特徴とする認識システム。
  2. 前記認識手段から受信した認識結果のテキストデータと、前記端末装置による修正後のテキストデータとを照合し、端末装置によって修正された修正語句を抽出する修正箇所抽出手段とを更に備え、
    前記候補数算出手段は、前記修正前の語句の適合率と前記修正後の語句の候補順位とに基づき、前記比較適合率を算出し、該比較適合率を用いて送信する候補語句の数を決定することを特徴とする請求項1に記載の認識システム。
  3. 前記入力データは、音声データであることを特徴とする請求項1又は2のいずれか1項に記載の認識システム。
  4. 端末装置から受信した入力データに対して複数の候補語句を提示し、複数の候補語句それぞれに対して前記入力データとの適合度合いを示す適合率を対応付けて認識するステップと、
    前記複数の候補語句に対する適合率の中で、最も高い適合率が、前記最も高い適合率を有する第1候補語句が現在までに正しい認識結果であった場合の前記適合率の平均値と、前記第1候補語句が現在までに正しい認識結果であった回数とを乗じた値に、前記認識手段により今回認識された前記最も高い適合率を加算し、前記加算によって得られた値を前記第1候補語句が現在までに正しい認識結果であった回数に1を加えた値で除算することにより、比較適合率を算出し、前記認識手段により今回認識された前記最も高い適合率が前記比較適合率より大きい場合に、送信する候補語句の数を1つに決定し、前記最も高い適合率が、前記比較適合率以下である場合に、送信する候補語句の数を複数に決定するステップと、
    決定された数の候補語句を、前記適合率の高い順に、テキストデータとして前記端末装置へ送信するステップと
    を含むことを特徴とする認識方法。
JP2004142782A 2004-05-12 2004-05-12 認識システム及び認識方法 Expired - Fee Related JP4512417B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004142782A JP4512417B2 (ja) 2004-05-12 2004-05-12 認識システム及び認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004142782A JP4512417B2 (ja) 2004-05-12 2004-05-12 認識システム及び認識方法

Publications (2)

Publication Number Publication Date
JP2005326505A JP2005326505A (ja) 2005-11-24
JP4512417B2 true JP4512417B2 (ja) 2010-07-28

Family

ID=35472929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004142782A Expired - Fee Related JP4512417B2 (ja) 2004-05-12 2004-05-12 認識システム及び認識方法

Country Status (1)

Country Link
JP (1) JP4512417B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10055767B2 (en) * 2015-05-13 2018-08-21 Google Llc Speech recognition for keywords

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08254991A (ja) * 1995-03-16 1996-10-01 Hitachi Zosen Corp パターン認識装置
JPH09120294A (ja) * 1995-10-26 1997-05-06 Omron Corp 音声認識装置および音声認識方法
JPH09274497A (ja) * 1996-04-05 1997-10-21 Nissan Motor Co Ltd 音声認識装置
JPH11202895A (ja) * 1998-01-14 1999-07-30 Hitachi Ltd 音声認識システムと方法およびそのプログラムを記録した記録媒体
JP2000250585A (ja) * 1999-02-25 2000-09-14 Nippon Telegr & Teleph Corp <Ntt> 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体
JP2002156996A (ja) * 2000-11-16 2002-05-31 Toshiba Corp 音声認識装置、認識結果修正方法及び記録媒体

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08254991A (ja) * 1995-03-16 1996-10-01 Hitachi Zosen Corp パターン認識装置
JPH09120294A (ja) * 1995-10-26 1997-05-06 Omron Corp 音声認識装置および音声認識方法
JPH09274497A (ja) * 1996-04-05 1997-10-21 Nissan Motor Co Ltd 音声認識装置
JPH11202895A (ja) * 1998-01-14 1999-07-30 Hitachi Ltd 音声認識システムと方法およびそのプログラムを記録した記録媒体
JP2000250585A (ja) * 1999-02-25 2000-09-14 Nippon Telegr & Teleph Corp <Ntt> 対話型データベース検索方法、装置及び対話型データベース検索プログラムを記録した記録媒体
JP2002156996A (ja) * 2000-11-16 2002-05-31 Toshiba Corp 音声認識装置、認識結果修正方法及び記録媒体

Also Published As

Publication number Publication date
JP2005326505A (ja) 2005-11-24

Similar Documents

Publication Publication Date Title
EP2838085B1 (en) Voice recognition server integration device and voice recognition server integration method
JP5480760B2 (ja) 端末装置、音声認識方法および音声認識プログラム
US7421387B2 (en) Dynamic N-best algorithm to reduce recognition errors
US6792408B2 (en) Interactive command recognition enhancement system and method
EP2666159B1 (en) Speech recognition using device docking context
US8583436B2 (en) Word category estimation apparatus, word category estimation method, speech recognition apparatus, speech recognition method, program, and recording medium
CN103971685B (zh) 语音命令识别方法和系统
US20080294433A1 (en) Automatic Text-Speech Mapping Tool
US8176419B2 (en) Self learning contextual spell corrector
US20020150295A1 (en) Handwritten word recognition using nearest neighbor techniques that allow adaptive learning
US8914385B2 (en) Search device and search program
EP1617409B1 (en) Multimodal method to provide input to a computing device
CN101785050B (zh) 语音识别用对照规则学习系统以及语音识别用对照规则学习方法
JP2008262279A (ja) 音声検索装置
US9082404B2 (en) Recognizing device, computer-readable recording medium, recognizing method, generating device, and generating method
JP5148671B2 (ja) 音声認識結果出力装置、音声認識結果出力方法、及び音声認識結果出力プログラム
US20060241936A1 (en) Pronunciation specifying apparatus, pronunciation specifying method and recording medium
CN112489655B (zh) 一种特定领域的语音识别文本纠错方法、系统和存储介质
US6502072B2 (en) Two-tier noise rejection in speech recognition
Jyothi et al. Transcribing continuous speech using mismatched crowdsourcing.
JP4512417B2 (ja) 認識システム及び認識方法
CN1369830A (zh) 歧义消除语言模型
WO2012150658A1 (ja) 音声認識装置および音声認識方法
US6631349B1 (en) Speech recognition method and system
KR102103186B1 (ko) 음성인식을 위한 텍스트 정규화 장치 및 그 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070330

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100510

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4512417

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140514

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees