JP2005227510A - 音声認識装置及び音声認識方法 - Google Patents

音声認識装置及び音声認識方法 Download PDF

Info

Publication number
JP2005227510A
JP2005227510A JP2004035616A JP2004035616A JP2005227510A JP 2005227510 A JP2005227510 A JP 2005227510A JP 2004035616 A JP2004035616 A JP 2004035616A JP 2004035616 A JP2004035616 A JP 2004035616A JP 2005227510 A JP2005227510 A JP 2005227510A
Authority
JP
Japan
Prior art keywords
phrase
dictionary
registered
corrected
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004035616A
Other languages
English (en)
Inventor
Naonobu Yamashita
直信 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2004035616A priority Critical patent/JP2005227510A/ja
Publication of JP2005227510A publication Critical patent/JP2005227510A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 個人用辞書への単語やフレーズの登録のみを目的とした回線接続を回避することによって登録目的のみの通信料を無くすことができ、また、各個人用辞書に登録された新語等の単語やフレーズを共有辞書に自動的に登録可能とすることによって共有辞書への登録の際の手間隙及び人件費を無くすこと。
【解決手段】 修正箇所抽出部25にて、音声認識テキストデータの誤認識箇所が端末機14で修正された修正テキストデータを受信し、この修正テキストデータと音声認識によるテキストデータとの比較から修正語句を抽出し、この修正語句が、当該端末機14の個人用辞書22−1及び共有辞書21に登録か未登録かを検出する。辞書登録部24で、修正箇所抽出部25で抽出された修正語句が未登録と検出された場合に、当該修正語句を該当個人用辞書22−1に登録する。
【選択図】 図1

Description

本発明は、音声入力機能を備えて通信を行う端末機と通信回線により接続され、この接続された端末機におけるディクテーション(dictation:口述)入力の音声認識を行う機能を有する音声認識装置及び音声認識方法に関する。
従来、音声認識装置において、ディクテーション音声認識の認識率を向上させるために、端末機から、個々のユーザ毎に自分がよく使用する単語やフレーズ(句)を出来るだけ多く辞書に登録することが行われていた。
この種の従来の音声認識装置として、例えば特許文献1及び2に記載のものがある。
特許文献1の内容は次の通りである。音声認識用の単語辞書にない単語を容易に登録できるようにする。音声入力された単語の音声データが、音声認識装置による音声認識の結果、記憶媒体から読み出された単語辞書内の音声データと一致しない場合に、単語登録手段が、音声入力された単語の音声データをRAMに一時的に記憶しておき、ユーザが、音声入力された単語に関連する検索項目をキー操作により検索し、この検索結果に、RAMに一時記憶した音声データを関連付けて単語辞書メモリに登録することにより、音声認識用の単語辞書にない単語でも容易に登録できるようにする。
特許文献2の内容は次の通りである。ユーザの入力音声を認識するための単語を辞書に格納し、また、ユーザの入力履歴として単語組毎に出現頻度情報を記憶手段に格納する。入力音声を日本語文章として認識し、この認識結果から単語組毎に分解し、上記の出現頻度情報に基づいて、上記の単語組の出現数が一定値以上の場合に単語組を1つの単語として上記の辞書に登録する。
特開2003−323192号公報(要約書、特許請求の範囲) 特開2001−195081号公報(要約書、特許請求の範囲)
しかし、従来の音声認識装置においては、端末機が有料の通信ネットワークを介して音声認識装置にアクセスするようになっている場合、端末機から音声認識装置の辞書に単語やフレーズを登録する際に通信料が発生してしまうという問題がある。
また、一般的に使用されるようになってきた新語も上記同様に登録を行うと、ユーザの個人用辞書に登録されてしまう。このため、全ユーザが共用する共有辞書に反映させるには音声認識装置の管理者が人為的に登録するしかないので、手間隙が掛かると共に、その分人件費が発生してしまうという問題がある。
上記特許文献1においては、単語辞書と一致しない音声入力による音声データ(単語やフレーズ)を一旦記憶し、ユーザがキー操作により得た音声データに対応するデータに、一旦記憶した音声データを関連付けて辞書に登録するようになっている。この技術内容でも、個人用辞書への登録は可能であるが、上述したと同様な手法で共有辞書に反映させなければならないので、手間隙が掛かると共に人件費が発生してしまうという問題がある。
上記特許文献2においては、ユーザの入力音声から認識した日本語文章を単語組毎に分解し、この単語組の出現数が一定値以上の場合に単語組を1つの単語として辞書に登録するようになっているので、この技術内容の場合も、個人用辞書への登録は可能であるが、共有辞書への反映には上記同様に手間隙が掛かると共に人件費が発生してしまうという問題がある。
本発明は、このような課題に鑑みてなされたものであり、個人用辞書への単語やフレーズの登録のみを目的とした回線接続を回避することによって登録目的のみの通信料を無くすことができ、また、各個人用辞書に登録された新語等の単語やフレーズを共有辞書に自動的に登録可能とすることによって共有辞書への登録の際の手間隙及び人件費を無くすことができる音声認識装置及び音声認識方法を提供することを目的としている。
上記目的を達成するために、本発明の請求項1による音声認識装置は、音声入力機能と文書作成及び修正機能を備えて通信を行う端末機と回線接続され、この端末機にて入力された音声による音声データと、端末機のユーザ毎に設定された個人用辞書及び全ユーザの端末機が共用する共有辞書に登録された語句との照合によって、音声データに対応する語句を検索し、この検索した語句によるテキストデータを生成して音声認識を行う音声認識装置において、前記端末機にて、前記音声認識により生成されたテキストデータの誤認識箇所が修正された修正テキストデータを受信し、この修正テキストデータと前記音声認識によるテキストデータとの比較から修正語句を抽出し、この抽出された修正語句が、当該端末機の個人用辞書及び共有辞書に登録か未登録かを検出する抽出手段と、前記抽出手段で抽出された修正語句が未登録と検出された場合に、当該修正語句を該当個人用辞書に登録する登録手段とを備えたことを特徴としている。
この構成によれば、例えば端末機によってユーザが所望の相手先へメール文書を送信する際に、そのメール文書を音声入力にて作成することを前提とした場合、音声認識装置で音声認識されて返信されてきたテキストデータに誤認識があった場合、その誤認識箇所が修正される。この修正テキストデータは、メール文書として相手先へ送信されるが、この送信処理と並列に修正テキストデータは音声認識装置でも受信される。そして、その受信された修正テキストデータと基の音声認識テキストデータとから修正語句が抽出され、これが個人用辞書に未登録であれば登録される。つまり、音声認識結果が誤認識の場合の修正時に、修正語句が自動的に音声認識装置の個人用辞書に登録されることになる。従って、従来のような個人用辞書への語句の登録のみを目的とした回線接続を回避することができるので、登録目的のみの通信料を無くすことができる。
また、本発明の請求項2による音声認識装置は、請求項1において、全ユーザの個人用辞書に登録された語句のうち同じ語句の登録数が、予め定められた閾値を超えた場合に、この閾値を登録数が超えた語句を前記共有辞書に登録し、この登録した語句を個人用辞書から削除する解析手段を更に備えたことを特徴としている。
この構成によれば、全個人用辞書において同じ語句が予め定められた数以上登録された場合は、その語句が自動的に共有辞書に登録され、この登録語句は個人用辞書から削除されるので、個人用辞書に登録された語句を共有辞書へ登録する際の手間隙及び人件費を無くすことができる。
また、本発明の請求項3による音声認識方法は、音声入力機能と文書作成及び修正機能を備えて通信を行う端末機と回線接続される音声認識装置によって、その端末機にて入力された音声による音声データと、端末機のユーザ毎に設定された個人用辞書及び全ユーザの端末機が共用する共有辞書に登録された語句との照合によって、音声データに対応する語句を検索し、この検索した語句によるテキストデータを生成して音声認識を行う音声認識方法において、前記端末機にて、前記音声認識により生成されたテキストデータの誤認識箇所が修正された修正テキストデータを受信し、この修正テキストデータと前記音声認識によるテキストデータとの比較から修正語句を抽出し、この抽出された修正語句が、当該端末機の個人用辞書及び共有辞書に登録か未登録かを検出する第1のステップと、前記第1のステップにおいて抽出された修正語句が未登録と検出された場合に、当該修正語句を該当個人用辞書に登録する第2のステップと、全ユーザの個人用辞書に登録された語句のうち同じ語句の登録数が、予め定められた閾値を超えた場合に、この閾値を登録数が超えた語句を前記共有辞書に登録し、この登録した語句を個人用辞書から削除する第3のステップとを含むことを特徴としている。
この方法によれば、上記の請求項1及び2の作用効果として説明したように、音声認識結果が誤認識の場合の端末機での修正時に、修正語句が自動的に音声認識装置の個人用辞書に登録されるので、個人用辞書への語句の登録のみを目的とした回線接続を回避することによって、登録目的のみの通信料を無くすことができる。また、全個人用辞書において同じ語句が予め定められた数以上登録された場合は、その語句が自動的に共有辞書に登録され、この登録語句は個人用辞書から削除されるので、個人用辞書に登録された語句を共有辞書へ登録する際の手間隙及び人件費を無くすことができる。
以上説明したように本発明によれば、個人用辞書への単語やフレーズの登録のみを目的とした回線接続を回避することによって登録目的のみの通信料を無くすことができるという効果がある。
また、各個人用辞書に登録された新語等の単語やフレーズを共有辞書に自動的に登録可能とすることによって共有辞書への登録の際の手間隙及び人件費を無くすことができるという効果がある。
以下、本発明の実施の形態を、図面を参照して説明する。
図1は、本発明の実施の形態に係る音声認識装置を用いた通信システムの構成を示すブロック図である。
図1に示す通信システムにおいては、音声認識装置10に通信ネットワーク12を介して携帯電話機、固定電話機並びにパーソナルコンピュータ等の音声入力機能を有する端末機14が接続されるようになっている。
端末機14は、音声入力部16及び文書作成部18を備えて構成されている。
音声入力部16は、ディクテーション入力などの音声が入力される音声インターフェースである。
文書作成部18は、音声入力部16への入力音声が通信ネットワーク12を介して音声認識装置10へ送信され、音声認識装置10で音声認識されたのち返信されてきた音声認識結果のテキストデータを、ユーザがキー操作によって修正する際に、そのキー操作による修正処理を行うものである。
音声認識装置10は、認識エンジン20と、共有辞書21と、個人用辞書22−1〜22−nと、ユーザ認証部23と、辞書登録部24と、修正箇所抽出部25と、登録語句蓄積部26及び閾値判定部27を有する個人用辞書解析部28とを備えて構成されている。
認識エンジン20は、端末機14から送信されてきた入力音声を認識するものである。
共有辞書21は、全ユーザの端末機14が共用することができる辞書であり、認識エンジン20が音声認識に際に参照する語句(単語及び句)が格納されている。
個人用辞書22−1〜22−nは、ユーザ個人の辞書であり、ユーザが個人毎に登録した語句が格納されている。
ユーザ認証部23は、音声認識のために接続したユーザを判別するものである。
辞書登録部24は、新たに個人用辞書を登録する処理を行うものである。
修正箇所抽出部25は、音声認識結果とユーザの修正結果との双方のテキストデータを比較して修正箇所を抽出するものである。
個人用辞書解析部28は、各個人用辞書22−1〜22−nに登録されている語句を管理・解析するものである。
登録語句蓄積部26は、各個人用辞書22−1〜22−nに登録されている語句を管理すると共に、同じ語句の登録数を管理するものである。
閾値判定部27は、登録語句蓄積部26で管理されている同じ語句の登録数が閥値を超えた場合に、この登録数が超えた語句を共有辞書21へ登録するものである。
次に、このような構成の音声認識装置10における個人用辞書22−1〜22−nへの登録処理の動作を、図2に示すシーケンス図を参照して説明する。
まず、ユーザが端末機14にて所望の相手先へメール文書を送信する場合に、そのメール文書を音声入力にて作成することを前提とする。
この場合に、ステップS1において、端末機14の音声入力部16にユーザの音声が入力されると、その音声に対応した音声データが生成されて、通信ネットワーク12を介して音声認識装置10へ送信される。但し、その音声データのヘッダ部分には、端末機14の所持者であるユーザID(Identification)が自動的に付加されるようになっている。
この音声データが音声認識装置10で受信されると、ステップS2において、ユーザ認証部23にて音声データのヘッダ部分からユーザIDが検出されることによってユーザが認証される。その認証されたユーザIDと音声データとが、ステップS3において認識エンジン20へ出力される。
認識エンジン20では、ステップS4において、ユーザIDから今回使用する個人用辞書(例えば22−1)が特定され、ステップS5及びS6において、共有辞書21と共に、それらの辞書内に含まれる語句と受信音声データとが照合されることによって、音声認識が行われる。
そして、ステップS7において、その音声認識結果から音声データに対応したテキストデータが作成され、このテキストデータがステップS8において、音声データ送信元の端末機14へ送信される。また、ステップS9において、テキストデータと、音声データから得られる音素データとの組にユーザIDが付与されて修正箇所抽出部25へ出力される。
ステップS10において、端末機14では、文書作成部18の処理によって受信テキストデータがディスプレイに表示される。この表示内容をユーザが確認した際に誤認識箇所があったとすると、ユーザはキー操作によって誤認識箇所を修正する。文書作成部18では、その修正操作に応じた誤認識箇所の修正処理が行われる。これによって得られた修正テキストデータは、元々ユーザが音声入力によって作成したメール文書が正しく修正されたものなので、メール文書として相手先へ送信される。これと同時にその修正テキストデータは、ステップS11において、音声認識装置10へも送信され、修正箇所抽出部25に入力される。
修正箇所抽出部25では、ステップS12において、受信された修正テキストデータと、この修正テキストデータの基となった音声認識結果のテキストデータとが比較されることによって修正された語句(修正語句)が抽出される。
更に、ステップS13において、その抽出された語句の読みが音素データを基に抽出される。そして、ステップS14及びS15において、修正箇所抽出部25にて、修正語句と、共有辞書21及び先にユーザIDから特定された個人用辞書22−1の登録語句とが照合される。
これらの照合によって、ステップS16において、修正語句が未登録であることを示す未登録語句が検出されると、ステップS17及びS18において、その未登録語句及び読みが、ユーザIDが付されて辞書登録部24の処理によって該当個人用辞書22−1に登録されると共に、個人用辞書解析部28へ出力される。
そして、ステップS20において、個人用辞書解析部28にて、上記ステップS18で個人用辞書22−1に登録された語句、つまり上記ステップS19で入力された登録語句の解析処理が行われる。
この個人用辞書解析部28による解析処理を、図3に示すフローチャートを参照して説明する。
ステップS31は、上記ステップS19にて入力された語句、読み、ユーザIDの入力処理を示す。
この入力後、ステップS32において、登録語句蓄積部26に格納されている語句が参照され、ステップS33において、入力語句が当該登録語句蓄積部26に登録されているか否かが判定される。この判定結果、登録されていなければ、ステップS34において、登録語句蓄積部26に入力語句が登録され、ステップS35において、その入力語句に対応付けられた登録数が1とされて登録処理が終了する。
一方、上記ステップS33の判定結果、登録されていれば、ステップS36において、その入力語句に対応付けられた登録数がカウントアップされる。この後、ステップS37において、閾値判定部27で、そのカウントアップされた登録数が、予め定められた閾値を超えたか否かが判定される。超えていない場合は処理が終了する。
超えた場合は、ステップS38において、入力語句が共有辞書21に登録され、ステップS39において、その登録された入力語句を個人用辞書22−1〜22−nに登録している全ユーザが検出され、ステップS40において、その検出されたユーザの個人用辞書から入力語句と同じ語句が削除される。そして、ステップS40において、当該語句が登録語句蓄積部26から削除され、解析処理が終了する。
以上説明したように本実施の形態の音声認識装置10によれば、修正箇所抽出部25によって、音声認識により生成されたテキストデータの誤認識箇所が端末機14で修正された修正テキストデータを受信し、この修正テキストデータと音声認識によるテキストデータとの比較から修正語句を抽出し、この抽出された修正語句が、当該端末機14の個人用辞書22−1及び共有辞書21に登録か未登録かを検出する。辞書登録部24によって、修正箇所抽出部25で抽出された修正語句が未登録と検出された場合に、当該修正語句を該当個人用辞書22−1に登録するようにした。
これによって、例えば端末機14によってユーザが所望の相手先へメール文書を送信する際に、そのメール文書を音声入力にて作成することを前提とした場合、音声認識装置10で音声認識されて返信されてきたテキストデータに誤認識があった場合、その誤認識箇所が修正される。この修正テキストデータは、メール文書として相手先へ送信されるが、この送信処理と並列に修正テキストデータは音声認識装置10でも受信される。そして、その受信された修正テキストデータと基の音声認識テキストデータとから修正語句が抽出され、これが個人用辞書22−1に未登録であれば登録される。つまり、音声認識結果が誤認識の場合の修正時に、修正語句が自動的に音声認識装置10の個人用辞書22−1に登録されることになる。従って、従来のような個人用辞書22−1への語句の登録のみを目的とした回線接続を回避することができるので、登録目的のみの通信料を無くすことができる。
また、個人用辞書解析部28によって、全ユーザの個人用辞書22−1〜22−nに登録された語句のうち同じ語句の登録数が、予め定められた閾値を超えた場合に、この閾値を登録数が超えた語句を共有辞書21に登録し、この登録した語句を個人用辞書22−1〜22−nから削除するようにした。
これによって、全個人用辞書22−1〜22−nにおいて同じ語句が予め定められた数以上登録された場合は、その語句が自動的に共有辞書21に登録され、この登録語句は個人用辞書22−1〜22−nから削除されるので、個人用辞書22−1〜22−nに登録された語句を共有辞書21へ登録する際の手間隙及び人件費を無くすことができる。
この他、個人用辞書解析部28が、全ユーザの個人用辞書22−1〜22−nの登録語句のうち同じ語句の登録率を算出し、一定以上の登録率となった語句を共有辞書21に登録し、この登録語句を個人用辞書22−1〜22−nから削除するようにしてもよい。この場合も、上記実施の形態と同様の効果を得ることができる。
本発明の実施の形態に係る音声認識装置を用いた通信システムの構成を示すブロック図である。 上記実施の形態に係る音声認識装置における個人用辞書への登録処理の動作を説明するためのシーケンス図である。 上記実施の形態に係る音声認識装置における個人用辞書解析部による解析処理の動作を説明するためのフローチャートである。
符号の説明
10 音声認識装置
12 通信ネットワーク
14 端末機
16 音声入力部
18 文書作成部
20 認識エンジン
21 共有辞書
22−1〜22−n 個人用辞書
23 ユーザ認証部
24 辞書登録部
25 修正箇所抽出部
26 登録語句蓄積部
27 閾値判定部
28 個人用辞書解析部

Claims (3)

  1. 音声入力機能と文書作成及び修正機能を備えて通信を行う端末機と回線接続され、この端末機にて入力された音声による音声データと、端末機のユーザ毎に設定された個人用辞書及び全ユーザの端末機が共用する共有辞書に登録された語句との照合によって、音声データに対応する語句を検索し、この検索した語句によるテキストデータを生成して音声認識を行う音声認識装置において、
    前記端末機にて、前記音声認識により生成されたテキストデータの誤認識箇所が修正された修正テキストデータを受信し、この修正テキストデータと前記音声認識によるテキストデータとの比較から修正語句を抽出し、この抽出された修正語句が、当該端末機の個人用辞書及び共有辞書に登録か未登録かを検出する抽出手段と、
    前記抽出手段で抽出された修正語句が未登録と検出された場合に、当該修正語句を該当個人用辞書に登録する登録手段と
    を備えたことを特徴とする音声認識装置。
  2. 全ユーザの個人用辞書に登録された語句のうち同じ語句の登録数が、予め定められた閾値を超えた場合に、この閾値を登録数が超えた語句を前記共有辞書に登録し、この登録した語句を個人用辞書から削除する解析手段
    を更に備えたことを特徴とする請求項1に記載の音声認識装置。
  3. 音声入力機能と文書作成及び修正機能を備えて通信を行う端末機と回線接続される音声認識装置によって、その端末機にて入力された音声による音声データと、端末機のユーザ毎に設定された個人用辞書及び全ユーザの端末機が共用する共有辞書に登録された語句との照合によって、音声データに対応する語句を検索し、この検索した語句によるテキストデータを生成して音声認識を行う音声認識方法において、
    前記端末機にて、前記音声認識により生成されたテキストデータの誤認識箇所が修正された修正テキストデータを受信し、この修正テキストデータと前記音声認識によるテキストデータとの比較から修正語句を抽出し、この抽出された修正語句が、当該端末機の個人用辞書及び共有辞書に登録か未登録かを検出する第1のステップと、
    前記第1のステップにおいて抽出された修正語句が未登録と検出された場合に、当該修正語句を該当個人用辞書に登録する第2のステップと、
    全ユーザの個人用辞書に登録された語句のうち同じ語句の登録数が、予め定められた閾値を超えた場合に、この閾値を登録数が超えた語句を前記共有辞書に登録し、この登録した語句を個人用辞書から削除する第3のステップと
    を含むことを特徴とする音声認識方法。
JP2004035616A 2004-02-12 2004-02-12 音声認識装置及び音声認識方法 Pending JP2005227510A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004035616A JP2005227510A (ja) 2004-02-12 2004-02-12 音声認識装置及び音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004035616A JP2005227510A (ja) 2004-02-12 2004-02-12 音声認識装置及び音声認識方法

Publications (1)

Publication Number Publication Date
JP2005227510A true JP2005227510A (ja) 2005-08-25

Family

ID=35002269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004035616A Pending JP2005227510A (ja) 2004-02-12 2004-02-12 音声認識装置及び音声認識方法

Country Status (1)

Country Link
JP (1) JP2005227510A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008007688A1 (fr) * 2006-07-13 2008-01-17 Nec Corporation Terminal téléphonique ayant une fonction de reconnaissance vocale, dispositif de support de mise à jour de dictionnaire de reconnaissance vocale, et procédé de support associé
WO2008069139A1 (ja) * 2006-11-30 2008-06-12 National Institute Of Advanced Industrial Science And Technology 音声認識システム及び音声認識システム用プログラム
WO2008114708A1 (ja) * 2007-03-14 2008-09-25 Nec Corporation 音声認識システム、音声認識方法、および音声認識処理プログラム
JP2010139744A (ja) * 2008-12-11 2010-06-24 Ntt Docomo Inc 音声認識結果訂正装置および音声認識結果訂正方法
CN102324233A (zh) * 2011-08-03 2012-01-18 中国科学院计算技术研究所 汉语语音识别中重复出现词识别错误的自动修正方法
JP2014067062A (ja) * 2007-04-26 2014-04-17 Microsoft Corp アジア文字を生成するための認識アーキテクチャ
JP2018055022A (ja) * 2016-09-30 2018-04-05 株式会社リコー 音声認識システム、情報処理装置、プログラム
CN109448701A (zh) * 2018-09-19 2019-03-08 易诚博睿(南京)科技有限公司 一种智能语音识别到语义理解的结果统计系统及方法
JP2020194184A (ja) * 2012-08-10 2020-12-03 エイディシーテクノロジー株式会社 音声応答装置、及び音声応答システム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62262898A (ja) * 1986-05-09 1987-11-14 株式会社リコー 音声認識装置
JPH0887573A (ja) * 1994-09-20 1996-04-02 Hitachi Ltd パターン情報処理装置
JP2001282779A (ja) * 2000-03-30 2001-10-12 Telecommunication Advancement Organization Of Japan 電子化テキスト作成システム
JP2001343994A (ja) * 2000-06-01 2001-12-14 Nippon Hoso Kyokai <Nhk> 音声認識誤り検出装置および記憶媒体
JP2002014693A (ja) * 2000-06-30 2002-01-18 Mitsubishi Electric Corp 音声認識システム用辞書提供方法、および音声認識インタフェース
JP2002344574A (ja) * 2001-05-15 2002-11-29 Aruze Corp 移動体通信機器
JP2003140682A (ja) * 2001-11-05 2003-05-16 Alpine Electronics Inc 音声認識装置及び音声辞書作成方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62262898A (ja) * 1986-05-09 1987-11-14 株式会社リコー 音声認識装置
JPH0887573A (ja) * 1994-09-20 1996-04-02 Hitachi Ltd パターン情報処理装置
JP2001282779A (ja) * 2000-03-30 2001-10-12 Telecommunication Advancement Organization Of Japan 電子化テキスト作成システム
JP2001343994A (ja) * 2000-06-01 2001-12-14 Nippon Hoso Kyokai <Nhk> 音声認識誤り検出装置および記憶媒体
JP2002014693A (ja) * 2000-06-30 2002-01-18 Mitsubishi Electric Corp 音声認識システム用辞書提供方法、および音声認識インタフェース
JP2002344574A (ja) * 2001-05-15 2002-11-29 Aruze Corp 移動体通信機器
JP2003140682A (ja) * 2001-11-05 2003-05-16 Alpine Electronics Inc 音声認識装置及び音声辞書作成方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008007688A1 (fr) * 2006-07-13 2008-01-17 Nec Corporation Terminal téléphonique ayant une fonction de reconnaissance vocale, dispositif de support de mise à jour de dictionnaire de reconnaissance vocale, et procédé de support associé
GB2457855B (en) * 2006-11-30 2011-01-12 Nat Inst Of Advanced Ind Scien Speech recognition system and speech recognition system program
WO2008069139A1 (ja) * 2006-11-30 2008-06-12 National Institute Of Advanced Industrial Science And Technology 音声認識システム及び音声認識システム用プログラム
JP2008158510A (ja) * 2006-11-30 2008-07-10 National Institute Of Advanced Industrial & Technology 音声認識システム及び音声認識システム用プログラム
GB2457855A (en) * 2006-11-30 2009-09-02 Nat Inst Of Advanced Ind Scien Speech recognition system and speech recognition system program
US8401847B2 (en) 2006-11-30 2013-03-19 National Institute Of Advanced Industrial Science And Technology Speech recognition system and program therefor
WO2008114708A1 (ja) * 2007-03-14 2008-09-25 Nec Corporation 音声認識システム、音声認識方法、および音声認識処理プログラム
US8676582B2 (en) 2007-03-14 2014-03-18 Nec Corporation System and method for speech recognition using a reduced user dictionary, and computer readable storage medium therefor
JP2014067062A (ja) * 2007-04-26 2014-04-17 Microsoft Corp アジア文字を生成するための認識アーキテクチャ
JP2010139744A (ja) * 2008-12-11 2010-06-24 Ntt Docomo Inc 音声認識結果訂正装置および音声認識結果訂正方法
CN102324233A (zh) * 2011-08-03 2012-01-18 中国科学院计算技术研究所 汉语语音识别中重复出现词识别错误的自动修正方法
JP2020194184A (ja) * 2012-08-10 2020-12-03 エイディシーテクノロジー株式会社 音声応答装置、及び音声応答システム
JP2018055022A (ja) * 2016-09-30 2018-04-05 株式会社リコー 音声認識システム、情報処理装置、プログラム
CN109448701A (zh) * 2018-09-19 2019-03-08 易诚博睿(南京)科技有限公司 一种智能语音识别到语义理解的结果统计系统及方法

Similar Documents

Publication Publication Date Title
TWI427620B (zh) A speech recognition result correction device and a speech recognition result correction method, and a speech recognition result correction system
JP2002125047A5 (ja)
JPH10105655A (ja) 光学文字認識のための検証および訂正の方法およびシステム
CN110765767B (zh) 局部优化关键词的提取方法、装置、服务器及存储介质
JP5148671B2 (ja) 音声認識結果出力装置、音声認識結果出力方法、及び音声認識結果出力プログラム
JP3141833B2 (ja) ネットワークアクセスシステム
KR102198424B1 (ko) 통화 녹음 정보 관리방법, 이를 위한 컴퓨터 프로그램
CN101405693A (zh) 多模式输入的个人协作过滤
JP2005227510A (ja) 音声認識装置及び音声認識方法
CN111858966B (zh) 知识图谱的更新方法、装置、终端设备及可读存储介质
JP5887162B2 (ja) 通信端末、制御方法及びプログラム
JP2014182270A (ja) 情報処理装置及び方法
JP5185807B2 (ja) 音声検索装置、音声検索方法及び音声検索プログラム
JP2010048890A (ja) クライアント装置、認識結果フィードバック方法、認識結果フィードバックプログラム、サーバ装置、音声認識のモデル更新方法、音声認識のモデル更新プログラム、音声認識システム、音声認識方法、音声認識プログラム
KR101440887B1 (ko) 영상 및 음성 정보를 이용한 명함 인식 방법 및 장치
CN111627438A (zh) 语音识别方法及装置
JP2000089786A (ja) 音声認識結果の修正方法および装置
CN110955796A (zh) 一种基于笔录信息的案件特征信息提取方法及装置
KR100373989B1 (ko) 음절 인식을 이용한 사용자 인증 방법 및 사용자 인증시스템
JP2002032386A (ja) データ処理方法、装置およびその方法を実施するプログラムを記録した記録媒体
JP2015102805A (ja) 音声認識システム、電子装置、サーバー、音声認識方法および音声認識プログラム
CN114528851A (zh) 回复语句确定方法、装置、电子设备和存储介质
CN115510182A (zh) 用户投诉定责方法、设备、存储介质及装置
KR100753779B1 (ko) 혼합형 초성 검색을 수행하는 방법 및 상기 방법을수행하는 시스템
JP2017134162A (ja) 音声認識装置、音声認識方法、及び音声認識プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060412

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090406

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090617

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100316