JP2005227510A - 音声認識装置及び音声認識方法 - Google Patents
音声認識装置及び音声認識方法 Download PDFInfo
- Publication number
- JP2005227510A JP2005227510A JP2004035616A JP2004035616A JP2005227510A JP 2005227510 A JP2005227510 A JP 2005227510A JP 2004035616 A JP2004035616 A JP 2004035616A JP 2004035616 A JP2004035616 A JP 2004035616A JP 2005227510 A JP2005227510 A JP 2005227510A
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- dictionary
- registered
- corrected
- text data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】 修正箇所抽出部25にて、音声認識テキストデータの誤認識箇所が端末機14で修正された修正テキストデータを受信し、この修正テキストデータと音声認識によるテキストデータとの比較から修正語句を抽出し、この修正語句が、当該端末機14の個人用辞書22−1及び共有辞書21に登録か未登録かを検出する。辞書登録部24で、修正箇所抽出部25で抽出された修正語句が未登録と検出された場合に、当該修正語句を該当個人用辞書22−1に登録する。
【選択図】 図1
Description
この種の従来の音声認識装置として、例えば特許文献1及び2に記載のものがある。
特許文献1の内容は次の通りである。音声認識用の単語辞書にない単語を容易に登録できるようにする。音声入力された単語の音声データが、音声認識装置による音声認識の結果、記憶媒体から読み出された単語辞書内の音声データと一致しない場合に、単語登録手段が、音声入力された単語の音声データをRAMに一時的に記憶しておき、ユーザが、音声入力された単語に関連する検索項目をキー操作により検索し、この検索結果に、RAMに一時記憶した音声データを関連付けて単語辞書メモリに登録することにより、音声認識用の単語辞書にない単語でも容易に登録できるようにする。
また、一般的に使用されるようになってきた新語も上記同様に登録を行うと、ユーザの個人用辞書に登録されてしまう。このため、全ユーザが共用する共有辞書に反映させるには音声認識装置の管理者が人為的に登録するしかないので、手間隙が掛かると共に、その分人件費が発生してしまうという問題がある。
この構成によれば、全個人用辞書において同じ語句が予め定められた数以上登録された場合は、その語句が自動的に共有辞書に登録され、この登録語句は個人用辞書から削除されるので、個人用辞書に登録された語句を共有辞書へ登録する際の手間隙及び人件費を無くすことができる。
また、各個人用辞書に登録された新語等の単語やフレーズを共有辞書に自動的に登録可能とすることによって共有辞書への登録の際の手間隙及び人件費を無くすことができるという効果がある。
図1は、本発明の実施の形態に係る音声認識装置を用いた通信システムの構成を示すブロック図である。
図1に示す通信システムにおいては、音声認識装置10に通信ネットワーク12を介して携帯電話機、固定電話機並びにパーソナルコンピュータ等の音声入力機能を有する端末機14が接続されるようになっている。
音声入力部16は、ディクテーション入力などの音声が入力される音声インターフェースである。
文書作成部18は、音声入力部16への入力音声が通信ネットワーク12を介して音声認識装置10へ送信され、音声認識装置10で音声認識されたのち返信されてきた音声認識結果のテキストデータを、ユーザがキー操作によって修正する際に、そのキー操作による修正処理を行うものである。
認識エンジン20は、端末機14から送信されてきた入力音声を認識するものである。
共有辞書21は、全ユーザの端末機14が共用することができる辞書であり、認識エンジン20が音声認識に際に参照する語句(単語及び句)が格納されている。
ユーザ認証部23は、音声認識のために接続したユーザを判別するものである。
辞書登録部24は、新たに個人用辞書を登録する処理を行うものである。
修正箇所抽出部25は、音声認識結果とユーザの修正結果との双方のテキストデータを比較して修正箇所を抽出するものである。
登録語句蓄積部26は、各個人用辞書22−1〜22−nに登録されている語句を管理すると共に、同じ語句の登録数を管理するものである。
閾値判定部27は、登録語句蓄積部26で管理されている同じ語句の登録数が閥値を超えた場合に、この登録数が超えた語句を共有辞書21へ登録するものである。
まず、ユーザが端末機14にて所望の相手先へメール文書を送信する場合に、そのメール文書を音声入力にて作成することを前提とする。
この場合に、ステップS1において、端末機14の音声入力部16にユーザの音声が入力されると、その音声に対応した音声データが生成されて、通信ネットワーク12を介して音声認識装置10へ送信される。但し、その音声データのヘッダ部分には、端末機14の所持者であるユーザID(Identification)が自動的に付加されるようになっている。
認識エンジン20では、ステップS4において、ユーザIDから今回使用する個人用辞書(例えば22−1)が特定され、ステップS5及びS6において、共有辞書21と共に、それらの辞書内に含まれる語句と受信音声データとが照合されることによって、音声認識が行われる。
更に、ステップS13において、その抽出された語句の読みが音素データを基に抽出される。そして、ステップS14及びS15において、修正箇所抽出部25にて、修正語句と、共有辞書21及び先にユーザIDから特定された個人用辞書22−1の登録語句とが照合される。
そして、ステップS20において、個人用辞書解析部28にて、上記ステップS18で個人用辞書22−1に登録された語句、つまり上記ステップS19で入力された登録語句の解析処理が行われる。
ステップS31は、上記ステップS19にて入力された語句、読み、ユーザIDの入力処理を示す。
この入力後、ステップS32において、登録語句蓄積部26に格納されている語句が参照され、ステップS33において、入力語句が当該登録語句蓄積部26に登録されているか否かが判定される。この判定結果、登録されていなければ、ステップS34において、登録語句蓄積部26に入力語句が登録され、ステップS35において、その入力語句に対応付けられた登録数が1とされて登録処理が終了する。
超えた場合は、ステップS38において、入力語句が共有辞書21に登録され、ステップS39において、その登録された入力語句を個人用辞書22−1〜22−nに登録している全ユーザが検出され、ステップS40において、その検出されたユーザの個人用辞書から入力語句と同じ語句が削除される。そして、ステップS40において、当該語句が登録語句蓄積部26から削除され、解析処理が終了する。
これによって、全個人用辞書22−1〜22−nにおいて同じ語句が予め定められた数以上登録された場合は、その語句が自動的に共有辞書21に登録され、この登録語句は個人用辞書22−1〜22−nから削除されるので、個人用辞書22−1〜22−nに登録された語句を共有辞書21へ登録する際の手間隙及び人件費を無くすことができる。
12 通信ネットワーク
14 端末機
16 音声入力部
18 文書作成部
20 認識エンジン
21 共有辞書
22−1〜22−n 個人用辞書
23 ユーザ認証部
24 辞書登録部
25 修正箇所抽出部
26 登録語句蓄積部
27 閾値判定部
28 個人用辞書解析部
Claims (3)
- 音声入力機能と文書作成及び修正機能を備えて通信を行う端末機と回線接続され、この端末機にて入力された音声による音声データと、端末機のユーザ毎に設定された個人用辞書及び全ユーザの端末機が共用する共有辞書に登録された語句との照合によって、音声データに対応する語句を検索し、この検索した語句によるテキストデータを生成して音声認識を行う音声認識装置において、
前記端末機にて、前記音声認識により生成されたテキストデータの誤認識箇所が修正された修正テキストデータを受信し、この修正テキストデータと前記音声認識によるテキストデータとの比較から修正語句を抽出し、この抽出された修正語句が、当該端末機の個人用辞書及び共有辞書に登録か未登録かを検出する抽出手段と、
前記抽出手段で抽出された修正語句が未登録と検出された場合に、当該修正語句を該当個人用辞書に登録する登録手段と
を備えたことを特徴とする音声認識装置。 - 全ユーザの個人用辞書に登録された語句のうち同じ語句の登録数が、予め定められた閾値を超えた場合に、この閾値を登録数が超えた語句を前記共有辞書に登録し、この登録した語句を個人用辞書から削除する解析手段
を更に備えたことを特徴とする請求項1に記載の音声認識装置。 - 音声入力機能と文書作成及び修正機能を備えて通信を行う端末機と回線接続される音声認識装置によって、その端末機にて入力された音声による音声データと、端末機のユーザ毎に設定された個人用辞書及び全ユーザの端末機が共用する共有辞書に登録された語句との照合によって、音声データに対応する語句を検索し、この検索した語句によるテキストデータを生成して音声認識を行う音声認識方法において、
前記端末機にて、前記音声認識により生成されたテキストデータの誤認識箇所が修正された修正テキストデータを受信し、この修正テキストデータと前記音声認識によるテキストデータとの比較から修正語句を抽出し、この抽出された修正語句が、当該端末機の個人用辞書及び共有辞書に登録か未登録かを検出する第1のステップと、
前記第1のステップにおいて抽出された修正語句が未登録と検出された場合に、当該修正語句を該当個人用辞書に登録する第2のステップと、
全ユーザの個人用辞書に登録された語句のうち同じ語句の登録数が、予め定められた閾値を超えた場合に、この閾値を登録数が超えた語句を前記共有辞書に登録し、この登録した語句を個人用辞書から削除する第3のステップと
を含むことを特徴とする音声認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004035616A JP2005227510A (ja) | 2004-02-12 | 2004-02-12 | 音声認識装置及び音声認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004035616A JP2005227510A (ja) | 2004-02-12 | 2004-02-12 | 音声認識装置及び音声認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005227510A true JP2005227510A (ja) | 2005-08-25 |
Family
ID=35002269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004035616A Pending JP2005227510A (ja) | 2004-02-12 | 2004-02-12 | 音声認識装置及び音声認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005227510A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008007688A1 (fr) * | 2006-07-13 | 2008-01-17 | Nec Corporation | Terminal téléphonique ayant une fonction de reconnaissance vocale, dispositif de support de mise à jour de dictionnaire de reconnaissance vocale, et procédé de support associé |
WO2008069139A1 (ja) * | 2006-11-30 | 2008-06-12 | National Institute Of Advanced Industrial Science And Technology | 音声認識システム及び音声認識システム用プログラム |
WO2008114708A1 (ja) * | 2007-03-14 | 2008-09-25 | Nec Corporation | 音声認識システム、音声認識方法、および音声認識処理プログラム |
JP2010139744A (ja) * | 2008-12-11 | 2010-06-24 | Ntt Docomo Inc | 音声認識結果訂正装置および音声認識結果訂正方法 |
CN102324233A (zh) * | 2011-08-03 | 2012-01-18 | 中国科学院计算技术研究所 | 汉语语音识别中重复出现词识别错误的自动修正方法 |
JP2014067062A (ja) * | 2007-04-26 | 2014-04-17 | Microsoft Corp | アジア文字を生成するための認識アーキテクチャ |
JP2018055022A (ja) * | 2016-09-30 | 2018-04-05 | 株式会社リコー | 音声認識システム、情報処理装置、プログラム |
CN109448701A (zh) * | 2018-09-19 | 2019-03-08 | 易诚博睿(南京)科技有限公司 | 一种智能语音识别到语义理解的结果统计系统及方法 |
JP2020194184A (ja) * | 2012-08-10 | 2020-12-03 | エイディシーテクノロジー株式会社 | 音声応答装置、及び音声応答システム |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62262898A (ja) * | 1986-05-09 | 1987-11-14 | 株式会社リコー | 音声認識装置 |
JPH0887573A (ja) * | 1994-09-20 | 1996-04-02 | Hitachi Ltd | パターン情報処理装置 |
JP2001282779A (ja) * | 2000-03-30 | 2001-10-12 | Telecommunication Advancement Organization Of Japan | 電子化テキスト作成システム |
JP2001343994A (ja) * | 2000-06-01 | 2001-12-14 | Nippon Hoso Kyokai <Nhk> | 音声認識誤り検出装置および記憶媒体 |
JP2002014693A (ja) * | 2000-06-30 | 2002-01-18 | Mitsubishi Electric Corp | 音声認識システム用辞書提供方法、および音声認識インタフェース |
JP2002344574A (ja) * | 2001-05-15 | 2002-11-29 | Aruze Corp | 移動体通信機器 |
JP2003140682A (ja) * | 2001-11-05 | 2003-05-16 | Alpine Electronics Inc | 音声認識装置及び音声辞書作成方法 |
-
2004
- 2004-02-12 JP JP2004035616A patent/JP2005227510A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62262898A (ja) * | 1986-05-09 | 1987-11-14 | 株式会社リコー | 音声認識装置 |
JPH0887573A (ja) * | 1994-09-20 | 1996-04-02 | Hitachi Ltd | パターン情報処理装置 |
JP2001282779A (ja) * | 2000-03-30 | 2001-10-12 | Telecommunication Advancement Organization Of Japan | 電子化テキスト作成システム |
JP2001343994A (ja) * | 2000-06-01 | 2001-12-14 | Nippon Hoso Kyokai <Nhk> | 音声認識誤り検出装置および記憶媒体 |
JP2002014693A (ja) * | 2000-06-30 | 2002-01-18 | Mitsubishi Electric Corp | 音声認識システム用辞書提供方法、および音声認識インタフェース |
JP2002344574A (ja) * | 2001-05-15 | 2002-11-29 | Aruze Corp | 移動体通信機器 |
JP2003140682A (ja) * | 2001-11-05 | 2003-05-16 | Alpine Electronics Inc | 音声認識装置及び音声辞書作成方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008007688A1 (fr) * | 2006-07-13 | 2008-01-17 | Nec Corporation | Terminal téléphonique ayant une fonction de reconnaissance vocale, dispositif de support de mise à jour de dictionnaire de reconnaissance vocale, et procédé de support associé |
GB2457855B (en) * | 2006-11-30 | 2011-01-12 | Nat Inst Of Advanced Ind Scien | Speech recognition system and speech recognition system program |
WO2008069139A1 (ja) * | 2006-11-30 | 2008-06-12 | National Institute Of Advanced Industrial Science And Technology | 音声認識システム及び音声認識システム用プログラム |
JP2008158510A (ja) * | 2006-11-30 | 2008-07-10 | National Institute Of Advanced Industrial & Technology | 音声認識システム及び音声認識システム用プログラム |
GB2457855A (en) * | 2006-11-30 | 2009-09-02 | Nat Inst Of Advanced Ind Scien | Speech recognition system and speech recognition system program |
US8401847B2 (en) | 2006-11-30 | 2013-03-19 | National Institute Of Advanced Industrial Science And Technology | Speech recognition system and program therefor |
WO2008114708A1 (ja) * | 2007-03-14 | 2008-09-25 | Nec Corporation | 音声認識システム、音声認識方法、および音声認識処理プログラム |
US8676582B2 (en) | 2007-03-14 | 2014-03-18 | Nec Corporation | System and method for speech recognition using a reduced user dictionary, and computer readable storage medium therefor |
JP2014067062A (ja) * | 2007-04-26 | 2014-04-17 | Microsoft Corp | アジア文字を生成するための認識アーキテクチャ |
JP2010139744A (ja) * | 2008-12-11 | 2010-06-24 | Ntt Docomo Inc | 音声認識結果訂正装置および音声認識結果訂正方法 |
CN102324233A (zh) * | 2011-08-03 | 2012-01-18 | 中国科学院计算技术研究所 | 汉语语音识别中重复出现词识别错误的自动修正方法 |
JP2020194184A (ja) * | 2012-08-10 | 2020-12-03 | エイディシーテクノロジー株式会社 | 音声応答装置、及び音声応答システム |
JP2018055022A (ja) * | 2016-09-30 | 2018-04-05 | 株式会社リコー | 音声認識システム、情報処理装置、プログラム |
CN109448701A (zh) * | 2018-09-19 | 2019-03-08 | 易诚博睿(南京)科技有限公司 | 一种智能语音识别到语义理解的结果统计系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI427620B (zh) | A speech recognition result correction device and a speech recognition result correction method, and a speech recognition result correction system | |
JP2002125047A5 (ja) | ||
JPH10105655A (ja) | 光学文字認識のための検証および訂正の方法およびシステム | |
CN110765767B (zh) | 局部优化关键词的提取方法、装置、服务器及存储介质 | |
JP5148671B2 (ja) | 音声認識結果出力装置、音声認識結果出力方法、及び音声認識結果出力プログラム | |
JP3141833B2 (ja) | ネットワークアクセスシステム | |
KR102198424B1 (ko) | 통화 녹음 정보 관리방법, 이를 위한 컴퓨터 프로그램 | |
CN101405693A (zh) | 多模式输入的个人协作过滤 | |
JP2005227510A (ja) | 音声認識装置及び音声認識方法 | |
CN111858966B (zh) | 知识图谱的更新方法、装置、终端设备及可读存储介质 | |
JP5887162B2 (ja) | 通信端末、制御方法及びプログラム | |
JP2014182270A (ja) | 情報処理装置及び方法 | |
JP5185807B2 (ja) | 音声検索装置、音声検索方法及び音声検索プログラム | |
JP2010048890A (ja) | クライアント装置、認識結果フィードバック方法、認識結果フィードバックプログラム、サーバ装置、音声認識のモデル更新方法、音声認識のモデル更新プログラム、音声認識システム、音声認識方法、音声認識プログラム | |
KR101440887B1 (ko) | 영상 및 음성 정보를 이용한 명함 인식 방법 및 장치 | |
CN111627438A (zh) | 语音识别方法及装置 | |
JP2000089786A (ja) | 音声認識結果の修正方法および装置 | |
CN110955796A (zh) | 一种基于笔录信息的案件特征信息提取方法及装置 | |
KR100373989B1 (ko) | 음절 인식을 이용한 사용자 인증 방법 및 사용자 인증시스템 | |
JP2002032386A (ja) | データ処理方法、装置およびその方法を実施するプログラムを記録した記録媒体 | |
JP2015102805A (ja) | 音声認識システム、電子装置、サーバー、音声認識方法および音声認識プログラム | |
CN114528851A (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN115510182A (zh) | 用户投诉定责方法、设备、存储介质及装置 | |
KR100753779B1 (ko) | 혼합형 초성 검색을 수행하는 방법 및 상기 방법을수행하는 시스템 | |
JP2017134162A (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060412 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090406 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090617 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100316 |