JP4189336B2 - 音声情報処理システム、音声情報処理方法及びプログラム - Google Patents
音声情報処理システム、音声情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP4189336B2 JP4189336B2 JP2004049749A JP2004049749A JP4189336B2 JP 4189336 B2 JP4189336 B2 JP 4189336B2 JP 2004049749 A JP2004049749 A JP 2004049749A JP 2004049749 A JP2004049749 A JP 2004049749A JP 4189336 B2 JP4189336 B2 JP 4189336B2
- Authority
- JP
- Japan
- Prior art keywords
- kana
- correction
- character string
- dictionary
- kanji character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
「情報処理学会誌」、2000年4月号(Vol.41 No.04)、pp.436−439、特集名:道しるべ、題目:ここまできた音声認識技術、執筆者:河原達也(京都大学 情報学研究科)
また、装置または方法に係る本発明は、コンピュータに当該発明に相当する手段を実行させるための(あるいはコンピュータを当該発明に相当する手段として機能させるための、あるいはコンピュータに当該発明に相当する機能を実現させるための)プログラムとしても成立し、該プログラムを記録したコンピュータ読み取り可能な記録媒体としても成立する。
図1に、本発明の第1の実施形態に係る音声認識システム(自然言語処理システム)の構成例を示す。
入力音声:「ふんこつさいしんどりょくします」
認識結果:「粉骨最新努力します。」
この誤認識を訂正するために、ユーザは次のような訂正操作(A)を実施する。
訂正操作(A):
(i)カーソルを「最新」の右に移動
(ii)直前2文字「最新」を削除
(iii)「くだく しんたい」と発声
(iv)認識結果の「砕く身体」のうち「く」「体」を削除
(v)カーソルを文末に移動して次の発声の準備をする
なお、本実施形態では、訂正操作時に文字列を入力するために音声入力を使用しているが、これはキーボード等による文字入力であっても構わない。
訂正結果:「粉骨砕身努力します。」
ユーザのこの訂正操作結果から訂正結果生成部102は、「最新」という認識結果の位置の文字列を「砕身」に訂正したことを検出し、訂正結果情報(203)として「訂正位置:認識結果中の『最新』、訂正結果文字列:砕身」を出力する。
図4に、本発明の第2の実施形態に係る音声認識システム(自然言語処理システム)の構成例を示す。
入力音声:「ふんこつさいしんどりょくします」
認識結果:「粉骨最新努力します。」
この誤認識を訂正するために、ユーザは訂正操作(A)を実施する(第1の実施形態参照)。
訂正結果:「粉骨砕身努力します。」
ユーザのこの訂正操作結果から、訂正手順生成部108は、「最新」という認識結果の位置の文字列に対して訂正操作(A)を実施したことを検出し、訂正手順206として「訂正位置:認識結果中の『最新』、訂正操作:「最新」を削除→「くだく しんたい」と発声→「く」「体」を削除」を出力する。
図6に、本発明の第3の実施形態に係る音声認識システム(自然言語処理システム)の構成例を示す。
入力音声:「ふんこつさいしんどりょくします」
認識結果:「粉骨最新努力します。」
この誤認識を訂正するために、ユーザは訂正操作(A)を実施する(第1の実施形態参照)。
訂正結果:「粉骨砕身努力します。」
ユーザのこの訂正操作結果から、訂正結果生成部102は、「最新」という認識結果の位置の文字列を「砕身」に訂正したことを検出し、訂正結果情報203として「訂正位置:認識結果中の『最新』、訂正結果文字列:砕身」を出力する。
図8に、本発明の第4の実施形態に係る音声認識システム(自然言語処理システム)の構成例を示す。
入力音声:「ふんこつさいしんどりょくします」
認識結果:「粉骨最新努力します。」
この誤認識を訂正するために、ユーザは訂正操作(A)を実施する(第1の実施形態参照)。
訂正結果:「粉骨砕身努力します。」
ユーザのこの訂正操作結果から、訂正結果生成部102は「最新」という認識結果の位置の文字列を「砕身」に訂正したことを検出し、訂正結果情報203として「訂正位置:認識結果中の『最新』、訂正結果文字列:砕身」を出力する。
本発明の第5の実施形態は、第4の実施形態の前後関係の情報を考慮する構成を、第2の実施形態に適用したものである。第4の実施形態で示した、前後関係の情報を考慮する構成に関する効果やバリエーションは、本実施形態にも妥当する。
入力音声:「ふんこつさいしんどりょくします」
認識結果:「粉骨最新努力します。」
この誤認識を訂正するために、ユーザは訂正操作(A)を実施する(第1の実施形態参照)。
訂正結果:「粉骨砕身努力します。」
ユーザのこの訂正操作結果から、訂正手順生成部108は「最新」という認識結果の位置の文字列に対して訂正操作(A)を実施したことを検出し、訂正手順206として「訂正位置:認識結果中の『最新』、訂正操作:「最新」を削除→「くだく しんたい」と発声→「く」「体」を削除」を出力する。
本発明の第6の実施形態は、第4の実施形態の前後関係の情報を考慮する構成を、第3の実施形態に適用したものである。第4の実施形態で示した、前後関係の情報を考慮する構成に関する効果やバリエーションは、本実施形態にも妥当する。
認識結果:「粉骨最新努力します。」
この誤認識を訂正するために、ユーザは訂正操作(A)を実施する(第1の実施形態参照)。
訂正結果:「粉骨砕身努力します。」
ユーザのこの訂正操作結果から、訂正結果生成部102は、「最新」という認識結果の位置の文字列を「砕身」に訂正したことを検出し、訂正結果情報203として「訂正位置:認識結果中の『最新』、訂正結果文字列:砕身」を出力する。
また、本実施形態は、コンピュータに所定の手段を実行させるための、あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるためのプログラムとして実施することもできる。加えて該プログラムを記録したコンピュータ読取り可能な記録媒体として実施することもできる。
Claims (7)
- 処理対象となる語彙の仮名による読みに関する情報と仮名漢字による表記に関する情報とを含む第1の辞書データを複数登録した認識語彙辞書と、音声を入力する手段と、
入力した前記音声をもとにして仮名文字列を生成する手段と、
前記認識語彙辞書に基づいて、生成された前記仮名文字列に対する仮名漢字文字列を生成する仮名漢字文字列生成手段と、
生成された前記仮名漢字文字列を表示画面に表示する表示手段と、
表示された前記仮名漢字文字列に対する訂正を受け付ける受付手段と、
前記訂正に係る仮名漢字文字列のもととなった仮名文字列と前記訂正の内容に関する情報とを含む第2の辞書データを生成する辞書データ生成手段と、
生成された前記第2の辞書データを、前記認識語彙辞書とは異なる特定の辞書に登録する登録手段と、
生成された前記仮名漢字文字列及び該仮名漢字文字列に対する訂正に基づき、前記仮名漢字文字列生成手段による仮名漢字文字列の生成にあたって、当該訂正に係る前記第2の辞書データを適用するか否かを判断するための基準となる基準データを生成する基準データ生成手段と、
生成された前記基準データを前記第2の辞書データに対応付けて記憶する記憶手段とを備え、
前記仮名漢字文字列生成手段は、前記認識語彙辞書と前記特定の辞書に登録されている前記第2の辞書データとのいずれも適用可能な場合には、該第2の辞書データに対応付けて前記記憶手段に記憶されている前記基準データに基づいて該第2の辞書データを適用すると判断されたときにのみ、該第2の辞書データに基づいて前記生成を行うことを特徴とする音声情報処理システム。 - 前記辞書データ生成手段は、前記訂正の内容に関する情報として、少なくとも前記訂正に係る訂正後の仮名漢字文字列を、前記第2の辞書データに含めるものであることを特徴とする請求項1に記載の音声情報処理システム。
- 前記特定の辞書は、所望の語彙に係る辞書データをユーザ登録可能なユーザ辞書であることを特徴とする請求項2に記載の音声情報処理システム。
- 前記辞書データ生成手段は、前記訂正の内容に関する情報として、前記訂正に係る操作の手順を示す情報を、前記第2の辞書データに含めるものであることを特徴とする請求項1に記載の音声情報処理システム。
- 前記基準データは、前記訂正に係る仮名文字列に対して特定の位置関係を持つ箇所に、特定の仮名漢字文字列が存在する場合にのみ、前記第2の辞書データを適用することを示すものであることを特徴とする請求項1に記載の音声情報処理システム。
- 処理対象となる語彙の仮名による読みに関する情報と仮名漢字による表記に関する情報とを含む第1の辞書データを複数登録した認識語彙辞書を備えた言語処理装置における音声情報処理方法であって、
音声を入力する音声入力ステップと、
入力した前記音声をもとにして仮名文字列を生成する仮名文字列生成ステップと、
前記認識語彙辞書に基づいて、生成された前記仮名文字列に対する仮名漢字文字列を生成する仮名漢字文字列生成ステップと、
生成された前記仮名漢字文字列を表示画面に表示する表示ステップと、
表示された前記仮名漢字文字列に対する訂正を受け付ける受付ステップと、
前記訂正に係る仮名漢字文字列のもととなった仮名文字列と前記訂正の内容に関する情報とを含む第2の辞書データを生成する辞書データ生成ステップと、
生成された前記第2の辞書データを、前記認識語彙辞書とは異なる特定の辞書に登録する登録ステップと、
生成された前記仮名漢字文字列及び該仮名漢字文字列に対する訂正に基づき、前記仮名漢字文字列生成手段による仮名漢字文字列の生成にあたって、当該訂正に係る前記第2の辞書データを適用するか否かを判断するための基準となる基準データを生成する基準データ生成ステップと、
生成された前記基準データを前記第2の辞書データに対応付けて記憶手段に記憶する記憶ステップとを有し、
前記仮名漢字文字列生成ステップでは、前記認識語彙辞書と前記特定の辞書に登録されている前記第2の辞書データとのいずれも適用可能な場合には、該第2の辞書データに対応付けて前記記憶手段に記憶されている前記基準データに基づいて該第2の辞書データを適用すると判断されたときにのみ、該第2の辞書データに基づいて前記生成を行うことを特徴とする音声情報処理方法。 - 処理対象となる語彙の仮名による読みに関する情報と仮名漢字による表記に関する情報とを含む第1の辞書データを複数登録した認識語彙辞書を備えた音声情報処理システムとしてコンピュータを機能させるためのプログラムにおいて、
前記プログラムは、
音声を入力する音声入力ステップと、
入力した前記音声をもとにして仮名文字列を生成する仮名文字列生成ステップと、
前記認識語彙辞書に基づいて、生成された前記仮名文字列に対する仮名漢字文字列を生成する仮名漢字文字列生成ステップと、
生成された前記仮名漢字文字列を表示画面に表示する表示ステップと、
表示された前記仮名漢字文字列に対する訂正を受け付ける受付ステップと、
前記訂正に係る仮名漢字文字列のもととなった仮名文字列と前記訂正の内容に関する情報とを含む第2の辞書データを生成する辞書データ生成ステップと、
生成された前記第2の辞書データを、前記認識語彙辞書とは異なる特定の辞書に登録する登録ステップと、
生成された前記仮名漢字文字列及び該仮名漢字文字列に対する訂正に基づき、前記仮名漢字文字列生成手段による仮名漢字文字列の生成にあたって、当該訂正に係る前記第2の辞書データを適用するか否かを判断するための基準となる基準データを生成する基準データ生成ステップと、
生成された前記基準データを前記第2の辞書データに対応付けて記憶手段に記憶する記憶ステップとをコンピュータに実行させるとともに、
前記仮名漢字文字列生成ステップでは、前記認識語彙辞書と前記特定の辞書に登録されている前記第2の辞書データとのいずれも適用可能な場合には、該第2の辞書データに対応付けて前記記憶手段に記憶されている前記基準データに基づいて該第2の辞書データを適用すると判断されたときにのみ、該第2の辞書データに基づいて前記生成を行わせるものであることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004049749A JP4189336B2 (ja) | 2004-02-25 | 2004-02-25 | 音声情報処理システム、音声情報処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004049749A JP4189336B2 (ja) | 2004-02-25 | 2004-02-25 | 音声情報処理システム、音声情報処理方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005241829A JP2005241829A (ja) | 2005-09-08 |
JP4189336B2 true JP4189336B2 (ja) | 2008-12-03 |
Family
ID=35023644
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004049749A Expired - Fee Related JP4189336B2 (ja) | 2004-02-25 | 2004-02-25 | 音声情報処理システム、音声情報処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4189336B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013050742A (ja) * | 2012-12-11 | 2013-03-14 | Ntt Docomo Inc | 音声認識装置および音声認識方法 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4736478B2 (ja) * | 2005-03-07 | 2011-07-27 | 日本電気株式会社 | 音声書き起こし支援装置およびその方法ならびにプログラム |
JP5366169B2 (ja) * | 2006-11-30 | 2013-12-11 | 独立行政法人産業技術総合研究所 | 音声認識システム及び音声認識システム用プログラム |
JP5451982B2 (ja) * | 2008-04-23 | 2014-03-26 | ニュアンス コミュニケーションズ,インコーポレイテッド | 支援装置、プログラムおよび支援方法 |
JP5285326B2 (ja) * | 2008-05-14 | 2013-09-11 | 日本電信電話株式会社 | 音声誤認識訂正支援装置とその方法と、プログラムとその記録媒体 |
JP5535238B2 (ja) * | 2009-11-30 | 2014-07-02 | 株式会社東芝 | 情報処理装置 |
JP6545633B2 (ja) * | 2016-03-17 | 2019-07-17 | 株式会社東芝 | 単語スコア計算装置、単語スコア計算方法及びプログラム |
US10019986B2 (en) * | 2016-07-29 | 2018-07-10 | Google Llc | Acoustic model training using corrected terms |
JP6526608B2 (ja) * | 2016-09-06 | 2019-06-05 | 株式会社東芝 | 辞書更新装置およびプログラム |
CN109841209A (zh) * | 2017-11-27 | 2019-06-04 | 株式会社速录抓吧 | 语音识别设备和系统 |
US11263198B2 (en) * | 2019-09-05 | 2022-03-01 | Soundhound, Inc. | System and method for detection and correction of a query |
JP7463690B2 (ja) * | 2019-10-31 | 2024-04-09 | 株式会社リコー | サーバ装置、通信システム、情報処理方法、プログラムおよび記録媒体 |
-
2004
- 2004-02-25 JP JP2004049749A patent/JP4189336B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013050742A (ja) * | 2012-12-11 | 2013-03-14 | Ntt Docomo Inc | 音声認識装置および音声認識方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2005241829A (ja) | 2005-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4158937B2 (ja) | 字幕修正装置 | |
US8515755B2 (en) | Replacing text representing a concept with an alternate written form of the concept | |
US20070100619A1 (en) | Key usage and text marking in the context of a combined predictive text and speech recognition system | |
JP2002014954A (ja) | 中国語入力変換処理装置、中国語入力変換処理方法及び記録媒体 | |
JP5535238B2 (ja) | 情報処理装置 | |
JPS61107430A (ja) | 音声情報の編集装置 | |
JP2002117026A (ja) | 確率的入力方法によって生成された候補リストからフィルタリングおよび選択を行うための方法およびシステム | |
JP4189336B2 (ja) | 音声情報処理システム、音声情報処理方法及びプログラム | |
US20060095263A1 (en) | Character string input apparatus and method of controlling same | |
JP3104661B2 (ja) | 日本語文章作成装置 | |
JP6678545B2 (ja) | 修正システム、修正方法及びプログラム | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
JP5160594B2 (ja) | 音声認識装置および音声認識方法 | |
WO2012144525A1 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP2002207728A (ja) | 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体 | |
JP2010197709A (ja) | 音声認識応答方法、音声認識応答システム、及びそのプログラム | |
JP2009199434A (ja) | アルファベット文字列日本語読み変換装置及びアルファベット文字列日本語読み変換プログラム | |
JP3284976B2 (ja) | 音声合成装置及びコンピュータ可読記録媒体 | |
CN110782899B (zh) | 信息处理装置、存储介质及信息处理方法 | |
JP6640788B2 (ja) | 言語変換プログラム及び言語変換装置 | |
JP2001014304A (ja) | 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体 | |
JP2000003355A (ja) | 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体 | |
WO2023166651A1 (ja) | 情報処理装置及び情報処理プログラム | |
JP2001109740A (ja) | 中国語文書作成装置及び中国語文書作成方法 | |
JPWO2005076259A1 (ja) | 音声入力システム、音声入力方法、および、音声入力用プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080909 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080912 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110919 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110919 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120919 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120919 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130919 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |