JP2012063545A - 音声認識結果出力装置、音声認識結果出力方法、及び音声認識結果出力プログラム - Google Patents
音声認識結果出力装置、音声認識結果出力方法、及び音声認識結果出力プログラム Download PDFInfo
- Publication number
- JP2012063545A JP2012063545A JP2010207132A JP2010207132A JP2012063545A JP 2012063545 A JP2012063545 A JP 2012063545A JP 2010207132 A JP2010207132 A JP 2010207132A JP 2010207132 A JP2010207132 A JP 2010207132A JP 2012063545 A JP2012063545 A JP 2012063545A
- Authority
- JP
- Japan
- Prior art keywords
- recognition result
- character string
- correction candidate
- characters
- reading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 37
- 238000012937 correction Methods 0.000 claims abstract description 178
- 238000000605 extraction Methods 0.000 claims abstract description 87
- 238000013500 data storage Methods 0.000 claims abstract description 47
- 238000012545 processing Methods 0.000 claims abstract description 23
- 230000006870 function Effects 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 13
- 238000004891 communication Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 10
- 239000003973 paint Substances 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 206010048669 Terminal state Diseases 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000005389 magnetism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Images
Abstract
【解決手段】この携帯電話端末1は、音声認識処理によって生成される認識結果文字列、及び認識結果文字列の読みの文字数を取得する音声認識部11と、予め複数の登録文字列を、登録文字列の読みと対応して格納する辞書データ格納部14と、音声認識部11によって取得された認識結果文字列及び文字数に基づいて、認識結果文字列のうちの誤認識部分、及び誤認識部分の読みの文字数を特定する誤認識部分特定部12と、誤認識部分特定部12によって特定された読みの文字数に基づいて、辞書データ格納部14から、読みの文字数が一致する登録文字列を誤認識部分に対する訂正候補として抽出する訂正候補抽出部13と、訂正候補抽出部13によって抽出された訂正候補を出力する訂正結果出力部15とを備える。
【選択図】図1
Description
図1は、本発明の第1実施形態にかかる携帯電話端末1の概略構成図である。同図に示す携帯電話端末1は、音声通信機能、データ通信機能、及び、電子メール送信時やWEBサイト接続時に用いられる文字データの入力機能とを有する携帯用端末装置である。なお、本発明はこのような通信機能を有する携帯電話端末に限定されるものではなく、通信機能を有さないパーソナルコンピュータ、PDA等のキーボード、入力ボタン等のデータ入力手段、及びマイク等の音声入力手段を具備した情報処理端末に広く適用されうる。
以下、本発明の第2実施形態について詳細に説明する。
Claims (7)
- 音声入力に対する音声認識処理の結果である認識結果文字列、及び前記認識結果文字列の読みの文字数を特定するための文字数特定データを取得する認識結果取得手段と、
予め複数の登録文字列を、前記登録文字列の読みと対応して格納する辞書データ格納手段と、
前記認識結果取得手段によって取得された前記認識結果文字列及び前記文字数特定データに基づいて、前記認識結果文字列のうちの誤認識部分、及び前記誤認識部分の読みの文字数を特定する誤認識部分特定手段と、
前記誤認識部分特定手段によって特定された前記読みの文字数に基づいて、前記辞書データ格納手段から、読みの文字数が一致する登録文字列を前記誤認識部分に対する訂正候補として抽出する訂正候補抽出手段と、
前記訂正候補抽出手段によって抽出された前記訂正候補を出力する訂正候補出力手段と、
を備えることを特徴とする音声認識結果出力装置。 - 前記訂正候補抽出手段は、前記辞書データ格納手段から、読みの文字及び位置が前記誤認識部分と一致する登録文字列をさらに抽出する、
ことを特徴とする請求項1記載の音声認識結果出力装置。 - 前記認識結果取得手段は、前記認識結果文字列の読みの文字毎に音声認識処理の信頼度を示す信頼度データをさらに取得し、
前記訂正候補抽出手段は、前記誤認識部分に対応する読みの文字の中から、前記信頼度データが所定の閾値以上の読みの文字を特定し、前記辞書データ格納手段から、前記読みの文字及び位置が前記誤認識部分と一致する登録文字列をさらに抽出する、
ことを特徴とする請求項2記載の音声認識結果出力装置。 - 前記認識結果取得手段は、前記認識結果文字列に対する音声認識処理の信頼度を示す信頼度データをさらに取得し、
前記訂正候補抽出手段は、前記辞書データ格納手段から前記登録文字列を抽出する際に、前記信頼度が高くなるに従って抽出条件を限定する、
ことを特徴とする請求項2記載の音声認識結果出力装置。 - 前記認識結果取得手段は、前記音声入力に対する複数の前記認識結果文字列を取得し、
前記訂正候補抽出手段は、一の前記認識結果文字列の誤認識部分と他の前記認識結果文字列との間で一致する読みの文字及び位置を特定し、前記辞書データ格納手段から、該読みの文字及び位置が前記誤認識部分と一致する登録文字列をさらに抽出する、
ことを特徴とする請求項1記載の音声認識結果出力装置。 - 認識結果取得手段が、音声入力に対する音声認識処理の結果である認識結果文字列、及び前記認識結果文字列の読みの文字数を特定するための文字数特定データを取得する認識結果取得ステップと、
辞書データ格納手段が、予め複数の登録文字列を、前記登録文字列の読みと対応して格納する辞書データ格納ステップと、
誤認識部分特定手段が、前記認識結果取得手段によって取得された前記認識結果文字列及び前記文字数特定データに基づいて、前記認識結果文字列のうちの誤認識部分、及び前記誤認識部分の読みの文字数を特定する誤認識部分特定ステップと、
訂正候補抽出手段が、前記誤認識部分特定手段によって特定された前記読みの文字数に基づいて、前記辞書データ格納手段から、読みの文字数が一致する登録文字列を前記誤認識部分に対する訂正候補として抽出する訂正候補抽出ステップと、
訂正候補出力手段が、前記訂正候補抽出手段によって抽出された前記訂正候補を出力する訂正候補出力ステップと、
を備えることを特徴とする音声認識結果出力方法。 - コンピュータを、
音声入力に対する音声認識処理の結果である認識結果文字列、及び前記認識結果文字列の読みの文字数を特定するための文字数特定データを取得する認識結果取得手段、
予め複数の登録文字列を、前記登録文字列の読みと対応して格納する辞書データ格納手段、
前記認識結果取得手段によって取得された前記認識結果文字列及び前記文字数特定データに基づいて、前記認識結果文字列のうちの誤認識部分、及び前記誤認識部分の読みの文字数を特定する誤認識部分特定手段、
前記誤認識部分特定手段によって特定された前記読みの文字数に基づいて、前記辞書データ格納手段から、読みの文字数が一致する登録文字列を前記誤認識部分に対する訂正候補として抽出する訂正候補抽出手段、及び
前記訂正候補抽出手段によって抽出された前記訂正候補を出力する訂正候補出力手段、
として機能させることを特徴とする音声認識結果出力プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010207132A JP5148671B2 (ja) | 2010-09-15 | 2010-09-15 | 音声認識結果出力装置、音声認識結果出力方法、及び音声認識結果出力プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010207132A JP5148671B2 (ja) | 2010-09-15 | 2010-09-15 | 音声認識結果出力装置、音声認識結果出力方法、及び音声認識結果出力プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012063545A true JP2012063545A (ja) | 2012-03-29 |
JP5148671B2 JP5148671B2 (ja) | 2013-02-20 |
Family
ID=46059321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010207132A Active JP5148671B2 (ja) | 2010-09-15 | 2010-09-15 | 音声認識結果出力装置、音声認識結果出力方法、及び音声認識結果出力プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5148671B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015056154A (ja) * | 2013-09-13 | 2015-03-23 | 独立行政法人情報通信研究機構 | テキスト編集装置及びプログラム |
JP2016091028A (ja) * | 2014-10-31 | 2016-05-23 | 株式会社東芝 | 音声認識結果最適化装置、音声認識結果最適化方法、及びプログラム |
JP2018005120A (ja) * | 2016-07-07 | 2018-01-11 | 学校法人立命館 | 音声認識装置、音声認識方法及びコンピュータプログラム |
JP2019507362A (ja) * | 2016-02-05 | 2019-03-14 | グーグル エルエルシー | 外部データソースを用いた音声の再認識 |
CN109697983A (zh) * | 2017-10-24 | 2019-04-30 | 上海赛趣网络科技有限公司 | 汽车钢印号快速获取方法、移动终端及存储介质 |
JP2020148814A (ja) * | 2019-03-11 | 2020-09-17 | 株式会社 日立産業制御ソリューションズ | 音声認識支援装置、音声認識支援方法及び音声認識支援プログラム |
JP2021179860A (ja) * | 2020-05-14 | 2021-11-18 | ヤフー株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7568607B2 (ja) | 2021-06-07 | 2024-10-16 | リズム株式会社 | 防災文字表示機システム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61239378A (ja) * | 1985-04-16 | 1986-10-24 | Toshiba Corp | 認識処理装置 |
JPH06282293A (ja) * | 1993-03-29 | 1994-10-07 | Sony Corp | 音声認識装置 |
-
2010
- 2010-09-15 JP JP2010207132A patent/JP5148671B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61239378A (ja) * | 1985-04-16 | 1986-10-24 | Toshiba Corp | 認識処理装置 |
JPH06282293A (ja) * | 1993-03-29 | 1994-10-07 | Sony Corp | 音声認識装置 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015056154A (ja) * | 2013-09-13 | 2015-03-23 | 独立行政法人情報通信研究機構 | テキスト編集装置及びプログラム |
JP2016091028A (ja) * | 2014-10-31 | 2016-05-23 | 株式会社東芝 | 音声認識結果最適化装置、音声認識結果最適化方法、及びプログラム |
US9672817B2 (en) | 2014-10-31 | 2017-06-06 | Kabushiki Kaisha Toshiba | Method and apparatus for optimizing a speech recognition result |
JP2019507362A (ja) * | 2016-02-05 | 2019-03-14 | グーグル エルエルシー | 外部データソースを用いた音声の再認識 |
JP2018005120A (ja) * | 2016-07-07 | 2018-01-11 | 学校法人立命館 | 音声認識装置、音声認識方法及びコンピュータプログラム |
CN109697983A (zh) * | 2017-10-24 | 2019-04-30 | 上海赛趣网络科技有限公司 | 汽车钢印号快速获取方法、移动终端及存储介质 |
CN109697983B (zh) * | 2017-10-24 | 2024-06-11 | 上海赛趣网络科技有限公司 | 汽车钢印号快速获取方法、移动终端及存储介质 |
JP2020148814A (ja) * | 2019-03-11 | 2020-09-17 | 株式会社 日立産業制御ソリューションズ | 音声認識支援装置、音声認識支援方法及び音声認識支援プログラム |
JP7096634B2 (ja) | 2019-03-11 | 2022-07-06 | 株式会社 日立産業制御ソリューションズ | 音声認識支援装置、音声認識支援方法及び音声認識支援プログラム |
JP2021179860A (ja) * | 2020-05-14 | 2021-11-18 | ヤフー株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7128229B2 (ja) | 2020-05-14 | 2022-08-30 | ヤフー株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7568607B2 (ja) | 2021-06-07 | 2024-10-16 | リズム株式会社 | 防災文字表示機システム |
Also Published As
Publication number | Publication date |
---|---|
JP5148671B2 (ja) | 2013-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5148671B2 (ja) | 音声認識結果出力装置、音声認識結果出力方法、及び音声認識結果出力プログラム | |
CN107357778B (zh) | 一种变形词的识别验证方法及系统 | |
JP5480760B2 (ja) | 端末装置、音声認識方法および音声認識プログラム | |
CN105931644B (zh) | 一种语音识别方法及移动终端 | |
JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
KR101590724B1 (ko) | 음성 인식 오류 수정 방법 및 이를 수행하는 장치 | |
JP4705023B2 (ja) | 音声認識装置、音声認識方法、及びプログラム | |
Tinwala et al. | Eyes-free text entry with error correction on touchscreen mobile devices | |
JP4930379B2 (ja) | 類似文検索方法、類似文検索システム及び類似文検索用プログラム | |
US8401852B2 (en) | Utilizing features generated from phonic units in speech recognition | |
US6763331B2 (en) | Sentence recognition apparatus, sentence recognition method, program, and medium | |
CN104166462A (zh) | 一种文字的输入方法和系统 | |
JP2016062069A (ja) | 音声認識方法、及び音声認識装置 | |
WO2020156342A1 (zh) | 语音识别方法、装置、电子设备及存储介质 | |
CN113268981B (zh) | 一种信息处理方法、装置及电子设备 | |
CN112669842A (zh) | 人机对话控制方法、装置、计算机设备及存储介质 | |
TW201919040A (zh) | 聲控方法及系統 | |
CN111768789A (zh) | 电子设备及其语音发出者身份确定方法、装置和介质 | |
JP2012078650A (ja) | 音声入力支援装置 | |
CN111209367A (zh) | 信息查找方法、信息查找装置、电子设备及存储介质 | |
CN114171000A (zh) | 一种基于声学模型和语言模型的音频识别方法 | |
JP2011008784A (ja) | ローマ字変換を用いる日本語自動推薦システムおよび方法 | |
CN112037772B (zh) | 基于多模态的响应义务检测方法、系统及装置 | |
JP2010048890A (ja) | クライアント装置、認識結果フィードバック方法、認識結果フィードバックプログラム、サーバ装置、音声認識のモデル更新方法、音声認識のモデル更新プログラム、音声認識システム、音声認識方法、音声認識プログラム | |
KR20130050132A (ko) | 오류 발음 검출을 위한 단말 및 음성 인식 장치, 그리고 그의 음향 모델 학습 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120521 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20120531 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20120613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5148671 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |