JP5396426B2 - 音声認識装置、音声認識方法及び音声認識プログラム - Google Patents
音声認識装置、音声認識方法及び音声認識プログラム Download PDFInfo
- Publication number
- JP5396426B2 JP5396426B2 JP2011095368A JP2011095368A JP5396426B2 JP 5396426 B2 JP5396426 B2 JP 5396426B2 JP 2011095368 A JP2011095368 A JP 2011095368A JP 2011095368 A JP2011095368 A JP 2011095368A JP 5396426 B2 JP5396426 B2 JP 5396426B2
- Authority
- JP
- Japan
- Prior art keywords
- section
- speech recognition
- input
- sections
- processing result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 47
- 238000012937 correction Methods 0.000 claims description 141
- 238000012545 processing Methods 0.000 claims description 123
- 230000006870 function Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 19
- 239000000284 extract Substances 0.000 description 14
- 238000004891 communication Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 230000002354 daily effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010012239 Delusion Diseases 0.000 description 1
- 241000277269 Oncorhynchus masou Species 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 231100000868 delusion Toxicity 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
Description
また、一の保留区間に対する修正入力を行うことにより、連続する複数の保留区間に対応する区間の修正が可能であるので、保留区間が統合されない場合において必要とされた後続する保留区間の削除操作が必要とされない。従って、ユーザの操作低減が可能となる。
Claims (6)
- 入力音声を取得する音声取得手段と、
複数の語句を記憶している辞書記憶手段と、
前記音声取得手段により取得された入力音声を複数の区間に区切り、前記辞書記憶手段を参照して前記複数の区間毎に音声認識処理を実施し、前記音声認識処理により複数の区間毎に得られた複数の語句からなる音声認識処理結果を出力する音声認識手段と、
前記音声認識手段により出力された音声認識処理結果を提示する認識結果表示手段と、
前記認識結果表示手段により提示された音声認識処理結果における前記区間に対して、少なくとも保留指定の入力を受け付ける指定受付手段と、
前記認識結果表示手段による音声認識処理結果の提示において、前記指定受付手段により保留指定の受け付けをされた区間である保留区間を、保留指定されていない区間と識別可能な態様で表示する保留区間表示手段と、
前記音声認識処理結果から前記保留区間を抽出し、抽出した前記保留区間の語句を編集可能に制御する編集制御手段と、
前記編集制御手段により編集可能に制御された保留区間に対する文字列の入力を受け付ける修正入力受付手段と、を備え、
前記編集制御手段は、前記音声認識処理結果において、連続する複数の区間を保留区間として抽出した場合に、当該複数の区間を統合して一の保留区間として編集可能に制御する、
ことを特徴とする音声認識装置。 - 前記編集制御手段により統合された一の保留区間に対応する入力音声に対して音声認識処理されて得られた語句を、前記音声認識手段により出力された音声認識処理結果から抽出する再認識手段と、
前記再認識手段により抽出された語句を、前記一の保留区間の語句の訂正候補の語句として表示する訂正候補表示手段と
を更に備えることを特徴とする請求項1に記載の音声認識装置。 - 前記編集制御手段により統合された一の保留区間に含まれる複数の区間の音声認識処理結果として音声認識手段により出力された語句に基づき、前記辞書記憶手段を検索する再検索手段と、
前記再検索手段により検索された語句を、前記一の保留区間の語句の訂正候補の語句として表示する訂正候補表示手段と
を更に備えることを特徴とする請求項1に記載の音声認識装置。 - 前記修正入力受付手段により受け付けられた入力文字列に基づき前記辞書記憶手段を検索して前記入力文字列を含む訂正候補語句を抽出し、該訂正候補語句の末尾の文字列と、前記音声認識手段により出力された音声認識処理結果における前記保留区間の直後の文字列とが一致する場合に、該一致した文字列を省いて前記訂正候補語句を表示する訂正候補表示手段を更に備えることを特徴とする請求項1に記載の音声認識装置。
- 入力音声を取得する音声取得ステップと、
前記音声取得ステップにおいて取得された入力音声を複数の区間に区切り、複数の語句を記憶している辞書記憶手段を参照して前記複数の区間毎に音声認識処理を実施し、前記音声認識処理により複数の区間毎に得られた複数の語句からなる音声認識処理結果を出力する音声認識ステップと、
前記音声認識ステップにおいて出力された音声認識処理結果を提示する認識結果提示ステップと、
前記認識結果提示ステップにおいて提示された音声認識処理結果における前記区間に対して、少なくとも保留指定の入力を受け付け可能な指定入力受付ステップと、
前記認識結果提示ステップにおける音声認識処理結果の提示において、前記指定入力受付ステップにおいて保留指定の受け付けをされた区間である保留区間を、保留指定されていない区間と識別可能な態様で表示する保留区間表示ステップと、
前記音声認識処理結果から前記保留区間を抽出し、抽出した前記保留区間の語句を編集可能に制御する編集制御ステップと、
前記編集制御ステップにおいて編集可能に制御された保留区間に対する文字列の入力を受け付ける修正入力受付ステップと、を有し、
前記編集制御ステップは、前記音声認識処理結果において、連続する複数の区間を保留区間として抽出した場合に、当該複数の区間を統合して一の保留区間として編集可能に制御する、
ことを特徴とする音声認識装置における音声認識方法。 - コンピュータに、
入力音声を取得する音声取得機能と、
前記音声取得機能により取得された入力音声を複数の区間に区切り、複数の語句を記憶している辞書記憶手段を参照して前記複数の区間毎に音声認識処理を実施し、前記音声認識処理により複数の区間毎に得られた複数の語句からなる音声認識処理結果を出力する音声認識機能と、
前記音声認識機能により出力された音声認識処理結果を提示する認識結果提示機能と、
前記認識結果提示機能により提示された音声認識処理結果における前記区間に対して、少なくとも保留指定の入力を受け付け可能な指定受付機能と、
前記認識結果提示機能による音声認識処理結果の提示において、前記指定受付機能により保留指定の受け付けをされた区間である保留区間を、保留指定されていない区間と識別可能な態様で表示する保留区間表示機能と、
前記音声認識処理結果から前記保留区間を抽出し、抽出した前記保留区間の語句を編集可能に制御する編集制御機能と、
前記編集制御機能により編集可能に制御された保留区間に対する文字列の入力を受け付ける修正入力受付機能と、を実現させ、
前記編集制御機能は、前記音声認識処理結果において、連続する複数の区間を保留区間として抽出した場合に、当該複数の区間を統合して一の保留区間として編集可能に制御する、
ことを特徴とする音声認識プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011095368A JP5396426B2 (ja) | 2011-04-21 | 2011-04-21 | 音声認識装置、音声認識方法及び音声認識プログラム |
PCT/JP2012/060478 WO2012144525A1 (ja) | 2011-04-21 | 2012-04-18 | 音声認識装置、音声認識方法及び音声認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011095368A JP5396426B2 (ja) | 2011-04-21 | 2011-04-21 | 音声認識装置、音声認識方法及び音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012226220A JP2012226220A (ja) | 2012-11-15 |
JP5396426B2 true JP5396426B2 (ja) | 2014-01-22 |
Family
ID=47041631
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011095368A Active JP5396426B2 (ja) | 2011-04-21 | 2011-04-21 | 音声認識装置、音声認識方法及び音声認識プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5396426B2 (ja) |
WO (1) | WO2012144525A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6327745B2 (ja) * | 2014-02-24 | 2018-05-23 | 日本放送協会 | 音声認識装置、及びプログラム |
US10074366B2 (en) * | 2014-04-08 | 2018-09-11 | Sony Corporation | Information processing device, information processing method, and program |
US10950240B2 (en) * | 2016-08-26 | 2021-03-16 | Sony Corporation | Information processing device and information processing method |
WO2018043137A1 (ja) * | 2016-08-31 | 2018-03-08 | ソニー株式会社 | 情報処理装置及び情報処理方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63278173A (ja) * | 1987-05-11 | 1988-11-15 | Nec Corp | 文書入力方式 |
JPH06282293A (ja) * | 1993-03-29 | 1994-10-07 | Sony Corp | 音声認識装置 |
JP3104661B2 (ja) * | 1997-11-25 | 2000-10-30 | 日本電気株式会社 | 日本語文章作成装置 |
JP2002140094A (ja) * | 2000-11-01 | 2002-05-17 | Mitsubishi Electric Corp | 音声認識装置、音声認識方法および音声認識プログラムを記録したコンピュータ読取可能な記録媒体 |
JP4509361B2 (ja) * | 2000-11-16 | 2010-07-21 | 株式会社東芝 | 音声認識装置、認識結果修正方法及び記録媒体 |
JP4020083B2 (ja) * | 2004-02-16 | 2007-12-12 | 日本電気株式会社 | 書き起こしテキスト作成支援システムおよびプログラム |
JP2006039954A (ja) * | 2004-07-27 | 2006-02-09 | Denso Corp | データベース検索装置、プログラム及びナビゲーション装置 |
JP4574390B2 (ja) * | 2005-02-22 | 2010-11-04 | キヤノン株式会社 | 音声認識方法 |
JP2009098490A (ja) * | 2007-10-18 | 2009-05-07 | Kddi Corp | 音声認識結果編集装置、音声認識装置およびコンピュータプログラム |
-
2011
- 2011-04-21 JP JP2011095368A patent/JP5396426B2/ja active Active
-
2012
- 2012-04-18 WO PCT/JP2012/060478 patent/WO2012144525A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2012144525A1 (ja) | 2012-10-26 |
JP2012226220A (ja) | 2012-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2379767C2 (ru) | Коррекция ошибок для систем распознавания речи | |
US8954329B2 (en) | Methods and apparatus for acoustic disambiguation by insertion of disambiguating textual information | |
US8407039B2 (en) | Method and apparatus of translating language using voice recognition | |
US8949133B2 (en) | Information retrieving apparatus | |
EP2523188A1 (en) | Speech recognition system and method based on word-level candidate generation | |
JP5824829B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP2002014954A (ja) | 中国語入力変換処理装置、中国語入力変換処理方法及び記録媒体 | |
CN104715005B (zh) | 信息处理设备以及方法 | |
JP5396426B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP3104661B2 (ja) | 日本語文章作成装置 | |
JP3795692B2 (ja) | 文字処理装置および方法 | |
JP5364412B2 (ja) | 検索装置 | |
JP5688677B2 (ja) | 音声入力支援装置 | |
JP4189336B2 (ja) | 音声情報処理システム、音声情報処理方法及びプログラム | |
JP4966324B2 (ja) | 音声翻訳装置、および方法 | |
KR102091684B1 (ko) | 음성 인식 텍스트 수정 방법 및 이 방법을 구현한 장치 | |
JP2009140287A (ja) | 検索結果表示装置 | |
JP6499228B2 (ja) | テキスト生成装置、方法、及びプログラム | |
KR20130128172A (ko) | 장애인을 위한 이동통신 단말기 및 문자생성방법 | |
JP3903841B2 (ja) | 自動通訳装置及び自動通訳用プログラム | |
JP2006031725A (ja) | 文字処理装置 | |
JP2004309928A (ja) | 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム | |
JPWO2005076259A1 (ja) | 音声入力システム、音声入力方法、および、音声入力用プログラム | |
KR100960490B1 (ko) | 동의어를 이용한 검색 서비스 제공 방법 및 시스템 | |
JP2005234136A (ja) | 音声認識サーバ、音声入力システム、及び、音声入力方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130730 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131021 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5396426 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |