JP2014178567A - 音声認識装置、音声認識方法、およびプログラム - Google Patents
音声認識装置、音声認識方法、およびプログラム Download PDFInfo
- Publication number
- JP2014178567A JP2014178567A JP2013053290A JP2013053290A JP2014178567A JP 2014178567 A JP2014178567 A JP 2014178567A JP 2013053290 A JP2013053290 A JP 2013053290A JP 2013053290 A JP2013053290 A JP 2013053290A JP 2014178567 A JP2014178567 A JP 2014178567A
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- candidates
- recognition result
- element candidate
- result information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 35
- 238000012545 processing Methods 0.000 claims abstract description 14
- 230000008859 change Effects 0.000 description 45
- 230000008569 process Effects 0.000 description 22
- 241000237502 Ostreidae Species 0.000 description 15
- 235000020636 oyster Nutrition 0.000 description 15
- 230000006870 function Effects 0.000 description 8
- 230000000877 morphologic effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】ユーザより発話された音声のデータである音声データを受け付ける音声データ受付手段101と、音声データ受付手段101が受け付けた音声データに対して音声認識処理を実施し、要素の候補である要素候補の2以上の並びを含む音声認識結果情報を取得する音声認識結果情報取得手段102と、音声認識結果情報が有する要素候補を表示する要素候補表示手段105と、要素候補表示手段105による要素候補の表示に対して、要素候補の並びの選択を受け付ける要素候補選択受付手段107と、要素候補選択受付手段107が選択を受け付けた要素候補の並びである出力情報を出力する出力手段108とを具備する音声認識装置1により、ユーザの負担を軽減できる。
【選択図】図1
Description
本実施の形態において、音声認識した際に得られる要素候補の並びを表示し、表示された要素候補から要素候補の並びを選択できる音声認識装置1について説明する。
なお、図2のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
101 音声データ受付手段
102 音声認識結果情報取得手段
103 同音用語格納手段
104 同音用語取得手段
105 要素候補表示手段
106 表示変更受付手段
107 要素候補選択受付手段
108 出力手段
Claims (9)
- ユーザより発話された音声のデータである音声データを受け付ける音声データ受付手段と、
前記音声データ受付手段が受け付けた音声データに対して音声認識処理を実施し、音声データに対応する音声認識結果の一部である要素の候補である要素候補の2以上の並びを含む音声認識結果情報を取得する音声認識結果情報取得手段と、
前記音声認識結果情報が有する2以上の要素候補を表示する要素候補表示手段と、
前記要素候補表示手段による要素候補の表示に対して、要素候補の並びの選択を受け付ける要素候補選択受付手段と、
前記要素候補選択受付手段が選択を受け付けた要素候補の並びである出力情報を出力する出力手段とを具備する音声認識装置。 - 前記要素候補表示手段は、
表示する領域のサイズ、または前記音声認識結果情報の情報量に応じて、前記音声認識結果情報の全ての要素候補、または一部の要素候補を表示する、請求項1記載の音声認識装置。 - 前記音声認識結果情報取得手段は、
要素候補の並びに関する尤度である尤度情報を含む音声認識結果情報を取得し、
前記要素候補表示手段は、
前記尤度情報に応じて要素候補を表示する、請求項1または2記載の音声認識装置。 - 前記要素候補表示手段は、
要素候補の尤度が最も高い並びが直線的になるように表示する、請求項3記載の音声認識装置。 - 前記要素候補に含まれる少なくとも一部の用語と同音であり、当該用語と異なる用語である1以上の同音用語を取得する同音用語取得手段をさらに具備し、
前記要素候補表示手段は、
前記同音用語取得手段が取得した1以上の同音用語を用いて、要素候補に含まれる用語を同音用語で置換した要素候補をも表示する請求項1から請求項4のいずれか一項記載の音声認識装置。 - 前記要素候補選択受付手段は、
ユーザによって指定された要素候補の順番に応じた要素候補の並びの選択を受け付ける、請求項1から請求項5のいずれか一項記載の音声認識装置。 - 前記要素候補選択受付手段は、
前記音声認識結果情報に含まれる要素候補のいずれかの並びの選択を受け付ける、請求項1から請求項5のいずれか一項記載の音声認識装置。 - 音声データ受付手段と、音声認識結果情報取得手段と、要素候補表示手段と、要素候補選択受付手段と、出力手段とを用いて処理される音声認識方法であって、
前記音声データ受付手段が、ユーザより発話された音声のデータである音声データを受け付ける音声データ受付ステップと、
前記音声認識結果情報取得手段が、前記音声データ受付ステップが受け付けた音声データに対して音声認識処理を実施し、音声データに対応する音声認識結果の一部である要素の候補である要素候補の2以上の並びを含む音声認識結果情報を取得する音声認識結果情報取得ステップと、
前記要素候補表示手段が、前記音声認識結果情報が有する2以上の要素候補を表示する要素候補表示ステップと、
前記要素候補選択受付手段が、前記要素候補表示ステップによる要素候補の表示に対して、要素候補の並びの選択を受け付ける要素候補選択受付ステップと、
前記出力手段が、前記要素候補選択受付ステップが選択を受け付けた要素候補の並びである出力情報を出力する出力ステップとを具備する音声認識方法。 - コンピュータを、
ユーザより発話された音声のデータである音声データを受け付ける音声データ受付手段、
前記音声データ受付手段が受け付けた音声データに対して音声認識処理を実施し、音声データに対応する音声認識結果の一部である要素の候補である要素候補の2以上の並びを含む音声認識結果情報を取得する音声認識結果情報取得手段、
前記音声認識結果情報が有する2以上の要素候補を表示する要素候補表示手段、
前記要素候補表示手段による要素候補の表示に対して、要素候補の並びの選択を受け付ける要素候補選択受付手段、
前記要素候補選択受付手段が選択を受け付けた要素候補の並びである出力情報を出力する出力手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013053290A JP5701327B2 (ja) | 2013-03-15 | 2013-03-15 | 音声認識装置、音声認識方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013053290A JP5701327B2 (ja) | 2013-03-15 | 2013-03-15 | 音声認識装置、音声認識方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014178567A true JP2014178567A (ja) | 2014-09-25 |
JP5701327B2 JP5701327B2 (ja) | 2015-04-15 |
Family
ID=51698552
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013053290A Active JP5701327B2 (ja) | 2013-03-15 | 2013-03-15 | 音声認識装置、音声認識方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5701327B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020184631A1 (ja) * | 2019-03-11 | 2020-09-17 | 株式会社RevComm | 情報処理装置 |
JPWO2019163011A1 (ja) * | 2018-02-21 | 2020-10-01 | 三菱電機株式会社 | 表示制御装置および表示制御方法 |
CN116580701A (zh) * | 2023-05-19 | 2023-08-11 | 国网物资有限公司 | 告警音频识别方法、装置、电子设备和计算机介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107844470B (zh) * | 2016-09-18 | 2021-04-30 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法及其设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000148747A (ja) * | 1998-11-12 | 2000-05-30 | Omron Corp | 変換候補表示方法,およびこの方法によるかな漢字変換用のプログラムの記録媒体ならびにかな漢字変換装置 |
JP2003005789A (ja) * | 1999-02-12 | 2003-01-08 | Microsoft Corp | 文字処理装置および方法 |
JP2003202886A (ja) * | 2001-12-28 | 2003-07-18 | Toshiba Corp | テキスト入力処理装置及び方法並びにプログラム |
JP2005044103A (ja) * | 2003-07-28 | 2005-02-17 | Toshiba Corp | 文書作成装置、文書作成方法およびプログラム |
WO2006054724A1 (ja) * | 2004-11-22 | 2006-05-26 | National Institute Of Advanced Industrial Science And Technology | 音声認識装置及び方法ならびにプログラム |
JP2010139744A (ja) * | 2008-12-11 | 2010-06-24 | Ntt Docomo Inc | 音声認識結果訂正装置および音声認識結果訂正方法 |
-
2013
- 2013-03-15 JP JP2013053290A patent/JP5701327B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000148747A (ja) * | 1998-11-12 | 2000-05-30 | Omron Corp | 変換候補表示方法,およびこの方法によるかな漢字変換用のプログラムの記録媒体ならびにかな漢字変換装置 |
JP2003005789A (ja) * | 1999-02-12 | 2003-01-08 | Microsoft Corp | 文字処理装置および方法 |
JP2003202886A (ja) * | 2001-12-28 | 2003-07-18 | Toshiba Corp | テキスト入力処理装置及び方法並びにプログラム |
JP2005044103A (ja) * | 2003-07-28 | 2005-02-17 | Toshiba Corp | 文書作成装置、文書作成方法およびプログラム |
WO2006054724A1 (ja) * | 2004-11-22 | 2006-05-26 | National Institute Of Advanced Industrial Science And Technology | 音声認識装置及び方法ならびにプログラム |
JP2010139744A (ja) * | 2008-12-11 | 2010-06-24 | Ntt Docomo Inc | 音声認識結果訂正装置および音声認識結果訂正方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2019163011A1 (ja) * | 2018-02-21 | 2020-10-01 | 三菱電機株式会社 | 表示制御装置および表示制御方法 |
US11243741B2 (en) | 2018-02-21 | 2022-02-08 | Mitsubishi Electric Corporation | Display control device and display control method |
WO2020184631A1 (ja) * | 2019-03-11 | 2020-09-17 | 株式会社RevComm | 情報処理装置 |
JPWO2020184631A1 (ja) * | 2019-03-11 | 2021-04-01 | 株式会社RevComm | 情報処理装置 |
JP7053069B2 (ja) | 2019-03-11 | 2022-04-12 | 株式会社RevComm | 情報処理装置 |
US11862190B2 (en) | 2019-03-11 | 2024-01-02 | Revcomm Inc. | Information processing device |
CN116580701A (zh) * | 2023-05-19 | 2023-08-11 | 国网物资有限公司 | 告警音频识别方法、装置、电子设备和计算机介质 |
CN116580701B (zh) * | 2023-05-19 | 2023-11-24 | 国网物资有限公司 | 告警音频识别方法、装置、电子设备和计算机介质 |
Also Published As
Publication number | Publication date |
---|---|
JP5701327B2 (ja) | 2015-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI293455B (en) | System and method for disambiguating phonetic input | |
RU2379767C2 (ru) | Коррекция ошибок для систем распознавания речи | |
JP4829901B2 (ja) | マニュアルでエントリされた不確定なテキスト入力を音声入力を使用して確定する方法および装置 | |
US20130073286A1 (en) | Consolidating Speech Recognition Results | |
US20140035823A1 (en) | Dynamic Context-Based Language Determination | |
US20090326938A1 (en) | Multiword text correction | |
KR101474854B1 (ko) | 음성인식을 통해 컨트롤 객체를 선택하기 위한 장치 및 방법 | |
JP5535238B2 (ja) | 情報処理装置 | |
JP6150268B2 (ja) | 単語登録装置及びそのためのコンピュータプログラム | |
US20160267902A1 (en) | Speech recognition using a foreign word grammar | |
US9009051B2 (en) | Apparatus, method, and program for reading aloud documents based upon a calculated word presentation order | |
JP5701327B2 (ja) | 音声認識装置、音声認識方法、およびプログラム | |
JP5231484B2 (ja) | 音声認識装置、音声認識方法、プログラム、及びプログラムを配信する情報処理装置 | |
KR101334154B1 (ko) | 중국어 단어 입력 장치 및 방법 | |
KR20170009486A (ko) | 청크 기반 언어 학습용 데이터베이스 구축 방법 및 이를 수행하는 전자 기기 | |
JP3762300B2 (ja) | テキスト入力処理装置及び方法並びにプログラム | |
CN1965349A (zh) | 多形式的非歧意性语音识别 | |
JP2019101739A (ja) | 情報処理装置、情報処理システムおよびプログラム | |
JP5318030B2 (ja) | 入力支援装置、抽出方法、プログラム、及び情報処理装置 | |
JP2002207728A (ja) | 表音文字生成装置及びそれを実現するためのプログラムを記録した記録媒体 | |
JP5474723B2 (ja) | 音声認識装置およびその制御プログラム | |
KR20160054751A (ko) | 텍스트 편집 시스템 및 그 방법 | |
JP2006031725A (ja) | 文字処理装置 | |
CN112786002B (zh) | 一种语音合成方法、装置、设备及存储介质 | |
JP2003288098A (ja) | ディクテーション装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5701327 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |