JP6280074B2 - 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム - Google Patents
言い直し検出装置、音声認識システム、言い直し検出方法、プログラム Download PDFInfo
- Publication number
- JP6280074B2 JP6280074B2 JP2015061834A JP2015061834A JP6280074B2 JP 6280074 B2 JP6280074 B2 JP 6280074B2 JP 2015061834 A JP2015061834 A JP 2015061834A JP 2015061834 A JP2015061834 A JP 2015061834A JP 6280074 B2 JP6280074 B2 JP 6280074B2
- Authority
- JP
- Japan
- Prior art keywords
- acoustic signal
- speech recognition
- recognition result
- input
- rephrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
・第1類似度として、各音響信号の特徴量のユークリッド距離の逆数値や符号を反転した値。特徴量としてケプストラムやパワー、またはそれらの変化量を用いることができる。
・第2類似度として、音声認識部17Fから得た各音声認識結果の文字列の編集距離の逆数値や符号を反転した値。ここで文字列とは表記上の文字列に限定するものではなく、文字列の読みを読み仮名や音素表記へ変換した文字列でも良い。
(参考非特許文献1:中川聖一,堀部千寿,“音響尤度と言語尤度を用いた音声認識結果の信頼度の算出”,情報処理学会研究報告,音声言語情報処理,SLP36-13,pp.87-92,2001)
以下、図5を参照して言い直し検出装置17の言い直し判定動作の例について説明する。図5は、本実施例の言い直し検出装置17、又はその変形例の音声認識システム2の言い直し判定動作を例示する図である。図5に示すように、言い直し検出装置17のユーザ9が、言い直し検出装置17に向かって「きりゅう」(桐生)と発話(以下、この発話を発話1という)したものとする。音響信号取得部17Eは、発話1を含む音響信号を音声認識部17Fに送信する。音声認識部17Fは、発話1を含む音響信号を音声認識し、音声認識結果「知立」(ちりゅう)を呈示部17Gに送信する(以下、この音声認識結果を認識結果1という)。呈示部17Gは認識結果1をユーザ9に呈示する。
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
Claims (6)
- 音響信号を入力とし、前記音響信号に対する音声認識結果を呈示する言い直し検出装置であって、
mを2以上の整数とし、m−1番目に入力された音響信号に対する音声認識結果が呈示された時刻とm番目に入力された音響信号の入力時刻との差分をm−1番目の反応時間として測定する反応時間測定部と、
前記m−1番目に入力された音響信号に対する音声認識結果の信頼度をm−1番目の信頼度として算出する信頼度算出部と、
前記m−1番目の反応時間と、前記m−1番目の信頼度に基づいて前記m番目に入力された音響信号に言い直し発話が含まれるか否かを判定する判定部を含む
言い直し検出装置。 - 請求項1に記載の言い直し検出装置であって、
前記m−1番目、m番目に入力された各音響信号の類似度をm−1番目の第1類似度、前記m−1番目、m番目に入力された各音響信号に対する各音声認識結果の類似度をm−1番目の第2類似度とし、少なくとも何れかのm−1番目の類似度を算出する類似度算出部を含み、
前記判定部は、
前記m−1番目の反応時間に加え、前記少なくとも何れかのm−1番目の類似度に基づいて前記m番目に入力された音響信号に言い直し発話が含まれるか否かを判定する
言い直し検出装置。 - 請求項1または2に記載の言い直し検出装置であって、
前記判定部は、
前記m番目に入力された音響信号に言い直し発話が含まれないと判定した場合に、前記m−1番目に入力された音響信号に対する音声認識結果を正解の音声認識結果と判定する言い直し検出装置。 - 音響信号を入力とし、前記音響信号に対する音声認識結果を呈示する言い直し検出装置と、前記音響信号に対する音声認識を実行する音声認識サーバ装置を含む音声認識システムであって、
前記音声認識サーバ装置は、
前記m−1番目に入力された音響信号に対する音声認識結果の信頼度をm−1番目の信頼度として算出する信頼度算出部を含み、
前記言い直し検出装置は、
mを2以上の整数とし、m−1番目に入力された音響信号に対する音声認識結果が呈示された時刻とm番目に入力された音響信号の入力時刻との差分をm−1番目の反応時間として測定する反応時間測定部と、
前記m−1番目の反応時間と、前記m−1番目の信頼度に基づいて前記m番目に入力された音響信号に言い直し発話が含まれるか否かを判定する判定部を含む
音声認識システム。 - 音響信号を入力とし、前記音響信号に対する音声認識結果を呈示する言い直し検出装置が実行する言い直し検出方法であって、
mを2以上の整数とし、m−1番目に入力された音響信号に対する音声認識結果が呈示された時刻とm番目に入力された音響信号の入力時刻との差分をm−1番目の反応時間として測定するステップと、
前記m−1番目に入力された音響信号に対する音声認識結果の信頼度をm−1番目の信頼度として算出するステップと、
前記m−1番目の反応時間と、前記m−1番目の信頼度に基づいて、前記m番目に入力された音響信号に言い直し発話が含まれるか否かを判定するステップを含む
言い直し検出方法。 - コンピュータを請求項1から3の何れかに記載の言い直し検出装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015061834A JP6280074B2 (ja) | 2015-03-25 | 2015-03-25 | 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015061834A JP6280074B2 (ja) | 2015-03-25 | 2015-03-25 | 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016180917A JP2016180917A (ja) | 2016-10-13 |
JP6280074B2 true JP6280074B2 (ja) | 2018-02-14 |
Family
ID=57132735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015061834A Active JP6280074B2 (ja) | 2015-03-25 | 2015-03-25 | 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6280074B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2016428215A1 (en) | 2016-10-31 | 2019-05-16 | Rovi Guides, Inc. | Systems and methods for flexibly using trending topics as parameters for recommending media assets that are related to a viewed media asset |
KR102391298B1 (ko) * | 2017-04-24 | 2022-04-28 | 삼성전자주식회사 | 음성 인식 서비스를 제공하는 전자 장치 및 그 방법 |
CN110663079A (zh) * | 2017-05-24 | 2020-01-07 | 乐威指南公司 | 基于语音纠正使用自动语音识别生成的输入的方法和系统 |
US11270074B2 (en) * | 2018-01-16 | 2022-03-08 | Sony Corporation | Information processing apparatus, information processing system, and information processing method, and program |
US11398221B2 (en) | 2018-02-22 | 2022-07-26 | Sony Corporation | Information processing apparatus, information processing method, and program |
JP7178576B2 (ja) * | 2018-10-03 | 2022-11-28 | パナソニックIpマネジメント株式会社 | 入力装置、入力方法および入力システム |
CN111326140B (zh) * | 2020-03-12 | 2023-05-30 | 科大讯飞股份有限公司 | 语音识别结果判别方法、纠正方法、装置、设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4680714B2 (ja) * | 2005-08-03 | 2011-05-11 | パナソニック株式会社 | 音声認識装置および音声認識方法 |
JP4542974B2 (ja) * | 2005-09-27 | 2010-09-15 | 株式会社東芝 | 音声認識装置、音声認識方法および音声認識プログラム |
JP2008203559A (ja) * | 2007-02-20 | 2008-09-04 | Toshiba Corp | 対話装置及び方法 |
JP2009015148A (ja) * | 2007-07-06 | 2009-01-22 | Panasonic Corp | 音声認識装置、音声認識方法、及び音声認識プログラム |
WO2011016129A1 (ja) * | 2009-08-07 | 2011-02-10 | パイオニア株式会社 | 音声認識装置、音声認識方法、及び音声認識プログラム |
-
2015
- 2015-03-25 JP JP2015061834A patent/JP6280074B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016180917A (ja) | 2016-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6280074B2 (ja) | 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム | |
US8886534B2 (en) | Speech recognition apparatus, speech recognition method, and speech recognition robot | |
JP5229234B2 (ja) | 非音声区間検出方法及び非音声区間検出装置 | |
US7013276B2 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
US8271282B2 (en) | Voice recognition apparatus, voice recognition method and recording medium | |
US20170263242A1 (en) | Information processing device, information processing method, computer program product, and recognition system | |
US9451304B2 (en) | Sound feature priority alignment | |
US8645139B2 (en) | Apparatus and method of extending pronunciation dictionary used for speech recognition | |
JP6495792B2 (ja) | 音声認識装置、音声認識方法、プログラム | |
JP2017097188A (ja) | 話者らしさ評価装置、話者識別装置、話者照合装置、話者らしさ評価方法、プログラム | |
US11495245B2 (en) | Urgency level estimation apparatus, urgency level estimation method, and program | |
JP4353202B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
JP4951035B2 (ja) | 音声単位別尤度比モデル作成装置、音声単位別尤度比モデル作成方法、音声認識信頼度算出装置、音声認識信頼度算出方法、プログラム | |
JP2005148342A (ja) | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 | |
WO2021014612A1 (ja) | 発話区間検出装置、発話区間検出方法、プログラム | |
JP4610451B2 (ja) | 音声認識装置及びプログラム | |
JP6468584B2 (ja) | 外国語の難易度判定装置 | |
US6438521B1 (en) | Speech recognition method and apparatus and computer-readable memory | |
JP2017187642A (ja) | 登録発話分割装置、話者らしさ評価装置、話者識別装置、登録発話分割方法、話者らしさ評価方法、プログラム | |
JP6526602B2 (ja) | 音声認識装置、その方法、及びプログラム | |
JP2012032538A (ja) | 音声認識方法、音声認識装置及び音声認識プログラム | |
CN110895938A (zh) | 语音校正系统及语音校正方法 | |
JP7035476B2 (ja) | 音声処理プログラム、音声処理装置、及び音声処理方法 | |
KR20180050809A (ko) | 음성 파일 검증 장치 및 방법 | |
JP5066668B2 (ja) | 音声認識装置、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171017 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171211 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180116 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6280074 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |