JP6280074B2 - 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム - Google Patents

言い直し検出装置、音声認識システム、言い直し検出方法、プログラム Download PDF

Info

Publication number
JP6280074B2
JP6280074B2 JP2015061834A JP2015061834A JP6280074B2 JP 6280074 B2 JP6280074 B2 JP 6280074B2 JP 2015061834 A JP2015061834 A JP 2015061834A JP 2015061834 A JP2015061834 A JP 2015061834A JP 6280074 B2 JP6280074 B2 JP 6280074B2
Authority
JP
Japan
Prior art keywords
acoustic signal
speech recognition
recognition result
input
rephrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015061834A
Other languages
English (en)
Other versions
JP2016180917A (ja
Inventor
智子 川瀬
智子 川瀬
小林 和則
和則 小林
仲 大室
仲 大室
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015061834A priority Critical patent/JP6280074B2/ja
Publication of JP2016180917A publication Critical patent/JP2016180917A/ja
Application granted granted Critical
Publication of JP6280074B2 publication Critical patent/JP6280074B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ユーザの言い直し発話を検出する言い直し検出装置、言い直し検出装置を含む音声認識システム、言い直し検出方法、プログラムに関する。
従来、音声認識結果の正誤を判定する機能を備える音声認識装置が知られている(例えば特許文献1)。特許文献1の音声認識装置は、利用者から入力された音声(第1の音声)の音声認識結果に対して確認発話を利用者に出力し、この確認発話に対する利用者からの応答(第2の音声)を受け取り、確認発話が誤っている場合に特徴的なパラメータ、利用者の応答内容、この応答における入力音声の発話時間長、同じ発話が繰り返されているかどうか、入力音声信号のピッチがそれまでの平均ピッチよりも高いかどうか、入力音声信号のパワーがそれまでの発声のパワーよりも大きいかどうか、のうちの1つまたは複数の情報を利用して音声認識結果の正誤を判定する。
特許文献1の音声認識装置は、第1の音声の認識結果に対して確認発話を要求する対話音声を提示し、利用者の第2の音声として「はい」「いいえ」のような肯定/否定の確認音声またはその他の発話を認識し、利用者の第2の音声がその他の発話の場合、発話内に直前の発話に類似の内容語を含んでいることに基づき、前回の音声認識結果が誤っている(利用者は何らかの「訂正」の発話を行っている)と判断する。
特開2001−236091号公報
しかし2つの音声の間に類似の内容語が含まれていたとしても、両者が訂正発話(言い直し)の関係にあるとは限らない。先の発話は誤認識を含んでいて、その誤認識部分に類似の内容語があるとするならば、内容語だけに着目して訂正発話を判別した結果が正しいとは限らない。
あるいはピッチ周波数の変化や発声のパワーなどの音響特徴量の変化に着目しても、これらの特徴量は発声の都度、発声環境の影響も受けて変化しやすいため、訂正発話(言い直し)の関係であるかどうかの判定に用いることは難しい。
そこで本発明では、訂正発話(言い直し発話)の有無を、発話ごとの音響特徴量の変化を根拠とせずに判定することができる言い直し検出装置を提供する。
本発明の言い直し検出装置は、音響信号を入力とし、音響信号に対する音声認識結果を呈示する言い直し検出装置であって、反応時間測定部と、判定部を含む。
反応時間測定部は、mを2以上の整数とし、m−1番目に入力された音響信号に対する音声認識結果が呈示された時刻とm番目に入力された音響信号の入力時刻との差分をm−1番目の反応時間として測定する。判定部は、m−1番目の反応時間に基づいて、m番目に入力された音響信号に言い直し発話が含まれるか否かを判定する。
本発明の言い直し検出装置によれば、訂正発話(言い直し発話)の有無を、発話ごとの音響特徴量の変化を根拠とせずに判定することができる。
実施例1の言い直し検出装置の構成を示すブロック図。 実施例1の変形例の音声認識システムの構成を示すブロック図。 実施例1の言い直し検出装置、又はその変形例の音声認識システムの音声認識動作を示すフローチャート。 実施例1の言い直し検出装置、又はその変形例の音声認識システムの言い直し判定動作を示すフローチャート。 実施例1の言い直し検出装置、又はその変形例の音声認識システムの言い直し判定動作を例示する図。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
以下の説明では、音声認識対象とする発声された信号を音声信号、音声信号と音声信号以外の背景雑音信号などが混在した状態で収音した信号を音響信号と呼ぶこととする。
以下、図1、図2を参照して実施例1の言い直し検出装置、およびその変形例の音声認識システムの構成について説明する。図1は、本実施例の言い直し検出装置17の構成を示すブロック図である。図2は、本実施例の変形例の音声認識システム2の構成を示すブロック図である。図1に示すように本実施例の言い直し検出装置17は、反応時間測定部17Aと、信頼度算出部17Bと、類似度算出部17Cと、判定部17Dと、音響信号取得部17Eと、音声認識部17Fと、呈示部17Gを含む。図1に示した言い直し検出装置17の構成要件のうち、信頼度算出部17Bと、音声認識部17Fに関しては、外部の装置、例えば図2に示す音声認識サーバ装置21内の構成要件としてもよい。この場合、反応時間測定部17A、類似度算出部17C、判定部17D、音響信号取得部17E、呈示部17Gを含む言い直し検出装置27と、信頼度算出部17B、音声認識部17Fを含む音声認識サーバ装置21とで音声認識システム2が構成される。この場合、言い直し検出装置27と音声認識サーバ装置21は、ネットワークを介し、無線または有線で通信可能に接続されているものとする。
図2に示す音声認識システム2の各構成要件は図1に示す言い直し検出装置17内において同一符号を付した各構成要件と同じ動作をするため、以下の説明では、言い直し検出装置17のみを説明する。なお、言い直し検出装置17、27、音声認識サーバ装置21はそれぞれ複数台ずつ存在していてもよい。
以下、図3を参照して本実施例の言い直し検出装置17の音声認識動作を説明する。図3は、本実施例の言い直し検出装置17、又はその変形例の音声認識システム2の音声認識動作を示すフローチャートである。音響信号取得部17Eは、音響信号を取得する(17E)。具体的には、音響信号取得部17Eにはマイクロフォンなどの収音手段が含まれ、音響信号取得部17Eは収音手段により音響信号を取得する。音響信号取得部17Eは、音響信号を取得した時刻を一時記憶するものとする。
ここで、言い直し検出装置17には全部でM個(MはM≧2を充たす整数)の音響信号が入力されたものとする。音声認識部17Fは入力された音響信号を音声認識する(S17F)。呈示部17Gは、音声認識結果をユーザに呈示する(S17G)。呈示部17Gは、音声認識結果をユーザに呈示した時刻を一時記憶するものとする。
次に、図4を参照して本実施例の言い直し検出装置17の言い直し判定動作を説明する。図4は、本実施例の言い直し検出装置17、又はその変形例の音声認識システム2の言い直し判定動作を示すフローチャートである。以下ではm番目(mを2≦m≦Mを充たす整数とする)の音響信号が言い直しであるか否かが判定される場合について説明する。
反応時間測定部17Aは、m−1番目に入力された音響信号に対する音声認識結果が呈示された時刻とm番目に入力された音響信号の入力時刻との差分をm−1番目の反応時間として測定する(S17A)。信頼度算出部17Bは、m−1番目に入力された音響信号に対する音声認識結果の信頼度をm−1番目の信頼度として算出する(S17B)。類似度算出部17Cは、m−1番目、m番目に入力された各音響信号の類似度をm−1番目の第1類似度、m−1番目、m番目に入力された各音響信号に対する各音声認識結果の類似度をm−1番目の第2類似度とし、少なくとも何れかのm−1番目の類似度を算出する(S17C)。言い直し検出部17の言い直し判定動作に必須な構成要件は反応時間測定部17Aと判定部17Dのみであって、信頼度算出部17B、類似度算出部17Cは、適宜省略することができる。
判定部17Dは、少なくともm−1番目の反応時間に基づいて、m番目に入力された音響信号に言い直し発話が含まれるか否かを判定する(S17D)。判定部17Dは、m−1番目の反応時間に加え、ステップS17Bで算出したm−1番目の信頼度、ステップS17Cで算出したm−1番目の第1類似度、またはm−1番目の第2類似度に基づいてm番目に入力された音響信号に言い直し発話が含まれるか否かを判定してもよい(S17D)。判定部17Dは、m番目に入力された音響信号に言い直し発話が含まれないと判定した場合に、m−1番目に入力された音響信号に対する音声認識結果を正解の音声認識結果と判定することができる。また、判定部17Dは、m番目に入力された音響信号に言い直し発話が含まれると判定した場合に、m−1番目に入力された音響信号に対する音声認識結果を誤認識と判定することができる。
典型的には、判定部17Dはm−1番目の反応時間が所定の閾値よりも小さく、m−1番目の信頼度が所定の閾値と比較して低く、m−1番目の第1、または第2類似度が所定の閾値よりも高くなる場合などに、m番目に入力された音響信号に言い直し発話が含まれると判定し、m−1番目に入力された音響信号に対する音声認識結果は誤認識であると判定する。ステップS17Cにおける類似度は、例えば次のいずれかとすることができる。
・第1類似度として、各音響信号の特徴量のユークリッド距離の逆数値や符号を反転した値。特徴量としてケプストラムやパワー、またはそれらの変化量を用いることができる。
・第2類似度として、音声認識部17Fから得た各音声認識結果の文字列の編集距離の逆数値や符号を反転した値。ここで文字列とは表記上の文字列に限定するものではなく、文字列の読みを読み仮名や音素表記へ変換した文字列でも良い。
ユーザの反応時間は、ユーザが認識結果を読んで理解するまでの時間を意味する。従って、反応時間を判定するための閾値は、認識結果として提示する文字数に比例した値としても良い。また認識結果に漢字が含まれる場合は漢字の文字数に応じてより長い閾値としても良い。
言い直しの判定に上述の反応時間を用いたのは、言い直しの場合、そうでない場合に比べて、前の認識結果の呈示を見てから次の発話を行うまでの時間が短くなる傾向が認められるからである。
例えば、ユーザのm−1番目の発話に対する音声認識結果を、呈示部17Gがテキストで呈示する場合に着目する。呈示された音声認識結果が正解である場合、ユーザは当該音声認識結果を文末まで目視で確認した上で次の発話(m番目の発話)を実行するのが一般的である。しかしながらm−1番目の発話に対する音声認識結果の途中に誤認識が存在する場合、ユーザは当該音声認識結果を文末まで目視で確認せずに、誤認識を認知した時点で次の発話(m番目の発話)を実行するのが一般的である。このように、音声認識結果が正解であった場合と誤認識を含んでいた場合とで、ユーザの反応時間が異なる。本実施例の言い直し検出装置17はこのようなユーザの性質に注目したため、発話ごとの音響特徴量の変化を根拠とせずに、言い直し発話の有無を判定することができる。
また言い直しの判定に信頼度を用いたのは、認識結果が誤っている場合、当該音声認識結果の信頼度が低くなる傾向が認められるからである。また言い直しの判定に類似度を用いたのは、言い直しの場合、発話同士の類似度が高くなる傾向が認められるからである。
m−1番目の信頼度(信頼度の例として、例えば参考非特許文献1参照)を確認することによって、m−1番目に入力された音響信号に対する音声認識結果に誤認識が含まれている場合の、m−1番目の信頼度の傾向をつかむことができ、m番目の発話が訂正発話(言い直し発話)であるか否かをより確実に判定することができる。
(参考非特許文献1:中川聖一,堀部千寿,“音響尤度と言語尤度を用いた音声認識結果の信頼度の算出”,情報処理学会研究報告,音声言語情報処理,SLP36-13,pp.87-92,2001)
以下、図5を参照して言い直し検出装置17の言い直し判定動作の例について説明する。図5は、本実施例の言い直し検出装置17、又はその変形例の音声認識システム2の言い直し判定動作を例示する図である。図5に示すように、言い直し検出装置17のユーザ9が、言い直し検出装置17に向かって「きりゅう」(桐生)と発話(以下、この発話を発話1という)したものとする。音響信号取得部17Eは、発話1を含む音響信号を音声認識部17Fに送信する。音声認識部17Fは、発話1を含む音響信号を音声認識し、音声認識結果「知立」(ちりゅう)を呈示部17Gに送信する(以下、この音声認識結果を認識結果1という)。呈示部17Gは認識結果1をユーザ9に呈示する。
ユーザ9は呈示された認識結果1が誤認識であることに気付いて、先ほどと同じように言い直し検出装置17に向かって「きりゅう」(桐生)と発話(以下、この発話を発話2という)したものとする。音響信号取得部17Eは、発話2を含む音響信号を音声認識部17Fに送信する。音声認識部17Fは、発話2を含む音響信号を音声認識し、音声認識結果「桐生」(きりゅう)を呈示部17Gに送信する(以下、この音声認識結果を認識結果2という)。呈示部17Gは認識結果2をユーザ9に呈示する。
ユーザ9は呈示された認識結果2を見て、正しく音声認識が実行されたことを確認し、今度は言い直し検出装置17に向かって「くどう」(工藤)と発話(以下、この発話を発話3という)したものとする。音響信号取得部17Eは、発話3を含む音響信号を音声認識部17Fに送信する。音声認識部17Fは、発話3を含む音響信号を音声認識し、音声認識結果「工藤」(くどう)を呈示部17Gに送信する(以下、この音声認識結果を認識結果3という)。呈示部17Gは認識結果3をユーザ9に呈示する。
上述の例において、反応時間測定部17Aは、認識結果1の呈示時刻と発話2を含む音響信号の入力時刻との差分である反応時間(以下、反応時間1という)を測定する(S17A)。信頼度算出部17Bは、認識結果1の信頼度を算出する(S17B)。類似度算出部17Cは、発話1を含む音響信号と発話2を含む音響信号の類似度(第1類似度)、あるいは認識結果1と認識結果2の類似度(第2類似度)の少なくとも何れかを算出する(S17C)。この場合、判定部17Dは反応時間1が所定の閾値よりも小さくなる、認識結果1の信頼度が所定の閾値と比較して低くなる、発話1を含む音響信号と発話2を含む音響信号の類似度(第1類似度)、あるいは認識結果1と認識結果2の類似度(第2類似度)が所定の閾値よりも高くなることなどから、認識結果1は誤認識であり、発話2はユーザによる言い直し発話であると判定する(S17D)。
同様に、判定部17Dは反応時間2が所定の閾値よりも小さくならない(反応時間2が十分に長い)、認識結果2の信頼度が所定の閾値と比較して低くならない(認識結果2の信頼度が十分に高い)、発話2を含む音響信号と発話3を含む音響信号の類似度(第1類似度)、あるいは認識結果2と認識結果3の類似度(第2類似度)が所定の閾値よりも高くならない(二つの音響信号、あるいは認識結果が十分に非類似である)ことなどから、認識結果2は正解の音声認識結果であり、発話3はユーザによる言い直し発話ではないものと判定する(S17D)。
前述した言い直し発話の判定は一度限りではなく全てのm(m=2,3,…,M)に対して実行されてもよい。この場合ステップS17Dにおいて、複数回連続して言い直し発話が含まれるものと判定される場合もある。例えば図5において、発話2が言い直し発話と判定された後で、発話2と発話3との間で、反応時間2が所定の閾値よりも小さくなる、認識結果2の信頼度が所定の閾値と比較して低くなる、発話2を含む音響信号と発話3を含む音響信号の類似度(第1類似度)、あるいは認識結果2と認識結果3の類似度(第2類似度)が所定の閾値よりも高くなる、などの場合には、発話3も発話2に続けてユーザによる言い直し発話であると判定されることになる。
このように本実施例の言い直し検出装置17、本実施例の変形例の音声認識システム2によれば、反応時間測定部17Aがm−1番目に入力された音響信号に対する音声認識結果が呈示された時刻とm番目に入力された音響信号の入力時刻との差分をm−1番目の反応時間として測定し、判定部17Dは、少なくともm−1番目の反応時間に基づいて、m番目に入力された音響信号に言い直し発話が含まれるか否かを判定するため、発話ごとの音響特徴量の変化を根拠とせずに、言い直し発話の有無を高精度に判定することができる。
本実施例の言い直し検出装置17の好適な適用先として、ユーザが一つの発話ごとに音声認識結果を確認するが、音声による入力操作以外の入力操作が制限された環境で用いられる音声認識システムが挙げられる。このような音声認識システムとして例えば車載音声認識システムが挙げられる。<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (6)

  1. 音響信号を入力とし、前記音響信号に対する音声認識結果を呈示する言い直し検出装置であって、
    mを2以上の整数とし、m−1番目に入力された音響信号に対する音声認識結果が呈示された時刻とm番目に入力された音響信号の入力時刻との差分をm−1番目の反応時間として測定する反応時間測定部と、
    前記m−1番目に入力された音響信号に対する音声認識結果の信頼度をm−1番目の信頼度として算出する信頼度算出部と、
    前記m−1番目の反応時間と、前記m−1番目の信頼度に基づいて前記m番目に入力された音響信号に言い直し発話が含まれるか否かを判定する判定部を含む
    言い直し検出装置。
  2. 請求項1に記載の言い直し検出装置であって、
    前記m−1番目、m番目に入力された各音響信号の類似度をm−1番目の第1類似度、前記m−1番目、m番目に入力された各音響信号に対する各音声認識結果の類似度をm−1番目の第2類似度とし、少なくとも何れかのm−1番目の類似度を算出する類似度算出部を含み、
    前記判定部は、
    前記m−1番目の反応時間に加え、前記少なくとも何れかのm−1番目の類似度に基づいて前記m番目に入力された音響信号に言い直し発話が含まれるか否かを判定する
    言い直し検出装置。
  3. 請求項1または2に記載の言い直し検出装置であって、
    前記判定部は、
    前記m番目に入力された音響信号に言い直し発話が含まれないと判定した場合に、前記m−1番目に入力された音響信号に対する音声認識結果を正解の音声認識結果と判定する言い直し検出装置。
  4. 音響信号を入力とし、前記音響信号に対する音声認識結果を呈示する言い直し検出装置と、前記音響信号に対する音声認識を実行する音声認識サーバ装置を含む音声認識システムであって、
    前記音声認識サーバ装置は、
    前記m−1番目に入力された音響信号に対する音声認識結果の信頼度をm−1番目の信頼度として算出する信頼度算出部を含み、
    前記言い直し検出装置は、
    mを2以上の整数とし、m−1番目に入力された音響信号に対する音声認識結果が呈示された時刻とm番目に入力された音響信号の入力時刻との差分をm−1番目の反応時間として測定する反応時間測定部と、
    前記m−1番目の反応時間と、前記m−1番目の信頼度に基づいて前記m番目に入力された音響信号に言い直し発話が含まれるか否かを判定する判定部を含む
    音声認識システム。
  5. 音響信号を入力とし、前記音響信号に対する音声認識結果を呈示する言い直し検出装置が実行する言い直し検出方法であって、
    mを2以上の整数とし、m−1番目に入力された音響信号に対する音声認識結果が呈示された時刻とm番目に入力された音響信号の入力時刻との差分をm−1番目の反応時間として測定するステップと、
    前記m−1番目に入力された音響信号に対する音声認識結果の信頼度をm−1番目の信頼度として算出するステップと、
    前記m−1番目の反応時間と、前記m−1番目の信頼度に基づいて、前記m番目に入力された音響信号に言い直し発話が含まれるか否かを判定するステップを含む
    言い直し検出方法。
  6. コンピュータを請求項1から3の何れかに記載の言い直し検出装置として機能させるためのプログラム。
JP2015061834A 2015-03-25 2015-03-25 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム Active JP6280074B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015061834A JP6280074B2 (ja) 2015-03-25 2015-03-25 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015061834A JP6280074B2 (ja) 2015-03-25 2015-03-25 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム

Publications (2)

Publication Number Publication Date
JP2016180917A JP2016180917A (ja) 2016-10-13
JP6280074B2 true JP6280074B2 (ja) 2018-02-14

Family

ID=57132735

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015061834A Active JP6280074B2 (ja) 2015-03-25 2015-03-25 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム

Country Status (1)

Country Link
JP (1) JP6280074B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2016428215A1 (en) 2016-10-31 2019-05-16 Rovi Guides, Inc. Systems and methods for flexibly using trending topics as parameters for recommending media assets that are related to a viewed media asset
KR102391298B1 (ko) * 2017-04-24 2022-04-28 삼성전자주식회사 음성 인식 서비스를 제공하는 전자 장치 및 그 방법
CN110663079A (zh) * 2017-05-24 2020-01-07 乐威指南公司 基于语音纠正使用自动语音识别生成的输入的方法和系统
US11270074B2 (en) * 2018-01-16 2022-03-08 Sony Corporation Information processing apparatus, information processing system, and information processing method, and program
US11398221B2 (en) 2018-02-22 2022-07-26 Sony Corporation Information processing apparatus, information processing method, and program
JP7178576B2 (ja) * 2018-10-03 2022-11-28 パナソニックIpマネジメント株式会社 入力装置、入力方法および入力システム
CN111326140B (zh) * 2020-03-12 2023-05-30 科大讯飞股份有限公司 语音识别结果判别方法、纠正方法、装置、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4680714B2 (ja) * 2005-08-03 2011-05-11 パナソニック株式会社 音声認識装置および音声認識方法
JP4542974B2 (ja) * 2005-09-27 2010-09-15 株式会社東芝 音声認識装置、音声認識方法および音声認識プログラム
JP2008203559A (ja) * 2007-02-20 2008-09-04 Toshiba Corp 対話装置及び方法
JP2009015148A (ja) * 2007-07-06 2009-01-22 Panasonic Corp 音声認識装置、音声認識方法、及び音声認識プログラム
WO2011016129A1 (ja) * 2009-08-07 2011-02-10 パイオニア株式会社 音声認識装置、音声認識方法、及び音声認識プログラム

Also Published As

Publication number Publication date
JP2016180917A (ja) 2016-10-13

Similar Documents

Publication Publication Date Title
JP6280074B2 (ja) 言い直し検出装置、音声認識システム、言い直し検出方法、プログラム
US8886534B2 (en) Speech recognition apparatus, speech recognition method, and speech recognition robot
JP5229234B2 (ja) 非音声区間検出方法及び非音声区間検出装置
US7013276B2 (en) Method of assessing degree of acoustic confusability, and system therefor
US8271282B2 (en) Voice recognition apparatus, voice recognition method and recording medium
US20170263242A1 (en) Information processing device, information processing method, computer program product, and recognition system
US9451304B2 (en) Sound feature priority alignment
US8645139B2 (en) Apparatus and method of extending pronunciation dictionary used for speech recognition
JP6495792B2 (ja) 音声認識装置、音声認識方法、プログラム
JP2017097188A (ja) 話者らしさ評価装置、話者識別装置、話者照合装置、話者らしさ評価方法、プログラム
US11495245B2 (en) Urgency level estimation apparatus, urgency level estimation method, and program
JP4353202B2 (ja) 韻律識別装置及び方法、並びに音声認識装置及び方法
JP4951035B2 (ja) 音声単位別尤度比モデル作成装置、音声単位別尤度比モデル作成方法、音声認識信頼度算出装置、音声認識信頼度算出方法、プログラム
JP2005148342A (ja) 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体
WO2021014612A1 (ja) 発話区間検出装置、発話区間検出方法、プログラム
JP4610451B2 (ja) 音声認識装置及びプログラム
JP6468584B2 (ja) 外国語の難易度判定装置
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
JP2017187642A (ja) 登録発話分割装置、話者らしさ評価装置、話者識別装置、登録発話分割方法、話者らしさ評価方法、プログラム
JP6526602B2 (ja) 音声認識装置、その方法、及びプログラム
JP2012032538A (ja) 音声認識方法、音声認識装置及び音声認識プログラム
CN110895938A (zh) 语音校正系统及语音校正方法
JP7035476B2 (ja) 音声処理プログラム、音声処理装置、及び音声処理方法
KR20180050809A (ko) 음성 파일 검증 장치 및 방법
JP5066668B2 (ja) 音声認識装置、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171017

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171211

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180118

R150 Certificate of patent or registration of utility model

Ref document number: 6280074

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150