JP2001343994A - 音声認識誤り検出装置および記憶媒体 - Google Patents

音声認識誤り検出装置および記憶媒体

Info

Publication number
JP2001343994A
JP2001343994A JP2000164233A JP2000164233A JP2001343994A JP 2001343994 A JP2001343994 A JP 2001343994A JP 2000164233 A JP2000164233 A JP 2000164233A JP 2000164233 A JP2000164233 A JP 2000164233A JP 2001343994 A JP2001343994 A JP 2001343994A
Authority
JP
Japan
Prior art keywords
word
sentence
recognition
appearance position
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000164233A
Other languages
English (en)
Inventor
Atsushi Matsui
淳 松井
Naoto Kato
直人 加藤
Kazuho Onoe
和穂 尾上
Toru Imai
亨 今井
Hideki Tanaka
英輝 田中
Akio Ando
彰男 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2000164233A priority Critical patent/JP2001343994A/ja
Publication of JP2001343994A publication Critical patent/JP2001343994A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識誤り検出装置および記憶媒体に関
し、認識誤り検出を迅速化する。 【解決手段】 音声認識装置5の音声入力4の元となる
原稿を集め、事前原稿データベース1とする。事前原稿
処理部2は、事前原稿データベース1から認識処理開始
前に単語出現位置辞書3を作成する。認識結果処理部7
は、単語出現位置辞書3を利用し、認識結果6に最も類
似した事前原稿データベース1の文を誤り検出の根拠
(正解文)とする。選んだ正解文と認識結果の各単語を
比較し、正解文に存在しない認識単語を認識誤りとみな
して、認識誤り検出結果8を検出する。事前原稿データ
ベース1の一文を正解文と仮定することで、認識誤り検
出手順を単純化した。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声認識誤り検出装
置および記憶媒体に係り、特に、認識誤りを自動検出す
る音声認識誤り検出装置および当該音声認識誤り検出装
置に自動検出を行わせるためのプログラムを記憶した記
憶媒体に関するものである。
【0002】
【従来の技術】初めに、本明細書中で使用する重要な語
句について、以下の通りに定義する。 「文」 読点(。)で終了する単語列。 「音声認識装置」 音声入力を逐次、単語に変換して出力する装置。 「認識結果」 音声認識装置が逐次出力する単語列、および、音声 認識装置が最終的に出力する文。 「認識誤り」 音声入力の書き起こしと異なる認識結果の単語。 「正解文」 認識誤りを検出する根拠として利用する文。 「事前原稿データベース」 音声入力の元となる原稿の集合。 「単語出現位置辞書」 事前原稿データベースに出現した単語と、その出現 位置を記録したテーブル。
【0003】従来の音声認識装置の認識誤り単語の自動
検出が可能な手法としては、例えば、正解文とのDPマ
ッチングによる方法(尾上和穂他、“記者原稿を用いた
ニュース音声認識結果の修正法”、日本音響学会講演論
文集,1−6−6,pp.11−12.1998.3)
を利用するものがある。この手法によれば、認識結果が
文末に到達した時点で、認識結果の文と最も多く単語が
一致する事前原稿データベースの文を「正解文」と仮定
して認識誤りを検出する。ここで、「正解文」の仮定
は、事前原稿データベースの文のうち、認識結果の一文
に対してDPマッチング(中川聖一、“確率モデルによ
る音声認識”、PP.18−20)のスコアが最も高い
文を選んで行っている。
【0004】
【発明が解決しようとする課題】上記したDPマッチン
グによる音声認識手法では、認識結果の一文に対する事
前原稿データベースの各々の文のマッチングスコアを正
解文の選択基準としている。このため、音声認識装置が
認識結果を逐次、出力可能であるにもかかわらず、認識
結果が文末に到達するまで認識誤りを検出することがで
きない。
【0005】本発明の目的は、音声認識結果に応じて正
解文を逐次仮定することで、迅速に認識誤りを検出する
ことのできる音声認識誤り検出装置および当該認識誤り
検出を行わせるためのプログラムを記憶した記憶媒体を
提供することである。
【0006】
【課題を解決するための手段】上記の課題を解決するた
めに請求項1の発明は、音声入力の元となる原稿を保持
する事前原稿データベースから所定の原稿を読み出し、
前記所定の原稿における単語の情報を単語辞書に記録す
る単語辞書作成手段と、前記所定の原稿の音声入力の音
声認識手段による認識結果と前記単語辞書を入力し、前
記単語の情報に基づいて、前記認識結果に最も類似した
前記事前原稿データベース中の文を基準として前記認識
結果における認識誤りを検出する検出手段とを備えたこ
とを特徴とする音声認識誤り検出装置を提供する。
【0007】また、請求項2の発明は、請求項1に記載
の音声認識誤り検出装置において、前記単語辞書作成手
段は、前記事前原稿データベース中の文を単語単位に分
割する手段と、前記分割した単語を、その出現する文番
号、出現位置とともに前記単語辞書に記録する手段とを
備えたことを特徴とする音声認識誤り検出装置を提供す
る。
【0008】また、請求項3の発明は、請求項2に記載
の音声認識誤り検出装置において、前記検出手段は、前
記認識結果の単語について、連続する長さが最長の単語
出現位置の組の文番号、出現位置を前記認識結果の単語
とともに出現位置リストに記録する手段と、前記単語辞
書と前記出現位置リストを入力し、前記出現位置リスト
に最も多く出現する文番号を正解文の文番号と仮定する
手段と、前記正解文の文番号に基づいて前記認識結果に
おける認識誤りを検出する誤り検出手段とを備えたこと
を特徴とする音声認識誤り検出装置を提供する。
【0009】また、請求項4の発明は、請求項3に記載
の音声認識誤り検出装置において、前記誤り検出手段
は、前記出現位置リストと前記正解文の各文番号が異な
る単語を誤り候補とし、前記誤り候補の前後の単語の出
現位置から前記誤り候補に対応する正解単語を前記単語
辞書を調べて正解文字列を作成することを特徴とする音
声認識誤り検出装置を提供する。
【0010】また、請求項5の発明は、音声入力の元と
なる原稿を保持する事前原稿データベースから所定の原
稿を読み出し、前記所定の原稿における単語の情報を単
語辞書に記録する単語辞書作成ステップと、前記所定の
原稿の音声入力に対して音声認識処理を行う音声認識ス
テップと、前記音声認識ステップにおける認識結果と前
記単語辞書を入力し、前記単語の情報に基づいて、前記
認識結果に最も類似した前記事前原稿データベース中の
文を基準として前記認識結果における認識誤りを検出す
る検出ステップとを備えたプログラムをコンピュータに
読み取り可能に記憶したことを特徴とする記憶媒体を提
供する。
【0011】また、請求項6の発明は、請求項5に記載
の記憶媒体において、前記単語辞書作成ステップは、前
記事前原稿データベース中の文を単語単位に分割するス
テップと、前記分割した単語を、その出現する文番号、
出現位置とともに前記単語辞書に記録するステップとを
備えたことを特徴とする記憶媒体を提供する。
【0012】また、請求項7の発明は、請求項6に記載
の記憶媒体において、前記検出ステップは、前記認識結
果の単語について、連続する長さが最長の単語出現位置
の組の文番号、出現位置を前記認識結果の単語とともに
出現位置リストに記録するステップと、前記単語辞書と
前記出現位置リストを入力し、前記出現位置リストに最
も多く出現する文番号を正解文の文番号と仮定するステ
ップと、前記正解文の文番号に基づいて前記認識結果に
おける認識誤りを検出する誤り検出ステップとを備えた
ことを特徴とする記憶媒体を提供する。
【0013】また、請求項8の発明は、請求項7に記載
の記憶媒体において、前記誤り検出ステップにおいて、
前記出現位置リストと前記正解文の各文番号が異なる単
語を誤り候補とし、前記誤り候補の前後の単語の出現位
置から前記誤り候補に対応する正解単語を前記単語辞書
を調べて正解文字列を作成することを特徴とする記憶媒
体を提供する。
【0014】
【発明の実施の形態】以下、添付図面を参照して、本発
明の実施の形態を詳細に説明する。図1は本発明に係る
音声認識誤り検出装置の一実施形態の全体構成を示す構
成図である。
【0015】本実施形態の装置は、事前原稿処理部2と
認識結果処理部7と音声認識装置5で構成される。音声
認識装置5は認識結果を単語単位で逐次、出力可能な構
成のものであればよく、これにより、音声入力4から認
識結果6を出力して認識結果処理部7に供給する。
【0016】事前原稿処理部2と認識結果処理部7は、
処理装置としてCPU,主記憶装置としてROM,CP
Uのワーキングエリアおよび補助記憶装置としてRA
M,補助記憶装置としてHDD等のディスク記憶装置、
および、外部記憶装置としてFDDその他のディスク記
憶装置を備える周知の構成を備え、例えばワークステー
ション、パーソナルコンピュータにより実施できる。こ
れらの構成を備えた本実施形態の装置は、各種記憶装置
(記憶媒体)からプログラムをロードし、このプログラ
ムにしたがって音声認識処理を行うことができる。
【0017】以下、事前原稿処理部2と認識結果処理部
7について機能的に説明する。事前原稿処理部2は単語
分割器21と単語出現位置辞書作成部23で構成され、
音声入力4の元となる原稿の集合である事前事前原稿デ
ータベース1から、認識処理開始前に単語出現位置辞書
3を作成する。したがって、単語出現位置辞書3は認識
結果6に依存しない。単語分割器21の出力は、一度、
分割済みテキストデータ22として記録されてから単語
出現位置辞書作成部23の入力となる。
【0018】認識結果処理部7は一致単語列推定部71
と認識誤り検出部73で構成され、認識処理開始後に認
識結果6を入力し、前もって作成された単語出現位置辞
書3を利用して認識結果6における認識誤りを検出し、
認識誤り検出結果8を出力する。一致単語列推定部71
の出力は、一旦、出現位置リスト72として記録された
後に認識誤り検出部73の入力となる。
【0019】上記本実施形態の装置および記憶媒体に記
憶されたプログラムにしたがった処理により、事前原稿
データベース1と音声入力4が与えられたとき、事前原
稿データベース1から単語出現位置辞書3を作成してお
き、音声入力4に対する認識結果6と一致する単語列を
単語出現位置辞書3を用いて調べ、この単語列の合計の
長さが最大となる文を正解文として選択/決定し、認識
誤り検出の根拠とすることで、迅速に認識誤り検出結果
8を出力することができる。
【0020】以下、認識結果6から認識誤りを逐次検出
し、認識結果6が文末に到達した時点で全ての処理を一
旦終了する場合について詳細に説明する。
【0021】まず事前原稿処理部2の処理手順につい
て、単語分割器21に関わる部分と単語出現位置辞書作
成部23に関わる部分に分けて説明する。
【0022】単語分割器21は図2に示したフローチャ
ートにしたがった手順で処理を行い、まずステップS2
10において、事前原稿データベース1の各文を形態素
解析し、単語単位に分割する。ここで利用可能な単語分
割ツールとしては、例えば、形態素解析ツール「茶筌」
ver.2.0(松本他、“日本語形態素解析システム
「茶筌」ver.2.0使用説明書”,NAIST−I
S−TR99008,参照)があるが、日本語文字列を
単語単位に分割することが可能なツールであれば他のツ
ールを用いても良い。
【0023】次に、ステップS210で作成した単語列
を、分割済みテキストデータ22に記録する。分割済み
テキストデータ22には、各文を識別する番号(文番
号)を、各単語列の先頭に併記しておく。図2の例の分
割済みテキストデータ22には、文番号として「23
0」が併記されている。
【0024】単語出現位置辞書作成部23は図3に示し
たフローチャートにしたがった手順で処理を行い、まず
ステップS230において、分割済みテキストデータ2
2から単語列を読み込む。次に、ステップS230で読
み込んだ単語列から、各単語が出現した位置(出現位
置)と出現した文の番号(文番号)を単語出現位置辞書
3に記録する。単語出現位置辞書3は、単語(例えば
「介護」)から出現位置(8610(230))を参照
するテーブル31と出現位置(例えば8611(23
0))から単語(「保険」)を参照するテーブル32の
二つを一組として作成する。
【0025】事前原稿処理部2による以上の処理は音声
認識装置5による認識処理開始前に行われ、音声入力4
の元となる事前原稿データベース1から単語出現位置辞
書3が作成され、認識誤り検出の準備がなされる。一
方、認識結果処理部7は認識結果6を待ってこれを入力
し、単語出現位置辞書3を利用して以下の処理を行な
い、認識結果6における認識単語列の認識誤りを検出し
て、認識誤り検出結果8を出力する。
【0026】ここで、認識詰果処理部7の処理手順につ
いて、一致単語列推定部71に関わる部分と認識誤り検
出部73に関わる部分に分けて説明する。
【0027】一致単語列推定部71は図4に示したフロ
ーチャートにしたがった手順で処理を行い、まずステッ
プS710において、単語出現位置辞書3を読み込む。
次にステップS711で認識結果6を読み込む。
【0028】事前原稿処理部2による情報と音声認識装
置5による情報を入力するとステップS712におい
て、認識結果6の各単語について、最長の一致する出現
位置と文番号を調べる。すなわち、認識結果6の各単語
の出現位置が前後の単語の出現位置と連続する出現位置
の組を調べ、見つかった出現位置の組の中で、連続する
長さが最長の組を探す。
【0029】図4の具体例では、テーブル31中の出現
位置の組(8610,8611,8612,8613)
が、認識結果6のそれぞれの認識単語「介護」、「保
険」、「制度」、および「で」について単語出現位置辞
書3から見つかる最長長さ(=4)の組である。また文
番号は、テーブル31から「230」が見つかる。
【0030】続いてステップS713では、ステップS
712で見つかった、最長長さの出現位置の組(861
0,8611,8612,8613)の各要素(出現位
置、文番号)を、それぞれ対応する認識単語とともに出
現位置リスト72に逐次、出力し記録する。
【0031】リスト出力に続いてステップS714で、
認識結果6の認識結果が文末に到達して一つ文の文とし
て完了したか判断し、文末に到達した場合は、ここで処
理を終了する。文末に到達していない場合はステップS
711の処理に戻り、次の新しい単語が認識されるまで
待ち、新しい認識単語について同様に出現位置リスト7
2を作成して記憶する。
【0032】認識誤り検出部73は図5に示したフロー
チャートにしたがった手順で処理を行い、まずステップ
S730において、単語出現位置辞書3を読み込む。次
にステップS731では、一致単語列推定部71が作成
した出現位置リスト72を読み込む。
【0033】事前原稿処理部2による情報と一致単語列
推定部71による情報を入力するとステップS732に
おいて、出現位置リスト72に記録された各文番号を調
べ、ここに最も多く出現した文番号を正解文の番号とし
て仮定する。図5の具体例では、出現位置リスト72中
の最多出現の文番号は合計6回出現の「230」(他は
「057」が合計2回)なので、文番号「230」を正
解文の文番号として選択する。
【0034】すなわち本実施形態では、事前原稿データ
ベース1から正解文を選ぶ評価基準として、認識結果6
と一致する単語列の長さ(合計長)の最大値を用いてお
り、認識結果6に最も類似した事前原稿データベース1
の文を誤り検出の根拠(正解文)に用いている。このと
き、正解文を一意に決定する認識結果6の単語列は、必
ずしも文末まで認識されている必要がなく、認識された
分について作成されている出現位置リスト72にしたが
って認識誤り検出することができる。
【0035】正解文が決まるとステップS733に進
み、この正解文の文番号を根拠として「誤り候補」を検
出する。すなわち、出現位置リスト72中の各単語の文
番号とステップS732で求めた正解文の文番号を比較
して、文番号が異なる認識単語を「誤り候補」とする。
一方、文番号が正解文の文番号と一致する認識単語は
「正解」とする。
【0036】図5の具体例では、出現位置リスト72中
の次の2つの要素; 和解 1508(057) 後 1509(057) の文番号「057」が、ステップS731で決定した正
解文の番号「230」と異なる。出現位置リスト72中
の他の要素の文番号「230」は正解文の番号と一致す
る。したがって、認識単語「和解」と「後」を誤り候補
76として検出し、それ以外の認識単語(「介護」、
「保険」、「制度」、「で」、「が」、「必要」)は正
解75,77とする。
【0037】誤り候補検出に続いてステップS734で
は誤り候補の認識単語(または認識単語列)の前後に正
解単語列が存在するか判断し、前後に存在せず、誤り候
補の認識単語(または認識単語列)が正解単語列で挟ま
れていない場合はステップS731に戻り、さらにリス
ト読み込みを行って誤り候補を検出するためにステップ
S731〜S734を繰り返し行う。ステップS734
において正解単語列が前後に存在し、誤り候補の認識単
語(または認識単語列)が正解単語列で挟まれている場
合はステップS735以降に進む。
【0038】図5の例では、誤り候補の単語列76(和
解−後)が正解単語列75(介護−保険−制度−で)と
正解単語列77(が−必要)に挟まれている。したがっ
て、ステップS735からステップS735へ進み、正
解単語列の出現位置を利用して正解文字列を作成する。
【0039】すなわち、出現位置リスト72中の誤り候
補の単語(または単語列)の前後の正解単語の出現位置
を補間して、単語出現位置辞書3を利用して正解文字列
を作る。
【0040】図5の具体例では、誤り候補の単語列76
(和解−後)の前後の正解「で」の出現位置「861
3」と正解「が」の出現位置「8616」の間を連続す
る出現位置「8614」〜「8615」で補間する。そ
して、補間した出現位置「8614」,「8615」に
対応する単語を単語出現位置辞書3から調べて、正解文
字列を作る。出現位置「8614」に対応する単語は
「は」(図示せず)、出現位置「8615」に対応する
単語は「介護」(図示せず)であり、正解文字列「は介
護」を作成する。
【0041】上記の通りに正解文字列を作成するとステ
ップS736に進み、正解文字列を根拠として誤り候補
の正誤判定を行う。すなわち、正解文字列に存在する誤
り候補の認識単語を「正解」とし、正解文字列に出現し
ない誤り候補の認識単語を「誤り」とする。この様に、
事前原稿データベース1の一文を前述の通りに正解文と
仮定し、正解文に存在しない認識単語を認識誤りとみな
すことで、誤り検出の手順を単純化している。
【0042】図5の具体例では、誤り候補の単語列76
における「和解」と「後」は、ともに正解文字列「は介
護」に存在しない。したがって、ともに「誤り」として
検出する。
【0043】正誤判定に続いてステップS737では、
その判定結果を認識誤り検出結果8に出力する。文頭か
ら順に、「正解」または「誤り」と判定した単語を認識
誤り検出結果8に出力し、ここで「誤り」の単語には、
図示の通りに「正解」の単語と識別する記号85を併記
する。
【0044】認識誤り検出に続いてステップS738
で、認識結果6の認識結果が文末に到達して一つ文の文
として完了したか判断し、文末に到達した場合は、ここ
で処理を終了する。文末に到達していない場合はステッ
プS731の処理に戻り、出現位置リスト72が更新さ
れるまで待ち、更新された出現位置リスト72にしたが
って同様に認識誤り検出を行う。
【0045】本実施形態によれば、単語列の最大一致長
を与える事前原稿データベース1の文が一つに特定され
る時点で正解文を決定できるので、必ずしも認識結果6
が文末に到達するまで待つ必要がない。すなわち、認識
結果6が文末に到達していなくても、正解文を決定した
時点で直ちに認識誤り検出結果8が得られるので、迅速
な処理を行うことができる。
【0046】
【発明の効果】以上説明した通り本発明によれば、音声
認識手段による認識結果が文末に到達するのを待つこと
なく、事前原稿データベースの文から正解文が決定した
時点で逐次、認識誤りを検出することができるので、迅
速に認識誤り検出を行える効果がある。また、認識誤り
の逐次検出を行えるため、事前原稿にしたがって番組を
進行する生放送等において、原稿にしたがった発言を音
声認識してリアルタイムでスーパーインポーズを付与す
る場合にも、認識結果に含まれる誤りの発見作業を効率
化できる効果がある。
【図面の簡単な説明】
【図1】本発明に係る音声認識誤り検出装置の一実施形
態の全体構成を示す構成図である。
【図2】本発明に係る音声認識誤り検出装置の一実施形
態における単語分割器の処理手順を表すフローチャート
と動作説明図である。
【図3】本発明に係る音声認識誤り検出装置の一実施形
態における出現位置辞書作成部の処理手順を表すフロー
チャートと動作説明図である。
【図4】本発明に係る音声認識誤り検出装置の一実施形
態における一致単語列推定部の処理手順を表すフローチ
ャートと動作説明図である。
【図5】本発明に係る音声認識誤り検出装置の一実施形
態における認識誤り検出部の処理手順を表すフローチャ
ートと動作説明図である。
【符号の説明】
1 事前原稿データベース 2 事前原稿処理部 3 単語出現位置辞書 4 音声入力 5 音声認識装置 6 認識結果 7 認識結果処理部 8 認識誤り検出結果 21 単語分割器 22 分割済みテキストデータ 23 単語出現位置辞書作成部 71 一致単語列推定部 72 出現位置リスト 73 認識誤り検出部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 尾上 和穂 東京都世田谷区砧一丁目10番11号 日本放 送協会 放送技術研究所内 (72)発明者 今井 亨 東京都世田谷区砧一丁目10番11号 日本放 送協会 放送技術研究所内 (72)発明者 田中 英輝 東京都世田谷区砧一丁目10番11号 日本放 送協会 放送技術研究所内 (72)発明者 安藤 彰男 東京都世田谷区砧一丁目10番11号 日本放 送協会 放送技術研究所内 Fターム(参考) 5D015 AA01 LL01

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 音声入力の元となる原稿を保持する事前
    原稿データベースから所定の原稿を読み出し、前記所定
    の原稿における単語の情報を単語辞書に記録する単語辞
    書作成手段と、 前記所定の原稿の音声入力の音声認識手段による認識結
    果と前記単語辞書を入力し、前記単語の情報に基づい
    て、前記認識結果に最も類似した前記事前原稿データベ
    ース中の文を基準として前記認識結果における認識誤り
    を検出する検出手段とを備えたことを特徴とする音声認
    識誤り検出装置。
  2. 【請求項2】 請求項1に記載の音声認識誤り検出装置
    において、 前記単語辞書作成手段は、 前記事前原稿データベース中の文を単語単位に分割する
    手段と、 前記分割した単語を、その出現する文番号、出現位置と
    ともに前記単語辞書に記録する手段とを備えたことを特
    徴とする音声認識誤り検出装置。
  3. 【請求項3】 請求項2に記載の音声認識誤り検出装置
    において、 前記検出手段は、 前記認識結果の単語について、連続する長さが最長の単
    語出現位置の組の文番号、出現位置を前記認識結果の単
    語とともに出現位置リストに記録する手段と、 前記単語辞書と前記出現位置リストを入力し、前記出現
    位置リストに最も多く出現する文番号を正解文の文番号
    と仮定する手段と、 前記正解文の文番号に基づいて前記認識結果における認
    識誤りを検出する誤り検出手段とを備えたことを特徴と
    する音声認識誤り検出装置。
  4. 【請求項4】 請求項3に記載の音声認識誤り検出装置
    において、 前記誤り検出手段は、前記出現位置リストと前記正解文
    の各文番号が異なる単語を誤り候補とし、前記誤り候補
    の前後の単語の出現位置から前記誤り候補に対応する正
    解単語を前記単語辞書を調べて正解文字列を作成するこ
    とを特徴とする音声認識誤り検出装置。
  5. 【請求項5】 音声入力の元となる原稿を保持する事前
    原稿データベースから所定の原稿を読み出し、前記所定
    の原稿における単語の情報を単語辞書に記録する単語辞
    書作成ステップと、 前記所定の原稿の音声入力に対して音声認識処理を行う
    音声認識ステップと、 前記音声認識ステップにおける認識結果と前記単語辞書
    を入力し、前記単語の情報に基づいて、前記認識結果に
    最も類似した前記事前原稿データベース中の文を基準と
    して前記認識結果における認識誤りを検出する検出ステ
    ップとを備えたプログラムをコンピュータに読み取り可
    能に記憶したことを特徴とする記憶媒体。
  6. 【請求項6】 請求項5に記載の記憶媒体において、 前記単語辞書作成ステップは、 前記事前原稿データベース中の文を単語単位に分割する
    ステップと、 前記分割した単語を、その出現する文番号、出現位置と
    ともに前記単語辞書に記録するステップとを備えたこと
    を特徴とする記憶媒体。
  7. 【請求項7】 請求項6に記載の記憶媒体において、 前記検出ステップは、 前記認識結果の単語について、連続する長さが最長の単
    語出現位置の組の文番号、出現位置を前記認識結果の単
    語とともに出現位置リストに記録するステップと、 前記単語辞書と前記出現位置リストを入力し、前記出現
    位置リストに最も多く出現する文番号を正解文の文番号
    と仮定するステップと、 前記正解文の文番号に基づいて前記認識結果における認
    識誤りを検出する誤り検出ステップとを備えたことを特
    徴とする記憶媒体。
  8. 【請求項8】 請求項7に記載の記憶媒体において、 前記誤り検出ステップにおいて、前記出現位置リストと
    前記正解文の各文番号が異なる単語を誤り候補とし、前
    記誤り候補の前後の単語の出現位置から前記誤り候補に
    対応する正解単語を前記単語辞書を調べて正解文字列を
    作成することを特徴とする記憶媒体。
JP2000164233A 2000-06-01 2000-06-01 音声認識誤り検出装置および記憶媒体 Pending JP2001343994A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000164233A JP2001343994A (ja) 2000-06-01 2000-06-01 音声認識誤り検出装置および記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000164233A JP2001343994A (ja) 2000-06-01 2000-06-01 音声認識誤り検出装置および記憶媒体

Publications (1)

Publication Number Publication Date
JP2001343994A true JP2001343994A (ja) 2001-12-14

Family

ID=18667879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000164233A Pending JP2001343994A (ja) 2000-06-01 2000-06-01 音声認識誤り検出装置および記憶媒体

Country Status (1)

Country Link
JP (1) JP2001343994A (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005227510A (ja) * 2004-02-12 2005-08-25 Ntt Docomo Inc 音声認識装置及び音声認識方法
JP2006521578A (ja) * 2003-03-26 2006-09-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識システム
JP2009532744A (ja) * 2006-04-03 2009-09-10 ヴォコレクト・インコーポレーテッド 音声認識システムにモデルを適合させるための方法およびシステム
KR100952974B1 (ko) * 2003-06-26 2010-04-15 주식회사 케이티 미등록어 처리를 지원하는 음성 인식 시스템과 방법 및이를 저장한 컴퓨터 판독 가능 기록매체
JP2012128188A (ja) * 2010-12-15 2012-07-05 Nippon Hoso Kyokai <Nhk> テキスト修正装置およびプログラム
US8374870B2 (en) 2005-02-04 2013-02-12 Vocollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
JP2013083897A (ja) * 2011-10-12 2013-05-09 Fujitsu Ltd 認識装置、認識プログラム、認識方法、生成装置、生成プログラムおよび生成方法
US8612235B2 (en) 2005-02-04 2013-12-17 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
US8756059B2 (en) 2005-02-04 2014-06-17 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
US8868421B2 (en) 2005-02-04 2014-10-21 Vocollect, Inc. Methods and systems for identifying errors in a speech recognition system
US8914290B2 (en) 2011-05-20 2014-12-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
JP2015125232A (ja) * 2013-12-26 2015-07-06 日本放送協会 音声認識誤り修正装置
JP2016099515A (ja) * 2014-11-21 2016-05-30 日本放送協会 音声認識誤り修正装置
US9978395B2 (en) 2013-03-15 2018-05-22 Vocollect, Inc. Method and system for mitigating delay in receiving audio stream during production of sound from audio stream
US10832679B2 (en) 2018-11-20 2020-11-10 International Business Machines Corporation Method and system for correcting speech-to-text auto-transcription using local context of talk
US11837253B2 (en) 2016-07-27 2023-12-05 Vocollect, Inc. Distinguishing user speech from background speech in speech-dense environments

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006521578A (ja) * 2003-03-26 2006-09-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識システム
KR100952974B1 (ko) * 2003-06-26 2010-04-15 주식회사 케이티 미등록어 처리를 지원하는 음성 인식 시스템과 방법 및이를 저장한 컴퓨터 판독 가능 기록매체
JP2005227510A (ja) * 2004-02-12 2005-08-25 Ntt Docomo Inc 音声認識装置及び音声認識方法
US9202458B2 (en) 2005-02-04 2015-12-01 Vocollect, Inc. Methods and systems for adapting a model for a speech recognition system
US10068566B2 (en) 2005-02-04 2018-09-04 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
US8374870B2 (en) 2005-02-04 2013-02-12 Vocollect, Inc. Methods and systems for assessing and improving the performance of a speech recognition system
US8612235B2 (en) 2005-02-04 2013-12-17 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
US8756059B2 (en) 2005-02-04 2014-06-17 Vocollect, Inc. Method and system for considering information about an expected response when performing speech recognition
US8868421B2 (en) 2005-02-04 2014-10-21 Vocollect, Inc. Methods and systems for identifying errors in a speech recognition system
US9928829B2 (en) 2005-02-04 2018-03-27 Vocollect, Inc. Methods and systems for identifying errors in a speech recognition system
JP2009532744A (ja) * 2006-04-03 2009-09-10 ヴォコレクト・インコーポレーテッド 音声認識システムにモデルを適合させるための方法およびシステム
JP2012128188A (ja) * 2010-12-15 2012-07-05 Nippon Hoso Kyokai <Nhk> テキスト修正装置およびプログラム
US11810545B2 (en) 2011-05-20 2023-11-07 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US11817078B2 (en) 2011-05-20 2023-11-14 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US10685643B2 (en) 2011-05-20 2020-06-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US9697818B2 (en) 2011-05-20 2017-07-04 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
US8914290B2 (en) 2011-05-20 2014-12-16 Vocollect, Inc. Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment
JP2013083897A (ja) * 2011-10-12 2013-05-09 Fujitsu Ltd 認識装置、認識プログラム、認識方法、生成装置、生成プログラムおよび生成方法
US9082404B2 (en) 2011-10-12 2015-07-14 Fujitsu Limited Recognizing device, computer-readable recording medium, recognizing method, generating device, and generating method
US9978395B2 (en) 2013-03-15 2018-05-22 Vocollect, Inc. Method and system for mitigating delay in receiving audio stream during production of sound from audio stream
JP2015125232A (ja) * 2013-12-26 2015-07-06 日本放送協会 音声認識誤り修正装置
JP2016099515A (ja) * 2014-11-21 2016-05-30 日本放送協会 音声認識誤り修正装置
US11837253B2 (en) 2016-07-27 2023-12-05 Vocollect, Inc. Distinguishing user speech from background speech in speech-dense environments
US10832679B2 (en) 2018-11-20 2020-11-10 International Business Machines Corporation Method and system for correcting speech-to-text auto-transcription using local context of talk

Similar Documents

Publication Publication Date Title
US7983915B2 (en) Audio content search engine
JP2001343994A (ja) 音声認識誤り検出装置および記憶媒体
JP4924950B2 (ja) 質問応答データ編集装置、質問応答データ編集方法、質問応答データ編集プログラム
US8150687B2 (en) Recognizing speech, and processing data
JP4466564B2 (ja) 文書作成閲覧装置、文書作成閲覧ロボットおよび文書作成閲覧プログラム
US20080270344A1 (en) Rich media content search engine
US6961699B1 (en) Automated transcription system and method using two speech converting instances and computer-assisted correction
US20080270110A1 (en) Automatic speech recognition with textual content input
US20070233486A1 (en) Transcript alignment
CN107305541A (zh) 语音识别文本分段方法及装置
JP5561123B2 (ja) 音声検索装置と音声検索方法
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JPWO2005069171A1 (ja) 文書対応付け装置、および文書対応付け方法
JP5824829B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
CN113626573B (zh) 一种销售会话异议及应对提取方法及系统
JP2002132287A (ja) 音声収録方法および音声収録装置および記憶媒体
JP3938096B2 (ja) インデックス作成装置、インデックス作成方法、および、インデックス作成プログラム
CN110853627B (zh) 用于语音标注的方法及系统
US20190392005A1 (en) Speech dialogue system, model creating device, model creating method
JP5189413B2 (ja) 音声データ検索システム
JP2000089786A (ja) 音声認識結果の修正方法および装置
JP5713782B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2011113426A (ja) 辞書作成装置,辞書作成プログラムおよび辞書作成方法
JP2007241636A (ja) 文書データ解析装置および文書データ解析プログラム
JP7163845B2 (ja) 情報処理装置、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050401

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050401

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071214

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080704