JP2001343994A

JP2001343994A - 音声認識誤り検出装置および記憶媒体

Info

Publication number: JP2001343994A
Application number: JP2000164233A
Authority: JP
Inventors: Atsushi Matsui; 淳松井; Naoto Kato; 直人加藤; Kazuho Onoe; 和穂尾上; Toru Imai; 亨今井; Hideki Tanaka; 英輝田中; Akio Ando; 彰男安藤
Original assignee: Nippon Hoso Kyokai NHK; Japan Broadcasting Corp
Current assignee: Japan Broadcasting Corp
Priority date: 2000-06-01
Filing date: 2000-06-01
Publication date: 2001-12-14

Abstract

(57)【要約】【課題】音声認識誤り検出装置および記憶媒体に関
し、認識誤り検出を迅速化する。【解決手段】音声認識装置５の音声入力４の元となる
原稿を集め、事前原稿データベース１とする。事前原稿
処理部２は、事前原稿データベース１から認識処理開始
前に単語出現位置辞書３を作成する。認識結果処理部７
は、単語出現位置辞書３を利用し、認識結果６に最も類
似した事前原稿データベース１の文を誤り検出の根拠
（正解文）とする。選んだ正解文と認識結果の各単語を
比較し、正解文に存在しない認識単語を認識誤りとみな
して、認識誤り検出結果８を検出する。事前原稿データ
ベース１の一文を正解文と仮定することで、認識誤り検
出手順を単純化した。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声認識誤り検出装
置および記憶媒体に係り、特に、認識誤りを自動検出す
る音声認識誤り検出装置および当該音声認識誤り検出装
置に自動検出を行わせるためのプログラムを記憶した記
憶媒体に関するものである。

【０００２】

【従来の技術】初めに、本明細書中で使用する重要な語
句について、以下の通りに定義する。「文」読点（。）で終了する単語列。「音声認識装置」音声入力を逐次、単語に変換して出力する装置。「認識結果」音声認識装置が逐次出力する単語列、および、音声認識装置が最終的に出力する文。「認識誤り」音声入力の書き起こしと異なる認識結果の単語。「正解文」認識誤りを検出する根拠として利用する文。「事前原稿データベース」音声入力の元となる原稿の集合。「単語出現位置辞書」事前原稿データベースに出現した単語と、その出現位置を記録したテーブル。

【０００３】従来の音声認識装置の認識誤り単語の自動
検出が可能な手法としては、例えば、正解文とのＤＰマ
ッチングによる方法（尾上和穂他、“記者原稿を用いた
ニュース音声認識結果の修正法”、日本音響学会講演論
文集，１−６−６，ｐｐ．１１−１２．１９９８．３）
を利用するものがある。この手法によれば、認識結果が
文末に到達した時点で、認識結果の文と最も多く単語が
一致する事前原稿データベースの文を「正解文」と仮定
して認識誤りを検出する。ここで、「正解文」の仮定
は、事前原稿データベースの文のうち、認識結果の一文
に対してＤＰマッチング（中川聖一、“確率モデルによ
る音声認識”、ＰＰ．１８−２０）のスコアが最も高い
文を選んで行っている。

【０００４】

【発明が解決しようとする課題】上記したＤＰマッチン
グによる音声認識手法では、認識結果の一文に対する事
前原稿データベースの各々の文のマッチングスコアを正
解文の選択基準としている。このため、音声認識装置が
認識結果を逐次、出力可能であるにもかかわらず、認識
結果が文末に到達するまで認識誤りを検出することがで
きない。

【０００５】本発明の目的は、音声認識結果に応じて正
解文を逐次仮定することで、迅速に認識誤りを検出する
ことのできる音声認識誤り検出装置および当該認識誤り
検出を行わせるためのプログラムを記憶した記憶媒体を
提供することである。

【０００６】

【課題を解決するための手段】上記の課題を解決するた
めに請求項１の発明は、音声入力の元となる原稿を保持
する事前原稿データベースから所定の原稿を読み出し、
前記所定の原稿における単語の情報を単語辞書に記録す
る単語辞書作成手段と、前記所定の原稿の音声入力の音
声認識手段による認識結果と前記単語辞書を入力し、前
記単語の情報に基づいて、前記認識結果に最も類似した
前記事前原稿データベース中の文を基準として前記認識
結果における認識誤りを検出する検出手段とを備えたこ
とを特徴とする音声認識誤り検出装置を提供する。

【０００７】また、請求項２の発明は、請求項１に記載
の音声認識誤り検出装置において、前記単語辞書作成手
段は、前記事前原稿データベース中の文を単語単位に分
割する手段と、前記分割した単語を、その出現する文番
号、出現位置とともに前記単語辞書に記録する手段とを
備えたことを特徴とする音声認識誤り検出装置を提供す
る。

【０００８】また、請求項３の発明は、請求項２に記載
の音声認識誤り検出装置において、前記検出手段は、前
記認識結果の単語について、連続する長さが最長の単語
出現位置の組の文番号、出現位置を前記認識結果の単語
とともに出現位置リストに記録する手段と、前記単語辞
書と前記出現位置リストを入力し、前記出現位置リスト
に最も多く出現する文番号を正解文の文番号と仮定する
手段と、前記正解文の文番号に基づいて前記認識結果に
おける認識誤りを検出する誤り検出手段とを備えたこと
を特徴とする音声認識誤り検出装置を提供する。

【０００９】また、請求項４の発明は、請求項３に記載
の音声認識誤り検出装置において、前記誤り検出手段
は、前記出現位置リストと前記正解文の各文番号が異な
る単語を誤り候補とし、前記誤り候補の前後の単語の出
現位置から前記誤り候補に対応する正解単語を前記単語
辞書を調べて正解文字列を作成することを特徴とする音
声認識誤り検出装置を提供する。

【００１０】また、請求項５の発明は、音声入力の元と
なる原稿を保持する事前原稿データベースから所定の原
稿を読み出し、前記所定の原稿における単語の情報を単
語辞書に記録する単語辞書作成ステップと、前記所定の
原稿の音声入力に対して音声認識処理を行う音声認識ス
テップと、前記音声認識ステップにおける認識結果と前
記単語辞書を入力し、前記単語の情報に基づいて、前記
認識結果に最も類似した前記事前原稿データベース中の
文を基準として前記認識結果における認識誤りを検出す
る検出ステップとを備えたプログラムをコンピュータに
読み取り可能に記憶したことを特徴とする記憶媒体を提
供する。

【００１１】また、請求項６の発明は、請求項５に記載
の記憶媒体において、前記単語辞書作成ステップは、前
記事前原稿データベース中の文を単語単位に分割するス
テップと、前記分割した単語を、その出現する文番号、
出現位置とともに前記単語辞書に記録するステップとを
備えたことを特徴とする記憶媒体を提供する。

【００１２】また、請求項７の発明は、請求項６に記載
の記憶媒体において、前記検出ステップは、前記認識結
果の単語について、連続する長さが最長の単語出現位置
の組の文番号、出現位置を前記認識結果の単語とともに
出現位置リストに記録するステップと、前記単語辞書と
前記出現位置リストを入力し、前記出現位置リストに最
も多く出現する文番号を正解文の文番号と仮定するステ
ップと、前記正解文の文番号に基づいて前記認識結果に
おける認識誤りを検出する誤り検出ステップとを備えた
ことを特徴とする記憶媒体を提供する。

【００１３】また、請求項８の発明は、請求項７に記載
の記憶媒体において、前記誤り検出ステップにおいて、
前記出現位置リストと前記正解文の各文番号が異なる単
語を誤り候補とし、前記誤り候補の前後の単語の出現位
置から前記誤り候補に対応する正解単語を前記単語辞書
を調べて正解文字列を作成することを特徴とする記憶媒
体を提供する。

【００１４】

【発明の実施の形態】以下、添付図面を参照して、本発
明の実施の形態を詳細に説明する。図１は本発明に係る
音声認識誤り検出装置の一実施形態の全体構成を示す構
成図である。

【００１５】本実施形態の装置は、事前原稿処理部２と
認識結果処理部７と音声認識装置５で構成される。音声
認識装置５は認識結果を単語単位で逐次、出力可能な構
成のものであればよく、これにより、音声入力４から認
識結果６を出力して認識結果処理部７に供給する。

【００１６】事前原稿処理部２と認識結果処理部７は、
処理装置としてＣＰＵ，主記憶装置としてＲＯＭ，ＣＰ
Ｕのワーキングエリアおよび補助記憶装置としてＲＡ
Ｍ，補助記憶装置としてＨＤＤ等のディスク記憶装置、
および、外部記憶装置としてＦＤＤその他のディスク記
憶装置を備える周知の構成を備え、例えばワークステー
ション、パーソナルコンピュータにより実施できる。こ
れらの構成を備えた本実施形態の装置は、各種記憶装置
（記憶媒体）からプログラムをロードし、このプログラ
ムにしたがって音声認識処理を行うことができる。

【００１７】以下、事前原稿処理部２と認識結果処理部
７について機能的に説明する。事前原稿処理部２は単語
分割器２１と単語出現位置辞書作成部２３で構成され、
音声入力４の元となる原稿の集合である事前事前原稿デ
ータベース１から、認識処理開始前に単語出現位置辞書
３を作成する。したがって、単語出現位置辞書３は認識
結果６に依存しない。単語分割器２１の出力は、一度、
分割済みテキストデータ２２として記録されてから単語
出現位置辞書作成部２３の入力となる。

【００１８】認識結果処理部７は一致単語列推定部７１
と認識誤り検出部７３で構成され、認識処理開始後に認
識結果６を入力し、前もって作成された単語出現位置辞
書３を利用して認識結果６における認識誤りを検出し、
認識誤り検出結果８を出力する。一致単語列推定部７１
の出力は、一旦、出現位置リスト７２として記録された
後に認識誤り検出部７３の入力となる。

【００１９】上記本実施形態の装置および記憶媒体に記
憶されたプログラムにしたがった処理により、事前原稿
データベース１と音声入力４が与えられたとき、事前原
稿データベース１から単語出現位置辞書３を作成してお
き、音声入力４に対する認識結果６と一致する単語列を
単語出現位置辞書３を用いて調べ、この単語列の合計の
長さが最大となる文を正解文として選択／決定し、認識
誤り検出の根拠とすることで、迅速に認識誤り検出結果
８を出力することができる。

【００２０】以下、認識結果６から認識誤りを逐次検出
し、認識結果６が文末に到達した時点で全ての処理を一
旦終了する場合について詳細に説明する。

【００２１】まず事前原稿処理部２の処理手順につい
て、単語分割器２１に関わる部分と単語出現位置辞書作
成部２３に関わる部分に分けて説明する。

【００２２】単語分割器２１は図２に示したフローチャ
ートにしたがった手順で処理を行い、まずステップＳ２
１０において、事前原稿データベース１の各文を形態素
解析し、単語単位に分割する。ここで利用可能な単語分
割ツールとしては、例えば、形態素解析ツール「茶筌」
ｖｅｒ．２．０（松本他、“日本語形態素解析システム
「茶筌」ｖｅｒ．２．０使用説明書”，ＮＡＩＳＴ−Ｉ
Ｓ−ＴＲ９９００８，参照）があるが、日本語文字列を
単語単位に分割することが可能なツールであれば他のツ
ールを用いても良い。

【００２３】次に、ステップＳ２１０で作成した単語列
を、分割済みテキストデータ２２に記録する。分割済み
テキストデータ２２には、各文を識別する番号（文番
号）を、各単語列の先頭に併記しておく。図２の例の分
割済みテキストデータ２２には、文番号として「２３
０」が併記されている。

【００２４】単語出現位置辞書作成部２３は図３に示し
たフローチャートにしたがった手順で処理を行い、まず
ステップＳ２３０において、分割済みテキストデータ２
２から単語列を読み込む。次に、ステップＳ２３０で読
み込んだ単語列から、各単語が出現した位置（出現位
置）と出現した文の番号（文番号）を単語出現位置辞書
３に記録する。単語出現位置辞書３は、単語（例えば
「介護」）から出現位置（８６１０（２３０））を参照
するテーブル３１と出現位置（例えば８６１１（２３
０））から単語（「保険」）を参照するテーブル３２の
二つを一組として作成する。

【００２５】事前原稿処理部２による以上の処理は音声
認識装置５による認識処理開始前に行われ、音声入力４
の元となる事前原稿データベース１から単語出現位置辞
書３が作成され、認識誤り検出の準備がなされる。一
方、認識結果処理部７は認識結果６を待ってこれを入力
し、単語出現位置辞書３を利用して以下の処理を行な
い、認識結果６における認識単語列の認識誤りを検出し
て、認識誤り検出結果８を出力する。

【００２６】ここで、認識詰果処理部７の処理手順につ
いて、一致単語列推定部７１に関わる部分と認識誤り検
出部７３に関わる部分に分けて説明する。

【００２７】一致単語列推定部７１は図４に示したフロ
ーチャートにしたがった手順で処理を行い、まずステッ
プＳ７１０において、単語出現位置辞書３を読み込む。
次にステップＳ７１１で認識結果６を読み込む。

【００２８】事前原稿処理部２による情報と音声認識装
置５による情報を入力するとステップＳ７１２におい
て、認識結果６の各単語について、最長の一致する出現
位置と文番号を調べる。すなわち、認識結果６の各単語
の出現位置が前後の単語の出現位置と連続する出現位置
の組を調べ、見つかった出現位置の組の中で、連続する
長さが最長の組を探す。

【００２９】図４の具体例では、テーブル３１中の出現
位置の組（８６１０，８６１１，８６１２，８６１３）
が、認識結果６のそれぞれの認識単語「介護」、「保
険」、「制度」、および「で」について単語出現位置辞
書３から見つかる最長長さ（＝４）の組である。また文
番号は、テーブル３１から「２３０」が見つかる。

【００３０】続いてステップＳ７１３では、ステップＳ
７１２で見つかった、最長長さの出現位置の組（８６１
０，８６１１，８６１２，８６１３）の各要素（出現位
置、文番号）を、それぞれ対応する認識単語とともに出
現位置リスト７２に逐次、出力し記録する。

【００３１】リスト出力に続いてステップＳ７１４で、
認識結果６の認識結果が文末に到達して一つ文の文とし
て完了したか判断し、文末に到達した場合は、ここで処
理を終了する。文末に到達していない場合はステップＳ
７１１の処理に戻り、次の新しい単語が認識されるまで
待ち、新しい認識単語について同様に出現位置リスト７
２を作成して記憶する。

【００３２】認識誤り検出部７３は図５に示したフロー
チャートにしたがった手順で処理を行い、まずステップ
Ｓ７３０において、単語出現位置辞書３を読み込む。次
にステップＳ７３１では、一致単語列推定部７１が作成
した出現位置リスト７２を読み込む。

【００３３】事前原稿処理部２による情報と一致単語列
推定部７１による情報を入力するとステップＳ７３２に
おいて、出現位置リスト７２に記録された各文番号を調
べ、ここに最も多く出現した文番号を正解文の番号とし
て仮定する。図５の具体例では、出現位置リスト７２中
の最多出現の文番号は合計６回出現の「２３０」（他は
「０５７」が合計２回）なので、文番号「２３０」を正
解文の文番号として選択する。

【００３４】すなわち本実施形態では、事前原稿データ
ベース１から正解文を選ぶ評価基準として、認識結果６
と一致する単語列の長さ（合計長）の最大値を用いてお
り、認識結果６に最も類似した事前原稿データベース１
の文を誤り検出の根拠（正解文）に用いている。このと
き、正解文を一意に決定する認識結果６の単語列は、必
ずしも文末まで認識されている必要がなく、認識された
分について作成されている出現位置リスト７２にしたが
って認識誤り検出することができる。

【００３５】正解文が決まるとステップＳ７３３に進
み、この正解文の文番号を根拠として「誤り候補」を検
出する。すなわち、出現位置リスト７２中の各単語の文
番号とステップＳ７３２で求めた正解文の文番号を比較
して、文番号が異なる認識単語を「誤り候補」とする。
一方、文番号が正解文の文番号と一致する認識単語は
「正解」とする。

【００３６】図５の具体例では、出現位置リスト７２中
の次の２つの要素；和解１５０８（０５７）後１５０９（０５７）の文番号「０５７」が、ステップＳ７３１で決定した正
解文の番号「２３０」と異なる。出現位置リスト７２中
の他の要素の文番号「２３０」は正解文の番号と一致す
る。したがって、認識単語「和解」と「後」を誤り候補
７６として検出し、それ以外の認識単語（「介護」、
「保険」、「制度」、「で」、「が」、「必要」）は正
解７５，７７とする。

【００３７】誤り候補検出に続いてステップＳ７３４で
は誤り候補の認識単語（または認識単語列）の前後に正
解単語列が存在するか判断し、前後に存在せず、誤り候
補の認識単語（または認識単語列）が正解単語列で挟ま
れていない場合はステップＳ７３１に戻り、さらにリス
ト読み込みを行って誤り候補を検出するためにステップ
Ｓ７３１〜Ｓ７３４を繰り返し行う。ステップＳ７３４
において正解単語列が前後に存在し、誤り候補の認識単
語（または認識単語列）が正解単語列で挟まれている場
合はステップＳ７３５以降に進む。

【００３８】図５の例では、誤り候補の単語列７６（和
解−後）が正解単語列７５（介護−保険−制度−で）と
正解単語列７７（が−必要）に挟まれている。したがっ
て、ステップＳ７３５からステップＳ７３５へ進み、正
解単語列の出現位置を利用して正解文字列を作成する。

【００３９】すなわち、出現位置リスト７２中の誤り候
補の単語（または単語列）の前後の正解単語の出現位置
を補間して、単語出現位置辞書３を利用して正解文字列
を作る。

【００４０】図５の具体例では、誤り候補の単語列７６
（和解−後）の前後の正解「で」の出現位置「８６１
３」と正解「が」の出現位置「８６１６」の間を連続す
る出現位置「８６１４」〜「８６１５」で補間する。そ
して、補間した出現位置「８６１４」，「８６１５」に
対応する単語を単語出現位置辞書３から調べて、正解文
字列を作る。出現位置「８６１４」に対応する単語は
「は」（図示せず）、出現位置「８６１５」に対応する
単語は「介護」（図示せず）であり、正解文字列「は介
護」を作成する。

【００４１】上記の通りに正解文字列を作成するとステ
ップＳ７３６に進み、正解文字列を根拠として誤り候補
の正誤判定を行う。すなわち、正解文字列に存在する誤
り候補の認識単語を「正解」とし、正解文字列に出現し
ない誤り候補の認識単語を「誤り」とする。この様に、
事前原稿データベース１の一文を前述の通りに正解文と
仮定し、正解文に存在しない認識単語を認識誤りとみな
すことで、誤り検出の手順を単純化している。

【００４２】図５の具体例では、誤り候補の単語列７６
における「和解」と「後」は、ともに正解文字列「は介
護」に存在しない。したがって、ともに「誤り」として
検出する。

【００４３】正誤判定に続いてステップＳ７３７では、
その判定結果を認識誤り検出結果８に出力する。文頭か
ら順に、「正解」または「誤り」と判定した単語を認識
誤り検出結果８に出力し、ここで「誤り」の単語には、
図示の通りに「正解」の単語と識別する記号８５を併記
する。

【００４４】認識誤り検出に続いてステップＳ７３８
で、認識結果６の認識結果が文末に到達して一つ文の文
として完了したか判断し、文末に到達した場合は、ここ
で処理を終了する。文末に到達していない場合はステッ
プＳ７３１の処理に戻り、出現位置リスト７２が更新さ
れるまで待ち、更新された出現位置リスト７２にしたが
って同様に認識誤り検出を行う。

【００４５】本実施形態によれば、単語列の最大一致長
を与える事前原稿データベース１の文が一つに特定され
る時点で正解文を決定できるので、必ずしも認識結果６
が文末に到達するまで待つ必要がない。すなわち、認識
結果６が文末に到達していなくても、正解文を決定した
時点で直ちに認識誤り検出結果８が得られるので、迅速
な処理を行うことができる。

【００４６】

【発明の効果】以上説明した通り本発明によれば、音声
認識手段による認識結果が文末に到達するのを待つこと
なく、事前原稿データベースの文から正解文が決定した
時点で逐次、認識誤りを検出することができるので、迅
速に認識誤り検出を行える効果がある。また、認識誤り
の逐次検出を行えるため、事前原稿にしたがって番組を
進行する生放送等において、原稿にしたがった発言を音
声認識してリアルタイムでスーパーインポーズを付与す
る場合にも、認識結果に含まれる誤りの発見作業を効率
化できる効果がある。

【図面の簡単な説明】

【図１】本発明に係る音声認識誤り検出装置の一実施形
態の全体構成を示す構成図である。

【図２】本発明に係る音声認識誤り検出装置の一実施形
態における単語分割器の処理手順を表すフローチャート
と動作説明図である。

【図３】本発明に係る音声認識誤り検出装置の一実施形
態における出現位置辞書作成部の処理手順を表すフロー
チャートと動作説明図である。

【図４】本発明に係る音声認識誤り検出装置の一実施形
態における一致単語列推定部の処理手順を表すフローチ
ャートと動作説明図である。

【図５】本発明に係る音声認識誤り検出装置の一実施形
態における認識誤り検出部の処理手順を表すフローチャ
ートと動作説明図である。

【符号の説明】

１事前原稿データベース２事前原稿処理部３単語出現位置辞書４音声入力５音声認識装置６認識結果７認識結果処理部８認識誤り検出結果２１単語分割器２２分割済みテキストデータ２３単語出現位置辞書作成部７１一致単語列推定部７２出現位置リスト７３認識誤り検出部

───────────────────────────────────────────────────── フロントページの続き (72)発明者尾上和穂東京都世田谷区砧一丁目10番11号日本放送協会放送技術研究所内 (72)発明者今井亨東京都世田谷区砧一丁目10番11号日本放送協会放送技術研究所内 (72)発明者田中英輝東京都世田谷区砧一丁目10番11号日本放送協会放送技術研究所内 (72)発明者安藤彰男東京都世田谷区砧一丁目10番11号日本放送協会放送技術研究所内Ｆターム(参考） 5D015 AA01 LL01

Claims

【特許請求の範囲】

【請求項１】音声入力の元となる原稿を保持する事前
原稿データベースから所定の原稿を読み出し、前記所定
の原稿における単語の情報を単語辞書に記録する単語辞
書作成手段と、前記所定の原稿の音声入力の音声認識手段による認識結
果と前記単語辞書を入力し、前記単語の情報に基づい
て、前記認識結果に最も類似した前記事前原稿データベ
ース中の文を基準として前記認識結果における認識誤り
を検出する検出手段とを備えたことを特徴とする音声認
識誤り検出装置。
【請求項２】請求項１に記載の音声認識誤り検出装置
において、前記単語辞書作成手段は、前記事前原稿データベース中の文を単語単位に分割する
手段と、前記分割した単語を、その出現する文番号、出現位置と
ともに前記単語辞書に記録する手段とを備えたことを特
徴とする音声認識誤り検出装置。
【請求項３】請求項２に記載の音声認識誤り検出装置
において、前記検出手段は、前記認識結果の単語について、連続する長さが最長の単
語出現位置の組の文番号、出現位置を前記認識結果の単
語とともに出現位置リストに記録する手段と、前記単語辞書と前記出現位置リストを入力し、前記出現
位置リストに最も多く出現する文番号を正解文の文番号
と仮定する手段と、前記正解文の文番号に基づいて前記認識結果における認
識誤りを検出する誤り検出手段とを備えたことを特徴と
する音声認識誤り検出装置。
【請求項４】請求項３に記載の音声認識誤り検出装置
において、前記誤り検出手段は、前記出現位置リストと前記正解文
の各文番号が異なる単語を誤り候補とし、前記誤り候補
の前後の単語の出現位置から前記誤り候補に対応する正
解単語を前記単語辞書を調べて正解文字列を作成するこ
とを特徴とする音声認識誤り検出装置。
【請求項５】音声入力の元となる原稿を保持する事前
原稿データベースから所定の原稿を読み出し、前記所定
の原稿における単語の情報を単語辞書に記録する単語辞
書作成ステップと、前記所定の原稿の音声入力に対して音声認識処理を行う
音声認識ステップと、前記音声認識ステップにおける認識結果と前記単語辞書
を入力し、前記単語の情報に基づいて、前記認識結果に
最も類似した前記事前原稿データベース中の文を基準と
して前記認識結果における認識誤りを検出する検出ステ
ップとを備えたプログラムをコンピュータに読み取り可
能に記憶したことを特徴とする記憶媒体。
【請求項６】請求項５に記載の記憶媒体において、前記単語辞書作成ステップは、前記事前原稿データベース中の文を単語単位に分割する
ステップと、前記分割した単語を、その出現する文番号、出現位置と
ともに前記単語辞書に記録するステップとを備えたこと
を特徴とする記憶媒体。
【請求項７】請求項６に記載の記憶媒体において、前記検出ステップは、前記認識結果の単語について、連続する長さが最長の単
語出現位置の組の文番号、出現位置を前記認識結果の単
語とともに出現位置リストに記録するステップと、前記単語辞書と前記出現位置リストを入力し、前記出現
位置リストに最も多く出現する文番号を正解文の文番号
と仮定するステップと、前記正解文の文番号に基づいて前記認識結果における認
識誤りを検出する誤り検出ステップとを備えたことを特
徴とする記憶媒体。
【請求項８】請求項７に記載の記憶媒体において、前記誤り検出ステップにおいて、前記出現位置リストと
前記正解文の各文番号が異なる単語を誤り候補とし、前
記誤り候補の前後の単語の出現位置から前記誤り候補に
対応する正解単語を前記単語辞書を調べて正解文字列を
作成することを特徴とする記憶媒体。