JP2000089786A

JP2000089786A - 音声認識結果の修正方法および装置

Info

Publication number: JP2000089786A
Application number: JP10254377A
Authority: JP
Inventors: Kazuho Onoe; 和穂尾上; Toru Imai; 亨今井; Akio Ando; 彰男安藤
Original assignee: Nippon Hoso Kyokai NHK; Japan Broadcasting Corp
Current assignee: Japan Broadcasting Corp
Priority date: 1998-09-08
Filing date: 1998-09-08
Publication date: 2000-03-31

Abstract

(57)【要約】【課題】音声認識結果の修正労力を低減する。【解決手段】放送前に作成されたニュース元原稿と、
放送に使用された原稿についての音声認識結果とを比較
し、不一致部分を検出する。ニュース元原稿の不一致部
分を音声認識結果の不一致部分と置換する処理を認識結
果修正部２で行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声認識結果を修
正するための音声認識結果の自動修正方法および装置に
関する。

【０００２】

【従来の技術】従来、音声認識装置により音声認識され
た結果（文字列）を修正する場合は、音声認識結果を表
示装置の画面に表示させたり、印刷装置により印刷し
て、表示または印刷結果をチェック者が目視により確認
する。

【０００３】その後、コンピュータのワープロ（文書編
集）機能を使用して、音声認識結果を文書編集（文字列
の変更，削除，挿入等）を行い、音声認識結果を修正す
る。

【０００４】

【発明が解決しようとする課題】チェック者が音声認識
結果を修正する場合、目視確認とキーボード等を利用し
た文書編集操作を伴うので、チェック者にとっては非常
に煩雑であり、大変な労力を要する。

【０００５】そこで、本発明の第１の目的は、上述の点
に鑑みて、音声認識結果を自動修正することのできる音
声認識結果の修正方法および装置を提供することにあ
る。

【０００６】本発明の第２の目的は、音声認識結果のチ
ェックに関連するチェック者の操作労力を軽減すること
の可能な音声認識結果の修正方法および装置を提供する
ことにある。

【０００７】

【課題を解決するための手段】上記第１の目的を達成す
るために、請求項１の発明は、最終決定した第１原稿に
ついて発声された音声を音声認識装置により音声認識
し、その音声認識結果を修正する音声認識結果の修正方
法において、最終決定前の第２原稿と前記音声認識結果
とを情報処理装置により比較することにより前記第２原
稿および前記音声認識結果の不一致部分を検出し、当該
検出された第２原稿側の不一致部分を音声認識結果の不
一致部分と置換することにより音声認識結果を修正する
ことを特徴とする。

【０００８】請求項２の発明は、請求項１に記載の音声
認識結果の修正方法において、前記情報処理装置はさら
に前記不一致部分の長さを計数し、その計数結果が一定
長さよりも小さい場合に前記置換を行うことを特徴とす
る。

【０００９】請求項３の発明は、請求項１に記載の音声
認識結果の修正方法において、前記第２原稿と前記音声
認識結果との比較に、音響スコアを使用することを特徴
とする。

【００１０】請求項４の発明は、請求項１に記載の音声
認識結果の修正方法において、前記第２原稿と前記音声
認識結果との比較に、言語スコアを使用することを特徴
とする。

【００１１】上記第２の目的を達成するために、請求項
５の発明は、最終決定した第１原稿について発声された
音声を音声認識装置により音声認識し、その音声認識結
果を修正する音声認識結果の修正方法において、最終決
定前の複数の第２原稿がデータベースの形態で情報処理
装置に記憶されており、前記音声認識結果を前記情報処
理装置に入力し、前記情報処理装置は、当該入力された
音声認識結果と最も類似する第２原稿を前記データベー
スから取り出すことを特徴とする。

【００１２】請求項６に記載の発明は、請求項５に記載
の音声認識結果の修正方法において、最も類似する第２
原稿の取り出しのために動的計画法を使用することを特
徴とする。

【００１３】請求項７に記載の発明は、請求項６に記載
の音声認識結果の修正方法において、前記動的計画法で
は単語単位で前記音声認識結果と前記データベース上の
第２原稿との照合を行うことを特徴とする。

【００１４】請求項８に記載の発明は、最終決定した原
稿について発声された音声を音声認識装置により音声認
識し、その音声認識結果を修正する音声認識結果の修正
装置において、最終決定前の第２原稿と前記音声認識結
果とを比較することにより前記第２原稿および前記音声
認識結果の不一致部分を検出する手段と、当該検出され
た第２原稿側の不一致部分を音声認識結果の不一致部分
と置換することにより音声認識結果を修正する手段とを
具えたことを特徴とする。

【００１５】請求項９に記載の発明は、請求項８に記載
の音声認識結果の修正装置において、前記情報処理装置
はさらに前記不一致部分の長さを計数する手段を有し、
その計数結果が一定長さよりも小さい場合に前記置換を
行うことを特徴とする。

【００１６】請求項１０に記載の発明は、請求項８に記
載の音声認識結果の修正装置において、前記不一致部分
を検出する手段は、前記第２原稿と前記音声認識結果と
の比較に、音響スコアを使用することを特徴とする。

【００１７】請求項１１に記載の発明は、請求項８に記
載の音声認識結果の修正装置において、前記不一致部分
を検出する手段は、前記第２原稿と前記音声認識結果と
の比較に、言語スコアを使用することを特徴とする。

【００１８】請求項１２に記載の発明は、最終決定した
第１原稿について発声された音声を音声認識装置により
音声認識し、その音声認識結果を修正する音声認識結果
の修正装置において、最終決定前の複数の第２原稿をデ
ータベースの形態で記憶する手段と、前記音声認識結果
を入力する手段と、当該入力された音声認識結果と最も
類似する第２原稿を前記データベースから取り出す手段
とを具えたことを特徴とする。

【００１９】請求項１３に記載の発明は、請求項１２に
記載の音声認識結果の修正装置において、最も類似する
原稿の取り出しのために動的計画法を使用することを特
徴とする。

【００２０】請求項１４に記載の発明は、請求項１３に
記載の音声認識結果の修正装置において、前記動的計画
法では単語単位で前記音声認識結果と前記データベース
上の第２原稿との照合を行うことを特徴とする。

【００２１】

【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。

【００２２】最初に本発明を適用した音声認識結果の自
動修正方法について説明する。

【００２３】（ａ）放送における原稿ニュースでは、アナウンサーが放送中に直接読む、アナ
ウンサー原稿と、あらかじめ放送前に、記者が入力して
電子化された記者原稿がある。ニュース項目の１つに対
して、いろいろな切り口で書かれた、複数の記者原稿が
存在し、それをアナウンサーが読むために紙に印刷し、
放送に入る直前まで、アナウンサー本人やディレクター
らによって、手書きで加筆や訂正が行われている。

【００２４】自動字幕化のために、直接記者原稿を用い
ることができないのは、放送に入る直前まで行われる手
書きの修正に対して、記者原稿を訂正する時間的な余裕
がなく、また、記者原稿にないアドリブにも対応できな
いからである。

【００２５】ニュースでのアナウンサーの発声１文と記
者原稿との対応関係は、以下のように大別できる。

【００２６】（１）アナウンサーの発声１文に対して、
記者原稿の１文が対応する場合（２）アナウンサーの発声１文に対して、記者原稿の複
数の文が対応する場合（３）アナウンサーの発声１文に対して、記者原稿が存
在しない場合上記対応の割合は約７：１：２になっており、まったく
同じではないにしろ、８割は元の記者原稿が存在してい
る。

【００２７】（ｂ）認識結果の修正法ニュース音声認識結果の修正は、以下の二段階で行う。
まず第一段階として、ニュース音声の認識結果を利用し
て、この元になったと思われる記者原稿の文を検出す
る。第二段階として、検出された記者原稿の文を利用し
て、認識結果の単語の入れ替えを行う。

【００２８】（ｂ）−１認識結果に対応する元原稿の
検出認識結果に対応する記者原稿を検出するために、文単位
のＤＰマッチングを行う。同じ放送日の記者原稿をすべ
て形態素解析して単語に分割し、最も認識結果との類似
度の高い文を、対応する元の文とみなすことにする。

【００２９】文単位の類似度を、単語単位の類似度と、
単語間の遷移スコアの総和が最大のものとする。文Ｗ１
Ｗ２Ｗ３…Ｗｎにおける、単語ＷｉからＷｊへの遷移ス
コアＴは、

【００３０】

【数１】

【００３１】とした。但し、Ｓは遷移スコアの最大値、
αは距離によって減少する値である。

【００３２】単語単位の類似度は、文字単位の類似度か
ら求める。単語ＡとＢの類似度Ｗ（Ａ，Ｂ）は、

【００３３】

【数２】

【００３４】とした。但し、ｍ，ｎはそれぞれ単語ＡＢ
間で、ｍは平仮名のマッチングした文字数、ｎは平仮名
以外の文字のマッチングした文字数である。定数Ｈ，Ｋ
はそれぞれ、平仮名のマッチングスコア、平仮名以外の
文字のマッチングスコアである。なお、文字間の遷移に
ついてはスコアを与えていない。

【００３５】対応する文が存在するかしないかの判定に
は、しきい値を用いた。認識結果の単語数をＮとする
と、しきい値θは

【００３６】

【数３】θ＝Ｎ・（Ｈ＋Ｋ）／２とした。

【００３７】（ｂ）−２対応する原稿による認識結果
の修正認識結果の修正法は、マッチングした単語の間を原稿の
単語で順次埋めていく形をとった。これにより、未知語
として認識できなかった単語も認識結果に加えることが
可能になる。ただし、原稿内に実際には読まれていない
単語の挿入を防ぐために、置換する両者の単語数の差が

【００３８】

【数４】｜Ｃ１−Ｃ２｜＜Ｌである時のみ置換を行った。ここで、置換する認識結果
の単語数をＣ１、元原稿の単語数をＣ２とした。また、
認識結果と記者原稿のＤＰマッチングでは始点と終点を
フリーとしたので、認識結果の文頭と文末の単語がマッ
チングしなかった時には、認識結果をそのまま使用し
た。

【００３９】（ｃ）実験（ｃ）−１実験条件実験には、平成８年６月４日のある放送局のニュースの
音声認識結果５３文（総単語数１，８０４）（小林ほ
か、“ニュース音声認識システムの検討”音講論集，３
−１−９，ｐｐ．１０３−１０４（１９９７．９）と、
同日の記者原稿データベースを使用した。修正前の認識
結果は、単語正解精度６７．２％である。

【００４０】（ｃ）−２実験結果まず、文字のマッチングスコアを、設定するためにＨと
Ｋの重みを変化させて対応する文の検出に最適な値を調
べた。ただし、単語間の遷移スコアＳについては、平仮
名のマッチングスコアＨと同値となるようにし、Ｌは５
単語以内の差は許すとして、Ｌ＝５とした。その結果を
表１に示す。

【００４１】

【表１】

【００４２】平仮名以外（漢字、カタカナなど）の文字
と平仮名ではマッチングスコアには３倍（Ｋ＝３＊Ｈ）
の差をつけた場合が今回はよかった。表２に詳しく示
す。

【００４３】その結果、認識結果と原稿との対応関係は
元原稿が無い場合も含めて、９０．６％正しく検出でき
た。文字のマッチングスコアを変化させてみると、今回
のように漢字やカタカナにある程度、重点を置いた場合
が有効であることがわかった。検出に失敗したものは、
ほとんど認識時の正解精度の低いものであった。また、
認識結果が短いほど、誤った文を検出しやすい。検出誤
りの内、１文は原稿中の複数の文に対応していたため、
対応文が無いと判定された。

【００４４】

【表２】

【００４５】次に、提案手法で音声認識結果を修正し
た。その結果、表３に示すように、１４．３％の改善が
みられた。

【００４６】中には、認識結果に含まれていなかった未
知語が加えられ、改善された場合が見られた。もともと
の認識結果とほとんど認識精度が変わらないものでも、
原稿の単語に入れ替えられているために、より日本語の
文として意味の通るものになっている。しかし、記者原
稿の表記の違いや誤字については無条件で修正されてし
まったり、原稿の前後の順番を入れ替えて作られたアナ
ウンサー原稿を修正できない、などの問題点がある。

【００４７】

【表３】

【００４８】（ｄ）まとめ記者原稿を用いて認識結果を修正することで、認識精度
の改善が見られた。今回は、文ごとに検出したので複数
文にわたる認識結果には対応していない。また、単に原
稿の文字について比較し修正を行ったが、精度向上のた
めに、音響的なスコアを利用したり、認識結果の単語間
のｂｉ−ｇｒａｍなどを使用して修正を行なうことがで
きる。

【００４９】次に本発明を適用した音声認識結果の自動
修正装置について説明する。

【００５０】（実施形態１）図１は本発明実施形態１の
システム構成を示す。なお、自動修正装置はコンピュー
タ等の情報処理装置が後述の処理を規定したプログラム
を実行することによっても実現することができる。図１
において、自動修正装置は、元原稿データベース中で音
声認識結果に最も類似した文章を検出する「類似文章検
出部」１と、類似文章によって音声認識結果を修正する
「認識結果修正部」２を有する。

【００５１】次に、類似文章検出部１について、図２を
参照して説明する。類似文章検出部１は、まず照合スコ
ア計算部１１において、あらかじめ形態素解析によって
単語単位に分割された自動修正装置内の元原稿データベ
ースを用いて、音声認識結果と元原稿の各文章を単語単
位に動的計画法（ＤＰとも呼ばれる）で照合し、照合ス
コアを求める。この際、照合スコアは平仮名と平仮名以
外の文字について、照合が一致した場合のスコアに数倍
の差をつけ、また、単語間の遷移スコアは照合距離に反
比例するものとする。たとえばこの実施形態において、
動的計画法の照合スコアをＰ、各単語どうしのマッチン
グの照合スコアをＷ、単語間の遷移スコアをＴとする
と、Ｐ＝Σ（Ｗ＋Ｔ）と表現できる。また、文Ｗ１Ｗ２
Ｗ３…Ｗｎにおける、単語ＷｉからＷｊへの遷移スコア
Ｔは、

【００５２】

【数５】

【００５３】但し、Ｓは遷移スコアの最大値、αは距離
によって減少する値である。また、単語単位の照合スコ
アは、単語ＡとＢの照合スコアＷ（Ａ，Ｂ）は、

【００５４】

【数６】

【００５５】となる。但しｍ，ｎはそれぞれ単語ＡＢ間
で、ｍは平仮名のマッチングした文字数、ｎは平仮名以
外の文字の照合が一致した文字数である。定数Ｈ，Ｋは
それぞれ、平仮名の照合スコア、平仮名以外の文字の照
合スコアである。

【００５６】類似文章判定部１２では、最大の照合スコ
アを示す元原稿について、音声認識結果の単語数に比例
した閾値以上であれば、その元原稿を音声認識結果の類
似文章とみなし、そうでなければ類似文章が存在しない
ものとみなす。たとえば、実施形態の場合、認識結果の
単語数をＮとすると、しきい値θは、θ＝Ｎ・（Ｈ＋
Ｋ）／２と表現できる。

【００５７】次に、認識結果修正部２について、図３を
参照して説明する。類似文章検出部１で類似文章が存在
すると判定された場合、単語不一致区間検出部２１にお
いて、音声認識結果と類似文章の単語が一致しない区間
を検出する。次に置換判定部２２において、不一致区間
の音声認識結果と類似文章の各々の単語数の差がある一
定数以下である場合、音声認識結果の単語を類似文章の
単語で置換する。たとえば、置換する両者の単語数の差
は置換する認識結果の単語数をＣ１、元原稿の単語数を
Ｃ２とする場合、｜Ｃ１−Ｃ２｜＜Ｌと表現することが
できる。

【００５８】以上の処理をコンピュータで実行するため
のプログラムの処理内容を図４に参考のために示してお
く。説明が上述の説明と重複する箇所についてはその説
明を簡単に留める。

【００５９】修正対象の音声認識結果は、通信，フロッ
ピーディスク，キーボード等の入力装置から入力され、
コンピュータ内のメモリに格納される（ステップＳ１
０）。比較の対象となる原稿はこの実施形態ではコンピ
ュータ内にデータベースから与えられるが、予め対応す
る原稿が判明している場合は通信，フロッピーディス
ク，キーボード等の入力装置から与えてもよい。本実施
形態では音声認識結果と対応する原稿をも自動検出す
る。

【００６０】最初にデータベースから取り出された原稿
と修正対象の音声の認識結果との照合を上述の動的計画
法で行う（ステップＳ２０〜Ｓ４０）。動的計画法を使
用すると、単語同士の類似度を計算するだけでなく、連
続する単語列についての類似度についても計算（各単語
の類似度を重み付けして加算、数１，数２式参照）する
ので、一致する単語が多く、かつ、その単語の並びの順
序が一致する場合ほど照合スコアは高くなる。

【００６１】得られた照合スコアを認識結果の単語数か
ら定めた閾値と比較し、データベースから取り出した原
稿が音声認識結果と対応するか否かを判定する（ステッ
プＳ５０）。

【００６２】閾値よりも照合スコアが低い場合には、デ
ータベースから取り出した原稿は、音声認識結果とは対
応しないので（ステップＳ５０でＮＯ判定）、次の原稿
と音声認識結果を照合すべく、ステップＳ９０を経由し
て、ステップＳ２０へ手順を戻す。

【００６３】これにより、次の原稿がコンピュータによ
り（正確にはＣＰＵ）データベースから取り出されて、
照合が行なわれる。このような処理を繰り返し、対応す
る原稿がデータベースから取り出されると、その原稿の
照合スコアは閾値よりも高くなる（ステップＳ５０がＹ
ＥＳ判定）、これにより手順は、ステップＳ６０に進
み、音声認識結果と、現在の原稿の文章とを比較するこ
とにより不一致の単語列部分を検出する。

【００６４】また、不一致の単語部分の単語数を計数す
る。この単語数が一定数以下の場合には、不一致部分の
原稿側の単語列で、音声認識側の不一致部分の文字列を
置換する（ステップＳ７０→Ｓ８０）。

【００６５】一方上記不一致部分の単語数が一定値より
も多い場合には、音声認識結果に誤認識があるのではな
く、元原稿が修正されて、放送されたと判定して、置換
処理は行なわず、別の原稿をデータベースから取り出す
（ステップＳ７０→、Ｓ９０→Ｓ２０）。

【００６６】なお、上述のステップＳ２０〜Ｓ９０の処
理を繰り返し実行しても照合スコアが閾値以上で、か
つ、不一致の単語数が一定数以下となるデータベース上
の原稿が見つからなかった場合には、手順を終了する
（ステップＳ９０のＹＥＳ判定→終了）。

【００６７】以上の処理を実行することにより、音声認
識結果の自動修正が可能となるとともに、単語あるいは
文字の修正に用いる原稿をデータベースから自動的に検
出することも可能となる。

【００６８】（実施形態２）図５には、認識結果修正部
２のもう一つの実施形態を示す。これは、図３の認識結
果修正部に「音響スコアおよび言語スコア計算部」３２
を加え、テキストの表記を単純に置き換えるのではな
く、修正後のテキストが音響的にも言語的にもより正し
いかどうかを、認識対象音声を用いて詳細に判定するも
のである。まず、単語不一致区間検出部３１において、
音声認識結果と類似文章の単語不一致区間を求める。次
に音響スコアおよび言語スコア計算部３２において、音
声認識結果および類似文章の単語不一致区間に存在する
すべての単語を用いて単語ネットワークを作成し、認識
対象音声の音響スコアおよび／または言語スコアを計算
する。最後に置換判定部３３において、音響スコアと言
語スコアの重み付け和が最大となる単語列で、音声認識
結果の単語不一致区間を置換する。

【００６９】なお音響スコアまたは言語スコアのいずれ
か一方のみを使用して単語不一致区間を置換することも
できる。

【００７０】このための実際例としては、実施形態１の
ステップＳ７０の単語数によって置換を判定している部
分（置換判定部２２）を、再度、認識結果と類似文章の
不一致区間の単語のみで、対応する音声区間を音声認識
装置にかけ音響スコアと言語スコアを計算したものと、
もともとの認識結果が認識時に得た不一致区間の音響ス
コアと言語スコアを比較して置換するもの（音響スコア
および言語スコア計算部３２・置換判定部３３）に置き
換えたものである。ここで、用いている音響スコアとは
連続音声認識装置で使用しているＨＭＭと不一致区間に
対応する音声との計算したスコアであり、また、言語ス
コアとは各７年間の原稿を利用し音声認識装置用にあら
かじめ学習した、単語連鎖確率を統計的に計算したｂｉ
−ｇｒａｍ・ｔｒｉ−ｇｒａｍのことを示す。

【００７１】認識結果の類似原稿との不一致区間の、も
ともとの認識時にえた音響スコアと言語スコアの合計を
Ｐとし、認識結果と類似文章の不一致区間の単語のみを
使用して不一致区間に対応する音声に対して音声認識装
置が出力した音響スコアと言語スコアの合計をＰｒ（音
響スコアおよび言語スコア計算部）とすると、Ｐ＜Ｐｒ
の時のみ（置換判定部３３）不一致区間に対応する音声
に対して行った音声認識装置の出力結果を不一致区間の
正解とみなし置換する。

【００７２】本実施形態の他に次の形態を実施できる。

【００７３】１）上述の実施形態では音声認識を自動修
正する例を示したが、チェック者が音声認識結果と類似
する原稿をデータベースから取り出したいときには上述
の動的計画法を使用した類似度の計算を行って、最も類
似する原稿を検出し、その原稿をプリンタにより印刷し
たり、表示器に表示させることもできる。この場合に
は、チェック者は、表示、あるいは印刷出力を見て音声
認識結果を手動で修正するが、チェックの基となる原稿
を自動的にデータベースから取り出すことができるの
で、原稿の検索にかかわる操作から開放される。

【００７４】２）さらに上述した実施形態において、修
正の基となった原稿および音声認識結果をともに表示さ
せ、音声認識結果の修正された個所を他の部分と異なる
色で表示すると、チェック者は修正個所を目視確認する
ことができる。

【００７５】３）上述の実施形態で述べたコンピュータ
にはパソコン，ワークステーション，ワープロ等各種の
情報処理装置を使用することができる。

【００７６】

【発明の効果】以上、説明したように、請求項１，８の
発明によれば、最終決定前の第２原稿は最終決定した原
稿と共通部分が多い点、および最終決定した第１原稿を
放送するまでの間に第２原稿を電子化（文書として情報
処理装置に入力すること）している点に着目し、第１原
稿の音声認識結果と第２原稿とを比較することで、音声
認識結果を速やかに自動修正することができる。

【００７７】請求項２，９の発明では不一致部の長さ、
たとえば、文字数や単語数などの長さを計数すること
で、不一致部分が音声の誤認識により発生したものか、
第２原稿から第１原稿を作成する際に加えられた変更か
を区別することができるので、誤認識別部分を自動検出
することができる。

【００７８】請求項３，４，１０，１１の発明では、さ
らに音響スコアや言語スコアを加味することにより誤認
識部分を精度よく検出することができる。

【００７９】請求項５〜７，１２〜１４の発明は、動的
計画法により第２原稿の文章を音声認識結果と比較する
ことで、原稿の類似度を計算することができる点に着目
して、最も音声認識結果と類似する原稿をデータベース
から自動的に取り出すことにより、操作者はデータベー
スの検索に関わる操作から解放される。

【図面の簡単な説明】

【図１】本発明実施形態１の構成を示すブロック図であ
る。

【図２】類似文章検出部１の構成を示すブロック図であ
る。

【図３】認識結果修正部２の構成を示すブロック図であ
る。

【図４】音声認識結果の自動修正処理手順を示すフロー
チャートである。

【図５】実施形態２の構成を示すブロック図である。

【符号の説明】

１類似文章検出部２認識結果修正部１１照合スコア計算部１２類似文章判定部２１，３１単語不一致区間検出部２２，３３置換判定部３２置換判定部

Claims

【特許請求の範囲】

【請求項１】最終決定した第１原稿について発声され
た音声を音声認識装置により音声認識し、その音声認識
結果を修正する音声認識結果の修正方法において、最終決定前の第２原稿と前記音声認識結果とを情報処理
装置により比較することにより前記第２原稿および前記
音声認識結果の不一致部分を検出し、当該検出された第２原稿側の不一致部分を音声認識結果
の不一致部分と置換することにより音声認識結果を修正
することを特徴とする音声認識結果の修正方法。
【請求項２】請求項１に記載の音声認識結果の修正方
法において、前記情報処理装置はさらに前記不一致部分の長さを計数
し、その計数結果が一定長さよりも小さい場合に前記置
換を行うことを特徴とする音声認識結果の修正方法。
【請求項３】請求項１に記載の音声認識結果の修正方
法において、前記第２原稿と前記音声認識結果との比較に、音響スコ
アを使用することを特徴とする音声認識結果の修正方
法。
【請求項４】請求項１に記載の音声認識結果の修正方
法において、前記第２原稿と前記音声認識結果との比較に、言語スコ
アを使用することを特徴とする音声認識結果の修正方
法。
【請求項５】最終決定した第１原稿について発声され
た音声を音声認識装置により音声認識し、その音声認識
結果を修正する音声認識結果の修正方法において、最終決定前の複数の第２原稿がデータベースの形態で情
報処理装置に記憶されており、前記音声認識結果を前記情報処理装置に入力し、前記情報処理装置は、当該入力された音声認識結果と最も類似する第２原稿を
前記データベースから取り出すことを特徴とする音声認
識結果の修正方法。
【請求項６】請求項５に記載の音声認識結果の修正方
法において、最も類似する第２原稿の取り出しのために
動的計画法を使用することを特徴とする音声認識結果の
修正方法。
【請求項７】請求項６に記載の音声認識結果の修正方
法において、前記動的計画法では単語単位で前記音声認
識結果と前記データベース上の第２原稿との照合を行う
ことを特徴とする音声認識結果の修正方法。
【請求項８】最終決定した原稿について発声された音
声を音声認識装置により音声認識し、その音声認識結果
を修正する音声認識結果の修正装置において、最終決定前の第２原稿と前記音声認識結果とを比較する
ことにより前記第２原稿および前記音声認識結果の不一
致部分を検出する手段と、当該検出された第２原稿側の不一致部分を音声認識結果
の不一致部分と置換することにより音声認識結果を修正
する手段とを具えたことを特徴とする音声認識結果の修
正装置。
【請求項９】請求項８に記載の音声認識結果の修正装
置において、前記情報処理装置はさらに前記不一致部分の長さを計数
する手段を有し、その計数結果が一定長さよりも小さい
場合に前記置換を行うことを特徴とする音声認識結果の
修正装置。
【請求項１０】請求項８に記載の音声認識結果の修正
装置において、前記不一致部分を検出する手段は、前記第２原稿と前記
音声認識結果との比較に、音響スコアを使用することを
特徴とする音声認識結果の修正装置。
【請求項１１】請求項８に記載の音声認識結果の修正
装置において、前記不一致部分を検出する手段は、前記第２原稿と前記
音声認識装置との比較に、言語スコアを使用することを
特徴とする音声認識結果の修正装置。
【請求項１２】最終決定した第１原稿について発声さ
れた音声を音声認識装置により音声認識し、その音声認
識結果を修正する音声認識結果の修正装置において、最
終決定前の複数の第２原稿をデータベースの形態で記憶
する手段と、前記音声認識結果を入力する手段と、当該入力された音声認識結果と最も類似する第２原稿を
前記データベースから取り出す手段とを具えたことを特
徴とする音声認識結果の修正装置。
【請求項１３】請求項１２に記載の音声認識結果の修
正装置において、最も類似する原稿の取り出しのために
動的計画法を使用することを特徴とする音声認識結果の
修正装置。
【請求項１４】請求項１３に記載の音声認識結果の修
正装置において、前記動的計画法では単語単位で前記音
声認識結果と前記データベース上の第２原稿との照合を
行うことを特徴とする音声認識結果の修正装置。