JP2000089786A - 音声認識結果の修正方法および装置 - Google Patents

音声認識結果の修正方法および装置

Info

Publication number
JP2000089786A
JP2000089786A JP10254377A JP25437798A JP2000089786A JP 2000089786 A JP2000089786 A JP 2000089786A JP 10254377 A JP10254377 A JP 10254377A JP 25437798 A JP25437798 A JP 25437798A JP 2000089786 A JP2000089786 A JP 2000089786A
Authority
JP
Japan
Prior art keywords
recognition result
speech recognition
correcting
document
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10254377A
Other languages
English (en)
Inventor
Kazuho Onoe
和穂 尾上
Toru Imai
亨 今井
Akio Ando
彰男 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP10254377A priority Critical patent/JP2000089786A/ja
Publication of JP2000089786A publication Critical patent/JP2000089786A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識結果の修正労力を低減する。 【解決手段】 放送前に作成されたニュース元原稿と、
放送に使用された原稿についての音声認識結果とを比較
し、不一致部分を検出する。ニュース元原稿の不一致部
分を音声認識結果の不一致部分と置換する処理を認識結
果修正部2で行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識結果を修
正するための音声認識結果の自動修正方法および装置に
関する。
【0002】
【従来の技術】従来、音声認識装置により音声認識され
た結果(文字列)を修正する場合は、音声認識結果を表
示装置の画面に表示させたり、印刷装置により印刷し
て、表示または印刷結果をチェック者が目視により確認
する。
【0003】その後、コンピュータのワープロ(文書編
集)機能を使用して、音声認識結果を文書編集(文字列
の変更,削除,挿入等)を行い、音声認識結果を修正す
る。
【0004】
【発明が解決しようとする課題】チェック者が音声認識
結果を修正する場合、目視確認とキーボード等を利用し
た文書編集操作を伴うので、チェック者にとっては非常
に煩雑であり、大変な労力を要する。
【0005】そこで、本発明の第1の目的は、上述の点
に鑑みて、音声認識結果を自動修正することのできる音
声認識結果の修正方法および装置を提供することにあ
る。
【0006】本発明の第2の目的は、音声認識結果のチ
ェックに関連するチェック者の操作労力を軽減すること
の可能な音声認識結果の修正方法および装置を提供する
ことにある。
【0007】
【課題を解決するための手段】上記第1の目的を達成す
るために、請求項1の発明は、最終決定した第1原稿に
ついて発声された音声を音声認識装置により音声認識
し、その音声認識結果を修正する音声認識結果の修正方
法において、最終決定前の第2原稿と前記音声認識結果
とを情報処理装置により比較することにより前記第2原
稿および前記音声認識結果の不一致部分を検出し、当該
検出された第2原稿側の不一致部分を音声認識結果の不
一致部分と置換することにより音声認識結果を修正する
ことを特徴とする。
【0008】請求項2の発明は、請求項1に記載の音声
認識結果の修正方法において、前記情報処理装置はさら
に前記不一致部分の長さを計数し、その計数結果が一定
長さよりも小さい場合に前記置換を行うことを特徴とす
る。
【0009】請求項3の発明は、請求項1に記載の音声
認識結果の修正方法において、前記第2原稿と前記音声
認識結果との比較に、音響スコアを使用することを特徴
とする。
【0010】請求項4の発明は、請求項1に記載の音声
認識結果の修正方法において、前記第2原稿と前記音声
認識結果との比較に、言語スコアを使用することを特徴
とする。
【0011】上記第2の目的を達成するために、請求項
5の発明は、最終決定した第1原稿について発声された
音声を音声認識装置により音声認識し、その音声認識結
果を修正する音声認識結果の修正方法において、最終決
定前の複数の第2原稿がデータベースの形態で情報処理
装置に記憶されており、前記音声認識結果を前記情報処
理装置に入力し、前記情報処理装置は、当該入力された
音声認識結果と最も類似する第2原稿を前記データベー
スから取り出すことを特徴とする。
【0012】請求項6に記載の発明は、請求項5に記載
の音声認識結果の修正方法において、最も類似する第2
原稿の取り出しのために動的計画法を使用することを特
徴とする。
【0013】請求項7に記載の発明は、請求項6に記載
の音声認識結果の修正方法において、前記動的計画法で
は単語単位で前記音声認識結果と前記データベース上の
第2原稿との照合を行うことを特徴とする。
【0014】請求項8に記載の発明は、最終決定した原
稿について発声された音声を音声認識装置により音声認
識し、その音声認識結果を修正する音声認識結果の修正
装置において、最終決定前の第2原稿と前記音声認識結
果とを比較することにより前記第2原稿および前記音声
認識結果の不一致部分を検出する手段と、当該検出され
た第2原稿側の不一致部分を音声認識結果の不一致部分
と置換することにより音声認識結果を修正する手段とを
具えたことを特徴とする。
【0015】請求項9に記載の発明は、請求項8に記載
の音声認識結果の修正装置において、前記情報処理装置
はさらに前記不一致部分の長さを計数する手段を有し、
その計数結果が一定長さよりも小さい場合に前記置換を
行うことを特徴とする。
【0016】請求項10に記載の発明は、請求項8に記
載の音声認識結果の修正装置において、前記不一致部分
を検出する手段は、前記第2原稿と前記音声認識結果と
の比較に、音響スコアを使用することを特徴とする。
【0017】請求項11に記載の発明は、請求項8に記
載の音声認識結果の修正装置において、前記不一致部分
を検出する手段は、前記第2原稿と前記音声認識結果と
の比較に、言語スコアを使用することを特徴とする。
【0018】請求項12に記載の発明は、最終決定した
第1原稿について発声された音声を音声認識装置により
音声認識し、その音声認識結果を修正する音声認識結果
の修正装置において、最終決定前の複数の第2原稿をデ
ータベースの形態で記憶する手段と、前記音声認識結果
を入力する手段と、当該入力された音声認識結果と最も
類似する第2原稿を前記データベースから取り出す手段
とを具えたことを特徴とする。
【0019】請求項13に記載の発明は、請求項12に
記載の音声認識結果の修正装置において、最も類似する
原稿の取り出しのために動的計画法を使用することを特
徴とする。
【0020】請求項14に記載の発明は、請求項13に
記載の音声認識結果の修正装置において、前記動的計画
法では単語単位で前記音声認識結果と前記データベース
上の第2原稿との照合を行うことを特徴とする。
【0021】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。
【0022】最初に本発明を適用した音声認識結果の自
動修正方法について説明する。
【0023】(a)放送における原稿 ニュースでは、アナウンサーが放送中に直接読む、アナ
ウンサー原稿と、あらかじめ放送前に、記者が入力して
電子化された記者原稿がある。ニュース項目の1つに対
して、いろいろな切り口で書かれた、複数の記者原稿が
存在し、それをアナウンサーが読むために紙に印刷し、
放送に入る直前まで、アナウンサー本人やディレクター
らによって、手書きで加筆や訂正が行われている。
【0024】自動字幕化のために、直接記者原稿を用い
ることができないのは、放送に入る直前まで行われる手
書きの修正に対して、記者原稿を訂正する時間的な余裕
がなく、また、記者原稿にないアドリブにも対応できな
いからである。
【0025】ニュースでのアナウンサーの発声1文と記
者原稿との対応関係は、以下のように大別できる。
【0026】(1)アナウンサーの発声1文に対して、
記者原稿の1文が対応する場合 (2)アナウンサーの発声1文に対して、記者原稿の複
数の文が対応する場合 (3)アナウンサーの発声1文に対して、記者原稿が存
在しない場合 上記対応の割合は約7:1:2になっており、まったく
同じではないにしろ、8割は元の記者原稿が存在してい
る。
【0027】(b)認識結果の修正法 ニュース音声認識結果の修正は、以下の二段階で行う。
まず第一段階として、ニュース音声の認識結果を利用し
て、この元になったと思われる記者原稿の文を検出す
る。第二段階として、検出された記者原稿の文を利用し
て、認識結果の単語の入れ替えを行う。
【0028】(b)−1 認識結果に対応する元原稿の
検出 認識結果に対応する記者原稿を検出するために、文単位
のDPマッチングを行う。同じ放送日の記者原稿をすべ
て形態素解析して単語に分割し、最も認識結果との類似
度の高い文を、対応する元の文とみなすことにする。
【0029】文単位の類似度を、単語単位の類似度と、
単語間の遷移スコアの総和が最大のものとする。文W1
W2W3…Wnにおける、単語WiからWjへの遷移ス
コアTは、
【0030】
【数1】
【0031】とした。但し、Sは遷移スコアの最大値、
αは距離によって減少する値である。
【0032】単語単位の類似度は、文字単位の類似度か
ら求める。単語AとBの類似度W(A,B)は、
【0033】
【数2】
【0034】とした。但し、m,nはそれぞれ単語AB
間で、mは平仮名のマッチングした文字数、nは平仮名
以外の文字のマッチングした文字数である。定数H,K
はそれぞれ、平仮名のマッチングスコア、平仮名以外の
文字のマッチングスコアである。なお、文字間の遷移に
ついてはスコアを与えていない。
【0035】対応する文が存在するかしないかの判定に
は、しきい値を用いた。認識結果の単語数をNとする
と、しきい値θは
【0036】
【数3】θ=N・(H+K)/2 とした。
【0037】(b)−2 対応する原稿による認識結果
の修正 認識結果の修正法は、マッチングした単語の間を原稿の
単語で順次埋めていく形をとった。これにより、未知語
として認識できなかった単語も認識結果に加えることが
可能になる。ただし、原稿内に実際には読まれていない
単語の挿入を防ぐために、置換する両者の単語数の差が
【0038】
【数4】|C1−C2|<L である時のみ置換を行った。ここで、置換する認識結果
の単語数をC1、元原稿の単語数をC2とした。また、
認識結果と記者原稿のDPマッチングでは始点と終点を
フリーとしたので、認識結果の文頭と文末の単語がマッ
チングしなかった時には、認識結果をそのまま使用し
た。
【0039】(c)実験 (c)−1 実験条件 実験には、平成8年6月4日のある放送局のニュースの
音声認識結果53文(総単語数1,804)(小林ほ
か、“ニュース音声認識システムの検討”音講論集,3
−1−9,pp.103−104(1997.9)と、
同日の記者原稿データベースを使用した。修正前の認識
結果は、単語正解精度67.2%である。
【0040】(c)−2 実験結果 まず、文字のマッチングスコアを、設定するためにHと
Kの重みを変化させて対応する文の検出に最適な値を調
べた。ただし、単語間の遷移スコアSについては、平仮
名のマッチングスコアHと同値となるようにし、Lは5
単語以内の差は許すとして、L=5とした。その結果を
表1に示す。
【0041】
【表1】
【0042】平仮名以外(漢字、カタカナなど)の文字
と平仮名ではマッチングスコアには3倍(K=3*H)
の差をつけた場合が今回はよかった。表2に詳しく示
す。
【0043】その結果、認識結果と原稿との対応関係は
元原稿が無い場合も含めて、90.6%正しく検出でき
た。文字のマッチングスコアを変化させてみると、今回
のように漢字やカタカナにある程度、重点を置いた場合
が有効であることがわかった。検出に失敗したものは、
ほとんど認識時の正解精度の低いものであった。また、
認識結果が短いほど、誤った文を検出しやすい。検出誤
りの内、1文は原稿中の複数の文に対応していたため、
対応文が無いと判定された。
【0044】
【表2】
【0045】次に、提案手法で音声認識結果を修正し
た。その結果、表3に示すように、14.3%の改善が
みられた。
【0046】中には、認識結果に含まれていなかった未
知語が加えられ、改善された場合が見られた。もともと
の認識結果とほとんど認識精度が変わらないものでも、
原稿の単語に入れ替えられているために、より日本語の
文として意味の通るものになっている。しかし、記者原
稿の表記の違いや誤字については無条件で修正されてし
まったり、原稿の前後の順番を入れ替えて作られたアナ
ウンサー原稿を修正できない、などの問題点がある。
【0047】
【表3】
【0048】(d)まとめ 記者原稿を用いて認識結果を修正することで、認識精度
の改善が見られた。今回は、文ごとに検出したので複数
文にわたる認識結果には対応していない。また、単に原
稿の文字について比較し修正を行ったが、精度向上のた
めに、音響的なスコアを利用したり、認識結果の単語間
のbi−gramなどを使用して修正を行なうことがで
きる。
【0049】次に本発明を適用した音声認識結果の自動
修正装置について説明する。
【0050】(実施形態1)図1は本発明実施形態1の
システム構成を示す。なお、自動修正装置はコンピュー
タ等の情報処理装置が後述の処理を規定したプログラム
を実行することによっても実現することができる。図1
において、自動修正装置は、元原稿データベース中で音
声認識結果に最も類似した文章を検出する「類似文章検
出部」1と、類似文章によって音声認識結果を修正する
「認識結果修正部」2を有する。
【0051】次に、類似文章検出部1について、図2を
参照して説明する。類似文章検出部1は、まず照合スコ
ア計算部11において、あらかじめ形態素解析によって
単語単位に分割された自動修正装置内の元原稿データベ
ースを用いて、音声認識結果と元原稿の各文章を単語単
位に動的計画法(DPとも呼ばれる)で照合し、照合ス
コアを求める。この際、照合スコアは平仮名と平仮名以
外の文字について、照合が一致した場合のスコアに数倍
の差をつけ、また、単語間の遷移スコアは照合距離に反
比例するものとする。たとえばこの実施形態において、
動的計画法の照合スコアをP、各単語どうしのマッチン
グの照合スコアをW、単語間の遷移スコアをTとする
と、P=Σ(W+T)と表現できる。また、文W1W2
W3…Wnにおける、単語WiからWjへの遷移スコア
Tは、
【0052】
【数5】
【0053】但し、Sは遷移スコアの最大値、αは距離
によって減少する値である。また、単語単位の照合スコ
アは、単語AとBの照合スコアW(A,B)は、
【0054】
【数6】
【0055】となる。但しm,nはそれぞれ単語AB間
で、mは平仮名のマッチングした文字数、nは平仮名以
外の文字の照合が一致した文字数である。定数H,Kは
それぞれ、平仮名の照合スコア、平仮名以外の文字の照
合スコアである。
【0056】類似文章判定部12では、最大の照合スコ
アを示す元原稿について、音声認識結果の単語数に比例
した閾値以上であれば、その元原稿を音声認識結果の類
似文章とみなし、そうでなければ類似文章が存在しない
ものとみなす。たとえば、実施形態の場合、認識結果の
単語数をNとすると、しきい値θは、θ=N・(H+
K)/2と表現できる。
【0057】次に、認識結果修正部2について、図3を
参照して説明する。類似文章検出部1で類似文章が存在
すると判定された場合、単語不一致区間検出部21にお
いて、音声認識結果と類似文章の単語が一致しない区間
を検出する。次に置換判定部22において、不一致区間
の音声認識結果と類似文章の各々の単語数の差がある一
定数以下である場合、音声認識結果の単語を類似文章の
単語で置換する。たとえば、置換する両者の単語数の差
は置換する認識結果の単語数をC1、元原稿の単語数を
C2とする場合、|C1−C2|<Lと表現することが
できる。
【0058】以上の処理をコンピュータで実行するため
のプログラムの処理内容を図4に参考のために示してお
く。説明が上述の説明と重複する箇所についてはその説
明を簡単に留める。
【0059】修正対象の音声認識結果は、通信,フロッ
ピーディスク,キーボード等の入力装置から入力され、
コンピュータ内のメモリに格納される(ステップS1
0)。比較の対象となる原稿はこの実施形態ではコンピ
ュータ内にデータベースから与えられるが、予め対応す
る原稿が判明している場合は通信,フロッピーディス
ク,キーボード等の入力装置から与えてもよい。本実施
形態では音声認識結果と対応する原稿をも自動検出す
る。
【0060】最初にデータベースから取り出された原稿
と修正対象の音声の認識結果との照合を上述の動的計画
法で行う(ステップS20〜S40)。動的計画法を使
用すると、単語同士の類似度を計算するだけでなく、連
続する単語列についての類似度についても計算(各単語
の類似度を重み付けして加算、数1,数2式参照)する
ので、一致する単語が多く、かつ、その単語の並びの順
序が一致する場合ほど照合スコアは高くなる。
【0061】得られた照合スコアを認識結果の単語数か
ら定めた閾値と比較し、データベースから取り出した原
稿が音声認識結果と対応するか否かを判定する(ステッ
プS50)。
【0062】閾値よりも照合スコアが低い場合には、デ
ータベースから取り出した原稿は、音声認識結果とは対
応しないので(ステップS50でNO判定)、次の原稿
と音声認識結果を照合すべく、ステップS90を経由し
て、ステップS20へ手順を戻す。
【0063】これにより、次の原稿がコンピュータによ
り(正確にはCPU)データベースから取り出されて、
照合が行なわれる。このような処理を繰り返し、対応す
る原稿がデータベースから取り出されると、その原稿の
照合スコアは閾値よりも高くなる(ステップS50がY
ES判定)、これにより手順は、ステップS60に進
み、音声認識結果と、現在の原稿の文章とを比較するこ
とにより不一致の単語列部分を検出する。
【0064】また、不一致の単語部分の単語数を計数す
る。この単語数が一定数以下の場合には、不一致部分の
原稿側の単語列で、音声認識側の不一致部分の文字列を
置換する(ステップS70→S80)。
【0065】一方上記不一致部分の単語数が一定値より
も多い場合には、音声認識結果に誤認識があるのではな
く、元原稿が修正されて、放送されたと判定して、置換
処理は行なわず、別の原稿をデータベースから取り出す
(ステップS70→、S90→S20)。
【0066】なお、上述のステップS20〜S90の処
理を繰り返し実行しても照合スコアが閾値以上で、か
つ、不一致の単語数が一定数以下となるデータベース上
の原稿が見つからなかった場合には、手順を終了する
(ステップS90のYES判定→終了)。
【0067】以上の処理を実行することにより、音声認
識結果の自動修正が可能となるとともに、単語あるいは
文字の修正に用いる原稿をデータベースから自動的に検
出することも可能となる。
【0068】(実施形態2)図5には、認識結果修正部
2のもう一つの実施形態を示す。これは、図3の認識結
果修正部に「音響スコアおよび言語スコア計算部」32
を加え、テキストの表記を単純に置き換えるのではな
く、修正後のテキストが音響的にも言語的にもより正し
いかどうかを、認識対象音声を用いて詳細に判定するも
のである。まず、単語不一致区間検出部31において、
音声認識結果と類似文章の単語不一致区間を求める。次
に音響スコアおよび言語スコア計算部32において、音
声認識結果および類似文章の単語不一致区間に存在する
すべての単語を用いて単語ネットワークを作成し、認識
対象音声の音響スコアおよび/または言語スコアを計算
する。最後に置換判定部33において、音響スコアと言
語スコアの重み付け和が最大となる単語列で、音声認識
結果の単語不一致区間を置換する。
【0069】なお音響スコアまたは言語スコアのいずれ
か一方のみを使用して単語不一致区間を置換することも
できる。
【0070】このための実際例としては、実施形態1の
ステップS70の単語数によって置換を判定している部
分(置換判定部22)を、再度、認識結果と類似文章の
不一致区間の単語のみで、対応する音声区間を音声認識
装置にかけ音響スコアと言語スコアを計算したものと、
もともとの認識結果が認識時に得た不一致区間の音響ス
コアと言語スコアを比較して置換するもの(音響スコア
および言語スコア計算部32・置換判定部33)に置き
換えたものである。ここで、用いている音響スコアとは
連続音声認識装置で使用しているHMMと不一致区間に
対応する音声との計算したスコアであり、また、言語ス
コアとは各7年間の原稿を利用し音声認識装置用にあら
かじめ学習した、単語連鎖確率を統計的に計算したbi
−gram・tri−gramのことを示す。
【0071】認識結果の類似原稿との不一致区間の、も
ともとの認識時にえた音響スコアと言語スコアの合計を
Pとし、認識結果と類似文章の不一致区間の単語のみを
使用して不一致区間に対応する音声に対して音声認識装
置が出力した音響スコアと言語スコアの合計をPr(音
響スコアおよび言語スコア計算部)とすると、P<Pr
の時のみ(置換判定部33)不一致区間に対応する音声
に対して行った音声認識装置の出力結果を不一致区間の
正解とみなし置換する。
【0072】本実施形態の他に次の形態を実施できる。
【0073】1)上述の実施形態では音声認識を自動修
正する例を示したが、チェック者が音声認識結果と類似
する原稿をデータベースから取り出したいときには上述
の動的計画法を使用した類似度の計算を行って、最も類
似する原稿を検出し、その原稿をプリンタにより印刷し
たり、表示器に表示させることもできる。この場合に
は、チェック者は、表示、あるいは印刷出力を見て音声
認識結果を手動で修正するが、チェックの基となる原稿
を自動的にデータベースから取り出すことができるの
で、原稿の検索にかかわる操作から開放される。
【0074】2)さらに上述した実施形態において、修
正の基となった原稿および音声認識結果をともに表示さ
せ、音声認識結果の修正された個所を他の部分と異なる
色で表示すると、チェック者は修正個所を目視確認する
ことができる。
【0075】3)上述の実施形態で述べたコンピュータ
にはパソコン,ワークステーション,ワープロ等各種の
情報処理装置を使用することができる。
【0076】
【発明の効果】以上、説明したように、請求項1,8の
発明によれば、最終決定前の第2原稿は最終決定した原
稿と共通部分が多い点、および最終決定した第1原稿を
放送するまでの間に第2原稿を電子化(文書として情報
処理装置に入力すること)している点に着目し、第1原
稿の音声認識結果と第2原稿とを比較することで、音声
認識結果を速やかに自動修正することができる。
【0077】請求項2,9の発明では不一致部の長さ、
たとえば、文字数や単語数などの長さを計数すること
で、不一致部分が音声の誤認識により発生したものか、
第2原稿から第1原稿を作成する際に加えられた変更か
を区別することができるので、誤認識別部分を自動検出
することができる。
【0078】請求項3,4,10,11の発明では、さ
らに音響スコアや言語スコアを加味することにより誤認
識部分を精度よく検出することができる。
【0079】請求項5〜7,12〜14の発明は、動的
計画法により第2原稿の文章を音声認識結果と比較する
ことで、原稿の類似度を計算することができる点に着目
して、最も音声認識結果と類似する原稿をデータベース
から自動的に取り出すことにより、操作者はデータベー
スの検索に関わる操作から解放される。
【図面の簡単な説明】
【図1】本発明実施形態1の構成を示すブロック図であ
る。
【図2】類似文章検出部1の構成を示すブロック図であ
る。
【図3】認識結果修正部2の構成を示すブロック図であ
る。
【図4】音声認識結果の自動修正処理手順を示すフロー
チャートである。
【図5】実施形態2の構成を示すブロック図である。
【符号の説明】
1 類似文章検出部 2 認識結果修正部 11 照合スコア計算部 12 類似文章判定部 21,31 単語不一致区間検出部 22,33 置換判定部 32 置換判定部

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 最終決定した第1原稿について発声され
    た音声を音声認識装置により音声認識し、その音声認識
    結果を修正する音声認識結果の修正方法において、 最終決定前の第2原稿と前記音声認識結果とを情報処理
    装置により比較することにより前記第2原稿および前記
    音声認識結果の不一致部分を検出し、 当該検出された第2原稿側の不一致部分を音声認識結果
    の不一致部分と置換することにより音声認識結果を修正
    することを特徴とする音声認識結果の修正方法。
  2. 【請求項2】 請求項1に記載の音声認識結果の修正方
    法において、 前記情報処理装置はさらに前記不一致部分の長さを計数
    し、その計数結果が一定長さよりも小さい場合に前記置
    換を行うことを特徴とする音声認識結果の修正方法。
  3. 【請求項3】 請求項1に記載の音声認識結果の修正方
    法において、 前記第2原稿と前記音声認識結果との比較に、音響スコ
    アを使用することを特徴とする音声認識結果の修正方
    法。
  4. 【請求項4】 請求項1に記載の音声認識結果の修正方
    法において、 前記第2原稿と前記音声認識結果との比較に、言語スコ
    アを使用することを特徴とする音声認識結果の修正方
    法。
  5. 【請求項5】 最終決定した第1原稿について発声され
    た音声を音声認識装置により音声認識し、その音声認識
    結果を修正する音声認識結果の修正方法において、 最終決定前の複数の第2原稿がデータベースの形態で情
    報処理装置に記憶されており、 前記音声認識結果を前記情報処理装置に入力し、 前記情報処理装置は、 当該入力された音声認識結果と最も類似する第2原稿を
    前記データベースから取り出すことを特徴とする音声認
    識結果の修正方法。
  6. 【請求項6】 請求項5に記載の音声認識結果の修正方
    法において、最も類似する第2原稿の取り出しのために
    動的計画法を使用することを特徴とする音声認識結果の
    修正方法。
  7. 【請求項7】 請求項6に記載の音声認識結果の修正方
    法において、前記動的計画法では単語単位で前記音声認
    識結果と前記データベース上の第2原稿との照合を行う
    ことを特徴とする音声認識結果の修正方法。
  8. 【請求項8】 最終決定した原稿について発声された音
    声を音声認識装置により音声認識し、その音声認識結果
    を修正する音声認識結果の修正装置において、 最終決定前の第2原稿と前記音声認識結果とを比較する
    ことにより前記第2原稿および前記音声認識結果の不一
    致部分を検出する手段と、 当該検出された第2原稿側の不一致部分を音声認識結果
    の不一致部分と置換することにより音声認識結果を修正
    する手段とを具えたことを特徴とする音声認識結果の修
    正装置。
  9. 【請求項9】 請求項8に記載の音声認識結果の修正装
    置において、 前記情報処理装置はさらに前記不一致部分の長さを計数
    する手段を有し、その計数結果が一定長さよりも小さい
    場合に前記置換を行うことを特徴とする音声認識結果の
    修正装置。
  10. 【請求項10】 請求項8に記載の音声認識結果の修正
    装置において、 前記不一致部分を検出する手段は、前記第2原稿と前記
    音声認識結果との比較に、音響スコアを使用することを
    特徴とする音声認識結果の修正装置。
  11. 【請求項11】 請求項8に記載の音声認識結果の修正
    装置において、 前記不一致部分を検出する手段は、前記第2原稿と前記
    音声認識装置との比較に、言語スコアを使用することを
    特徴とする音声認識結果の修正装置。
  12. 【請求項12】 最終決定した第1原稿について発声さ
    れた音声を音声認識装置により音声認識し、その音声認
    識結果を修正する音声認識結果の修正装置において、最
    終決定前の複数の第2原稿をデータベースの形態で記憶
    する手段と、前記音声認識結果を入力する手段と、 当該入力された音声認識結果と最も類似する第2原稿を
    前記データベースから取り出す手段とを具えたことを特
    徴とする音声認識結果の修正装置。
  13. 【請求項13】 請求項12に記載の音声認識結果の修
    正装置において、最も類似する原稿の取り出しのために
    動的計画法を使用することを特徴とする音声認識結果の
    修正装置。
  14. 【請求項14】 請求項13に記載の音声認識結果の修
    正装置において、前記動的計画法では単語単位で前記音
    声認識結果と前記データベース上の第2原稿との照合を
    行うことを特徴とする音声認識結果の修正装置。
JP10254377A 1998-09-08 1998-09-08 音声認識結果の修正方法および装置 Pending JP2000089786A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10254377A JP2000089786A (ja) 1998-09-08 1998-09-08 音声認識結果の修正方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10254377A JP2000089786A (ja) 1998-09-08 1998-09-08 音声認識結果の修正方法および装置

Publications (1)

Publication Number Publication Date
JP2000089786A true JP2000089786A (ja) 2000-03-31

Family

ID=17264147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10254377A Pending JP2000089786A (ja) 1998-09-08 1998-09-08 音声認識結果の修正方法および装置

Country Status (1)

Country Link
JP (1) JP2000089786A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006521578A (ja) * 2003-03-26 2006-09-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識システム
JP2007509377A (ja) * 2003-10-21 2007-04-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザインタフェースを有するインテリジェント音声認識
JP2009271117A (ja) * 2008-04-30 2009-11-19 Mitsubishi Electric Corp 音声検索装置および音声検索方法
JP2012128188A (ja) * 2010-12-15 2012-07-05 Nippon Hoso Kyokai <Nhk> テキスト修正装置およびプログラム
JP2015125232A (ja) * 2013-12-26 2015-07-06 日本放送協会 音声認識誤り修正装置
JP2016080832A (ja) * 2014-10-16 2016-05-16 日本放送協会 学習データ生成装置及びそのプログラム
JP2016099515A (ja) * 2014-11-21 2016-05-30 日本放送協会 音声認識誤り修正装置
JP2019008315A (ja) * 2018-09-18 2019-01-17 日本放送協会 学習データ生成装置及びそのプログラム
JP2019197210A (ja) * 2018-05-08 2019-11-14 日本放送協会 音声認識誤り修正支援装置およびそのプログラム
WO2020178974A1 (ja) 2019-03-05 2020-09-10 株式会社 東芝 グラフェン含有膜、その製造方法、グラフェン含有膜積層体および光電変換素子

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006521578A (ja) * 2003-03-26 2006-09-21 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識システム
US8447602B2 (en) 2003-03-26 2013-05-21 Nuance Communications Austria Gmbh System for speech recognition and correction, correction device and method for creating a lexicon of alternatives
JP2007509377A (ja) * 2003-10-21 2007-04-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザインタフェースを有するインテリジェント音声認識
JP4864712B2 (ja) * 2003-10-21 2012-02-01 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ユーザインタフェースを有するインテリジェント音声認識
JP2009271117A (ja) * 2008-04-30 2009-11-19 Mitsubishi Electric Corp 音声検索装置および音声検索方法
JP2012128188A (ja) * 2010-12-15 2012-07-05 Nippon Hoso Kyokai <Nhk> テキスト修正装置およびプログラム
JP2015125232A (ja) * 2013-12-26 2015-07-06 日本放送協会 音声認識誤り修正装置
JP2016080832A (ja) * 2014-10-16 2016-05-16 日本放送協会 学習データ生成装置及びそのプログラム
JP2016099515A (ja) * 2014-11-21 2016-05-30 日本放送協会 音声認識誤り修正装置
JP2019197210A (ja) * 2018-05-08 2019-11-14 日本放送協会 音声認識誤り修正支援装置およびそのプログラム
JP2019008315A (ja) * 2018-09-18 2019-01-17 日本放送協会 学習データ生成装置及びそのプログラム
WO2020178974A1 (ja) 2019-03-05 2020-09-10 株式会社 東芝 グラフェン含有膜、その製造方法、グラフェン含有膜積層体および光電変換素子

Similar Documents

Publication Publication Date Title
US7584093B2 (en) Method and system for generating spelling suggestions
CN113435186B (zh) 中文文本纠错系统、方法、装置及计算机可读存储介质
CN111613214A (zh) 一种用于提升语音识别能力的语言模型纠错方法
CN111651978A (zh) 基于实体的词法检查方法与装置和计算机设备及存储介质
JP2000089786A (ja) 音声認識結果の修正方法および装置
JP3589007B2 (ja) 文書ファイリングシステムおよび文書ファイリング方法
JP4278011B2 (ja) 文書校正装置およびプログラム記憶媒体
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP4047895B2 (ja) 文書校正装置およびプログラム記憶媒体
JP4318223B2 (ja) 文書校正装置およびプログラム記憶媒体
JP2007058415A (ja) テキストマイニング装置、テキストマイニング方法、およびテキストマイニング用プログラム
JP4047894B2 (ja) 文書校正装置およびプログラム記憶媒体
JP2908460B2 (ja) 誤認識修正方法及び装置
JPH0256086A (ja) 文字認識の後処理方法
JP3157557B2 (ja) 文字認識装置
CN113033188B (zh) 一种基于神经网络的藏文语法纠错方法
JP2599973B2 (ja) 日本文訂正候補文字抽出装置
KR100258923B1 (ko) 한글 및 영문 성명인식 및 오인식 교정방법
JP2902138B2 (ja) 誤読文字修正方法
JP2908132B2 (ja) 文字認識結果の後処理方法
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPH08249428A (ja) 文書認識装置
CN111753544A (zh) 基于rpa及ai的文档纠错方法、装置、设备及介质
JP3916792B2 (ja) 音声認識装置
JPH10240736A (ja) 形態素解析装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040408

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060502

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060703

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060703

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060811