JP2003316384A - リアルタイム文字修正装置、およびその方法、ならびにそのプログラム、その記憶媒体 - Google Patents

リアルタイム文字修正装置、およびその方法、ならびにそのプログラム、その記憶媒体

Info

Publication number
JP2003316384A
JP2003316384A JP2002121712A JP2002121712A JP2003316384A JP 2003316384 A JP2003316384 A JP 2003316384A JP 2002121712 A JP2002121712 A JP 2002121712A JP 2002121712 A JP2002121712 A JP 2002121712A JP 2003316384 A JP2003316384 A JP 2003316384A
Authority
JP
Japan
Prior art keywords
sentence
character
real
text
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002121712A
Other languages
English (en)
Other versions
JP3682922B2 (ja
Inventor
Akira Nakamura
章 中村
Masato Kawaguchi
正人 河口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2002121712A priority Critical patent/JP3682922B2/ja
Publication of JP2003316384A publication Critical patent/JP2003316384A/ja
Application granted granted Critical
Publication of JP3682922B2 publication Critical patent/JP3682922B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 誤字脱字が認められる指定箇所あるいはその
指定箇所を含む句読点間で挟まれたセンテンスを検出し
て削除し、音声により再入力することにより、リアルタ
イム性を損なうことなく修正可能とする。 【解決手段】 発話者によって入力される音声を、音声
認識によってテキストに変換して字幕表示するために、
誤字脱字の生じた箇所をリアルタイムで修正するリアル
タイム文字修正装置2は、音声認識されたテキストの誤
字脱字がある箇所の指定に基づき、その誤字脱字を生じ
ている箇所を含む読点、句点から文末、また、文頭から
句読点、読点あるいは句点で挟まれたセンテンスを抽出
する句読点間センテンス抽出手段23と、前記センテン
スを削除する誤センテンス削除手段24と、その削除さ
れたセンテンスの音声入力を促がすことにより再度音声
認識された結果を反映させる再認識結果反映手段25
と、を備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば、テレビ番
組や講演、VTR等の記録媒体に収録された音声からテ
キストを生成し、誤字脱字の生じた箇所をリアルタイム
で修正する、リアルタイム文字修正システム、およびそ
の方法、ならびにそのプログラム、その記憶媒体に関す
る。
【0002】
【従来の技術】従来、テレビ番組などの番組内で出演者
が話した音声を字幕により表示することが行われてい
る。この音声情報から文字情報に変換して表示する場合
において、テレビ番組が録画放送である場合は、音声情
報から変換ソフトを用いてテキストデータに変換し、そ
の変換されたテキストデータの誤りを修正するために通
常、ワードプロセッサやエディタ等のアプリケーション
ソフトウェアが用いられている。そして、テキストの誤
りを修正する手順として、マウス等のポインティングデ
バイス(タッチパネルの場合は、指示ペンあるは手指)
を用いて誤って認識された箇所を指定し、正しい単語を
入力した後、誤認識された箇所を削除することが行われ
る。
【0003】一方、テレビ番組や講演などの内容に関し
てリアルタイムで字幕を制作する場合、そのテレビ番組
や講演などの内容の音声をもとにコンピュータによって
音声認識手段を介してテキスト化する方法が知られてい
る。
【0004】このとき、誤字脱字を一字一句チェックし
ながら修正を行うと、そのテレビ番組や講演などの進行
から大幅に遅れ、テンポの速い番組や講演等では、内容
の把握が困難になる場合がある。また、リアルタイム性
を重んじた場合、誤字脱字が生じても修正を施すことな
く、そのままの状態で放置することも多々あった。その
ため、従来、文字データ修正装置が提案されている。
【0005】この文字データ修正装置は、音声入力され
た音声データから文字データに変換して、その変換され
た文字データの誤り箇所を指摘して、その指摘された文
字データの誤り箇所を修正するものであり、音声認識装
置等のテキストデータ出力装置から出力されるテキスト
データから間違いを見つけて選択するポイント用端末装
置と、誤っている単語を修正する修正用端末装置とを備
え、役割を分担することで修正時間を短縮するものであ
る。
【0006】
【発明が解決しようとする課題】しかし、従来の文字デ
ータ修正装置では、ポイント用端末装置と修正用端末装
置とより役割を分担して修正速度を上げているが、さら
なる改良する余地が存在した。すなわち、文字データ修
正装置では、修正用端末装置により訂正する箇所の入力
をキーボードからの入力に頼っているため、修正に対す
る時間がかかり、さらに時間の短縮が可能となる修正を
リアルタイムで行うことが望まれていた。
【0007】本発明は前記事情に鑑みてなされたもので
あり、誤字脱字が認められる箇所である指定箇所あるい
は誤字脱字が認められる箇所を含む句読点間で挟まれた
センテンス単位で、削除し、音声認識手段により再度再
現することにより、リアルタイム性を損なうことなく修
正可能な、リアルタイム文字修正装置、およびリアルタ
イム文字修正方法、ならびにリアルタイム文字修正プロ
グラム、リアルタイム文字修正記憶媒体を提供すること
を目的とする。
【0008】
【課題を解決するための手段】本発明は前記目的を達成
するため、請求項1に記載の発明として、発話者によっ
て入力される音声を、音声認識手段によってテキストに
変換して字幕表示するために、誤字脱字の生じた箇所を
リアルタイムで修正するリアルタイム文字修正装置であ
って、変換された前記テキストの誤字脱字がある箇所の
指定に基づき、前記誤字脱字を生じている指定箇所を検
出する誤字脱字位置検出手段と、この誤字脱字位置検出
手段により検出した前記指定箇所が示す文字を抽出する
文字抽出手段と、この文字抽出手段により抽出された文
字を削除する誤文字削除手段と、この誤文字削除手段に
より削除された前記指定箇所が示す文字に対する発話者
の音声入力を促がし、その指定箇所の文字に対する音声
入力を得て音声認識を行いその結果を、削除した前記指
定箇所に反映させる再認識結果反映手段と、を備える構
成とした。
【0009】請求項1に記載の発明によれば、リアルタ
イム文字修正装置は、音声認識されたテキストの誤字脱
字がある箇所の指定に基づき、その誤字脱字を生じてい
る指定箇所を検出し抽出して削除し、その削除された指
定箇所の音声入力を促がすことにより再度音声認識され
た結果を反映させてリアルタイム修正する。なお、指定
箇所とは、指定された単語の位置である。また、変換し
たテキストに発生する誤字脱字を指定する場合は、発話
者本人あるいは誤字脱字をチェックするチェッカーがモ
ニタ画面により行なっている。
【0010】また、請求項2の発明として、発話者によ
って入力される音声を、音声認識手段によってテキスト
に変換して字幕表示するために、誤字脱字の生じた箇所
をリアルタイムで修正するリアルタイム文字修正装置で
あって、変換された前記テキストの誤字脱字がある箇所
の指定に基づき、前記誤字脱字を生じている箇所を含む
文頭から読点あるいは句点まで、または、読点あるいは
句点から文末、または、読点あるいは句点で挟まれたセ
ンテンスを抽出する句読点間センテンス抽出手段と、こ
の句読点間センテンス抽出手段により抽出した前記セン
テンスを削除する誤センテンス削除手段と、このセンテ
ンス削除手段により削除された前記センテンスに対する
発話者の音声入力を促がし、そのセンテンスの音声入力
を得て音声認識を行いその結果を、削除した前記センテ
ンスの位置に反映させる再認識結果反映手段と、を備え
る構成とした。
【0011】請求項2に記載の発明によれば、リアルタ
イム文字修正装置は、音声認識されたテキストの誤字脱
字がある箇所の指定に基づき、その誤字脱字を生じてい
る箇所を含む読点あるいは句点を基準とするセンテンス
を抽出して削除し、その削除されたセンテンスの音声入
力を促がすことにより再度音声認識された結果を反映さ
せてリアルタイム修正する。なお、読点あるいは句点で
挟まれたセンテンスとは、句点と句点、句点と読点、読
点と句点、読点と読点で挟まれたセンテンスである。ま
た、変換したテキストのセンテンスに発生する誤字脱字
を指定する場合は、発話者本人あるいは誤字脱字をチェ
ックするチェッカーがモニタ画面により行なっている。
【0012】請求項3に記載の発明は、発話者の音声に
ついて音声認識手段により電子化されるテキストのリア
ルタイム文字修正方法であって、前記テキストの誤字脱
字がある箇所の指定に基づき、その誤字脱字を生じてい
る箇所を含む読点、あるいは句点から後段、または、読
点あるいは読点で挟まれたセンテンスを抽出して削除す
ると共に、前記削除されたテキスト部分の再入力を促が
すことにより再度音声認識手段によりテキストとして表
された結果を反映させてリアルタイム修正すること、を
特徴とする。
【0013】請求項3に記載の発明によれば、テキスト
の誤字脱字がある箇所の指定に基づき、その誤字脱字を
生じている箇所を含む読点、あるいは句点から後段、ま
たは、読点、あるいは句点で挟まれたセンテンスを抽出
して削除することにより、削除されたテキスト部分の再
入力を促がし、即座に発話者がその部分を再度発声し、
そのセンテンスを補うことにより、再認識された結果を
反映させてリアルタイム修正し、その修正に殆ど時間を
要さず、従って修正にリアルタイム性を損なうことがな
い。
【0014】請求項4に記載の発明は、発話者によって
入力される音声を、音声認識によってテキストに変換し
て字幕表示するために、誤字脱字の生じた箇所をリアル
タイム修正するリアルタイム文字修正プログラムであっ
て、前記音声認識されたテキストの誤字脱字がある箇所
の指定に基づき、その誤字脱字を生じている箇所を含む
読点、あるいは句点から後段、または、読点、あるいは
句点で挟まれたセンテンスを抽出するステップと、前記
検出されたセンテンスに相当する箇所を削除するステッ
プと、前記削除されたセンテンスの音声入力を促がすこ
とにより再度音声認識された結果を反映させてリアルタ
イム修正するステップと、をコンピュータに実行させる
ことを特徴とする。
【0015】請求項4に記載の発明によれば、前記した
リアルタイム文字修正プログラムをコンピュータに実行
させることにより、音声認識されたテキストの誤字脱字
がある箇所の指定に基づき、センテンス単位で抽出して
削除し、その削除されたセンテンスの音声入力を促がし
再度音声認識された結果を反映させてリアルタイム修正
することで、修正に殆ど時間を要さず、リアルタイムに
誤認識箇所を修正可能とすることができる。
【0016】請求項5に記載の発明は、発話者によって
入力される音声を、音声認識によってテキストに変換し
て字幕表示するために、誤字脱字の生じた箇所をリアル
タイム修正するリアルタイム文字修正プログラムを記録
したコンピュータ読み取り可能な記録媒体であって、前
記音声認識されたテキストの誤字脱字がある箇所の指定
に基づき、その誤字脱字を生じている箇所を含む読点、
あるいは句点から後段、または、読点、あるいは句点で
挟まれたセンテンスを抽出するステップと、前記抽出さ
れたセンテンスに相当する箇所を削除するステップと、
前記削除されたセンテンスの音声入力を促がすことによ
り再度音声認識された結果を反映させてリアルタイム修
正するステップと、をコンピュータに実行させるリアル
タイム文字修正プログラムを記録した記録媒体として構
成した。
【0017】請求項5に記載の発明によれば、上記した
記録媒体からリアルタイム文字修正プログラムを読み出
しコンピュータに実行させることにより、音声認識され
たテキストの誤字脱字がある箇所の指定に基づき、その
誤字脱字を生じている箇所を含む読点、あるいは句点か
ら後段、または、読点、あるいは句点で挟まれたセンテ
ンスを抽出して削除し、その削除されたセンテンスの音
声入力を促がし再度音声認識された結果を反映させてリ
アルタイム修正することで、オペレータが指定した部分
を含む句読点間を一気に削除し、即座に発話者がその部
分を再度発声してそのセンテンスを補い、従って修正に
殆ど時間を要さず、リアルタイム性を損なうことがなく
なる。
【0018】
【発明の実施の形態】図1は、本発明のリアルタイム文
字修正装置を含むシステムの構成ならびに概略動作を説
明するために引用したブロック図である。本発明のシス
テムは、音声認識手段としての音声認識装置1と、リア
ルタイム文字修正装置2と、字幕変換装置3で構成され
る。
【0019】音声認識装置1は、発話者からのマイクな
どを介して音声を受信し()、内蔵する音声認識辞書
に基づく類似度比較演算等により、テキストに変換して
リアルタイム文字修正装置2へ供給する()。このと
き、変換されたテキストには誤字脱字が含まれることが
ある。なお、発話者の認識できる位置には、発話者の音
声がテキストに変換されて文字としてのセンテンスとな
った状態を確認できるように、モニタ画面10が設置さ
れている。
【0020】リアルタイム文字修正装置2は、音声認識
されたテキストの誤字脱字がある箇所の指定(オペレー
タがタッチパネル画面を確認することにより指定)に基
づき、その誤字脱字を生じている指定箇所(図4の斜線
で示す「化膿」)、あるいは、誤字脱字を生じている箇
所を含む文頭から読点あるいは句点までのセンテンス、
または、読点あるいは句点から文末までのセンテンス、
または、読点あるいは句点で挟まれたセンテンスを検出
し抽出して削除し()、その削除されたセンテンスの
音声入力を促がす()ことにより再度音声認識された
結果を反映させてリアルタイム修正し、字幕変換装置3
へ引き渡す。
【0021】なお、リアルタイム文字修正装置2は、タ
ッチパネル20を備え、このタッチパネル20を介して
確認画面が表示され、また、誤字脱字部分の指定がなさ
れることとする。このリアルタイム文字修正装置2に接
続される字幕変換装置3は、リアルタイム文字修正装置
3によって出力されるテキストと放送番組とを合成して
字幕放送番組を制作して出力する。
【0022】図2は、図1に示すリアルタイム文字修正
装置2の内部構成を機能展開して示したブロック図であ
る。以下に示す各ブロックは、具体的には、CPUなら
びにメモリを含む周辺LSIで構成され、CPUがメモ
リに記録されたプログラムを読み出し実行することによ
り、そのブロックが持つ機能を実現するものとする。な
お、ここでは、テキストのセンテンスに対する検出、抽
出、および削除を行う構成のリアルタイム文字修正装置
として説明するが、テキストの文字に対する検出、抽
出、および削除を行う構成のリアルタイム文字修正装置
であっても構わない。
【0023】リアルタイム文字修正装置2は、テキスト
画面生成表示部21(テキスト画面生成表示手段)と、
誤字脱字位置検出部22(誤字脱字位置検出手段)と、
句読点間センテンス抽出部23(句読点間センテンス抽
出手段、または、文字抽出手段)と、誤センテンス削除
部24(誤センテンス削除手段、誤文字削除手段)と、
再認識結果反映部(再認識結果反映手段)25と、切替
部26で構成される。
【0024】テキスト画面生成表示部21は、音声認識
装置1によって出力されるテキストに基づく画面生成を
行い、そしてタッチパネル20に表示する機能を持ち、
ここに表示された内容は、オペレータのチェックを経て
字幕変換装置3へ供給される。
【0025】誤字脱字位置検出部22は、音声認識され
たテキストの誤字脱字がある箇所の指定に基づき、その
指定箇所の単語を検出して抽出する機能を持ち、ここで
はタッチパネルを使用するために表示画面上に実装され
たタブレットにより検出し抽出される。なお、この誤字
脱字位置検出部22により指定されたセンテンス内の位
置箇所について、誤字脱字の位置であることを音声認識
装置1にフィードバックすることで、音声認識装置1側
の正しい文字の変換作業をするための再現確率を高める
ことができる。
【0026】誤字脱字位置検出部22により検出される
座標データは、句読点間センテンス抽出部23に供給さ
れる。この句読点間センテンス抽出部23は、誤字脱字
を生じている箇所を含む読点、あるいは句点から後段の
センテンス、または、読点、あるいは句点で挟まれたセ
ンテンスを抽出する機能を持ち、ここで検出されたセン
テンスは、その領域を反転あるいは点滅、または、括弧
などで範囲指定した状態で示すようにして、誤センテン
ス削除部24へ供給される。なお、読点、あるいは句点
で挟まれるセンテンスとは、読点と読点、読点と句点、
句点と読点、句点と句点により挟まれる位置の文字群を
いう。
【0027】誤センテンス削除部24は、オペレータの
操作に基づき誤センテンスを削除する機能を持ち、ここ
で削除される内容はテキスト画面生成表示部21に反映
され、範囲指定されたセンテンスの表示が、タッチパネ
ル20から消える。なお、この誤センテンス削除部24
は、タッチパネル20に表示されている単語あるいはセ
ンテンスが削除されると、切替部26のルートを切り替
えるための切替信号を送信するように構成されている。
【0028】再認識結果反映部25は、削除されたセン
テンスの音声入力を促がすことにより音声入力を得て、
音声認識装置1による再音声認識を行い、その結果につ
いてテキスト画面生成表示部21を介して反映させる機
能を持つ。この再認識結果反映部25は、音声入力を促
す手段として、話者が認識できるモニタ画面10におい
てその話者が認識できるようにセンテンスが反転などし
て指定された箇所が判断できるようにしても良いし、ま
た、チェッカーから話者にイヤホンを介して音声によっ
て行っても構わない。なお、この再認識結果反映部25
は、音声認識装置1で再認識された結果をテキスト画面
生成表示部21に反映させると、切替部26にルートを
切り替えるための切替信号を送信するように構成されて
いる。
【0029】切替部26は、誤センテンス削除部24お
よび再認識結果反映部25からの切替信号により動作す
るように構成されている。この切替部26は、通常、音
声認識装置1からの出力がテキスト画面生成表示部21
に供給されるように接続制御するが、誤センテンス削除
部24からの切替信号によりルートが切り替えられ、音
声認識装置1からの出力が再認識結果反映部25に供給
されるように接続制御され、音声認識装置1で再認識さ
れた結果をテキスト画面生成表示部21に反映させてい
る。
【0030】また、この切替手段26は、再認識結果反
映部25によりセンテンス(単語)が修正されテキスト
画面生成表示部21にセンテンスが表示された場合に、
再認識結果反映部25から発生される切替信号によりも
とのルートに切り替える動作を行うように構成されてい
る。また、再認識結果反映部25によりセンテンス(単
語)が再度修正を必要とし、同じ位置のセンテンスが再
び指定された(場合、切替部26は、誤センテンス削除
部24から切替信号が送られ再認識結果反映部25側の
ルートに再び切り替えられることとなる。
【0031】つぎに、リアルタイム文字修正装置を含む
システムの動作説明をする。図3、図4は、図1、図2
に示す本発明実施形態の動作を説明するために引用した
図であり、それぞれ動作フローチャート、タッチパネル
に表示される画面構成の一例を示す。なお、図3に示す
動作フローチャートは、具体的には、本発明のリアルタ
イム文字修正プログラムの処理手順を示す。以下、図
3、図4を参照しながら図1、図2に示す本発明実施形
態の動作について詳細に説明する。
【0032】まず、アナウンサーやキャスターなどの発
話者による音声入力が行なわれる(S31)。このこと
により、音声認識装置1は、その入力音声をもとに、音
声辞書による類似度計算に基づく音声認識を行いテキス
ト化する(S32)。ここで認識されたテキストは、テ
キスト画面生成表示部21を介してタッチパネル20上
に即座に表示される(S33)。
【0033】ここで、そのテキストに誤字脱字がある場
合、オペレータは、その誤字脱字に相当するタッチパネ
ル20の表示位置(指定箇所)にタッチする。これを、
誤字脱字位置検出部22を介して検知し(S34)、句
読点間センテンス抽出部23により抽出される誤字脱字
を生じている箇所を含む読点あるいは句点を基準とする
センテンスの範囲について発話者が認識できるように範
囲指定した後、誤センテンス削除部24が一気に削除す
る(S35、S36)。なお、このとき、センテンスを
単位とせずに、指定箇所の単語を削除の単位としても構
わない。誤り箇所を含むセンテンス(単語)が削除され
たことはテキスト画面生成表示部21を介してタッチパ
ネル20に反映される。それとともに、誤センテンス削
除部24から切替部26に切替信号が送られてルートを
切り替える。
【0034】そして、発話者にそのセンテンス(単語)
部分についての発声を再度促がし、その発声が図2の切
替部26を介して音声認識装置1に再入力され(S3
7)、再認識結果反映部25によりその音声認識結果が
テキスト画面生成表示部21を介してタッチパネル20
(モニタ画面10)上に表示される。そして、テキスト
画面生成表示部21によりタッチパネル20(モニタ画
面10)上にセンテンスが表示されると、この再認識結
果反映部25から切替信号が切替部26に送られ、その
切替部26がもとのルートに切替られる。なお、このと
き、このように誤センテンスが補われることにより、修
正に殆ど時間を要さず、リアルタイムで誤字脱字を修正
することができる。ここで、誤字脱字が修正されていな
い場合は、再度発声を促し(S37:yes)S32以
降の処理を繰り返す。
【0035】なお、音声認識が適正にいかなかった場
合、リアルタイム性は確保できなくなるが、手入力によ
る修正、あるいはリアルタイム性が重視される場合は放
置することになる(S39)。
【0036】また、音声認識装置1による音声認識は、
「言いよどみ」、「曖昧な発音」等発声上の問題により
誤認識が発声する可能性が高く、この場合は、再度発音
を注意しながら発声させることにより正解率がアップす
る。また、焦って難しい単語を発声し、その単語が音声
認識辞書に存在しないため、誤認識が生じた場合は、再
度発声するときにその難しい単語を簡単な単語に置換し
て発生させることにより認識率の向上が見込める。単語
を置換して発生させる場合は、発話者がどの文字が音声
認識装置1に認識させることが困難であったかを判断で
きるように、誤字脱字位置検出部22によりその誤字脱
字の位置を指定することができる。
【0037】最終的に誤字脱字がなくなったことが確認
されたら(S34:no)、字幕変換装置3による字幕
変換処理を起動する(S38)。字幕変換装置3により
字幕放送用フォーマット(NABフォーマット:社団法
人日本民間放送連名「T027−1996」)に変換さ
れ、映像を合成された状態で字幕放送として放送され
る。
【0038】図4にタッチパネル20に表示される画面
イメージが示されている。ここでは、誤字が生じた箇所
(“化膿”)をオペレータがタッチすることにより、こ
の単語を含む句読点間(初めて生字幕放送を化膿としま
した)が範囲指定された後、削除される。そして、削除
されたセンテンスに対応する言葉の発声を再度行うこと
により、リアルタイム文字修正を実現するものである。
なお、どの単語に誤字が発生したかを誤字脱字位置検出
部22により指定することで、その誤字の情報を音声認
識装置1にフィードバックさせ、同じ文章が読まれたと
きに、同じ変換を起こさないようにすることが好都合で
ある。
【0039】以上説明のように本発明は、誤字脱字が認
められる箇所を含む句読点間で挟まれたセンテンスを抽
出して削除することにより、リアルタイム性を損なうこ
となく修正可能となるものである。なお、上記した本発
明実施形態は、音声認識を用いてテレビ番組や講演等の
内容をテキスト化する場合の修正についてのみ説明した
が、他に、電子的な速記を用いてテレビ番組や講演等の
内容を電子テキスト化する場合の修正にも同様に応用可
能である。また、本発明は、リアルタイムで放送を行う
字幕制作の分野以外に、難聴者を対象に講演等で字幕を
つける分野、あるいは音声認識を用いて事前収録番組に
ついて字幕制作を行う分野についても有効である。
【0040】また、図2に示すテキスト画面生成表示部
21、誤字脱字位置検出部22、句読点間センテンス抽
出部23、誤センテンス削除部24、再認識結果反映部
25、切替部26のそれぞれで実行される手順をコンピ
ュータ読み取り可能な記録媒体に記録し、この記録媒体
に記録されたプログラムをコンピュータシステムに読み
込ませ、実行することにより本発明のリアルタイム文字
修正システムが実現されるものとする。ここでいうコン
ピュータシステムとは、OSや周辺機器等のハードウエ
アを含むものである。
【0041】さらに、「コンピュータ読み取り可能な記
録媒体」とは、フレキシブルディスク、光磁気ディス
ク、CD−ROM等の可搬媒体、またはROM、コンピ
ュータシステムに内蔵されるハードディスク等の記憶装
置のことをいう。そして、この「コンピュータ読み取り
可能な記録媒体」とは、インターネット等のネットワー
クや電話回線等の通信回線を介してプログラムが送信さ
れた場合のシステムやクライアントとなるコンピュータ
システム内部の揮発性メモリ(RAM)のように、一定
時間プログラムを保持しているものも含むものとする。
【0042】なお、発話者がモニタ画面10においてテ
キストのセンテンスを確認しながら、音声入力作業を行
うことができる場合は、発話者のタイミングに合わせて
調整することができ、テキストのセンテンスの誤字脱字
をチェックするチェッカーとあわせて迅速な修正を行っ
たうえで、ミスのない文章を提供することができる。ま
た、チェッカーがいない状態でも迅速な修正を行ったう
えで、ミスの少ない文章を提供できる。また、切替手段
26の切替信号は、ここでは誤センテンス削除部24お
よび再認識結果反映部25から送られる構成として説明
したが、切替部26の切替動作が適切にできる構成であ
れば、特に限定されるものではない。さらに、リアルタ
イム文字修正装置は、テキストに変換されたデータを記
憶するハードディスクなどの記憶手段を備える構成とし
ても構わない。
【0043】
【発明の効果】以上説明したように、本発明に係るリア
ルタイム文字修正装置、及びその方法、並びにそのプロ
グラム、その記憶媒体は、以下に示す優れた効果を奏す
る。本発明の請求項2、3、4,5によれば、テレビ番
組や講演、VTRなどの記録媒体に収録された音声から
テキスト化する場合において、誤字脱字の生じた箇所を
リアルタイムに修正することを実現し、修正に殆ど時間
を要しないため、修正にリアルタイム性が重視されるア
プリケーションへの適用が考えられる。
【0044】特に、テレビ番組や講演などの内容につい
てリアルタイムで字幕を制作する場合に、そのテレビ番
組や講演などの内容の音声をもとにコンピュータによっ
て音声認識する手法に対して、音声認識ミスによって誤
字脱字が生じても、この誤字脱字が認められる箇所を認
識あるいは指示することにより、その誤字脱字がある単
語を含む句読点間で挟まれたセンテンスを抽出して削除
し、再度、その削除された部分を音声で繰り返し発声し
てテキスト化することで、迅速な修正を行うことによ
り、字幕へのリアルタイムでの反映が可能となる。
【0045】また、本発明は上記した音声認識による字
幕制作の他に、電子速記による字幕制作による場合でも
同様、リアルタイム修正を可能とする。
【0046】さらに、本発明の請求項1によれば、音声
認識手段に対してテキストのセンテンス内において文字
単位で、どの文字の変換が間違っていたかを指摘するこ
とができるため、音声認識手段に対して同じ指定部分に
ついて発話者が音声入力しても、間違った変換文字を繰
り返すことがなく、音声による迅速な修正を行うことが
可能となる。
【図面の簡単な説明】
【図1】本発明のリアルタイム文字修正システムの構成
ならびに概略動作を説明するために引用したブロック図
である。
【図2】図1に示すリアルタイム文字修正装置の内部構
成を機能展開して示したブロック図である。
【図3】本発明実施形態の動作を説明するために引用し
た図であり、動作フローチャートを示す図である。
【図4】 本発明実施形態の動作を説明するために引用
した図であり、タッチパネルに表示される画面構成の一
例を示す図である。
【符号の説明】
1 音声認識装置 2 リアルタイム文字修正装置 3 字幕変換装置 21 テキスト画面生成表示部 22 誤字脱字位置検出部 23 句読点間センテンス抽出部 24 誤センテンス削除部 25 再認識結果反映部 26 切替部
フロントページの続き Fターム(参考) 5B009 KB06 QB12 QB13 5D015 HH00 KK03 LL02 LL04 LL05 LL10

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 発話者によって入力される音声を、音声
    認識手段によってテキストに変換して字幕表示するため
    に、誤字脱字の生じた箇所をリアルタイムで修正するリ
    アルタイム文字修正装置であって、 変換された前記テキストの誤字脱字がある箇所の指定に
    基づき、前記誤字脱字を生じている指定箇所を検出する
    誤字脱字位置検出手段と、 この誤字脱字位置検出手段により検出した前記指定箇所
    が示す文字を抽出する文字抽出手段と、 この文字抽出手段により抽出された文字を削除する誤文
    字削除手段と、 この誤文字削除手段により削除された前記指定箇所が示
    す文字に対する発話者の音声入力を促がし、その指定箇
    所の文字に対する音声入力を得て音声認識を行いその結
    果を、削除した前記指定箇所に反映させる再認識結果反
    映手段と、 を備えることを特徴とするリアルタイム文字修正装置。
  2. 【請求項2】 発話者によって入力される音声を、音声
    認識手段によってテキストに変換して字幕表示するため
    に、誤字脱字の生じた箇所をリアルタイムで修正するリ
    アルタイム文字修正装置であって、 変換された前記テキストの誤字脱字がある箇所の指定に
    基づき、前記誤字脱字を生じている箇所を含む文頭から
    読点あるいは句点まで、または、読点あるいは句点から
    文末、または、読点あるいは句点で挟まれたセンテンス
    を抽出する句読点間センテンス抽出手段と、 この句読点間センテンス抽出手段により抽出した前記セ
    ンテンスを削除する誤センテンス削除手段と、 この誤センテンス削除手段により削除された前記センテ
    ンスに対する発話者の音声入力を促がし、そのセンテン
    スの音声入力を得て音声認識を行いその結果を、削除し
    た前記センテンスの位置に反映させる再認識結果反映手
    段と、 を備えることを特徴とするリアルタイム文字修正装置。
  3. 【請求項3】 発話者の音声について音声認識手段によ
    り電子化されるテキストのリアルタイム文字修正方法で
    あって、 前記テキストの誤字脱字がある箇所の指定に基づき、そ
    の誤字脱字を生じている指定箇所を抽出して削除すると
    共に、前記指定箇所の再入力を促がすことにより再度音
    声認識手段によりテキストとして表された結果を反映さ
    せてリアルタイムで修正すること、を特徴とするリアル
    タイム文字修正方法。
  4. 【請求項4】 発話者によって入力される音声を、音声
    認識によってテキストに変換して字幕表示するために、
    誤字脱字の生じた箇所をリアルタイム修正するリアルタ
    イム文字修正プログラムであって、 前記音声認識されたテキストの誤字脱字がある箇所の指
    定に基づき、その誤字脱字を生じている指定箇所を抽出
    するステップと、 前記抽出された指定箇所を削除するステップと、 前記削除された指定箇所の音声入力を促がすことにより
    再度音声認識された結果を反映させてリアルタイムで修
    正するステップと、 をコンピュータに実行させるリアルタイム文字修正プロ
    グラム。
  5. 【請求項5】 発話者によって入力される音声を、音声
    認識手段によってテキストに変換して字幕表示するため
    に、誤字脱字の生じた箇所をリアルタイムで修正するリ
    アルタイム文字修正システムに用いられるリアルタイム
    文字修正プログラムを記録したコンピュータ読み取り可
    能な記録媒体であって、 前記音声認識されたテキストの誤字脱字がある箇所の指
    定に基づき、その誤字脱字を生じている指定箇所を抽出
    するステップと、 前記抽出された指定箇所を削除するステップと、 前記削除された指定箇所の音声入力を促がすことにより
    再度音声認識された結果を反映させてリアルタイムで修
    正するステップと、 についてコンピュータに実行させるリアルタイム文字修
    正プログラムとして記録した記録媒体。
JP2002121712A 2002-04-24 2002-04-24 リアルタイム文字修正装置およびリアルタイム文字修正プログラム Expired - Fee Related JP3682922B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002121712A JP3682922B2 (ja) 2002-04-24 2002-04-24 リアルタイム文字修正装置およびリアルタイム文字修正プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002121712A JP3682922B2 (ja) 2002-04-24 2002-04-24 リアルタイム文字修正装置およびリアルタイム文字修正プログラム

Publications (2)

Publication Number Publication Date
JP2003316384A true JP2003316384A (ja) 2003-11-07
JP3682922B2 JP3682922B2 (ja) 2005-08-17

Family

ID=29537532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002121712A Expired - Fee Related JP3682922B2 (ja) 2002-04-24 2002-04-24 リアルタイム文字修正装置およびリアルタイム文字修正プログラム

Country Status (1)

Country Link
JP (1) JP3682922B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006054724A1 (ja) * 2004-11-22 2006-05-26 National Institute Of Advanced Industrial Science And Technology 音声認識装置及び方法ならびにプログラム
JP2007256836A (ja) * 2006-03-24 2007-10-04 Toshiba Corp 音声認識装置、音声認識方法および音声認識プログラム
CN100539649C (zh) * 2006-03-24 2009-09-09 国际商业机器公司 用于校正字幕的字幕校正设备和方法
JP2013156349A (ja) * 2012-01-27 2013-08-15 Nec Corp 音声認識結果修正支援システム、音声認識結果修正支援方法および音声認識結果修正支援プログラム
JP2014149490A (ja) * 2013-02-04 2014-08-21 Nippon Hoso Kyokai <Nhk> 音声認識誤り修正装置及びそのプログラム
CN105827417A (zh) * 2016-05-31 2016-08-03 安徽声讯信息技术有限公司 一种用于会议记录并可随时修改的语音速记装置
CN108564953A (zh) * 2018-04-20 2018-09-21 科大讯飞股份有限公司 一种语音识别文本的标点处理方法及装置
CN113268981A (zh) * 2021-05-27 2021-08-17 咪咕音乐有限公司 一种信息处理方法、装置及电子设备

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7848926B2 (en) 2004-11-22 2010-12-07 National Institute Of Advanced Industrial Science And Technology System, method, and program for correcting misrecognized spoken words by selecting appropriate correction word from one or more competitive words
WO2006054724A1 (ja) * 2004-11-22 2006-05-26 National Institute Of Advanced Industrial Science And Technology 音声認識装置及び方法ならびにプログラム
GB2437436A (en) * 2004-11-22 2007-10-24 Nat Inst Of Advanced Ind Scien Voice recognition device and method, and program
GB2437436B (en) * 2004-11-22 2009-07-08 Nat Inst Of Advanced Ind Scien Voice recognition device and method, and program
CN100539649C (zh) * 2006-03-24 2009-09-09 国际商业机器公司 用于校正字幕的字幕校正设备和方法
US7729917B2 (en) 2006-03-24 2010-06-01 Nuance Communications, Inc. Correction of a caption produced by speech recognition
JP2007256836A (ja) * 2006-03-24 2007-10-04 Toshiba Corp 音声認識装置、音声認識方法および音声認識プログラム
US7974844B2 (en) 2006-03-24 2011-07-05 Kabushiki Kaisha Toshiba Apparatus, method and computer program product for recognizing speech
JP2013156349A (ja) * 2012-01-27 2013-08-15 Nec Corp 音声認識結果修正支援システム、音声認識結果修正支援方法および音声認識結果修正支援プログラム
JP2014149490A (ja) * 2013-02-04 2014-08-21 Nippon Hoso Kyokai <Nhk> 音声認識誤り修正装置及びそのプログラム
CN105827417A (zh) * 2016-05-31 2016-08-03 安徽声讯信息技术有限公司 一种用于会议记录并可随时修改的语音速记装置
CN108564953A (zh) * 2018-04-20 2018-09-21 科大讯飞股份有限公司 一种语音识别文本的标点处理方法及装置
CN113268981A (zh) * 2021-05-27 2021-08-17 咪咕音乐有限公司 一种信息处理方法、装置及电子设备
CN113268981B (zh) * 2021-05-27 2023-04-28 咪咕音乐有限公司 一种信息处理方法、装置及电子设备

Also Published As

Publication number Publication date
JP3682922B2 (ja) 2005-08-17

Similar Documents

Publication Publication Date Title
JP6463825B2 (ja) 多重話者音声認識修正システム
JP6605995B2 (ja) 音声認識誤り修正装置、方法及びプログラム
JP4481972B2 (ja) 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム
JP4241376B2 (ja) 認識されたテキスト中の音声シーケンスと手動入力される補正ワードの音声転写との比較を通した音声認識により認識されたテキストの補正
JP4087400B2 (ja) 音声対話翻訳装置、音声対話翻訳方法および音声対話翻訳プログラム
JP5787780B2 (ja) 書き起こし支援システムおよび書き起こし支援方法
JP2006351028A (ja) 音声認識中に可変数の代替ワードを表示する方法及びシステム
JP2004530205A (ja) 編集中における音声カーソルとテキストカーソルの位置合わせ
JP6150268B2 (ja) 単語登録装置及びそのためのコンピュータプログラム
US20180217985A1 (en) Control method of translation device, translation device, and non-transitory computer-readable recording medium storing a program
US20060195318A1 (en) System for correction of speech recognition results with confidence level indication
JP2012109901A (ja) 資料提示装置
JPWO2017217046A1 (ja) 情報処理装置及び情報処理方法
JPWO2011033834A1 (ja) 音声翻訳システム、音声翻訳方法および記録媒体
JP3104661B2 (ja) 日本語文章作成装置
JP3682922B2 (ja) リアルタイム文字修正装置およびリアルタイム文字修正プログラム
JP5160594B2 (ja) 音声認識装置および音声認識方法
JP2013050742A (ja) 音声認識装置および音声認識方法
JP2010128766A (ja) 情報処理装置、情報処理方法、プログラム及び記憶媒体
KR102160117B1 (ko) 장애인을 위한 실시간 방송 컨텐츠 제작 시스템
JP5243886B2 (ja) 字幕出力装置、字幕出力方法及びプログラム
US11606629B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP6401488B2 (ja) 外国語会話理解支援装置、外国語会話理解支援方法及びプログラム
JP2001306091A (ja) 音声認識システムおよび単語検索方法
JP2016024378A (ja) 情報処理装置、その制御方法及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050518

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050520

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090603

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100603

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110603

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120603

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130603

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140603

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees