JP2004240920A - 校正システム - Google Patents

校正システム Download PDF

Info

Publication number
JP2004240920A
JP2004240920A JP2003032229A JP2003032229A JP2004240920A JP 2004240920 A JP2004240920 A JP 2004240920A JP 2003032229 A JP2003032229 A JP 2003032229A JP 2003032229 A JP2003032229 A JP 2003032229A JP 2004240920 A JP2004240920 A JP 2004240920A
Authority
JP
Japan
Prior art keywords
audio signal
unit
text data
audio
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003032229A
Other languages
English (en)
Other versions
JP2004240920A5 (ja
Inventor
Yasuhiro Murata
康博 村田
Hidehiko Kikuchi
秀彦 菊地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Television Network Corp
Original Assignee
Nippon Television Network Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Television Network Corp filed Critical Nippon Television Network Corp
Priority to JP2003032229A priority Critical patent/JP2004240920A/ja
Publication of JP2004240920A publication Critical patent/JP2004240920A/ja
Publication of JP2004240920A5 publication Critical patent/JP2004240920A5/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】音声認識装置によってテキスト化されたテキストデータと、テキスト化に使用された音声データとを同時に校正者に送信するシステム及びその方法を提供することにある。
【解決手段】発せられた音声に基づいて変換されたテキストデータを校正する校正システムであって、発せられた音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、前記分割された音声信号をテキストデータに変換するテキスト変換部と、互いに対応している前記音声信号と前記テキストデータとを同期させて読み出す同期読出部と、前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部とを有することを特徴とする。
【選択図】 図1

Description

【0001】
【発明が属する技術分野】
本発明は校正システム及びそのプログラムに関し、特に、文字放送等で用いられるテキストデータを効率よく校正するための技術に関する。
【0002】
【従来技術】
音声をテキスト化する技術は、議事録の作成や聴覚障害者への情報伝達などで広く用いられている。
【0003】
現在、音声を文字化する方法として、人が音声を聞き、速記ワープロ等を用いて文字化する方法が主流である。しかしながら、これは特殊な訓練を受けた人のみ可能な作業であり、又、人によっては変換精度が異なってしまう。
【0004】
そのため、近年において、音声をテキストデータへ変換する音声認識装置の導入が行われているが、現状の技術では音声認識装置による音声の文字化は、変換精度が完全ではないため、人手による校正を必要とする。
【0005】
【発明が解決しようとする課題】
しかしながら、文字化にリアルタイム性を要求する場合、聞き終えた音声のテキストデータの誤り箇所を校正している最中に次の音声が流れ、注意力が分散するため、テキストデータの誤り箇所を見つけるのが困難であった。
【0006】
そこで、本発明は上記問題点に鑑みて発明されたものであって、その目的は、音声認識装置によって文字化されたテキストデータと、文字化に使用された音声データとを同時に校正者に送信すること、又は、音声認識装置によって文字化されたテキストデータを文字化に使用された音声データより先に校正者に送信することによって、文字化されたテキストデータの誤り箇所を見つけやすくする技術を提供することにある。
【0007】
【課題を解決するための手段】
上記課題を解決するための第一の発明は、発せられた音声に基づいて変換されたテキストデータを校正する校正システムであって、発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、前記分割された音声信号をテキストデータに変換するテキスト変換部と、互いに対応している前記音声信号と前記テキストデータとを同期させて読み出す同期読出部と、前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部とを有することを特徴とする。
【0008】
上記課題を解決するための第二の発明は、発せられた音声に基づいて変換されたテキストデータを校正する校正システムであって、発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、前記分割された音声信号をテキストデータに変換するテキスト変換部と、前記変換された音声データ及びテキストデータを蓄積させる蓄積部と、前記蓄積部から互いに対応する音声信号と前記テキストデータとを同期させて読み出す同期読出部と、前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部とを有することを特徴とする。
【0009】
上記課題を解決するための第三の発明は、発せられた音声に基づいて変換されたテキストデータを校正する校正システムであって、発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、前記分割された音声信号をテキストデータに変換するテキスト変換部と、前記分割された音声信号を、前記テキスト変換部で生じる変換時間に近似した時間、遅延させる遅延部と、前記遅延部で遅延された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部とを有することを特徴とする。
【0010】
上記課題を解決するための第四の発明は、発せられた音声に基づいて変換されたテキストデータを校正する校正システムであって、発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、前記分割された音声信号をテキストデータに変換するテキスト変換部と、テキストデータと、このテキストデータの元となる分割された音声信号とを互いに関連付ける識別情報を、前記テキストデータと前記分割された音声信号とに付装する識別情報付装部と、前記識別情報が付された音声信号と、前記識別情報が付されたテキストデータとが蓄積される蓄積部と、互いに関連付けられた識別情報を持つテキストデータ及び音声信号を、先頭識別情報から順番に、前記蓄積部から同期させて読み出す同期読出部と、前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部とを有することを特徴とする。
【0011】
上記課題を解決するための第五の発明は、上記第一から第四の発明のいずれかの発明において、前記同期読出部、又は遅延部から読み出された音声信号を、所定時間遅延させて前記校正実行部に出力する遅延部を更に有することを特徴とする。
【0012】
上記課題を解決するための第六の発明は、上記第一から上記第四のいずれかの発明において、前記同期読出部、又は遅延部から読み出された、テキストデータと音声信号とを結合する結合部を更に有することを特徴とする。
【0013】
上記課題を解決するための第七の発明は、上記第六の発明において、前記結合部で結合された音声信号及びテキストデータを分離した後、分離された音声信号を所定時間遅延させて前記校正実行部に出力する遅延部を更に有することを特徴とする。
【0014】
上記課題を解決するための第八の発明は、上記第一から上記第七のいずれかの発明において、前記同期読出部は、所定の間隔をおいて、テキストデータ及び音声信号を同期させて読み出す同期読出部であることを特徴とする。
【0015】
上記課題を解決するための第九の発明は、上記第一から上記第八のいずれかの発明において、前記校正実行部は、前記テキストデータを表示させる表示部と、前記表示部に表示されているテキストデータに対応している音声を流す音声再生部と、校正者のアクションに基づいて、前記表示部に表示されているテキストデータに対応している音声を前記音声再生部に再生させるように制御する再生制御部とを更に有することを特徴とする。
【0016】
上記課題を解決するための第十の発明は、発せられた音声に基づいて変換されたテキストデータを校正する校正システムを、情報処理装置に行わせるプログラムであって、前記プログラムは、情報処理装置を、発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、前記分割された音声信号をテキストデータに変換するテキスト変換部と、互いに対応している前記音声信号と前記テキストデータとを同期させて読み出す同期読出部と、前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部として機能させることを特徴とする。
【0017】
上記課題を解決するための第十一の発明は、発せられた音声に基づいて変換されたテキストデータを校正する校正システムを、情報処理装置に行わせるプログラムであって、前記プログラムは、情報処理装置を、発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、前記分割された音声信号をテキストデータに変換するテキスト変換部と、前記変換された音声データ及びテキストデータを蓄積させる蓄積部と、前記蓄積部から互いに対応する音声信号と前記テキストデータとを同期させて読み出す同期読出部と、前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部として機能させることを特徴とする。
【0018】
上記課題を解決するための第十二の発明は、発せられた音声に基づいて変換されたテキストデータを校正する校正システムを、情報処理装置に行わせるプログラムであって、前記プログラムは、情報処理装置を、発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、前記分割された音声信号をテキストデータに変換するテキスト変換部と、前記分割された音声信号を、前記テキスト変換部で生じる変換時間に近似した時間、遅延させる遅延部と、前記遅延部で遅延された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部として機能させることを特徴とする。
【0019】
上記課題を解決するための第十三の発明は、発せられた音声に基づいて変換されたテキストデータを校正する校正システムを、情報処理装置に行わせるプログラムであって、前記プログラムは、情報処理装置を、発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、前記分割された音声信号をテキストデータに変換するテキスト変換部と、テキストデータと、このテキストデータの元となる分割された音声信号とを互いに関連付ける識別情報を、前記テキストデータと前記分割された音声信号とに付装する識別情報付装部と、前記識別情報が付された音声信号と前記識別情報が付されたテキストデータとが蓄積された蓄積部から、互いに関連付けられた識別情報を持つテキストデータ及び音声信号を、先頭識別情報から順番に同期させて読み出す同期読出部と、前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部として機能させることを特徴とする。
【0020】
上記課題を解決するための第十四の発明は、上記第十から第十三のいずれかの発明において、前記プログラムは、情報処理装置を、前記同期読出部、又は遅延部から読み出された音声信号を、所定時間遅延させて前記校正実行部に出力する遅延部として更に機能させることを特徴とする。
【0021】
上記課題を解決するための第十五の発明は、上記第十から第十三のいずれかの発明において、前記プログラムは、情報処理装置を、前記同期読出部、又は遅延部から読み出された、テキストデータと音声信号とを結合する結合部として更に機能させることを特徴とする。
【0022】
上記課題を解決するための第十六の発明は、上記第十五の発明において、前記プログラムは、情報処理装置を、前記結合部で結合された音声信号及びテキストデータを分離した後、分離された音声信号を所定時間遅延させて前記校正実行部に出力する遅延部として更に機能させることを特徴とする。
【0023】
上記課題を解決するための第十七の発明は、上記第十から第十六のいずれかの発明において、前記プログラムは、情報処理装置を、前記同期読出部を、所定の間隔をおいて、テキストデータ及び音声信号を同期させて読み出す同期読出部として機能させることを特徴とする。
【0024】
上記課題を解決するための第十八の発明は、上記第十から第十七のいずれかの発明において、前記プログラムは、前記校正実行部を、前記テキストデータを表示させる表示部と、前記表示部に表示されているテキストデータに対応している音声を流す音声再生部と、校正者のアクションに基づいて、前記表示部に表示されているテキストデータに対応している音声を前記音声再生部に再生させるように制御する再生制御部として更に機能させることを特徴とする。
【0025】
【発明の実施の形態】
本発明の実施の形態を説明する。
【0026】
図1は本発明における校正システムの第一の実施の形態を示すブロック図であり、図2は本発明に係わる実施の形態を説明するための音声波形である。
【0027】
図1において、10は音声認識部であり、20は校正部である。
【0028】
音声認識部10は、音声信号変換部11と、テキスト変換部12とを有する。
【0029】
音声信号変換部11は、発せられた音声を音声信号に変換し、変換した音声信号を、例えば、息継ぎ箇所で区切り、複数の音声信号を生成するものである。息継ぎ箇所を認識して区切る方法の一例を、図2を用いて説明する。
【0030】
息継ぎ箇所、つまり一定時間、無音に近い箇所を認識するために、所定の閾値L及び時間Tsを予め決めておき、音声信号のレベルが時間Ts以上、閾値Lより小さくなった場合、息継ぎ箇所として認識する。例えば図2の如く、音声信号のレベルが閾値Lより小さくなるX1から、音声信号のレベルが閾値Lより大きくなるX2までの時間を測定し、この時間が予め決めておいた時間Tsを超えたと判定すると、無音状態の最初の箇所であるX1で区切るようにする方法が挙げられる。このような方法を用いて、発せられた音声を、図2のA1、A2、・・・Anというように区切ることができる。尚、閾値L及び所定の時間は、任意に設定可能である。又、発せられた音声を、複数に区切る方法は、上記以外の如何なる方法であっても良い。
【0031】
テキスト変換部12は、音声信号変換部11で生成された複数の音声信号をテキストデータに変換するものである。尚、入力された音声を認識してテキストデータに変換する技術は、数多くあるが、周知なので詳細は省略する。そして、本発明においては、如何なるものでも良い。
【0032】
校正部20は、遅延部21とバッファ22と同期読出部23と校正実行部24とを有する。
【0033】
遅延部21は、予め設定された遅延時間に従って、音声信号変換部11からの音声信号を遅延させてバッファ22に送信するものである。尚、遅延時間は、テキスト変換部12で音声データからテキストデータを作成するのに要する時間であり、任意に設定可能である。
【0034】
バッファ22は、FIFO型のバッファであり、音声信号とテキストデータとを蓄積するものである。
【0035】
同期読出部23は、バッファ22に蓄積されている音声信号及びテキストデータを先頭から読み出すものである。
【0036】
校正実行部24は、校正者が校正するために使用するための装置である。
【0037】
次に、上述システムにおける動作を説明する。
【0038】
図3は、第一の実施の形態を示すフローチャートである。
【0039】
まず、発せられた音声は、音声信号変換部11で複数の音声信号に変換され、遅延部21とテキスト変換部12とに送信される(ステップS1)。
【0040】
テキスト変換部12に送信された音声信号は、テキストデータに変換されてバッファ22に送信される(ステップS2)。
【0041】
一方、遅延部21に送信された複数の音声信号は、遅延部21により、テキスト変換部12で変換に要する時間だけ遅延され、バッファ22に送信される(ステップS3)。
【0042】
送信された音声信号とテキストデータとは、送信された順にバッファ22に蓄積される(ステップS4)。
【0043】
バッファ22に音声信号及びテキストデータが蓄積されると、同期読出部23は、蓄積された順に、すなわち、対応する音声信号とテキストデータとを同期させて読み出し、校正実行部24に送信する(ステップS5)。
【0044】
校正実行部24から出力された音声信号はイヤホン等を介して音声として流され、校正実行部24から出力されたテキストデータはテキストとしてモニタ等に表示される(ステップS6)。
【0045】
校正者は、流れてくる音声と表示されるテキストとを比べ、両者に相違があると、校正実行部24を用いてテキストデータを校正する(ステップS7)。
【0046】
このような構成によれば、校正者は表示されたテキストに同期して、このテキストに対応する音声が聞かれるので、間違っている箇所を直ぐに発見することができ、校正の効率を上げることができる。
【0047】
次に、本発明における第二の実施の形態について説明する。
【0048】
第一の実施の形態では、テキストデータに変換する時間だけ、音声信号を遅延する遅延部を設けることにより、音声信号とテキストデータとを同期させるように構成した。しかしながら、テキストデータに変換する変換時間は変化する場合があり、完全な同期は期し難い場合がある。そこで、第2の実施の形態では、第一の実施の形態の構成に加え、識別情報付装部13を設け、より正確に音声信号とテキストデータとを同期させるように構成したことを特徴とする。
【0049】
図4は本発明における第二の実施の形態を示すブロック図である。尚、第一の実施の形態と同様な構成のものについては、同一の番号を付して詳細な説明は省略する。
【0050】
識別情報付装部13は、0から+1づつカウントアップするカウンタ100を有し、音声信号変換部11により分割された音声信号の各々を一意に識別する識別番号を、各分割された音声信号に付するものである。例えば、図5に示す如く、分割された音声信号、「あす」、「は」、「はれです」があるとすると、「あす」、「は」、「はれです」を一意に識別するように「あす」には識別番号“1”、「は」には識別番号“2”、「はれです」には“3”というように、カウンタ100から得られる識別番号を付す。尚、識別番号が付された音声信号は、バッファ22に出力される。
【0051】
テキスト変換部12は、識別情報付装部13から出力される識別番号付きの音声信号をテキストデータに変換し、このテキストデータに音声信号に付されていた識別番号を付して出力する。例えば、「あす」という音声信号を変換して得られたテキストデータには、「あす」の識別番号である“1”を付す。同様に「は」という音声信号を変換して得られたテキストデータには、「は」の識別番号である“2”を付す。同様に、「はれです」という音声信号を変換して得られたテキストデータには、「はれです」の識別番号である“3”を付す。尚、識別番号が付されたテキストデータは、バッファ22に出力される。
【0052】
同期読出部23は、同一の識別番号が付された音声信号及びテキストデータを、バッファ22に蓄積されているデータの中から、先頭の識別番号順に検索する。そして、同一識別番号の音声信号とテキストデータとを同期させて出力する。
【0053】
次に、第二の実施の形態における動作を説明する。
【0054】
図6は、第二の実施の形態を示すフローチャートである。
【0055】
まず、発せられた音声は、音声信号変換部11で複数の音声信号に変換され、識別情報付装部13に出力される(ステップS21)。
【0056】
識別情報付装部13では、分割された音声信号に対して、カウンタ100から得られる識別番号が、1、2、3、・・・nというように順次付されていき、バッファ22とテキスト変換部12とに出力される(ステップS22)。
【0057】
テキスト変換部12に送信された識別番号付きの音声信号はテキストデータに変換され、同一の識別番号が付されたテキストデータがバッファ22に出力される(ステップS23)。
【0058】
送信された音声信号とテキストデータとは、送信された順にバッファ22に蓄積される(ステップS24)。
【0059】
バッファ22に音声信号とテキストデータとが蓄積されると、同期読出部23は、バッファ22の中から、同一の識別番号が付されている音声信号とテキストデータとを先頭識別番号から順番に検索する(ステップS25)。そして、同一識別番号が付された音声信号とテキストデータとを同期させて読み出し、校正実行部24に送信する(ステップS26)。
【0060】
校正実行部24から出力された音声信号はイヤホン等を介して音声として流され、校正実行部24から出力されたテキストデータはテキストとしてモニタ等に表示される(ステップS27)。
【0061】
校正者は、流れてくる音声と表示されるテキストとを比べ、両者に相違があると、校正実行部24を用いてテキストデータを校正する(ステップS28)。
【0062】
このような構成によれば、音声信号とテキストデータとを、正確に同期させて出力することができる。
【0063】
次に第三の実施の形態について説明する。
【0064】
第二の実施の形態では、テキストデータと、このテキストデータの元となる分割された音声信号とに同一の識別番号を付して、先頭の識別番号順に同期させて読み出すように構成した。しかしながら、音声認識装置で発せられた音声を音声信号とテキストデータとに変換後、LANを介して校正部に送信する場合、テキストデータと、このテキストデータの元となる分割された音声信号とを結合させて送信した方が、校正部での音声とテキストとの同期が簡易になる。そこで、第三の実施の形態では、第二の実施の形態の構成に加え、結合部25を設け、テキストデータと、このテキストデータの元となる分割された音声信号とを結合させて、校正部に送信
するように構成したことを特徴とする。
【0065】
図7は本発明における第三の実施の形態を示すブロック図である。尚、第二の実施の形態と同様な構成のものについては、同一の番号を付して詳細な説明は省略する。
【0066】
結合部25は、同期読出部23が読み出したテキストデータ及び音声信号を結合し、校正実行部24に出力するものである。例えば、同一の識別番号が付された音声信号とテキストデータとを、図8に示すようなデータ形式になるように結合する。
【0067】
次に第三の実施の形態における動作の説明をする。
【0068】
図9は、第三の実施の形態を示すフローチャートである。
【0069】
まず、発せられた音声は、音声信号変換部11で複数の音声信号に変換され、識別情報付装部13に出力される(ステップS31)。
【0070】
識別情報付装部13では、分割された音声信号に対して、カウンタ100から得られる識別番号が、1、2、3、・・・nというように順次付されていき、バッファ22とテキスト変換部12とに出力される(ステップS32)。
【0071】
テキスト変換部12に送信された識別番号付きの音声信号はテキストデータに変換され、同一の識別番号が付されたテキストデータがバッファ22に出力される(ステップS33)。
【0072】
送信された音声信号とテキストデータとは、送信された順にバッファ22に蓄積される(ステップS34)。
【0073】
バッファ22に音声信号とテキストデータとが蓄積されると、同期読出部23は、バッファ22の中から、同一の識別番号が付されている音声信号とテキストデータとを先頭識別番号から順番に検索する(ステップS35)。そして、同一識別番号が付された音声信号とテキストデータとを同期させて読み出し、結合部25に送信する(ステップS36)。
【0074】
結合部25に送信された音声信号とテキストデータとは結合され、校正実行部24に送信する(ステップS37)。
【0075】
校正実行部24から出力された音声信号はイヤホン等を介して音声として流され、校正実行部24から出力されたテキストデータはテキストとしてモニタ等に表示される(ステップS38)。
【0076】
校正者は、流れてくる音声と表示されるテキストとを比べ、両者に相違があると、校正実行部24を用いてテキストデータを校正する(ステップS39)。
【0077】
このような構成によれば、テキストデータと、このテキストデータの元となる分割された音声信号とを結合させてから校正部に送信しているので、校正部での音声とテキストとの同期が簡易なものですむ。
【0078】
尚、上述した第1、第2及び第3の実施の形態において、同期読出部23で読み出された音声信号を、所定時間遅延させて校正実行部に出力する遅延部を更に有する構成でもよい。このような構成によれば、テキストデータが先にモニタ等にテキストとして表示されるので、テキストの内容を確認した後にイヤホン等を介して流される音声を聞くことができるので、誤り箇所を容易に発見できる。
【0079】
更に、上述した第1、第2及び第3の実施の形態における同期読出部23は、蓄積部23からテキストデータと音声信号とを同期させて順次読み出すにあたって、所定の間隔をおいて順次読み出していく構成でもよい。このような構成によれば、校正者は時間的な余裕を持って、表示されるテキストとこれに対応している音声が聞かれるので、一つの校正をしている間に次々と音声が先行して流れる恐れが無い。
【0080】
次に第四の実施の形態について説明する。
【0081】
第四の実施の形態は、上述した第1、第2及び第3の実施の形態における校正実行部に、図10に示すような再生制御部240、表示部241、音声再生部242、及び再生ボタン243を加えたものである。
【0082】
このような構成によると、通常はテキストのみが表示部241に表示される。そして、再生制御部240は、校正者が再生ボタン243を押下した時のみ、表示部241に表示されているテキストに対応している音声を音声再生部242が流すように制御する。
【0083】
このような構成によれば、表示されているテキストに誤り箇所がある場合だけ音声を流すことができるので、校正者は校正作業をスムーズに行うことができる。
【0084】
又、この再生制御部240は、再生ボタン243を押下すれば、表示部241に表示されているテキストに対応している音声を音声再生部242が何度でも繰り返して流すよう制御するものであってもよい。このような構成によれば、校正者は音声を聞き漏らしても音声を再度聞くことができ、更に、校正後、確認のために音声を再度聞くことができるので、表示されているテキストの誤り箇所を見逃す恐れが無い。
【0085】
【発明の効果】本発明によれば、校正者は表示されたテキストに同期して、このテキストに対応する音声が聞かれるので、間違っている箇所を直ぐに発見することができ、校正の効率を上げることができる。
【0086】
本発明によれば、音声信号とテキストデータとに識別情報を付したことにより、音声信号とテキストデータとを、正確に同期させて出力することができる。
【0087】
本発明によれば、テキストデータと、このテキストデータの元となる分割された音声信号とを結合させてから校正部に送信しているので、校正部での音声とテキストとの同期が簡易なものですむ。
【0088】
本発明によれば、テキストデータが先にモニタ等に表示されるので、テキストの内容を確認した後にイヤホン等を介して流される音声を聞くことができ、校正箇所を容易に発見できる。
【0089】
本発明によれば、テキストデータと音声信号とを、所定の間隔をおいて、同期させて順次読み出していくので、校正者は時間的な余裕を持って、表示されるテキストとこれに対応している音声を聞くことができ、校正箇所を見逃す恐れが無い。
【0090】
本発明によれば、校正者の指示に従って、表示されているテキストに対応している音声を流すことができるので、表示されているテキストに誤り箇所がある場合だけ音声を流すことができ、校正作業をスムーズに行うことができる。
【0091】
本発明によれば、表示されているテキストに対応している音声を校正者の指示に従って繰り返すことができるので、音声を聞き漏らした場合に音声を再度聞くことができ、更に、校正後の確認のために音声を再度聞くことができる。
【0092】
【図面の簡単な説明】
【図1】図1は、本発明に係わる第一の実施の形態を示すブロック図である。
【図2】図2は、本発明に係わる実施の形態を説明するための音声波形である。
【図3】図3は、本発明に係わる第一の実施形態の動作を示すフローチャートである。
【図4】図4は、本発明に係わる第二の実施形態を示すブロック図である。
【図5】図5は、本発明に係わる実施形態を説明するための音声波形である。
【図6】図6は、本発明に係わる第二の実施形態の動作を示すフローチャートである。
【図7】図7は本発明に係わる第三の実施形態を示すブロック図である。
【図8】図8は本発明に係わる第三の実施形態におけるデータの図である。
【図9】図9は、本発明に係わる第三の実施形態の動作を示すフローチャートである。
【図10】図10は、本発明に係わる実施形態を示すブロック図である。
【符号の説明】
1 校正システム
10 音声認識部
11 音声信号変換部
12 テキスト変換部
13 識別情報付装部
20 校正部
21 遅延部
22 バッファ
23 同期読出部
24 校正装置
25 結合部
100 カウンタ
240 再生制御部
241 表示部
242 音声再生部
243 再生ボタン

Claims (18)

  1. 発せられた音声に基づいて変換されたテキストデータを校正する校正システムであって、
    発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、
    前記分割された音声信号をテキストデータに変換するテキスト変換部と、
    互いに対応している前記音声信号と前記テキストデータとを同期させて読み出す同期読出部と、
    前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部と
    を有することを特徴とする校正システム。
  2. 発せられた音声に基づいて変換されたテキストデータを校正する校正システムであって、
    発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、
    前記分割された音声信号をテキストデータに変換するテキスト変換部と、
    前記変換された音声データ及びテキストデータを蓄積させる蓄積部と、
    前記蓄積部から互いに対応する音声信号と前記テキストデータとを同期させて読み出す同期読出部と、
    前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部と
    を有することを特徴とする校正システム。
  3. 発せられた音声に基づいて変換されたテキストデータを校正する校正システムであって、
    発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、
    前記分割された音声信号をテキストデータに変換するテキスト変換部と、
    前記分割された音声信号を、前記テキスト変換部で生じる変換時間に近似した時間、遅延させる遅延部と、
    前記遅延部で遅延された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部と
    を有することを特徴とする校正システム。
  4. 発せられた音声に基づいて変換されたテキストデータを校正する校正システムであって、
    発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、
    前記分割された音声信号をテキストデータに変換するテキスト変換部と、
    テキストデータと、このテキストデータの元となる分割された音声信号とを互いに関連付ける識別情報を、前記テキストデータと前記分割された音声信号とに付装する識別情報付装部と、
    前記識別情報が付された音声信号と、前記識別情報が付されたテキストデータとが蓄積される蓄積部と、
    互いに関連付けられた識別情報を持つテキストデータ及び音声信号を、先頭識別情報から順番に、前記蓄積部から同期させて読み出す同期読出部と、
    前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部と
    を有することを特徴とする校正システム。
  5. 前記同期読出部、又は遅延部から読み出された音声信号を、所定時間遅延させて前記校正実行部に出力する遅延部を更に有することを特徴とする請求項1から請求項4のいずれかに記載の校正システム。
  6. 前記同期読出部、又は遅延部から読み出された、テキストデータと音声信号とを結合する結合部を更に有することを特徴とする請求項1から請求項4のいずれかに記載の校正システム。
  7. 前記結合部で結合された音声信号及びテキストデータを分離した後、分離された音声信号を所定時間遅延させて前記校正実行部に出力する遅延部を更に有することを特徴とする請求項6に記載の校正システム。
  8. 前記同期読出部は、所定の間隔をおいて、テキストデータ及び音声信号を同期させて読み出す同期読出部であることを特徴とする請求項1から請求項7のいずれかに記載の校正システム。
  9. 前記校正実行部は、
    前記テキストデータを表示させる表示部と、
    前記表示部に表示されているテキストデータに対応している音声を流す音声再生部と、
    校正者のアクションに基づいて、前記表示部に表示されているテキストデータに対応している音声を前記音声再生部に再生させるように制御する再生制御部とを更に有することを特徴とする請求項1から請求項8のいずれかに記載の校正システム。
  10. 発せられた音声に基づいて変換されたテキストデータを校正する校正システムを、情報処理装置に行わせるプログラムであって、
    前記プログラムは、情報処理装置を、
    発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、
    前記分割された音声信号をテキストデータに変換するテキスト変換部と、
    互いに対応している前記音声信号と前記テキストデータとを同期させて読み出す同期読出部と、
    前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部と
    して機能させることを特徴とするプログラム。
  11. 発せられた音声に基づいて変換されたテキストデータを校正する校正システムを、情報処理装置に行わせるプログラムであって、
    前記プログラムは、情報処理装置を、
    発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、
    前記分割された音声信号をテキストデータに変換するテキスト変換部と、
    前記変換された音声データ及びテキストデータを蓄積させる蓄積部と、
    前記蓄積部から互いに対応する音声信号と前記テキストデータとを同期させて読み出す同期読出部と、
    前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部と
    して機能させることを特徴とするプログラム。
  12. 発せられた音声に基づいて変換されたテキストデータを校正する校正システムを、情報処理装置に行わせるプログラムであって、
    前記プログラムは、情報処理装置を、
    発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、
    前記分割された音声信号をテキストデータに変換するテキスト変換部と、
    前記分割された音声信号を、前記テキスト変換部で生じる変換時間に近似した時間、遅延させる遅延部と、
    前記遅延部で遅延された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部と
    して機能させることを特徴とするプログラム。
  13. 発せられた音声に基づいて変換されたテキストデータを校正する校正システムを、情報処理装置に行わせるプログラムであって、
    前記プログラムは、情報処理装置を、
    発せられた一連の音声を音声信号に変換し、複数の音声信号に分割する音声信号変換部と、
    前記分割された音声信号をテキストデータに変換するテキスト変換部と、
    テキストデータと、このテキストデータの元となる分割された音声信号とを互いに関連付ける識別情報を、前記テキストデータと前記分割された音声信号とに付装する識別情報付装部と、
    前記識別情報が付された音声信号と、前記識別情報が付されたテキストデータとが蓄積された蓄積部から、互いに関連付けられた識別情報を持つテキストデータ及び音声信号を、先頭識別情報から順番に同期させて読み出す同期読出部と、
    前記同期読出部で読み出された音声信号から得られた音声に基づいて、テキストデータを校正する校正実行部と
    して機能させることを特徴とするプログラム。
  14. 前記プログラムは、情報処理装置を、前記同期読出部、又は遅延部から読み出された音声信号を、所定時間遅延させて前記校正実行部に出力する遅延部として更に機能させることを特徴とする請求項10から請求項13のいずれかに記載のプログラム。
  15. 前記プログラムは、情報処理装置を、前記同期読出部、又は遅延部から読み出された、テキストデータと音声信号とを結合する結合部として更に機能させることを特徴とする請求項10から請求項13のいずれかに記載のプログラム。
  16. 前記プログラムは、情報処理装置を、前記結合部で結合された音声信号及びテキストデータを分離した後、分離された音声信号を所定時間遅延させて前記校正実行部に出力する遅延部として更に機能させることを特徴とする請求項15に記載のプログラム。
  17. 前記プログラムは、情報処理装置を、前記同期読出部を、所定の間隔をおいて、テキストデータ及び音声信号を同期させて読み出す同期読出部として機能させることを特徴とする請求項10から請求項16のいずれかに記載のプログラム。
  18. 前記プログラムは、前記校正実行部を、
    前記テキストデータを表示させる表示部と、
    前記表示部に表示されているテキストデータに対応している音声を流す音声再生部と、
    校正者のアクションに基づいて、前記表示部に表示されているテキストデータに対応している音声を前記音声再生部に再生させるように制御する再生制御部として更に機能させることを特徴とする請求項10から請求項17のいずれかに記載の校正システム。
JP2003032229A 2003-02-10 2003-02-10 校正システム Pending JP2004240920A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003032229A JP2004240920A (ja) 2003-02-10 2003-02-10 校正システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003032229A JP2004240920A (ja) 2003-02-10 2003-02-10 校正システム

Publications (2)

Publication Number Publication Date
JP2004240920A true JP2004240920A (ja) 2004-08-26
JP2004240920A5 JP2004240920A5 (ja) 2006-01-26

Family

ID=32958536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003032229A Pending JP2004240920A (ja) 2003-02-10 2003-02-10 校正システム

Country Status (1)

Country Link
JP (1) JP2004240920A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014136534A1 (ja) 2013-03-07 2014-09-12 Necソリューションイノベータ株式会社 理解支援システム、理解支援サーバ、理解支援方法、及びコンピュータ読み取り可能な記録媒体
JP2019185005A (ja) * 2018-04-13 2019-10-24 株式会社Tbsテレビ 音声認識テキストデータ出力制御装置、音声認識テキストデータ出力制御方法、及びプログラム
JP2020052264A (ja) * 2018-09-27 2020-04-02 富士通株式会社 音声再生区間の制御方法、音声再生区間の制御プログラムおよび情報処理装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014136534A1 (ja) 2013-03-07 2014-09-12 Necソリューションイノベータ株式会社 理解支援システム、理解支援サーバ、理解支援方法、及びコンピュータ読み取り可能な記録媒体
JP2019185005A (ja) * 2018-04-13 2019-10-24 株式会社Tbsテレビ 音声認識テキストデータ出力制御装置、音声認識テキストデータ出力制御方法、及びプログラム
JP2020052264A (ja) * 2018-09-27 2020-04-02 富士通株式会社 音声再生区間の制御方法、音声再生区間の制御プログラムおよび情報処理装置
US11386684B2 (en) 2018-09-27 2022-07-12 Fujitsu Limited Sound playback interval control method, sound playback interval control program, and information processing apparatus
JP7159756B2 (ja) 2018-09-27 2022-10-25 富士通株式会社 音声再生区間の制御方法、音声再生区間の制御プログラムおよび情報処理装置

Similar Documents

Publication Publication Date Title
JP3629253B2 (ja) 音声再生装置および同装置で用いられる音声再生制御方法
US20130204605A1 (en) System for translating spoken language into sign language for the deaf
JP5093239B2 (ja) 文字情報提示装置
CN106658135B (zh) 一种音视频播放方法及装置
JP2009139592A (ja) 音声処理装置、音声処理システム及び音声処理プログラム
JP2008172409A (ja) 収音装置及び音声伝送システム
TW200806050A (en) Method and system for synchronizing audio and video data signals
KR102044689B1 (ko) 방송자막 제작 시스템 및 방법
JP2013187765A (ja) 映像音声処理装置
ES2370218B1 (es) Procedimiento y dispositivo para sincronizar subtítulos con audio en subtitulación en directo.
JP2010112981A (ja) 遠隔実演再生方法、装置
JP2013025299A (ja) 書き起こし支援システムおよび書き起こし支援方法
JP2011066544A (ja) ネットワーク・スピーカシステム、送信装置、再生制御方法、およびネットワーク・スピーカプログラム
JP2008299032A (ja) 語学教材および文字データ再生装置
JP5727777B2 (ja) 会議支援装置および会議支援方法
JP2004240920A (ja) 校正システム
JP2012208218A (ja) 電子機器
JP2002369163A (ja) マルチストリーム出力時刻制御方法及びその制御装置
JP5325059B2 (ja) 映像音声同期再生装置、映像音声同期処理装置、映像音声同期再生プログラム
US9570056B2 (en) Audio data synthesis method, audio output method, and program for synthesizing audio data based on a time difference
JP4381108B2 (ja) 話速変換装置における時報処理装置
JP2002229576A (ja) 携帯カラオケ端末、模範歌唱信号送出装置および携帯カラオケシステム
JP2008066931A (ja) 映像音声再生システムおよびこれを構成する映像音声同期再生装置
JP2005196074A (ja) 演奏システム及び楽音映像再生装置
KR100447371B1 (ko) 녹음 비교 기능을 갖는 어학 학습 장치 및 이를 이용한어학학습 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051130

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070704

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070903

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080109