JPH1141538A - 音声認識文字表示装置 - Google Patents

音声認識文字表示装置

Info

Publication number
JPH1141538A
JPH1141538A JP9192906A JP19290697A JPH1141538A JP H1141538 A JPH1141538 A JP H1141538A JP 9192906 A JP9192906 A JP 9192906A JP 19290697 A JP19290697 A JP 19290697A JP H1141538 A JPH1141538 A JP H1141538A
Authority
JP
Japan
Prior art keywords
character
image
data
voice
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9192906A
Other languages
English (en)
Inventor
Megumi Sakurai
恵 櫻井
Yasushi Sugita
靖 杉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Home Electronics Ltd
NEC Corp
Original Assignee
NEC Home Electronics Ltd
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Home Electronics Ltd, Nippon Electric Co Ltd filed Critical NEC Home Electronics Ltd
Priority to JP9192906A priority Critical patent/JPH1141538A/ja
Publication of JPH1141538A publication Critical patent/JPH1141538A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識した話者音声をテロップ形式で画面
表示することにより、画像と文字により情報が重層的に
理解できるようにする。 【解決手段】 音声入力を認識して音声データを出力す
る音声認識部22が供給する音声データを、画像変換部
25が発声順に連なって移動する文字列からなる文字画
像データに変換し、この文字画像データを映像信号に挿
入して合成したものを表示手段であるモニタ受像機33
に画面表示する。画面上で文字が発声順に、右から左へ
と連なって移動するよう文字データを画像変換し、コン
ピュータ映像やビデオ画像に合成してテロップ表示する
ことができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識された文
字をテロップ形式でモニタ受像機に画面表示するように
した音声文字認識表示装置に関する。
【0002】
【従来の技術】音声認識された文字を文字列として送出
し、字幕スーパーとして文字列を画面に表示する音声認
識文字表示装置が提案されている。例えば、特開昭61
−264882号「不特定話者の音声入力装置を用いた
TV・及モニターディスプレイにおける字幕スーパー文
字表示システムに関する方法」には、不特定話者の音声
認識機能を有する音声入力装置を用い、音声を文字に変
換し、モニター用テレビ及びモニターディスプレイ画面
下部の字幕スーパーとして文字を表示するようにした装
置が開示されている。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の音声認識文字表示装置は、字幕スーパーの表示位置
として指定された箇所に表示できる文字数に制限がある
ため、音声認識された発声内容が長文の場合は文字デー
タを一括して表示できず、こうした場合に話し手の喋る
速度に文字スーパー表示が追いつかないことがあり、ま
た話し手の音声が途切れたときに画面上に何らの表示も
なされないため、音声ボリュームを絞って画面を見てい
るときや聴覚障害者が字幕スーパーを頼りに画面を見る
ような場合に、話者が発言中なのか或いはモニタ受像機
自体が故障しているのかが判別できないために焦燥感に
駆られることがある等の課題があった。
【0004】本発明は、上記課題を解決したものであ
り、音声認識した話者音声をテロップ形式で画面表示す
ることにより、画像と文字により情報が重層的に理解で
きるようにする。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、音声入力を認識して文字データを出力す
る音声認識手段と、該音声認識手段の出力文字データを
供給され、発声順に連なって移動する文字列からなる文
字画像データに変換する画像変換部と、該画像変換部の
出力文字画像データを映像信号に挿入して合成する画像
合成部と、該画像合成部の出力を画面表示する表示手段
とを具備することを特徴としている。
【0006】また、本発明は、前記音声認識手段が、予
め設定されたしきい値レベル以下の音声入力について
は、無音であることを示す文字データを生成すること、
或いは音声入力があっても音声認識できない場合は、音
声認識不能であることを示す文字データを生成すること
等を特徴とするものである。
【0007】さらにまた、前記画像変換部は、文字デー
タに対応する文字フォントデータを格納した文字フォン
トROMと、前記発声順に供給される文字データを受
け、前記文字フォントROMから対応する文字フォント
データを読み出し、文字を画像として表示するのに必要
な文字画像データを生成する文字画像生成部と、画面の
1行分又は1列分を越えるメモリ容量を備え、前記文字
画像生成部の出力をシフトパルスに同期して1文字ずつ
シフトさせながら書き込まれ、前記1行分又は1列分の
文字画像データを読み出して前記画像合成部に供給する
表示メモリとを具備することを特徴とするものである。
【0008】
【発明の実施の形態】以下、本発明の実施形態を図1,
2を参照して説明する。図1は、本発明の音声認識文字
表示装置の一実施形態を示すブロック構成図、図2は、
図1に示した音声画像データ変換器の詳細回路構成図で
ある。
【0009】図1に示す音声認識文字表示装置1は、音
声を文字認識した上で画像データに変換する音声画像デ
ータ変換器2と、画像データに変換された音声をモニタ
画面上のテロップとして表示する表示器3とから構成さ
れる。音声画像データ変換器2は、音声を集音するマイ
クロフォン21と、このマイクロフォン21が接続され
た音声認識部22と、この音声認識部22の出力を格納
するバッファメモリ23と、バッファメモリ23への文
字データの書き込みを制御する制御部24と、バッファ
メモリ23から読み出される文字データを発声順に1文
字づつ取り出し、文字が発声順に連なって移動する文字
列からなる文字画像データに変換する画像変換部25と
から構成される。本実施形態では、音声認識部22と制
御部24とが音声認識手段を構成する。一方また、表示
器3は、パーソナルコンピュータやビデオ機器といった
映像信号源4から映像信号が供給される映像信号入力部
31と、この映像信号入力部31の出力と前記画像変換
部25の出力とを合成する画像合成部32と、画像合成
部31の出力画像を表示する表示手段としてのモニタ受
像機33とからなる。
【0010】音声画像データ変換器2内の音声認識部2
2は、入力された音声信号を、平仮名かカタカナ又はか
な漢字交じり文字に変換するものであり、音声入力があ
っても音声認識できない場合は、音声認識不能であるこ
とを示す認識不能信号Aを生成し、これを制御部24に
供給する。バッファメモリ23は、音声認識部22にお
いて文字データに変換された音声について、文字表示速
度よりも速い速度をもって発言された音声について認識
した文字を一時的に蓄えておく働きをする。制御部24
は、マイクロフォン21を介して入力される音声信号を
監視し、音声信号レベルが予め定めたしきい値レベル以
下になったときは、発声がないと判断し、音声認識部2
2からバッファメモリ23へのデータ送出を中止すると
ともに無音であることを示す文字データ例えば「・」を
生成し、これをバッファメモリ23に書き込む働きをす
る。また、音声認識部22から前記認識不能信号Aが供
給された場合は、音声信号と認識不能信号Aの両入力の
存在を確認した上で、音声認識がなされていないことを
示す文字データ例えば「?」を生成し、バッファメモリ
23に書き込む働きをする。
【0011】ただし、制御部24は、バッファメモリ2
3の記憶状態を常に監視しており、無音を示す文字デー
タ「・」或いは認識不能を示す文字データ「?」につい
ては、バッファメモリ23が空である場合、すなわちバ
ッファメモリ23に格納された他の文字データが存在し
ない場合にだけ、バッファメモリ23に書き込むよう自
己規制するようにしてある。これは、バッファメモリ2
3が僅かでも文字データで埋まっているときに、無音を
示す文字データ「・」や認識不能を示す文字データ
「?」が次々と縦列的に格納されてしまい、次に発言が
なされたときに音声認識された文字データが、「・」や
「?」といった文字データをバッファメモリ23から掃
き出し終えるまで表示されないといった不都合を排除
し、即応性を高めるという理由からである。
【0012】さらにまた、上記制御部24は、バッファ
メモリ23に蓄えられた文字データを読みやすい速さで
もって読み出し、画像変換部25に発声順に送り出す働
きをする。また、バッファメモリ23及び画像変換部2
5内の表示メモリ25cの読み書きを制御するため、制
御部24はシフトパルス発生回路24aを内蔵してお
り、このシフトパルス発生回路24aから読みやすい速
度で文字を送出するためのパルスD(周期T)をバッフ
ァメモリ23に供給するとともに、文字を構成するドッ
トの横又は縦方向のドット数nをパルスDの周期Tに乗
じた周期nTのパルスEを、表示メモリ25cに供給す
る。これにより、表示メモリ25cに格納される文字画
像データは、ドット単位でシフトしながら移動させられ
る。
【0013】画像変換部25は、バッフアメモリ23か
ら送られてくる文字データを画像データに変換し、画面
上で文字が例えば右から左へ順に連なって移動するよう
に文字画像データを生成する。この画像変換部25は、
図2に示したように、文字フォントROM25aと文字
画像生成部25bと表示メモリ25cとから構成され
る。文字フォントROM25aは、文字フォントデータ
を格納した読み出し専用メモリであり、音声認識部22
の認識対象に含まれるあらゆる文字データに対応する文
字フォントデータが格納してある。文字画像生成部25
bは、バッファメモリ23からシフトパルスDに同期し
て送出される文字データを受け、文字フォントROM2
5aから文字データに対応する文字フォントデータを読
み出し、文字を画像として表示するのに必要な文字画像
データを生成し、これを表示メモリ25cに送出する。
表示メモリ25cは、画面に表示する1行分又は1列分
の文字数に1文字分を加えたメモリ容量を有しており、
文字画像生成部25bから供給される文字画像データ
を、制御部24が内蔵するシフトパルス発生回路24a
から供給されるシフトパルスEに従ってシフトする。す
なわち、文字画像データに含まれる文字を構成する文字
フォントデータがシフトパルスEに従ってドット単位で
画面の横方向又は縦方向にシフトすることで、テロップ
形式で移動表示される文字画像が表示メモリ25cに書
き込まれる。また、表示メモリ25cに書き込まれたデ
ータは1行分又は1列分が読み出され、これが背景画像
に合成されて画面表示に供される。表示メモリ25cか
らの文字画像データの送出は、表示文字の移動と同期し
ているため、表示メモリ25cの入力側が1文字分空く
と次の文字画像データが送り込まれる。
【0014】ここで、展示会場等の展示ブースにおい
て、例えば新製品の宣伝或いは商品アプリケーション等
を説明するビデオ映像を映像信号源4から発し、モニタ
受像機33にて再生し、聴衆に対して随所に解説を加え
る映像プレゼンテーションを行う場合の動作について説
明する。この場合、解説者の音声はマイクロフォン21
を介して音声認識部22に取り込まれる。音声認識部2
2は、音声認識により話者音声を文字データに変換し、
逐次バッファメモリ23に格納していく。同時にまた、
話者音声が途切れたときや入力音声が認識不能である場
合は、制御部24が、バッファメモリ23に文字データ
が格納されていないことを確認した上で、無音部である
ことを示す文字データ「・」や認識不能を示す文字デー
タ「?」をバッファメモリ23に書き込む。
【0015】ところで、音声認識部22と制御部24か
ら送出された文字データが、バッファメモリ23から読
み出される文字データの速度を上回る場合は、バッファ
メモリ23に書き込まれた文字データの終端Bが、図2
に示すごとく縦列配列状態に図示したメモリセル上を右
側へ移動する。また、これとは逆に、音声認識部22と
制御部24から送出された文字データが、バッファメモ
リ23から読み出される文字データの速度に満たない場
合は、バッファメモリ23に書き込まれた文字データ上
の終端Bが、図2に示すメモリセル上を左側へ移動す
る。従って、文字データの入力が遅い場合は、バッファ
メモリ23に書き込まれた文字データ上の終端Bは最左
端の位置Cに移動し、文字データは直ちに文字画像生成
部25bに読み出される。
【0016】一方、画像変換部25内の文字画像生成部
25aは、シフトパルスDに同期してバッファメモリ2
3から送出される文字データを受け、文字フォントRO
M25aから文字データに対応する文字フォントデータ
を読み出す。さらに、読み出した文字フォントデータを
用い、文字を画像として表示するのに必要な文字画像デ
ータを生成し、これを表示メモリ25cに送出する。た
だし、文字データがヌルの場合は無音声を示す文字
「・」が読み出され、また文字データが認識不能を示す
文字データである場合は、認識不能を示す文字「?」が
読み出される。文字画像生成部25bから文字画像デー
タの供給を受けた表示メモリ25cは、制御部24が内
蔵するシフトパルス発生回路24aから供給されるシフ
トパルスEに従って文字画像データをシフトする。すな
わち、文字画像データに含まれる文字を構成する文字フ
ォントデータがシフトパルスEに従ってドット単位で画
面の横方向又は縦方向にシフトし、これによりテロップ
形式で移動する文字画像が表示メモリ25cに書き込ま
れる。
【0017】表示メモリ25cから読み出された文字画
像データは画像合成部32に供給され、画像変換部25
で生成された表示メモリ25cの入力側1文字分を除い
た文字画像データを、映像信号入力部を介して入力され
た映像信号に合成する。映像信号入力部31には、プレ
ゼンテーション用の映像信号がビデオテープレコーダや
パーソナルコンピュータといった映像信号源4から入力
されているため、この映像信号に横1ライン分或いは縦
1ライン分の文字画像データが合成される。この場合の
合成は、例えば背景画像となる映像信号の一部にブラン
キング処理を施し、このブランキング処理により空白と
なった箇所に文字画像データを挿入するPIP(Pictur
e In Picture)方式により行われる。
【0018】かくして、プロジェクタ等のモニタ受像機
33を用いたプレゼンテーションにおいて、プレゼンテ
ータ或いはアナウンサの話し声が例えば画面下部に右か
ら左へ読みやすい速さで送られ、聴衆は説明用ビデオ映
像の一部にプレゼンテータの喋る音声が文字化されたテ
ロップを読み取ることができ、聴覚と視覚を合わせた総
合理解が可能である。
【0019】このように、上記音声認識文字表示装置1
によれば、音声入力を認識して音声データを出力する音
声認識部22が供給する音声データを、画像変換部25
が発声順に連なって移動する文字列からなる文字画像デ
ータに変換し、この文字画像データを映像信号に挿入し
て合成したものを表示手段であるモニタ受像機33に画
面表示する構成としたから、展示ブースや展示会場等に
おけるプレゼンテーションや、或いは表示スクリーンを
使って講演する講演会などにおいて、視覚的な理解を助
けるために表示する映像の一部に、プレゼンテータや講
演者が発する音声を文字に変換して表示したり、或いは
またテレビジョン放送で流されるニュースなどに於い
て、アナウンサが発する音声を文字に変換して画面の一
部に表示したりでき、しかも画面表示される文字は例え
ば電光表示板に移動表示されるテロップのように、画面
を上下又は左右に移動しながら表示されるため、文字表
示領域に制約を受けることなく、発声速度によらず読み
取りやすい速度でもって余すところなく確実に表示する
ことができる。
【0020】また、音声認識部22が、予め設定された
しきい値レベル以下の音声入力については、無音声であ
ることを示す文字データを生成するようにしたから、発
言がないときは、画面の一部に「・・・」のごとく無音
声であることを示す文字が表示され、従って聴覚障害者
や或いは出力音声を絞る代わりにテロップ表示される文
字を参照しながら映像を見ている人は、無音声箇所を機
械の故障とは明確に区別した上で安心して映像を見るこ
とができる。
【0021】また、音声認識部22が、音声入力があっ
ても音声認識できない場合は、音声認識不能であること
を示す文字データを生成するから、発言があっても文字
認識できない場合は、画面の一部に「???」のごとく
文字認識不能であることを示す文字が表示され、従って
映像を見ながら解説を加えているプレゼンテータは、喋
っている内容が音声認識できていないことを了解し、再
度分かりやすい言葉で喋るなどの対処が可能であり、視
覚を重視した明確な情報伝達或いは意志疎通が可能であ
る。
【0022】さらにまた、画像変換部25は、文字デー
タに対応する文字フォントデータを格納した文字フォン
トROM25aと、発声順に供給される文字データを受
け、文字フォントROM25aから対応する文字フォン
トデータを読み出し、文字を画像として表示するのに必
要な文字画像データを生成する文字画像生成部25b
と、画面の1行分又は1列分を越えるメモリ容量を備
え、前記文字画像生成部の出力をシフトパルスに同期し
て1文字ずつシフトさせながら書き込まれ、前記1行分
又は1列分の文字画像データを読み出して画像合成部3
2に供給する表示メモリ25cとを具備するから、表示
メモリ25cに書き込む文字画像データのシフトパルス
を、視聴者が最も読み取りやすい速度でもって表示文字
が移動するような周期に決定しさえすれば、画面の1行
分又は1列分だけを使用して話者音声を的確に表示する
ことができ、聴覚障害者に対する情報伝達の徹底或いは
健常者に対する重層的な情報理解の徹底を図ることがで
きる。
【0023】なお、上記説明では、プレゼンテーション
を例に説明したが、音声認識文字表示装置1は、講演会
などの外に、例えばテレビ放送のニュースなどを音声認
識してテロップとして流すといった使用法も可能であ
る。
【0024】
【発明の効果】以上説明したように、本発明によれば、
音声入力を認識して音声データを出力する音声認識部が
供給する音声データを、画像変換部が発声順に連なって
移動する文字列からなる文字画像データに変換し、この
文字画像データを映像信号に挿入して合成したものを表
示手段に画面表示する構成としたから、展示ブースや展
示会場等におけるプレゼンテーションや、或いは表示ス
クリーンを使って講演する講演会などにおいて、視覚的
な理解を助けるために表示する映像の一部に、プレゼン
テータや講演者が発する音声を文字に変換して表示した
り、或いはまたテレビジョン放送で流されるニュースな
どに於いて、アナウンサが発する音声を文字に変換して
画面の一部に表示したりでき、しかも画面表示される文
字は例えば電光表示板に移動表示されるテロップのよう
に、画面を上下又は左右に移動しながら表示されるた
め、文字表示領域に制約を受けることなく、発声速度に
よらず読み取りやすい速度でもって余すところなく確実
に表示することができる等の優れた効果を奏する。
【0025】また、音声認識部が、予め設定されたしき
い値レベル以下の音声入力については、無音声であるこ
とを示す文字データを生成するようにしたから、発言が
ないときは、画面の一部に「・・・」のごとく無音声で
あることを示す文字が表示され、従って聴覚障害者や或
いは出力音声を絞る代わりにテロップ表示される文字を
参照しながら映像を見ている人は、無音声箇所を機械の
故障とは明確に区別した上で安心して映像を見ることが
できる等の効果を奏する。
【0026】また、音声認識部が、音声入力があっても
音声認識できない場合は、音声認識不能であることを示
す文字データを生成するから、発言があっても文字認識
できない場合は、画面の一部に「???」のごとく文字
認識不能であることを示す文字が表示され、従って映像
を見ながら解説を加えているプレゼンテータは、喋って
いる内容が音声認識できていないことを了解し、再度分
かりやすい言葉で喋るなどの対処が可能であり、視覚を
重視した明確な情報伝達或いは意志疎通が可能である等
の効果を奏する。
【0027】さらにまた、画像変換部は、文字データに
対応する文字フォントデータを格納した文字フォントR
OMと、前記発声順に供給される文字データを受け、前
記文字フォントROMから対応する文字フォントデータ
を読み出し、文字を画像として表示するのに必要な文字
画像データを生成する文字画像生成部と、画面の1行分
又は1列分を越えるメモリ容量を備え、前記文字画像生
成部の出力をシフトパルスに同期して1文字ずつシフト
させながら書き込まれ、前記1行分又は1列分の文字画
像データを読み出して前記画像合成部に供給する表示メ
モリとを具備するから、表示メモリに書き込む文字画像
データのシフトパルスを、視聴者が最も読み取りやすい
速度でもって表示文字が移動するような周期に決定しさ
えすれば、画面の1行分又は1列分だけを使用して話者
音声を的確に表示することができ、聴覚障害者に対する
情報伝達の徹底或いは健常者に対する重層的な情報理解
の徹底を図ることができる等の効果を奏する。
【図面の簡単な説明】
【図1】本発明の音声認識文字表示装置の一実施形態を
示すブロック構成図である。
【図2】図1に示した音声画像データ変換器の詳細回路
構成図である。
【符号の説明】
1 音声認識文字表示装置 2 音声データ変換器 3 表示器 4 映像信号源 21 マイクロフォン 22 音声認識手段(音声認識部) 23 バッファメモリ 24 音声認識手段(制御部) 24a シフトパルス発生回路 25 画像変換部 25a 文字フォントROM 25b 文字画像生成部 25c 表示メモリ 31 映像信号入力部 32 画像合成部 33 (表示手段)モニタ受像機

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 音声入力を認識して文字データを出力す
    る音声認識手段と、該音声認識手段の出力文字データを
    供給され、発声順に連なって移動する文字列からなる文
    字画像データに変換する画像変換部と、該画像変換部の
    出力文字画像データを映像信号に挿入して合成する画像
    合成部と、該画像合成部の出力を画面表示する表示手段
    とを具備することを特徴とする音声認識文字表示装置。
  2. 【請求項2】 前記音声認識手段は、予め設定されたし
    きい値レベル以下の音声入力については、無音であるこ
    とを示す文字データを生成することを特徴とする請求項
    1記載の音声認識文字表示装置。
  3. 【請求項3】 前記音声認識手段は、音声入力があって
    も音声認識できない場合は、音声認識不能であることを
    示す文字データを生成することを特徴とする請求項1記
    載の音声認識文字表示装置。
  4. 【請求項4】 前記画像変換部は、文字データに対応す
    る文字フォントデータを格納した文字フォントROM
    と、前記発声順に供給される文字データを受け、前記文
    字フォントROMから対応する文字フォントデータを読
    み出し、文字を画像として表示するのに必要な文字画像
    データを生成する文字画像生成部と、画面の1行分又は
    1列分を越えるメモリ容量を備え、前記文字画像生成部
    の出力をシフトパルスに同期して1文字ずつシフトさせ
    ながら書き込まれ、前記1行分又は1列分の文字画像デ
    ータを読み出して前記画像合成部に供給する表示メモリ
    とを具備することを特徴とする請求項1記載の音声文字
    認識表示装置。
JP9192906A 1997-07-17 1997-07-17 音声認識文字表示装置 Pending JPH1141538A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9192906A JPH1141538A (ja) 1997-07-17 1997-07-17 音声認識文字表示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9192906A JPH1141538A (ja) 1997-07-17 1997-07-17 音声認識文字表示装置

Publications (1)

Publication Number Publication Date
JPH1141538A true JPH1141538A (ja) 1999-02-12

Family

ID=16298955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9192906A Pending JPH1141538A (ja) 1997-07-17 1997-07-17 音声認識文字表示装置

Country Status (1)

Country Link
JP (1) JPH1141538A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992005692A1 (en) * 1990-09-27 1992-04-16 Kim, Sang, Myun An electronic float for fishing tackle
JP2002304286A (ja) * 2001-04-04 2002-10-18 Nec Viewtechnology Ltd 音声認識機能を内蔵した映像表示装置
US6556970B1 (en) 1999-01-28 2003-04-29 Denso Corporation Apparatus for determining appropriate series of words carrying information to be recognized
JP2006178087A (ja) * 2004-12-21 2006-07-06 Internatl Business Mach Corp <Ibm> 字幕生成装置、検索装置、文書処理と音声処理とを融合する方法、及びプログラム
US7953602B2 (en) 2004-11-08 2011-05-31 Panasonic Corporation Digital video reproducing apparatus for recognizing and reproducing a digital video content
JP2011139227A (ja) * 2009-12-28 2011-07-14 Brother Industries Ltd ヘッドマウントディスプレイ
JP2011150705A (ja) * 2011-02-10 2011-08-04 Necディスプレイソリューションズ株式会社 音声認識機能を内蔵した映像表示装置
KR101292563B1 (ko) * 2012-11-13 2013-08-09 주식회사 한글과컴퓨터 자막 출력 기반의 프레젠테이션 장치 및 방법
JP2015046016A (ja) * 2013-08-28 2015-03-12 株式会社リコー 画像処理サーバ、画像処理システム及びプログラム
CN108366305A (zh) * 2018-02-07 2018-08-03 深圳佳力拓科技有限公司 一种不带字幕的码流通过语音识别显示字幕的方法及系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1992005692A1 (en) * 1990-09-27 1992-04-16 Kim, Sang, Myun An electronic float for fishing tackle
US6556970B1 (en) 1999-01-28 2003-04-29 Denso Corporation Apparatus for determining appropriate series of words carrying information to be recognized
JP2002304286A (ja) * 2001-04-04 2002-10-18 Nec Viewtechnology Ltd 音声認識機能を内蔵した映像表示装置
US7953602B2 (en) 2004-11-08 2011-05-31 Panasonic Corporation Digital video reproducing apparatus for recognizing and reproducing a digital video content
JP2006178087A (ja) * 2004-12-21 2006-07-06 Internatl Business Mach Corp <Ibm> 字幕生成装置、検索装置、文書処理と音声処理とを融合する方法、及びプログラム
JP2011139227A (ja) * 2009-12-28 2011-07-14 Brother Industries Ltd ヘッドマウントディスプレイ
JP2011150705A (ja) * 2011-02-10 2011-08-04 Necディスプレイソリューションズ株式会社 音声認識機能を内蔵した映像表示装置
KR101292563B1 (ko) * 2012-11-13 2013-08-09 주식회사 한글과컴퓨터 자막 출력 기반의 프레젠테이션 장치 및 방법
JP2015046016A (ja) * 2013-08-28 2015-03-12 株式会社リコー 画像処理サーバ、画像処理システム及びプログラム
CN108366305A (zh) * 2018-02-07 2018-08-03 深圳佳力拓科技有限公司 一种不带字幕的码流通过语音识别显示字幕的方法及系统

Similar Documents

Publication Publication Date Title
JP4980018B2 (ja) 字幕生成装置
US7443449B2 (en) Information display apparatus, information display method and program therefor
US9298704B2 (en) Language translation of visual and audio input
US5677739A (en) System and method for providing described television services
KR20130029055A (ko) 청각 장애인을 위해 음성 언어를 수화로 번역하기 위한 시스템
US20020054047A1 (en) Image displaying apparatus
EP2315201B1 (en) Transmitting and receiving apparatus and method, computer program, and broadcasting system with speech to sign language conversion
JP2003345379A6 (ja) 音声映像変換装置及び方法、音声映像変換プログラム
WO2003079328A1 (fr) Appareil, procede et programme de conversion audio video
JPH09130750A (ja) 映像音声データ供給装置
JP6945130B2 (ja) 音声提示方法、音声提示プログラム、音声提示システム及び端末装置
JP2006041887A (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JPH1141538A (ja) 音声認識文字表示装置
JP2001186430A (ja) デジタル放送受信機
JP2005124169A (ja) 吹き出し字幕付き映像コンテンツ作成装置、送信装置、再生装置、提供システムならびにそれらで用いられるデータ構造および記録媒体
JP4789227B2 (ja) 音声認識機能を内蔵した映像表示装置
JP2005524867A (ja) 低ビットレートの分散型スライドショウ・プレゼンテーションを提供するシステムおよび方法
JP6172770B2 (ja) 要約筆記支援システム、情報配信装置、要約筆記支援方法、及びプログラム
CN115359796A (zh) 数字人手语播报方法、装置、设备及存储介质
KR20140084463A (ko) 화자 정보를 표시하는 장치 및 방법 그리고, 동영상을 편집하는 서버
JP5114578B2 (ja) 音声認識機能を内蔵した映像表示装置
JP4219129B2 (ja) テレビジョン受像機
JPH05176232A (ja) 字幕重畳装置
KR100565726B1 (ko) 캡션 방송 시스템의 자막 데이타 전송방법
JP2002300434A (ja) 番組送出システム及びこれに用いる番組送出装置