JP2000032422A - 画像伝送装置 - Google Patents

画像伝送装置

Info

Publication number
JP2000032422A
JP2000032422A JP10193145A JP19314598A JP2000032422A JP 2000032422 A JP2000032422 A JP 2000032422A JP 10193145 A JP10193145 A JP 10193145A JP 19314598 A JP19314598 A JP 19314598A JP 2000032422 A JP2000032422 A JP 2000032422A
Authority
JP
Japan
Prior art keywords
data
voice
image
video
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10193145A
Other languages
English (en)
Inventor
Yukari Kamura
ゆかり 加村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10193145A priority Critical patent/JP2000032422A/ja
Publication of JP2000032422A publication Critical patent/JP2000032422A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

(57)【要約】 【課題】 送信する音声を音声認識し、その音声に対応
したデータをデータベースより選択し、送信映像と合成
して送信する画像伝送装置を提供する。 【解決手段】 マイク2からの音声は音声符号化器31
で符号化されて多重化器37へ供給されると同時に、音
声認識器32で認識されてデータ判定機33へ供給され
る。データ判定機33によりこの音声に対応するデータ
がデータベース34より選択され、合成器35へ供給さ
れる。合成器35で前記データがカメラ1からの映像と
合成され、画像符号化器36で符号化されて多重化器3
7へ供給される。多重化器37では画像符号化器36か
らの画像と音声符号化器31からの音声を多重化する。
分離器41では、受信された多重化信号が符号化映像と
符号化音声に分離され、符号化映像は画像復号化器42
で復号化されてモニタ5へ、符号化音声は音声復号化器
43で復号化されてスピーカ6へ出力される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テレビ会議システ
ムにおいて、音声認識を用いてデータの選択を行い、映
像と合成して送信する画像伝送装置に関する。
【0002】
【従来の技術】一般に、テレビ会議システムを使用する
場合、会議中相手の映像を見ていることが多いが、音声
だけでは分かりにくいような内容の場合、補足的に映像
情報を用いることが会議の運用に有効である。従来のテ
レビ会議システムにおいては、補足情報として映像情
報、例えば図面などをデータとして送って表示させる場
合、予め使用するデータを準備しておかなくてはならな
かった。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
テレビ会議システムでは、会議の展開に応じた適切な映
像情報をタイムリーに使用するのは難しいという問題が
あった。その理由は、送信するデータは予め用意された
ものか、送信されている映像や音声の情報に左右されな
い内容のものを映像や音声と多重化して送信することし
かできないからである。
【0004】本発明はこのような点を考慮してなされた
もので、テレビ会議において、送信する音声を音声認識
により認識し、その音声に対応したデータをデータベー
スより選択し、送信映像と合成して送信する画像伝送装
置を提供することを目的とする。
【0005】
【課題を解決するための手段】請求項1記載の発明は、
テレビ会議システムにおいて、送信された音声を音声認
識する音声認識手段と、前記音声認識手段の認識結果に
対応するデータを蓄積している蓄積手段と、前記データ
を前記蓄積手段より選択する選択手段と前記選択手段よ
り選択されたデータと送信された画像とを合成する合成
手段とを具備し、音声に対応したデータを映像と共に送
信することを特徴とする画像伝送装置である。
【0006】
【発明の実施の形態】以下、図面を参照して本発明の一
実施形態について説明する。図1は本発明の一実施形態
による画像伝送装置の構成を示すブロック図である。こ
の図において、3はCODEC送信部、4はCODEC
受信部である。CODEC送信部3において、符号31
はマイク2から供給された音声を符号化する音声符号化
器、32はマイク2から供給された音声を認識する音声
認識器、33は音声認識器32で認識された音声に対応
するデータをデータベース34より選択するデータ判定
機、35はカメラ1より供給された映像とデータベース
34より供給されたデータとを合成する合成器、36は
合成器35より供給された映像を符号化する画像符号化
器、37は音声符号化器31から供給された符号化音声
を画像符号化器36から供給された符号化画像と多重化
する多重化器である。また、CODEC受信部4におい
て、41は符号化音声と符号化画像の多重化信号を符号
化映像と符号化音声とに分離する分離器、42は分離器
41からの符号化画像を復号化して線425を介してモニ
タ5へと出力する画像復号化器、そして43は分離器4
1からの符号化音声を復号化して線436を介してスピー
カ6へと出力する音声復号化器である。
【0007】次に、上記構成による画像伝送装置の動作
について説明する。カメラ1からの映像は、線135を介
して合成器35に供給される。マイク2からの音声は、
線231を介して音声符号化器31へ、また線232を介して
音声認識器32へと供給される。音声符号化器31では
供給された音声を符号化し、線317を介して多重化器3
7へと供給する。音声認識器32では供給された音声を
認識し、そのデータを線323を介してデータ判定機33
へと供給する。データ判定機33では認識された音声に
対応するデータを線343を介してデータベース34より
選択し、その判定結果を線334を介して再びデータベー
ス34へ供給する。データベース34は、データ判定器
33から供給された情報に対応するデータを線345を介
して合成器35へ供給する。合成器35ではカメラ1よ
り供給された映像とデータベース34より供給されたデ
ータとを合成し、線356を介して画像符号化器36へと
供給する。画像符号化器36では供給された映像を符号
化し、線367を介して多重化器37へと供給する。多重
化器37では画像符号化器36から供給された符号化画
像と音声符号化器31から供給された符号化音声を多重
化し、結合器へ出力する。
【0008】分離器41では結合器を介して供給された
多重化信号を符号化映像と符号化音声とに分離し、符号
化映像は線412を介して画像復号化器42へ供給され、
符号化音声は線413を介して音声復号化器43へと供給
される。画像復号化器42では符号化映像を復号化して
線425を介してモニタ5へと供給する。モニタ5では送
信された映像を表示する。音声復号化器43では符号化
音声を復号化して線436を介してスピーカ6へと供給す
る。
【0009】図2は、複数の画像伝送装置によって構成
されるテレビ会議システムの構成を示す図である。複数
の装置間におけるデータの送受信は、ISDN(Integr
atedService Digital Network)などのネットワークを
介して行われる。装置A側のカメラ1からの映像および
マイク2からの音声は、CODEC送信部3に供給され
る。これらの映像および音声は、CODEC送信部3に
おいて前述のような処理を施されて多重化されたデータ
として結合器7へ供給される。結合器7へ供給されたデ
ータは、ISDN8を介して装置B側の結合器7’へ供
給される。
【0010】結合器7’に供給されたデータは、装置B
側のCODEC受信部4’へ供給され、そこで前述のよ
うに、再び映像データと音声データとに分離され、さら
に復号化されて、モニタ5’およびスピーカ6’へそれ
ぞれ供給される。以上は装置A側から装置B側へのデー
タの流れについて述べたが、装置B側から装置A側への
データの流れについても全く同様であるので、これにつ
いての説明は省略する。
【0011】本発明により、データベースに手話の映像
データを蓄積しておき、音声認識器から送信された音声
データに対応した手話の映像データをデータ判定器がデ
ータベースより選択することによって、耳の不自由な人
に手話を知らない人の会話を聞かせることが可能にな
る。また、データベースに他国語のデータを蓄積してお
き、送信する言葉に対応する翻訳語をデータ判定器が選
択することによって、異なる言語を話す人同士の会話が
可能となる。
【0012】
【発明の効果】以上説明したように、本発明によれば、
送信される音声を音声認識手段により認識し、その音声
に対応したデータを蓄積手段より選択し、送信された映
像と合成して送信するので、送信側の音声に対応したデ
ータを、音声と同時に受信側に表示できるという効果が
得られる。
【図面の簡単な説明】
【図1】 本発明の一実施形態による画像伝送装置の構
成を示すブロック図である。
【図2】 本発明の一実施形態による、複数の画像伝送
装置間でのデータのやりとりを示すブロック図である。
【符号の説明】
1,1’.カメラ 2,2’.マイク 3,3’.CODEC送信部 31.音声符号化器 32.音声認識器 33.データ判定機 34.データベース 35.合成器 36.画像符号化器 37.多重化器 4,4’.CODEC受信部 41.分離器 42.画像復号化器 43.音声復号化器 5,5’.モニタ 6,6’.スピーカ 7,7’.結合器 8.ISDN
【手続補正書】
【提出日】平成10年8月19日(1998.8.1
9)
【手続補正1】
【補正対象書類名】図面
【補正対象項目名】全図
【補正方法】変更
【補正内容】
【図2】
【図1】

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 送信された音声を音声認識する音声認識
    手段と、 前記音声認識手段の認識結果に対応するデータを蓄積し
    ている蓄積手段と、 前記データを前記蓄積手段より選択する選択手段と前記
    選択手段より選択された前記データと前記送信された画
    像とを合成する合成手段とを具備し、音声に対応したデ
    ータを映像と共に送信することを特徴とする画像伝送装
    置。
  2. 【請求項2】 前記蓄積手段には、予め手話映像が蓄積
    されていることを特徴とする請求項1記載の画像伝送装
    置。
JP10193145A 1998-07-08 1998-07-08 画像伝送装置 Pending JP2000032422A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10193145A JP2000032422A (ja) 1998-07-08 1998-07-08 画像伝送装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10193145A JP2000032422A (ja) 1998-07-08 1998-07-08 画像伝送装置

Publications (1)

Publication Number Publication Date
JP2000032422A true JP2000032422A (ja) 2000-01-28

Family

ID=16303042

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10193145A Pending JP2000032422A (ja) 1998-07-08 1998-07-08 画像伝送装置

Country Status (1)

Country Link
JP (1) JP2000032422A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6674458B1 (en) * 2000-07-21 2004-01-06 Koninklijke Philips Electronics N.V. Methods and apparatus for switching between a representative presence mode and one or more other modes in a camera-based system
WO2004030328A1 (ja) * 2002-09-27 2004-04-08 Ginganet Corporation テレビ電話通訳システムおよびテレビ電話通訳方法
JP2004343232A (ja) * 2003-05-13 2004-12-02 Nec Corp 通信装置及び通信方法
CN102025968A (zh) * 2009-09-15 2011-04-20 柯尼卡美能达商用科技株式会社 图像发送装置和图像发送方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6674458B1 (en) * 2000-07-21 2004-01-06 Koninklijke Philips Electronics N.V. Methods and apparatus for switching between a representative presence mode and one or more other modes in a camera-based system
WO2004030328A1 (ja) * 2002-09-27 2004-04-08 Ginganet Corporation テレビ電話通訳システムおよびテレビ電話通訳方法
RU2293369C2 (ru) * 2002-09-27 2007-02-10 Гинганет Корпорейшн Система и способ перевода по видеотелефону
AU2003266592B2 (en) * 2002-09-27 2007-02-15 Ginganet Corporation Video telephone interpretation system and video telephone interpretation method
KR100695926B1 (ko) * 2002-09-27 2007-03-19 가부시키가이샤 깅가네트 텔레비전 전화 통역 시스템 및 텔레비전 전화 통역 방법
JP2004343232A (ja) * 2003-05-13 2004-12-02 Nec Corp 通信装置及び通信方法
US7233345B2 (en) * 2003-05-13 2007-06-19 Nec Corporation Communication apparatus and method
CN102025968A (zh) * 2009-09-15 2011-04-20 柯尼卡美能达商用科技株式会社 图像发送装置和图像发送方法
US8615395B2 (en) 2009-09-15 2013-12-24 Konica Minolta Business Technologies, Inc. Generating a display screen in response to detecting keywords in speech

Similar Documents

Publication Publication Date Title
US5815196A (en) Videophone with continuous speech-to-subtitles translation
KR100827802B1 (ko) 휴대 단말기의 화상 통화 장치 및 화상 통화 송수신방법
US6208959B1 (en) Mapping of digital data symbols onto one or more formant frequencies for transmission over a coded voice channel
US20110307242A1 (en) Method for realtime spoken natural language translation and apparatus therefor
JP2004304601A (ja) Tv電話装置、tv電話装置のデータ送受信方法
JP2005094696A (ja) テレビ電話装置
JP3473204B2 (ja) 翻訳装置及び携帯端末装置
JP2000032422A (ja) 画像伝送装置
JP5046589B2 (ja) 電話システムと通話補助方法とプログラム
JP2002218424A (ja) 映像表示制御装置
JPH11355747A (ja) 映像・音声通信装置と同装置を用いたテレビ会議装置
JP2003061098A (ja) 画像処理装置、画像処理方法、記録媒体及びプログラム
US6498834B1 (en) Speech information communication system
JP2000004304A (ja) 異なる手段での会話が可能な通話装置
JP2611728B2 (ja) 動画像符号化復号化方式
JP6064209B2 (ja) 通話システム及び通話中継方法
JPH0787472A (ja) テレビ会議システム
JP3031320B2 (ja) ビデオ会議装置
JP2002084518A (ja) オブジェクト選択式情報通信方法及びその装置
KR100619991B1 (ko) 영상 통신 단말기의 사용자 영상 차단 방법
KR20040093297A (ko) 이동 통신 단말기의 화상 통화 내용 저장 장치 및 방법
JPH07107451A (ja) 画像通信端末装置
GB2351638A (en) Telephone that receives image of caller
KR100948394B1 (ko) 풀화면 유저인터페이스 인터넷 뱅킹용 브이오아이피 영상전화기
JP3207284B2 (ja) ステレオ音声伝送装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20001205