JP2015173433A - 端末装置及び通信システム - Google Patents

端末装置及び通信システム Download PDF

Info

Publication number
JP2015173433A
JP2015173433A JP2014253498A JP2014253498A JP2015173433A JP 2015173433 A JP2015173433 A JP 2015173433A JP 2014253498 A JP2014253498 A JP 2014253498A JP 2014253498 A JP2014253498 A JP 2014253498A JP 2015173433 A JP2015173433 A JP 2015173433A
Authority
JP
Japan
Prior art keywords
unit
imaging
voice
display
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014253498A
Other languages
English (en)
Other versions
JP6500419B2 (ja
Inventor
和紀 北澤
Kazuki Kitazawa
和紀 北澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2014253498A priority Critical patent/JP6500419B2/ja
Priority to US14/625,204 priority patent/US9392036B2/en
Publication of JP2015173433A publication Critical patent/JP2015173433A/ja
Application granted granted Critical
Publication of JP6500419B2 publication Critical patent/JP6500419B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1083In-session procedures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/57Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • G10L13/047Architecture of speech synthesisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Quality & Reliability (AREA)

Abstract

【課題】受信側が所望する音声合成に柔軟に対応することが可能な端末装置及び通信システムを提供する。
【解決手段】他の端末装置が有する撮像部により撮像される画像に関する制御を行う撮像制御部153と、当該撮像部により撮像された画像と、他の端末装置が有する複数の音声入力部それぞれに入力された音声と、を受信する受信部157と、複数の音声を合成して合成音声を生成する音声合成部159と、画像を表示部180に表示させる表示制御部161と、合成音声を音声出力部190に出力させる音声出力制御部163と、を備える。
【選択図】図2

Description

本発明は、端末装置及び通信システムに関する。
インターネット等のネットワークを介して画像(映像)や音声などをリアルタイムに送受信することで、遠隔地とのコミュニケーションを実現するビデオ会議システム(テレビ会議システムなどと称される場合もある)などの通信システムが知られている。
例えば、ビデオ会議システムの場合、一方の参加者が用いる会議端末が、当該参加者の画像を撮影するとともに当該参加者の発言などの音声を収集し、他方の参加者が用いる会議端末に送信する。そして、他方の参加者が用いる会議端末が、画像及び音声を受信し、画像を表示するとともに音声を出力することで、遠隔会議を実現する。
ここで、例えば特許文献1には、複数のマイクロフォンを内蔵するとともに、外部制御可能なPTZ(パン・チルト・ズーム)機能を有するビデオカメラをテレビ会議システムに採用し、当該ビデオカメラが、PTZの状態を示す制御信号に応じたパラメータで複数のマイクロフォンから入力された音声信号を合成して外部出力する技術が開示されている。
特許文献1に開示された技術によれば、ビデオカメラの撮像範囲(撮像された画像)に対応した音声信号を外部出力できるので、テレビ会議の音声品質を向上させることができる。
しかしながら、上述したような従来技術では、送信側で音声を合成しているので、受信側で着目したい範囲の音声を合成するなど受信側が所望する音声合成に柔軟に対応することができない。
本発明は、上記事情に鑑みてなされたものであり、受信側が所望する音声合成に柔軟に対応することが可能な端末装置及び通信システムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明の一態様にかかる端末装置は、ネットワークを介して他の端末装置と接続される端末装置であって、前記他の端末装置が有する撮像部により撮像される画像に関する制御を行う撮像制御部と、前記撮像部により撮像された画像と、前記他の端末装置が有する複数の音声入力部それぞれに入力された音声と、を受信する受信部と、前記複数の音声を合成して合成音声を生成する音声合成部と、前記画像を表示部に表示させる表示制御部と、前記合成音声を音声出力部に出力させる音声出力制御部と、を備える。
本発明によれば、受信側が所望する音声合成に柔軟に対応することが可能という効果を奏する。
図1は、第1実施形態のビデオ会議システムの構成の一例を示すブロック図である。 図2は、第1実施形態の会議端末の構成の一例を示すブロック図である。 図3は、第1実施形態の音声入力部の配置の一例を示す図である。 図4は、第1実施形態の会議端末で実行される送信動作の一例を示すフローチャート図である。 図5は、第1実施形態の会議端末で実行される受信動作の一例を示すフローチャート図である。 図6は、第2実施形態の会議端末で実行される送信動作の一例を示すフローチャート図である。 図7は、第2実施形態の会議端末で実行される受信動作の一例を示すフローチャート図である。 図8は、変形例のサーバで実行される処理の一例を示すフローチャート図である。
以下、添付図面を参照しながら、本発明にかかる端末装置及び通信システムの実施形態を詳細に説明する。以下の実施形態では、本発明をビデオ会議システムに適用した場合を例に取り説明するが、これに限定されるものではない。
(第1実施形態)
図1は、第1実施形態のビデオ会議システム1の構成の一例を示すブロック図である。図1に示すように、ビデオ会議システム1(通信システムの一例)は、会議端末10−1〜10−N(端末装置及び他の端末装置の一例)と、サーバ20とを、備える。ここで、Nは2以上の自然数である。
会議端末10−1〜10−N及びサーバ20は、ネットワーク2を介して接続されている。ネットワーク2は、例えば、LAN(Local Area Network)やインターネットなどにより実現できる。
サーバ20は、会議端末10−1〜10−N間での画像(映像)や音声などの送受信を中継する。また、サーバ20は、画像や音声の中継機能に加え、会議端末10−1〜10−N間での会議の開始や終了などを制御する会議制御機能も有しているが、ここでは説明を省略する。
会議端末10−1〜10−Nは、それぞれ異なる拠点に配置されており、サーバ20を介して画像や音声の送受信を行う。第1実施形態では、会議端末10−1〜10−Nとして、ビデオ会議用の専用端末を想定しているが、これに限定されず、ノートPC(Personal Computer)、スマートフォン、及びタブレット端末などであってもよい。なお、以下の説明では、会議端末10−1〜10−Nを各々区別する必要がない場合は、単に会議端末10と称する場合がある。
図2は、第1実施形態の会議端末10の構成の一例を示すブロック図である。図2に示すように、会議端末10は、撮像部110と、音声入力部120−1〜120−Mと、記憶部130と、通信部140と、制御部150と、操作部170と、表示部180と、音声出力部190とを、備える。ここで、Mは2以上の自然数である。
制御部150は、会議端末10の各部を制御するものであり、例えば、CPU(Central Processing Unit)などの処理装置にプログラムを実行させること、即ち、ソフトウェアにより実現してもよいし、IC(Integrated Circuit)などのハードウェアにより実現してもよいし、ソフトウェア及びハードウェアを併用して実現してもよい。制御部150は、送信部151と、撮像制御部153と、設定部155と、受信部157と、音声合成部159と、表示制御部161と、音声出力制御部163とを、含む。
まず、会議端末10が画像及び音声を会議に用いられている(参加している)他の会議端末10に送信する送信動作について説明する。
撮像部110は、会議端末10を使用する会議の参加者を撮像するものであり、CMOS(Complementary Metal Oxide Semiconductor)やCCD(Charge Coupled Device)等の撮像素子、及びレンズなどにより構成される撮像装置により実現できる。なお、レンズは広角レンズであってもよい。
また撮像部110は、外部制御可能なメカニカルなPTZ(パン・チルト・ズーム)機能を有しており、自身の撮像範囲を外部制御可能に構成されている。メカニカルなPTZ機能とは、撮像部110を物理的に動かしてPTZを行う機能である。
音声入力部120−1〜120−Mは、それぞれ、会議端末10を使用する会議の参加者が発話する音声などを入力するものであり、マイクロフォンなどの音声入力装置により実現できる。なお、以下の説明では、音声入力部120−1〜120−Mを各々区別する必要がない場合は、単に音声入力部120と称する場合がある。
第1実施形態では、音声入力部120−1〜120−Mは、撮像部110の撮像可能な範囲で発生した音声を、音声入力部120−1〜120−Mの少なくともいずれかで入力できるように、会議端末10の筐体に配置されている。
具体的には、音声入力部120は、指向性を有しており、音声入力部120に対して所定方向の一定範囲を集音範囲とし、当該集音範囲で発生した音声を入力する。このため、音声入力部120−1〜120−Mは、撮像部110の撮像可能な範囲を音声入力部120−1〜120−M全体での集音範囲が網羅するように、会議端末10の筐体に配置されている。
図3は、第1実施形態の音声入力部120−1〜120−Mの配置の一例を示す図であり、M=4の場合を示している。図3に示す例では、音声入力部120−1〜120−4を撮像部110の周辺に分散して会議端末10の筐体に配置することで、撮像部110の撮像可能な範囲を音声入力部120−1〜120−4全体での集音範囲が網羅するようになっている。
記憶部130は、会議端末10で実行される各種プログラム、及び会議端末10で行われる各種処理に使用されるデータなどを記憶する。例えば、記憶部130は、音声入力部120−1〜120−Mそれぞれの配置位置及び指向性の特性を定義した合成制御情報などを記憶する。
記憶部130は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、光ディスク、及びRAM(Random Access Memory)などの磁気的、光学的、及び電気的に記憶可能な記憶装置の少なくともいずれかにより実現できる。
通信部140は、ネットワーク2を介してサーバ20などの外部機器と通信するものであり、NIC(Network Interface Card)や無線通信装置などの通信装置により、有線、無線を問わずに実現できる。
送信部151は、撮像部110により撮像された画像と、音声入力部120−1〜120−Mそれぞれに入力された音声と、を送信する。具体的には、送信部151は、撮像部110により撮像された画像と音声入力部120−1〜120−Mそれぞれに入力された音声とをエンコードし、送信先情報(例えば、会議に用いられている他の会議端末10のIPアドレスなど)を付加し、通信部140からサーバ20に送信する。これにより、サーバ20は、エンコードされた画像及び複数の音声を会議に用いられている他の会議端末10に転送する。
例えば、会議端末10−1〜10−3が会議に用いられている場合、会議端末10−1の送信部151は、会議端末10−1の撮像部110により撮像された画像と、会議端末10−1の音声入力部120−1〜120−Mそれぞれに入力された音声と、をエンコードし、サーバ20を介して、会議端末10−2、10−3に送信する。
同様に、会議端末10−2の送信部151は、会議端末10−2の撮像部110により撮像された画像と、会議端末10−2の音声入力部120−1〜120−Mそれぞれに入力された音声と、をエンコードし、サーバ20を介して、会議端末10−1、10−3に送信する。
同様に、会議端末10−3の送信部151は、会議端末10−3の撮像部110により撮像された画像と、会議端末10−3の音声入力部120−1〜120−Mそれぞれに入力された音声と、をエンコードし、サーバ20を介して、会議端末10−1、10−2に送信する。
なお、送信部151がエンコードする画像は、制御部150によりA/D変換処理及び画像処理が施され、送信部151がエンコードする複数の音声は、制御部150によりA/D変換処理が施されている。ここで、送信部151がエンコードする複数の音声は、制御部150により更に音声処理が施されていてもよい。
また送信部151は、会議開始時に記憶部130から合成制御情報を取得し、サーバ20を介して会議に用いられている他の会議端末10に送信する。
次に、会議端末10が画像及び音声を会議に用いられている(参加している)他の会議端末10から受信する受信動作について説明する。
操作部170は、会議端末10を使用する会議の参加者が各種操作入力を行うものであり、マウス、キーボード、タッチパッド、及びタッチパネルなどの入力装置により実現できる。
表示部180は、会議画像(会議の参加者やホワイトボードなどの画像)など各種画面を表示するものであり、液晶ディスプレイやタッチパネル式ディスプレイなどの表示装置により実現できる。なお、表示部180は、会議端末10と別体で設けられていてもよい。
音声出力部190は、会議に用いられている他の会議端末10を使用している会議の参加者が発話した音声を出力するものであり、スピーカなどの音声出力装置により実現できる。
撮像制御部153は、他の会議端末10が有する撮像部110の撮像範囲を遠隔制御する。具体的には、会議端末10を使用している会議の参加者が、表示部180に表示されている、会議に用いられている他の会議端末10が有する撮像部110により撮像された画像を見ながら、操作部170から当該撮像部110のPTZ(パン・チルト・ズーム)をメカニカルに制御する操作入力を行うので、撮像制御部153は、当該操作入力から当該撮像部110のPTZ(パン・チルト・ズーム)をメカニカルに遠隔制御するコマンドを生成し、通信部140からサーバ20を介して他の会議端末10に送信する。
これにより、他の会議端末10が有する撮像部110は、送信されたコマンドに基づいて、自身(他の会議端末10)のPTZをメカニカルに制御する。
設定部155は、他の会議端末10が有する撮像部110の撮像範囲に対する撮像制御部153による遠隔制御の設定に基づく第1音声合成を行うか当該撮像範囲のデフォルトの設定に基づく第2音声合成を行うかを設定する。具体的には、設定部155は、会議端末10を使用している会議の参加者が操作部170から音声合成手法の設定操作入力を行うので、当該設定操作入力から第1音声合成を行うか第2音声合成を行うかを設定する。なお第1実施形態では、第1音声合成を行う設定の場合に、前述の撮像制御部153が、他の会議端末10が有する撮像部110の撮像範囲を遠隔制御でき、第2音声合成を行う設定の場合に、前述の撮像制御部153が、他の会議端末10が有する撮像部110の撮像範囲を遠隔制御できないことを想定している。
受信部157は、他の会議端末10が有する撮像部110により撮像された画像と、他の会議端末10が有する音声入力部120−1〜120−Mそれぞれに入力された音声と、を受信する。具体的には、受信部157は、サーバ20が他の会議端末10から転送したエンコードされた画像及び複数の音声を受信し、受信した画像及び複数の音声をデコードする。
例えば、会議端末10−1〜10−3が会議に用いられている場合、会議端末10−1の受信部157は、会議端末10−2からエンコードされた画像及び複数の音声を受信し、受信した画像及び複数の音声をデコードするとともに、会議端末10−3からエンコードされた画像及び複数の音声を受信し、受信した画像及び複数の音声をデコードする。
同様に、会議端末10−2の受信部157は、会議端末10−1からエンコードされた画像及び複数の音声を受信し、受信した画像及び複数の音声をデコードするとともに、会議端末10−3からエンコードされた画像及び複数の音声を受信し、受信した画像及び複数の音声をデコードする。
同様に、会議端末10−3の受信部157は、会議端末10−1からエンコードされた画像及び複数の音声を受信し、受信した画像及び複数の音声をデコードするとともに、会議端末10−2からエンコードされた画像及び複数の音声を受信し、受信した画像及び複数の音声をデコードする。
また受信部157は、会議開始時に、会議に用いられている他の会議端末10からサーバ20を介して合成制御情報を受信する。
音声合成部159は、受信部157により受信され、デコードされた複数の音声を合成して合成音声を生成する。
例えば、音声合成部159は、他の会議端末10が有する撮像部110の撮像範囲に対する撮像制御部153による遠隔制御の設定に基づいて、受信部157が当該他の会議端末10から受信した複数の音声を合成する。
第1実施形態では、音声合成部159は、設定部155により第1音声合成が設定されている場合、他の会議端末10が有する撮像部110の撮像範囲に対する撮像制御部153による遠隔制御の設定に基づいて、受信部157が当該他の会議端末10から受信した複数の音声を合成する。
例えば、音声合成部159は、他の会議端末10が有する撮像部110の撮像範囲に対する撮像制御部153による遠隔制御の設定(例えば、PTZの設定値)より、当該撮像部110の撮像範囲を特定する。そして音声合成部159は、受信部157が当該他の会議端末10から受信した合成制御情報を用いて、特定した撮像範囲で発生した音声を再現するように、受信部157が当該他の会議端末10から受信した複数の音声を合成する。
一方、音声合成部159は、設定部155により第2音声合成が設定されている場合、他の会議端末10が有する撮像部110の撮像範囲のデフォルトの設定に基づいて、受信部157が当該他の会議端末10から受信した複数の音声を合成する。なお、他の会議端末10が有する撮像部110の撮像範囲のデフォルトの設定は、例えば、撮像制御部153が把握している。
例えば、音声合成部159は、他の会議端末10が有する撮像部110の撮像範囲のデフォルトの設定(例えば、デフォルトのPTZの設定値)より、当該撮像部110のデフォルトの撮像範囲を特定する。そして音声合成部159は、受信部157が当該他の会議端末10から受信した合成制御情報を用いて、特定した撮像範囲で発生した音声を再現するように、受信部157が当該他の会議端末10から受信した複数の音声を合成する。
なお、音声合成部159の音声合成手法については、特許文献1に開示された手法を採用できるため、これ以上の詳細な説明は省略する。
表示制御部161は、受信部157により受信され、デコードされた画像を表示部180に表示させる。
音声出力制御部163は、音声合成部159により生成された合成音声を音声出力部190に出力させる。
第1実施形態では、会議に用いられている各会議端末10が、上述した画像及び複数の音声の送信動作及び受信動作を繰り返し行うことで、ビデオ会議システム1による多拠点間での遠隔会議が実現される。
図4は、第1実施形態の会議端末10で実行される送信動作の一例を示すフローチャート図である。
まず、会議端末10の送信部151は、会議開始時に記憶部130から合成制御情報を取得し、サーバ20を介して会議に用いられている他の会議端末10に送信する(ステップS101)。
続いて、会議端末10の撮像部110は、他の会議端末10の撮像制御部153からPTZの遠隔制御が行われた場合(ステップS103でYes)、自身のPTZを遠隔制御の設定に変更する(ステップS105)。
なお、他の会議端末10の撮像制御部153からPTZの遠隔制御が行われない場合(ステップS103でNo)、ステップS105の処理は行われない。
続いて、会議端末10の撮像部110は、会議端末10を使用する会議の参加者を撮像する(ステップS107)。
続いて、会議端末10の音声入力部120−1〜120−Mは、それぞれ、会議端末10を使用する会議の参加者などが発話する音声を入力する(ステップS109)。
続いて、会議端末10の送信部151は、撮像部110により撮像された画像と音声入力部120−1〜120−Mそれぞれに入力された音声とをエンコードし(ステップS111)、エンコードされた画像及び複数の音声を、サーバ20を介して会議に用いられている他の会議端末10に送信する(ステップS113)。
続いて、会議が終了しなければ(ステップS115でNo)、ステップS103へ戻り、会議が終了すれば(ステップS115でYes)、処理は終了となる。
図5は、第1実施形態の会議端末10で実行される受信動作の一例を示すフローチャート図である。
まず、会議端末10の受信部157は、会議開始時に、会議に用いられている他の会議端末10からサーバ20を介して合成制御情報を受信する(ステップS201)。
続いて、会議端末10の撮像制御部153は、他の会議端末10が有する撮像部110のPTZを遠隔制御する場合(ステップS203でYes)、他の会議端末10が有する撮像部110のPTZを遠隔制御する(ステップS205)。この際、撮像制御部153は、他の会議端末10から遠隔制御後の撮像部110のPTZの設定値を取得してもよい。
なお、他の会議端末10が有する撮像部110のPTZを遠隔制御しない場合(ステップS203でNo)、ステップS205の処理は行われない。
続いて、会議端末10の受信部157は、他の会議端末10が有する撮像部110により撮像された画像と、他の会議端末10が有する音声入力部120−1〜120−Mそれぞれに入力された音声と、を受信し(ステップS207)、受信した画像及び複数の音声をデコードする(ステップS209)。
続いて、会議端末10の音声合成部159は、設定部155により第1音声合成が設定されている場合(ステップS211でYes)、受信部157が他の会議端末10から受信した合成制御情報を用いて、当該他の会議端末10が有する撮像部110に対する撮像制御部153による遠隔制御後のPTZの設定に基づく撮像範囲で発生した音声を再現するように、受信部157が当該他の会議端末10から受信した複数の音声を合成する(ステップS213)。
一方、音声合成部159は、設定部155により第1音声合成が設定されていない場合(ステップS211でNo)、受信部157が他の会議端末10から受信した合成制御情報を用いて、当該他の会議端末10が有する撮像部110のデフォルトのPTZの設定に基づく撮像範囲で発生した音声を再現するように、受信部157が当該他の会議端末10から受信した複数の音声を合成する(ステップS215)。
続いて、会議端末10の表示制御部161は、受信部157により受信され、デコードされた画像を表示部180に表示させる(ステップS217)。
続いて、会議端末10の音声出力制御部163は、音声合成部159により生成された合成音声を音声出力部190に出力させる(ステップS219)。
続いて、会議が終了しなければ(ステップS221でNo)、ステップS203へ戻り、会議が終了すれば(ステップS221でYes)、処理は終了となる。
以上のように第1実施形態によれば、受信側で音声合成を行うので、受信側で着目したい範囲の音声を合成するなど受信側が所望する音声合成に柔軟に対応することができる。
例えば、他の会議端末10が有する撮像部110に対する撮像制御部153による遠隔制御後の撮像範囲で発生した音声を再現するように、当該他の会議端末10から受信した複数の音声を合成すれば、撮像範囲(撮像された画像)に対応した合成音声を生成でき、同一の場で会議を行っているような臨場感のある遠隔会議を行うことができる。
また例えば、他の会議端末10が有する撮像部110のデフォルトの撮像範囲で発生した音声を再現するように、当該他の会議端末10から受信した複数の音声を合成すれば、例えば、他の会議端末10が有する撮像部110が、会議の参加者ではなくホワイトボードなど音声が発生しない範囲を撮像している場合であっても、他の会議端末10を使用している会議の参加者の発話音声を途切れさせずに、当該発話音声をある程度の品質で再現することができる。
特に第1実施形態によれば、受信側で音声合成を行うので、多拠点間で会議を行っており、受信側が複数存在し、それぞれ受信側で着目したい範囲の音声が異なる場合であっても、それぞれの受信側が所望する音声合成を行うことができ、それぞれの受信側が所望する音声合成に柔軟に対応することができる。
(第2実施形態)
第2実施形態では、撮像部110が外部制御可能なメカニカルなPTZ機能を有さない例について説明する。第2実施形態では、第1実施形態との相違点、具体的には、撮像制御部153、設定部155、音声合成部159、及び表示制御部161について主に説明し、第1実施形態と同様の内容については、その説明を省略する。
第2実施形態では、撮像制御部153は、他の会議端末10が有する撮像部110の撮像範囲を遠隔制御するのでは無く、他の会議端末10が撮像した画像の表示範囲を制御する。
例えば、会議端末10を使用している会議の参加者が、表示部180に表示されている、会議に用いられている他の会議端末10が有する撮像部110により撮像された画像を見ながら、操作部170からデジタルPTZを制御する操作入力を行う。そして、撮像制御部153は、当該操作入力に基づいて、デジタルPTZを制御するコマンド(例えば、デジタルPTZの設定値を示すコマンド)を生成し、表示制御部161に出力する。デジタルPTZとは、画像の表示範囲を制御するために、画像に仮想的にPTZ(パン・チルト・ズーム)を行うことである。
例えば、会議端末10を使用している会議の参加者が、操作部170から、表示部180に表示されている画像中で注目した領域を中心として拡大する操作入力を行うと、撮像制御部153は、当該画像の表示範囲が当該操作後(拡大後)の表示範囲となるように表示制御部161にデジタルPTZを行わせるためのコマンドを生成し、表示制御部161に出力する。
これにより、表示制御部161は、出力されたコマンドに基づいて、受信部157が他の会議端末10から受信した画像に対してデジタルPTZを行うことができる。
第2実施形態では、設定部155は、撮像制御部153によるデジタルPTZ(画像の表示範囲)の設定に基づく第1音声合成及び第1表示制御を行うか撮像制御部153のデジタルPTZのデフォルトの設定に基づく第2音声合成及び第2表示制御を行うかを設定する。具体的には、設定部155は、会議端末10を使用している会議の参加者が操作部170から音声合成手法及び表示制御手法の設定操作入力を行うので、当該設定操作入力から第1音声合成及び第1表示制御を行うか第2音声合成及び第2表示制御を行うかを設定する。なお第2実施形態では、第1音声合成及び第1表示制御を行う設定の場合に、前述の撮像制御部153がデジタルPTZ(画像の表示範囲)を制御でき、第2音声合成及び第2表示制御を行う設定の場合に、前述の撮像制御部153がデジタルPTZ(画像の表示範囲)を制御できないことを想定している。
第2実施形態では、音声合成部159は、例えば、撮像制御部153によるデジタルPTZ(画像の表示範囲)の設定に基づいて、受信部157が他の会議端末10から受信した複数の音声を合成する。
具体的には、音声合成部159は、設定部155により第1音声合成及び第1表示制御が設定されている場合、受信部157が他の会議端末10から受信する画像に対する撮像制御部153によるデジタルPTZの設定に基づいて、受信部157が当該他の会議端末10から受信した複数の音声を合成する。
例えば、音声合成部159は、受信部157が他の会議端末10から受信する画像に対する撮像制御部153によるデジタルPTZの設定(例えば、デジタルPTZの設定値)より、当該画像の表示範囲を特定する。そして音声合成部159は、受信部157が当該他の会議端末10から受信した合成制御情報を用いて、特定した表示範囲で発生した音声を再現するように、受信部157が当該他の会議端末10から受信した複数の音声を合成する。
一方、音声合成部159は、設定部155により第2音声合成及び第2表示制御が設定されている場合、受信部157が他の会議端末10から受信する画像に対する撮像制御部153によるデジタルPTZのデフォルトの設定に基づいて、受信部157が当該他の会議端末10から受信した複数の音声を合成する。なお、撮像制御部153によるデジタルPTZのデフォルトの設定は、例えば、撮像制御部153が把握している。
例えば、音声合成部159は、撮像制御部153によるデジタルPTZのデフォルトの設定(例えば、画像の全てを表示)より、画像のデフォルトの表示範囲を特定する。そして音声合成部159は、受信部157が当該他の会議端末10から受信した合成制御情報を用いて、特定した表示範囲で発生した音声を再現するように、受信部157が当該他の会議端末10から受信した複数の音声を合成する。
第2実施形態では、表示制御部161は、例えば、撮像制御部153によるデジタルPTZ(画像の表示範囲)の設定に基づいて、受信部157が他の会議端末10から受信した画像を表示部180に表示させる。
具体的には、表示制御部161は、設定部155により第1音声合成及び第1表示制御が設定されている場合、受信部157が他の会議端末10から受信する画像に対する撮像制御部153によるデジタルPTZの設定に基づいて、受信部157が当該他の会議端末10から受信した画像を表示部180に表示させる。
例えば、表示制御部161は、受信部157が他の会議端末10から受信する画像に対する撮像制御部153によるデジタルPTZの設定(例えば、デジタルPTZの設定値を示すコマンド)に基づいて、受信部157が他の会議端末10から受信した画像に対してデジタルPTZを行い、表示部180に表示させる。これにより、あたかもメカニカルなPTZを行ったかのように表示範囲が制御された画像を表示できる。
一方、表示制御部161は、設定部155により第2音声合成及び第2表示制御が設定されている場合、受信部157が他の会議端末10から受信する画像に対する撮像制御部153によるデジタルPTZのデフォルトの設定に基づいて、受信部157が当該他の会議端末10から受信した画像を表示部180に表示させる。なお、撮像制御部153によるデジタルPTZのデフォルトの設定は、例えば、撮像制御部153が把握している。
例えば、表示制御部161は、撮像制御部153によるデジタルPTZのデフォルトの設定(例えば、画像の全てを表示)に基づいて、受信部157が他の会議端末10から受信した画像に対して必要であればデジタルPTZを行い、表示部180に表示させる。なお、表示制御部161は、撮像制御部153によるデジタルPTZのデフォルトの設定上、受信部157が他の会議端末10から受信した画像に対してデジタルPTZを行う必要がなければ、そのまま表示部180に表示させる。
図6は、第2実施形態の会議端末10で実行される送信動作の一例を示すフローチャート図である。
まず、会議端末10の送信部151は、会議開始時に記憶部130から合成制御情報を取得し、サーバ20を介して会議に用いられている他の会議端末10に送信する(ステップS301)。
続いて、会議端末10の撮像部110は、会議端末10を使用する会議の参加者を撮像する(ステップS307)。
続いて、会議端末10の音声入力部120−1〜120−Mは、それぞれ、会議端末10を使用する会議の参加者などが発話する音声を入力する(ステップS309)。
続いて、会議端末10の送信部151は、撮像部110により撮像された画像と音声入力部120−1〜120−Mそれぞれに入力された音声とをエンコードし(ステップS311)、エンコードされた画像及び複数の音声を、サーバ20を介して会議に用いられている他の会議端末10に送信する(ステップS313)。
続いて、会議が終了しなければ(ステップS315でNo)、ステップS307へ戻り、会議が終了すれば(ステップS315でYes)、処理は終了となる。
図7は、第2実施形態の会議端末10で実行される受信動作の一例を示すフローチャート図である。
まず、会議端末10の受信部157は、会議開始時に、会議に用いられている他の会議端末10からサーバ20を介して合成制御情報を受信する(ステップS401)。
続いて、会議端末10の撮像制御部153は、デジタルPTZの設定を変更する場合(ステップS403でYes)、デジタルPTZの設定を変更する(ステップS405)。
なお、デジタルPTZの設定を変更しない場合(ステップS403でNo)、ステップS405の処理は行われない。
続いて、会議端末10の受信部157は、他の会議端末10が有する撮像部110により撮像された画像と、他の会議端末10が有する音声入力部120−1〜120−Mそれぞれに入力された音声と、を受信し(ステップS407)、受信した画像及び複数の音声をデコードする(ステップS409)。
続いて、会議端末10の音声合成部159は、設定部155により第1音声合成及び第1表示制御が設定されている場合(ステップS411でYes)、受信部157が他の会議端末10から受信した合成制御情報を用いて、受信部157が他の会議端末10から受信する画像に対する撮像制御部153によるデジタルPTZの設定に基づく表示範囲で発生した音声を再現するように、受信部157が当該他の会議端末10から受信した複数の音声を合成する(ステップS413)。
続いて、会議端末10の表示制御部161は、受信部157が他の会議端末10から受信する画像に対する撮像制御部153によるデジタルPTZの設定に基づく表示範囲となるように、当該画像に対してデジタルPTZを行い、表示部180に表示させる(ステップS415)。
一方、音声合成部159は、設定部155により第1音声合成及び第1表示制御が設定されていない場合(ステップS411でNo)、受信部157が他の会議端末10から受信した合成制御情報を用いて、受信部157が他の会議端末10から受信する画像に対する撮像制御部153によるデジタルPTZのデフォルトの設定に基づく表示範囲で発生した音声を再現するように、受信部157が当該他の会議端末10から受信した複数の音声を合成する(ステップS417)。
続いて、会議端末10の表示制御部161は、受信部157が他の会議端末10から受信する画像に対する撮像制御部153によるデジタルPTZのデフォルトの設定に基づく表示範囲となるように、当該画像に対してデジタルPTZを行い、表示部180に表示させる(ステップS419)。
続いて、会議端末10の音声出力制御部163は、音声合成部159により生成された合成音声を音声出力部190に出力させる(ステップS421)。
続いて、会議が終了しなければ(ステップS423でNo)、ステップS403へ戻り、会議が終了すれば(ステップS423でYes)、処理は終了となる。
以上のように第2実施形態によれば、受信側でデジタルPTZを行いながら、音声合成を行うので、受信側で着目したい範囲の音声を合成するなど受信側が所望する音声合成に柔軟に対応することができる。
例えば、他の会議端末10が撮像した画像範囲のうち、指定した所定の領域で発生した音声を再現するように、当該他の会議端末10から受信した複数の音声を合成すれば、指定した所定の領域に適合した合成音声を生成でき、同一の場で会議を行っているような臨場感のある遠隔会議を行うことができる。
また例えば、他の会議端末10が撮像した画像のデフォルトの範囲で発生した音声を再現するように、当該他の会議端末10から受信した複数の音声を合成すれば、例えば、他の会議端末10が有する撮像部110が、会議の参加者ではなくホワイトボードなど音声が発生しない範囲を撮像している場合であっても、他の会議端末10を使用している会議の参加者の発話音声を途切れさせずに、当該発話音声をある程度の品質で再現することができる。
特に第2実施形態によれば、受信側で音声合成を行うので、多拠点間で会議を行っており、受信側が複数存在し、それぞれ受信側で着目したい範囲の音声が異なる場合であっても、それぞれの受信側が所望する音声合成を行うことができ、それぞれの受信側が所望する音声合成に柔軟に対応することができる。
(変形例)
なお、本発明は、上記各実施形態に限定されるものではなく、種々の変形が可能である。例えば、会議端末10が行った、エンコード処理、デコード処理、及び音声合成処理の少なくともいずれかをサーバ20で行うようにしてもよい。
例えば、音声の合成をサーバ20が行う場合、サーバ20は、少なくとも端末装置10の通信部140、送信部151、受信部157、及び音声合成部159と同様の構成を備える。
図8は、変形例のサーバ20で実行される処理の一例を示すフローチャート図である。
まず、サーバ20の受信部157は、会議開始時に、会議に用いられている送信側の会議端末10から合成制御情報を受信する(ステップS501)。
続いて、サーバ20の受信部157は、会議に用いられている受信側の会議端末10から、第1音声合成を行うか第2音声合成を行うかの設定を受信した場合(ステップS503でYes)、受信側の会議端末10の音声合成の設定を受信した設定に更新する(ステップS505)。なお、受信側の会議端末10から、第1音声合成を行うか第2音声合成を行うかの設定を受信しなかった場合(ステップS503でNo)、ステップS505の処理は行われない。
続いて、サーバ20の受信部157は、会議に用いられている受信側の会議端末10から、デジタルPTZの設定を受信した場合(ステップS507でYes)、受信側の会議端末10のデジタルPTZの設定を受信した設定に更新する(ステップS509)。なお、受信側の会議端末10から、デジタルPTZの設定を受信しなかった場合(ステップS507でNo)、ステップS509の処理は行われない。
続いて、サーバ20の受信部157は、送信側の会議端末10が有する撮像部110により撮像され、エンコードされた画像と、送信側の会議端末10が有する音声入力部120−1〜120−Mそれぞれに入力され、エンコードされた音声と、を受信し(ステップS511)、受信した複数の音声をデコードする(ステップS513)。
続いて、サーバ20の音声合成部159は、受信側の会議端末10の音声合成の設定が第1音声合成の場合(ステップS515でYes)、サーバ20の受信部157が送信側の会議端末10から受信した合成制御情報を用いて、サーバ20の受信部157が受信側の会議端末10から受信したデジタルPTZの設定に基づく表示範囲で発生した音声を再現するように、デコードした複数の音声を合成する(ステップS517)。
一方、サーバ20の音声合成部159は、受信側の会議端末10の音声合成の設定が第2音声合成の場合(ステップS515でNo)、サーバ20の受信部157が送信側の会議端末10から受信した合成制御情報を用いて、受信側の会議端末10のデフォルトのデジタルPTZの設定に基づく表示範囲で発生した音声を再現するように、デコードした複数の音声を合成する(ステップS519)。
続いて、サーバ20の送信部151は、合成音声をエンコードし(ステップS521)、エンコードされた画像及び合成音声を、受信側の会議端末10に送信する(ステップS523)。
続いて、会議が終了しなければ(ステップS525でNo)、ステップS503へ戻り、会議が終了すれば(ステップS525でYes)、処理は終了となる。
変形例においても第2実施形態と同様の効果が得られる。特に変形例によれば、音声の合成処理の種類が増加しても、サーバ20で処理するので、会議端末10にかかる負荷を抑えることができる。
(ハードウェア構成)
上記実施形態の会議端末10のハードウェア構成について説明する。上記実施形態の会議端末10は、CPUなどの制御装置、ROM(Read Only Memory)やRAMなどの記憶装置、HDDやSSDなどの外部記憶装置、ディスプレイなどの表示装置、マウスやキーボードなどの入力装置、NICなどの通信装置、デジタルカメラなどの撮像装置、マイクロフォンなどの音声入力装置、及びスピーカなどの音声出力装置を備えており、通常のコンピュータを利用したハードウェア構成で実現できる。
上記実施形態の会議端末10で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、CD−R、メモリカード、DVD(Digital Versatile Disk)、フレキシブルディスク(FD)等のコンピュータで読み取り可能な記憶媒体に記憶されて提供される。
また、上記実施形態の会議端末10で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するようにしてもよい。また、上記実施形態の会議端末10で実行されるプログラムを、インターネット等のネットワーク経由で提供または配布するようにしてもよい。また、上記実施形態の会議端末10で実行されるプログラムを、ROM等に予め組み込んで提供するようにしてもよい。
上記実施形態の会議端末10で実行されるプログラムは、上述した各部をコンピュータ上で実現させるためのモジュール構成となっている。実際のハードウェアとしては、制御装置が外部記憶装置からプログラムを記憶装置上に読み出して実行することにより、上記各部がコンピュータ上で実現されるようになっている。
1 ビデオ会議システム
2 ネットワーク
10−1〜10−N(10) 会議端末
20 サーバ
110 撮像部
120−1〜120−M(120) 音声入力部
130 記憶部
140 通信部
150 制御部
151 送信部
153 撮像制御部
155 設定部
157 受信部
159 音声合成部
161 表示制御部
163 音声出力制御部
170 操作部
180 表示部
190 音声出力部
特許第3370530号公報

Claims (9)

  1. ネットワークを介して他の端末装置と接続される端末装置であって、
    前記他の端末装置が有する撮像部により撮像される画像に関する制御を行う撮像制御部と、
    前記撮像部により撮像された画像と、前記他の端末装置が有する複数の音声入力部それぞれに入力された音声と、を受信する受信部と、
    前記複数の音声を合成して合成音声を生成する音声合成部と、
    前記画像を表示部に表示させる表示制御部と、
    前記合成音声を音声出力部に出力させる音声出力制御部と、
    を備える端末装置。
  2. 前記撮像制御部は、前記撮像部の撮像範囲を遠隔制御する請求項1に記載の端末装置。
  3. 前記撮像制御部は、前記画像の表示範囲を制御する請求項1に記載の端末装置。
  4. 前記音声合成部は、前記撮像範囲の遠隔制御の設定に基づいて、前記複数の音声を合成する請求項2に記載の端末装置。
  5. 前記撮像範囲の遠隔制御の設定に基づく第1音声合成を行うか前記撮像範囲のデフォルトの設定に基づく第2音声合成を行うかを設定する設定部を更に備え、
    前記音声合成部は、前記第1音声合成が設定されている場合、前記撮像範囲の遠隔制御の設定に基づいて、前記複数の音声を合成し、前記第2音声合成が設定されている場合、前記撮像範囲のデフォルトの設定に基づいて、前記複数の音声を合成する請求項2又は4に記載の端末装置。
  6. 前記音声合成部は、前記表示範囲の設定に基づいて、前記複数の音声を合成し、
    前記表示制御部は、前記表示範囲の設定に基づいて、前記画像を前記表示部に表示させる請求項3に記載の端末装置。
  7. 前記表示範囲の設定に基づく第1音声合成及び第1表示制御を行うか前記表示範囲のデフォルトの設定に基づく第2音声合成及び第2表示制御を行うかを設定する設定部を更に備え、
    前記音声合成部は、前記第1音声合成及び前記第1表示制御が設定されている場合、前記表示範囲の設定に基づいて、前記複数の音声を合成し、前記第2音声合成及び前記第2表示制御が設定されている場合、前記表示範囲のデフォルトの設定に基づいて、前記複数の音声を合成し、
    前記表示制御部は、前記第1音声合成及び前記第1表示制御が設定されている場合、前記表示範囲の設定に基づいて、前記画像を前記表示部に表示させ、前記第2音声合成及び前記第2表示制御が設定されている場合、前記表示範囲のデフォルトの設定に基づいて、前記画像を前記表示部に表示させる請求項3又は6に記載の端末装置。
  8. ネットワークを介して接続された複数の端末装置を備える通信システムであって、
    一の端末装置は、
    撮像部と、
    複数の音声入力部と、
    前記撮像部により撮像された画像と、前記複数の音声入力部それぞれに入力された音声と、を送信する送信部と、を備え、
    他の端末装置は、
    前記撮像部の撮像範囲を遠隔制御する撮像制御部と、
    前記画像と前記複数の音声とを受信する受信部と、
    前記複数の音声を合成して合成音声を生成する音声合成部と、
    前記画像を表示部に表示させる表示制御部と、
    前記合成音声を音声出力部に出力させる音声出力制御部と、を備える通信システム。
  9. ネットワークを介して接続された複数の端末装置を備える通信システムであって、
    一の端末装置は、
    撮像部と、
    複数の音声入力部と、
    前記撮像部により撮像された画像と、前記複数の音声入力部それぞれに入力された音声と、を送信する送信部と、を備え、
    他の端末装置は、
    前記画像と前記複数の音声とを受信する受信部と、
    前記画像の表示範囲を制御する撮像制御部と、
    前記複数の音声を合成して合成音声を生成する音声合成部と、
    前記画像を表示部に表示させる表示制御部と、
    前記合成音声を音声出力部に出力させる音声出力制御部と、を備える通信システム。
JP2014253498A 2014-02-19 2014-12-15 端末装置、通信システム及びプログラム Expired - Fee Related JP6500419B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014253498A JP6500419B2 (ja) 2014-02-19 2014-12-15 端末装置、通信システム及びプログラム
US14/625,204 US9392036B2 (en) 2014-02-19 2015-02-18 Terminal device and communication system

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014029901 2014-02-19
JP2014029901 2014-02-19
JP2014253498A JP6500419B2 (ja) 2014-02-19 2014-12-15 端末装置、通信システム及びプログラム

Publications (2)

Publication Number Publication Date
JP2015173433A true JP2015173433A (ja) 2015-10-01
JP6500419B2 JP6500419B2 (ja) 2019-04-17

Family

ID=53798635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014253498A Expired - Fee Related JP6500419B2 (ja) 2014-02-19 2014-12-15 端末装置、通信システム及びプログラム

Country Status (2)

Country Link
US (1) US9392036B2 (ja)
JP (1) JP6500419B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6500419B2 (ja) * 2014-02-19 2019-04-17 株式会社リコー 端末装置、通信システム及びプログラム
US10860692B1 (en) * 2019-06-16 2020-12-08 Shmuel Ur Innovation Ltd. Digital media verification

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08237590A (ja) * 1995-02-24 1996-09-13 Canon Inc 映像処理装置
JP2005033838A (ja) * 2004-10-18 2005-02-03 Sony Corp 固体撮像装置
JP2008157906A (ja) * 2006-12-25 2008-07-10 Adtec Plasma Technology Co Ltd 出力インピーダンス検出方法およびこの方法を用いたインピーダンスのセンサー、高周波電源につながる負荷側の電力モニターならびに高周波電源の制御装置
JP2008294724A (ja) * 2007-05-24 2008-12-04 Panasonic Corp 画像受信装置
JP2013017063A (ja) * 2011-07-05 2013-01-24 Brother Ind Ltd 会議端末装置、会議制御方法、及び会議制御プログラム、
US20130155178A1 (en) * 2011-12-16 2013-06-20 Wayne E. Mock Controlling a Camera Using a Touch Interface
JP2013192139A (ja) * 2012-03-15 2013-09-26 Hitachi Ltd 多地点ビデオ会議システム及び画面配置割当て方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3370530B2 (ja) 1996-11-20 2003-01-27 京セラ株式会社 マイクロホン内蔵型ビデオカメラ
US6243685B1 (en) * 1999-02-08 2001-06-05 Rick C. Bergman Voice operated interactive message display system for vehicles
JP3998858B2 (ja) * 1999-05-28 2007-10-31 株式会社バンダイナムコゲームス ゲーム装置、ゲーム装置の画像処理方法および記録媒体
JP2001282952A (ja) * 2000-03-30 2001-10-12 Namco Ltd クライアント・コンピュータ、サーバ・コンピュータ、ネットワーク・ランキング・システム、ネットワーク・ランキング方法、課題処理方法および記録媒体
US7120583B2 (en) * 2000-10-02 2006-10-10 Canon Kabushiki Kaisha Information presentation system, information presentation apparatus, control method thereof and computer readable memory
JP2002219044A (ja) * 2001-01-26 2002-08-06 Kura Corporation:Kk 飲食店における飲食物注文装置
WO2006003714A1 (ja) * 2004-07-06 2006-01-12 Fujitsu Limited 読み上げ機能付きブラウザプログラム、読み上げ機能付きブラウザ、ブラウジング処理方法およびブラウザプログラム記録媒体
JP2006203548A (ja) 2005-01-20 2006-08-03 Yamaha Corp 複数話者の音声信号を処理する音声信号処理装置およびプログラム
US7966123B2 (en) * 2005-09-28 2011-06-21 Denso Corporation Display device and method for vehicle
JP2007258934A (ja) * 2006-03-22 2007-10-04 Canon Inc 情報処理装置及び情報処理方法
JP4124246B2 (ja) * 2006-06-30 2008-07-23 ソニー株式会社 撮像装置、カメラコントロールユニット、ビデオカメラシステム及び警告情報伝送方法
US20110134327A1 (en) * 2008-10-16 2011-06-09 Kazuma Kaneko Digital broadcast receiver
JP2012186551A (ja) 2011-03-03 2012-09-27 Hitachi Ltd 制御装置、制御システムと制御方法
JP5708097B2 (ja) * 2011-03-18 2015-04-30 株式会社リコー 撮像装置、撮像方法、及び撮像プログラム
JP2013009304A (ja) 2011-05-20 2013-01-10 Ricoh Co Ltd 画像入力装置、会議装置、画像処理制御プログラム、記録媒体
US9185345B2 (en) * 2012-09-14 2015-11-10 Ricoh Company, Limited Video conference system and method for performing the same
JP6179179B2 (ja) * 2013-05-10 2017-08-16 株式会社リコー 情報処理装置、情報処理方法およびプログラム
KR101565926B1 (ko) * 2013-10-18 2015-11-04 주식회사 자원메디칼 저시력자를 위한 영상보정방법 및 이를 위한 장치
JP6500419B2 (ja) * 2014-02-19 2019-04-17 株式会社リコー 端末装置、通信システム及びプログラム
JP6455138B2 (ja) * 2014-03-12 2019-01-23 株式会社リコー 会議システム、及び制御方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08237590A (ja) * 1995-02-24 1996-09-13 Canon Inc 映像処理装置
JP2005033838A (ja) * 2004-10-18 2005-02-03 Sony Corp 固体撮像装置
JP2008157906A (ja) * 2006-12-25 2008-07-10 Adtec Plasma Technology Co Ltd 出力インピーダンス検出方法およびこの方法を用いたインピーダンスのセンサー、高周波電源につながる負荷側の電力モニターならびに高周波電源の制御装置
JP2008294724A (ja) * 2007-05-24 2008-12-04 Panasonic Corp 画像受信装置
JP2013017063A (ja) * 2011-07-05 2013-01-24 Brother Ind Ltd 会議端末装置、会議制御方法、及び会議制御プログラム、
US20130155178A1 (en) * 2011-12-16 2013-06-20 Wayne E. Mock Controlling a Camera Using a Touch Interface
JP2013192139A (ja) * 2012-03-15 2013-09-26 Hitachi Ltd 多地点ビデオ会議システム及び画面配置割当て方法

Also Published As

Publication number Publication date
US20150235650A1 (en) 2015-08-20
US9392036B2 (en) 2016-07-12
JP6500419B2 (ja) 2019-04-17

Similar Documents

Publication Publication Date Title
JP6547496B2 (ja) 通信装置、通信方法、プログラムおよび通信システム
JP6179834B1 (ja) テレビ会議装置
AU2013236158B2 (en) Teleconference system and teleconference terminal
US9699414B2 (en) Information processing apparatus, information processing method, and computer program product
JP6931815B2 (ja) テレビ会議装置
US10079996B2 (en) Communication system, communication device, and communication method
JP2011205243A (ja) 情報処理装置、会議システム、情報処理方法及びコンピュータプログラム
JP2017085372A (ja) 通信システム、通信装置、通信方法およびプログラム
US20060125914A1 (en) Video input for conversation with sing language, video i/o device for conversation with sign language, and sign language interpretation system
JP2016174282A (ja) テレビ会議用通信装置
JP6701573B2 (ja) 音声処理装置、音声映像出力装置、及び遠隔会議システム
CN102202206B (zh) 通信设备
JP6500419B2 (ja) 端末装置、通信システム及びプログラム
WO2016147538A1 (ja) テレビ会議用通信装置
JP2011055444A (ja) 通信装置
US9131109B2 (en) Information processing device, display control system, and computer program product
JP2017168903A (ja) 情報処理装置、会議システムおよび情報処理装置の制御方法
JP2017163466A (ja) 情報処理装置および会議システム
JP7020132B2 (ja) 端末装置、情報処理方法、プログラム、通信システム
JP2016178355A (ja) 通信装置、通信システム、通信装置の制御方法およびプログラム
JP2008160667A (ja) 通信会議装置
KR20060131478A (ko) 휴대단말기에서 외부장치의 리소스 제어방법
JP6853909B1 (ja) 画像処理装置、画像処理方法及びプログラム
JP2017108287A (ja) 通信装置、制御方法及び制御プログラム
JP2017092950A (ja) 情報処理装置、会議システム、情報処理方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190304

R151 Written notification of patent or utility model registration

Ref document number: 6500419

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees