JP4496060B2 - Transition support method and video / audio communication system - Google Patents

Transition support method and video / audio communication system Download PDF

Info

Publication number
JP4496060B2
JP4496060B2 JP2004328022A JP2004328022A JP4496060B2 JP 4496060 B2 JP4496060 B2 JP 4496060B2 JP 2004328022 A JP2004328022 A JP 2004328022A JP 2004328022 A JP2004328022 A JP 2004328022A JP 4496060 B2 JP4496060 B2 JP 4496060B2
Authority
JP
Japan
Prior art keywords
display
user
video
mode
face direction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004328022A
Other languages
Japanese (ja)
Other versions
JP2006139028A (en
Inventor
篤信 木村
義弘 島田
稔 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004328022A priority Critical patent/JP4496060B2/en
Publication of JP2006139028A publication Critical patent/JP2006139028A/en
Application granted granted Critical
Publication of JP4496060B2 publication Critical patent/JP4496060B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Controls And Circuits For Display Device (AREA)

Description

本発明は、遠隔地にいる相手とのコミュニケーションを図る映像音声通信システムに関し、特に、個人作業を主体とした実空間における作業状態と遠隔相手との会話状態の二つの状態が混在し得る場合に、作業状態と会話状態との円滑な遷移を支援する遷移支援方法と、そのような遷移支援方法を実現する映像音声通信システムと、に関する。   The present invention relates to a video / audio communication system that facilitates communication with a remote party, particularly when two states, that is, a work state in a real space mainly composed of personal work and a conversation state with a remote partner can be mixed. The present invention relates to a transition support method that supports smooth transition between a work state and a conversation state, and a video / audio communication system that realizes such a transition support method.

遠隔地にいる相手とのコミュニケーションを図るためのツールとして、利用者自身を撮影するカメラと相手の画像を提示するディスプレイと相手の発した音声を出力するスピーカと利用者自身の発した音声を取得するマイクロホンとを用いる映像音声通信システムがある。これらの映像音声通信システムでは、カメラ、ディスプレイを水平方向に設置する、言い換えれば各利用者の正面にカメラやディスプレイを設置するのが一般的である。   As a tool to communicate with a remote party, obtain a camera that shoots the user, a display that displays the partner's image, a speaker that outputs the voice of the partner, and the voice of the user. There is a video / audio communication system using a microphone. In these video / audio communication systems, it is common to install a camera and a display in the horizontal direction, in other words, to install a camera and a display in front of each user.

このような映像音声通信システムの利用方法として、これまで、1対1での遠隔会議がよく知られているが、相手方との物理的な接続は維持するものの、相手方の常時と会話をするのではなく、間欠的に(あるいはときたま)相手方と会話を行ない、その他の時間帯には実空間における個人作業(例えば、利用者自身のデスクワーク)を行なう、という使い方もある。すなわち、1つの室内において複数の人間がデスクワークを行なっており、通常時には各人がそれぞれの個人作業を行なっているが、疑問点や確認事項が発生した場合に隣に在席している人と会話する、という、一般的は執務形態を遠隔地にいる相手にまで拡張したものに相当する。   As a method of using such a video / audio communication system, a one-to-one remote conference has been well known so far, but a physical connection with the other party is maintained, but a conversation with the other party is always performed. Rather, there is a usage in which a conversation with the other party is performed intermittently (or occasionally) and personal work (for example, the user's own desk work) is performed in real time at other times. In other words, multiple people are doing desk work in one room, and each person is usually doing their own personal work, but when a question or confirmation occurs, Talking is generally equivalent to an extended form of work to remote parties.

このように、遠隔の相手とずっと会話をするわけではなく、実空間における個人作業を主に行いながらも遠隔相手と物理的に接続した状態を保つものは、グループワークシステムの研究にいくつか例があげられる。これらの研究例では、ユーザに事前に相手の状況情報を提示することで、映像音声通信システムを利用した会話を開始する事を支援している。映像を常時接続することによって、相手の状況を互いに取得できるシステムにおける研究(非特許文献1)や、遠隔相手の近接情報を視覚効果として提示することで相手の状況を取得できるシステムの研究(非特許文献2)、仮想世界を歩き回り遠隔相手のデスクの様子を見ながら相手を探して会話を開始できるシステムの研究(非特許文献3)、ユーザの位置情報とスケジュール情報を用いて情報を提示するシステムの研究(非特許文献4)などが行なわれている。しかし、これらは、状況情報の提示場所について検討していないため、ユーザの個人作業を妨げる場所に提示する可能性があり、また作業状態から会話状態への遷移による、集中したい対象が異なるというユーザ特性の変化について考慮していない。
"Evaluating Video as a Technology for Informal Communication", R. S. Fish, CHI '92 "The Effects of Visual Proxemic Information in Video Mediated Communication", D. Grayson, L. Coventry, CHI '98 "Design of a Multi Media Vehicle for Social Browsing", R. W. Root, Proceedings of the 1988 ACM conference on CSCW "Context Aware Messaging Service:位置情報とスケジュール情報を用いたモパイルコミュニケーションシステムの構築および運用実験", 中西泰人,辻貴孝,大山実,箱崎勝也,情報処理学会論文誌,Vol. 37, No. 6
In this way, there are several examples of research on group work systems that do not always talk with remote partners, but maintain physical connection with remote partners while mainly doing personal work in real space. Can be given. In these research examples, it is supported that the conversation using the video / audio communication system is started by presenting the situation information of the other party to the user in advance. Research on systems that can acquire each other's situation by always connecting video (Non-Patent Document 1), and research on systems that can obtain the other party's situation by presenting the proximity information of the remote party as a visual effect (Non-Patent Document 1) (Patent Document 2), research on a system that can walk around the virtual world and start a conversation while looking at the remote partner's desk (Non-Patent Document 3), presenting information using the user's location information and schedule information System research (Non-patent Document 4) is being conducted. However, these are not considering where to present the situation information, so there is a possibility that it will be presented in a place that hinders the user's personal work, and the user who wants to concentrate differs due to the transition from the work state to the conversation state It does not consider changes in characteristics.
"Evaluating Video as a Technology for Informal Communication", RS Fish, CHI '92 "The Effects of Visual Proxemic Information in Video Mediated Communication", D. Grayson, L. Coventry, CHI '98 "Design of a Multi Media Vehicle for Social Browsing", RW Root, Proceedings of the 1988 ACM conference on CSCW "Context Aware Messaging Service: Construction and operation experiment of mopile communication system using location information and schedule information", Yasuhito Nakanishi, Takataka Tsuji, Minoru Oyama, Katsuya Hakozaki, IPSJ Transactions, Vol. 37, No . 6

従来の映像音声通信システムにおいて、会話に用いるディスプレイを利用者の正面に設置した場合、個人作業中の利用者に対して、ディスプレイは必要でない状況情報を提示することになり、具体的には相手側の状況がちらちらと目に入ってしまって気が散ることとなるので、その利用者の作業の妨げとなる可能性がある。また利用者が会話を始めようとする直前や会話中では、遠隔地にいる相手の顔方向が、会話をしたいと思ってディスプレイ越しにユーザを見ている顔方向であるのか、作業をしたいと思って作業をしている顔方向であるか、の判別が困難である。そのために相手に対して話しかけることが難しい、あるいは、話をしたいという相手の欲求を感じ取りにくいなど、会話の円滑な開始が阻害される、という問題がある。   In a conventional video / audio communication system, when a display used for conversation is installed in front of a user, the display is presented to the user who is working personally. The situation on the side will be distracted and distracted, which may hinder the user's work. Also, when the user is about to start a conversation or during a conversation, he / she wants to work to see if the face direction of the remote party is the face direction where he / she is looking at the user through the display. It is difficult to determine whether the face direction is working. For this reason, there is a problem that the smooth start of the conversation is hindered, for example, it is difficult to talk to the other party or it is difficult to sense the desire of the other party to talk.

そこで本発明の目的は、個人作業を主にした実空間における作業状態と遠隔相手との会話状態という二つの状態が混在する環境において用いられる映像音声通信システムにおいて、利用者の作業の妨げにならないように相手側の映像を提示でき、利用者はその作業中は作業に集中できるとともに、利用者が相手側と会話をしたいときには相手との会話状態への円滑な切替えを可能とする遷移支援方法と、そのような遷移支援方法を実現する映像音声通信システムと、を提供することにある。   Accordingly, an object of the present invention is not to hinder a user's work in a video / audio communication system used in an environment in which two states of a work state in a real space mainly for personal work and a conversation state with a remote partner are mixed. The transition support method that can present the other party's video in such a way that the user can concentrate on the work during the work, and can smoothly switch to the conversation state with the other party when the user wants to talk with the other party And a video / audio communication system for realizing such a transition support method.

本発明の遷移支援方法は、利用者の正面に配置された第1のディスプレイと、第1のディスプレイとは異なる方向に配置された第2のディスプレイとを用い、遠隔相手からの映像及び音声を利用者に提示する映像音声通信システムにおける、利用者の個人作業を主にした実空間における作業状態と遠隔相手との会話状態との間での遷移を支援する遷移支援方法であって、利用者の顔方向を検出するステップと、利用者及び遠隔相手との会話における無発話時間を検出するステップと、顔方向が第2のディスプレイに向いたことを検出して会話モードに遷移するステップと、顔方向がいずれのディスプレイの方向を向いておらず、かつ、無発話時間が一定時間以上継続した場合に、作業モードに移行するステップと、を有する。   The transition support method of the present invention uses a first display arranged in front of a user and a second display arranged in a direction different from the first display, and receives video and audio from a remote partner. A transition support method for supporting a transition between a work state in a real space mainly for a user's personal work and a conversation state with a remote partner in a video / audio communication system to be presented to a user. Detecting the face direction, detecting no-speech time in the conversation with the user and the remote partner, detecting that the face direction is directed to the second display, and transitioning to the conversation mode; And a step of shifting to a work mode when the face direction is not directed to any of the displays and the non-speech time continues for a certain time or more.

本発明の映像音声通信システムは、利用者の個人作業を主にした実空間における作業状態と遠隔相手との会話状態とが混在する環境で用いられ、遠隔相手からの映像及び音声を利用者に提示する映像音声通信システムであって、利用者の正面方向に配置された第1のディスプレイと、第1のディスプレイとは異なる方向に配置された第2のディスプレイと、利用者の正面方向に配置されて利用者を撮影する第1のカメラと、第1のカメラとは異なる位置に配置されて利用者を撮影する第2のカメラと、利用者の発話を収録するマイクロホンと、遠隔相手の発話を利用者に向けて再生するスピーカと、第1及び第2のカメラで撮影した映像をもとに利用者の顔方向を検出する顔方向検出部と、マイクロホンに入力した音声に基づいて無発話時間を測定する無発話時間測定部と、顔方向検出部及び無発話時間測定部のデータに基づき、顔方向が第2のディスプレイに向いたことを検出して会話モードに遷移したと判定し、顔方向がいずれのディスプレイの方向を向いておらず、かつ、無発話時間が一定時間以上継続した場合に、作業モードに遷移したと判定し、判定結果に応じて、遠隔相手の映像の各ディスプレイによる提示を制御するモード判定部と、を有する。   The video / audio communication system of the present invention is used in an environment in which a work state in a real space mainly for a user's personal work and a conversation state with a remote partner are mixed, and video and audio from the remote partner are used for the user. A video / audio communication system to be presented, a first display arranged in a front direction of a user, a second display arranged in a direction different from the first display, and arranged in a front direction of the user The first camera for photographing the user, the second camera for photographing the user arranged at a different position from the first camera, the microphone for recording the user's speech, and the speech of the remote partner A speaker that reproduces the sound toward the user, a face direction detection unit that detects the face direction of the user based on the images taken by the first and second cameras, and no speech based on the sound input to the microphone time Based on the data of the non-speech time measurement unit to be measured, the face direction detection unit, and the non-speech time measurement unit, it is determined that the face direction is directed to the second display, and the face direction is determined Is not facing the direction of any display, and if no talk time continues for a certain time or more, it is determined that the mode has been changed to the work mode, and the remote partner's video is displayed on each display according to the determination result. And a mode determination unit for controlling.

本発明は、個人作業を主にした実空間における作業状態と遠隔相手との会話状態という二つの状態が混在する環境において、ユーザの顔方向、発話の状況を活用してユーザの作業の妨げにならない相手側の映像の提示ディスプレイを選択する事で、ユーザの作業中は作業に集中でき、またユーザが会話をしたい時には相手との会話への円滑な切り替えを可能とする。   The present invention obstructs the user's work by utilizing the user's face direction and the state of the utterance in an environment where two states of a work state in a real space mainly for personal work and a conversation state with a remote partner are mixed. By selecting the display screen of the other party's video that should not be used, it is possible to concentrate on the work during the user's work, and to smoothly switch to the conversation with the other person when the user wants to talk.

次に、本発明の好ましい実施の形態について、図面を参照して説明する。図1は本発明の実施の一形態の映像音声通信システムの構成を示すブロック図である。   Next, a preferred embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a video / audio communication system according to an embodiment of the present invention.

映像音声通信システムは、利用者100の側と相手200の側とにそれぞれ配置されており、両者の映像音声通信システム間は、ネットワーク190によって接続されている。利用者100側ではその利用者100用のデスク150が設けられており、相手200側ではその人用のデスク250が備えられているものとする。   The video / audio communication system is arranged on the user 100 side and the partner 200 side, respectively, and the video / audio communication system is connected by a network 190. It is assumed that a desk 150 for the user 100 is provided on the user 100 side, and a desk 250 for the person is provided on the partner 200 side.

本実施形態の映像音声通信システムでは、会話モードと作業モードとの2つのモードが備えられている。会話モードは、利用者100が相手200と会話している、相手200と会話をしたい、あるいは、会話をするためにディスプレイによって相手200の状況を見ている、という状態(遠隔相手との会話状態)に対応するモードである。これに対し、作業モードは、利用者100が、相手200に対して会話をしないで、その利用者100の個人の作業に集中している状態(個人作業を主体とした実空間における作業状態)に対応するモードである。以下に説明するように、映像音声通信システムは、利用者100の状態を検出して会話モードと作業モードの間で遷移し、判別されたモードに応じてディスプレイ上での提示内容を変更する。   The video / audio communication system of the present embodiment has two modes, a conversation mode and a work mode. The conversation mode is a state in which the user 100 is talking with the partner 200, wants to talk with the partner 200, or is watching the situation of the partner 200 on the display to have a conversation (a conversation state with a remote partner). ) Mode. On the other hand, in the work mode, the user 100 does not have a conversation with the partner 200 and concentrates on the personal work of the user 100 (work state in a real space mainly composed of personal work). Is a mode corresponding to. As will be described below, the video / audio communication system detects the state of the user 100, makes a transition between the conversation mode and the work mode, and changes the content presented on the display according to the determined mode.

利用者100側の映像音声通信システムは、デスク150の椅子に座った状態の利用者100から見えるように画面を向けられているとともに、デスク150の上方の天井に設置された天井ディスプレイ101と、デスク150の椅子に座った利用者100の頭部に光軸を向けてデスク150上方の天井に設置された天井カメラ102と、デスク150の椅子に座った状態の利用者100の正面の位置に配置されたデスクディスプレイ103と、デスク150の椅子に座った状態の利用者100の頭部に指向軸を向けて設置されたデスクカメラ104と、利用者100の発話を収録するマイクロホン105と、天井カメラ102及び/またはデスクカメラ104によって撮影した映像に基づいて利用者100の顔方向を検出する顔方向検出部106と、マイクロホン105によって入力した音声に基づいて利用者100と相手200との会話における無発話時間を測定する無発話時間測定部107と、顔方向検出部106及び無発話時間測定部107での検出あるいは測定結果に基づいて、会話モードか作業モードかを判定するモード判定部108と、相手200側の映像音声通信システムへのネットワーク190を介した通信を制御する通信制御部109と、遠隔地にいる相手200の発話を利用者100に向けて再生するスピーカ110と、を備えている。デスクディプレイ103は、例えば、デスク150上あるいはデスク150の前方に設置されている。デスクディスプレイ103としては、利用者100がその個人作業に用いるパーソナルコンピュータのディスプレイを用いることができる。   The video / audio communication system on the user 100 side has a screen facing the user 100 who is sitting on a chair of the desk 150 and a ceiling display 101 installed on the ceiling above the desk 150; The ceiling camera 102 installed on the ceiling above the desk 150 with the optical axis directed to the head of the user 100 sitting on the chair of the desk 150 and the front position of the user 100 sitting on the chair of the desk 150 The desk display 103 arranged, the desk camera 104 installed with the directional axis directed to the head of the user 100 sitting on the chair of the desk 150, the microphone 105 that records the utterance of the user 100, and the ceiling A face direction detection unit that detects the face direction of the user 100 based on an image captured by the camera 102 and / or the desk camera 104. 06, a non-speech time measuring unit 107 that measures a non-speech time in a conversation between the user 100 and the other party 200 based on the voice input by the microphone 105, a face direction detecting unit 106, and a non-speech time measuring unit 107 Based on the detection or measurement result, a mode determination unit 108 that determines whether the mode is a conversation mode or a work mode, a communication control unit 109 that controls communication via the network 190 to the video / audio communication system on the partner 200 side, And a speaker 110 that reproduces the utterance of the partner 200 at the user 100 toward the user 100. The desk display 103 is installed on the desk 150 or in front of the desk 150, for example. As the desk display 103, a display of a personal computer used by the user 100 for the personal work can be used.

同様に、相手200側の映像音声通信システムも、天井ディスプレイ201と、天井カメラ202と、デスクディスプレイ203と、デスクカメラ204と、マイクロホン205と、顔方向検出部206と、無発話時間測定部207と、モード判定部208と、通信制御部209と、スピーカ210と、を備えている。   Similarly, the video / audio communication system on the partner 200 side also includes a ceiling display 201, a ceiling camera 202, a desk display 203, a desk camera 204, a microphone 205, a face direction detection unit 206, and a speechless time measurement unit 207. A mode determination unit 208, a communication control unit 209, and a speaker 210.

利用者100の映像音声通信システムでは、天井ディスプレイ101には、少なくとも利用者100の顔が天井ディスプレイ101の方向を向いたときに、相手200側の天井カメラ202で撮影された相手200の映像が提示される。また、デスクディスプレイ103には、会話モード時に、相手200側のデスクカメラ204で撮影された相手200の映像が提示される。相手200の映像音声通信システムでも、天井ディスプレイ201には、少なくとも相手200の顔が天井ディスプレイ201の方向を向いたときに、利用者100側の天井カメラ102で撮影された利用者100の映像が提示され、モード判定部208が会話モードと判定しているときに、デスクディスプレイ103には、利用者100側のデスクカメラ104で撮影された利用者100の映像が提示される。   In the video / audio communication system of the user 100, the image of the partner 200 captured by the ceiling camera 202 on the partner 200 side is displayed on the ceiling display 101 when at least the face of the user 100 faces the direction of the ceiling display 101. Presented. In addition, the desk display 103 presents an image of the partner 200 captured by the desk camera 204 on the partner 200 side in the conversation mode. Even in the video / audio communication system of the other party 200, the image of the user 100 captured by the ceiling camera 102 on the user 100 side is displayed on the ceiling display 201 when at least the face of the other party 200 faces the direction of the ceiling display 201. When presented and the mode determination unit 208 determines the conversation mode, the desk display 103 presents the video of the user 100 taken by the desk camera 104 on the user 100 side.

次に、この映像音声通信システムの動作を説明する。   Next, the operation of this video / audio communication system will be described.

まず、モード判定部108によるモード判定を説明する。   First, mode determination by the mode determination unit 108 will be described.

顔方向検出部106は、天井カメラ102及び/またはデスクカメラ104で撮影した映像から、肌色領域検出によって、利用者100の顔領域を抽出し、またその領域内の利用者100の目口鼻の位置を検出し、これらの結果から、利用者100の顔方向を判定する。無発話時間測定部107は、マイクロホン105で取得した音声に基づいて、利用者100及び相手200との互いの発話のない時間を測定する。そして、モード判定部108は、いずれのモードにある場合であっても、利用者100の顔方向が天井ディスプレイ101の方向を向いたときには、利用者100が相手200と会話をしたい、あるいは相手200と会話するために相手200の状況を見ている、と判断して、会話モードに遷移する。そして、会話モードに遷移すると、利用者100の顔が天井ディスプレイ101に向いている時には天井ディスプレイ101に相手200側の天井カメラ202で取得した相手200の映像を提示し、利用者100の顔がデスクディスプレイ103に向いている時は、そのデスクディスプレイ103には相手200側のデスクカメラ204で取得した相手200の映像を提示する、というように、利用者100の顔方向に応じて提示するディスプレイを決定する。そしてモード判定部108は、会話モード中であって、利用者100の顔方向がいずれのディスプレイ101,103にも向いておらず、かつ無発話時間が一定時間(例えば3秒)より長い場合、その利用者100は提示された相手200に会話しないで個人の作業に集中している状態とみなして、作業モードに遷移する。作業モードでは、モード判定部108は、利用者100の作業を妨げないよう、相手映像を天井ディスプレイ101のみに提示する。   The face direction detection unit 106 extracts the face area of the user 100 from the image captured by the ceiling camera 102 and / or the desk camera 104 by detecting the skin color area, and also detects the area of the eyes and nose of the user 100 in the area. The position is detected, and the face direction of the user 100 is determined from these results. The non-speech time measuring unit 107 measures the time when the user 100 and the partner 200 do not speak each other based on the voice acquired by the microphone 105. In any mode, the mode determination unit 108 wants the user 100 to have a conversation with the partner 200 or the partner 200 when the face direction of the user 100 faces the direction of the ceiling display 101. It is determined that the situation of the partner 200 is being viewed in order to talk to the user, and the conversation mode is entered. When the mode is changed to the conversation mode, when the face of the user 100 faces the ceiling display 101, the video of the partner 200 acquired by the ceiling camera 202 on the partner 200 side is presented on the ceiling display 101, and the face of the user 100 is displayed. When facing the desk display 103, the display that is presented according to the face direction of the user 100, such as presenting the video of the partner 200 acquired by the desk camera 204 on the partner 200 side on the desk display 103. To decide. The mode determination unit 108 is in the conversation mode, the face direction of the user 100 is not facing any of the displays 101 and 103, and the no-speaking time is longer than a certain time (for example, 3 seconds), The user 100 is considered to be in a state where he / she concentrates on the individual work without talking to the presented partner 200, and transitions to the work mode. In the work mode, the mode determination unit 108 presents the partner video only on the ceiling display 101 so as not to disturb the work of the user 100.

このように本実施形態では、モード判定部108(あるいはモード判定部208)によって、会話モードと作業モードとを自動的に切替えることができ、これによって、利用者100や相手200は、その個人作業中は作業に集中でき、また作業から相手との会話への円滑な切り替えを行なうことができるようになる。   As described above, in the present embodiment, the mode determination unit 108 (or the mode determination unit 208) can automatically switch between the conversation mode and the work mode. You can concentrate on your work and you can smoothly switch from work to conversation with your partner.

図2は、利用者100側の映像音声通信システムにおける処理を示すフローチャートである。当然のことながら、相手200側の映像音声通信システムも、同様に処理を実行する。   FIG. 2 is a flowchart showing processing in the video / audio communication system on the user 100 side. As a matter of course, the video / audio communication system on the partner 200 side performs the same process.

初期状態は作業モードであるとして、ステップ301において、作業モードに移行する。作業モードでは、利用者100が、デスクディスプレイ103を使用する使用しないに関わらずそのデスク150上で作業をしている時、天井ディスプレイ101は、相手200側の天井カメラ202より送信されたデータを提示する(ステップ302)。デスクディスプレイ103は、作業用のデータを提示する、もしくは何も提示しない。作業モードは、互いに相手側の利用者とは通信しようとしない状態であるので、マイクロホン105での音声入力は行なわれず、スピーカ110からの相手側音声の再生も行なわれない。作業モード時、モード判定部108は、天井カメラ102及びデスクカメラ104で撮影した映像に基づいて顔方向検出部106が検出した利用者100の顔方向のデータによって判定を行なう(ステップ303)。ユーザの顔方向が天井ディスプレイ101方向である場合にのみ、ステップ304に移行して会話モードに遷移する。それ以外の場合は、ステップ301に戻る。   Assuming that the initial state is the work mode, in step 301, the operation mode is entered. In the work mode, when the user 100 is working on the desk 150 regardless of whether or not the desk display 103 is used, the ceiling display 101 receives the data transmitted from the ceiling camera 202 on the partner 200 side. Present (step 302). The desk display 103 presents work data or does not present anything. Since the work mode is a state in which the other users are not trying to communicate with each other, no sound is input from the microphone 105 and the other party's sound from the speaker 110 is not reproduced. In the work mode, the mode determination unit 108 makes a determination based on the face direction data of the user 100 detected by the face direction detection unit 106 based on the images taken by the ceiling camera 102 and the desk camera 104 (step 303). Only when the face direction of the user is the direction of the ceiling display 101, the process proceeds to step 304 and transitions to the conversation mode. Otherwise, the process returns to step 301.

会話モードでは、常時ユーザの顔方向判定が行なわれ、利用者100の顔方向が天井ディスプレイ101方向である時は、相手200側の天井カメラ202より送信されたデータを天井ディスプレイ101に提示し、顔方向がデスクディスプレイ103方向である時は、相手200側のデスクカメラ204より送信されたデータをデスクディスプレイ103に提示する。顔方向がそれら以外の方向である時は事前に提示されていたディスプレイへの提示を続行する。すなわち、顔方向に追従して映像を提示する(ステップ305)。そして、モード判定部107は、ステップ306において、まず、無発話時間測定部107のデータにより、無発話時間が一定時間以上であるかどうかを判定し、無発話時間が一定時間未満であれば会話モードを続行するものとしてステップ304に戻る。無発話時間が一定時間以上であれば、モード判定部108は、ステップ307において、顔方向検出部106のデータによってユーザの顔方向がいずれのディスプレイ101,103方向以外の方向であるかどうかを判定し、ディスプレイ方向以外の方向であれば、利用者100は、相手200に会話せず個人の作業に集中しているとみなして、ステップ301に移行し、作業モードに遷移する。顔方向がディスプレイ方向であれば、会話モードを続行するものとしてステップ304に戻る。   In the conversation mode, the user's face direction is always determined, and when the face direction of the user 100 is the direction of the ceiling display 101, the data transmitted from the ceiling camera 202 on the partner 200 side is presented to the ceiling display 101, When the face direction is the desk display 103 direction, the data transmitted from the desk camera 204 on the partner 200 side is presented on the desk display 103. When the face direction is a direction other than those, the presentation on the display previously presented is continued. That is, the video is presented following the face direction (step 305). Then, in step 306, the mode determination unit 107 first determines whether or not the non-speech time is a predetermined time or more based on the data of the non-speech time measurement unit 107. Return to step 304 to continue the mode. If the non-speaking time is equal to or longer than a certain time, the mode determination unit 108 determines in step 307 whether the face direction of the user is a direction other than the display 101 or 103 direction based on the data of the face direction detection unit 106. If the direction is other than the display direction, the user 100 considers that the user 100 is not conversing with the partner 200 and concentrates on the individual work, and proceeds to step 301 to shift to the work mode. If the face direction is the display direction, the process returns to step 304 as continuing the conversation mode.

このようにして、モード判定部108は、モード判定の処理を実行する。   In this way, the mode determination unit 108 executes the mode determination process.

次に、デスクディスプレイ103における表示方法を説明する。会話モード時に、相手200側のデスクカメラ204の映像がデスクディスプレイ103に表示される場合、利用者100が読書などを行っていて作業にデスクディスプレイ103を用いていない場合には、デスクディスプレイ103の全面に映像を提示するようにする。これに対し、利用者100が、メール送受信など、作業にデスクディスプレイ103を用いている場合には、まず文字表示の無い部分をディスプレイ上より探索し、文字表示の無い領域が一定のサイズ以上存在すれば、その領域に映像を提示するようにする。そのような領域が内場合には、デスクディスプレイ103の表示面の四隅のうち、文字表示のない領域の多い箇所に映像を提示するようにする。   Next, a display method on the desk display 103 will be described. When the video of the desk camera 204 of the other party 200 is displayed on the desk display 103 in the conversation mode, when the user 100 is reading and not using the desk display 103 for work, the desk display 103 Try to present the video on the entire surface. On the other hand, when the user 100 is using the desk display 103 for work such as sending and receiving e-mails, the user first searches for a portion without character display on the display, and an area without character display exists more than a certain size. Then, the video is presented in that area. In the case where such an area is inside, the video is presented at a place where there are many areas without character display among the four corners of the display surface of the desk display 103.

以上説明した映像音声通信システムのうち、顔方向検出部106、無発話時間測定部107、モード判定部108及び通信制御部109は、それを実現するための計算機プログラムを、パーソナルコンピュータなどの計算機に読み込ませ、そのプログラムを実行させることによっても実現できる。このようなプログラムは、CD−ROMなどの記録媒体によって、あるいはネットワークを経由して、計算機に読み込まれる。そのような計算機は、一般に、CPU(中央処理装置)と、プログラムやデータを格納するためのハードディスク装置と、主メモリと、キーボードやマウスなどの入力装置と、天井ディスプレイ101やデスクディスプレイ103と接続するためのビデオアダプタと、CD−ROM等の記録媒体を読み取る読み取り装置と、天井カメラ102、デスクカメラ104、マイクロホン105、スピーカ110などが接続されるインタフェース部と、ネットワーク190と接続するための通信インタフェースとから構成されている。   In the video / audio communication system described above, the face direction detection unit 106, the non-speech time measurement unit 107, the mode determination unit 108, and the communication control unit 109 store a computer program for realizing the above in a computer such as a personal computer. It can also be realized by reading and executing the program. Such a program is read into a computer by a recording medium such as a CD-ROM or via a network. Such a computer is generally connected to a CPU (Central Processing Unit), a hard disk device for storing programs and data, a main memory, input devices such as a keyboard and a mouse, and a ceiling display 101 and a desk display 103. A video adapter, a reading device that reads a recording medium such as a CD-ROM, an interface unit to which the ceiling camera 102, the desk camera 104, the microphone 105, the speaker 110, and the like are connected, and a communication for connecting to the network 190 Interface.

本発明の実施の一形態の映像音声通信システムの構成を示すブロック図である。It is a block diagram which shows the structure of the video / audio communication system of one Embodiment of this invention. 図1に示す映像音声通信システムにおけるモードの遷移を説明するフローチャートである。It is a flowchart explaining the mode transition in the audio video communication system shown in FIG.

符号の説明Explanation of symbols

100 利用者
101,201 天井ディスプレイ
102,202 天井カメラ
103,203 デスクディスプレイ
104,204 デスクカメラ
105,205 マイクロホン
106,206 顔方向検出部
107,207 無発話時間測定部
108,208 モード判定部
109,209 通信制御部
110,210 スピーカ
150,250 デスク
190 ネットワーク
200 相手
100 User 101, 201 Ceiling display 102, 202 Ceiling camera 103, 203 Desk display 104, 204 Desk camera 105, 205 Microphone 106, 206 Face direction detection unit 107, 207 Speechless time measurement unit 108, 208 Mode determination unit 109, 209 Communication control unit 110, 210 Speaker 150, 250 Desk 190 Network 200

Claims (7)

利用者の正面に配置された第1のディスプレイと、前記第1のディスプレイとは異なる方向に配置された第2のディスプレイとを用い、遠隔相手からの映像及び音声を利用者に提示する映像音声通信システムにおける、利用者の個人作業を主にした実空間における作業状態と遠隔相手との会話状態との間での遷移を支援する遷移支援方法であって、
前記利用者の顔方向を検出するステップと、
前記利用者及び前記遠隔相手との会話における無発話時間を検出するステップと、
前記顔方向が前記第2のディスプレイに向いたことを検出して会話モードに遷移するステップと、
前記顔方向がいずれのディスプレイの方向を向いておらず、かつ、前記無発話時間が一定時間以上継続した場合に、作業モードに移行するステップと、
を有する、遷移支援方法。
Video and audio presenting video and audio from a remote partner to the user using a first display arranged in front of the user and a second display arranged in a direction different from the first display A transition support method for supporting transition between a working state in a real space mainly for a user's personal work in a communication system and a conversation state with a remote partner,
Detecting a face direction of the user;
Detecting speechless time in a conversation with the user and the remote party;
Detecting that the face direction is directed to the second display and transitioning to a conversation mode;
When the face direction does not face the direction of any display, and when the no-speech time continues for a certain time or more, a transition to a work mode;
A transition support method.
前記会話モードにおいて、前記会話モードにおいて、前記遠隔相手の正面からの映像を前記第1のディスプレイによって提示し、前記遠隔相手の正面以外からの映像を前記第2のディスプレイによって提示するように、前記顔方向に追従して前記第1及び第2のディスプレイによて前記遠隔相手の映像を提示するステップと、
前記作業モードでは、前記第1のディスプレイによる前記遠隔相手の映像の提示を停止するステップと、
をさらに有する請求項1に記載の遷移支援方法。
In the conversation mode, in the conversation mode, the video from the front of the remote partner is presented by the first display, and the video from other than the front of the remote partner is presented by the second display. Following the face direction and presenting the image of the remote party on the first and second displays;
In the work mode, stopping the presentation of the image of the remote partner on the first display;
The transition support method according to claim 1, further comprising:
異なる2つのカメラによって前記利用者を撮影し、撮影された映像に対して肌色領域検出を行なって前記利用者の顔の領域を抽出し、抽出された領域内で前記利用者の目口鼻の位置を検出することによって、前記利用者の顔方向を判定する、請求項1または2に記載の遷移支援方法。   The user is photographed by two different cameras, the skin color area detection is performed on the photographed video, the face area of the user is extracted, and the user's eyes and nose are extracted in the extracted area. The transition support method according to claim 1, wherein a face direction of the user is determined by detecting a position. 利用者の個人作業を主にした実空間における作業状態と遠隔相手との会話状態とが混在する環境で用いられ、前記遠隔相手からの映像及び音声を前記利用者に提示する映像音声通信システムであって、
前記利用者の正面方向に配置された第1のディスプレイと、
前記第1のディスプレイとは異なる方向に配置された第2のディスプレイと、
前記利用者の正面方向に配置されて前記利用者を撮影する第1のカメラと、
前記第1のカメラとは異なる位置に配置されて前記利用者を撮影する第2のカメラと、
前記利用者の発話を収録するマイクロホンと、
前記遠隔相手の発話を前記利用者に向けて再生するスピーカと、
前記第1及び第2のカメラで撮影した映像をもとに前記利用者の顔方向を検出する顔方向検出部と、
マイクロホンに入力した音声に基づいて無発話時間を測定する無発話時間測定部と、
前記顔方向検出部及び前記無発話時間測定部のデータに基づき、前記顔方向が前記第2のディスプレイに向いたことを検出して会話モードに遷移したと判定し、前記顔方向がいずれのディスプレイの方向を向いておらず、かつ、前記無発話時間が一定時間以上継続した場合に、作業モードに遷移したと判定し、判定結果に応じて、前記遠隔相手の映像の前記各ディスプレイによる提示を制御するモード判定部と、
を有する映像音声通信システム。
A video / audio communication system that is used in an environment where a work state in a real space mainly for a user's personal work and a conversation state with a remote partner are mixed, and presents video and audio from the remote partner to the user. There,
A first display arranged in the front direction of the user;
A second display arranged in a different direction from the first display;
A first camera arranged in a front direction of the user to photograph the user;
A second camera arranged at a position different from the first camera and photographing the user;
A microphone that records the user's utterance;
A speaker for reproducing the utterance of the remote partner toward the user;
A face direction detection unit for detecting the face direction of the user based on images taken by the first and second cameras;
A non-speech time measuring unit that measures the non-speech time based on the sound input to the microphone;
Based on the data of the face direction detecting unit and the non-speech time measuring unit, it is determined that the face direction is directed to the second display and it is determined that the conversation mode has been changed, and the face direction is any display. If the no-speaking time has continued for a certain time or more, it is determined that the mode has shifted to the work mode, and the display of the remote partner's video is displayed on each display according to the determination result. A mode determination unit to control;
A video / audio communication system.
前記モード判定部は、前記会話モードでは、前記遠隔相手の正面からの映像を前記第1のディスプレイによって提示し、前記遠隔相手の正面以外からの映像を前記第2のディスプレイによって提示するように、前記顔方向に追従して前記第1及び第2のディスプレイによって前記遠隔相手の映像を提示し、前記作業モードでは、前記第1のディスプレイによる前記遠隔相手の映像の提示を停止する、請求項4に記載の映像音声通信システム。   In the conversation mode, the mode determination unit presents an image from the front of the remote partner on the first display, and presents an image from other than the front of the remote partner on the second display. The video of the remote partner is presented by the first and second displays following the face direction, and the presentation of the video of the remote partner by the first display is stopped in the work mode. The audiovisual communication system according to 1. 前記第2のディスプレイ及び前記第2のカメラは、前記利用者の頭上方向の天井に設けられる、請求項4または5に記載の映像音声通信システム。   The video / audio communication system according to claim 4, wherein the second display and the second camera are provided on a ceiling in the overhead direction of the user. 利用者の正面に配置された第1のディスプレイと、前記第1のディスプレイとは異なる方向に配置された第2のディスプレイとを用い、遠隔相手からの映像及び音声を利用者に提示する映像音声通信システムを構成するコンピュータに、
前記利用者の顔方向を検出する処理、
前記利用者及び前記遠隔相手との会話における無発話時間を検出する処理、
前記顔方向が前記第2のディスプレイに向いたことを検出して会話モードに遷移する処理、
前記顔方向がいずれのディスプレイの方向を向いておらず、かつ、前記無発話時間が一定時間以上継続した場合に、作業モードに移行する処理、
前記会話モードにおいて、前記遠隔相手の正面からの映像を前記第1のディスプレイによって提示し、前記遠隔相手の正面以外からの映像を前記第2のディスプレイによって提示するように、前記顔方向に追従して前記第1及び第2のディスプレイによて前記遠隔相手の映像を提示する処理、
前記作業モードでは、前記第1のディスプレイによる前記遠隔相手の映像の提示を停止する処理、
とを実行させる、プログラム。
Video and audio presenting video and audio from a remote partner to the user using a first display arranged in front of the user and a second display arranged in a direction different from the first display In the computer constituting the communication system,
Processing to detect the user's face direction;
A process for detecting a speechless time in a conversation between the user and the remote party;
A process of detecting that the face direction is directed to the second display and transitioning to a conversation mode;
A process of shifting to a work mode when the face direction is not directed to any display and the no-speaking time has continued for a certain period of time;
In the conversation mode, the image from the front of the remote partner is presented on the first display, and the image from the front of the remote partner is presented on the second display, following the face direction. A process of presenting the image of the remote party on the first and second displays;
In the work mode, a process of stopping the presentation of the remote partner's video on the first display;
And a program to execute.
JP2004328022A 2004-11-11 2004-11-11 Transition support method and video / audio communication system Expired - Fee Related JP4496060B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004328022A JP4496060B2 (en) 2004-11-11 2004-11-11 Transition support method and video / audio communication system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004328022A JP4496060B2 (en) 2004-11-11 2004-11-11 Transition support method and video / audio communication system

Publications (2)

Publication Number Publication Date
JP2006139028A JP2006139028A (en) 2006-06-01
JP4496060B2 true JP4496060B2 (en) 2010-07-07

Family

ID=36619908

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004328022A Expired - Fee Related JP4496060B2 (en) 2004-11-11 2004-11-11 Transition support method and video / audio communication system

Country Status (1)

Country Link
JP (1) JP4496060B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2639674B1 (en) * 2012-03-12 2016-06-01 Alcatel Lucent Method for control of a video interface, face orientation detector, and video conferencing server

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04238475A (en) * 1991-01-22 1992-08-26 Nippon Telegr & Teleph Corp <Ntt> Handset type television device and video telephone system using the same
JP2002034009A (en) * 2000-07-14 2002-01-31 Canon Inc Bidirectional recognition system and method and recording medium

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04238475A (en) * 1991-01-22 1992-08-26 Nippon Telegr & Teleph Corp <Ntt> Handset type television device and video telephone system using the same
JP2002034009A (en) * 2000-07-14 2002-01-31 Canon Inc Bidirectional recognition system and method and recording medium

Also Published As

Publication number Publication date
JP2006139028A (en) 2006-06-01

Similar Documents

Publication Publication Date Title
JP7379907B2 (en) Information processing device, information processing program, information processing system, information processing method
JP6734419B2 (en) Message user interface for media and location capture and transmission
CN105683867B (en) Touch-screen display is configured to meeting
US20170180678A1 (en) User experience for conferencing with a touch screen display
JP6051208B2 (en) Present or shared state in the presence
US20220224735A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and method
JP7427408B2 (en) Information processing device, information processing method, and information processing program
JPWO2019098037A1 (en) Information processing terminal, information processing device, and information processing method
WO2020170453A1 (en) Information processing device, information processing method, and program
JP2020136921A (en) Video call system and computer program
JP4496060B2 (en) Transition support method and video / audio communication system
JPWO2010018770A1 (en) Image display device
JP2009060220A (en) Communication system and communication program
WO2021153303A1 (en) Information processing device and information processing method
JP2001057672A (en) Apparatus and method for communication, and medium
JP2006338493A (en) Method, device, and program for detecting next speaker
KR102124757B1 (en) System and method of determining micro spare time using sensor of mobile apparatus
JP2012114511A (en) Conference system
KR102061619B1 (en) Mobile apparatus, audio book creating system having the same and method of creating audio book using the same
JP2004259198A (en) Information management apparatus, information management system and program
JPH06311510A (en) Conference supporting system for remote location
WO2019146188A1 (en) Information processing device and information processing method
JP5909475B2 (en) Remote dialogue apparatus and method
JP7067481B2 (en) Information processing equipment, information processing methods, programs, and communication systems
JP2009123229A (en) Information management device, information management system, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100331

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100412

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130416

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140416

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees