JPH0746561A - Multmedia equipment - Google Patents

Multmedia equipment

Info

Publication number
JPH0746561A
JPH0746561A JP5189591A JP18959193A JPH0746561A JP H0746561 A JPH0746561 A JP H0746561A JP 5189591 A JP5189591 A JP 5189591A JP 18959193 A JP18959193 A JP 18959193A JP H0746561 A JPH0746561 A JP H0746561A
Authority
JP
Japan
Prior art keywords
voice
window
variable
received
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5189591A
Other languages
Japanese (ja)
Inventor
Shuichi Kadowaki
修一 門脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5189591A priority Critical patent/JPH0746561A/en
Publication of JPH0746561A publication Critical patent/JPH0746561A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To easily identify the window of an opposite party receiving the voice from plural windows by a user. CONSTITUTION:When there is any opposite party receiving no voice higher than a prescribed level for prescribed time, a level detection circuit 22 instructs to display the opposite party with an icon on a display device 34 to a display control circuit 32 by detecting the level of the voice from the opposite party. When the voice higher than the prescribed level is received from the opposite party displayed with icon, the window display of the opposite party on the display device 34 is instructed to the display control circuit 32.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、通信回線を介して複数
の相手とマルチメディア(画像、音声及びデータ等)の
通信を行うマルチメディア装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multimedia device for communicating multimedia (image, voice, data, etc.) with a plurality of parties via a communication line.

【0002】[0002]

【従来の技術】従来、テレビ会議システムは、通信回線
を介して複数の相手と画像、音声及びデータなどを多重
化してマルチメディア通信を行い、複数の相手から受信
した音声をひとつに混合してスピーカに出力し、複数の
相手から受信した画像をマルチウィンドウ上に表示する
ことができるように構成されている。
2. Description of the Related Art Conventionally, a video conference system performs multimedia communication by multiplexing images, voice and data with a plurality of parties via a communication line, and mixes voices received from a plurality of parties into one. The image output from the speaker and received from a plurality of parties can be displayed on the multi-window.

【0003】[0003]

【発明が解決しようとする課題】しかし、従来例では、
現在、音声を受信しているか否かに拘わらず、全ての相
手の画像がウィンドウに表示される。また、複数の相手
から受信した音声は、各ウィンドウの位置とは無関係
に、同等に混合されて出力されるため、どのウィンドウ
に対応する音声も一様に聞こえる。そのため、ユーザ
は、スピーカから出力される音声がどのウィンドウの相
手からのものか分かりにくい。また、全ての相手の画像
をウィンドウに表示すると、装置の負担が大きい。
However, in the conventional example,
Currently, the images of all the opponents are displayed in the window regardless of whether or not audio is currently received. Further, the voices received from a plurality of parties are equally mixed and output regardless of the position of each window, so that the voices corresponding to any windows can be heard uniformly. For this reason, it is difficult for the user to understand which window the partner outputs as the sound output from the speaker. Also, displaying the images of all the opponents in the window puts a heavy burden on the device.

【0004】本発明は、このような問題を解決するマル
チメディア装置を提示することを目的とする。
The present invention aims at presenting a multimedia device which solves such problems.

【0005】[0005]

【課題を解決するための手段】第1の発明に係るマルチ
メディア装置は、通信回線を介して複数の相手とマルチ
メディア通信を行い、当該相手から受信した複数の画像
をマルチウィンドウで表示するマルチメディア装置であ
って、当該相手から受信した音声レベルを検出する音声
レベル検出手段と、当該音声レベル検出手段の検出結果
に基づいて、所定時間、所定の音声を受信していない相
手の画像を表示するウインドウをアイコン表示とすRつ
手段とを有することを特徴とする。
A multimedia device according to a first aspect of the present invention performs multimedia communication with a plurality of partners via a communication line and displays a plurality of images received from the partner in a multi-window. A media device, which displays a voice level detecting means for detecting a voice level received from the other party, and an image of the other party who has not received a predetermined voice for a predetermined time based on the detection result of the voice level detecting means. R window means for displaying a window to be displayed as an icon.

【0006】第2の発明に係るマルチメディア装置は、
通信回線を介して複数の相手とマルチメディア通信を行
い、受信画像をマルチウィンドウで表示するマルチメデ
ィア装置であって、各ウィンドウの位置関係を読み込む
手段と、当該複数の相手からの受信音声を、対応するウ
ィンドウの位置関係に応じた音量で出力させる出力手段
とを有することを特徴とする。
A multimedia device according to the second invention is
A multimedia device for performing multimedia communication with a plurality of parties via a communication line and displaying received images in a multi-window, a means for reading the positional relationship of each window, and a received voice from the plurality of parties, And an output unit for outputting at a volume according to the positional relationship of the corresponding windows.

【0007】[0007]

【作用】上記手段により、所定時間、音声を発していな
い相手は、ウィンドウ表示から除外されるので、注目す
べきウィンドウ、即ち音声に対応する相手のウィンドウ
がユーザに分かりやすい。
By the above means, the person who has not made a voice for a predetermined time is excluded from the window display, so that the user can easily understand the window to be noticed, that is, the window of the person corresponding to the voice.

【0008】また、各スピーカから出力される音声の強
弱関係から、音声に対応する相手のウィンドウがユーザ
に分かりやすくなる。
Also, the window of the other party corresponding to the voice can be easily understood by the user due to the strength relation of the voice output from each speaker.

【0009】[0009]

【実施例】以下、図面を参照して本発明の実施例を説明
する。
Embodiments of the present invention will be described below with reference to the drawings.

【0010】図1は、本発明の第1の実施例の概略構成
ブロック図である。10は装置全体を制御するCPU、
12はCPU10で実行されるプログラムを格納するR
OM、14はCPU10で使用されるデータを格納する
RAM、16はキーボード及びタッチパネルなどからな
る操作装置、18はITU−T(旧CCITT)勧告
G.722に従って音声信号の符号化及び復号化を実行
する音声符号化復号化回路、20は音声入力のマイク、
22は受信した音声のレベルを検出するレベル検出回
路、24は受信した複数の相手の音声をひとつに混合す
る音声混合回路、26は音声を出力するスピーカであ
る。
FIG. 1 is a schematic block diagram of the first embodiment of the present invention. 10 is a CPU that controls the entire apparatus,
Reference numeral 12 is an R storing a program executed by the CPU 10.
OM, 14 is a RAM for storing data used in the CPU 10, 16 is an operating device including a keyboard and a touch panel, and 18 is ITU-T (former CCITT) recommendation G. 722, a voice encoding / decoding circuit for performing encoding and decoding of a voice signal, 20 is a voice input microphone,
Reference numeral 22 is a level detection circuit that detects the level of the received voice, 24 is a voice mixing circuit that mixes the received voices of the other parties into one, and 26 is a speaker that outputs the voice.

【0011】28はITUーT勧告H.261に従って
画像信号の符号化及び復号化を実行する画像符号化復号
化回路、30は画像を入力するカメラ、32は複数の相
手の画像をマルチウィンドウ上に表示したり、ウィンド
ウ表示とアイコン表示との切り替えを行う表示制御回
路、34は画像を表示するLCD又はCRTなどからな
る表示装置である。
28 is ITU-T Recommendation H.264. An image encoding / decoding circuit that executes encoding and decoding of an image signal in accordance with H.261, 30 is a camera for inputting an image, 32 is a multi-window display of images of a plurality of partners, a window display and an icon display. Is a display control circuit for switching between, and 34 is a display device including an LCD or a CRT for displaying an image.

【0012】36はITU−T勧告H.221に従って
画像、音声及びデータなどを多重化し、分離する多重分
離回路、38は通信回線との接続及び通信を制御する回
線制御回路、40は現在の時刻を読みとることができる
クロックである。
Reference numeral 36 denotes ITU-T recommendation H.264. A demultiplexing circuit that multiplexes and separates images, voices, and data according to 221, 38 is a line control circuit that controls connection and communication with a communication line, and 40 is a clock that can read the current time.

【0013】図2は、音声符号化復号化回路18から音
声混合回路24に供給される音声フレームの構造を示
す。複数の相手からの音声信号は時分割多重化され、各
相手の音声信号はタイムスロットに格納される。図2に
おいて、42は相手#1の音声信号を格納するタイムス
ロット、44は相手#2の音声信号を格納するタイムス
ロット、46は相手#3の音声信号を格納するタイムス
ロット、48は相手#4の音声信号を格納するタイムス
ロットである。図2は相手が4人の場合を示しており、
タイムスロット48の後には同じ繰り返しでタイムスロ
ットが続く。
FIG. 2 shows the structure of the audio frame supplied from the audio encoding / decoding circuit 18 to the audio mixing circuit 24. Voice signals from a plurality of partners are time-division multiplexed, and the voice signals of each partner are stored in time slots. In FIG. 2, 42 is a time slot for storing the voice signal of the partner # 1, 44 is a time slot for storing the voice signal of the partner # 2, 46 is a time slot for storing the voice signal of the partner # 3, and 48 is a partner #. 4 is a time slot for storing 4 audio signals. Figure 2 shows the case where there are four people,
The time slot 48 is followed by a time slot with the same repetition.

【0014】図3は通信時に表示される表示装置34の
画面の一例を示す。図3において、50は表示装置34
の画面、52は画面50の中で相手#1から受信した画
像を表示するウィンドウ、54は画面50の中で相手#
2から受信した画像を表示するウィンドウ、56は画面
50の中で相手#3から受信した画像を表示するウィン
ドウ、58は画面50の中で相手#4から受信した画像
を表示するアイコンである。図3は相手が4人の場合で
あり、アイコンには相手を示す静止画や名称などが表示
される。
FIG. 3 shows an example of the screen of the display device 34 displayed during communication. In FIG. 3, 50 is a display device 34.
Screen, 52 is a window for displaying the image received from the other party # 1 on the screen 50, and 54 is the other party # on the screen 50
2 is a window for displaying an image received from # 2, 56 is a window for displaying an image received from partner # 3 on screen 50, and 58 is an icon for displaying an image received from partner # 4 on screen 50. FIG. 3 shows a case where there are four opponents, and a still image or a name indicating the opponent is displayed on the icon.

【0015】図4はRAM14のメモリ構成を示す。6
0は相手の人数を格納する変数N、62は音声を受信し
ていない相手のウィンドウの最大表示時間を格納する変
数Tm、64は現在の時刻を格納する変数T、66は相
手の番号を格納する変数I、68は相手Iの音声レベル
を格納する変数V、70は相手#1の音声を受信してウ
ィンドウを表示した時刻を格納する変数Ti(1)、7
2は相手#2の音声を受信してウィンドウを表示した時
刻を格納する変数Ti(2)、74は相手#3の音声を
受信してウィンドウを表示した時刻を格納する変数Ti
(3)、76は相手#Nの音声を受信してウィンドウを
表示した時刻を格納する変数Ti(N)である。
FIG. 4 shows the memory configuration of the RAM 14. 6
0 is a variable N that stores the number of the other party, 62 is a variable Tm that stores the maximum display time of the window of the other party who is not receiving voice, 64 is a variable T that stores the current time, 66 is the number of the other party Variable I, 68 is a variable V for storing the voice level of the other party I, 70 is a variable Ti (1), 7 for storing the time when the voice of the other party # 1 is received and the window is displayed.
2 is a variable Ti (2) for storing the time when the voice of the partner # 2 is received and the window is displayed, and 74 is a variable Ti for storing the time when the voice of the partner # 3 is received and the window is displayed.
(3) and 76 are variables Ti (N) for storing the time when the voice of the partner #N is received and the window is displayed.

【0016】図5は、ROM12に格納されているプロ
グラムのフローチャートを示す。通信開始時、変数Nに
相手の人数、変数Tmに音声を受信していない相手のウ
ィンドウの最大表示時間、変数Ti(I)に相手Iとの
通信開始の時刻が夫々設定されているものとする。
FIG. 5 shows a flow chart of the program stored in the ROM 12. At the start of communication, the variable N is set to the number of the other party, the variable Tm is set to the maximum display time of the window of the other party who is not receiving voice, and the variable Ti (I) is set to the time to start communication with the other party I. To do.

【0017】また、本プログラムは、図2に示す音声フ
レームを受信するたびに起動される。
The program is started each time the audio frame shown in FIG. 2 is received.

【0018】先ず、クロック40から現在の時刻をTに
読み込み(S1)、変数Iに1を設定する(S2)。変
数Iが変数N以下であればS4に進み、そうでなければ
終了する(S3)。
First, the current time is read from clock 40 into T (S1), and variable I is set to 1 (S2). If the variable I is less than or equal to the variable N, the process proceeds to S4, and if not, the process ends (S3).

【0019】S4では、レベル検出回路22で相手Iか
らの音声レベルを検出し、変数Vに格納する。変数Vが
ゼロであればS6に進み、そうでなければS8に進む
(S5)。S6では、変数Tと変数Tiとを比較して、
その差が変数Tmより大きいならば、S7に進み、そう
でなければS10に進む。
In S4, the level detection circuit 22 detects the voice level from the opponent I and stores it in the variable V. If the variable V is zero, the process proceeds to S6, and if not, the process proceeds to S8 (S5). In S6, the variable T and the variable Ti are compared,
If the difference is larger than the variable Tm, proceed to S7, otherwise proceed to S10.

【0020】S7では、相手Iの画像を表示装置34に
アイコンで表示するように表示制御回路32に指示す
る。S8では、相手Iの画像を表示装置34にウィンド
ウで表示するように表示制御回路32に指示する。
In step S7, the display control circuit 32 is instructed to display the image of the partner I on the display device 34 as an icon. In S8, the display control circuit 32 is instructed to display the image of the partner I on the display device 34 in a window.

【0021】変数Ti(I)に変数Tの内容をセットし
(S9)、変数Iに1を加算してS3に戻る(S1
0)。
The content of the variable T is set in the variable Ti (I) (S9), 1 is added to the variable I, and the process returns to S3 (S1).
0).

【0022】尚、S7で、現在、アイコンで表示されて
いる相手について、再度、アイコンで表示すべきことを
表示制御回路32に指示しても、継続してアイコンで表
示されるだけであって、何の変化も起こらない。同様
に、S8で、現在、ウィンドウに画像表示されている相
手について、再度、ウィンドウで画像表示すべきことを
表示制御回路32に指示しても、継続してウィンドウに
画像表示されるだけであって、何の変化も起こらない。
In step S7, even if the display control circuit 32 is instructed again to display the icon with respect to the other party who is currently displayed with the icon, only the icon is continuously displayed. , No change happens. Similarly, in S8, even if the display control circuit 32 is instructed again to display an image in the window for the other party who is currently displaying the image in the window, only the image is continuously displayed in the window. And no change happens.

【0023】上記実施例によれば、常時、通信相手の音
声レベルを監視しながら、所定時間、音声を発していな
い相手をウィンドウ表示からアイコン表示に切り替える
ので、ウィンドウの数がその分減少し、ユーザは、現在
受信している音声との関連で注目すべきウィンドウを、
容易に峻別することができる。また、表示されるウィン
ドウの数が減少するため、装置のウィンドウ表示の負担
が軽減される。
According to the above-described embodiment, while monitoring the voice level of the communication partner at all times, the partner who is not uttering a voice is switched from the window display to the icon display for a predetermined time, so that the number of windows is reduced accordingly. The user has a window of interest in relation to the audio currently being received,
It can be easily distinguished. Further, since the number of windows displayed is reduced, the load of window display of the device is reduced.

【0024】前述した実施例では、プログラムやデータ
を格納する記憶装置としてROM12及びRAM14を
使用しているが、フロッピーディスク、ハードディスク
又はメモリ・カードなどを利用してもよい。
In the above-mentioned embodiment, the ROM 12 and the RAM 14 are used as the storage device for storing the programs and data, but a floppy disk, a hard disk or a memory card may be used.

【0025】上記実施例では、画像符号化復号化方式と
してITU−T勧告H.261を採用しているが、MP
EG(Moving Picture Coding
Experts Group)などの他の画像符号化復
号化方式でもよい。
In the above embodiment, ITU-T Recommendation H.264 is used as the image encoding / decoding method. 261 is adopted, MP
EG (Moving Picture Coding)
Other image encoding / decoding methods such as Experts Group) may be used.

【0026】上記実施例では、画像として動画を使用し
ているが、静止画又は連続して静止画でもよい。
In the above embodiment, a moving image is used as the image, but it may be a still image or continuous still images.

【0027】上記実施例では、マルチメディア多重化方
式としてITU−T勧告H.221を使用しているが、
複数呼を画像、音声、データに割り当てる方式でもよ
い。
In the above embodiment, ITU-T Recommendation H.264 is used as the multimedia multiplexing method. 221 is used,
A method of assigning a plurality of calls to images, voices, and data may be used.

【0028】上記実施例では複数の相手の音声及び画像
を時分割多重化方式により多重化しているが、周波数多
重化、位相差多重化及びパケット多重化でもよい。
In the above embodiment, the voices and images of a plurality of partners are multiplexed by the time division multiplexing method, but frequency multiplexing, phase difference multiplexing and packet multiplexing may be used.

【0029】上記実施例では、ウィンドウを一部重ねて
表示しているが、画面分割のように重なりの無い表示方
式を採用することもできる。
In the above embodiment, the windows are displayed in a partially overlapped manner, but it is also possible to employ a display method in which there is no overlap such as screen division.

【0030】上記実施例では、アイコンには相手を示す
静止画や名称が表示されるが、アイコンに相手の動画を
表示してもよい。
In the above embodiment, the icon displays a still image or name indicating the partner, but the icon may display a moving image of the partner.

【0031】上記実施例では、相手の音声のレベルがゼ
ロ(0)の時に音声を受信していないと判断している
が、相手の音声レベルが所定値より小さいときに、音声
を受信していないと判断することにしてもよい。或い
は、全ての相手のうち、相対的に音声レベルの低い所定
人数を、音声を受信していない相手と判断することにし
てもよい。
In the above embodiment, it is judged that the voice is not received when the voice level of the other party is zero (0), but the voice is received when the voice level of the other party is smaller than the predetermined value. You may decide not to. Alternatively, among all the opponents, the predetermined number of people whose voice level is relatively low may be determined as the opponent who has not received the voice.

【0032】上記実施例では、変数Tmは通信開始時に
設定されるが、通信中にユーザが操作装置16を介して
変更できるようにしてもよい。また、変数Tmを相手ご
とに設定し、音声レベルの如何に係わらず、アイコンで
表示する優先度をつけることもできる。
In the above embodiment, the variable Tm is set at the start of communication, but the user may change it via the operating device 16 during communication. Further, it is possible to set the variable Tm for each partner and give priority to display with an icon regardless of the voice level.

【0033】図6は、本発明の第2の実施例の概略構成
ブロック図を示す。110は装置全体を制御するCP
U、112はCPU110で実行されるプログラムを格
納するROM、114はCPU110で使用されるデー
タを格納するRAM、116はキーボード及びタッチパ
ネルなどからなる操作装置、118はITU−T勧告
G.722に従って音声信号の符号化及び復号化を実行
する音声符号化復号化回路、120は音声入力のマイ
ク、122は音声符号化復号化回路118から受信した
音声を増幅する音声増幅回路、124L及び124R
は、夫々、音声増幅回路122から入力した複数の相手
の音声をひとつに混合する音声混合回路、126Lは、
音声混合回路124Lから入力した音声を出力する左ス
ピーカ、126Rは、音声混合回路124Rから入力し
た音声を出力する右スピーカである。
FIG. 6 shows a schematic block diagram of the second embodiment of the present invention. 110 is a CP that controls the entire apparatus
U, 112 are ROMs for storing programs executed by the CPU 110, 114 are RAMs for storing data used by the CPU 110, 116 is an operating device including a keyboard and a touch panel, 118 is ITU-T Recommendation G. 722, a voice encoding / decoding circuit that performs encoding and decoding of a voice signal, 120 is a voice input microphone, 122 is a voice amplifying circuit that amplifies the voice received from the voice encoding / decoding circuit 118, and 124L and 124R.
Is a voice mixing circuit that mixes the voices of a plurality of partners input from the voice amplification circuit 122 into one, and 126L is
The left speaker that outputs the sound input from the sound mixing circuit 124L and the right speaker 126R that outputs the sound input from the sound mixing circuit 124R.

【0034】128はITUーT勧告H.261に従っ
て画像信号の符号化及び復号化を実行する画像符号化復
号化回路、130は画像を入力するカメラ、132は複
数の相手の画像をマルチウィンドウ上に表示したり、ウ
ィンドウの表示状態を読み込んだりする表示制御回路、
134は画像を表示するLCD又はCRTなどからなる
表示装置である。
Reference numeral 128 denotes ITU-T Recommendation H.264. An image encoding / decoding circuit that performs encoding and decoding of an image signal in accordance with H.261, 130 is a camera for inputting images, 132 is a display of images of a plurality of partners on a multi-window, and a display state of windows is read. Display control circuit,
Reference numeral 134 denotes a display device including an LCD or a CRT that displays an image.

【0035】136はITU−T勧告H.221に従っ
て画像、音声及びデータなどを多重化し、分離する多重
分離回路、138は通信回線との接続及び通信を制御す
る回線制御回路である。
Reference numeral 136 denotes ITU-T Recommendation H.264. A demultiplexing circuit 138 that multiplexes and separates images, voices, and data according to 221 is a line control circuit that controls connection and communication with a communication line.

【0036】音声符号化復号化回路118から音声混合
回路124L及び124Rへ送られる音声フレームの形
式は、図2に示す第1の実施例のものと同じである。
The format of the audio frame sent from the audio encoding / decoding circuit 118 to the audio mixing circuits 124L and 124R is the same as that of the first embodiment shown in FIG.

【0037】図7は通信時に表示される表示装置134
の画面の一例を、その左右に配置されたスピーカ126
L及び126Rとともに示す。図7において、150は
表示装置134の画面、152は画面150の中で相手
#1から受信した画像を表示するウィンドウ、154は
画面150の中で相手#2から受信した画像を表示する
ウィンドウ、156は画面150の中で相手#3から受
信した画像を表示するウィンドウ、158は画面150
の中で相手#4から受信した画像を表示するウィンドウ
である。
FIG. 7 shows a display device 134 displayed during communication.
Of an example of the screen of the speaker 126
Shown with L and 126R. 7, 150 is a screen of the display device 134, 152 is a window for displaying an image received from the other party # 1 in the screen 150, 154 is a window for displaying an image received from the other party # 2 in the screen 150, 156 is a window for displaying an image received from the other party # 3 on the screen 150, and 158 is a screen 150
It is a window displaying an image received from the other party # 4.

【0038】D1は画面150の左端から相手#1のウ
ィンドウ152の中心までの距離、D2は相手#2のウ
ィンドウ154の中心までの距離、D3は相手#3のウ
ィンドウ156の中心までの距離、D4は相手#4のウ
ィンドウ158の中心までの距離、Wは画面150の左
端から右端までの距離、すなわち、画面150の幅であ
る。DLは左スピーカ126Lの中心から画面150の
左端までの距離、DRは右スピーカ126Rの中心から
画面150の右端までの距離である。
D1 is the distance from the left end of the screen 150 to the center of the window 152 of the opponent # 1, D2 is the distance to the center of the window 154 of the opponent # 2, D3 is the distance to the center of the window 156 of the opponent # 3, D4 is the distance from the center of the window 158 of the opponent # 4, W is the distance from the left end to the right end of the screen 150, that is, the width of the screen 150. DL is the distance from the center of the left speaker 126L to the left end of the screen 150, and DR is the distance from the center of the right speaker 126R to the right end of the screen 150.

【0039】尚、図7は、相手が4人の場合であり、各
ウィンドウ152乃至158は、操作装置116の操作
により、画面150内で移動可能である。
Note that FIG. 7 shows a case where there are four opponents, and each of the windows 152 to 158 can be moved within the screen 150 by operating the operating device 116.

【0040】図8は、RAM114のメモリ構成を示
す。160は相手の人数を格納する変数N、162は画
面150の幅Wを格納する変数w、164は左スピーカ
126Lの中心から画面150の左端までの距離DLを
格納する変数d(L)、166は右スピーカ126Rの
中心から画面150の右端までの距離DRを格納する変
数d(R)、168は音声増幅回路122が音声符号化
復号化回路118から入力された音声を増幅する増幅率
を格納する変数Aである。即ち、音声符号化復号化回路
118からの音声をA倍したものが、両音声混合回路1
24L及び124Rから出力される音声の総量に相当す
る。
FIG. 8 shows the memory configuration of the RAM 114. 160 is a variable N for storing the number of opponents, 162 is a variable w for storing the width W of the screen 150, 164 is a variable d (L) for storing the distance DL from the center of the left speaker 126L to the left end of the screen 150, 166. Is a variable d (R) that stores the distance DR from the center of the right speaker 126R to the right end of the screen 150, and 168 stores the amplification factor by which the audio amplification circuit 122 amplifies the audio input from the audio encoding / decoding circuit 118. Is a variable A to be executed. That is, the audio from the audio encoding / decoding circuit 118 multiplied by A is the audio mixing circuit 1
This corresponds to the total amount of sound output from 24L and 124R.

【0041】170は相手の番号を格納する変数I、1
72は画面150の左端から相手Iのウィンドウの中心
までの距離(D1、D2、D3又はD4)を格納する変
数di、174は音声増幅回路122から両音声混合回
路124L及び124Rに出力される音声総量に対す
る、音声混合回路124Lに出力される音声の比率を格
納する変数R(L)、176は音声増幅回路122にか
ら両音声混合回路124L及び124Rに出力される音
声の総量に対する、音声混合回路124Rに出力される
音声の比率を格納する変数R(R)である。
170 is a variable I for storing the other party's number, 1
Reference numeral 72 is a variable di that stores the distance (D1, D2, D3 or D4) from the left end of the screen 150 to the center of the window of the opponent I, and 174 is a voice output from the voice amplification circuit 122 to both voice mixing circuits 124L and 124R. A variable R (L) 176 for storing the ratio of the sound output to the sound mixing circuit 124L with respect to the total amount is a sound mixing circuit with respect to the total amount of sound output from the sound amplifying circuit 122 to both sound mixing circuits 124L and 124R. A variable R (R) that stores the ratio of the sound output to 124R.

【0042】図9は、ROM112に格納されたプログ
ラムのフローチャートを示す。通信開始時、変数Nに相
手の人数、変数wに画面150の幅、変数d(L)に左
スピーカ126Lの中心から画面150の左端までの距
離DL、変数d(R)に右スピーカ126Rの中心から
画面150の右端までの距離DR、変数Aに音声増幅回
路122の音声増幅率が、夫々設定されているものとす
る。
FIG. 9 shows a flow chart of the program stored in the ROM 112. At the start of communication, the variable N is the number of opponents, the variable w is the width of the screen 150, the variable d (L) is the distance DL from the center of the left speaker 126L to the left end of the screen 150, and the variable d (R) is the right speaker 126R. It is assumed that the distance DR from the center to the right end of the screen 150 and the audio amplification factor of the audio amplification circuit 122 are set to the variable A, respectively.

【0043】また、本プログラムは、図2に示す音声フ
レームを受信するたびに起動される。
Further, this program is activated each time the voice frame shown in FIG. 2 is received.

【0044】先ず、変数Iに1を設定する(S10
1)。変数Iが変数N以下であれば、S103に進み、
そうでなければ終了する(S102)。
First, the variable I is set to 1 (S10).
1). If the variable I is less than or equal to the variable N, the process proceeds to S103,
If not, the process ends (S102).

【0045】S103では、表示制御回路132から、
画面150の左端から相手Iのウィンドウの中心までの
距離(D1、D2、D3またはD4)を読み込み、変数
diに格納する。変数R(L)には、音声混合回路12
4Lに出力される音声の比率を格納する(S104)。
この比率は、左右のスピーカ126L及び126Rの中
心間距離に対する左スピーカ126Lの中心から相手I
のウィンドウの中心までの距離の割合、即ち、(d
(L)+di)/(d(L)+w+d(R))で算出す
ることができる。変数R(R)には、1−R(L)を格
納する(S105)。
In S103, the display control circuit 132
The distance (D1, D2, D3 or D4) from the left end of the screen 150 to the center of the window of the partner I is read and stored in the variable di. For the variable R (L), the voice mixing circuit 12
The ratio of the sound output to 4L is stored (S104).
This ratio is calculated from the center of the left speaker 126L with respect to the distance between the centers of the left and right speakers 126L and 126R.
The percentage of the distance to the center of the window, that is, (d
It can be calculated by (L) + di) / (d (L) + w + d (R)). 1-R (L) is stored in the variable R (R) (S105).

【0046】S104及びS105で格納された音声出
力比率に基づいて、音声増幅回路122に対し、音声混
合回路124Lへ出力すべき音声の増幅率をA×R
(L)とするように指示し(S106)、音声混合回路
124Rへ出力すべき音声の増幅率をA×R(R)とす
るように指示する(S107)。
Based on the audio output ratios stored in S104 and S105, the audio amplification circuit 122 sets the amplification factor of the audio to be output to the audio mixing circuit 124L to A × R.
(L) is instructed (S106), and the amplification factor of the sound to be output to the sound mixing circuit 124R is instructed to be A × R (R) (S107).

【0047】変数Iに1を加算し、S102に戻る(S
108)。
1 is added to the variable I, and the process returns to S102 (S
108).

【0048】各ウィンドウの位置は、ユーザが通信中に
操作装置116からの操作によって変更することがで
き、これにともなって、変数diの値は変化する。
The position of each window can be changed by the user operating the operation device 116 during communication, and the value of the variable di changes accordingly.

【0049】以上の説明から明らかなように、第2の実
施例によれば、スピーカからの音声の強弱によって、ユ
ーザは、その音声に対応する相手のウィンドウの位置の
見当をつけることができる。また、その音声及び映像
を、違和感無く視聴することができる。
As is clear from the above description, according to the second embodiment, the strength of the voice from the speaker enables the user to estimate the position of the window of the partner corresponding to the voice. In addition, the audio and video can be viewed without a feeling of strangeness.

【0050】上記第2の実施例では、前記第1の実施例
と同様に、ITU−T勧告H.261に代えてMPEG
などの他の画像符号化復号化方式でも採用でき、画像と
して動画に代えて静止画又は連続する静止画としてもよ
く、ITU−T勧告H.221に代えて、複数呼を画
像、音声、データに割り当てるマルチメディア多重化方
式を採用してもよく、複数の相手の音声及び画像の多重
化には、時分割多重化方式に代えて、周波数多重化、位
相差多重化及びパケット多重化の何れでも採用してもよ
く、画面分割のように、ウィンドウの重なりのない画面
表示に変えることもできる。
In the second embodiment, as in the first embodiment, the ITU-T Recommendation H.264 is used. MPEG instead of H.261
Other image encoding / decoding methods such as the above may also be adopted, and still images or continuous still images may be used as images instead of moving images. 221 may be replaced by a multimedia multiplexing method for allocating a plurality of calls to images, voices, and data. For multiplexing voices and images of a plurality of parties, instead of the time division multiplexing method, a frequency division method is used. Any of multiplex, phase difference multiplex, and packet multiplex may be adopted, and it is also possible to change to a screen display in which windows do not overlap, such as screen division.

【0051】第2の実施例では、左右2つのスピーカ1
26L、126Rのみを使用しているが、3つ以上のス
ピーカを使用することもできる。例えば、上下のスピー
カを設け、上下スピーカの音声出力比率を変えることに
よって、音声の方向とウィンドウの位置との、より正確
な対応をとることができる。
In the second embodiment, two left and right speakers 1 are used.
Although only 26L and 126R are used, three or more speakers can be used. For example, by providing upper and lower speakers and changing the sound output ratio of the upper and lower speakers, more accurate correspondence between the direction of sound and the position of the window can be achieved.

【0052】第2の実施例は、通信中は変数Aを変化さ
せないものとして説明しているが、操作装置116から
の操作により変化するようにしてもよい。
In the second embodiment, the variable A is not changed during communication, but it may be changed by an operation from the operation device 116.

【0053】[0053]

【発明の効果】以上の説明から理解できるように、本発
明によれば、ユーザは、常時、音声に対応する相手のウ
ィンドウを容易に識別して注視することができる。
As can be understood from the above description, according to the present invention, the user can always easily identify and gaze at the window of the other party corresponding to the voice.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の第1の実施例の概略構成ブロック図
である。
FIG. 1 is a schematic block diagram of a first embodiment of the present invention.

【図2】 第1の実施例の通信時の音声フレームのフレ
ーム構造図である。
FIG. 2 is a frame structure diagram of a voice frame during communication according to the first embodiment.

【図3】 第1の実施例の通信時の表示画面の一例であ
る。
FIG. 3 is an example of a display screen during communication according to the first embodiment.

【図4】 第1の実施例のRAM14のメモリ構成であ
る。
FIG. 4 is a memory configuration of a RAM 14 of the first embodiment.

【図5】 第1の実施例のROM12に記憶されるプロ
グラムのフローチャートである。
FIG. 5 is a flowchart of a program stored in the ROM 12 of the first embodiment.

【図6】 本発明の第2の実施例の概略構成ブロック図
である。
FIG. 6 is a schematic block diagram of a second embodiment of the present invention.

【図7】 第2の実施例の通信時の表示画面の一例であ
る。
FIG. 7 is an example of a display screen during communication according to the second embodiment.

【図8】 第2の実施例のRAM114のメモリ構成で
ある。
FIG. 8 is a memory configuration of a RAM 114 according to a second embodiment.

【図9】 第2の実施例のROM112に記憶されるプ
ログラムのフローチャートである。
FIG. 9 is a flowchart of a program stored in the ROM 112 according to the second embodiment.

【符号の説明】[Explanation of symbols]

10:CPU 12:ROM 14:RAM 16:操
作回路 18:音声符号化復号化回路 20:マイク
22:レベル検出回路 24:音声混合回路 26:ス
ピーカ 28:画像符号化復号化回路 30:カメラ
32:表示制御回路 34:表示装置 36:多重分離
回路 38:回線制御回路 40:クロック 42,4
4,46,48:タイムスロット 50:表示画面 5
2,54,56:ウィンドウ 58:アイコン 60:
相手の人数を格納する変数N 62:音声を受信してい
ない相手のウィンドウの最大表示時間を格納する変数T
m 64:現在の時刻を格納する変数T 66:相手の番号
を格納する変数I 68:相手Iの音声レベルを格納す
る変数V 70:相手#1の音声を受信してウィンドウ
を表示した時刻を格納する変数Ti(1) 72:相手
#2の音声を受信してウィンドウを表示した時刻を格納
する変数Ti(2) 74:相手#3の音声を受信して
ウィンドウを表示した時刻を格納する変数Ti(3)
76:相手#Nの音声を受信してウィンドウを表示した
時刻を格納する変数Ti(N) 110:CPU 11
2:ROM 114:RAM 116:操作回路 11
8:音声符号化復号化回路 120:マイク 122:
音声増幅回路 124L,124R:音声混合回路 1
26L,126R:左右スピーカ 128:画像符号化
復号化回路 130:カメラ 132:表示制御回路
134:表示装置 136:多重分離回路 138:回
線制御回路 150:表示画面 152,154,15
6、158:ウィンドウ D1,D2,D3,D4:画
面150の左端から各ウィンドウの中心までの距離
W:画面150の幅 DL:左スピーカ126Lの中心
から画面150の左端までの距離 DR:右スピーカ1
26の中心から画面150の右端までの距離 160:
相手の人数を格納する変数N 162:画面150の幅
Wを格納する変数w 164:左スピーカ126Lの中
心から画面150の左端までの距離DLを格納する変数
d(L) 166:右スピーカ126Rの中心から画面
150の右端までの距離DLを格納する変数d(R) 168:音声増幅率を格納する変数A 170:相手の
番号を格納する変数I 172:画面150の左端から相手Iのウィンドウの中
心までの距離を格納する変数di 174:音声混合回
路124Lに出力される音声の比率を格納する変数R
(L) 176:音声混合回路124Rに出力される音
声の比率を格納する変数R(R)
10: CPU 12: ROM 14: RAM 16: Operation circuit 18: Voice encoding / decoding circuit 20: Microphone
22: Level detection circuit 24: Audio mixing circuit 26: Speaker 28: Image encoding / decoding circuit 30: Camera
32: display control circuit 34: display device 36: demultiplexing circuit 38: line control circuit 40: clock 42, 4
4,46,48: Time slot 50: Display screen 5
2, 54, 56: Window 58: Icon 60:
Variable N 62 for storing the number of opponents: Variable T for storing the maximum display time of the window of the opponent who is not receiving voice
m 64: Variable T that stores the current time T 66: Variable I that stores the number of the other party 68: Variable V that stores the voice level of the other party I 70: The time when the window of the other party # 1 is received and the window is displayed Variable Ti (1) 72 to store: The time when the voice of the partner # 2 is received and the window is displayed is stored. Variable Ti (2) 74: The voice of the partner # 3 is received and the time to display the window is stored. Variable Ti (3)
76: Variable Ti (N) 110 for storing the time when the window of the other party #N is received and the window is displayed 110: CPU 11
2: ROM 114: RAM 116: Operation circuit 11
8: Speech coding / decoding circuit 120: Microphone 122:
Audio amplification circuit 124L, 124R: audio mixing circuit 1
26L, 126R: left and right speakers 128: image encoding / decoding circuit 130: camera 132: display control circuit
134: Display device 136: Demultiplexing circuit 138: Line control circuit 150: Display screen 152, 154, 15
6, 158: Windows D1, D2, D3, D4: Distance from the left end of the screen 150 to the center of each window
W: width of screen 150 DL: distance from center of left speaker 126L to left end of screen 150 DR: right speaker 1
Distance from the center of 26 to the right edge of screen 150 160:
Variable N 162 for storing the number of opponents: Variable w 164 for storing the width W of the screen 150: Variable d (L) 166 for storing the distance DL from the center of the left speaker 126L to the left end of the screen 150L: For the right speaker 126R Variable d (R) 168 that stores the distance DL from the center to the right end of the screen 150: Variable A that stores the voice amplification factor 170: Variable I that stores the number of the other party 172: From the left end of the screen 150 to the window of the other party I Variable di 174 for storing distance to center: Variable R for storing ratio of voices output to voice mixing circuit 124L
(L) 176: Variable R (R) that stores the ratio of the sound output to the sound mixing circuit 124R

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 通信回線を介して複数の相手とマルチメ
ディア通信を行い、当該相手から受信した複数の画像を
マルチウィンドウで表示するマルチメディア装置であっ
て、当該相手から受信した音声レベルを検出する音声レ
ベル検出手段と、当該音声レベル検出手段の検出結果に
基づいて、所定時間、所定の音声を受信していない相手
の画像を表示するウインドウをアイコン表示とする手段
とを有することを特徴とするマルチメディア装置。
1. A multimedia device which performs multimedia communication with a plurality of partners via a communication line and displays a plurality of images received from the partner in a multi-window, and detects a sound level received from the partner. And a means for displaying, as an icon, a window for displaying an image of a partner who has not received a predetermined voice for a predetermined time, based on the detection result of the voice level detecting means. Multimedia device to do.
【請求項2】 前記所定レベル以上の音声を受信した相
手の画像をウィンドウで表示する手段を有する請求項1
に記載のマルチメディア装置。
2. A means for displaying, in a window, an image of the other party who has received the voice of the predetermined level or higher.
Multimedia device.
【請求項3】 通信回線を介して複数の相手とマルチメ
ディア通信を行い、受信画像をマルチウィンドウで表示
するマルチメディア装置であって、各ウィンドウの位置
関係を読み込む手段と、当該複数の相手からの受信音声
を、対応するウィンドウの位置関係に応じた音量で出力
させる出力手段とを有することを特徴とするマルチメデ
ィア装置。
3. A multimedia device for performing multimedia communication with a plurality of parties via a communication line and displaying received images in a multi-window, comprising means for reading a positional relationship of each window, and means for reading the positional relationship between the windows. And an output unit for outputting the received voice of the above at a volume according to the positional relationship of the corresponding windows.
【請求項4】 前記出力手段が、複数のスピーカから前
記ウインドウの位置関係に応じた比率の音量で出力させ
る手段である請求項3に記載のマルチメディア装置。
4. The multimedia device according to claim 3, wherein the output unit is a unit that outputs from a plurality of speakers at a volume of a ratio according to a positional relationship of the windows.
JP5189591A 1993-07-30 1993-07-30 Multmedia equipment Pending JPH0746561A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5189591A JPH0746561A (en) 1993-07-30 1993-07-30 Multmedia equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5189591A JPH0746561A (en) 1993-07-30 1993-07-30 Multmedia equipment

Publications (1)

Publication Number Publication Date
JPH0746561A true JPH0746561A (en) 1995-02-14

Family

ID=16243885

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5189591A Pending JPH0746561A (en) 1993-07-30 1993-07-30 Multmedia equipment

Country Status (1)

Country Link
JP (1) JPH0746561A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007293897A (en) * 2001-12-28 2007-11-08 Simdesk Technologies Inc Instant messaging system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007293897A (en) * 2001-12-28 2007-11-08 Simdesk Technologies Inc Instant messaging system

Similar Documents

Publication Publication Date Title
KR970014257A (en) Television receiver
JPH01276977A (en) Television receiver
JPH05103324A (en) Multi-point video conference controlling device
US7652722B2 (en) Apparatus and method for displaying multiple channels and changing channels in a portable terminal having a television video signal receiving function
JP2003299051A (en) Information output unit and information outputting method
KR19980046159A (en) How to adjust the volume according to the volume level
JPH05344435A (en) Mute circuit
JPH0746561A (en) Multmedia equipment
JPH0556369A (en) Television receiver
JPH06311448A (en) Television receiver
JPH0974531A (en) Audio and video device
JPH0358681A (en) Television receiver provided with connecting state display function with external connection device
JP2737559B2 (en) Dual screen television receiver
JPH0746560A (en) Video conference system
JPH0738868A (en) Terminal equipment for video conference
JPH09168139A (en) Sound volume controller
JPH07123383A (en) Terminal for video conference
JPH0738864A (en) Terminal equipment for video conference
JP3561075B2 (en) Music playback device
JP2000050224A (en) Video conference device
JPH07162779A (en) Multiscreen display television receiver
JP3036983B2 (en) Control key control device and television receiver provided with the same
JP2606242B2 (en) Image and audio output device
JPH08275080A (en) Wide television receiver
JP3232886B2 (en) Television receiver with aspect switching function

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20011016