JP2774204B2 - Video phone - Google Patents

Video phone

Info

Publication number
JP2774204B2
JP2774204B2 JP3221664A JP22166491A JP2774204B2 JP 2774204 B2 JP2774204 B2 JP 2774204B2 JP 3221664 A JP3221664 A JP 3221664A JP 22166491 A JP22166491 A JP 22166491A JP 2774204 B2 JP2774204 B2 JP 2774204B2
Authority
JP
Japan
Prior art keywords
speaker
telephone
amplification factor
contour
party
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3221664A
Other languages
Japanese (ja)
Other versions
JPH0564181A (en
Inventor
彰友 桐山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP3221664A priority Critical patent/JP2774204B2/en
Publication of JPH0564181A publication Critical patent/JPH0564181A/en
Application granted granted Critical
Publication of JP2774204B2 publication Critical patent/JP2774204B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は撮像装置と電話機とが一
体となったシステムに係り、より詳細には、本電話機か
ら本電話機の話者までの距離に応じて相手側電話機から
送られてくる音声信号の増幅率を変化させるようにした
テレビ電話機に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system in which an image pickup apparatus and a telephone are integrated, and more particularly, to a system transmitted from a partner telephone according to a distance from the telephone to a speaker of the telephone. The present invention relates to a video phone that changes the amplification factor of an incoming audio signal.

【0002】[0002]

【従来の技術】従来より、電話機には一般に音量調整用
のスイッチが設けられており、スピーカの音量を使用者
自身の操作によって任意に設定できるようになってい
る。
2. Description of the Related Art Conventionally, telephones are generally provided with a switch for adjusting the volume, so that the volume of a speaker can be arbitrarily set by a user himself / herself.

【0003】このような機能は、近時市場に提供され、
普及しつつあるテレビ電話機においても同様である。
[0003] Such a function has recently been offered to the market,
The same applies to videophones that are becoming popular.

【0004】テレビ電話機は、通話中、電話機と一体と
なった例えばCCDカメラによって話者の姿を撮影し、
その画像データを音声信号とともに相手側のテレビ電話
機に送出し、相手側のテレビ電話機の表示画面に通話中
の相手側話者の姿を映し出すようになっている。また、
テレビ電話機の話者は、通常受話器を取ることなく、ハ
ンズフリーの状態でマイクに向かって話し、内蔵のスピ
ーカから送出される相手側話者の音声を聴取するように
なっている。
[0004] During a telephone call, a video telephone captures the image of a speaker using, for example, a CCD camera integrated with the telephone.
The image data is transmitted together with the audio signal to the videophone of the other party, and the display screen of the videophone of the other party is displayed on the display screen of the other party talking on the phone. Also,
A speaker of a videophone usually speaks into a microphone in a hands-free state without picking up the receiver, and listens to the voice of the other speaker transmitted from a built-in speaker.

【0005】[0005]

【発明が解決しようとする課題】このように、テレビ電
話機はハンズフリーとなっていることから、通話に際し
ては、テレビ電話機の近くに居なくても、CCDカメラ
によって撮影が可能であり、かつ本テレビ電話機の話者
の声がマイクに届く距離及びスピーカから送出される相
手側話者の音声が聞き取れる距離であれば、自由に行動
して通話を行うことができる。
As described above, since the videophone is hands-free, it is possible to take a picture with a CCD camera even if the user is not near the videophone, and If the distance of the voice of the speaker of the videophone reaches the microphone and the distance of the voice of the other party's speaker transmitted from the speaker can be heard, the user can freely talk and talk.

【0006】しかしながら、上記したように電話機に設
けられている音量調整用のスイッチは使用者自身が操作
する必要があることから、通常は任意の音量に調整する
と、その後はほとんど操作しないのが現状である。
However, since the volume control switch provided on the telephone as described above must be operated by the user himself, usually, when the volume is adjusted to an arbitrary level, the user rarely operates thereafter. It is.

【0007】そのため、テレビ電話機の使用者が音量調
整用のスイッチを通常レベルに設定している場合には、
通話中電話機から離れると、スピーカから送出される相
手側話者の音声も小さくなって、聞き取りにくくなると
いった問題があった。
Therefore, if the user of the videophone sets the volume adjustment switch to the normal level,
When the user is away from the telephone during a call, there is a problem that the voice of the other party's speaker transmitted from the speaker becomes low, making it difficult to hear.

【0008】本発明はかかる実情に鑑みてなされたもの
で、その目的は、本テレビ電話機から本テレビ電話機の
話者までの距離に応じて、相手側電話機から送られてく
る音声信号の増幅率を変化させることにより、話者が本
テレビ電話機から離れているときには、スピーカの音量
を大きくして相手側話者の音声を聞き取り易くしたテレ
ビ電話機を提供することにある。
The present invention has been made in view of the above circumstances, and has as its object to increase the amplification factor of an audio signal transmitted from the other party's telephone according to the distance from the present television telephone to the speaker of the present television telephone. Is to provide a video telephone in which the volume of the speaker is increased to make it easier to hear the voice of the other party when the speaker is away from the video telephone.

【0009】[0009]

【課題を解決するための手段】上記課題を解決するた
め、本発明のテレビ電話機は、撮像装置と電話機とが一
体となったシステムであって、この撮像装置により撮影
された本電話機の話者の画像データに基づいてその話者
の輪郭を抽出する輪郭抽出部と、この輪郭抽出部によっ
て抽出された話者の輪郭データからその話者の顔の大き
さを判定する判定部と、この判定部の判定結果による話
者の顔の大きさが小さくなるほど増幅率が大きくなるよ
うに、相手側電話機から送られてくる音声信号の増幅率
を決定する増幅率決定部と、この増幅率決定部によって
決定された増幅率でもって相手側電話機から送られてく
る音声信号の増幅を行い、スピーカに出力する音声増幅
部とを備えた構成とする。
In order to solve the above problems, a video telephone according to the present invention is a system in which an imaging device and a telephone are integrated, and a speaker of the telephone photographed by the imaging device. A contour extracting unit for extracting a contour of the speaker based on the image data of the speaker, a determining unit for determining the size of the face of the speaker from the contour data of the speaker extracted by the contour extracting unit, Talk based on the judgment result of the part
The smaller the size of the person's face, the higher the amplification
Thus, an amplification factor determining unit that determines the amplification factor of the audio signal sent from the other party's telephone, and the amplification of the audio signal sent from the other party's phone with the amplification factor determined by the amplification factor determining unit. And an audio amplification unit for outputting to a speaker.

【0010】[0010]

【作用】通話時、電話機の側に設置された撮像装置によ
って本テレビ電話機の話者の姿を撮影し、その撮影した
画像データを輪郭抽出部に出力する。輪郭抽出部では、
与えられた画像データを分析(例えば高速フーリエ変換
等を用いてスペクトルの変化点を捜す等)して、話者の
輪郭を抽出し、その輪郭データを判定部に出力する。
During a call, the image of the speaker of the present videophone is photographed by an imaging device installed on the telephone side, and the photographed image data is output to the contour extraction unit. In the contour extraction unit,
The given image data is analyzed (for example, a change point of the spectrum is searched using a fast Fourier transform or the like) to extract the contour of the speaker, and the contour data is output to the determination unit.

【0011】判定部では、与えられた輪郭データからそ
の話者の顔を認識するとともに、顔の大きさを判定し、
その判定結果を増幅率決定部に出力する。増幅率決定部
では、予め格納しているテーブルを参照して、与えられ
た判定結果に対応する増幅率を決定し、これを音声増幅
部に出力する。すなわち、テーブルには、話者の顔の大
きさが小さくなるほど増幅率が大きくなるように対応付
けられたデータが格納されており、話者が電話機から離
れる程、増幅率も大きくなるようになっている。
The determination section recognizes the speaker's face from the given contour data and determines the size of the face.
The result of the determination is output to the amplification factor determining unit. The amplification factor determination unit refers to a table stored in advance, determines an amplification factor corresponding to the given determination result, and outputs this to the audio amplification unit. That is, the table shows the size of the speaker's face
Corresponds to increase the amplification factor as the size becomes smaller
Data is stored, and the speaker moves away from the telephone.
The higher the gain, the higher the amplification factor.

【0012】音声増幅部では、増幅率決定部によって決
定された増幅率でもって、電話回線を通じて送られてく
る相手側話者の音声信号の増幅を行い、増幅後の音声信
号をスピーカに出力し、音声として出力する。
The audio amplification unit amplifies the audio signal of the other speaker transmitted through the telephone line with the amplification factor determined by the amplification factor determination unit, and outputs the amplified audio signal to the speaker. Output as audio.

【0013】これにより、本テレビ電話機の話者が本電
話機から離れている場合には、スピーカの音量が大きく
なって相手側話者の音声が聞き取り易くなる。
Thus, when the speaker of the present video telephone is away from the present telephone, the volume of the speaker is increased and the voice of the other speaker becomes easier to hear.

【0014】[0014]

【実施例】以下、本発明の一実施例を図面を参照して説
明する。
An embodiment of the present invention will be described below with reference to the drawings.

【0015】図1は、本発明のテレビ電話機の電気的構
成を示すブロック図である。
FIG. 1 is a block diagram showing the electrical configuration of the videophone of the present invention.

【0016】同図において、電話機の側に設置された話
者の姿を撮影するCCDカメラ11の出力は、アナログ
信号をデジタル信号に変換するA/D変換器12に導か
れており、A/D変換器12の出力は、輪郭抽出部13
に導かれている。
In FIG. 1, the output of a CCD camera 11 for photographing a figure of a speaker installed on the side of a telephone is guided to an A / D converter 12 for converting an analog signal into a digital signal. The output of the D converter 12 is
Is led to.

【0017】輪郭抽出部13は、A/D変換器12から
与えられたデジタル化された画像データから話者の輪郭
を抽出するブロックで、通常は高速フーリエ変換(FF
T)等を用いてスペクトルの変化点を捜すことにより輪
郭の抽出を行っている。
The contour extraction unit 13 is a block for extracting a speaker's contour from digitized image data supplied from the A / D converter 12, and is usually a fast Fourier transform (FF).
The contour is extracted by searching for a change point of the spectrum using T) or the like.

【0018】このような輪郭抽出部13の出力は、判定
部14に導かれており、判定部14の出力は、増幅率決
定部15に導かれている。
The output of the contour extracting unit 13 is guided to a determining unit 14, and the output of the determining unit 14 is guided to an amplification factor determining unit 15.

【0019】判定部14は、輪郭抽出部13から与えら
れた輪郭データに基づいて話者の顔を認識するととも
に、その大きさを判定するブロックである。
The determination section 14 is a block for recognizing a speaker's face based on the contour data supplied from the contour extraction section 13 and determining the size of the face.

【0020】増幅率決定部15は、話者の顔の大きさと
PAD値(デジタル的な増幅値)との対応関係を示すテ
ーブルを内部に保有しており、判定部14で判定された
データに基づいて最適なPAD値を決定するようになっ
ている。ここで、テーブルに示された話者の顔の大きさ
を示すデータとPAD値との関係は、話者の顔が小さい
程、増幅率を示すPAD値は大きくなるように設定され
ている。つまり、話者が電話機から離れている程、増幅
率も大きくなるようになっている。
The amplification factor determination unit 15 internally stores a table indicating the correspondence between the size of the speaker's face and the PAD value (digital amplification value). The optimum PAD value is determined based on the PAD value. Here, the relationship between the data indicating the size of the speaker's face and the PAD value shown in the table is set such that the smaller the speaker's face, the larger the PAD value indicating the amplification factor. That is, the further the speaker is away from the telephone, the greater the amplification factor.

【0021】このような増幅率決定部15の出力は、デ
ジタル信号をアナログ信号に変換するD/A変換器16
に導かれており、D/A変換器16の出力は、乗算器1
7の一方の入力に導かれている。
The output of the amplification factor determining unit 15 is a D / A converter 16 for converting a digital signal into an analog signal.
Is output from the D / A converter 16 to the multiplier 1
7 to one input.

【0022】一方、乗算器17の他方の入力には、2線
−4線変換や送受話レベルの調整等を行う通話回路19
の出力が導かれており、乗算器17の出力は、電話機に
内蔵されたスピーカ18に導かれている。
On the other hand, the other input of the multiplier 17 is provided with a speech circuit 19 for performing 2-wire to 4-wire conversion and adjusting the transmission / reception talk level.
, And the output of the multiplier 17 is guided to a speaker 18 built in the telephone.

【0023】また、通話回路19は、図示しないフック
スイッチを介して電話回線に接続された構成となってい
る。
The communication circuit 19 is connected to a telephone line via a hook switch (not shown).

【0024】次に、上記構成のテレビ電話機の動作を説
明する。
Next, the operation of the videophone having the above configuration will be described.

【0025】相手側からの着信を検出して通話に移行す
る動作、及び本電話機から発呼して通話に移行する動作
は通常の電話機と同様であるので、ここでは通話状態と
なるまでの動作説明は省略し、通話状態となったところ
から説明を行う。
The operation of detecting an incoming call from the other party and shifting to a telephone call and the operation of calling from this telephone and shifting to a telephone call are the same as those of a normal telephone. The description will be omitted, and the description will be given from the point where the communication state is established.

【0026】通話状態になると、CCDカメラ11は、
本電話機の話者の姿を撮影して電気信号に変換し、A/
D変換器12に与える。A/D変換器12では、与えら
れたアナログ信号をデジタル信号に変換して輪郭抽出部
13に与える。
When a call is made, the CCD camera 11
The image of the speaker of this telephone is photographed and converted into an electric signal.
It is given to the D converter 12. The A / D converter 12 converts the applied analog signal into a digital signal and supplies the digital signal to the contour extraction unit 13.

【0027】輪郭抽出部13は、上記したように例えば
高速フーリエ変換を用いてスペクトルの変化点を捜すこ
とにより、デジタル化された画像データから話者の輪郭
を抽出し、その輪郭データを判定部14に与える。
The contour extraction unit 13 extracts the speaker's contour from the digitized image data by searching for a change point in the spectrum using, for example, the fast Fourier transform, as described above, and determines the contour data. Give to 14.

【0028】判定部14は、輪郭抽出部13から与えら
れた輪郭データに基づいて話者の顔を認識するととも
に、その大きさを判定し、その判定結果を増幅率決定部
15に与える。
The judging section 14 recognizes the speaker's face based on the contour data provided from the contour extracting section 13, judges its size, and supplies the judgment result to the amplification factor determining section 15.

【0029】増幅率決定部15では、内部テーブルを参
照して、判定部14から与えられた判定結果に対応する
PAD値を決定し、そのPAD値を次のD/A変換器に
よってアナログ値に変換した後、乗算器17に与える。
The amplification factor determining unit 15 determines a PAD value corresponding to the determination result given from the determining unit 14 with reference to the internal table, and converts the PAD value to an analog value by the next D / A converter. After the conversion, it is given to the multiplier 17.

【0030】乗算器17には、電話回線を通じて送られ
てきた相手側話者の音声信号が、通話回路19を介して
導かれていることから、乗算器17では、この音声信号
にD/A変換器16から与えられた増幅率を示すアナロ
グ値を乗算することによって音声信号を増幅し、これを
スピーカ18から音声として送出する。
Since the voice signal of the other party sent through the telephone line is guided to the multiplier 17 through the communication circuit 19, the multiplier 17 converts the voice signal into a D / A signal. The audio signal is amplified by multiplying by an analog value indicating the amplification factor given from the converter 16, and the amplified audio signal is transmitted from the speaker 18 as audio.

【0031】これにより、話者が電話機から離れている
場合には、スピーカ18から出力される音声も大きくな
って聞き取り易くなり、話者が電話機に近づく程、スピ
ーカ18から出力される音声は通常時の音量まで徐々に
低下することになる。従って、本テレビ電話機の話者に
とっては、電話機からの距離に関係なく、相手側話者の
音声を良好な状態で聞き取ることができるものである。
Accordingly, when the speaker is away from the telephone, the sound output from the speaker 18 becomes large and easy to hear, and as the speaker approaches the telephone, the sound output from the speaker 18 is normally increased. It will gradually decrease to the volume of the hour. Therefore, the speaker of the present videophone can hear the voice of the other party in a good condition regardless of the distance from the telephone.

【0032】[0032]

【発明の効果】本発明のテレビ電話機は、撮像装置によ
り撮影された本電話機の話者の画像データに基づいてそ
の話者の輪郭を抽出する輪郭抽出部と、この輪郭抽出部
によって抽出された話者の輪郭データからその話者の顔
の大きさを判定する判定部と、この判定部の判定結果
よる話者の顔の大きさが小さくなるほど増幅率が大きく
なるように、相手側電話機から送られてくる音声信号の
増幅率を決定する増幅率決定部と、この増幅率決定部に
よって決定された増幅率でもって相手側電話機から送ら
れてくる音声信号の増幅を行い、スピーカに出力する音
声増幅部とを備えた構成としたので、本テレビ電話機の
話者にとっては、テレビ電話機の近くに居るときも、離
れているときも、スピーカからそれぞれの位置に応じた
音量で相手側話者の音声を出力することになり、室内を
動き回りながら電話をしていても、良好な状態で相手側
話者の音声を聴取することができるといった効果を奏す
る。
According to the videophone of the present invention, a contour extracting section for extracting a contour of a speaker of the present telephone based on image data of the speaker of the telephone photographed by the imaging device, and the contour extracting section extracts the contour. A determining unit that determines the size of the speaker's face from the contour data of the speaker; and a determination result of the determining unit.
The smaller the size of the speaker's face, the higher the amplification rate
An amplification factor determining unit that determines the amplification factor of the audio signal sent from the other party's telephone, and an audio signal sent from the other party's telephone with the amplification factor determined by the amplification factor determining unit. The video phone has a configuration that includes an audio amplifier that amplifies and outputs the signal to the speaker, so that the speaker of this video phone can be at each position from the speaker regardless of whether the speaker is near or away from the video phone. The sound of the other party's speaker is output at a corresponding volume, and the effect of being able to listen to the sound of the other party's speaker in a good condition even when making a phone call while moving around the room.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明のテレビ電話機の電気的構成を示すブロ
ック図である。
FIG. 1 is a block diagram showing an electrical configuration of a videophone of the present invention.

【符号の説明】[Explanation of symbols]

11 CCDカメラ(撮像装置) 12 A/D変換器 13 輪郭抽出部 14 判定部 15 増幅率設定部 16 D/A変換器 17 乗算器 18 スピーカ Reference Signs List 11 CCD camera (imaging device) 12 A / D converter 13 Contour extraction unit 14 Judgment unit 15 Amplification rate setting unit 16 D / A converter 17 Multiplier 18 Speaker

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 撮像装置と電話機とが一体となったシス
テムであって、この撮像装置により撮影された本電話機
の話者の画像データに基づいてその話者の輪郭を抽出す
る輪郭抽出部と、 この輪郭抽出部によって抽出された話者の輪郭データか
らその話者の顔の大きさを判定する判定部と、 この判定部の判定結果による話者の顔の大きさが小さく
なるほど増幅率が大きくなるように、相手側電話機から
送られてくる音声信号の増幅率を決定する増幅率決定部
と、 この増幅率決定部によって決定された増幅率でもって相
手側電話機から送られてくる音声信号の増幅を行い、ス
ピーカに出力する音声増幅部とを備えたことを特徴とす
るテレビ電話機。
1. A system in which an imaging device and a telephone are integrated, wherein a contour extraction unit extracts a contour of the speaker based on image data of a speaker of the telephone photographed by the imaging device. , a determination unit the size of the face of the speaker from the contour data of the speaker extracted by the contour extraction unit, small size of the speaker's face by the determination result of the determination section
An amplification factor determining unit that determines the amplification factor of the audio signal sent from the other party's telephone so that the amplification factor becomes larger, and transmitted from the other party's telephone with the amplification factor determined by the amplification factor determining unit. A video phone, comprising: an audio amplifier that amplifies an incoming audio signal and outputs the amplified audio signal to a speaker.
JP3221664A 1991-09-02 1991-09-02 Video phone Expired - Fee Related JP2774204B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3221664A JP2774204B2 (en) 1991-09-02 1991-09-02 Video phone

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3221664A JP2774204B2 (en) 1991-09-02 1991-09-02 Video phone

Publications (2)

Publication Number Publication Date
JPH0564181A JPH0564181A (en) 1993-03-12
JP2774204B2 true JP2774204B2 (en) 1998-07-09

Family

ID=16770330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3221664A Expired - Fee Related JP2774204B2 (en) 1991-09-02 1991-09-02 Video phone

Country Status (1)

Country Link
JP (1) JP2774204B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3475809B2 (en) 1998-10-14 2003-12-10 株式会社デンソー Portable videophone
JP5609431B2 (en) * 2010-08-25 2014-10-22 富士通株式会社 Volume control device, volume control method and program
CN103716437A (en) * 2012-09-28 2014-04-09 华为终端有限公司 Sound quality and volume control method and apparatus

Also Published As

Publication number Publication date
JPH0564181A (en) 1993-03-12

Similar Documents

Publication Publication Date Title
US20050288063A1 (en) Method for initiating voice recognition mode on mobile terminal
KR100760728B1 (en) Telephone apparatus
EP1089526A2 (en) Telephone with sound customizable to audiological profile of user
JP2774204B2 (en) Video phone
JP3719580B2 (en) Mobile phone device with camera
US20070082717A1 (en) Dual prompting device and method for mobile phone
JPH02113656A (en) Visual telephone
JP3291920B2 (en) Call system
EP1139661A3 (en) A remote video telephone system
JP2000152203A (en) Video compliant computer/telephone device
JPH11194798A (en) Speech recognition telephone set
KR20030033353A (en) Door phone
JP2006140596A (en) Communication terminal
CN201114282Y (en) Network telephone possessing wide-angle camera shooting and standing function
KR100606092B1 (en) Method for preventing howling in wireless terminal
JPH11234541A (en) Income system for tv camera
JPH0670312A (en) Portable radio telephone system and stationary telephone system
USRE39612E1 (en) Communicating apparatus
JP3660121B2 (en) Intercom device
JPH02181200A (en) Voice recognition device
KR100295365B1 (en) image processor with object chase and method for the same
JPH11187112A (en) Equipment and method for communication
KR200203369Y1 (en) Telephone
JP4107012B2 (en) Intercom system
JP2002185625A (en) Intercom device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees