JP2004350298A - Communication terminal equipment - Google Patents

Communication terminal equipment Download PDF

Info

Publication number
JP2004350298A
JP2004350298A JP2004160279A JP2004160279A JP2004350298A JP 2004350298 A JP2004350298 A JP 2004350298A JP 2004160279 A JP2004160279 A JP 2004160279A JP 2004160279 A JP2004160279 A JP 2004160279A JP 2004350298 A JP2004350298 A JP 2004350298A
Authority
JP
Japan
Prior art keywords
speaker
unit
information
signal
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004160279A
Other languages
Japanese (ja)
Inventor
Kaoru Suzuki
薫 鈴木
Katsumi Takahashi
克己 高橋
Shogo Yamaguchi
尚吾 山口
Toshiaki Watanabe
敏明 渡邊
Takashi Ida
孝 井田
Naoaki Kuratate
尚明 倉立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004160279A priority Critical patent/JP2004350298A/en
Publication of JP2004350298A publication Critical patent/JP2004350298A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide communication terminal equipment capable of realizing immediate interactivity in translation and interpretation and making a speech without disturbing the rhythm of conversation. <P>SOLUTION: The communication terminal equipment includes: a signal input section 901; a symbol processing section 902; a signal processing section 903; a signal output section 904; a code conversion section 906; and a communication section 907, the code conversion section 906 translates a language code into a prescribed language and shows the result to a talker of its own station, sequentially executes translation of the language codes in an appropriate unit such as a word and immediately delivers the result of translation even in a way of a prattle. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、TV電話又はTV会議機能を有する通信端末装置に関する。   The present invention relates to a communication terminal device having a TV telephone or TV conference function.

従来、翻訳電話装置の多くは、送信側でキー入力された文字コード列を相手語の文字コード列に翻訳して伝送し、受信側では該伝送された文字コード列を文字表示出力したり音声出力するものであった。   2. Description of the Related Art Conventionally, many translation telephone devices translate a character code string input from a key on a transmitting side into a character code string of a partner language and transmit the translated character code string. Output.

また、この装置に音声認識機能を付与し、送信側で音声信号を認識処理して得られる文字コード列を翻訳伝送するものも提案されている。   In addition, a device has been proposed in which a voice recognition function is added to this device, and a character code string obtained by recognizing a voice signal on a transmission side is translated and transmitted.

しかしながら、これらの装置では、文として完成された翻訳結果を得るために送信側で纏まった文を入力し終わるまで翻訳を開始できず、そのため通話における即時性が損なわれるという問題点があった。   However, these devices have a problem in that translation cannot be started until the sender has finished inputting a compiled sentence in order to obtain a completed translation result as a sentence, which impairs the immediacy of a call.

従来の翻訳電話装置には、通話における即時性が損なわれるという問題点があった。   The conventional translation telephone device has a problem that the immediacy in a call is impaired.

そこで、本発明は、翻訳通訳における即時対話性を実現し、会話リズムを乱さない通話を可能とする通信端末装置を提供する。   Therefore, the present invention provides a communication terminal device that realizes immediate interactivity in translation interpretation and enables a telephone conversation without disturbing the conversation rhythm.

本発明の通信端末装置は、画像情報もしくは音声情報の記号化情報を受信する受信手段と、この受信手段により受信した記号化情報を、文として翻訳不可能な短い単位もしくは文として翻訳可能な単位のどちらか一方の単位毎に、記号化された時の記号化規則とは異なる記号化規則で時間的に逐次変換する変換手段と、この変換手段により変換された記号化情報を復号化する復号化手段と、この復号化手段により復号化した復号化情報を出力する出力手段とからなるものである。   A communication terminal device according to the present invention includes a receiving unit that receives coded information of image information or audio information, and a unit that can convert the coded information received by the receiving unit into a short unit that cannot be translated as a sentence or a unit that can be translated as a sentence. A conversion unit for sequentially performing temporal conversion according to a coding rule different from the coding rule at the time of coding for each one of the units; and a decoding unit for decoding the coding information converted by the conversion unit. And decoding means for outputting decoding information decoded by the decoding means.

本発明の通信端末装置について説明する。   The communication terminal device according to the present invention will be described.

受信手段は、画像情報、もしくは、音声情報の記号化情報を受信する。   The receiving means receives image information or encoded information of audio information.

変換手段は、この受信手段により受信した記号化情報を、文として翻訳可能でない短い単位(例えば、単語の単位)、もしくは、文として翻訳可能な最小の単位(例えば、文節の単位)のどちらか一方の単位毎に、記号化された時の記号化規則とは異なる記号化規則に時間的に逐次変換し翻訳を行う。   The conversion unit converts the symbolized information received by the reception unit into a short unit that cannot be translated as a sentence (for example, a unit of a word) or a minimum unit that can be translated as a sentence (for example, a unit of a phrase). For each unit, translation is performed by temporally sequentially converting to a symbolization rule different from the symbolization rule at the time of symbolization.

復号化手段は、この変換手段により変換すなわち翻訳された記号化情報を復号化する。   The decoding means decodes the symbolized information converted or translated by the conversion means.

出力手段は、この復号化手段により復号化した復号化情報を出力する。   The output means outputs the decoded information decoded by the decoding means.

これにより、本発明の通信端末装置であれば、一文としてのまとまりを受信することを待たずに、単語や文節を受信した時点で時間的に逐次翻訳を行うことにより、翻訳通訳における即時対話性を実現し、会話リズムを乱さない通話を可能とする。   Thus, the communication terminal device of the present invention performs the immediate interactivity in the translation interpreter by performing temporal sequential translation at the time of receiving a word or a phrase without waiting for reception of a unit as one sentence. And make it possible to communicate without disturbing the conversation rhythm.

本発明の通信端末装置によれば、1文毎の翻訳が終了するまで翻訳結果の提示を遅らせることなく、片言であるにせよ単語や文節が時間的に逐次翻訳されるため、良好な対話を行うことができる。   ADVANTAGE OF THE INVENTION According to the communication terminal device of this invention, without deferring the presentation of the translation result until the translation of each sentence is completed, even if it is one word, words and phrases are translated sequentially in time, so that a good dialogue can be performed. It can be carried out.

(TV電話装置の第1の実施例)
図1は、本発明の通信端末装置に係るTV電話装置の第1の実施例のブロック図である。
(First Embodiment of TV Telephone Device)
FIG. 1 is a block diagram of a first embodiment of a TV telephone apparatus according to the communication terminal apparatus of the present invention.

符号101は、自話者が発生した音声と自話者が写る画像等の自話者信号を入力する信号入力部である。信号入力部101は、例えばマイクロフォンとTVカメラ等で構成される。   Reference numeral 101 denotes a signal input unit for inputting a self-speaker signal such as a voice generated by the self-speaker and an image of the self-speaker. The signal input unit 101 includes, for example, a microphone and a TV camera.

符号102は、信号入力部101により入力された自話者信号を、話者に依存しない自話者コード列と話者に依存する自話者特徴とに分離する。具体的には、音声信号を、文字や単語を表すコード列と話者の音質を表わす話者特徴とに分離し、また、画像信号を、動作や表情を表すコード列と話者の容貌を表わすCGデータとに分離する。   A code 102 separates a self-speaker signal input by the signal input unit 101 into a self-speaker code string independent of a speaker and a self-speaker characteristic that depends on a speaker. Specifically, the audio signal is separated into a code sequence representing characters and words and a speaker feature representing the sound quality of the speaker, and the image signal is converted into a code sequence representing actions and facial expressions and the appearance of the speaker. Separated into the CG data to be represented.

符号103は、相手話者コード列と相手話者特徴とから相手話者信号を復元する信号化部である。信号化部103における処理は、記号化部102における処理の逆過程となる。   Reference numeral 103 denotes a signal converting unit for restoring the other party's signal from the other party's code sequence and the other party's characteristics. The processing in the signal generator 103 is the reverse process of the processing in the symbolizer 102.

符号104は、信号化部103により復元された相手話者信号を自話者に対して出力する信号出力部である。   Reference numeral 104 denotes a signal output unit that outputs the partner speaker signal restored by the signal conversion unit 103 to the own speaker.

符号105は、自話者の操作を受け付ける操作入力部である。   Reference numeral 105 denotes an operation input unit that receives an operation performed by a speaker.

符号106は、操作入力部105による操作信号に従って、話者IDと話者特徴とからなる話者情報を管理するとともに、回線接続等の装置全体の機能を制御する話者情報管理部である。   Reference numeral 106 denotes a speaker information management unit that manages speaker information including a speaker ID and speaker characteristics in accordance with an operation signal from the operation input unit 105, and controls functions of the entire apparatus such as a line connection.

符号107は、話者情報をデータベース(以下、DBという)化して格納する話者DB部である。   Reference numeral 107 denotes a speaker DB unit that stores the speaker information in a database (hereinafter, referred to as DB).

符号108は、相手局との通信回線を接続し、話者コード列や話者情報等を通信信号に変換して相手局とやりとりする通信部である。   Reference numeral 108 denotes a communication unit for connecting a communication line with the partner station, converting a speaker code string, speaker information, and the like into a communication signal, and exchanging with the partner station.

次に、上記TV電話装置の動作を説明する。   Next, the operation of the TV telephone device will be described.

このTV電話装置の特徴として3つのモードが存在する点が従来装置と異なる。これらのモードを、オンラインブートモード、オフラインブートモード、ブートレスモードとそれぞれ呼ぶ。以下、各々のモードを説明する。   This TV telephone device is different from the conventional device in that there are three modes as features. These modes are called an online boot mode, an offline boot mode, and a bootless mode, respectively. Hereinafter, each mode will be described.

(1)オンラインブートモード
オンラインブートモードは、話者ID交換処理205により知らされた相手話者が自局の話者DBに未登録(未知話者)であり、かつ、該未知話者の話者情報の自局話者DBへの新規登録を自話者と相手話者の両者が同意した場合にのみ選択されるモードである。
(1) Online Boot Mode In the online boot mode, the partner speaker notified by the speaker ID exchange processing 205 is not registered in the speaker DB of its own station (unknown speaker), and the talk of the unknown speaker is performed. This mode is selected only when both the own speaker and the other speaker agree to newly register speaker information in the own station speaker DB.

このとき、少なくとも一方の話者が話者情報の送信または受信を拒否した場合には、オンラインブートモードは選択されないことを特記しておく。   At this time, it should be noted that the online boot mode is not selected if at least one of the speakers refuses to transmit or receive the speaker information.

オンラインブートモードでは回線接続後から通話処理208に移行するまでに登録すべき話者情報を伝送する必要があるため、通話可能となるまでに多少の時間を要する。そのため、従来装置はオンラインモードのみを採用しているため、この問題はそのまま従来装置が抱える問題点でもある。しかしながら、本装置は、次に述べるオフラインブートモードを備えることにより、この問題を回避し、従来装置に比較して極めて高い利便性を発揮している点が特徴である。   In the online boot mode, it is necessary to transmit the speaker information to be registered after the line is connected and before the process proceeds to the call processing 208, so that it takes some time before the call can be made. For this reason, since the conventional device employs only the online mode, this problem is also a problem of the conventional device as it is. However, the present apparatus is characterized in that it has an offline boot mode described below, thereby avoiding this problem and exhibiting extremely high convenience as compared with the conventional apparatus.

(2)オフラインブートモード
オフラインブートモードは、話者ID交換処理205により知らされた相手話者が自局の話者DBに既に登録(既知話者)されている場合に選択されるモードであり、通話に先駆けての話者情報の伝送を必要としないために回線接続後直ちに通話可能となることが特徴である。
(2) Offline Boot Mode The offline boot mode is a mode selected when the other party notified by the speaker ID exchange processing 205 is already registered (known speaker) in the speaker DB of the own station. Since the transmission of the speaker information prior to the call is not required, the call can be made immediately after the line is connected.

即ち、本装置ではオンラインブートモードとオフラインブートモードとを有するために、一旦オンラインブートモードで話者情報を登録しさえすれば、次回から時間のかかるオンラインブートモードを用いる必要がなくなり、使用者を待たせることなく良好な通話開始が実現できるのである。   That is, since the present apparatus has an online boot mode and an offline boot mode, once the speaker information is registered in the online boot mode, it is not necessary to use the online boot mode which takes a long time from the next time. A good call can be started without having to wait.

(3)ブートレスモード
本装置では、上記2つのモード以外に相手話者が未知話者であり、かつ話者情報の交換を希望しない場合に対応したモードとしてブートレスモードも有している。
(3) Bootless Mode In addition to the above two modes, the present apparatus has a bootless mode as a mode corresponding to a case where the other party is an unknown speaker and does not wish to exchange speaker information.

ブートレスモードでは、話者情報を交換せず、双方の話者DBに予め格納される標準話者情報が使用される。該標準話者情報は固定の標準的な話者特徴を含んでおり、相手話者を忠実に再現しない反面、話者の匿名性を向上させるという効果を生む。   In the bootless mode, standard speaker information stored in advance in both speaker DBs is used without exchanging speaker information. The standard speaker information includes fixed standard speaker characteristics, and does not faithfully reproduce the other speaker, but produces an effect of improving the anonymity of the speaker.

この結果、例えば、親しくなる必要のない人物と暫定的な通話をする場合に、自分の顔や声を隠して対応できるという使用形態を可能とする利点がある。勿論、該モードは前記のオフラインブートモードと同様に回線接続後直ちに通話可能となるという特徴も備えている。   As a result, for example, when a temporary call is made with a person who does not need to be close, there is an advantage that a use form in which one's face and voice can be hidden and dealt with is possible. Of course, this mode also has a feature that, as in the above-mentioned offline boot mode, a call can be made immediately after the line is connected.

図2は、TV電話装置の基本動作を示すフローチャートである。   FIG. 2 is a flowchart showing a basic operation of the TV telephone device.

ステップ201,202は、ともに発信側と被発信側で各々通話に先駆けて自話者情報を生成して自局の話者DBに登録しておく新規自話者情報登録処理である。   Steps 201 and 202 are new self-speaker information registration processing for generating self-speaker information and registering the self-speaker information in the speaker DB of the own station prior to the call on both the calling side and the called side.

ステップ203は、発信側話者が通話を希望する相手話者のIDを指定することにより、相手話者との回線接続要求を発信する発呼処理である。   Step 203 is an outgoing call process in which the calling speaker designates the ID of the other talker who wants to talk, and sends a line connection request with the other talker.

ステップ204は、発信側の回線接続要求に基づいて相互に回線を接続する回線接続処理である。   Step 204 is a line connection process for connecting lines to each other based on a line connection request on the calling side.

ステップ205は、自話者IDを相互に交換する話者ID交換処理である。この結果、通話相手が誰であるのかを相互に知ることができる。   Step 205 is a speaker ID exchange process for exchanging own speaker IDs. As a result, it is possible to mutually know who the call partner is.

ステップ206において、通話相手が既知者であれば、オフラインブートモードに入って、ステップ211に進む。また、通話相手が未知者であれば、オンラインブートモードもしくはブートレスモードの選択のために、ステップ207に進む。   If it is determined in step 206 that the other party is a known person, the system enters the offline boot mode and proceeds to step 211. If the other party is unknown, the process proceeds to step 207 to select the online boot mode or the bootless mode.

ステップ207において、通話者がブートレスモードを選択したかどうかを判断する。ブートレスモードを選択すれば、ブートレスモードに入りステップ210に進む。一方、ブートレスモードを選択しなければオンラインブートモードに入りステップ208に進む。   In step 207, it is determined whether the caller has selected the bootless mode. If the bootless mode is selected, the system enters the bootless mode and proceeds to step 210. On the other hand, if the bootless mode is not selected, the operation enters the online boot mode and proceeds to step 208.

ステップ208は、前記新規自話者情報登録処理201,202により話者DBに登録されている自話者情報を必要に応じて相互に交換する話者情報交換処理である。この結果、通話相手の話者特徴を相互に入手することができる。   Step 208 is a speaker information exchange process for mutually exchanging the speaker information registered in the speaker DB by the new speaker information registration processes 201 and 202 as necessary. As a result, the speaker characteristics of the other party can be mutually obtained.

ステップ209は、前記話者情報交換処理206で受け取った相手話者情報を自局の話者DBに登録する新規相手話者情報登録処理である。   Step 209 is a new speaker information registration process for registering the other speaker information received in the speaker information exchange process 206 in the speaker DB of the own station.

ステップ210においては、ブートレスモードに入っているため、標準話者情報を抽出する。この標準話者情報は、予め準備された一般的な画像情報や後述するマンガ的な画像的特徴を情報とするものであり、これにより、自分の顔や声を隠して対応できる。この場合に、相手に写る画像は、その標準話者の画像的特徴において口や顔の表情のみ、通話者の動きに対応するものであり、少なくとも、通話相手にとっては、顔の表情や口の動かし方だけは判別することができる。そのため、TV電話装置の利便を損うことがない。   In step 210, since the system is in the bootless mode, standard speaker information is extracted. The standard speaker information uses general image information prepared in advance or manga-like image features to be described later as information, whereby it is possible to deal with it by hiding its own face and voice. In this case, the image shown in the other party corresponds only to the mouth and face expressions in the image characteristics of the standard speaker and corresponds to the movement of the caller. Only the way of movement can be determined. Therefore, the convenience of the TV telephone device is not impaired.

ステップ211は、話者相互に通話する通話処理である。   Step 211 is a call process for talking between the speakers.

ステップ212は、回線を切断して通話を終了する回線切断処理である。   Step 212 is a line disconnection process for disconnecting the line and ending the call.

なお、上記の回線接続処理204から回線切断処理212までの処理は、発信側と被発信側で各々同時にかつ独立に行われる。   The processing from the line connection processing 204 to the line disconnection processing 212 is performed simultaneously and independently on the calling side and the called side.

(TV電話装置の第1の実施例の変更例1)
図3に第1の実施例の変更例を説明する。
(Modification Example 1 of First Embodiment of TV Telephone Device)
FIG. 3 illustrates a modification of the first embodiment.

第1の実施例(図1)との相違は、話者DB部308が装置本体から着脱可能となり、かつ話者DB部308と話者情報管理部306とを繋ぐ接続部309を新たに設けた構成となっている点である。   The difference from the first embodiment (FIG. 1) is that the speaker DB unit 308 is detachable from the apparatus main body, and a connection unit 309 that connects the speaker DB unit 308 and the speaker information management unit 306 is newly provided. This is the point of having a configuration.

この結果、使用者毎に専用の話者DB部308を用意することが可能となり、例えば家族で一台の装置を使うような、使用者が頻繁に変わる状況においても、個人毎の話者DB部308を自在に入れ替えることで1台の装置が各話者に応じた最適な状態で使用されることが可能となる。しかも、着脱自在な話者DB部308は、例えば、メモリカードや磁気ディスク等で実現することにより小型化が可能なので、装置本体を小型化する上でも有利であり、携帯可能TV電話装置を提供する上で重要な役割を果たす。   As a result, a dedicated speaker DB unit 308 can be prepared for each user, and even in a situation where the user changes frequently, for example, when a family uses one device, the speaker DB for each individual can be prepared. By freely exchanging the unit 308, one device can be used in an optimal state according to each speaker. Moreover, since the detachable speaker DB unit 308 can be miniaturized by realizing it with, for example, a memory card or a magnetic disk, it is advantageous in miniaturizing the apparatus main body, and provides a portable TV telephone apparatus. Play an important role in

(TV電話装置の第1の実施例の変更例2)
図4に第1の実施例の変更例を説明する。話者DB部の容量が不足した場合には、大容量の話者DB部を持つ親装置に該容量不足を起こした話者DB部の内容を待避させたり、逆に該大容量話者DB部から保存されている話者情報を読み込んだりできれば一層便利である。
(Modification 2 of the first embodiment of the TV telephone apparatus)
FIG. 4 illustrates a modification of the first embodiment. When the capacity of the speaker DB unit is insufficient, the content of the speaker DB unit having the insufficient capacity can be saved in the parent device having the large-capacity speaker DB unit. It would be more convenient if the speaker information stored from the section could be read.

図4にこのような装置の全体構成図を示す。   FIG. 4 shows an overall configuration diagram of such an apparatus.

本装置は、図3の装置に大容量話者DB部410を新たに備えることにより、通信部407や着脱自在の話者DB部408を介して他装置との間で話者情報を交換可能である。   This device is provided with a large-capacity speaker DB unit 410 in the device of FIG. 3, so that speaker information can be exchanged with another device via the communication unit 407 and the detachable speaker DB unit 408. It is.

(TV電話装置の第1の実施例の変更例3)
図4において、登録される各話者についての通話頻度を対応する話者情報に付加して記録可能とし、話者DB部408から大容量話者DB部410への待避に際しては通話頻度の低いものから待避させることにより、重要な通話相手の話者情報が、常に使用可能な話者DB部408上に残るようにすることができる。
(Third modification of the first embodiment of the TV telephone apparatus)
In FIG. 4, the call frequency of each registered speaker is added to the corresponding speaker information and can be recorded. When the call is saved from the speaker DB unit 408 to the large-capacity speaker DB unit 410, the call frequency is low. By evacuating from the object, the speaker information of the important communication partner can always be left on the available speaker DB unit 408.

このようにすると、使用状況に最も適った話者DBを自動的に構築することが可能となり、本装置の利便性はさらに向上する。   This makes it possible to automatically construct a speaker DB most suitable for the use situation, and the convenience of the present apparatus is further improved.

(TV電話装置の第1の実施例の変更例4)
なお、以上で述べた話者特徴は必ずしも写実的な画像特徴や音声特徴である必要はなく、使用者の好みに合わせて漫画的な画像特徴や音声特徴を用いることも可能である。
(Modification 4 of the first embodiment of the TV telephone apparatus)
It should be noted that the above-described speaker features need not necessarily be realistic image features and voice features, and cartoon-like image features and voice features can be used according to the user's preference.

このためには、漫画的な話者特徴を話者DB部に登録可能であることが必要であるが、本装置では、これを外部装置(または親装置)から通信部や着脱自在の話者DB部等を経由して登録可能とすれば良い。   For this purpose, it is necessary that cartoon-like speaker characteristics can be registered in the speaker DB unit. In this apparatus, however, this can be transmitted from an external device (or parent device) to a communication unit or a detachable speaker. What is necessary is just to be able to register via a DB part etc.

(TV電話装置の第2の実施例)
TV電話装置の第2の実施例を説明する。
(Second embodiment of TV telephone device)
A second embodiment of the TV telephone apparatus will be described.

図5は、実施例装置の基本構成図である。   FIG. 5 is a basic configuration diagram of the apparatus according to the embodiment.

符号501,504,506は、図1で述べた信号入力部101、信号出力部104、通信部108に対応する構成要素である。   Reference numerals 501, 504, and 506 are components corresponding to the signal input unit 101, the signal output unit 104, and the communication unit 108 described in FIG.

符号502は、自話者信号を自話者コード列に変換する記号化部である。   Reference numeral 502 denotes a symbol conversion unit that converts a speaker signal into a speaker code sequence.

符号503は、相手話者コード列を、相手話者信号に変換する信号化部である。   Reference numeral 503 denotes a signal conversion unit that converts a partner speaker code string into a partner speaker signal.

符号505は、記号化部502が出力する自話者コード列から自装置への指令となっている指令コード列を分離抽出し、該指令コード列に対応する操作信号を発生すると同時に、該指令コード列を除いた送信コード列を相手局へ送出されるべきコード列として、通信部506に出力する指令分離部である。   Reference numeral 505 denotes a command code sequence that is a command to the own device, which is separated and extracted from the self-speaker code sequence output by the encoding unit 502, generates an operation signal corresponding to the command code sequence, and The command separation unit outputs the transmission code sequence excluding the code sequence to the communication unit 506 as a code sequence to be transmitted to the partner station.

図1の装置との相違は、話者DB部と話者情報管理部を持たないことである。信号化に際して用いられる話者特徴は信号化部503が標準的な特徴情報を内蔵することで提供する。   The difference from the apparatus of FIG. 1 is that the apparatus does not have a speaker DB section and a speaker information management section. The speaker characteristics used for signal conversion are provided by the signal generator 503 incorporating standard characteristic information.

この構成により、音声や動作による操作が通話中にも行えるようになり、かつ該操作を意味する音声や動作が不用意に相手に伝送されることのない音声命令可能な通信端末装置を実現することができる。   With this configuration, a communication terminal device capable of performing an operation by voice or operation even during a telephone call and capable of performing voice commands without inadvertently transmitting voice or operation meaning the operation is realized. be able to.

具体例としては、通話相手が、電話番号や住所等の情報を言い始めた場合に、これらの情報を記憶させるために、通話者はTV電話装置に向かって、「メモ機能」と音声で指令すれば、この指令部分は、通話相手に送信されず、TV電話装置のみが受諾する。なお、この場合にメモ機能の録画装置を備えておく。   As a specific example, when the other party starts to say information such as a telephone number and an address, in order to memorize such information, the caller instructs the TV telephone device to use a “memo function” by voice. Then, this command portion is not transmitted to the other party and only the TV telephone device accepts the command portion. In this case, a recording device having a memo function is provided.

無論、従来の電話装置にも音声によりダイヤル可能なものが提案されているが、この場合の音声指令の受け付けは通話前に限定され、通話中の指令音声の受け付けやその伝送の禁止に関しては一切配慮が成されていなかった。   Of course, conventional telephone devices that can be dialed by voice have been proposed, but in this case the reception of voice commands is limited before the call, and there is no restriction on the reception of command voice during a call or the prohibition of its transmission. No consideration was given.

本実施例はこの点を解決して、本装置の利便性を向上せしむるものである。無論、本装置でも音声による回線接続操作を実現可能である。   This embodiment solves this point and improves the convenience of the present apparatus. Of course, this apparatus can also realize a line connection operation by voice.

(TV電話装置の第2の実施例の変更例1)
図6は、前記通話中の音声による命令機能を図1で示した第1の実施例において実現した例である。
(Modification Example 1 of Second Embodiment of TV Telephone Device)
FIG. 6 shows an example in which the command function by voice during a call is realized in the first embodiment shown in FIG.

自話者は、自話者コード列を用いて装置を操作可能であることから、図1の操作入力部105を指令分離部605に置き換えた構成となっている。   Since the self-speaker can operate the apparatus using the self-speaker code string, the operation input unit 105 in FIG. 1 is replaced with a command separation unit 605.

(TV電話装置の第2の実施例の変更例2)
図7に第2の実施例の変更例を説明する。
(Modification 2 of the second embodiment of the TV telephone apparatus)
FIG. 7 illustrates a modification of the second embodiment.

符号701,702,703,704,706は、図5における信号入力部501、記号化部502、指令分離部505、信号出力部504、通信部506に対応した構成要素であり、符号705は、図1における操作入力部105に対応した構成要素である。   Reference numerals 701, 702, 703, 704, and 706 are components corresponding to the signal input unit 501, the encoding unit 502, the command separation unit 505, the signal output unit 504, and the communication unit 506 in FIG. These are components corresponding to the operation input unit 105 in FIG.

信号入力部701からの自話者信号は、記号化部702と指令分離部703の両方に入力される。   The own speaker signal from the signal input unit 701 is input to both the encoding unit 702 and the command separation unit 703.

指令分離部703は、記号化部702からの自話者コード列から指令コード列を分離抽出し、前記自話者信号から該指令コードの発せられた時間に対応した区間の信号を削除した送信信号を通信部706に出力する。   The command separating unit 703 separates and extracts the command code sequence from the own speaker code sequence from the encoding unit 702, and deletes the signal of the section corresponding to the time when the command code was issued from the own speaker signal. The signal is output to the communication unit 706.

同時に、指令分離部703は、前記指令コード列に対応した操作信号も出力する。   At the same time, the command separating section 703 also outputs an operation signal corresponding to the command code sequence.

通信部706は、前記送信信号を通信信号に変換して送出するとともに、相手局から受信した相手話者信号を信号出力部704に直接入力する。   The communication section 706 converts the transmission signal into a communication signal and transmits the communication signal, and also directly inputs the other party's speaker signal received from the other station to the signal output section 704.

この構成は、図5の構成と異なり、情報伝送の主役が話者コード列ではなくて話者信号である点がポイントである。このような構成により、信号化部と話者DB部を含まない小規模な構成が可能となる。   This configuration differs from the configuration of FIG. 5 in that the main role of information transmission is not a speaker code sequence but a speaker signal. With such a configuration, a small-scale configuration that does not include the signal conversion unit and the speaker DB unit is possible.

なお、本変更例では、図中の操作入力部705を排した構成も可能である。   In this modification, a configuration in which the operation input unit 705 in the drawing is omitted is also possible.

(TV電話装置の第2の実施例の変更例3)
上記の変更例2を図8に示すように、さらに変更して実施することも可能である。
(Third modification of the second embodiment of the TV telephone apparatus)
As shown in FIG. 8, the second modification can be further modified and implemented.

符号801,802,803,804,805,807は、図7における信号入力部701、記号化部702、指令分離部703、信号出力部704、操作入力部705、通信部706に対応した構成要素である。   Reference numerals 801, 802, 803, 804, 805, and 807 are components corresponding to the signal input unit 701, the encoding unit 702, the command separation unit 703, the signal output unit 704, the operation input unit 705, and the communication unit 706 in FIG. It is.

そして、新たに制御部806を設け、操作信号を受理して制御信号と区間信号とを生成させる。区間信号とは、自話者が自装置に指令を発している期間を示す信号であり、該話者が例えば指令を発しながら、押しボタンスイッチを押し下げる等の、現在指令中であることを示す特別な操作をすることによって制御部806から発生されるものであるとする。   Then, a new control unit 806 is provided to receive an operation signal and generate a control signal and a section signal. The section signal is a signal indicating a period during which the own speaker is issuing a command to the own device, and indicates that the speaker is currently instructing, for example, pressing down a push button switch while issuing the command. It is assumed that this is generated from the control unit 806 by performing a special operation.

指令分離部803は、区間信号を検知している間の自話者信号を指令を含む信号として処理する。   The command separation unit 803 processes the own speaker signal while detecting the section signal as a signal including a command.

要するに、第2の実施例においては、通話中に話者信号を認識して指令を受理し、かつ、その指令に該当する情報を送信対象から除外可能であるならば、指令中であることの検知方法等の細部の差異は問題とはならない。   In short, in the second embodiment, if a speaker signal is recognized during a call and a command is received, and information corresponding to the command can be excluded from transmission targets, it is determined that the command is being performed. Differences in details such as the detection method do not matter.

(TV電話装置の第3の実施例)
図9に、TV電話装置の第3の実施例を示す。
(Third embodiment of TV telephone device)
FIG. 9 shows a third embodiment of the TV telephone apparatus.

符号901,902,903,904,907は、図5に示した信号入力部501、記号化部502、信号化部503、信号出力部504、通信部506に対応した構成要素である。また、符号905は、図7の操作入力部705に対応した構成要素である。符号906は、入力コードを所定の出力コードに変換するコード変換部である。   Reference numerals 901, 902, 903, 904, and 907 are components corresponding to the signal input unit 501, the symbolization unit 502, the signalization unit 503, the signal output unit 504, and the communication unit 506 shown in FIG. Reference numeral 905 is a component corresponding to the operation input unit 705 in FIG. A code conversion unit 906 converts an input code into a predetermined output code.

ここで、説明の都合上、コード変換部906により変換されるコード列を言語コードに限定し、該言語コード翻訳に際しての本実施例の利便性について述べる。   Here, for convenience of explanation, the code sequence converted by the code conversion unit 906 is limited to a language code, and the convenience of this embodiment in translating the language code will be described.

相手局から送出された言語コードは通信部907で受信され、通信コード列としてコード変換部906に入力される。   The language code transmitted from the partner station is received by the communication unit 907, and is input to the code conversion unit 906 as a communication code string.

コード変換部906では該言語コードを所定の言語に翻訳して自局の話者に呈示する。しかし、従来の装置のように1文を受信し終わるまで翻訳作業を行わないのではなく、例えば、単語等のきりのよい単位での逐次翻訳を実行し、片言ではあるが即時に翻訳結果を伝達するようにできる点が特徴である。   The code conversion unit 906 translates the language code into a predetermined language and presents it to the speaker of the own station. However, instead of performing translation work until one sentence is received as in the conventional apparatus, for example, sequential translation is performed in units such as words that are well-defined, and the translation result is immediately, albeit in one word. The feature is that it can be transmitted.

このようにすることによって、通話の同時性や即時性が維持され、該装置を通じてのコミュニケーションをより円滑なものとすることができる。   By doing so, the simultaneity and immediacy of the call are maintained, and communication through the device can be made smoother.

なお、1文を受信後には該文の翻訳結果をも呈示可能としても良い。このために、該装置に言語コードを文字表示したり音声出力したりできる呈示機能を具備させ、例えば逐次翻訳結果は音声で出力し、1文一括翻訳結果は文字で同時に出力可能とすることもできる。   After receiving one sentence, the translation result of the sentence may be presented. For this purpose, the device is provided with a presentation function capable of displaying language codes in characters or outputting sounds, for example, it is possible to output the results of sequential translation in voice and output the results of one sentence batch translation in characters simultaneously. it can.

また、使用者によっては、前記言語コードをマイクを介して音声で入力したり、キーボード等を介して文字で入力したりと、該入力方法を選択可能としても良い。   Further, some users may be able to select the input method by inputting the language code by voice through a microphone or by inputting characters through a keyboard or the like.

あるいは、該言語コードを音声や文字で出力するのみでなく、手話の画像に変換して呈示しても良い。   Alternatively, the language code may not only be output as voice or text, but also converted into a sign language image and presented.

さらには、該言語コードを入力するに際しても手話動作を認識して入力可能とすることも可能である。   Further, it is also possible to recognize the sign language operation and input the language code when inputting the language code.

要するに、本実施例においては、逐次翻訳結果と一括翻訳結果のうち、少なくとも前者を呈示可能であるならば、入力の方法や出力の方法等の細部の差異は問題とはならないのである。   In short, in the present embodiment, if at least the former of the sequential translation result and the batch translation result can be presented, a difference in details such as an input method and an output method does not matter.

(TV電話装置の第3の実施例の変更例1)
図10は、コード変換部1007を着脱自在とするために、装置本体と該コード変換部1007とのインタフェースをとるコード伝達部1006を新たに加えた構成例である。
(Modification Example 1 of Third Embodiment of TV Telephone Device)
FIG. 10 shows a configuration example in which a code transmission unit 1006 for interfacing the apparatus main body and the code conversion unit 1007 is newly added in order to make the code conversion unit 1007 detachable.

このようにすると、コード変換部1007をオプションとすることが可能となり、前記翻訳機能を必要とする利用者のみが、該機能を追加することができるという点において利便性が向上する。   By doing so, the code conversion unit 1007 can be made optional, and convenience is improved in that only a user who needs the translation function can add the function.

(TV電話装置の第3の実施例の変更例2)
図11は、図9に示した実施例を図1に示した装置に適用した例である。このようにすることにより、翻訳機能付きの知的符号化通信装置を提供可能である。
(Modification Example 2 of Third Embodiment of TV Telephone Device)
FIG. 11 shows an example in which the embodiment shown in FIG. 9 is applied to the apparatus shown in FIG. By doing so, it is possible to provide an intelligent coded communication device with a translation function.

(TV電話装置の第4の実施例)
図12にTV電話装置の第4の実施例を示す。
(Fourth embodiment of TV telephone device)
FIG. 12 shows a fourth embodiment of the TV telephone apparatus.

符号1201,1203,1204,1205,1206,1207,1208は、図9に示した実施例における信号入力部901、記号化部902、信号化部903、信号出力部904、操作入力部905、コード変換部906、通信部907に対応している。   Reference numerals 1201, 1203, 1204, 1205, 1206, 1207, and 1208 denote a signal input unit 901, a symbolization unit 902, a signal conversion unit 903, a signal output unit 904, an operation input unit 905, and a code in the embodiment illustrated in FIG. It corresponds to the conversion unit 906 and the communication unit 907.

符号1202は、自話者信号から相手話者信号を差し引くキャンセル部であり、相手話者信号に遅延をかけた信号を一定倍して生成される信号を自話者信号から差し引く処理を行うことにより、信号入力部1201により入力された自話者音声に混入した相手話者音声をキャンセルする働きをするものである。   Reference numeral 1202 denotes a canceling unit that subtracts the other party's signal from the own speaker's signal, and performs a process of subtracting from the own speaker's signal a signal generated by multiplying the signal obtained by delaying the other party's signal by a certain number. Thus, the function of canceling the other party's voice mixed with the own speaker's voice input by the signal input unit 1201 is achieved.

(TV電話装置の第4の実施例の具体例)
図13は、第3の実施例を腕時計型の装置として実施した具体例である。
(Specific Example of Fourth Embodiment of TV Telephone Device)
FIG. 13 is a specific example in which the third embodiment is implemented as a wristwatch-type device.

この小型のTV電話装置では、マイク1301等の音声入力手段とスピーカー1302等の音声出力手段とが近接しており、この距離に比較して使用者と該装置との距離が大きくなるのが通常である。このとき、使用者に可聴な音量で相手音声を再生すると、該音声が前記音声入力手段に拾われてしまい、相手局では自分の発した音声に相手の発した音声がエコーのように重複する結果となり、甚だ使用感を損なうもととなる。ところが、本装置では、このエコーを除去するキャンセル部1202を有することにより、使用感を損なわない小型TV電話装置を提供可能となる。   In this small TV telephone device, a voice input unit such as a microphone 1301 and a voice output unit such as a speaker 1302 are close to each other, and the distance between the user and the device is usually larger than this distance. It is. At this time, when the other party's voice is reproduced at a volume that is audible to the user, the voice is picked up by the voice input means, and the other party's voice overlaps with his own voice like an echo at the partner station. As a result, the feeling of use is greatly impaired. However, in the present apparatus, by providing the cancel unit 1202 for removing the echo, it is possible to provide a small TV telephone apparatus which does not impair the usability.

なお、本実施例は、通常は時計として機能するように、非通話時には画面全面が時計表示となる。無論、通話時には表示部1303に相手話者の画像が表示され、同時に時計画像が画面の一部に縮小表示される。   In the present embodiment, the entire screen is displayed as a clock during a non-call, so that it normally functions as a clock. Of course, during a call, the image of the other party is displayed on the display unit 1303, and at the same time, the clock image is reduced and displayed on a part of the screen.

ところで、上記実施例で示されるキャンセル部1202を有するTV電話装置は、図12と図13に例示された実現形態に限定されるものではない。要するに、信号入力部と信号出力部がともに接近しており、かつ、それに比して該信号入力部と信号出力部がともに使用者から遠いが故に入力音声と出力音声が混入してしまう状況が発生する通信装置であれば、いかようにも適用実施可能である。即ち、前記キャンセル部1202が入力信号と出力信号の加重差を計算することによって前記混信を防止できさえすれば実現に際しての細部の差異は問題とはならない。   By the way, the TV telephone device having the cancel unit 1202 shown in the above embodiment is not limited to the embodiment illustrated in FIG. 12 and FIG. In short, the signal input unit and the signal output unit are both close to each other, and the input sound and the output sound are mixed because the signal input unit and the signal output unit are far from the user. The present invention can be applied to any communication device. That is, as long as the canceling unit 1202 can prevent the interference by calculating the weight difference between the input signal and the output signal, the difference in the details does not matter.

(TV電話装置の追加機能1)
以上で述べた第1から第4までの実施例及び各変更例において、伝送された相手話者コード列を伝送時刻、相手話者ID、再生時のメディアの種別(音声,画像,文字,それらの組み合わせ)等の補助的情報とともに記録し、かつ後刻、自話者に対して再生可能とする記号レベルの留守番機能部を付加することも可能である。
(Additional function 1 for TV phone)
In the first to fourth embodiments and the modified examples described above, the transmitted partner code sequence is transmitted by the transmission time, the partner speaker ID, and the type of media at the time of reproduction (voice, image, character, It is also possible to add a symbol-level answering machine which records the information together with auxiliary information such as a combination of the same and later makes it reproducible to the own speaker at a later time.

このようにすると、信号レベルで記録を行っていた従来の留守番機能付き電話装置等よりも少ないデータ量でメッセージの記録が可能となり、より多くのメッセージを格納可能とすることができる。   By doing so, it becomes possible to record a message with a smaller amount of data than in a conventional telephone device with an answering machine or the like that records at the signal level, and it is possible to store more messages.

また、前記留守番機能部が自局から送信したいメッセージも記録可能とし、予め設定されたイベント(タイマー,遠隔操作,留守番機能起動時等)が発生した時点で、該メッセージを自局から自動発信するようにしても良い。記録される送信メッセージは、相手話者ID、起動イベント、再生時のメディアの種別(音声,画像,文字,それらの組み合わせ)等の補助的情報とともに記録される。この結果、相手毎,イベント毎にメッセージを変えて送信,応答可能であるという点において利便性が一層向上する。   Also, the answering machine function unit can record a message that the user wants to transmit from the own station, and automatically transmits the message from the own station when a preset event (timer, remote operation, when the answering machine function is activated, etc.) occurs. You may do it. The transmitted message to be recorded is recorded together with auxiliary information such as a partner speaker ID, a start-up event, and a type of media at the time of reproduction (voice, image, character, or a combination thereof). As a result, the convenience is further improved in that the message can be transmitted and responded to by changing the message for each partner and event.

(TV電話装置の追加機能2)
また、以上で述べた第1から第4までの実施例及び各変更例において、信号入力部が使用者によるキー入力を受け付け可能とし、あるいは信号出力部が使用者に対して文字表示を出力可能とすることもできる。
(Additional function 2 of TV telephone device)
In the first to fourth embodiments and the modifications described above, the signal input unit can accept the key input by the user, or the signal output unit can output the character display to the user. It can also be.

このようにすると、少なくとも音声を用いる通信において、例えば耳が聞こえない等の音声によるコミュニケーションが困難な人も本装置を使用でき、使用者の枠が拡大するという点において本装置の利便性が一層向上する。   By doing so, at least in communication using voice, for example, a person who has difficulty communicating by voice such as deafness can use the present device, and the convenience of the present device is further improved in that the number of users is expanded. improves.

なお、本機能を実現する場合には、画像用と文字用の画面を別々に用いることも可能であるが、相手画像に相手音声を文字に変換してスーパーインポーズして同一の画面に表示出力するようにすれば、使用者は常に該単一の表示画面のみを注視すればよいという点において、本装置の利便性が一層向上する。   When implementing this function, it is possible to use the screen for images and the screen for text separately.However, the other party's voice is converted to text and superimposed on the other image and displayed on the same screen. If output is performed, the convenience of the present apparatus is further improved in that the user only needs to watch the single display screen at all times.

なお、以上の実施例及び変更例のさらなる変更例として、音声もしくは画像の少なくとも1つを記号で送受し、残りを信号で送受するようにしても良い。   As a further modified example of the above-described embodiment and modified examples, at least one of voice or image may be transmitted and received by a symbol, and the remaining may be transmitted and received by a signal.

例えば、音声を記号化して伝送し、画像は信号を圧縮符号化して送る構成とすることも可能である。無論、記号、信号とも可能な限り圧縮符号化し、さらにバケット化する等して単一の伝送路でやりとりされることは言うまでもない。   For example, it is also possible to adopt a configuration in which sound is symbolized and transmitted, and an image is compressed and coded for transmission. Needless to say, symbols and signals are exchanged through a single transmission path by compressing and encoding as much as possible and further bucketing.

(TV電話装置の追加機能3)
以上の実施例及び変更例において、例えば話者DB部のような記憶手段に登録される話者情報に基づいてダイヤルを実行するための画面の構成例を図22、図23、図24に示す。
(Additional function 3 of TV telephone device)
In the above embodiments and modified examples, examples of screen configurations for executing dialing based on speaker information registered in a storage unit such as a speaker DB unit are shown in FIGS. 22, 23, and 24. .

図22は、TV電話装置における通話相手選択画面の例である。   FIG. 22 is an example of a call partner selection screen in the TV telephone device.

符号2201は、該画面の表示領域であり、表示手段全面またはその一部に表示される。   Reference numeral 2201 denotes a display area of the screen, which is displayed on the entire display unit or a part thereof.

符号2202は、相手話者アイコンであり、このアイコンを指またはマウス等の所定の指示手段によってクリックする等の選択操作を行うことにより、通話相手を選択可能とするものである。アイコン2202の近傍にはこれが示す通話相手の例えば名前等の情報が表示される話者ID表示領域2203がある。   Reference numeral 2202 denotes an opposite party speaker icon, and a call partner can be selected by performing a selection operation such as clicking the icon with a predetermined instruction unit such as a finger or a mouse. In the vicinity of the icon 2202, there is a speaker ID display area 2203 in which information such as the name of the other party indicated by the icon is displayed.

符号2205のように新たに登録される相手話者を表示するための空領域も表示することが可能である。   It is also possible to display an empty area for displaying a newly registered partner as indicated by reference numeral 2205.

符号2206,2207は、該画面に全ての話者アイコンが表示しきれない場合に、該画面をめくる操作を実行可能とするためのページめくりボタンである。もし、ページめくりボタン2207が表示されているときには次のページが存在することを示し、ページめくりボタン2206が表示されているときには前のページが存在していることを示す。   Reference numerals 2206 and 2207 denote page turning buttons for enabling an operation to turn the screen when not all the speaker icons can be displayed on the screen. If the page turning button 2207 is displayed, it indicates that the next page exists, and if the page turning button 2206 is displayed, it indicates that the previous page exists.

符号2204は、一覧画面に登録されていない相手との通話を希望する際に選択されるダイヤル画面呼び出しアイコンであり、前記ページめくり操作に関わらず常に画面の所定の位置に表示され続けるものとする。   Reference numeral 2204 denotes a dial screen call icon that is selected when the user desires a call with a party not registered in the list screen, and is always displayed at a predetermined position on the screen regardless of the page turning operation. .

図23は、前記相手話者アイコンの例である。   FIG. 23 shows an example of the partner speaker icon.

符号2301,2303,2305は各々アイコン領域である。この領域内に話者の例えば上半身の画像等が表示される。   Reference numerals 2301, 230, and 2305 denote icon areas, respectively. For example, an image of the upper body of the speaker is displayed in this area.

符号2302,2304,2306,2307は、各々話者ID表示領域であり、アイコン領域の内部または該領域の近傍に表示される。   Reference numerals 2302, 2304, 2306, and 2307 denote speaker ID display areas, respectively, which are displayed inside or near the icon area.

特に、符号2306,2307は、同一IDの人物であってもその所在地の違いによってかけ分けられるように、話者IDと例えば所在地の情報とを表示可能なように複数領域を使用して表示した例となっている。   In particular, reference numerals 2306 and 2307 are displayed using a plurality of areas so that a speaker ID and, for example, location information can be displayed so that even persons with the same ID can be divided according to the location difference. It is an example.

前記ダイヤル画面呼び出しアイコンを選択すると図24に示すようなダイヤル画面2401が表示される。該画面2401にはプッシュホン装置のダイヤルボタン同様のダイヤルボタン2402が表示され、ダイヤルした番号がダイヤル番号表示領域2403に表示される。なお、該ダイヤルボタンには番号を訂正するためのボタンやダイヤルを実行するボタンが含まれる。   When the dial screen call icon is selected, a dial screen 2401 as shown in FIG. 24 is displayed. On the screen 2401, a dial button 2402 similar to the dial button of the touch-tone device is displayed, and the dialed number is displayed in a dial number display area 2403. The dial buttons include a button for correcting a number and a button for executing dialing.

(TV電話装置の第5の実施例)
図14は、TV電話装置の第5の実施例を示した図である。
(Fifth Embodiment of TV Telephone Device)
FIG. 14 is a diagram showing a fifth embodiment of the TV telephone apparatus.

本装置は2つの画面を備えており、画面1401に相手の動画像を、画面1402に相手から伝送されてきた資料を表示している。自局からの映像はカメラ1403で撮像され、符号化された後アンテナ1406から無線で相手局に転送される。音声についても同様にマイク1407から取り込まれ、アンテナ1406から相手局に転送される。相手話者の声はスピーカー1408を通して得られる。また一連の操作はキーボード1404で行われる。   The present apparatus has two screens, and displays a moving image of the other party on a screen 1401 and data transmitted from the other party on a screen 1402. An image from the own station is picked up by the camera 1403, encoded, and then transmitted wirelessly from the antenna 1406 to the other station. Similarly, voice is also captured from the microphone 1407 and transferred from the antenna 1406 to the partner station. The voice of the other speaker is obtained through the speaker 1408. A series of operations is performed using the keyboard 1404.

この際、動画像は情報量が多く、しかもリアルタイムで符号化,復号化処理を行う必要があることから、画像サイズ(つまり表示する場合の解像度)をあまり大きく設定できない。一方、参考資料等のように静止させて見る画像の場合にはリアルタイム性が要求されない代わりに、出来る限り高い解像度であることが要求される。   At this time, since the moving image has a large amount of information and needs to perform encoding and decoding processes in real time, the image size (that is, the resolution for display) cannot be set to be too large. On the other hand, in the case of an image to be viewed at rest, such as a reference material, a real-time property is not required, but a resolution as high as possible is required.

従って動画像表示用の画面1401は、低解像度画面(例えば国際標準方式H.261のCIF,QCIFレベル)、静止画像表示用の画面1402は高解像度画面(例えば国際標準方式のJPEGレベル)を装備すれば良い。   Therefore, the screen 1401 for displaying a moving image is provided with a low-resolution screen (for example, the CIF and QCIF levels of the international standard H.261), and the screen 1402 for displaying a still image is provided with a high-resolution screen (for example, a JPEG level of the international standard). Just do it.

ただし、コスト的な問題、あるいは画面1401、1402のいずれにも動画を表示する必要がある場合にはどちらの画面も動画用の解像度画面とすることも可能である。   However, in the case of cost considerations, or when it is necessary to display a moving image on any of the screens 1401 and 1402, both screens can be a resolution screen for a moving image.

なお、静止画像は相手から伝送されてきたものを表示する場合と、手持ちの資料を表示して参照する場合とがある。手持ち資料を表示、あるいはそれを相手に伝送する場合には例えばディスクやICカードを格納口1405より挿入し、情報を取り出して表示するようにすれば良い。また、TV受像機の解像度(例えばNTSCやHDTVレベル)を有している画面を用意しておけば、TV番組を視聴しつつ、同時に相手とコミュニケーションを取ることが出来る。なお、本実施例では画面を2つ具備した例を示したが、画面が3つもしくはそれ以上であってももちろん実現可能である。   In addition, there are a case where a still image is displayed as transmitted from a partner and a case where a material on hand is displayed for reference. When displaying the hand-held material or transmitting it to the other party, for example, a disk or IC card may be inserted from the storage port 1405, and the information may be taken out and displayed. If a screen having the resolution of the TV receiver (for example, NTSC or HDTV level) is prepared, it is possible to simultaneously communicate with the other party while watching the TV program. In this embodiment, an example in which two screens are provided has been described. However, it is needless to say that three or more screens can be realized.

(TV電話装置の第6の実施例)
図15は、TV電話装置の第6の実施例を示した図である。
(Sixth embodiment of TV telephone apparatus)
FIG. 15 is a diagram showing a sixth embodiment of the TV telephone apparatus.

図14に示した装置と同様に、画像はカメラ1503で撮像され、また音声はマイク1507から取り込まれて、それぞれアンテナ1506から相手局に転送される。また、相手側の画像は、画面1501に表示され、音声はスピーカー1508を通して得られる。これら一連の操作は、キーボード1504上で行われる。   As in the apparatus shown in FIG. 14, an image is captured by a camera 1503, and audio is captured from a microphone 1507 and transferred from an antenna 1506 to a partner station. An image of the other party is displayed on a screen 1501, and sound is obtained through a speaker 1508. These series of operations are performed on the keyboard 1504.

相手とのコミュニケーションの最中に情報をメモしたり、あるいはお互いに画面上で資料の修正を行う場合には、ボート画面1502が有効に機能する。   The boat screen 1502 functions effectively when making notes on information during communication with the other party or when mutually correcting materials on the screen.

該画面は、ライトペン1505を用いて情報を入力することが可能であり、またそれを随時相手側と送受信し合うことで、該ボード画面を用いながら資料を修正しつつのディスカッションが可能になる。   On the screen, it is possible to input information using the light pen 1505, and by transmitting and receiving the information to and from the other party at any time, a discussion while modifying the material using the board screen becomes possible. .

この場合、ボード画面1502に入力された情報に対する文字認識機能を具備されることも可能であり、このようにすると本装置の利便性が一層向上する。   In this case, a character recognition function for the information input to the board screen 1502 can be provided, so that the convenience of the present apparatus is further improved.

さらに、図14の場合と同様に、手持ちの資料をディスクあるいはICカードから読み出すための格納口1509があり、ここを通じて情報の読み出しが可能になる。もちろん相手から送られてきた情報、あるいは修正した情報を再びディスクやICカードに格納することも可能である。   Further, as in the case of FIG. 14, there is a storage port 1509 for reading out a material on hand from a disk or an IC card, through which information can be read out. Of course, the information sent from the other party or the corrected information can be stored again in the disk or IC card.

なお、ボード画面1502は、画面1501と同様の動画像表示画面であって、さらにその上からライトペンで書き込み可能なものであっても良い。また、これらの画面はキーボード1504からの入力を表示できる構成にすることも可能である。   Note that the board screen 1502 is a moving image display screen similar to the screen 1501, and may be writable from above with a light pen. In addition, these screens can be configured to display input from the keyboard 1504.

(TV電話装置の第7の実施例)
図16は、TV電話装置の第7の実施例である。
(Seventh embodiment of TV telephone device)
FIG. 16 shows a seventh embodiment of the TV telephone apparatus.

カメラ1604、アンテナ1605、マイク1606、スピーカー1607、キーボード1608、ライトペン1609、及び、ディスクやICカード等のための格納口1610は、図15と同様の働きをする。ここでは、さらに3種類の画面を装備している。   A camera 1604, an antenna 1605, a microphone 1606, a speaker 1607, a keyboard 1608, a light pen 1609, and a storage port 1610 for a disk, an IC card, and the like have the same functions as those in FIG. Here, three types of screens are further provided.

この結果、使用者は動画用低解像度画面1601により、常に相手を見ながら通信ができ、静止画用高解像度画面1602により、その場で必要な資料をお互いに参照しながらディスカッションができる。   As a result, the user can always communicate while watching the other party on the moving image low-resolution screen 1601, and can have a discussion while referring to necessary materials on the spot with each other on the still image high-resolution screen 1602.

また、ライトペン1609からの入力画面1603により、お互いが黒板を使っているようなイメージで情報の加筆,修正がこの画面上でおこなえる。   In addition, on the input screen 1603 from the light pen 1609, information can be added and corrected on this screen in an image as if each other is using a blackboard.

なお、これらの画面は任意にキーボード1608からの入力を表示することも可能であり、その場合はワープロの代用としても使用できる。   Note that these screens can arbitrarily display the input from the keyboard 1608, in which case they can be used as a substitute for a word processor.

(TV電話装置の第8の実施例)
以下、TV電話装置の第8の実施例を図17を用いて説明する。
(Eighth Embodiment of TV Telephone Device)
Hereinafter, an eighth embodiment of the TV telephone apparatus will be described with reference to FIG.

図17は、本実施例に係わるブロック図である。   FIG. 17 is a block diagram according to the present embodiment.

入力端子1701より選択開始信号が入力されると、表示レート選択部1702で、ディスプレイに表示する動画像のレートを選択する。レート入力の方法は何でも良く、例えば音声に入力しても良いし、テンキーを用意しておきそれを用いて入力しても良い。あるいは表示可能レートをディスプレイ上に表示し、タッチパネル等を用いてその中から選択する方法を用いても良い。   When a selection start signal is input from an input terminal 1701, a display rate selection unit 1702 selects a rate of a moving image to be displayed on a display. Any rate input method may be used. For example, a rate may be input to a voice, or a numeric keypad may be prepared and input may be performed using the keypad. Alternatively, a method may be used in which the displayable rate is displayed on a display, and the display rate is selected using a touch panel or the like.

表示レートが決まると、選択レート画像表示部1703で、実際に表示レート下での動画像を表示する。表示する動画像は、予め選択可能レートでの動画像を作り、動画像メモリ1704に蓄積しておく。そして、動画像メモリ1704では入力された選択レートにおける動画像を選択レート画像表示部1703に送る。   When the display rate is determined, the selected rate image display unit 1703 actually displays a moving image at the display rate. A moving image to be displayed is created in advance at a selectable rate and stored in the moving image memory 1704. Then, the moving image memory 1704 sends the moving image at the input selection rate to the selection rate image display unit 1703.

選択レート画像表示部1703では動画像の表示終了後、さらに別のレートでの動画像を表示するか、あるいは実際に用いる伝送,蓄積レートの決定をするかをユーザに問い、結果に応じて表示レート選択部1702あるいは伝送,蓄積レート決定部1705に信号を送る。   After the display of the moving image is completed, the selection rate image display unit 1703 asks the user whether to display the moving image at another rate or to determine the transmission and storage rates to be actually used, and displays the image according to the result. A signal is sent to the rate selection unit 1702 or the transmission and accumulation rate determination unit 1705.

伝送,蓄積レート決定部1705では、実際に伝送,蓄積に用いるレートをユーザに問う。レート入力の方法は何でも良く、例えば音声で入力しても良いし、テンキーを用意しておきそれを用いて入力しても良い。あるいは表示可能レートをディスプレイ上に表示し、タッチパネル等を用いてその中から選択する方法を用いても良い。最後に決定レートを出力端子1706に出力する。   The transmission / storage rate determination unit 1705 asks the user about the rate actually used for transmission / storage. Any rate input method may be used. For example, the rate input may be made by voice, or a ten-key may be prepared and used for input. Alternatively, a method may be used in which the displayable rate is displayed on a display, and the display rate is selected using a touch panel or the like. Finally, the determined rate is output to the output terminal 1706.

(TV電話装置の第9の実施例)
図18は、TV電話装置の第9の実施例に係わるブロック図である。
(Ninth embodiment of TV telephone apparatus)
FIG. 18 is a block diagram according to a ninth embodiment of the TV telephone apparatus.

図17と異なるのは、図17の動画像メモリ1704が図18では再構成画像生成部1807となっていることのみで、残りの部分は同じである。再構成画像生成部1807では画像入力端子1808より入力される画像を選択レートに基づき符号化と復号化を行い、再構成画像を生成した後、選択レート画像表示部1803に送る。   The only difference from FIG. 17 is that the moving image memory 1704 in FIG. 17 is replaced with a reconstructed image generation unit 1807 in FIG. 18, and the remaining parts are the same. The reconstructed image generation unit 1807 encodes and decodes the image input from the image input terminal 1808 based on the selection rate, generates a reconstructed image, and sends it to the selection rate image display unit 1803.

画像入力端子1808から入力される画像としては、例えば、TV電話の場合には自局のカメラで撮像した画像が考えられる。   As an image input from the image input terminal 1808, for example, in the case of a TV phone, an image captured by a camera of the own station can be considered.

(TV電話装置の第10の実施例)
図19は、TV電話装置の第10の実施例に係わるブロック図である。
(Tenth embodiment of TV telephone device)
FIG. 19 is a block diagram according to a tenth embodiment of the TV telephone apparatus.

図17の場合には選択レートにおける動画像を表示したが、図19の場合には選択されたレートで使用した時の単位時間当りに必要な通信料金、蓄積系の場合には蓄積可能な時間等の詳細情報を選択レート詳細情報表示部1909で表示する。   In the case of FIG. 17, the moving image at the selected rate is displayed. In the case of FIG. 19, the communication fee required per unit time when used at the selected rate. And the like are displayed on the selected rate detailed information display section 1909.

なお、画像や情報の表示方法としては、1画面上に1つのレートに関するもののみを表示しても良いし、複数のレートに関するものを同時に表示し、レート間の比較を容易にしても良い。   As a method of displaying images and information, only one rate may be displayed on one screen, or a plurality of rates may be displayed at the same time to facilitate comparison between rates.

(TV電話装置の第11の実施例)
図20にTV電話装置の第11の実施例のブロック図を示す。
(Eleventh embodiment of TV telephone apparatus)
FIG. 20 is a block diagram showing an eleventh embodiment of the TV telephone apparatus.

該ブロック図は、単体の装置として機能することも考えられるが、テレビ電話等のような双方向伝送装置の一部として機能することも考えられる。   The block diagram may function as a single device, or may function as a part of a two-way transmission device such as a videophone.

撮像手段2001は、伝送する画像よりも広い範囲をカバーしている。   The imaging unit 2001 covers a wider range than the image to be transmitted.

表示手段2002は、撮像手段2001によって撮像された画像を表示している。表示手段2002は、図21に示すように、表示領域2105に撮像された画像を表示している。表示領域2105の内側には伝送領域2106があり、伝送領域2106内の画像が伝送対象画像となる。伝送領域の縁は撮像者が分かるように線引きされている。   The display unit 2002 displays an image captured by the imaging unit 2001. The display means 2002 displays the captured image in the display area 2105 as shown in FIG. The transmission area 2106 is inside the display area 2105, and the image in the transmission area 2106 is the transmission target image. The edge of the transmission area is delineated so that the photographer can see it.

画像切出し手段2003は、撮像手段2001によって撮像された画像のうち、伝送領域2106に対応する画像のみを切り出す。   The image cutout unit 2003 cuts out only the image corresponding to the transmission area 2106 from the images picked up by the image pickup unit 2001.

符号化手段2004は、画像切り出し手段2003によって切り出された画像を伝送するための符号化を行う。   The encoding unit 2004 performs encoding for transmitting the image clipped by the image clipping unit 2003.

以上のように画像信号が処理されるため、該TV電話装置は伝送領域より広い領域を表示している。このため、撮像者は伝送領域の周囲の状況も確認できるため、カメラワークを容易に行うことができる。   Since the image signal is processed as described above, the TV telephone device displays an area wider than the transmission area. For this reason, the photographer can check the situation around the transmission area, and can easily perform camera work.

上記説明では、TV電話装置において説明したが、これに代えてビデオカメラで撮影した画像を無線で送る場合においても本実施例は効果的となる。   In the above description, the TV telephone device has been described, but the present embodiment is also effective in a case where an image captured by a video camera is transmitted wirelessly.

なお、本発明に係るTV電話装置は以上で述べた実施例及び変形例に限定されるものではなく、その要旨を逸脱しない限りにおいて上記の実施例及び変形例を様々に組み合わせて実施することも含めて、様々に変形可能であることは言うまでもない。   It should be noted that the TV telephone device according to the present invention is not limited to the above-described embodiments and modified examples, and may be implemented in various combinations of the above-described embodiments and modified examples without departing from the gist thereof. Needless to say, various modifications can be made.

TV電話装置の第1の実施例のブロック図である。FIG. 2 is a block diagram of a first embodiment of the TV telephone apparatus. TV電話装置の基本動作を示すフローチャートである。4 is a flowchart showing a basic operation of the TV telephone device. TV電話装置の第1の実施例の変更例1のブロック図である。It is a block diagram of the example 1 of a change of 1st Example of a TV telephone apparatus. TV電話装置の第1の実施例の変更例2のブロック図である。It is a block diagram of the modification 2 of 1st Example of a TV telephone apparatus. TV電話装置の第2の実施例のブロック図である。It is a block diagram of a 2nd Example of a TV telephone apparatus. TV電話装置の第2の実施例の変更例1のブロック図である。It is a block diagram of the example 1 of a change of 2nd Example of a TV telephone apparatus. TV電話装置の第2の実施例の変更例2のブロック図である。It is a block diagram of the example 2 of a change of 2nd Example of a TV telephone apparatus. TV電話装置の第2の実施例の変更例3のブロック図である。It is a block diagram of the modification 3 of 2nd Example of a TV telephone apparatus. TV電話装置の第3の実施例のブロック図である。FIG. 11 is a block diagram of a third embodiment of the TV telephone device. TV電話装置の第3の実施例の変更例1のブロック図である。It is a block diagram of the example 1 of a change of 3rd Example of a TV telephone apparatus. TV電話装置の第3の実施例の変更例2のブロック図である。It is a block diagram of the modification 2 of 3rd Example of a TV telephone apparatus. TV電話装置の第4の実施例のブロック図である。FIG. 13 is a block diagram of a fourth embodiment of the TV telephone device. TV電話装置の第4の実施例の具体例(腕時計形)の斜視図である。It is a perspective view of the example (watch type) of the 4th Example of a TV telephone apparatus. TV電話装置の第5の実施例の斜視図である。It is a perspective view of a 5th example of a TV telephone device. TV電話装置の第6の実施例の斜視図である。FIG. 14 is a perspective view of a sixth embodiment of the TV telephone device. TV電話装置の第7の実施例の斜視図である。It is a perspective view of the 7th Example of a TV telephone device. TV電話装置の第8の実施例のブロック図である。FIG. 16 is a block diagram of an eighth embodiment of the TV telephone device. TV電話装置の第9の実施例のブロック図である。FIG. 16 is a block diagram of a ninth embodiment of a TV telephone device. TV電話装置の第10の実施例のブロック図である。It is a block diagram of the 10th Example of a TV telephone device. TV電話装置の第11の実施例のブロック図である。FIG. 21 is a block diagram of an eleventh embodiment of a TV telephone device. TV電話装置の第11の実施例における表示手段の表示状態を示す図面である。It is a drawing showing the display state of the display means in the eleventh embodiment of the TV telephone apparatus. TV電話装置の追加機能3における画面の構成例であって、TV電話装置における通話相手選択画面の図面である。It is a structural example of the screen in the additional function 3 of a TV telephone device, and is a drawing of the other party selection screen in the TV telephone device. 同じく相手話者アイコンの図面である。It is also a drawing of a partner speaker icon similarly. 同じくダイヤル画面呼出しアイコンの図面である。It is also a drawing of a dial screen call icon.

符号の説明Explanation of reference numerals

101 信号入力部
102 記号化部
103 信号化部
104 信号出力部
105 操作入力部
106 話者情報管理部
107 話者DB部
108 通信部
Reference Signs List 101 signal input unit 102 symbolization unit 103 signal conversion unit 104 signal output unit 105 operation input unit 106 speaker information management unit 107 speaker DB unit 108 communication unit

Claims (1)

画像情報もしくは音声情報の記号化情報を受信する受信手段と、
この受信手段により受信した記号化情報を、文として翻訳不可能な短い単位もしくは文として翻訳可能な単位のどちらか一方の単位毎に、記号化された時の記号化規則とは異なる記号化規則で時間的に逐次変換する変換手段と、
この変換手段により変換された記号化情報を復号化する復号化手段と、
この復号化手段により復号化した復号化情報を出力する出力手段とからなる
ことを特徴とする通信端末装置。
Receiving means for receiving encoded information of image information or audio information;
A symbolization rule different from the symbolization rule at the time of symbolization for each of the short unit that cannot be translated as a sentence and the unit that can be translated as a sentence, by using the symbolic information received by the receiving unit. Conversion means for sequentially converting in time with
Decoding means for decoding the coded information converted by the conversion means;
A communication terminal device comprising: output means for outputting decoded information decoded by the decoding means.
JP2004160279A 2004-05-28 2004-05-28 Communication terminal equipment Pending JP2004350298A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004160279A JP2004350298A (en) 2004-05-28 2004-05-28 Communication terminal equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004160279A JP2004350298A (en) 2004-05-28 2004-05-28 Communication terminal equipment

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP14785494A Division JP3589702B2 (en) 1994-06-29 1994-06-29 Communication terminal device

Publications (1)

Publication Number Publication Date
JP2004350298A true JP2004350298A (en) 2004-12-09

Family

ID=33535793

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004160279A Pending JP2004350298A (en) 2004-05-28 2004-05-28 Communication terminal equipment

Country Status (1)

Country Link
JP (1) JP2004350298A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018082225A (en) * 2016-11-14 2018-05-24 株式会社日立製作所 Audio signal processing system and device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018082225A (en) * 2016-11-14 2018-05-24 株式会社日立製作所 Audio signal processing system and device

Similar Documents

Publication Publication Date Title
KR100630204B1 (en) Device and method for performing multi-tasking in wireless terminal
US20060001737A1 (en) Video conference arrangement
KR20070098732A (en) Communication system, information processing device, information processing method, and program
US20080266378A1 (en) Mobile communication device capable of storing video chatting log and operating method thereof
JPH0983630A (en) Telephone system
KR20070012059A (en) Method for displaying emotion in video telephone mode of wireless terminal
CN108960158A (en) A kind of system and method for intelligent sign language translation
CN1893629B (en) Interactive communication apparatus and status signaling method
KR100575924B1 (en) Method for compositing picture with background scenes of device having camera
US20060035606A1 (en) Method and apparatus for transmitting and outputting data in voice communication
CN100545795C (en) Graphical user interface device, operating input processing method and bi-directional communication device
JP2004356896A (en) Automatic answering machine and automatic answering system using same, and telephone banking system
JP3589702B2 (en) Communication terminal device
JP2002044285A (en) Mobile communication terminal device and portable display terminal device
JP4296976B2 (en) Communication terminal device
JP2004320796A (en) Communication terminal device
CN201114207Y (en) 3D commercial information telephone set
JP2004350298A (en) Communication terminal equipment
JP2004350315A (en) Communication terminal
CN113923471A (en) Interaction method, device, equipment and storage medium
JP2004336805A (en) Communication terminal device
JP3062080U (en) Telephone with screen
KR100584352B1 (en) Video transmission and reception control method of video telephone device
KR20090001627A (en) Public system for interactive contents
US8774867B2 (en) Image display system, terminal device, image display method and program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061219

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070508