WO2005122575A1 - 通信装置 - Google Patents

通信装置 Download PDF

Info

Publication number
WO2005122575A1
WO2005122575A1 PCT/JP2004/008305 JP2004008305W WO2005122575A1 WO 2005122575 A1 WO2005122575 A1 WO 2005122575A1 JP 2004008305 W JP2004008305 W JP 2004008305W WO 2005122575 A1 WO2005122575 A1 WO 2005122575A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
unit
encoded
media data
reception
Prior art date
Application number
PCT/JP2004/008305
Other languages
English (en)
French (fr)
Inventor
Masayuki Baba
Fuminobu Ogawa
Original Assignee
Mitsubishi Denki Kabushiki Kaisha
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Denki Kabushiki Kaisha filed Critical Mitsubishi Denki Kabushiki Kaisha
Priority to JP2006514390A priority Critical patent/JPWO2005122575A1/ja
Priority to PCT/JP2004/008305 priority patent/WO2005122575A1/ja
Publication of WO2005122575A1 publication Critical patent/WO2005122575A1/ja

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Definitions

  • the present invention relates to a communication device for storing transmission / reception media data such as audio data.
  • Akita
  • the present invention has been made to solve the above problems, and has as its object to obtain a communication device that can be realized with a minimum device configuration even when reproducing transmitted / received data.
  • the communication device comprises: a transmission media data before encoding;
  • the stored encoded reception media data is stored in the storage unit, and the data obtained by decoding the stored encoded reception media data and the transmission media data stored in the storage unit are combined, and the playback data is combined. It is output as evening.
  • FIG. 1 is a configuration diagram illustrating a communication device according to a first embodiment of the present invention.
  • FIG. 2 is a configuration diagram illustrating a communication device according to a second embodiment of the present invention.
  • FIG. 3 is a configuration diagram showing a communication device according to Embodiment 3 of the present invention.
  • FIG. 4 is a configuration diagram showing a communication device according to Embodiment 4 of the present invention. ⁇
  • FIG. 5 is an operation explanatory diagram in a case where the next data is output at the first timing of the silent data of the communication device according to the fourth embodiment of the present invention.
  • FIG. 1 is a configuration diagram showing a communication device according to Embodiment 1 of the present invention.
  • the communication device 101a is connected to the communication device 101b via the network 200.
  • the communication devices 101a and 101b are terminals for transmitting and receiving images and sound, such as so-called videophones. Also, in the figure, since the configuration of the communication device 101b is the same as that of the communication device 101a, only the internal configuration of the communication device 101a is shown. It is assumed that the communication device 101b is a communication partner device of the communication device 101a.
  • the communication device 10la includes a video encoding unit 1, an audio encoding unit 2, a transmission unit 3, a reception unit 4, an audio decoding unit 5, a video decoding unit 6, a storage unit 7, and a combining unit 8.
  • the video encoding unit 1 is a functional unit that encodes a video signal from a video input device such as the camera 111.
  • the audio encoding unit 2 is a functional unit that encodes an audio signal from an audio input device such as a microphone 112.
  • An encoding unit is realized by the video encoding unit 1 and the audio encoding unit 2.
  • the transmitting unit 3 is a functional unit for outputting the encoded data from the video encoding unit 1 and the audio encoding unit 2 to the network 200 according to a communication protocol.
  • the receiving unit 4 is a functional unit that receives data addressed to the communication device 101a via the network 200, and has a function of separating video data and audio data.
  • the audio decoding unit 5 is a functional unit for decoding the encoded reception audio data output from the reception unit 4 and outputting the decoded audio data to an audio output device such as the speakers 113.
  • the video decoding unit 6 is a functional unit that decodes the encoded video data from the receiving unit 4 and outputs the decoded video data to a video output device such as the monitor 114. Further, the audio decoding unit 5 and the video decoding unit 6 are configured to decode the encoded reception audio data and the encoded reception video data stored in the storage unit 7.
  • the audio decoding unit 5 and the video decoding unit 6 perform decoding. Department has been realized.
  • the storage unit 7 is a functional unit that stores the encoded reception data from the reception unit 4 and the transmission audio data before encoding from the microphone 112, and is configured to output the stored data as necessary. ing.
  • the synthesizing unit 8 has a function of synthesizing the decoded audio data from the audio decoding unit 5 and the transmitted audio data from the storage unit 7 and outputting the synthesized audio data to an audio output device such as a speaker 113.
  • Each configuration of the video encoding unit 1 to the synthesizing unit 8 is realized by dedicated hardware or software corresponding to each function and hardware such as a CPU and a memory for executing the software.
  • the communication device 101 a and the communication device 101 b are connected to the media data such as voice and video via the network 200. It is assumed that communication using is performed.
  • the video signal from the camera 111 is encoded by the video encoding unit 1 and sent to the transmission unit 3.
  • the audio signal from the microphones 11 and 12 is encoded by the audio encoding unit 2 and sent to the transmitting unit 3 and sent to the storage unit 7 at the same time, and is stored as an unencoded audio signal.
  • the transmitting unit 3 transmits the coded video and audio data in accordance with the communication protocol.
  • video and audio coded data transmitted from the communication device 10 lb via the network 200 is received by the receiver 4 in accordance with the communication protocol, and divided into video data and audio data. And passed to the video decoding unit 6 and the audio decoding unit 5, respectively. At this time, the encoded video and audio data are transferred to the storage unit 7 at the same time, and are stored in the storage unit 7 as encoded data.
  • the video decoder 6 decodes the encoded video data from the receiver 4 and Output to monitor 114 as a video signal.
  • the audio decoding unit 5 decodes the encoded audio data from the receiving unit 4, passes through the synthesizing unit 8, and outputs the audio signal to the speakers 113 as an audio signal.
  • the encoded audio data is output to the audio decoding unit 5 and the encoded video data is output to the video decoding unit 6.
  • the video decoder 6 decodes the coded video data, outputs the video data to the monitor 114 as a video signal, and the monitor 114 reproduces the received video.
  • the audio decoding unit 5 also decodes the encoded audio data and outputs it to the synthesizing unit 8 as an audio signal.
  • the storage unit 7 Since the storage unit 7 has stored the transmission data together with the reception data during the communication, the storage unit 7 simultaneously outputs the audio signal as the transmission data to the synthesizing unit.
  • the synthesizing unit 8 mixes the audio signal from the audio decoding unit 5 and the audio signal from the storage unit 7, outputs the synthesized audio signal to the speakers 113, and reproduces the transmission / reception audio at the speed 113. You.
  • an encoding unit that encodes transmission media data to generate encoded transmission media data
  • a decoding unit that decodes received encoded reception media data
  • a storage unit that stores the media data and the transmission media, a data that is obtained by decoding the encoded reception media data stored in the storage unit by the decoding unit, and a transmission media data that is stored in the storage unit
  • a synthesizing unit for synthesizing and outputting the reproduced data, so that it is possible to obtain a communication device capable of reproducing transmitted / received data with a minimum device configuration. That is, the size of the stored data can be reduced due to the effect of the coding, compared to the case where the transmitted and received voice data is stored as uncoded data. Also, it is possible to reproduce transmitted / received data with one decoding unit. Therefore, such a reproduction can be realized with a minimum device configuration without requiring a separate decoding unit.
  • the storage unit outputs one or both of the stored encoded reception media data—evening data and transmission media data. Therefore, only one of them is played back during playback. It becomes possible. That is, compared to the case where the data is accumulated after mixing as in the related art, only the desired data can be reproduced, so that the convenience can be improved. This allows the user to select various playback methods, such as only sending data, receiving data only, or sending and receiving data simultaneously.
  • Embodiment 1 is directed to simultaneously reproducing separately stored data of transmission and reception, while Embodiment 2 is an embodiment in which one combined data is reproduced.
  • FIG. 2 is a configuration diagram of a communication device according to a second embodiment.
  • the communication device 102a is connected to the communication device 102 via the network 200, and the connection relationship between them is the same as in the first embodiment. Further, also in the second embodiment, since communication device 102a and communication device 102b have the same configuration, only the internal configuration of communication device 102a is shown.
  • the communication device 102a includes a video encoding unit 1, an audio encoding unit 2, a transmitting unit 3, a receiving unit 4, an audio decoding unit 5, a video decoding unit 6, a storage unit 7, and an editing unit 9.
  • a video encoding unit 1 an audio encoding unit 2
  • a transmitting unit 3 a transmitting unit 3
  • a receiving unit 4 an audio decoding unit 5
  • a video decoding unit 6 a storage unit 7, and an editing unit 9.
  • an editing unit 9 since the configuration other than the editing unit 9 is the same as that of the first embodiment, corresponding parts are denoted by the same reference numerals and description thereof will be omitted.
  • the editing unit 9 combines the received voice data obtained by decoding the encoded received voice data stored in the storage unit 7 with the transmitted voice data, and combines the synthesized data. It has a function of performing processing for encoding and storing the encoded data in the storage unit 7 again.
  • Each configuration of the video encoding unit 1 to the editing unit 9 is realized by dedicated hardware or software corresponding to each function and hardware such as a CPU and a memory for executing the software.
  • the operation during communication is the same as that of the first embodiment, and while transmitting and receiving video and audio data, the transmission audio data before encoding and the encoded data of video and audio before decoding are stored in the storage unit. Accumulate at 7.
  • the storage unit 7 transfers the transmission audio data before encoding and the encoded reception audio data before decoding, which are accumulated during the communication, to the editing unit 9.
  • the editing unit 9 decodes the encoded received voice data before decoding. This decoding process may be configured to be performed using the audio decoding unit 5. Next, the editing unit 9 combines the decoded received voice data and the transmitted voice data before encoding stored in the storage unit 7 to generate transmission / reception synthesized voice data. Further, the editing unit 9 encodes the generated transmission / reception synthesized voice data to obtain encoded transmission / reception synthesized voice data. The encoding process may be configured to be instructed by the editing unit 9 using the audio encoding unit 2.
  • the editing unit 9 transfers the encoded transmission / reception synthesized voice data thus obtained to the storage unit 7.
  • the storage unit 7 stores the encoded transmission / reception combined audio data and the video reception encoded data sent from the editing unit 9 together.
  • encoded data of audio and video is sent from the storage unit 7 to the audio decoding unit 5 and the video decoding unit 6, respectively, and the decoding unit decodes the received video and the transmitted / received audio.
  • the storage unit 7 when storing the coded transmission / reception synthesized voice data transmitted from the editing unit 9 and the video reception coded data together, By deleting received voice data and transmitted voice data, only desired stored data can be left. Alternatively, by copying the received video data while retaining the received coded voice and video data, and storing the coded transmitted / received synthesized voice data sent from the editing unit 9 together, only the received video data is stored. Two types of audio and video data and synthesized audio and video data can be generated and played back according to the application.
  • the encoding unit that encodes the transmission media data to be the encoded transmission media data, and decodes the received encoded reception media data.
  • An editing unit that combines the reception media data obtained by decoding the encoded reception media data and the transmission media data, and generates encoded composite data obtained by encoding the combined data.
  • a storage unit for storing the encoded combined data is provided, and the stored encoded combined data is decoded and output as a reproduction data, so that the transmission / reception data can be reproduced with a minimum device configuration.
  • Embodiment 3 is configured to accumulate the encoded transmission voice data output from the encoding unit.
  • FIG. 3 is a configuration diagram of a communication device according to a third embodiment.
  • the communication device 103a is connected to the communication device 103b via the network 200, and the connection relationship between them is the same as in the first and second embodiments. Also, in the third embodiment, the communication device 103a and the communication device 103b are similar. Since it is a configuration, its internal configuration shows only the communication device 103a.
  • the communication device 103a includes a video encoding unit 1, an audio encoding unit 2, a transmitting unit 3, a receiving unit 4, an audio decoding unit 5, a video decoding unit 6, a storage unit 7, and an editing unit 10. .
  • the input to the storage unit 7 is the output data of the video encoding unit 1 and the audio encoding unit 2 and the configuration other than the editing unit 10 is the same as that of the first embodiment, The description of the other components is omitted.
  • the storage unit 7 is configured to receive encoded transmission video data as output data of the video encoding unit 1 and encoded transmission audio data as output data of the audio encoding unit 2, and Unit 7 accumulates these encoded data. Further, the editing unit 10 extracts the coded transmission voice data and the coded reception voice data stored in the storage unit 7 and mixes the voice data obtained by decoding the voice data to generate synthesized voice data. It has a function of outputting the synthesized speech data to the storage unit 7.
  • Each configuration of the video encoding unit 1 to the editing unit 10 is realized by dedicated hardware or software corresponding to each function and hardware such as a CPU and a memory for executing the software. ing.
  • the coded transmission audio data output from the audio encoding unit 2 and the undecoded video and audio output from the receiving unit 4 are output.
  • Storing the coded data in the storage unit 7 After the communication is completed, the storage unit 7 transfers the coded transmission voice data stored during the communication and the coded reception voice data before decoding to the editing unit 10.
  • the editing unit 10 decodes these encoded audio data to obtain decoded received audio data. This decoding process is performed using the audio decoding unit 5. Such a configuration may be adopted. Next, the editing unit 10 combines the decoded received voice data and the transmitted voice data to generate transmitted / received synthesized voice data. More
  • the editing unit 10 encodes the generated transmission / reception synthesized voice data to obtain an encoded transmission / reception synthesized voice data.
  • the encoding process may be performed using the audio encoding unit 2.
  • the editing unit 10 transfers the encoded transmission / reception synthesized speech data obtained in this manner to the storage unit 7.
  • the storage unit 7 stores the encoded transmission / reception synthesized voice data transmitted from the editing unit 10.
  • the same processing as that for audio is performed by the editing unit 10 on the encoded transmission video data stored in the storage unit 7 and the received encoded reception video data.
  • the transmission image and the reception image are simultaneously processed.
  • Synthesized video data to be displayed is generated.
  • encoded transmission / reception combined video data obtained by encoding the combined video data is generated, and this is stored in the storage unit 7.
  • this function can be omitted if no composite video is required.
  • the decoding process is performed such that, for example, the encoded transmission audio data is decoded and then the encoded reception audio data is decoded.
  • the editing can be performed by the editing unit 10.
  • the encoded synthesized data from the editing unit 10 stored in the storage unit 7 is only the audio data, the encoded received video data can be copied and stored together. In this way, the encoded combined data in the same format as the encoded data for transmission and reception is stored in the storage unit 7. To do.
  • the storage unit 7 When the stored data is reproduced, the storage unit 7 outputs any of the coded data of transmission, reception, and synthesis to the audio decoding unit 5 and the video decoding unit 6, and outputs the audio signal and the video signal, respectively. .
  • an encoding unit that encodes transmission media data to generate encoded transmission media data
  • a decoding unit that decodes received encoded reception media data
  • An editing unit that combines the reception media data and the reception media data obtained by decoding the encoded transmission media data with the transmission media data, and generates encoded composite data obtained by encoding the combined data, and outputs from the editing unit.
  • a storage unit for storing the encoded and synthesized data, and decodes the stored encoded and synthesized data and outputs the decoded data as playback data. can do.
  • encoded transmission data and encoded reception data are stored, edited after communication, and transmission / reception combined data is generated. And can generate encoded data for transmission, reception, and synthesis.
  • transmission audio data and reception audio data are stored in a time-division manner.
  • FIG. 4 is a configuration diagram of a communication device according to a fourth embodiment.
  • the communication device 104a is connected to the communication device 104b via the network 200, and the connection relationship between them is the same as in the first to third embodiments. Also, in the fourth embodiment, since the communication device 104a and the communication device 104b have the same configuration, only the communication device 104a is shown as the internal configuration.
  • the communication device 104a includes a video encoding unit 1, an audio encoding unit 2, a transmission unit 3, a reception unit 4, an audio decoding unit 5, a video decoding unit 6, a storage unit 7, and a selection unit 11. .
  • the configuration other than the selection unit 11 is the same as that of the first embodiment, the corresponding parts are denoted by the same reference numerals and description thereof will be omitted.
  • the selection unit 11 selects the coded transmission voice data output from the voice coding unit 2 and the coded reception voice data output from the reception unit 4 based on the voiced / silent state. And a function unit for outputting the selected data to the storage unit 7.
  • Each configuration of the video encoding unit 1 to the selection unit 11 is realized by dedicated hardware or software corresponding to each function and hardware such as a CPU and a memory for executing the software. .
  • the selection unit 11 receives the output of the audio encoding unit 2 (encoded transmission audio data—evening) and the audio output from the receiving unit 4 (encoded reception audio data) as input data, and outputs these data. Sound of the evening. Z silence detection is performed. Then, the silent part of the received voice data is replaced with the voiced part of the transmitted voice data, one piece of voice data is generated, and this is output to the storage unit 7.
  • the selection unit 11 basically selects coded reception data, and when the coded transmission data becomes sound. Then, the coded transmission data is transferred to the storage unit 7 in place of the coded reception data of the silent part.
  • the storage unit 7 stores the encoded audio data selected by the selection unit 11 and the encoded video data from the reception unit 4. In addition, if necessary, A function of directly storing the encoded audio data may be provided. The other operations are the same as those in the third embodiment, and thus description thereof will be omitted.
  • the coded audio data is output from the storage unit 7 to the audio decoding unit 5 and the coded video data is output to the video decoding unit 6, respectively. Perform playback.
  • an encoding unit that encodes transmission media data to generate encoded transmission media data
  • a decoding unit that decodes received encoded reception media data
  • a selection unit that selects one of received media data and encoded transmission media data depending on whether the media data is valid or not
  • a storage unit that stores output data of the selection unit
  • the encoded transmission audio data and the encoded reception audio data are both sound parts in the selection unit 11, not only one of them is selected, but also the encoded audio data that is not selected is temporarily stored.
  • the selected coded voice data becomes silent, the delayed coded voice data may be transferred to the subsequent storage unit 7.
  • the encoded voice data transmitted to the storage unit 7 with a delay from the original timing is stored at the timing transmitted to the storage unit 7. Therefore, during playback, the sound is output with a slight delay compared to the actual sound. However, it is possible to output all of the transmitted and received audio data without adding any sound.
  • the coded transmission voice data and the coded reception voice data are simultaneously voiced, one of them is delayed and stored. It is possible to accumulate all voiced parts of transmitted / received data.
  • the switching may be performed if a silent section exists in the coded data to be switched for a certain period or more. By doing so, for example, it is possible to prevent switching during the conversation included in the audio data.
  • the audio data before switching is switched when there is a silent period for a certain period or more. It is possible to prevent the conversation during data conversion from being interrupted.
  • both the transmitted and received data are voiced, either one of the voice data is delayed, and the voice data is further delayed by a certain amount of silent data for a switching determination. In other words, the relative delay between transmitted and received voices is further increased by the amount of silence data.
  • the selection unit 11 outputs the data output to the storage unit 7 with a delay of a certain period or more.
  • FIG. 5 is an explanatory diagram of the operation when the next data is output at the first timing of the silent data.
  • Selecting unit 1 1 has selected received data from essentially receiver 4, and outputs the reception data a predetermined period T, the storage unit 7 delayed by greater than the delay time T 2.
  • the transmission data from the voice encoding unit 2 has sound at time ti
  • the reception data is sound at time ti
  • the selection unit 11 temporarily stores the transmission data.
  • the reception data is output with a delay by the delay time T 2
  • Isseki received de delayed (output data selection selecting section 1 1) is the time t 3 after for a silent portion, immediately outputs the transmission data at time t 3. That is, when such processing is not performed, there is a silence period of 1 for a fixed period between the reception data and the transmission data, but the transmission is immediately performed at the first timing of the sound data. By outputting the data, the delay of the transmission data after switching can be reduced.
  • the selection unit outputs the data to be selected with a delay for a time equal to or longer than a predetermined period for performing the switching determination, and when switching the data to be selected, When the data to be selected next is already delayed for a certain period or more, the data is output immediately, so that the silent part at the switching point can be eliminated, and the relative Delay can be reduced.
  • the determination as to whether or not the media data is valid is made based on the presence or absence of sound in the audio data.
  • the present invention is not limited to this. Any type may be selected depending on the type of the night, etc.
  • the transmitted / received media data to be reproduced is audio data or video data, but is not limited to these data. No, it is applicable to various data. Industrial applicability
  • the communication device is applied to, for example, a videophone, and is suitable for reproducing video data and audio data after communication.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

送信音声データは音声符号化部2で符号化され、送信部3によって送信される。受信された符号化音声データは音声復号部5によって復号される。蓄積部7は、音声符号化部2で符号化される前の送信音声データと、受信部4で受信された符号化受信音声データを蓄積する。送受音声データを再生する場合、蓄積部7に蓄積された符号化受信音声データを音声復号部5で復号する。合成部8は、音声復号部5から出力された受信音声データと、蓄積部7に蓄積されている送信音声データとを合成し、再生データとして出力する。

Description

通信装置
技術分野
本発明は、 例えば音声データ等の送受信メァィ ァデータを蓄積する通 信装置に関する。 明 田
背景技術
従来、 無線電話機といった通信装置では、 たとえば特開平 1 0— 2 7
1 0 6 1号公報等に示されるよ に、 符号化前の送信データと復号後の 受信データをミキシングすることによって、 非符号化デ一夕の形式で送 受の音声を合成音声として蓄積していた。
また、 従来の通信装置として 、 符号化したつ 夕を蓄積するようにし たものがあるが、 これは受信した符号化デー夕のみを蓄積するだけであ つ 。
従来の通信装置は以上のように構成されているため、 送受信の音声を 符号化データとして蓄積し、 これらの送受信首尸を再生しょう とした場 合、 例えば、 送信デ一夕用の符号化器と蓄積用の符号化器の二つが必要 になる等、 装置構成が大きくなるという問題点があつた。
この発明は上記のような課題を解決するためになされたもので、 送受 信データを再生する場合でも、 最小限の装置構成で実現することのでき る通信装置を得ることを目的とする。
発明の開示
この発明に係る通信装置は、 符号化前の送信メディ アデータと、 受信 した符号化受信メディアデ一夕とを蓄積部で蓄積し、 この蓄積された符 号化受信メディアデ一夕を復号したデータと、 蓄積部で蓄積された送信 メディアデータを合成し、 再生デ一夕として出力するようにしたもので ある。
このことによって、 送受信データを再生する場合でも、 符号化部ゃ復 号部およびデータ蓄積部といった装置構成を最小限の数で実現すること ができる効果がある。 図面の簡単な説明
第 1図はこの発明の実施の形態 1による通信装置を示す構成図である 第 2図はこの発明の実施の形態 2における通信装置を示す構成図であ る。
第 3図はこの発明の実施の形態 3における通信装置を示す構成図であ る。
第 4図はこの発明の実施の形態 4における通信装置を示す構成図であ る。 ·
第 5図は、 この発明の実施の形態 4における通信装置の無音データの 最初のタイミングで次のデ一夕を出力するようにした場合の動作説明図 である。 発明を実施するための最良の形態
以下、 この発明をより詳細に説明するために、 この発明を実施するた めの最良の形態について、 添付の図面に従って説明する。
実施の形態 1 .
第 1図は、 この発明の実施の形態 1 による通信装置を示す構成図であ る。
通信装置 1 0 1 aは網 2 0 0 を介して通信装置 1 0 1 b と接続されて いる。 通信装置 1 0 1 a, 1 0 1 bは、 いわゆるテレビ電話といった画 像と音声を送受信する端末である。 また、 図中、 通信装置 1 0 1 bの構 成は、 通信装置 1 0 1 aと同様であるため、 通信装置 1 0 1 aの内部構 成のみを示している。 尚、 通信装置 1 0 1 bは、 通信装置 1 0 1 aの通 信相手装置であるとする。
通信装置 1 0 l aは、 ビデオ符号化部 1、 音声符号化部 2、 送信部 3 、 受信部 4、 音声復号部 5、 ビデオ復号部 6、 蓄積部 7、 合成部 8 を備 えている。
ビデオ符号化部 1 は、 カメラ 1 1 1などの映像入力装置からのビデオ 信号の符号化を行う機能部である。 音声符号化部 2は、 マイク 1 1 2な どの音声入力装置からの音声信号の符号化を行う機能部である。 また、 これらビデオ符号化部 1および音声符号化部 2 により、 符号化部が実現 されている。 送信部 3は、 ビデオ符号化部 1および音声符号化部 2から の符号化データを通信プロ 卜コルに則り、 網 2 0 0に出力するための機 能部である。
受信部 4は、 網 2 0 0 を介して通信装置 1 0 1 a宛のデータを受信す る機能部であり、 ビデオデータと音声データに分離する機能を有してい る。 音声復号部 5は、 受信部 4から出力された符号化受信音声データを 復号し、 スピーカ 1 1 3などの音声出力装置に出力するための機能部で ある。 ビデオ復号部 6は、 受信部 4からの符号化ビデオデータを復号し 、 モニタ 1 1 4などの映像出力装置に出力する機能部である。 また、 こ れら音声復号部 5およびビデオ復号部 6は、 蓄積部 7 に蓄積された符号 化受信音声デ一夕や符号化受信ビデオデータを復号するよう構成されて いる。 そして、 これら音声復号部 5およびビデオ復号部 6 により、 復号 部が実現されている。
蓄積部 7は、 受信部 4からの符号化受信デ一夕やマイク 1 1 2からの 符号化前の送信音声データを蓄積する機能部であり、 必要に応じて蓄積 データを出力するよう構成されている。 合成部 8は、 音声復号部 5から の復号音声データと蓄積部 7からの送信音声データとを合成し、 スピー 力 1 1 3等の音声出力装置に出力する機能を有している。
尚、 上記のビデオ符号化部 1〜合成部 8の各構成は、 専用のハー ドウ エアあるいはそれぞれの機能に対応したソフ トウェアとこれを実行する C P Uやメモリ等のハー ドウェアによって実現されている。
次に、 このように構成された通信装置の動作について説明する。
先ず、 通信装置 1 0 l a , 1 0 l bの通信中の動作について説明する 今、 通信装置 1 0 1 a と通信装置 1 0 1 bとは網 2 0 0 を介して音声 やビデオなどのメディアデータを用いた通信を行っているとする。
カメラ 1 1 1からのビデオ信号は、 ビデオ符号化部 1で符号化され送 信部 3 に送られる。 マイク 1 1 2からの音声信号は音声符号化部 2で符 号化され送信部 3 に送られると同時に蓄積部 7に送られ、 符号化されな い音声信号のまま蓄積される。
送信部 3では、 ビデオと音声の符号化データを通信プロ トコルに則り 送信する。
一方、 通信装置 1 0 l bから網 2 0 0を介して送信されたビデオと音 声の符号化データは、 通信プロ トコルに則り受信部 4で受信され、 ビデ ォデ一夕と音声データに分けられ、 それぞれビデオ復号部 6および音声 復号部 5 に渡される。 このとき、 符号化されたビデオ、 音声データは同 時に蓄積部 7 に渡され、 蓄積部 7で符号化データとして蓄積される。
ビデオ復号部 6では受信部 4からの符号化ビデオデ一夕を復号し、 ビ デォ信号としてモニタ 1 1 4に出力する。 同様に、 音声復号部 5では受 信部 4からの符号化音声デ一夕を復号し、 合成部 8を通過して音声信号 としてスピーカ 1 1 3に出力される。
以上は、 通信中の動作であるが、 次に通信中に蓄積したデータを非通 信中に再生する場合の動作について説明する。
蓄積部 7において、 受信部 4からの出力を蓄積した符号化データは、 その符号化音声デ一夕が音声復号部 5へ、 符号化ビデオデータがビデオ 復号部 6へ出力される。 ビデオ復号部 6では符号化ビデオデータを復号 し、 モニタ 1 1 4にビデオ信号として出力し、 モニタ 1 1 4において受 信したビデオが再生される。 一方、 音声復号部 5でも符号化音声データ を復号し、 音声信号として合成部 8に出力する。
蓄積部 7では、 通信中に受信データと共に送信データも蓄積していた ので、 その送信データである音声信号を同時に合成部に出力する。 合成 部 8では、 音声復号部 5からの音声信号と蓄積部 7からの音声信号のミ キシングを行い、 合成音声信号としてスピーカ 1 1 3に出力し、 スピー 力 1 1 3において送受信音声が再生される。
以上のように、 実施の形態 1 によれば、 送信メディアデータを符号化 して符号化送信メディアデータとする符号化部と、 受信した符号化受信 メディアデータを復号する復号部と、 符号化受信メディアデ一夕と送信 メディアデ一夕を蓄積する蓄積部と、 蓄積部で蓄積された符号化受信メ ディアデ一夕を復号部で復号したデータと、 蓄積部で蓄積された送信メ ディアデ一夕を合成し、 再生データとして出力する合成部とを備えたの で、 最小限の装置構成で送受信データを再生することのできる通信装置 を得ることができる。 即ち、 送受音声データを非符号化デ一夕として蓄 積する場合より、 符号化の効果により蓄積データサイズを小さくするこ とができる。 また、 一つの復号部で送受信データの再生が可能であるた め、 別途に復号部を必要とせず、 最小限の装置構成でこのような再生を 実現することができる。
また、 実施の形態 1では、 蓄積部は、 蓄積した符号化受信メディアデ —夕または送信メディアデータのうち、 いずれか一方または両方を出力 するようにしたので、 再生時にどちらか片方のみを再生することが可能 となる。 即ち、 従来のようにミキシングを行った後に蓄積する場合に比 ベて、 所望のデ一夕のみを再生することができるため、 利便性を向上さ せることができる。 これにより、 利用者は、 送信デ一夕のみ、 または受 信デ一夕のみ、 あるいは送受信データを同時といったように、 様々な再 生方法を選択することができる。 実施の形態 2 .
実施の形態 1は、 送受別々の蓄積データを同時に再生するようにした ものであるが、 実施の形態 2では、 一つの合成したデータを再生するよ うにした場合の実施形態である。
第 2図は、 実施の形態 2の通信装置の構成図である。
通信装置 1 0 2 aは網 2 0 0を介して通信装置 1 0 2 と接続されて おり、 これらの接続関係は、 実施の形態 1 と同様である。 また、 実施の 形態 2においても、 通信装置 1 0 2 aと通信装置 1 0 2 bは同様の構成 であるため、 その内部構成は通信装置 1 0 2 aのみ示している。
通信装置 1 0 2 aは、 ビデオ符号化部 1、 音声符号化部 2、 送信部 3 、 受信部 4、 音声復号部 5、 ビデオ復号部 6、 蓄積部 7、 編集部 9を備 えている。 ここで編集部 9以外の構成は、 実施の形態 1 と同様であるた め、 対応する部分に同一符号を付してその説明は省略する。
編集部 9は、 蓄積部 7で蓄積された符号化受信音声データを復号した 受信音声データと、 送信音声データとを合成し、 この合成したデータを 符号化して、 再度、 蓄積部 7に蓄積させるよう処理を行う機能を有して いる。
尚、 上記のビデオ符号化部 1〜編集部 9の各構成は、 専用のハー ドウ エアあるいはそれぞれの機能に対応したソフ トウェアとこれを実行する C P Uやメモリ等のハードウエアによって実現されている。
次に、 実施の形態 2の動作について説明する。
通信中の動作については、 実施の形態 1 と同様であり、 ビデオと音声 のデータの送受信を行いながら、 符号化前の送信音声データと復号前の ビデオと音声の符号化デ一夕を蓄積部 7で蓄積する。
通信終了後、 蓄積部 7は通信中に蓄積した符号化前の送信音声データ と復号前の符号化受信音声データを編集部 9 に転送する。
編集部 9では、 復号前の符号化受信音声データの復号を行う。 尚、 こ の復号処理は音声復号部 5 を用いて行うよう構成してもよい。 次に、 編 集部 9 は、 復号された受信音声データと蓄積部 7 に蓄積されている符号 化前の送信音声データを合成して、 送受合成音声データを生成する。 更 に、 編集部 9は、 生成した送受合成音声データを符号化し、 符号化送受 合成音声デ一タを得る。 尚、 この符号化処理は音声符号化部 2 を用いて 編集部 9が指示するよう構成してもよい。
編集部 9は、 このようにして得た符号化送受合成音声データを蓄積部 7 に転送する。 蓄積部 7では、 編集部 9から送られてきた符号化送受合 成音声データとビデオの受信符号化データを合わせて蓄積する。 再生時 は、 蓄積部 7から音声とビデオの符号化データをそれぞれ音声復号部 5 とビデオ復号部 6 に送出し、 これら復号部によって受信ビデオの復号と 送受信音声の復号が行われる。
また、 蓄積部 7では、 編集部 9から送られてきた符号化送受合成音声 デ一夕とビデオの受信符号化デ一夕とを合わせて蓄積する際に、 合成前 の受信音声データおよび送信音声データを削除することで、 所望の蓄積 データのみを残すことができる。 または、 受信した符号化音声 , ビデオ データを残したまま、 受信ビデオデ一夕をコピーし、 それに編集部 9か ら送られてきた符号化送受合成音声データを合わせて蓄積することで、 受信のみの音声 · ビデオデータと、 合成音声 · ビデオデータの 2種類が 生成でき、 用途に応じて再生することも可能となる。
以上のように、 実施の形態 2 によれば、 送信メディ アデ一夕を符号化 して符号化送信メディ アデ一夕とする符号化部と、 受信した符号化受信 メディ アデ一夕を復号する復号部と、 符号化受信メディ アデータを復号 した受信メディ アデータと、 送信メディアデータとを合成し、 合成した デ一夕を符号化した符号化合成データを生成する編集部と、 編集部から 出力された符号化合成データを蓄積する蓄積部とを備え、 蓄積した符号 化合成データを復号し再生デ一夕として出力するようにしたので、 最小 限の装置構成で送受信データを再生することができる。
また、 実施の形態 2では、 通信後に仮に蓄積したデータを編集して、 送受合成データを生成しているので、 通信中には合成処理のための負荷 がかかることがない。 このため、 符号化部や復号部は通信時に必要な数 量でこのような送受信データの再生を実現することができる。 実施の形態 3 .
実施の形態 3 は、 符号化部から出力された符号化送信音声デ一夕を蓄 積するようにしたものである。
第 3図は、 実施の形態 3の通信装置の構成図である。
通信装置 1 0 3 aは網 2 0 0 を介して通信装置 1 0 3 bと接続されて おり、 これらの接続関係は、 実施の形態 1 、 2 と同様である。 また、 実 施の形態 3 においても、 通信装置 1 0 3 a と通信装置 1 0 3 bは同様の 構成であるため、 その内部構成は通信装置 1 0 3 aのみ示している。 通信装置 1 0 3 aは、 ビデオ符号化部 1 、 音声符号化部 2、 送信部 3 、 受信部 4、 音声復号部 5、 ビデオ復号部 6、 蓄積部 7、 編集部 1 0 を 備えている。 ここで、 蓄積部 7 に入力されるのが、 ビデオ符号化部 1お よび音声符号化部 2の出力データである点と、 編集部 1 0以外の構成は 実施の形態 1 と同様であるため、 これら以外の構成に対する説明は省略 する。
蓄積部 7 には、 ビデオ符号化部 1 の出力データである符号化送信ビデ ォデータと、 音声符号化部 2の出力データである符号化送信音声データ とが入力されるよう構成されており、 蓄積部 7は、 これらの符号化デー 夕を蓄積する。 また、 編集部 1 0は、 蓄積部 7 に蓄積されている符号化 送信音声データと符号化受信音声データとを取り出し、 これら音声デー 夕を復号した音声データをミキシングして合成音声データを生成し、 こ の合成音声デ一夕を蓄積部 7 に出力する機能を有している。
尚、 上記のビデオ符号化部 1〜編集部 1 0の各構成は、 専用の八ー ド ウェアあるいはそれぞれの機能に対応したソフ トウエアとこれを実行す る C P Uやメモリ等のハー ドウェアによって実現されている。
次に、 実施の形態 3の動作について説明する。
通信中の動作については、 ビデオと音声のデータの送受信を行いなが ら、 音声符号化部 2の出力である符号化送信音声データと、 受信部 4の 出力である復号前のビデオと音声の符号化データを蓄積部 7で蓄積する 通信終了後、 蓄積部 7は通信中に蓄積した符号化送信音声データと復 号前の符号化受信音声データを編集部 1 0 に転送する。
編集部 1 0では、 これら符号化音声データの復号を行い、 復号された 受信音声データを得る。 尚、 この復号処理は音声復号部 5 を用いて行う よう構成してもよい。 次に、 編集部 1 0は、 復号された受信音声データ と送信音声データとを合成して、 送受合成音声データを生成する。 更に
、 編集部 1 0は、 生成した送受合成音声データを符号化し、 符号化送受 合成音声デ一夕を得る。 尚、 この符号化処理は音声符号化部 2を用いて 行うよう構成してもよい。
編集部 1 0は、 このようにして得た符号化送受合成音声デ一夕を蓄積 部 7に転送する。 蓄積部 7では、 編集部 1 0から送られてきた符号化送 受合成音声データを蓄積する。
また、 蓄積部 7に蓄積されている符号化送信ビデオデータと受信され た符号化受信ビデオデータについても、 編集部 1 0によって音声と同様 の処理が行われ、 例えば送信画像と受信画像とを同時に表示するような 合成ビデオデータが生成される。 そして、 この合成ビデオデータを符号 化した符号化送受合成ビデオデータが生成され、 これが蓄積部 7で蓄積 される。 但し、 特に合成ビデオを必要としない場合は、 この機能を省く ことができる。
尚、 編集部 1 0で行うこれら一連の処理はリアルタイムで行う必要が ないため、 例えば、 符号化送信音声データの復号を行った後に符号化受 信音声データの復号を行う、 といったように復号処理を順番に行うこと で、 装置としての必要な機能数を最小限に抑えることができる。
また、 本実施の形態では、 音声とビデオデータのみを扱っているが、 他の様々なメディアデータに関しても合成等の処理を行う必要があれば
、 編集部 1 0によって行うことができる。
尚、 蓄積部 7が蓄積する編集部 1 0からの符号化合成データが音声デ 一夕のみであれば、 符号化受信ビデオデータをコピーしそれと合わせて 蓄積することも可能である。 このようにして、 送受信用の符号化データ と同様のフォーマツ 卜の符号化合成データを蓄積部 7で保存することと する。
また、 蓄積データの再生時、 蓄積部 7では送信、 受信、 合成のいずれ かの符号化データを音声復号部 5およびビデオ復号部 6 に対して出力し 、 それぞれ音声信号、 ビデオ信号が出力される。
以上のように実施の形態 3 によれば、 送信メディ アデータを符号化し て符号化送信メディ アデータとする符号化部と、 受信した符号化受信メ ディ アデ一夕を復号する復号部と、 符号化受信メディ アデータと、 符号 化送信メディ アデータとを復号した受信メディ アデータと送信メディ ア データとを合成し、 合成したデータを符号化した符号化合成データを生 成する編集部と、 編集部から出力された符号化合成データを蓄積する蓄 積部とを備え、 蓄積した符号化合成デ一タを復号し再生データとして出 力するようにしたので、 最小限の装置構成で送受信デ一夕を再生するこ とができる。
また、 実施の形態 3では、 符号化送信データ、 符号化受信データを蓄 積し、 それらを通信後に編集を行い、 送受合成データを生成しているの で、 通信中に合成処理のための負荷がかからず、 送信、 受信、 合成の符 号化データを生成することができる。 実施の形態 4 .
実施の形態 4は、 時分割に送信音声データと受信音声データとを蓄積 するようにしたものである。
第 4図は、 実施の形態 4の通信装置の構成図である。
通信装置 1 0 4 aは網 2 0 0 を介して通信装置 1 0 4 bと接続されて おり、 これらの接続関係は、 実施の形態 1〜 3 と同様である。 また、 実 施の形態 4においても、 通信装置 1 0 4 a と通信装置 1 0 4 bは同様の 構成であるため、 その内部構成は通信装置 1 0 4 aのみ示している。 通信装置 1 0 4 aは、 ビデオ符号化部 1、 音声符号化部 2、 送信部 3 、 受信部 4、 音声復号部 5、 ビデオ復号部 6、 蓄積部 7、 選択部 1 1 を 備えている。 ここで、 選択部 1 1以外の構成は、 実施の形態 1 と同様で あるため、 対応する部分に同一符号を付してその説明は省略する。 選択 部 1 1は、 音声符号化部 2からの出力である符号化送信音声デ一夕と、 受信部 4からの出力である符号化受信音声データとをその有音 無音状 態に基づいて選択し、 その選択データを蓄積部 7に出力する機能部であ る。
尚、 上記のビデオ符号化部 1〜選択部 1 1の各構成は、 専用のハード ウェアあるいはそれぞれの機能に対応したソフ トウェアとこれを実行す る C P Uやメモリ等のハードウェアによって実現されている。
次に、 実施の形態 4の動作について説明する。
通信中では、 選択部 1 1は音声符号化部 2の出力 (符号化送信音声デ —夕) 、 および受信部 4からの音声出力 (符号化受信音声データ) を入 カデ一夕として、 それらデ一夕.の有音 Z無音検出を行う。 そして、 受信 音声データの無音部分を送信音声データの有音部分と入れ替えて、 一つ 分の音声データを生成し、 これを蓄積部 7に出力する。
一般に通話中でも音声の無音区間はかなりあるため、 送信と受信の有 音部分の符号化データを集めて切り貼りし、 片方向分の音声符号化デー 夕よりデータ量を小さくすることは可能である。 但し、 通常蓄積するよ うな一方向分のデ一夕量と同じにするために、 選択部 1 1では、 基本的 に符号化受信データを選択し、 符号化送信データが有音になった場合に のみ無音部分の符号化受信データに代えて符号化送信データを蓄積部 7 に転送する。
蓄積部 7では、 選択部 1 1で選択された符号化音声データと受信部 4 からの符号化ビデオデ一夕とを蓄積する。 尚、 必要に応じて受信部 4か らの符号化音声データを直接蓄積する機能を設けても良い。 他の動作は 実施の形態 3 と同様であるためその説明は省略する。
蓄積したデータを再生するときは蓄積部 7から符号化音声データを音 声復号部 5 へ、 符号化ビデオデータをビデオ復号部 6へそれぞれ出力し 、 音声の送受データの再生と受信ビデオデ一夕の再生を行う。
以上のように、 実施の形態 4では、 送信メディアデータを符号化して 符号化送信メディアデ一夕とする符号化部と、 受信した符号化受信メデ ィアデ一夕を復号する復号部と、 符号化受信メディアデータと、 符号化 送信メディアデータを、 これらメディアデータが有効デ一夕か否かによ つていずれか一方を選択する選択部と、 選択部の出力データを蓄積する 蓄積部とを備え、 蓄積したデータを復号部で復号し再生データとして出 力するようにしたので、 最小限の装置構成で送受信データを再生するこ とができると共に、 片方向分のデータ量で両方の音声データの有効な部 分のみを蓄積できる効果がある。
また、 選択部 1 1 において、 符号化送信音声データと符号化受信音声 データが共に有音部分であった場合、 どちらかを選択するだけでなく、 選択されなかった方の符号化音声データを一時的に遅延させ、 選択され た方の符号化音声データが無音になった時に、 その遅延させた符号化音 声データを後続の蓄積部 7に転送するようにしても良い。
このように構成すれば、 本来のタイミングより遅延して蓄積部 7へ送 られた符号化音声デ一夕は、 蓄積部 7に送られたタイミングで蓄積され る。 そのため、 再生時、 実際よりわずかに遅延して音声が出力されるこ とになるが、 送受音声データの有音部分がかけることなく全て出力可能 となる。
以上のように、 実施の形態 4では、 符号化送信音声データと符号化受 信音声デ一夕が同時に有音となった場合にどちらかを遅延させて蓄積す るようにしているので、 送受データの有音部分全て.を蓄積することがで さる。
更に、 選択部 1 1において、 符号化送信音声データと符号化受信音声 データを切り替える際に、 被切替対象の符号化データに無音区間が一定 期間以上存在したら切り替えるようにしてもよい。 こうすることで、 例 えば音声データに含まれる会話の途中で切り替わることを防ぐことがで さる。
以上のように、 実施の形態 4では、 送信音声符号化データと受信音声 符号化データを切り替える際に、 切り替える前の音声データに一定期間 以上の無音区間が存在した時に切り替えるようにしたので、 符号化音声 デ一タ中の会話が途中で途切れないようにすることができる。
ところで、 切替の判定のために一定期間以上の無音が存在した後に切 替を行うと、 必ず切替ポイントで一定期間以上の無音が存在する。 もし 、 送受データ共に有音の場合、 どちらか一方の音声データは遅延させら れており、 更に切替判定のための一定期間以上の無音データ分だけ更に 遅延することになる。 つまり、 送受音声間での相対遅延は無音データ分 だけ更に大きくなる。
そこで、 一定期間以上の無音データを検出したら、 その無音データの 最初のタイミングで切り替えられるようにすれば、 切替後のデータの遅 延が減少する。 そのために、 選択部 1 1では蓄積部 7に出力するデータ に一定期間以上の遅延をかけて出力する。 そして一定期間以上の無音デ —夕を検出した時、 つまり切替タイミングで、 次に出力すべきデータが 既に一定期間以上待たされている場合、 そのデータを即座に出力すれば 、 切替検出のための無音データは蓄積部 7に出力されずにすむ。
第 5図は、 無音デ一夕の最初のタイミングで次のデ一夕を出力するよ うにした場合の動作説明図である。 選択部 1 1は、 基本的に受信部 4からの受信データを選択しており、 この受信データを一定期間 T , より大きい遅延時間 T 2 だけ遅延させて 蓄積部 7に出力する。 今、 時刻 t i で音声符号化部 2から送信データが 有音となったとすると、 時刻 t iでは受信データが有音であるため、 選 択部 1 1は送信データを一時的に蓄積する。 そして、 受信データは遅延 時間 T 2 だけ遅延して出力されるため、 その終端 (時刻 t 2 ) は、 時刻 t 3 ( = t 2 + T 2 ) に出力される。 ここで、 遅延した受信デ一夕 (選 択部 1 1 の出力データ) は時刻 t 3以降は無音部分となるため、 時刻 t 3 において即座に送信データを出力する。 即ち、 このような処理を行わ ない場合は'、 受信データと送信データとの間には一定期間 1 の無音時 間が存在することになるが、 有音データの最初のタイミングで即座に送 信データを出力することによって、 切替後の送信データの遅延を減少さ せることができる。
以上のように、 実施の形態 4によれば、 選択部は、 切り替え判定を行 うための一定期間以上の時間分、 選択するデータに遅延をかけて出力し 、 選択するデータを切り替える際に、 次に選択すべきデータが既に一定 期間以上遅延している場合に、 そのデ一夕を即座に出力するようにした ので、 切替ポイントにおける無音部分をなくすことができ、 従って、 送 受音声の相対的な遅延を小さくすることができる。
尚、 上記実施の形態 4において、 メディアデ一夕が有効か否かの判定 を音声デ一夕の有音か無音かで行うようにしたが、 これに限定されるも のではなく、 メディアデ一夕の種類等によって、 任意に選択してもよい また、 上記各実施の形態では、 再生する送受信メディアデータとして 、 音声データやビデオデータであるとしたが、 これらのデータに限定さ れるものではなく、 種々のデータに適用可能である。 産業上の利用可能性
以上のように、 この発明に係る通信装置は、 例えばテレビ電話に適用 され、 通信後のビデオデータや音声デ一夕を再生するのに適している。

Claims

1 . 送信メディ アデータを符号化して符号化送信メディアデータとす る符号化部と、
受信した符号化受信メディ アデ一夕を復号する復号部と、
前記符号化受信メディ ア請デ一夕と前記送信メディ アデ一夕を蓄積する 蓄積部と、
前記蓄積部で蓄積された符号化受の信メディアデ一夕を前記復号部で復 号したデータと、 前記蓄積部で蓄積された送信メディ アデ一夕を合成し 、 再生データとして出力する合成部とを備えた通信装置。
2 . 蓄積部は、 蓄積した符号化受信メディアデータまたは送信メディ アデ一夕のうち、 いずれか一方または両方を出力することを特徴とする 請求の範囲第 1項記載の通信装置。
3 . 送信メディ アデ一夕を符号化して符号化送信メディ ァデータとす る符号化部と、
受信した符号化受信メディアデ一夕を復号する復号部と、
前記符号化受信メディアデータを復号した受信メディアデータと、 前 記送信メディ アデータとを合成し、 当該合成したデータを符号化した符 号化合成データを生成する編集部と、
前記編集部から出力された符号化合成データを蓄積する蓄積部とを備 え、 当該蓄積した符号化合成データを前記復号部で復号し再生データと して出力するようにした通信装置。
4 送信メディアデ一夕を符号化して符号化送信メディアデータとす る符号化部と、
受信した符号化受信メディ アデ一夕を復号する復号部と、
前記符号化受信メディアデータと、 前記符号化送信メディアデータと を復号した受信メディ アデータと送信メディ アデータとを合成し、 当該 合成したデータを符号化した符号化合成データを生成する編集部と、 前記編集部から出力された符号化合成データを蓄積する蓄積部とを備 え、 当該蓄積した符号化合成データを前記復号部で復号し再生データと して出力するようにした通信装置。
5 . 送信メディ アデータを符号化して符号化送信メディアデ一夕とす る符号化部と、
受信した符号化受信メディ アデ一夕を復号する復号部と、
前記符号化受信メディアデ一夕と、 前記符号化送信メディ アデータを
、 これらメディ アデータが有効データか否かによっていずれか一方を選 択する選択部と、
前記選択部の出力データを蓄積する蓄積部とを備え、 当該蓄積したデ —夕を前記復号部で復号し再生データとして出力するようにした通信装 置。
6 . 選択部は、 符号化受信メディアデ一夕と符号化送信メディ アデー 夕の両方が有効デ一夕であった場合、 いずれか一方のデータを出力する タイミ ングを遅らせることを特徴とする請求の範囲第 5項記載の通信装 置。
7 . 選択部は、 符号化受信メディ アデ一夕と符号化送信メディ アデー 夕とを切り替える場合、 切り替える前のデータの状態が有効データでは ない時間が一定期間以上存在した場合に行うことを特徴とする請求の範 囲第 5項記載の通信装置。
8 . 選択部は、 切り替え判定を行うための一定期間以上の時間分、 選 択するデータに遅延をかけて出力し、 選択するデータを切り替える際に 、 次に選択すべきデ一夕が既に一定期間以上遅延している場合に、 その データを即座に出力することを特徴とする請求の範囲第 7項記載の通信 装置。
PCT/JP2004/008305 2004-06-08 2004-06-08 通信装置 WO2005122575A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006514390A JPWO2005122575A1 (ja) 2004-06-08 2004-06-08 通信装置
PCT/JP2004/008305 WO2005122575A1 (ja) 2004-06-08 2004-06-08 通信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2004/008305 WO2005122575A1 (ja) 2004-06-08 2004-06-08 通信装置

Publications (1)

Publication Number Publication Date
WO2005122575A1 true WO2005122575A1 (ja) 2005-12-22

Family

ID=35503512

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2004/008305 WO2005122575A1 (ja) 2004-06-08 2004-06-08 通信装置

Country Status (2)

Country Link
JP (1) JPWO2005122575A1 (ja)
WO (1) WO2005122575A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63250251A (ja) * 1987-04-06 1988-10-18 Matsushita Electric Ind Co Ltd 電話用デイジタル録音、再生装置
JPS6481460A (en) * 1987-09-22 1989-03-27 Nec Corp Telephone set
JPH04132482A (ja) * 1990-09-25 1992-05-06 Sharp Corp テレビ電話装置
JPH10271061A (ja) * 1997-03-25 1998-10-09 Mitsubishi Electric Corp デジタル式無線電話機
JP2003348222A (ja) * 2002-05-24 2003-12-05 Mitsubishi Electric Corp テレビ電話機能付き携帯電話機

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63250251A (ja) * 1987-04-06 1988-10-18 Matsushita Electric Ind Co Ltd 電話用デイジタル録音、再生装置
JPS6481460A (en) * 1987-09-22 1989-03-27 Nec Corp Telephone set
JPH04132482A (ja) * 1990-09-25 1992-05-06 Sharp Corp テレビ電話装置
JPH10271061A (ja) * 1997-03-25 1998-10-09 Mitsubishi Electric Corp デジタル式無線電話機
JP2003348222A (ja) * 2002-05-24 2003-12-05 Mitsubishi Electric Corp テレビ電話機能付き携帯電話機

Also Published As

Publication number Publication date
JPWO2005122575A1 (ja) 2008-04-10

Similar Documents

Publication Publication Date Title
JP5026167B2 (ja) ストリーム伝送サーバおよびストリーム伝送システム
JP2012151555A (ja) テレビ会議システム、テレビ会議中継装置、テレビ会議中継方法および中継プログラム
JP3500667B2 (ja) テレビ会議システムおよび同期方法
JP3014366B2 (ja) インターネット電話通信方法及び装置、及びそのプログラムを記録した記録媒体
JP5447034B2 (ja) 遠隔会議装置及び遠隔会議方法
JP5086366B2 (ja) 会議端末装置、中継装置、および会議システム
WO2005122575A1 (ja) 通信装置
JP2005157045A (ja) 音声伝送方法
JP2007020095A (ja) 情報合成装置、情報合成システム、情報同期方法およびプログラム
JP4551555B2 (ja) 符号化データ伝送装置
US20060259618A1 (en) Method and apparatus of processing audio of multimedia playback terminal
JP3604817B2 (ja) 音声伝送システム及び受信端末
JP3231722B2 (ja) 通話録音システムおよび通話録音方法、並びに記録媒体
US20080266381A1 (en) Selectively privatizing data transmissions in a video conference
JP6289178B2 (ja) 通話会議システム
JP3300471B2 (ja) 通信制御装置
JP2005043423A (ja) リアルタイムパケット処理装置及びその方法
JP2004343566A (ja) 移動電話端末及びプログラム
JP3425410B2 (ja) 送受信システム
JP3222226B2 (ja) 復号装置
JP2005057362A (ja) 音声及び画像の送受信記録システム
JPH09163333A (ja) 音声遅延制御装置
WO2001043443A1 (en) Video encoding/transmitting device, video receiving/decoding device, video transmitting/receiving device, and video transmitting system
JP2004343152A (ja) デジタルビデオ通信システム
JP3683210B2 (ja) 映像音声伝送システム

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2006514390

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Country of ref document: DE

122 Ep: pct application non-entry in european phase