JP2007067826A - Audio and animation communication system and data communication terminal - Google Patents

Audio and animation communication system and data communication terminal Download PDF

Info

Publication number
JP2007067826A
JP2007067826A JP2005251176A JP2005251176A JP2007067826A JP 2007067826 A JP2007067826 A JP 2007067826A JP 2005251176 A JP2005251176 A JP 2005251176A JP 2005251176 A JP2005251176 A JP 2005251176A JP 2007067826 A JP2007067826 A JP 2007067826A
Authority
JP
Japan
Prior art keywords
time information
transmission time
video
data
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005251176A
Other languages
Japanese (ja)
Inventor
Chikako Segawa
智香子 瀬川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2005251176A priority Critical patent/JP2007067826A/en
Publication of JP2007067826A publication Critical patent/JP2007067826A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To control disturbance of synchronization timing of audio data and image data without deterioration of realtime property of audio packet in the bidirectional realtime communication of the audio data packet and image data packet. <P>SOLUTION: A TV adapter 102 obtains the transmission time information of audio packet of the communication partner having received with the IP phone 103 and the transmission time information of the audio packet added to the image packet, and compares these two transmission time information pieces. The TV adapter 102 reproduces the image when these information pieces are identical, and cancels the image when the audio packet transmission time added to the image packet is delayed. When the audio packet transmission time information added to the image packet is leading, the TV adapter 102 determines that the image is buffered. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明はLANやインターネット、IP通信網等のネットワークを介して、音声データや映像データの送受信を行うためのデータ通信装置、このデータ通信装置を用いたデータ通信システムに関するものである。   The present invention relates to a data communication apparatus for transmitting and receiving audio data and video data via a network such as a LAN, the Internet, and an IP communication network, and a data communication system using the data communication apparatus.

近年、ブロードバンドの普及に伴い、インターネット、IP通信網などのネットワークを介しパケット化した音声データや映像データを相手側の装置に送信するとともに、相手側の装置からパケット化した音声データや映像データを受信することにより、双方向にリアルタイム通信を行うデータ通信装置が実用化されている。   In recent years, with the spread of broadband, packetized audio data and video data are transmitted to the other party's device via a network such as the Internet and IP communication network, and the packetized voice data and video data are transmitted from the other device. Data communication apparatuses that perform real-time communication in both directions by receiving them have been put into practical use.

この種のデータ通信装置では、音声データや映像データがそれぞれ複数のパケットに分割され、ネットワークを介して順次送信されるが、帯域保証がなされていない経路で伝送される場合には、データの消失やデータ伝送時間のずれなどの発生により、音声データ、映像データがリアルタイムに送受信できず、また音声と映像の再生の同期タイミングが乱れることがある。   In this type of data communication device, audio data and video data are each divided into a plurality of packets and transmitted sequentially over the network. However, if the data is transmitted through a route with no bandwidth guarantee, the data is lost. Due to occurrence of a shift in data transmission time or the like, audio data and video data cannot be transmitted and received in real time, and synchronization timing of audio and video reproduction may be disturbed.

異なるパケットの送受信におけるリアルタイム性と同期タイミングのずれは本質的に相反するトレードオフの関係にあり、両者の完全な両立は不可能である。   The real-time property and the synchronization timing shift in the transmission / reception of different packets are essentially in a trade-off relationship, and it is impossible to completely satisfy both.

特に音声データはパケットのサイズが小さいため、帯域保証がなされていない経路での伝送の影響が大きく、パケットの消失、遅延によってリアルタイム性が悪化し、音声のとぎれが発生することがある。   In particular, since audio data has a small packet size, the influence of transmission on a route for which bandwidth is not guaranteed is large, and real-time performance may be deteriorated due to packet loss and delay, and audio interruption may occur.

また、利用者は音声、映像の双方向のリアルタイム通信では映像の品質よりも音声の品質とリアルタイム性を利便性として重視している。   In addition, in the two-way real-time communication of audio and video, the user places more importance on the audio quality and the real-time property than the video quality as convenience.

これらの問題を解決するために、受信端末がパケット損失又はパケットのゆらぎが一定値を超えたことを認識すると、送信端末にデータ量変更要求パケットを送出し、データ量の変更を行うことにより、リアルタイム通信時に受信端末が送信端末からの受信データを制御して、音切れや画像の乱れを発生させることなく、かつリアルタイム通信を可能とする技術が知られている(特許文献1参照)。
特開2000−332829号公報
In order to solve these problems, when the receiving terminal recognizes that the packet loss or the fluctuation of the packet exceeds a certain value, it sends a data amount change request packet to the transmitting terminal, and changes the data amount, A technique is known in which a receiving terminal controls data received from a transmitting terminal during real-time communication so that real-time communication is possible without causing sound interruption or image disturbance (see Patent Document 1).
JP 2000-332829 A

しかしながら、上記従来の技術では以下のような問題が生じる。上記特許文献1に記載の技術では、受信端末側から送信端末に対して、送信データ量の変更を要求し、送信端末側は送信する音声パケットのパケットサイズの変更、符号化方式の変更、映像のフレームレート、画質パラメータのなどの変更により送信データ量を減らす制御を行う場合がある。   However, the following problems occur in the above conventional technique. In the technique described in Patent Document 1, the receiving terminal side requests the transmitting terminal to change the transmission data amount, and the transmitting terminal side changes the packet size of the voice packet to be transmitted, changes the encoding method, video There are cases where control is performed to reduce the amount of transmission data by changing the frame rate, image quality parameter, and the like.

前記制御は、符号化方式の変更による音質の劣化、フレームレート、画質パラメータの変更による映像品質の低下などをもたらし、利用者に音声、映像のリアルタイム通信のパフォーマンスに不満足感を与えてしまい、十分な課題解決にはなっていなかった。   The above-mentioned control causes deterioration in sound quality due to changes in the encoding method, degradation in video quality due to changes in the frame rate and image quality parameters, etc., and gives users dissatisfaction with the performance of real-time communication of audio and video. The problem was not solved.

本発明は、このような従来の課題を解決するものであり、音声データと映像データの双方向のリアルタイム通信において、音声データのリアルタイム性を損なわず、かつ音声データと映像データの同期タイミングの乱れを抑制し、パケットのデータ量の減少に起因する音質、映像品質の劣化などによる通信パフォーマンスの不満足感を利用者に与えないことを目的とする。   The present invention solves such a conventional problem, and in two-way real-time communication between audio data and video data, the real-time property of the audio data is not impaired, and the synchronization timing of the audio data and the video data is disturbed. The purpose is to prevent the user from being dissatisfied with the communication performance due to the deterioration of the sound quality and the video quality due to the decrease in the data amount of the packet.

本発明は、上記目的を達成するために、請求項1に示すとおり、パケット化された音声データ及び映像データを双方向に送受信するデータ通信システムであって、音声パケット送信時刻情報を音声パケット及び映像パケットに付加し順次送信するパケット送信部と受信した音声パケットと映像パケットの2つの音声パケット送信時刻情報を比較し、等しい場合は映像データを再生し、映像パケットの前記音声パケット送信時刻情報が遅い場合は映像データを破棄し、音声パケットの前記音声パケット送信時刻情報が遅い場合は映像パケットをバッファリングするパケット受信部を備えた装置を備えた構成とした。   In order to achieve the above object, the present invention provides a data communication system for bidirectionally transmitting and receiving packetized audio data and video data, as shown in claim 1, wherein the audio packet transmission time information is converted into an audio packet and The packet transmission unit that is added to the video packet and sequentially transmits the received audio packet and the audio packet transmission time information of the video packet are compared. If they are equal, the video data is reproduced, and the audio packet transmission time information of the video packet is When late, the video data is discarded, and when the audio packet transmission time information of the audio packet is late, an apparatus including a packet receiving unit that buffers the video packet is provided.

このような本発明によれば、音声と映像の双方向リアルタイム通信を行うに際し、音声送信時刻情報が音声パケットと映像パケットの2つのパケットで独立に順次送信され、受信側では2つのパケットの音声送信時刻情報を比較し、等しい場合は映像データを再生し、映像パケットの前記音声パケット送信時刻情報が遅い場合は映像データを破棄し、音声パケットの前記音声パケット送信時刻情報が遅い場合は映像データの再生を遅らせることができるので、音声データのリアルタイム性を損なわず、また、音声データと映像データの同期タイミングの乱れを抑制し、かつ、パケットのデータ量の減少に起因する音質、映像品質の劣化などによる通信パフォーマンスの不満足感を利用者に与えないという効果を奏する。   According to the present invention, when performing bidirectional real-time communication between audio and video, the audio transmission time information is independently and sequentially transmitted in two packets, that is, an audio packet and a video packet. Compare transmission time information, if equal, play video data, discard video data if the audio packet transmission time information of the video packet is late, discard video data if the audio packet transmission time information of the audio packet is late Playback can be delayed, so that the real-time nature of the audio data is not impaired, the disturbance of the synchronization timing of the audio data and the video data is suppressed, and the sound quality and video quality due to the decrease in the amount of packet data are reduced. There is an effect that the user is not dissatisfied with the communication performance due to deterioration or the like.

本発明においては、データ通信端末装置が、音声データの送信時刻情報を音声パケット及び映像パケットの2つのパケットに付加し順次送信するパケット送信部と前記2つのパケットを受信する受信部と前記2つのパケットに含まれる音声データの送信時刻情報それぞれを比較する比較部と、前記比較部によって比較した結果、前記送信時刻情報と実質的に同一の時刻情報の場合は、受信した音声データと映像データとの同期がとれていると判断して受信した映像を再生し、映像パケットに付加された送信時刻情報が音声パケットに付加された前記送信時刻情報より遅れた時刻情報の場合は、受信した音声データと映像データとの同期がとれていないと判断して受信した映像データを破棄し、映像パケットに付加された送信時刻情報が音声パケットに付加された前記送信時刻情報より早い時刻情報の場合は、受信した音声データと映像データとの同期がとれていないと判断して受信した映像データをバッファリングするいずれかの処理を行う制御部とを備えた構成を特徴とする音声動画通信システムを有する。   In the present invention, the data communication terminal device adds the transmission time information of the audio data to the two packets of the audio packet and the video packet and sequentially transmits the packet transmitting unit, the receiving unit that receives the two packets, and the two A comparison unit that compares each transmission time information of audio data included in the packet, and, as a result of comparison by the comparison unit, if the time information is substantially the same as the transmission time information, the received audio data and video data If the transmission time information added to the video packet is time information delayed from the transmission time information added to the audio packet, the received audio data is reproduced. The received video data is discarded, and the transmission time information added to the video packet is the audio packet. In the case of time information earlier than the transmission time information added to the network, it is determined that the received audio data and video data are not synchronized, and any processing for buffering the received video data is performed. An audio video communication system characterized by a configuration including a control unit.

これにより、音声送信時刻情報が音声パケットと映像パケットの2つのパケットで独立に送信され、受信側では2つのパケットの送信時刻情報の比較することにより、映像パケットの到達時間が音声パケットの到達時間と同じか、あるいは早いか遅いか、簡易かつ高速に判定して、映像データを再生するよう作用させ、音声データのリアルタイム性を損なわず、音声データと映像データの同期タイミングの乱れを抑制でき、かつ、パケットのデータ量の減少による音質、映像品質の劣化などによる通信パフォーマンスの不満足感を利用者に与えなくなる。   As a result, the audio transmission time information is independently transmitted in two packets of an audio packet and a video packet. On the receiving side, the arrival time of the video packet is compared by comparing the transmission time information of the two packets. It can be determined whether it is the same or early or late, simply and at high speed, and it plays back video data, and it can suppress the disturbance of the synchronization timing of audio data and video data without impairing the real time property of audio data, In addition, the user is not dissatisfied with the communication performance due to the deterioration of the sound quality and video quality due to the decrease in the amount of packet data.

また、データ通信端末装置は、音声データの送信時刻情報を音声パケット及び映像パケットの2つのパケットに付加し順次送信するパケット送信部と前記2つのパケットを受信する受信部と前記2つのパケットに含まれる音声データの送信時刻情報それぞれを比較する比較部と、前記比較部によって比較した結果、前記送信時刻情報と実質的に同一の時刻情報の場合は、受信した音声データと映像データとの同期がとれていると判断して受信した映像を再生し、映像パケットに付加された送信時刻情報が音声パケットに付加された前記送信時刻情報より遅れた時刻情報の場合は、受信した音声データと映像データとの同期がとれていないと判断して受信した映像データを破棄し、映像パケットに付加された送信時刻情報が音声パケットに付加された前記送信時刻情報より早い時刻情報の場合は、受信した音声データと映像データとの同期がとれていないと判断して受信した映像データをバッファリングするいずれかの処理を行う制御部とを、備えた構成としてもよい。   In addition, the data communication terminal device includes the packet transmission unit that sequentially transmits the transmission time information of the audio data to the two packets of the audio packet and the video packet, the reception unit that receives the two packets, and the two packets. When the time information is substantially the same as the transmission time information as a result of comparison by the comparison unit that compares the transmission time information of the audio data to be transmitted and the comparison unit, the received audio data and the video data are synchronized. When the received video data is reproduced after the received video is reproduced and the transmission time information added to the video packet is later than the transmission time information added to the audio packet, the received audio data and video data Discards the received video data because it is determined that it is not synchronized with the video, and sends the transmission time information added to the video packet to the audio packet. If the received time information is earlier than the transmitted time information, the control unit performs any process of buffering the received video data by determining that the received audio data and video data are not synchronized. It is good also as a structure provided.

これによっても、音声送信時刻情報が音声パケットと映像パケットの2つのパケットで独立に送信され、受信側では2つのパケットの送信時刻情報の比較することにより、映像パケットの到達時間が音声パケットの到達時間と同じか、あるいは早いか遅いか、簡易かつ高速に判定して、映像データを再生するよう作用させ、音声データのリアルタイム性を損なわず、音声データと映像データの同期タイミングの乱れを抑制でき、かつ、パケットのデータ量の減少による音質、映像品質の劣化などによる通信パフォーマンスの不満足感を利用者に与えなくなる。   Even in this case, the audio transmission time information is independently transmitted in the two packets of the audio packet and the video packet, and the arrival time of the video packet is reached by comparing the transmission time information of the two packets on the receiving side. Whether it is the same as the time, or early or late, can be easily and quickly determined to play back the video data, and the real-time performance of the audio data can be reduced without disturbing the synchronization timing of the audio data and video data. In addition, the user will not be dissatisfied with the communication performance due to the deterioration of the sound quality and video quality due to the decrease in the amount of packet data.

さらに、データ通信端末装置が、少なくとも、音声データとこの音声データの送信時刻情報を含む音声パケットを順次送受信する電話装置と、映像データと前記音声データの送信時刻情報を含む映像パケットを順次送受信するTVアダプタを備え、前記電話装置には、自分側電話装置から相手側電話装置に送信した音声パケットに含まれる音声データの送信時刻情報Aと、相手側電話装置から受信した音声パケットに含まれる音声データの送信時刻情報B1とを自分側TVアダプタに通知する音声通信制御部を備え、前記TVアダプタには、自分側電話装置から送信されてきた前記音声データの送信時刻情報のうち、送信時刻情報Aを含む映像パケットを相手側TVアダプタに送信する送信部と、相手側TVアダプタで前記と同様にして作られた音声データの送信時刻情報B2を含む映像パケットを受信する受信部と、前記送信時刻情報B1と前記送信時刻情報B2とを比較する比較部と、前記比較部によって比較した結果、前記送信時刻情報B1が前記送信時刻情報B2と実質的に同一の時刻情報の場合は、受信した音声データと同期がとれていると判断して受信した映像を再生し、前記送信時刻情報B2が前記送信時刻情報B1より遅れた時刻情報の場合は、受信した音声データと同期がとれていないと判断して受信した映像データを破棄し、前記送信時刻情報B2が前記送信時刻情報B1より早い時刻情報の場合は、受信した音声データと同期がとれていないと判断して、映像データをバッファリングする、いずれかの処理を行う制御部とを備え、これらの機能を備えたデータ通信端末装置の間で、通信ネットワークを介して音声データと映像データを対話的に送受信することを、特徴とする音声動画通信システムとしてもよい。   Further, the data communication terminal apparatus sequentially transmits and receives at least the audio data and the audio packet including the transmission time information of the audio data, and the video packet including the video data and the transmission time information of the audio data. A TV adapter is provided, and the telephone device includes transmission time information A of voice data included in a voice packet transmitted from the local telephone device to the remote telephone device, and voice included in a voice packet received from the remote telephone device. A voice communication control unit for notifying the own TV adapter of the data transmission time information B1 is included, and the TV adapter includes transmission time information among the transmission time information of the voice data transmitted from the own telephone device. A transmission unit that transmits a video packet including A to the partner TV adapter, and the partner TV adapter. As a result of the comparison by the receiving unit that receives the video packet including the transmission time information B2 of the audio data, the comparison unit that compares the transmission time information B1 and the transmission time information B2, the transmission time information When B1 is substantially the same time information as the transmission time information B2, the received video is determined to be synchronized with the received audio data, and the received video is reproduced, and the transmission time information B2 is the transmission time information. In the case of time information later than B1, it is determined that the received audio data is not synchronized and the received video data is discarded. When the transmission time information B2 is time information earlier than the transmission time information B1, And a control unit that performs any of the processes for determining that the received audio data is not synchronized with the received audio data and buffering the video data. Between the communication terminal device, to interactively transmit and receive audio data and video data via a communications network may be a voice video communication system according to claim.

これにより、ローカルネットワーク上のTVアダプタで映像の撮影、再生処理を行い、電話装置で音声の入力、再生処理することにより、利用者は2つの端末を異なる設置場所で使用できる。   Thus, the user can use the two terminals at different installation locations by performing video shooting and playback processing with the TV adapter on the local network and voice input and playback processing with the telephone device.

さらに、データ通信端末装置は、少なくとも、音声データとこの音声データの送信時刻情報を含む音声パケットを順次送受信する電話装置と、映像データと前記音声データの送信時刻情報を含む映像パケットを順次送受信するTVアダプタを備え、前記電話装置には、自分側電話装置から相手側電話装置に送信した音声パケットに含まれる音声データの送信時刻情報Aと、相手側電話装置から受信した音声パケットに含まれる音声データの送信時刻情報B1とを自分側TVアダプタに通知する音声通信制御部を備え、前記TVアダプタには、自分側電話装置から送信されてきた前記音声データの送信時刻情報のうち、送信時刻情報Aを含む映像パケットを相手側TVアダプタに送信する送信部と、相手側TVアダプタで前記と同様にして作られた音声データの送信時刻情報B2を含む映像パケットを受信する受信部と、前記送信時刻情報B1と前記送信時刻情報B2とを比較する比較部と、前記比較部によって比較した結果、前記送信時刻情報B1が前記送信時刻情報B2と実質的に同一の時刻情報の場合は、受信した音声データと同期がとれていると判断して受信した映像を再生し、前記送信時刻情報B2が前記送信時刻情報B1より遅れた時刻情報の場合は、受信した音声データと同期がとれていないと判断して受信した映像データを破棄し、前記送信時刻情報B2が前記送信時刻情報B1より早い時刻情報の場合は、受信した音声データと同期がとれていないと判断して、映像データをバッファリングする、いずれかの処理を行う制御部とを、備えた構成にしてもよい。   Furthermore, the data communication terminal device sequentially transmits / receives at least audio data and a voice packet including transmission time information of the audio data sequentially, and a video packet including video data and transmission time information of the audio data. A TV adapter is provided, and the telephone device includes transmission time information A of voice data included in a voice packet transmitted from the local telephone device to the remote telephone device, and voice included in a voice packet received from the remote telephone device. A voice communication control unit for notifying the own TV adapter of the data transmission time information B1 is included, and the TV adapter includes transmission time information among the transmission time information of the voice data transmitted from the own telephone device. A transmission unit that transmits a video packet including A to the partner TV adapter, and the partner TV adapter. As a result of the comparison by the receiving unit that receives the video packet including the transmission time information B2 of the audio data, the comparison unit that compares the transmission time information B1 and the transmission time information B2, the transmission time information When B1 is substantially the same time information as the transmission time information B2, the received video is determined to be synchronized with the received audio data, and the received video is reproduced, and the transmission time information B2 is the transmission time information. In the case of time information later than B1, it is determined that the received audio data is not synchronized, and the received video data is discarded. When the transmission time information B2 is time information earlier than the transmission time information B1, It may be configured to include a control unit that performs any of the processes for determining that the received audio data is not synchronized with the received audio data and buffering the video data.

これにより、ローカルネットワーク上のTVアダプタで映像の撮影、再生処理を行い、電話装置で音声の入力、再生することにより、利用者は2つの端末を異なる設置場所で使用できる。   As a result, the user can use the two terminals at different installation locations by performing video shooting and playback processing with the TV adapter on the local network and inputting and playing back sound with the telephone device.

さらに、データ通信端末装置が、少なくとも、音声データとこの音声データの送信時刻情報を含む音声パケットを順次送受信する電話装置と、映像データと前記音声データの送信時刻情報を含む映像パケットを順次送受信するTVアダプタを備え、前記電話装置には、自分側電話装置から相手側電話装置に送信した音声パケットに含まれる音声データの送信時刻情報Aと、相手側電話装置から受信した音声パケットに含まれる音声データの送信時刻情報B1とを自分側TVアダプタに通知する音声通信制御部を備え、前記TVアダプタには、自分側電話装置から送信されてきた前記音声データの送信時刻情報のうち、送信時刻情報Aを含む映像パケットを相手側TVアダプタに送信する送信部と、相手側TVアダプタで前記と同様にして作られた音声データの送信時刻情報B2を含む映像パケットを受信する受信部と、前記送信時刻情報B1と前記送信時刻情報B2とを比較する比較部と、前記比較部によって比較した結果、前記送信時刻情報B1が前記送信時刻情報B2と実質的に同一の時刻情報の場合は、受信した音声データと同期がとれていると判断して受信した映像を再生し、前記送信時刻情報B2が前記送信時刻情報B1より遅れた時刻情報の場合は、受信した音声データと同期がとれていないと判断して受信した映像データを破棄し、前記送信時刻情報B2が前記送信時刻情報B1より早い時刻情報の場合は、受信した音声データと同期がとれていないと判断して、映像データをバッファリングする、いずれかの処理を行う制御部とを備え、所定の回数の音声パケット受信毎に、前記電話装置から前記TVアダプタへ前記音声データの送信時刻情報を通知することを、特徴とする音声動画通信システムとしてもよい。   Further, the data communication terminal apparatus sequentially transmits and receives at least the audio data and the audio packet including the transmission time information of the audio data, and the video packet including the video data and the transmission time information of the audio data. A TV adapter is provided, and the telephone device includes transmission time information A of voice data included in a voice packet transmitted from the local telephone device to the remote telephone device, and voice included in a voice packet received from the remote telephone device. A voice communication control unit for notifying the own TV adapter of the data transmission time information B1 is included, and the TV adapter includes transmission time information among the transmission time information of the voice data transmitted from the own telephone device. A transmission unit that transmits a video packet including A to the partner TV adapter, and the partner TV adapter. As a result of the comparison by the receiving unit that receives the video packet including the transmission time information B2 of the audio data, the comparison unit that compares the transmission time information B1 and the transmission time information B2, the transmission time information When B1 is substantially the same time information as the transmission time information B2, the received video is determined to be synchronized with the received audio data, and the received video is reproduced, and the transmission time information B2 is the transmission time information. In the case of time information later than B1, it is determined that the received audio data is not synchronized, and the received video data is discarded. When the transmission time information B2 is time information earlier than the transmission time information B1, A predetermined number of audio packets, and a control unit that performs any of the processes by determining that the received audio data is not synchronized with the received audio data and buffering the video data. Each signal, to notify the sending time information of the audio data to the TV adapter from the telephone device may be a voice video communication system according to claim.

これにより、本機能の処理負荷が軽減され、処理速度の低いCPUを使用できる。   Thereby, the processing load of this function is reduced and a CPU with a low processing speed can be used.

さらに、データ通信端末装置は、少なくとも、音声データとこの音声データの送信時刻情報を含む音声パケットを順次送受信する電話装置と、映像データと前記音声データの送信時刻情報を含む映像パケットを順次送受信するTVアダプタを備え、前記電話装置には、自分側電話装置から相手側電話装置に送信した音声パケットに含まれる音声データの送信時刻情報Aと、相手側電話装置から受信した音声パケットに含まれる音声データの送信時刻情報B1とを自分側TVアダプタに通知する音声通信制御部を備え、前記TVアダプタには、自分側電話装置から送信されてきた前記音声データの送信時刻情報のうち、送信時刻情報Aを含む映像パケットを相手側TVアダプタに送信する送信部と、相手側TVアダプタで前記と同様にして作られた音声データの送信時刻情報B2を含む映像パケットを受信する受信部と、前記送信時刻情報B1と前記送信時刻情報B2とを比較する比較部と、前記比較部によって比較した結果、前記送信時刻情報B1が前記送信時刻情報B2と実質的に同一の時刻情報の場合は、受信した音声データと同期がとれていると判断して受信した映像を再生し、前記送信時刻情報B2が前記送信時刻情報B1より遅れた時刻情報の場合は、受信した音声データと同期がとれていないと判断して受信した映像データを破棄し、前記送信時刻情報B2が前記送信時刻情報B1より早い時刻情報の場合は、受信した音声データと同期がとれていないと判断して、映像データをバッファリングする、いずれかの処理を行う制御部とを備え、所定の回数の音声パケット受信毎に、前記電話装置から前記TVアダプタへ前記音声データの送信時刻情報を通知する構成としてもよい。   Furthermore, the data communication terminal device sequentially transmits / receives at least audio data and a voice packet including transmission time information of the audio data sequentially, and a video packet including video data and transmission time information of the audio data. A TV adapter is provided, and the telephone device includes transmission time information A of voice data included in a voice packet transmitted from the local telephone device to the remote telephone device, and voice included in a voice packet received from the remote telephone device. A voice communication control unit for notifying the own TV adapter of the data transmission time information B1 is included, and the TV adapter includes transmission time information among the transmission time information of the voice data transmitted from the own telephone device. A transmission unit that transmits a video packet including A to the partner TV adapter, and the partner TV adapter. As a result of the comparison by the receiving unit that receives the video packet including the transmission time information B2 of the audio data, the comparison unit that compares the transmission time information B1 and the transmission time information B2, the transmission time information When B1 is substantially the same time information as the transmission time information B2, the received video is determined to be synchronized with the received audio data, and the received video is reproduced, and the transmission time information B2 is the transmission time information. In the case of time information later than B1, it is determined that the received audio data is not synchronized, and the received video data is discarded. When the transmission time information B2 is time information earlier than the transmission time information B1, A predetermined number of audio packets, and a control unit that performs any of the processes by determining that the received audio data is not synchronized with the received audio data and buffering the video data. Each signal may be configured to notify the transmission time information of the audio data to the TV adapter from the telephone device.

これによっても、本機能の処理負荷が軽減される、処理速度の低いCPUを使用できる。   This also makes it possible to use a CPU with a low processing speed that reduces the processing load of this function.

以下、本発明の実施例における音声動画通信システムについて図面を参照しながら説明する。   Hereinafter, an audio video communication system according to an embodiment of the present invention will be described with reference to the drawings.

図1は、本発明の実施例の音声動画通信システム100の構成図である。音声動画通信システム100は、自分側音声動画通信装置112と相手側音声動画通信装置113がインターネット106によって接続され構成されている。   FIG. 1 is a configuration diagram of an audio video communication system 100 according to an embodiment of the present invention. The audio video communication system 100 is configured by connecting a local audio video communication device 112 and a counterpart audio video communication device 113 via the Internet 106.

なお、本実施例では音声動画通信装置112,113は、IPテレビ電話として実施されている。実施例のの構成に限らず3台以上の音声動画通信装置を接続してシステムを構成してもかまわない。   In this embodiment, the audio / video communication devices 112 and 113 are implemented as IP videophones. Not limited to the configuration of the embodiment, a system may be configured by connecting three or more audio / video communication apparatuses.

自分側音声動画通信装置112は、ルータ104の配下のLAN(または無線LAN)などのローカルネットワークに自分側TVアダプタ102と自分側IP電話103を接続し、自分側TVアダプタ102は映像の送受信を行い、自分側IP電話103は音声の送受信を行う。TV101は、自分側TVアダプタ102に接続され動画表示をするテレビである。ルータ104の上位にはモデム105があり、インターネット106を介して相手側の音声動画通信装置113へと接続される。   The own-side audio-video communication device 112 connects the own-side TV adapter 102 and the own-side IP phone 103 to a local network such as a LAN (or wireless LAN) under the router 104, and the own-side TV adapter 102 transmits and receives video. The own IP phone 103 transmits and receives voice. The TV 101 is a television that is connected to the TV adapter 102 on its own side and displays a moving image. A modem 105 is provided above the router 104 and is connected to the audio / video communication device 113 on the other side via the Internet 106.

相手側音声動画通信装置113は、ルータ108の配下のLAN(または無線LAN)などのローカルネットワークに相手側TVアダプタ110と相手側IP電話109が接続し、相手側TVアダプタ110は映像の送受信を行い、相手側IP電話109は音声の送受信を行う。TV111は、相手側TVアダプタ110に接続され動画表示をするテレビである。ルータ108の上位にはモデム107があり、インターネット106を介して自分側の音声動画通信装置112へと接続される。   In the other party audio video communication device 113, the other party TV adapter 110 and the other party IP phone 109 are connected to a local network such as a LAN (or wireless LAN) under the router 108, and the other party TV adapter 110 transmits and receives video. Then, the other party's IP phone 109 transmits and receives voice. The TV 111 is a television that is connected to the partner TV adapter 110 and displays a moving image. A modem 107 is provided above the router 108 and is connected to the audio / video communication device 112 on the own side via the Internet 106.

図2は、図1の音声動画通信システム100で用いられる自分側TVアダプタ102の構成を示すブロック図である。なお相手側TVアダプタ110も同様の構成を備える。   FIG. 2 is a block diagram showing the configuration of the own TV adapter 102 used in the audio / video communication system 100 of FIG. The counterpart TV adapter 110 has the same configuration.

図2において、自分側TVアダプタ102は、ネットワークインターフェース201、カメラ202、映像通信制御部203、映像コーデック204、表示制御部205、表示出力部206、システム制御部207、リモコン制御部208により主に構成されている。   In FIG. 2, the own TV adapter 102 is mainly composed of a network interface 201, a camera 202, a video communication control unit 203, a video codec 204, a display control unit 205, a display output unit 206, a system control unit 207, and a remote control unit 208. It is configured.

ネットワークインターフェース201は、ルータ104及び自分側IP電話103にLAN(または無線LAN)などのローカルネットワークで接続するインターフェースである。映像データ送信の際は、カメラ202で撮影された映像データは、映像コーデック204で圧縮符号化される。   The network interface 201 is an interface for connecting to the router 104 and the own IP phone 103 via a local network such as a LAN (or wireless LAN). When transmitting video data, video data captured by the camera 202 is compressed and encoded by the video codec 204.

圧縮符号化された映像データは、映像通信制御部203で映像パケット化処理され、映像パケット400(詳細は図4で後述)はネットワークインターフェース201からインターネット106を介して相手側音声動画通信装置113へ送信される。   The compressed and encoded video data is processed into a video packet by the video communication control unit 203, and the video packet 400 (details will be described later with reference to FIG. 4) is sent from the network interface 201 to the partner audio video communication device 113 via the Internet 106. Sent.

また、映像データ受信の際は、映像パケット400は、相手側音声動画通信装置113の相手側TVアダプタ110からインターネット106を介してネットワークインターフェース201で受信される。   When receiving video data, the video packet 400 is received by the network interface 201 via the Internet 106 from the counterpart TV adapter 110 of the counterpart audio video communication device 113.

受信した映像パケット400は、映像通信制御部203においてパケット解析・分解・バッファリング処理され、映像コーデック204で伸張復号化され、表示制御部205でフレーム表示するため合成処理され、表示出力部206を介してTV101で相手側の映像が再生表示される。   The received video packet 400 is subjected to packet analysis / decomposition / buffering processing in the video communication control unit 203, decompressed and decoded by the video codec 204, and combined for display in a frame by the display control unit 205. The other party's video is reproduced and displayed on the TV 101.

また、リモコン制御部208は、リモコンを用いて自分側TVアダプタ102を操作し、システム制御部207は自分側TVアダプタ102全体の制御を行う。カメラ202で自分側の映像を表示出力部206から表示させることも可能である。   In addition, the remote controller control unit 208 operates the own TV adapter 102 using the remote controller, and the system control unit 207 controls the entire own TV adapter 102. It is also possible to display the video on its own side from the display output unit 206 with the camera 202.

図3は、音声動画通信システム100で用いられる自分側IP電話103の構成を示すブロック図である。なお相手側IP電話109も同様の構成を備える。   FIG. 3 is a block diagram showing the configuration of the own IP phone 103 used in the audio / video communication system 100. The other party IP phone 109 has the same configuration.

図3において、自分側IP電話103は、ネットワークインターフェース301、音声通信制御部302、音声制御部303、表示制御部304、LCD305、システム制御部306、受話器307により主に構成されている。   In FIG. 3, the own IP phone 103 is mainly configured by a network interface 301, a voice communication control unit 302, a voice control unit 303, a display control unit 304, an LCD 305, a system control unit 306, and a receiver 307.

ネットワークインターフェース301は、ルータ104及び自分側TVアダプタ102にLAN(または無線LAN)などのローカルネットワークで接続するインターフェースである。電話音声発信の際は受話器307から入力された音声データは音声制御部303で圧縮符号化される。   The network interface 301 is an interface connected to the router 104 and the own TV adapter 102 via a local network such as a LAN (or wireless LAN). When the telephone voice is transmitted, the voice data input from the receiver 307 is compressed and encoded by the voice control unit 303.

圧縮符号化された音声データは、音声通信制御部302で音声パケット化処理され、音声パケット1100(詳細は図11で後述)はネットワークインターフェース301からインターネット106を介して相手側音声動画通信装置113へ送出される。   The audio data that has been compression-encoded is processed into an audio packet by the audio communication control unit 302, and an audio packet 1100 (details will be described later with reference to FIG. 11) is sent from the network interface 301 to the counterpart audio-video communication device 113 via the Internet 106. Sent out.

また、電話音声受信の際、音声パケット1100は相手側音声動画通信装置113の相手側IP電話109からインターネット106を介してネットワークインターフェース301で受信される。   At the time of telephone voice reception, the voice packet 1100 is received by the network interface 301 via the Internet 106 from the partner IP telephone 109 of the partner voice video communication device 113.

受信した音声パケット1100は、音声通信制御部302でパケット解析・分解・バッファリング処理され、音声制御部303で伸張復号化され、受話器307から音声が出力される。システム制御部306では自分側IP電話103全体の制御を行う。   The received voice packet 1100 is subjected to packet analysis / decomposition / buffering processing by the voice communication control unit 302, decompressed and decoded by the voice control unit 303, and voice is output from the receiver 307. The system control unit 306 controls the own IP phone 103 as a whole.

表示制御部204は、IP電話の設定、状態などの表示処理を行い、LCD305で表示を行う。   The display control unit 204 performs display processing such as setting and status of the IP phone, and displays on the LCD 305.

図11は、自分側IP電話103と相手側IP電話109の間で送受信される音声パケット1100の構成図である。   FIG. 11 is a configuration diagram of a voice packet 1100 transmitted and received between the own IP phone 103 and the other party IP phone 109.

音声パケット1100は、リアルタイム通信で用いられる、IETFのRFC1889標準準拠のRTP(リアルタイムプロトコル)パケット構成を備えている。具体的にはRTPヘッダ1101、タイムスタンプ1102、SSRC識別子1103、CSRC識別子1104、ペイロードヘッダ(音声)1105、ペイロードデータ(音声)1106から構成される。   The voice packet 1100 has an RTP (real time protocol) packet configuration conforming to the RFC 1889 standard of IETF used in real time communication. Specifically, it comprises an RTP header 1101, a time stamp 1102, an SSRC identifier 1103, a CSRC identifier 1104, a payload header (voice) 1105, and payload data (voice) 1106.

音声パケット1100は、図3に示した自分側IP電話103の音声通信制御部302で送信時に生成され、受信時に解析・分解される。なお、IP電話109においても音声パケットは同様に処理される。   The voice packet 1100 is generated at the time of transmission by the voice communication control unit 302 of the own IP phone 103 shown in FIG. 3, and is analyzed and decomposed at the time of reception. In the IP phone 109, the voice packet is processed in the same manner.

タイムスタンプ1102には、音声パケット1100の送信時刻情報が搭載されている。なお、音声パケットの送信時刻情報であるタイムスタンプ1102は、自分側音声動画通信装置112から相手側音声動画通信装置113に送信されるものを音声タイムスタンプ1102Aとし、相手側音声動画通信装置113から自分側音声動画通信装置112に送信されるものを音声タイムスタンプ1102Bと定め、以降の説明で用いる。   The time stamp 1102 carries the transmission time information of the voice packet 1100. It should be noted that the time stamp 1102 that is the transmission time information of the audio packet is the audio time stamp 1102A that is transmitted from the own audio / video communication device 112 to the other audio / video communication device 113, and from the other audio / video communication device 113. What is transmitted to the own audio / video communication device 112 is defined as an audio time stamp 1102B, and is used in the following description.

図4は、自分側TVアダプタ102と相手側TVアダプタ110の間で送受信される映像パケット400の構成図である。   FIG. 4 is a configuration diagram of a video packet 400 transmitted and received between the own TV adapter 102 and the other TV adapter 110.

映像パケット400は、リアルタイム通信で用いられる、RTP(リアルタイムプロトコル)パケットをヘッダ拡張した構成を備えている。具体的にはRTPヘッダ401、タイムスタンプ402、SSRC識別子403、CSRC識別子404、ペイロードヘッダ(映像)405、ペイロードデータ(映像)406に音声送信時刻情報用ヘッダ拡張407(詳細は図5で後述)が追加されて構成されている。   The video packet 400 has a configuration in which a header of an RTP (real time protocol) packet used in real time communication is extended. Specifically, RTP header 401, time stamp 402, SSRC identifier 403, CSRC identifier 404, payload header (video) 405, payload data (video) 406 and voice transmission time information header extension 407 (details will be described later in FIG. 5) Is added and configured.

タイムスタンプ402には、映像パケット400の送信時刻情報が搭載されている。音声送信時刻情報用ヘッダ拡張407はRTPパケットの標準準拠ではない拡張情報であり、音声パケット1100の送信時刻情報が搭載されている。   In the time stamp 402, transmission time information of the video packet 400 is mounted. The voice transmission time information header extension 407 is extension information that does not conform to the standard of the RTP packet, and includes transmission time information of the voice packet 1100.

図5は、図4の音声送信時刻情報用ヘッダ拡張407の構成図である。   FIG. 5 is a block diagram of the voice transmission time information header extension 407 of FIG.

音声送信時刻情報用ヘッダ拡張407は、音声送信時刻情報用ヘッダ拡張の識別子であるデータタイプ及び音声送信時刻情報用ヘッダ拡張407のバイト数を示すデータ長501と音声パケット1100の送信時刻情報である音声タイムスタンプ502から構成されている。   The voice transmission time information header extension 407 is a data type that is an identifier of the voice transmission time information header extension and a data length 501 indicating the number of bytes of the voice transmission time information header extension 407 and transmission time information of the voice packet 1100. It consists of an audio time stamp 502.

すなわち、前記送信時刻情報は図11の音声パケット1100のタイムスタンプ1102に搭載した送信時刻発信情報と等しい値が設定される。   That is, the transmission time information is set to a value equal to the transmission time transmission information mounted on the time stamp 1102 of the voice packet 1100 in FIG.

映像パケット400は、図2に示した自分側TVアダプタ102及び相手側TVアダプタ103の映像通信制御部203で送信時に生成され、受信時に解析・分解される。   The video packet 400 is generated at the time of transmission by the video communication control unit 203 of the local TV adapter 102 and the counterpart TV adapter 103 shown in FIG. 2, and is analyzed and decomposed at the time of reception.

なお、説明の便宜上、映像パケット400の音声送信時刻情報用ヘッダ拡張407に含まれる音声パケット1100の送信時刻情報である音声タイムスタンプ502は、自分側音声動画通信装置112から相手側音声動画通信装置113へ送信されるものを音声タイムスタンプ502Aとし、相手側音声動画通信装置113から自分側音声動画通信装置112へ送信されるものを502Bと定め、以降の説明で用いる。   For convenience of explanation, the audio time stamp 502, which is transmission time information of the audio packet 1100 included in the audio packet transmission time information header extension 407 of the video packet 400, is transmitted from the own audio video communication device 112 to the other audio video communication device. It is determined that the audio time stamp 502A is transmitted to 113, and 502B is the audio time stamp 502A transmitted from the partner audio / video communication device 113 to the own audio / video communication device 112, and is used in the following description.

図6は、自分側IP電話103から自分側TVアダプタ102へ通知される自分側タイムスタンプ用パケット600の構成図である。   FIG. 6 is a configuration diagram of the own time stamp packet 600 notified from the own IP phone 103 to the own TV adapter 102.

自分側タイムスタンプ用パケット600は、自分側タイムスタンプ用パケット600の識別子であるデータタイプ及びタイムスタンプ用パケットのバイト数を示すデータ長601、自分側IP電話103から相手側IP電話109へ送信した音声パケット1100の送信時刻情報である音声パケット(送信)の音声タイムスタンプ602(設定値は前記図11で説明した1102Aに等しい)、自分側IP電話103が相手側IP電話109から受信した、相手側IP電話109が自分側のIP電話103へ送信した音声パケット1100の送信時刻情報である音声パケット(受信)の音声タイムスタンプ603(設定値は前記図11で説明した1102Bに等しい)から構成されている。   The own time stamp packet 600 is transmitted from the own IP phone 103 to the other party IP phone 109, the data type 601 indicating the data type that is the identifier of the own time stamp packet 600 and the number of bytes of the time stamp packet. Voice time stamp 602 of the voice packet (transmission) that is the transmission time information of the voice packet 1100 (the setting value is equal to 1102A described in FIG. 11), and the other party's IP telephone 103 received from the other party's IP telephone 109 It is composed of a voice time stamp 603 (set value is equal to 1102B described in FIG. 11) of the voice packet (reception) which is transmission time information of the voice packet 1100 sent from the side IP phone 109 to its own IP phone 103. ing.

自分側タイムスタンプ用パケット600は、自分側IP電話103の音声通信制御部302で生成、送出され、自分側TVアダプタ102の映像通信制御部203で受信され解析・分解されて後述する映像データの再生時に用いられる(詳細は図7にて後述)。   The self-time stamp packet 600 is generated and transmitted by the voice communication control unit 302 of the own-side IP phone 103, received by the video communication control unit 203 of the own-side TV adapter 102, analyzed and decomposed, and later-described video data. Used during reproduction (details will be described later with reference to FIG. 7).

図10は、相手側IP電話109から相手側TVアダプタ110へ通知される相手側タイムスタンプ用パケット1000の構成図である。   FIG. 10 is a configuration diagram of the counterpart time stamp packet 1000 notified from the counterpart IP phone 109 to the counterpart TV adapter 110.

相手側タイムスタンプ用パケット1000は、相手側タイムスタンプ用パケット1000の識別子であるデータタイプ及びタイムスタンプ用パケットのバイト数を示すデータ長1001、相手側IP電話109から自分側IP電話103へ送信した音声パケット1100の送信時刻情報である音声パケット(送信)の音声タイムスタンプ1002(設定値は前記図11で説明した1102Bに等しい)、相手側IP電話109が自分側IP電話103へ送信した音声パケット1100の送信時刻情報である音声パケット1003(設定値は前記図11で説明した1102Aに等しい)から構成されている。   The counterpart time stamp packet 1000 is transmitted from the counterpart IP phone 109 to the own IP phone 103 from the data type 1001 indicating the data type that is the identifier of the counterpart time stamp packet 1000 and the number of bytes of the timestamp packet. Voice time stamp 1002 of the voice packet (transmission) which is the transmission time information of the voice packet 1100 (the setting value is equal to 1102B described in FIG. 11), and the voice packet transmitted from the partner IP phone 109 to the own IP phone 103 It is composed of a voice packet 1003 which is transmission time information 1100 (the set value is equal to 1102A described in FIG. 11).

相手側タイムスタンプ用パケット1000は、自分側タイムスタンプ用パケット600と同様に、相手側IP電話109で生成、送出され、相手側TVアダプタ110で受信され解析・分解されて後述する映像データの再生時に用いられる(詳細は図7にて後述)。   The counterpart time stamp packet 1000 is generated and transmitted by the counterpart IP phone 109, received by the counterpart TV adapter 110, analyzed and disassembled, and video data reproduction described later, as with the own time stamp packet 600. Sometimes used (details will be described later in FIG. 7).

なお、図6と図10のパケット構成はフォーマットが同一であり、図6のパケット600は自分側音声動画通信装置112で用いられ、図10のパケット1000は相手側音声動画通信装置113で用いられているのが異なっている点である。   6 and FIG. 10 have the same format. The packet 600 in FIG. 6 is used by the own audio / video communication device 112, and the packet 1000 in FIG. What is different is.

次に図1のシステム100の構成において、自分側IP電話103及び109、自分側TVアダプタ102及び110の間で、音声データのリアルタイム性を損なわず、また、音声データと映像データの同期タイミングの乱れを抑制し、かつ、パケットのデータ量の減少に起因する音質、映像品質の劣化などによる通信パフォーマンスの不満足感を利用者に与えない動作を図7に示すシーケンス図を参照して説明する。   Next, in the configuration of the system 100 of FIG. 1, the real-time property of the audio data is not impaired between the own IP telephones 103 and 109 and the own TV adapters 102 and 110, and the synchronization timing of the audio data and the video data is not affected. With reference to the sequence diagram shown in FIG. 7, an explanation will be given of the operation that suppresses the disturbance and does not give the user unsatisfactory communication performance due to the deterioration of the sound quality and the video quality due to the decrease in the data amount of the packet.

図7は、音声動画通信システムの動作を説明するシーケンス図である。本シーケンスは、自分側データ通信装置112が備える映像通信制御部203及び音声通信制御部302と相手側データ通信装置113が備える図2、3と同様の映像制御通信部及び音声通信制御部との間で実施される。   FIG. 7 is a sequence diagram for explaining the operation of the audio video communication system. This sequence includes the video communication control unit 203 and the audio communication control unit 302 included in the local data communication device 112 and the video control communication unit and the audio communication control unit similar to those illustrated in FIGS. Between.

自分側IP電話103は、ネットワーク接続が完了し、電源がオンされる(ステップS701)と、自分側TVアダプタ102に向けてペアリング要求のメッセージを継続的に発信する。自分側TVアダプタ102は、ネットワーク接続が完了し、電源がオンされると自分側IP電話103からのペアリング要求のメッセージに応答し、自分側IP電話103と自分側TVアダプタ102とのペアリングが確立する(ステップS701)。   When the network connection is completed and the power is turned on (step S701), the own IP phone 103 continuously sends a pairing request message to the own TV adapter 102. When the network connection is completed and the power is turned on, the own-side TV adapter 102 responds to a pairing request message from the own-side IP phone 103 and performs pairing between the own-side IP phone 103 and the own-side TV adapter 102. Is established (step S701).

相手側IP電話109と相手側TVアダプタ110でも同様の動作によりペアリングが確立する(ステップS702)。   The other party IP phone 109 and the other party TV adapter 110 establish pairing by the same operation (step S702).

自分側IP電話103から受話器をオフフックして相手側IP電話109にダイヤルすると、標準呼制御プロトコルSIP呼制御通信により、INVITEメッセージを送出すると、相手側IP電話109が鳴動し、相手側IP電話109が200OKメッセージを自分側IP電話103へ応答することによって双方向に会話のできる音声通信が確立する(ステップS703)。   When the handset is off-hooked from its own IP phone 103 and dialed to the other party's IP phone 109, when the INVITE message is sent by the standard call control protocol SIP call control communication, the other party's IP phone 109 rings and the other party's IP phone 109 Responds with a 200 OK message to its own IP phone 103 to establish voice communication capable of two-way conversation (step S703).

前記SIP呼制御通信のSIPメッセージに含まれるSDP(セッション記述プロトコル)の映像パケット送受信の設定により、自分側TVアダプタ102と相手側TVアダプタ110の間の映像通信も確立する(ステップS704)。   Video communication between the own TV adapter 102 and the other TV adapter 110 is also established by setting the SDP (Session Description Protocol) video packet transmission / reception included in the SIP message of the SIP call control communication (step S704).

音声通信が確立すると、自分側IP電話103と相手側IP電話109との間で音声パケットの双方向通信が開始する。自分側IP電話103から相手側IP電話109へ音声タイムスタンプ1102A(前記図11の説明参照)を含む音声パケット1100を送信する(ステップS705)。   When the voice communication is established, two-way voice packet communication is started between the IP phone 103 on the own side and the IP phone 109 on the other side. Voice packet 1100 including voice time stamp 1102A (see the description of FIG. 11) is transmitted from own IP phone 103 to counterpart IP phone 109 (step S705).

同様に、相手側IP電話109から自分側IP電話103へ音声タイムスタンプ1102B(前記図11の説明参照)を含む音声パケット1100を送信する(ステップS706)。   Similarly, voice packet 1100 including voice time stamp 1102B (see the description of FIG. 11) is transmitted from partner IP phone 109 to own IP phone 103 (step S706).

次に、自分側IP電話103から自分側TVアダプタ102に相手側IP電話109へ送信した音声タイムスタンプ602(設定値は1102Aに等しい)と相手側IP電話109から受信した音声タイムスタンプ603(設定値は1102Bに等しい)を搭載した自分側タイムスタンプ用パケット600を自分側TVアダプタ102へ通知する(ステップS707)。   Next, the voice time stamp 602 (set value is equal to 1102A) sent from the own IP phone 103 to the own TV adapter 102 to the other party IP phone 109 and the voice time stamp 603 (setting) received from the other party IP phone 109 The own-side time stamp packet 600 with the value equal to 1102B is notified to the own-side TV adapter 102 (step S707).

同様に、相手側IP電話109から相手側TVアダプタ110へ、自分側IP電話103から送信した音声タイムスタンプ1002(設定値は1102Bに等しい)と自分側IP電話103から受信した音声タイムスタンプ1003(設定値は1102Aに等しい)を含む相手側タイムスタンプ用パケット1000を相手側TVアダプタ110へ通知する(ステップS708)。   Similarly, the voice time stamp 1002 (set value is equal to 1102B) transmitted from the own IP phone 103 to the other party TV adapter 110 from the other party IP phone 109 and the voice time stamp 1003 received from the own IP phone 103 ( The partner side time stamp packet 1000 including the set value is equal to 1102A is notified to the partner side TV adapter 110 (step S708).

映像通信が確立すると、自分側TVアダプタ102と相手側TVアダプタ110との間で映像パケットの双方向通信が開始する。自分側TVアダプタ102は、相手側TVアダプタ110へ音声タイムスタンプ502A(符号Aについては前記図5の説明を参照)を含む映像パケット400を送信する(ステップS709)。   When video communication is established, bi-directional communication of video packets between the own TV adapter 102 and the other TV adapter 110 starts. The own TV adapter 102 transmits the video packet 400 including the audio time stamp 502A (refer to the description of FIG. 5 for the symbol A) to the other TV adapter 110 (step S709).

同様に、相手側TVアダプタ110は、自分側TVアダプタ102へ音声タイムスタンプ502B(符号Bについては前記図5の説明を参照)を含む映像パケット400を送信する(ステップS710)。   Similarly, the partner TV adapter 110 transmits the video packet 400 including the audio time stamp 502B (refer to the description of FIG. 5 for the sign B) to the own TV adapter 102 (step S710).

以上の動作によって自分側TVアダプタ102は、音声送信時刻情報を映像パケット400が含む音声タイムスタンプ502B及び自分側タイムスタンプ用パケット600が含む音声タイムスタンプ603(設定値は1102Bに等しい)の2つの音声タイムスタンプを取得する。   With the above operation, the own TV adapter 102 has two audio time stamps 502B included in the video packet 400 and the audio time stamp 603 included in the own time stamp packet 600 (the setting value is equal to 1102B). Get audio time stamp.

前記2つの音声タイムスタンプにより、音声パケットと映像パケットの2つのパケットの到達時間の相対的な早さの判定の識別ができる。   With the two audio time stamps, it is possible to identify a determination of the relative speed of arrival time of two packets, that is, an audio packet and a video packet.

自分側TVアダプタ102では、前記2つの音声タイムスタンプの値を基準に、次の比較判定によりリップシンク再生(音声と声をだす唇の動きが同期した映像の再生)を行う。
(1)音声タイムスタンプ502Bが音声タイムスタンプ1102Bに等しいときは映像パケットと音声パケットの同期ずれがないと判断し、映像再生の処理を開始する。
(2)音声タイムスタンプ502Bが音声タイムスタンプ1102Bより大きいときは、映像パケットが音声パケットよりも遅れていると判断し、映像パケットは破棄して映像再生しない。
(3)音声タイムスタンプ502Bが音声タイムスタンプ1102Bより小さいときは、音声パケットが映像パケットよりも遅れていると判断し、映像パケットはバッファリングし、次の音声パケット到達時以降に、映像は音声とタイミングを同期させて再生する(ステップS711)。
The own-side TV adapter 102 performs lip sync reproduction (reproduction of video in which the movement of the lip that produces voice and voice is synchronized) by the following comparison determination based on the two audio time stamp values.
(1) When the audio time stamp 502B is equal to the audio time stamp 1102B, it is determined that there is no synchronization deviation between the video packet and the audio packet, and the video reproduction process is started.
(2) When the audio time stamp 502B is larger than the audio time stamp 1102B, it is determined that the video packet is behind the audio packet, and the video packet is discarded and the video is not reproduced.
(3) When the audio time stamp 502B is smaller than the audio time stamp 1102B, it is determined that the audio packet is behind the video packet, the video packet is buffered, and the video is audio after the next audio packet arrives. And the timing is reproduced (step S711).

なお、音声のリアルタイム性を損なうことなく、かつ音声データと映像データの再生タイミングの乱れの抑制が本発明の目的であるため、前記(1)、(2)、(3)の判断処理における音声タイムスタンプの比較は厳密である必要はなく、例えば、比較において“ほぼ等しい”場合は“等しい”とするように、判定比較は所定の範囲のずれの許容値をもって行ってもかまわない。   Note that the purpose of the present invention is to suppress the disturbance of the reproduction timing of audio data and video data without impairing the real-time property of the audio, and therefore the audio in the determination processes (1), (2), and (3) described above. The comparison of the time stamps does not need to be strict, and for example, the determination comparison may be performed with a tolerance of deviation within a predetermined range so that it is “equal” when “substantially equal” in the comparison.

相手側TVアダプタ110でも、音声タイムスタンプ1102Aと音声タイムスタンプ502Aを基準に、自分側TVアダプタ102と同様のリップシンク再生を行う(ステップS712)。   The counterpart TV adapter 110 also performs lip sync playback similar to that of the own TV adapter 102 based on the audio time stamp 1102A and the audio time stamp 502A (step S712).

次に、自分側IP電話103の動作について、図8に示すフローチャートを参照して説明する。図8は自分側IP電話103の動作を説明するフローチャートである。フローチャートは主に図3の音声通信制御部で実施される。なお、相手側IP電話109も同様のフローによって動作する。   Next, the operation of own IP phone 103 will be described with reference to the flowchart shown in FIG. FIG. 8 is a flowchart for explaining the operation of the own IP phone 103. The flowchart is mainly implemented by the voice communication control unit of FIG. The other party's IP phone 109 operates in the same flow.

自分側IP電話103のネットワーク接続が完了し、電源がオンされる(ステップS801)と自分側TVアダプタ102に向けてペアリング要求のメッセージを継続的に発信する。   When the network connection of the own IP phone 103 is completed and the power is turned on (step S801), a pairing request message is continuously transmitted to the own TV adapter 102.

自分側TVアダプタ102がペアリング要求に応答することで、自分側IP電話103と自分側TVアダプタ102とがペアリングが確立する(ステップS802)。   When the own TV adapter 102 responds to the pairing request, pairing is established between the own IP phone 103 and the own TV adapter 102 (step S802).

自分側IP電話103から受話器307をオフフックして相手側IP電話109にダイヤルすると、SIP呼制御メッセージの通信により、INVITEメッセージを送出し、200OKメッセージの応答を受信することによって双方向に会話のできる音声通信が確立する(ステップS803)。   When the handset 307 is off-hooked from the own-side IP phone 103 and dialed to the other-side IP phone 109, an INVITE message is transmitted by communication of the SIP call control message, and a two-way conversation can be performed by receiving a response of the 200 OK message. Voice communication is established (step S803).

音声通信が確立すると、自分側IP電話103は相手側IP電話109との間で音声パケットの双方向通信を開始する(ステップS804)。   When the voice communication is established, the local IP phone 103 starts two-way communication of voice packets with the counterpart IP phone 109 (step S804).

この際、自分側IP電話103は、音声タイムスタンプ1102Aを含む音声パケットを相手側IP電話109に送信する(ステップS805)。   At this time, the own IP phone 103 transmits a voice packet including the voice time stamp 1102A to the counterpart IP phone 109 (step S805).

また、自分側IP電話103は、相手側IP電話109から音声タイムスタンプ1102Bを含む音声パケット受信する(ステップS806)。   In addition, own IP phone 103 receives the voice packet including voice time stamp 1102B from partner IP phone 109 (step S806).

次に、自分側IP電話103は、受信した音声を順次リアルタイムに再生する(ステップS807)。   Next, the own IP phone 103 sequentially reproduces the received voice in real time (step S807).

次に、自分側IP電話103から自分側TVアダプタ102へ相手側IP電話109から送信した音声タイムスタンプ602(設定値は1102Aに等しい)と相手側IP電話109から受信した音声タイムスタンプ603(設定値は1102Bに等しい)を含む自分側タイムスタンプ用パケット600を自分側TVアダプタ102に通知する(ステップS808)。   Next, the voice time stamp 602 (set value is equal to 1102A) transmitted from the partner IP phone 109 to the own TV adapter 102 from the own IP phone 103 and the voice time stamp 603 (setting) set from the partner IP phone 109 The own-side time stamp packet 600 including the value equal to 1102B is notified to the own-side TV adapter 102 (step S808).

順次、音声パケットの送受信を行い、通話が終了すると音声通信は終了する(ステップS809)。   The voice packets are sequentially transmitted and received, and the voice communication ends when the call ends (step S809).

以上のように、自分側IP電話103では、前記ステップS808以外は標準準拠の呼制御の動作を行うものであり、音声通信制御部302における処理負担の増加は発生せず、これによってリアルタイム性を損なうものではない。   As described above, the IP phone 103 on the own side performs standard-compliant call control operations except for step S808, and the processing load on the voice communication control unit 302 does not increase, thereby improving the real-time property. There is no loss.

次に、自分側TVアダプタ102の動作について、図9に示すフローチャートを参照して説明する。図9は、自分側TVアダプタ102の動作を説明するフローチャートである。フローチャートは、主に図2の映像通信制御部203で実施される。なお、相手側TVアダプタ110も同様のフローによって動作する。   Next, the operation of the own TV adapter 102 will be described with reference to the flowchart shown in FIG. FIG. 9 is a flowchart for explaining the operation of the own TV adapter 102. The flowchart is mainly executed by the video communication control unit 203 of FIG. The counterpart TV adapter 110 operates according to the same flow.

自分側TVアダプタ102は、ネットワーク接続が完了し、電源がオンされる(ステップS901)と自分側IP電話103からのペアリング要求のメッセージに応答し、自分側IP電話103と自分側TVアダプタ102とペアリングが確立する(ステップS902)。   When the network connection is completed and the power is turned on (step S901), the own-side TV adapter 102 responds to a pairing request message from the own-side IP phone 103, and the own-side IP phone 103 and the own-side TV adapter 102 And pairing are established (step S902).

図7で説明したように、自分側IP電話103が相手側IP電話109と呼制御により音声通信を確立すると、自分側TVアダプタ102は相手側TVアダプタ110との間で映像通信が確立し(ステップS903)、映像パケットの双方向通信を開始する(ステップS904)。   As described with reference to FIG. 7, when the local IP phone 103 establishes voice communication with the counterpart IP phone 109 through call control, the local TV adapter 102 establishes video communication with the counterpart TV adapter 110 ( In step S903), bidirectional communication of the video packet is started (step S904).

自分側TVアダプタ102は、自分側IP電話103から相手側IP電話109に送信した音声タイムスタンプ602(設定値は1102Aに等しい)と相手側IP電話109から受信した音声タイムスタンプ603(設定値は1102Bに等しい)を搭載した自分側タイムスタンプ用パケット600を受信する(ステップS905)。   The own TV adapter 102 transmits the voice time stamp 602 (set value is equal to 1102A) transmitted from the own IP phone 103 to the other party IP phone 109 and the voice time stamp 603 (set value is the same as the set value is 1102A). The self-time stamp packet 600 loaded with “equal to 1102B” is received (step S905).

自分側TVアダプタ102は、相手側TVアダプタ110へ音声タイムスタンプ502A(符号Aについては前記図5の説明を参照)を含む映像パケット400を送信する(S906)。   The own-side TV adapter 102 transmits the video packet 400 including the audio time stamp 502A (refer to the description of FIG. 5 for the code A) to the other-side TV adapter 110 (S906).

また、自分側TVアダプタ102は、相手側TVアダプタ110から音声タイムスタンプ502B(符号Bについては前記図5の説明を参照)を含む映像パケット400を受信する(ステップS907)。   In addition, the own TV adapter 102 receives the video packet 400 including the audio time stamp 502B (refer to the description of FIG. 5 for the code B) from the other TV adapter 110 (step S907).

以上の動作によって、自分側TVアダプタ102は、映像パケット400が含む音声タイムスタンプ502B及び自分側タイムスタンプ用パケット600が含む音声タイムスタンプ603(設定値は1102Bに等しい)の2つの音声タイムスタンプを得る。   As a result of the above operation, the own-side TV adapter 102 obtains two audio time stamps of the audio time stamp 502B included in the video packet 400 and the audio time stamp 603 included in the own-side time stamp packet 600 (the setting value is equal to 1102B). obtain.

前記2つの音声タイムスタンプにより、音声パケットと映像パケットの2つのパケットの到達時間の相対的な早さを判定できる。   Based on the two audio time stamps, it is possible to determine a relative speed of arrival time of two packets of the audio packet and the video packet.

自分側TVアダプタ102は、音声タイムスタンプ502Bが音声タイムスタンプ1102Bに等しいか比較を行う(ステップS908)。   The own TV adapter 102 compares whether the audio time stamp 502B is equal to the audio time stamp 1102B (step S908).

自分側TVアダプタ102は、ステップS908の判定結果で音声タイムスタンプ502Bが音声タイムスタンプ1102Bに等しいときは、映像パケットと音声パケットの同期ずれがないと判断し、映像再生の処理を開始する(ステップS909)。   When the audio time stamp 502B is equal to the audio time stamp 1102B as a result of the determination in step S908, the own TV adapter 102 determines that there is no synchronization between the video packet and the audio packet, and starts the video reproduction process (step S909).

ステップS908でそれが等しくない場合は、自分側TVアダプタ102は音声タイムスタンプ502Bが音声タイムスタンプ1102Bより大きいか比較を行う(ステップS910)。   If they are not equal in step S908, the TV adapter 102 on the local side compares whether the audio time stamp 502B is greater than the audio time stamp 1102B (step S910).

自分側TVアダプタ102は、音声タイムスタンプ502Bが音声タイムスタンプ1102Bより大きいときは、映像パケットが音声パケットよりも遅れていると判断し、映像パケットは破棄して映像再生しない(ステップS911)。   When the audio time stamp 502B is larger than the audio time stamp 1102B, the own-side TV adapter 102 determines that the video packet is behind the audio packet, discards the video packet, and does not reproduce the video (step S911).

自分側TVアダプタ102は、ステップS910の判定結果で音声タイムスタンプ502Bが音声タイムスタンプ1102Bより小さいときは、音声パケットが映像パケットよりも遅れていると判断し、映像パケットはバッファリングし、次の音声パケット到達以降に音声に同期させ映像再生する(ステップS912)。   When the audio time stamp 502B is smaller than the audio time stamp 1102B in the determination result in step S910, the own-side TV adapter 102 determines that the audio packet is behind the video packet, buffers the video packet, and After the audio packet arrives, the video is reproduced in synchronization with the audio (step S912).

順次、映像パケットの送受信を行い、映像通信は終了する(ステップS913)。   The video packets are sequentially transmitted and received, and the video communication ends (step S913).

なお、シーケンス図の説明でも説明したように、上記ステップS908,S910の比較は所定の許容幅をもって行ってもかまわない。   As described in the description of the sequence diagram, the comparison of steps S908 and S910 may be performed with a predetermined tolerance.

以上の実施例で説明したように、帯域保証のないインターネットにおいてリアルタイムに双方向の通話を行うIPテレビ電話の実現において、音声を送受信するIP電話は本実施例でのパケット処理の大きな負荷増大はなく、リアルタイム性を損なうことはない。   As described in the above embodiments, in the realization of an IP videophone that performs a two-way call in real time on the Internet without bandwidth guarantee, the IP phone that transmits and receives voices does not significantly increase the load of packet processing in this embodiment. And real-time performance is not impaired.

さらに、映像を送受信するTVアダプタは、音声パケットと映像パケットの2つのパケットで独立に受信された、音声送信時刻情報の比較により、映像パケットの到達時間が音声パケットの到達時間と同じか、あるいは早いか遅いかを判定し、映像データを再生制御するので、簡易かつ高速に音声との同期ずれを抑制することが可能となる。   Further, the TV adapter for transmitting and receiving video may receive the same time as the arrival time of the audio packet by comparing the audio transmission time information received independently in the two packets of the audio packet and the video packet, or Since it is determined whether it is early or late, and video data is reproduced and controlled, it is possible to suppress synchronization deviation with audio easily and at high speed.

また、送受信するパケットのデータ量を減少させることはないので、音質、映像品質の劣化などによる通信パフォーマンスの不満足感を利用者に与えることなく音声、映像が再生できる。   Further, since the amount of data of packets to be transmitted / received is not reduced, it is possible to reproduce audio and video without giving the user unsatisfactory communication performance due to deterioration of sound quality and video quality.

本発明を実施例に基づいて詳細に説明したが、これらの実施例はあくまでも例示であって、本発明は実施例によって限定されるものではない。本実施例ではIP電話とTVアダプタを分離したが、IP電話とTVアダプタを一体化しても同様の効果が得られる。   Although the present invention has been described in detail based on examples, these examples are merely examples, and the present invention is not limited to the examples. In this embodiment, the IP phone and the TV adapter are separated, but the same effect can be obtained by integrating the IP phone and the TV adapter.

さらに、本実施例では、パケットの受信毎に音声パケット発信時刻情報を基準にした映像再生の比較判定をしたが、IP電話及びTVアダプタの具備するメモリ、CPU処理能力に応じ、パケットの受信毎でなく、所定の間隔で音声パケット発信時刻情報を基準にした映像再生の比較判定をしても同様の効果が得られる。   Further, in this embodiment, the video reproduction comparison determination is performed based on the voice packet transmission time information every time a packet is received. However, every time a packet is received according to the memory and CPU processing capability of the IP phone and the TV adapter. Alternatively, the same effect can be obtained by making a video reproduction comparison determination based on the voice packet transmission time information at predetermined intervals.

さらに、本実施例ではIP電話を電話機と一体化したが、IP電話をIP電話アダプタと電話機に分離して構成しても同様の効果が得られる。   Further, in this embodiment, the IP telephone is integrated with the telephone, but the same effect can be obtained even if the IP telephone is separated into the IP telephone adapter and the telephone.

さらに、本実施例では、TVアダプタはTVと分離したが、TVアダプタとTVを一体化しても同様の効果が得られる。   Further, in this embodiment, the TV adapter is separated from the TV, but the same effect can be obtained even if the TV adapter and the TV are integrated.

また、本実施例ではインターネット106、モデム105及び107、ルータ104及び108を備えていたが、インターネット106、モデム105及び107、ルータ104及び108、のいずれかを必要に応じ省き、自分側IP電話103及び相手側IP電話109、自分側TVアダプタ102及び相手側TVアダプタ110、テレビTV101及びTV111を同一IPアドレス空間のLAN等のネットワーク上に備えても同様の効果が得られる。   In this embodiment, the Internet 106, the modems 105 and 107, and the routers 104 and 108 are provided. However, any one of the Internet 106, the modems 105 and 107, and the routers 104 and 108 is omitted as necessary, and the own IP phone is provided. The same effect can be obtained by providing 103 and the other party's IP telephone 109, the own TV adapter 102, the other party's TV adapter 110, the television TV 101 and the TV 111 on a network such as a LAN in the same IP address space.

本発明の音声動画通信装置は、LANやインターネット、IP通信網等のネットワークを介して音声と映像の双方向リアルタイム通信を行うに際し、音声データのリアルタイム性を損なわず、音声データと映像データの同期タイミングの乱れを抑制することが可能となり、送受信するパケットのデータ量を減少させることはないので、音質、映像品質の劣化などによる通信パフォーマンスの不満足感を利用者に与えることなく音声、映像が再生できるので、音声動画の双方向リアルタイムデータ通信装置及びそれを用いたシステムとして利用することが可能である。   The audio-video communication device of the present invention can synchronize audio data and video data without losing the real-time property of audio data when performing bidirectional real-time communication of audio and video via a network such as a LAN, the Internet, or an IP communication network. It is possible to suppress timing fluctuations and does not reduce the amount of packet data to be transmitted / received, so audio and video can be played without giving users dissatisfaction with communication performance due to degradation of sound quality and video quality. Therefore, the present invention can be used as a two-way real-time data communication device for audio / video and a system using the same.

本発明の実施例の音声動画通信システムの構成図Configuration diagram of an audio-video communication system according to an embodiment of the present invention 本実施例の音声動画通信システムで用いられる自分側TVアダプタの構成を示すブロック図The block diagram which shows the structure of the own side TV adapter used with the audio video communication system of a present Example. 本実施例の音声動画通信システムで用いられる自分側IP電話の構成を示すブロック図The block diagram which shows the structure of the own side IP telephone used with the audio video communication system of a present Example. 本実施例の自分側TVアダプタと相手側TVアダプタの間で送受信される映像パケットの構成図The block diagram of the video packet transmitted / received between the own side TV adapter and the other party TV adapter of a present Example 本実施例の音声送信時刻情報用ヘッダ拡張の構成図Configuration diagram of header extension for voice transmission time information in this embodiment 本実施例の音声動画通信システムの自分側IP電話から自分側TVアダプタに通知される自分側タイムスタンプ用パケットの構成図Configuration diagram of own time stamp packet notified to own TV adapter from own IP phone of audio / video communication system of this embodiment 本実施例の音声動画通信システムの動作を説明するシーケンス図Sequence diagram for explaining the operation of the audio-video communication system of the present embodiment 本実施例の自分側IP電話の動作を説明するフローチャートFlowchart for explaining the operation of the own IP phone of this embodiment 本実施例の自分側TVアダプタの動作を説明するフローチャートFlowchart for explaining the operation of the own TV adapter of this embodiment 本実施例の相手側IP電話から相手側TVアダプタに通知される相手側タイムスタンプ用パケットの構成図Configuration diagram of the other party time stamp packet notified from the other party IP phone of this embodiment to the other party TV adapter 本実施例の自分側IP電話と相手側IP電話の間で送受信される音声パケットの構成図Configuration diagram of voice packet transmitted / received between own IP phone and partner IP phone of this embodiment

符号の説明Explanation of symbols

100 音声動画通信システム
102 自分側TVアダプタ
103 自分側IP電話
109 相手側IP電話
110 相手側TVアダプタ
112 自分側音声動画通信装置
113 相手側音声動画通信装置
203 映像通信制御部
302 音声通信制御部
400 映像パケット
407 音声送信時刻情報用ヘッダ拡張
600 自分側タイムスタンプ用パケット
1000 相手側タイムスタンプ用パケット
1100 音声パケット
DESCRIPTION OF SYMBOLS 100 Audio video communication system 102 Own side TV adapter 103 Own side IP telephone 109 Other party IP telephone 110 Other party TV adapter 112 Own side audio video communication apparatus 113 Other party audio video communication apparatus 203 Video communication control part 302 Audio communication control part 400 Video packet 407 Audio transmission time information header extension 600 Local time stamp packet 1000 Remote side time stamp packet 1100 Audio packet

Claims (6)

通信ネットワークを介して接続されたデータ通信端末装置間で音声データ及び映像デーを双方向に送受信する音声動画通信システムにおいて、
前記データ通信端末装置は、音声データの送信時刻情報を音声パケット及び映像パケットの2つのパケットに付加し順次送信するパケット送信部と
前記2つのパケットを受信する受信部と
前記2つのパケットに含まれる音声データの送信時刻情報それぞれを比較する比較部と、
前記比較部によって比較した結果、
前記送信時刻情報と実質的に同一の時刻情報の場合は、受信した音声データと映像データとの同期がとれていると判断して受信した映像を再生し、
映像パケットに付加された送信時刻情報が音声パケットに付加された前記送信時刻情報より遅れた時刻情報の場合は、受信した音声データと映像データとの同期がとれていないと判断して受信した映像データを破棄し、
映像パケットに付加された送信時刻情報が音声パケットに付加された前記送信時刻情報より早い時刻情報の場合は、受信した音声データと映像データとの同期がとれていないと判断して受信した映像データをバッファリングする
いずれかの処理を行う制御部とを備え、
これらの機能を備えたデータ通信端末装置の間で、通信ネットワークを介して音声データと映像データを対話的に送受信することを、特徴とする音声動画通信システム。
In an audio / video communication system for transmitting and receiving audio data and video data bidirectionally between data communication terminal devices connected via a communication network,
The data communication terminal apparatus includes a packet transmitting unit that sequentially transmits audio data transmission time information added to two packets of an audio packet and a video packet, a receiving unit that receives the two packets, and the two packets. A comparison unit that compares each transmission time information of the audio data;
As a result of comparison by the comparison unit,
If the time information is substantially the same as the transmission time information, the received audio data and the video data are determined to be synchronized, and the received video is reproduced.
When the transmission time information added to the video packet is time information delayed from the transmission time information added to the audio packet, it is determined that the received audio data and the video data are not synchronized, and the received video Destroy the data,
If the transmission time information added to the video packet is earlier than the transmission time information added to the audio packet, the received video data is determined to be out of synchronization with the received audio data. A control unit for performing any processing for buffering,
An audio-video communication system characterized in that audio data and video data are interactively transmitted and received through a communication network between data communication terminal devices having these functions.
パケット化された音声データ及び映像データを相手側装置と通信ネットワークを介して双方向に送受信するデータ通信端末装置であって、
音声データの送信時刻情報を音声パケット及び映像パケットの2つのパケットに付加し順次送信するパケット送信部と、前記2つのパケットを受信する受信部と、
前記2つのパケットに含まれる音声データの送信時刻情報を比較する比較部と、
前記比較部によって比較した結果、
前記送信時刻情報が実質的に同一の時刻情報の場合は、受信した音声データと映像データとの同期がとれていると判断して受信した映像を再生し、
映像パケットに付加された送信時刻情報が音声パケットに付加された前記送信時刻情報より遅れた時刻情報の場合は、受信した音声データと映像データとの同期がとれていないと判断して受信した映像データを破棄し、
映像パケットに付加された送信時刻情報が音声パケットに付加された前記送信時刻情報より早い時刻情報の場合は、受信した音声データと映像データとの同期がとれていないと判断して受信した映像データをバッファリングする
いずれかの処理を行う制御部とを備えたことを、特徴したデータ通信端末装置。
A data communication terminal device for bidirectionally transmitting / receiving packetized audio data and video data to / from a counterpart device via a communication network,
A packet transmission unit that sequentially transmits the transmission time information of audio data to two packets of an audio packet and a video packet, and a reception unit that receives the two packets;
A comparison unit for comparing transmission time information of audio data included in the two packets;
As a result of comparison by the comparison unit,
If the transmission time information is substantially the same time information, it is determined that the received audio data and video data are synchronized, and the received video is reproduced,
When the transmission time information added to the video packet is time information delayed from the transmission time information added to the audio packet, it is determined that the received audio data and the video data are not synchronized, and the received video Destroy the data,
If the transmission time information added to the video packet is earlier than the transmission time information added to the audio packet, the received video data is determined to be out of synchronization with the received audio data. A data communication terminal device comprising: a control unit that performs any processing for buffering the data.
通信ネットワークを介して接続されたデータ通信端末装置間で音声データ及び映像デーを双方向に送受信する音声動画通信システムにおいて、
前記データ通信端末装置は、少なくとも、音声データとこの音声データの送信時刻情報を含む音声パケットを順次送受信する電話装置と、映像データと前記音声データの送信時刻情報を含む映像パケットを順次送受信するTVアダプタを備え、
前記電話装置には、自分側電話装置から相手側電話装置に送信した音声パケットに含まれる音声データの送信時刻情報Aと、相手側電話装置から受信した音声パケットに含まれる音声データの送信時刻情報B1とを自分側TVアダプタに通知する音声通信制御部を備え、
前記TVアダプタには、自分側電話装置から送信されてきた前記音声データの送信時刻情報のうち、送信時刻情報Aを含む映像パケットを相手側TVアダプタに送信する送信部と、
相手側TVアダプタで前記と同様にして作られた音声データの送信時刻情報B2を含む映像パケットを受信する受信部と、
前記送信時刻情報B1と前記送信時刻情報B2とを比較する比較部と、
前記比較部によって比較した結果、
前記送信時刻情報B1が前記送信時刻情報B2と実質的に同一の時刻情報の場合は、受信した音声データと同期がとれていると判断して受信した映像を再生し、
前記送信時刻情報B2が前記送信時刻情報B1より遅れた時刻情報の場合は、受信した音声データと同期がとれていないと判断して受信した映像データを破棄し、
前記送信時刻情報B2が前記送信時刻情報B1より早い時刻情報の場合は、受信した音声データと同期がとれていないと判断して、映像データをバッファリングする
いずれかの処理を行う制御部とを備え、
これらの機能を備えたデータ通信端末装置の間で、通信ネットワークを介して音声データと映像データを対話的に送受信することを、特徴とする音声動画通信システム。
In an audio / video communication system for transmitting and receiving audio data and video data bidirectionally between data communication terminal devices connected via a communication network,
The data communication terminal device includes: a telephone device that sequentially transmits / receives at least audio data and an audio packet including transmission time information of the audio data; and a TV that sequentially transmits / receives video packet including image data and transmission time information of the audio data. With an adapter,
The telephone device includes transmission time information A of voice data included in a voice packet transmitted from the local telephone device to the counterpart telephone device, and transmission time information of voice data included in a voice packet received from the counterpart telephone device. A voice communication control unit for notifying B1 to the TV adapter on its own side,
In the TV adapter, a transmission unit that transmits a video packet including transmission time information A to the other TV adapter among transmission time information of the audio data transmitted from the own telephone device;
A receiving unit for receiving a video packet including transmission time information B2 of audio data created in the same manner as described above by the other-side TV adapter;
A comparison unit for comparing the transmission time information B1 and the transmission time information B2,
As a result of comparison by the comparison unit,
When the transmission time information B1 is substantially the same time information as the transmission time information B2, the received video is determined to be synchronized with the received audio data, and the received video is reproduced.
If the transmission time information B2 is time information delayed from the transmission time information B1, it is determined that the received audio data is not synchronized, and the received video data is discarded.
If the transmission time information B2 is earlier than the transmission time information B1, it is determined that the transmission time information B2 is not synchronized with the received audio data, and a control unit that performs any processing for buffering video data is provided. Prepared,
An audio-video communication system characterized in that audio data and video data are interactively transmitted and received through a communication network between data communication terminal devices having these functions.
パケット化された音声データ及び映像データを相手側装置と通信ネットワークを介して双方向に送受信するデータ通信端末装置であって、
少なくとも、音声データとこの音声データの送信時刻情報を含む音声パケットを順次送受信する電話装置と、映像データと前記音声データの送信時刻情報を含む映像パケットを順次送受信するTVアダプタを備え、
前記電話装置には、自分側電話装置から相手側電話装置に送信した音声パケットに含まれる音声データの送信時刻情報Aと、相手側電話装置から受信した音声パケットに含まれる音声データの送信時刻情報B1とを自分側TVアダプタに通知する音声通信制御部を備え、
前記TVアダプタには、自分側電話装置から送信されてきた前記音声データの送信時刻情報のうち、送信時刻情報Aを含む映像パケットを相手側TVアダプタに送信する送信部と、
相手側TVアダプタで前記と同様にして作られた音声データの送信時刻情報B2を含む映像パケットを受信する受信部と、
前記送信時刻情報B1と前記送信時刻情報B2とを比較する比較部と、
前記比較部によって比較した結果、
前記送信時刻情報B1が前記送信時刻情報B2と実質的に同一の時刻情報の場合は、受信した音声データと同期がとれていると判断して受信した映像を再生し、
前記送信時刻情報B2が前記送信時刻情報B1より遅れた時刻情報の場合は、受信した音声データと同期がとれていないと判断して受信した映像データを破棄し、
前記送信時刻情報B2が前記送信時刻情報B1より早い時刻情報の場合は、受信した音声データと同期がとれていないと判断して、映像データをバッファリングする
いずれかの処理を行う制御部とを備えたことを、特徴したデータ通信端末装置。
A data communication terminal device for bidirectionally transmitting / receiving packetized audio data and video data to / from a counterpart device via a communication network,
At least, a telephone device that sequentially transmits and receives audio data and audio packets including transmission time information of the audio data, and a TV adapter that sequentially transmits and receives video data and video packets including the transmission time information of the audio data,
The telephone device includes transmission time information A of voice data included in a voice packet transmitted from the local telephone device to the counterpart telephone device, and transmission time information of voice data included in a voice packet received from the counterpart telephone device. A voice communication control unit for notifying B1 to the TV adapter on its own side,
In the TV adapter, a transmission unit that transmits a video packet including transmission time information A to the other TV adapter among transmission time information of the audio data transmitted from the own telephone device;
A receiving unit for receiving a video packet including transmission time information B2 of audio data created in the same manner as described above by the other-side TV adapter;
A comparison unit for comparing the transmission time information B1 and the transmission time information B2,
As a result of comparison by the comparison unit,
When the transmission time information B1 is substantially the same time information as the transmission time information B2, the received video is determined to be synchronized with the received audio data, and the received video is reproduced.
If the transmission time information B2 is time information delayed from the transmission time information B1, it is determined that the received audio data is not synchronized, and the received video data is discarded.
If the transmission time information B2 is earlier than the transmission time information B1, it is determined that the transmission time information B2 is not synchronized with the received audio data, and a control unit that performs any processing for buffering video data is provided. A data communication terminal device characterized by comprising.
所定の回数の音声パケット受信毎に、前記電話装置から前記TVアダプタへ前記音声データの送信時刻情報を通知することを、更に、特徴とする請求項3記載の音声動画通信システム。 4. The audio-video communication system according to claim 3, further comprising notifying the transmission time information of the audio data from the telephone device to the TV adapter every time a predetermined number of audio packets are received. 所定の回数の音声パケット受信毎に、前記電話装置から前記TVアダプタへ前記音声データの送信時刻情報を通知することを、更に、特徴とする請求項4記載のデータ通信端末装置。 5. The data communication terminal device according to claim 4, further comprising notifying the transmission time information of the audio data from the telephone device to the TV adapter every time a predetermined number of audio packets are received.
JP2005251176A 2005-08-31 2005-08-31 Audio and animation communication system and data communication terminal Pending JP2007067826A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005251176A JP2007067826A (en) 2005-08-31 2005-08-31 Audio and animation communication system and data communication terminal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005251176A JP2007067826A (en) 2005-08-31 2005-08-31 Audio and animation communication system and data communication terminal

Publications (1)

Publication Number Publication Date
JP2007067826A true JP2007067826A (en) 2007-03-15

Family

ID=37929495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005251176A Pending JP2007067826A (en) 2005-08-31 2005-08-31 Audio and animation communication system and data communication terminal

Country Status (1)

Country Link
JP (1) JP2007067826A (en)

Similar Documents

Publication Publication Date Title
US10930262B2 (en) Artificially generated speech for a communication session
US7843974B2 (en) Audio and video synchronization
CN101271720B (en) Synchronization process for mobile phone stream media audio and video
KR100763269B1 (en) Method, apparatus, system and program-recording medium for switching image coded data
US8208460B2 (en) Method and system for in-band signaling of multiple media streams
US20090305694A1 (en) Audio-video sharing system and audio-video sharing method thereof
JP2006014299A (en) Synchronizing method of video/audio data of mobile communication terminal
US8749611B2 (en) Video conference system
US6646674B1 (en) TV telephone system
JP4771369B2 (en) Media stream switching method, system and program in seamless handover
US8359620B2 (en) Set-top box for wideband IP telephony service and method for providing wideband IP telephony service using set-top box
JP5074834B2 (en) Audio / video synchronization method, audio / video synchronization system, and audio / video receiving terminal
CN108366044B (en) VoIP remote audio/video sharing method
JP4768250B2 (en) Transmission device, reception device, transmission / reception device, transmission method, and transmission system
JP2002058002A (en) Video telephone device
WO2007080788A1 (en) Teleconference control device and teleconference control method
JP2008167351A (en) Terminal device
JP2003198618A (en) Packet data communication system, portable telephone set and network side equipment
JP2007020095A (en) Information combination apparatus, information combination system, information synchronizing method and program
JP2005157045A (en) Voice transmission method
JP2007067826A (en) Audio and animation communication system and data communication terminal
JP2007081623A (en) Voice moving image communication system and data communication terminal
TWI468013B (en) Video conference system and method
CN114584520A (en) Method and apparatus for multiplexing data
KR100550801B1 (en) VOD service offering method by based on internet videophone system