WO2001043443A1 - Video encoding/transmitting device, video receiving/decoding device, video transmitting/receiving device, and video transmitting system - Google Patents

Video encoding/transmitting device, video receiving/decoding device, video transmitting/receiving device, and video transmitting system Download PDF

Info

Publication number
WO2001043443A1
WO2001043443A1 PCT/JP2000/008603 JP0008603W WO0143443A1 WO 2001043443 A1 WO2001043443 A1 WO 2001043443A1 JP 0008603 W JP0008603 W JP 0008603W WO 0143443 A1 WO0143443 A1 WO 0143443A1
Authority
WO
WIPO (PCT)
Prior art keywords
video
stream
receiving
synthesizing
data
Prior art date
Application number
PCT/JP2000/008603
Other languages
French (fr)
Japanese (ja)
Inventor
Morio Yoshimoto
Yukinari Matsuda
Susumu Oka
Original Assignee
Mitsubishi Denki Kabushiki Kaisha
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Denki Kabushiki Kaisha filed Critical Mitsubishi Denki Kabushiki Kaisha
Publication of WO2001043443A1 publication Critical patent/WO2001043443A1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Definitions

  • Video encoding and transmitting device video receiving and decoding device, video transmitting and receiving device, and video transmission system
  • the present invention relates to a video encoding and transmitting device, a video receiving and decoding device, a video transmitting and receiving device, and a video transmitting system for transmitting video and audio via a predetermined line, and more particularly to a video using an object encoding technology.
  • the present invention relates to an encoding transmission device, a video reception / decoding device, a video transmission / reception device, and a video transmission system.
  • FIG. 1 is a block diagram showing a conventional video encoding and transmitting apparatus described in, for example, Japanese Patent Application Laid-Open No. 10-42275.
  • reference numeral 101 denotes an NTSC (Nationa 1 Television System Comm ittee) video signal from a video camera that uses an image sensor such as a CCD (Charge Coup led Device).
  • a camera signal processing unit that performs signal processing such as decoding and A / D conversion.102 is a unit that encodes video signals after A / D conversion as moving image data using the H.261 method.
  • 103 is a moving image data encoding unit that encodes the video signal after A / D conversion as still image data using the JPEG Joint Photographic Experts Group (JPEG) method.
  • JPEG Joint Photographic Experts Group
  • 104 is an image data switching unit for switching image data to be transmitted
  • 105 is an audio signal processing unit for performing signal processing such as A / D conversion on an audio signal from the microphone.
  • 106 is the value after A / D conversion
  • An audio data encoding unit for encoding an audio signal 107 is a demultiplexing unit for multiplexing image data and audio data, and 108 is a line interface for transmitting the multiplexed data.
  • the data encoding unit 102 encodes the video signal after the AZD conversion as moving image data according to the H.261 method, and the still image data encoding unit 103 performs the AZD conversion.
  • the subsequent video signal is encoded as still image data in JPEG format.
  • the image data switching unit 104 switches the image data to be transmitted according to the movement of the object in the image, and supplies either the moving image data or the still image data to the demultiplexing unit 107.
  • the audio signal processing unit 105 performs signal processing such as A / D conversion on the audio signal from the microphone, and the audio data encoding unit 106 encodes the audio signal after AZD conversion.
  • the audio data is supplied to the demultiplexer 107.
  • the demultiplexing unit 107 multiplexes the image data and the audio data, and the line interface unit 108 transmits the multiplexed data via a line such as an ISDN line.
  • An object of the present invention is to encode a video signal on a transmission side, and a part or all of the encoded object and a previously object-coded object.
  • Video transmission device, video transmission / reception device, and video transmission that can transmit video data by combining the video data and transmitting the video so that the calling side of the caller is not specified on the receiving side.
  • Another object of the present invention is to provide a system in which a video signal is object-coded on a transmitting side, only a part of the coded object is transmitted, and the received object is previously encoded with a received object on a receiving side.
  • the coded object is synthesized and the synthesized video data is decoded so that the caller's calling place can be determined on the receiving side. It is an object of the present invention to obtain a video receiving / decoding device, a video transmitting / receiving device, and a video transmitting system capable of transmitting a video so as not to be specified and reducing the amount of data to be transmitted. Disclosure of the invention
  • a video encoding and transmitting apparatus includes: a media encoding unit that subjects an externally supplied video signal to object encoding; and a part or all of the object encoded by the media encoding unit.
  • Transmission stream synthesizing means for synthesizing an object encoded in advance with an object, and stream transmitting means for transmitting the video image synthesized by the transmission stream synthesizing means. It is prepared for.
  • the video encoding and transmitting apparatus is configured so that object encoding is performed in advance. It is equipped with a stream storage means for recording objects.
  • the transmission stream synthesizing unit may be configured to convert the video data output from the stream storage unit into a background with respect to the video data encoded by the media encoding unit. In this case, the composition processing is performed.
  • a video encoding and transmitting apparatus is configured such that the video image is a moving image or a still image.
  • a video encoding and transmitting apparatus includes a control unit that controls a transmission stream combining unit according to a transmission destination.
  • a video encoding and transmitting apparatus is configured to combine an audio signal supplied from the outside with a previously acquired audio signal, and then transmit audio data corresponding to the synthesized audio signal together with the video data. Is This has the effect of making it possible to prevent the caller's originating location from being specified on the receiving side.
  • the transmission stream synthesizing means may include an externally supplied audio data or an audio data supplied from the stream storage means and an externally supplied video data or stream. This is to combine the video data supplied from the ream storage means.
  • the video encoding / transmitting apparatus is configured to read out the object encoded in advance from the stream storage means, thereby simplifying the exchange of the object for synthesis.
  • the portability of the object to be synthesized is improved, and for example, an effect of being able to synthesize an object in the background of a place that has not been visited in the past is obtained.
  • the stream storage means records one or both of the video data and the audio data which have been previously encoded.
  • control unit selects an object to be output from the stream storage unit that records a plurality of objects encoded based on the communication partner or the communication date and time. This is what we do.
  • a video encoding and transmitting apparatus is configured to generate video data and audio data by performing coding according to the MPEG-4 system.
  • a video receiving and decoding apparatus includes: a stream receiving unit that receives object-encoded video data; and a part or all of the video data received by the stream receiving unit.
  • a receiving stream synthesizing means for synthesizing an object and an object which has been previously coded, and a media decoding means for decoding video data synthesized by the receiving stream synthesizing means. It is provided.
  • a video receiving / decoding apparatus includes stream storage means for recording an object encoded in advance.
  • the reception stream synthesizing means uses the video data output from the stream storage means as a background with respect to the video data received by the stream reception means. It is a combination process.
  • a video receiving / decoding device is such that video data is a moving image or a still image.
  • a video receiving / decoding apparatus is configured to combine an object of a person portion received by a stream receiving means with an object of a background portion which has been object-coded in advance. .
  • a video receiving and decoding apparatus includes a control unit that controls a receiving stream combining unit according to a transmission source.
  • a video receiving / decoding device is configured to synthesize an audio signal corresponding to audio data received by stream receiving means with an audio signal obtained in advance.
  • the receiving stream synthesizing means may include an externally supplied audio data or an audio data supplied from the stream storage means, and an externally supplied video data or This is to combine the video data supplied from the stream storage means with the video data.
  • the video receiving / decoding device is configured to read out an object which has been previously coded from the stream storage means, thereby simplifying the exchange of the object for synthesis.
  • the portability of the object to be synthesized is improved, and for example, it is possible to synthesize an object in the background of a place that has not been visited in the past.
  • the stream storage means records one or both of the video data and the audio data which have been object-coded in advance.
  • control unit selects an object to be output from the stream storage unit that records a plurality of objects that are object-encoded based on the communication partner or communication date and time. It is the one that was adopted.
  • a video receiving / decoding device is configured to generate video data and audio data by performing encoding according to the MPEG-4 method.
  • the video transmission / reception device includes a video signal and a video signal supplied from the outside.
  • Encoding means for encoding one or both of the audio signal and the audio signal, and a part or all of the object encoded by the media encoding means and the object encoded in advance.
  • Transmission stream synthesizing means for synthesizing the object and the video data and / or audio data synthesized by the transmission stream synthesizing means.
  • a stream receiving unit for receiving one or both of the object-coded video data and audio data, and the video data and audio received by the stream receiving unit.
  • Stream receiving means and a reception processing unit having a media decoding means for decoding one or both of the video data and the audio data combined by the receiving stream combining means. It was made. This allows two-way communication without significantly increasing the circuit scale, and also allows video transmission so that the caller's calling location is not specified on the receiving side. This has the effect of reducing the amount of data required.
  • a video transmission system is characterized in that a video signal and / or an audio signal supplied from the outside are encoded by a media encoding unit for encoding an object or both of them, and a media encoding unit.
  • Transmission stream synthesizing means for synthesizing a part or all of the coded object and an object coded in advance, and video data and audio data synthesized by the transmission stream synthesizing means.
  • Video coded transmission device having a stream transmission means for transmitting one or both of the video and video data and / or audio data from the video coded transmission device. And a receiving device that receives and decodes both. This allows two-way communication without significantly increasing the circuit scale, and also allows video transmission so that the caller's calling location is not specified on the receiving side. This has the effect of reducing the amount of data that can be generated.
  • the video transmission system is characterized in that one or both of a video signal and an audio signal supplied from the outside are object-coded, and one of the object-coded video data and audio data is provided.
  • a transmitting device that transmits one or both of the objects, and a stream that receives one or both of the object-coded video data and the audio data from the transmitting device.
  • a receiver that combines an object in one or both of video data and audio data received by the receiving means and the stream receiving means with an object that has been previously encoded.
  • Either video data or audio data synthesized by the stream synthesizing means and the receiving stream synthesizing means Is provided with a video receiving and decoding device having media decoding means for decoding both.
  • FIG. 1 is a block diagram showing a conventional video encoding and transmitting device.
  • FIG. 2 is a block diagram showing a configuration of a video encoding and transmitting apparatus according to Embodiment 1 of the present invention.
  • FIG. 3 is a block diagram of a video receiving and decoding apparatus according to Embodiment 2 of the present invention.
  • FIG. 3 is a block diagram of a video receiving and decoding apparatus according to Embodiment 2 of the present invention.
  • FIG. 4 is a block diagram showing a configuration of a video transmitting / receiving device according to Embodiment 3 of the present invention.
  • FIG. 5 is a diagram showing an example of a network provided with a video transmission system according to Embodiment 4 of the present invention.
  • FIG. 6 is a block diagram showing a configuration of a video transmission system according to Embodiment 4 of the present invention.
  • FIG. 7 is a block diagram showing a configuration of a video transmission system according to Embodiment 5 of the present invention.
  • FIG. 2 is a block diagram showing a configuration of a video encoding and transmitting apparatus according to Embodiment 1 of the present invention.
  • reference numeral 1 denotes an object extracting unit that processes a video signal from a camera that captures images using an image sensor such as a CCD and divides a video image into objects
  • 2 denotes an object extracting unit.
  • An object encoding unit that encodes a video signal based on the data from the clipping unit 1 using a predetermined object encoding method such as MPEG (Moving Picture Ex- perts Group) -4.
  • MPEG Motion Picture Ex- perts Group
  • Media encoding means 3 is the video data after the object encoding from the object encoding unit 2 is pre-encoded on the recording medium 4 (stream storage means), This is the object synthesis unit (transmission stream synthesis means) that synthesizes with data.
  • the object coding section 2 is the object coding section 2, the voice coding section (media coding means) 6 and It is a recording medium such as a flash memory and a disk-type recording medium (optical disk, magnetic disk, magneto-optical disk) that stores video data and audio data that have been encoded from outside and object encoded.
  • a recording medium such as a flash memory and a disk-type recording medium (optical disk, magnetic disk, magneto-optical disk) that stores video data and audio data that have been encoded from outside and object encoded.
  • Reference numeral 5 denotes a voice adding unit (voice synthesizing means) for adding a voice signal input from a microphone or the like and a voice signal decoded by the voice decoding unit 7, and 6 denotes a voice signal from the voice adding unit 5.
  • Reference numeral 7 denotes an audio decoding unit for encoding in a predetermined format, and 7 denotes an audio decoding unit for decoding encoded audio data stored in the recording medium 4.
  • Reference numeral 8 denotes a line interface unit (stream transmitting means) for transmitting data from the object synthesizing unit 3 to the receiving side via a predetermined line.
  • Reference numeral 9 denotes a call control unit (control means) for controlling the object synthesizing unit 3 and the recording medium 4 according to the control information to be transmitted and the receiving side device of the communication partner.
  • the object extracting unit 1 processes the video signal based on motion and color information, divides the video data into each object, and the object encoding unit 2 divides them into objects. Encoding.
  • the object-encoded video data is supplied to the object synthesizing unit 3 or the recording medium 4.
  • This video image is supplied to both the object synthesizing unit 3 and the recording medium 4 as necessary.
  • the object synthesizing unit 3 synthesizes a part or all of the object with an object encoded in advance on the recording medium 4 and the like.
  • the combined data is supplied to the line interface section 8.
  • the object synthesizing unit 3 responds to the control signal from the call control unit 9 by a part of the video image after the object coding from the object coding unit 2 (for example, the object of the person part in the video). ) Or supply all or the whole to the line interface section 8 or supply the data after synthesis. For example, only when transmitting / receiving a video to / from a predetermined communication partner, the combined data from the object combining unit 3 is supplied to the line interface unit 8.
  • the line interface unit 8 transmits the supplied data to the receiving terminal device, which is the communication partner, via a predetermined line.
  • the recording medium 4 stores the video data. Thereafter, the video data stored in the recording medium 4 is appropriately used as video data (object) to be synthesized by the object synthesizing unit 3 in real time during communication.
  • the audio addition unit 5 When an audio signal from a microphone or the like is supplied, the audio addition unit 5 combines the audio signal with the audio signal obtained by decoding the audio data in the recording medium 4 by the audio decoding unit 7, and Is supplied to the audio encoding unit 6.
  • the audio encoding unit 6 encodes the audio signal, and supplies the encoded audio data to the object synthesizing unit 3 or the recording medium 4.
  • the encoded audio data is supplied to both the object synthesizing unit 3 and the recording medium 4 as necessary.
  • the object synthesizing unit 3 When supplied with the audio data, the object synthesizing unit 3 synthesizes the image data with the above-described video data (object).
  • the recording medium 4 stores the audio data.
  • the audio data stored in the recording medium 4 is then decoded by the audio decoding unit 7 in real time during communication, and the decoded audio signal is used as appropriate as an audio signal synthesized in the audio adding unit 5 Is done.
  • the call control unit 9 controls the object synthesizing unit 3 and the recording medium 4 based on information such as the date and time of communication and the communication partner, and converts the encoded video data and audio data to the object synthesizing unit. Or to 3 In this way, it is possible to execute or not execute the replacement of the background image only for a specific communication partner.
  • the background image can be switched according to the communication partner, and the combination of background and sound according to the schedule, event, and time can be selected. Furthermore, it is also possible to transmit a pre-stored image without transmitting the video at the place where the video is currently being transmitted, and the answering machine function can be realized.
  • the call control unit 9 exchanges control information with the communication partner, determines whether the terminal device of the communication partner supports object coding, and determines whether or not to perform transmission using this method. Can be automatically identified.
  • the video signal is object-coded on the transmitting side, and a part or all of the coded object is combined with the object coded in advance. Since the synthesized video data is transmitted, the object of the background part, which is encoded in advance, is synthesized in real time with the object of the person part in the video, so that the calling place of the caller can be received.
  • the advantage is that the video can be transmitted without being specified on the side.
  • the background to be synthesized by switching the background to be synthesized based on the date and time information, it is possible to obtain an effect of concealing a more natural calling place of the caller.
  • an audio signal supplied from the outside and an audio signal obtained in advance are synthesized, and the audio data corresponding to the audio signal is transmitted together with the video data. So more caller calling place According to the first embodiment, the voice to be synthesized is switched based on the date and time information, so that a more natural caller's call can be transmitted. The effect of concealing the place is obtained.
  • the call control unit 9 automatically identifies that the terminal device of the communication partner supports the object coding, the specific destination For example, instead of transmitting the background of the video image encoded in real time, the object of only the person part is transmitted, and the object of the background part is synthesized by the receiving terminal device. Accordingly, the effect that the amount of data to be transmitted can be reduced is obtained.
  • the object encoded in advance is read from the recording medium 4, it is possible to simplify the exchange of the object to be synthesized and to improve the portability of the object to be synthesized. However, for example, it is possible to synthesize an object in the background of a place that has not been visited in the past.
  • Embodiment 2 since the video data and the audio data are generated by encoding in the MPEG-4 system, the present invention can be used widely when equipment compatible with the MPEG-4 system becomes widespread.
  • Embodiment 2
  • FIG. 3 is a block diagram showing a configuration of a video reception / decoding device according to Embodiment 2 of the present invention.
  • reference numeral 11 denotes a line interface unit (stream receiving means) for receiving data transmitted via a line
  • 12 denotes a data processing unit which converts the received data into an image data object and an audio data. This is the object separation unit that separates objects.
  • a flash memory that stores the object separation unit 12, the object coding unit 20, the audio coding unit 21 and externally coded video data and coded audio data from outside, It is a recording medium (stream storage means) such as a disk-type recording medium (optical disk, magnetic disk, magneto-optical disk).
  • a recording medium such as a disk-type recording medium (optical disk, magnetic disk, magneto-optical disk).
  • Reference numeral 14 denotes an object synthesizing unit which synthesizes a part or all of the video data from the object separating unit 12 and video data encoded in advance and stored in the recording medium 13.
  • Reference numeral 15 is an object decoding unit (media decoding unit) for decoding the video data from the object combining unit 14.
  • Reference numeral 16 denotes an audio decoding unit (media decoding means) for decoding audio data from the object separation unit 12, and reference numeral 17 denotes audio for decoding pre-encoded audio data stored in the recording medium 13.
  • a decoding unit (media decoding means) 18 is a speech adding unit (speech synthesis means) for synthesizing and outputting the speech signal from the speech decoding unit 16 and the speech signal from the speech decoding unit 17. .
  • Reference numeral 19 denotes an object cutout unit that processes a video signal from a camera that captures images using an image sensor such as a CCD and divides the image data into objects, and 20 denotes an object cutout unit.
  • 19 is an object coding section (media coding means) for subjecting the video signal to a predetermined object coding method such as the MPEG-4 method based on the data from 19;
  • This is an audio encoding unit (media encoding means) that encodes the audio signal from the audio signal according to a predetermined method.
  • Reference numeral 22 denotes a call control unit (control means) for controlling the recording medium 13 and the object synthesizing unit 14 in accordance with the received control information and the transmitting device of the communication partner. Next, the operation will be described.
  • the line interface 11 receives the data transmitted via the line, and the object separation unit 12 separates the data into video data and audio data.
  • the video data is supplied to the recording medium 13 or the object synthesizing unit 14 or both, and the audio data is supplied to the recording medium 13 or the audio decoding unit 16 or both. .
  • the video data and the audio data supplied to the recording medium 13 are stored.
  • the video data and audio data stored in the recording medium 13 are appropriately used as data for synthesizing video data and audio data received thereafter in real time.
  • the object synthesizing unit 14 synthesizes a part or all of the video data and the video data stored in the recording medium 13 in accordance with the control signal from the call control unit 22, and synthesizes them.
  • the subsequent video data is supplied to the object decoding unit 15.
  • the object decoding unit 15 decodes the video data from the object synthesizing unit 14 and outputs the decoded video signal.
  • the object-encoded video data is composed of an object of a person part and an object of a background part
  • the object of the person part and other objects stored in the recording medium 13 are stored.
  • the object with the background part is synthesized.
  • the object-encoded video data is composed of only the object of the person, the object of the person and the object of the background stored in the recording medium 13 are used. Are synthesized.
  • the audio decoding unit 16 decodes the audio data and supplies the decoded audio signal to the audio adding unit 18.
  • the audio decoding unit 17 decodes the pre-encoded audio data stored in the recording medium 13 and supplies the decoded audio signal to the audio adding unit 18.
  • voice The adder 18 combines the audio signal from the audio decoder 16 with the audio signal from the audio decoder 17 and outputs the synthesized audio signal.
  • the video data coded by the object clipping unit 19 and the object coding unit 20 is stored in the recording medium 13 so as to be combined with the received video data in real time.
  • the audio data encoded by the audio encoding unit 21 is stored in the recording medium 13 and used as data for synthesizing received audio data in real time. can do.
  • the call control unit 22 controls the recording medium 13 and the object synthesizing unit 14 based on the communication date and time and information on the communication partner, and converts the pre-encoded video data and audio data into an object. It is supplied to the synthesizing unit 14 and the audio decoding unit 17. This makes it possible to execute or not execute the replacement of the background image only for a specific communication partner.
  • the background image can be switched according to the communication partner, and the combination of background and sound can be selected according to the scheduled 'event' time.
  • the call control unit 22 can communicate with the transmitting terminal device of the communication partner, automatically identify whether or not the device performs transmission according to the present method, and execute a receiving process corresponding thereto. . Further, a control signal is appropriately supplied from the transmission side to the reception side, and the video data from the transmission side at the start of communication is stored in the recording medium 13, and thereafter, the video data of the person portion is transmitted from the transmission side. The background portion may be combined with the video data at the start of communication stored in the recording medium 13. At this time, the data may be combined with the video / audio data according to the schedule / event / timetable based on the date and time information.
  • an object-encoded video image is received from the transmitting side, and a part or a part of the received object is received. Combines the entire object with the object encoded in advance and decodes the combined video data, so that the object of the background part encoded in advance in the object of the person part in the video is By synthesizing the video in real time, it is possible to obtain an effect that the video can be transmitted so that the transmitting side of the caller is not specified on the receiving side.
  • the second embodiment by switching the background to be synthesized based on the date and time information, it is possible to obtain a more natural effect of concealing the calling place of the caller.
  • the background portion other than the person of the object-encoded video data received by the object synthesizing section 14 is replaced in real time with the background portion of the video data previously stored in the recording medium 13.
  • the background is different from the place where the video is currently being transmitted, so the video is currently transmitted even if the transmitting side does not have the function to replace the background as shown in Embodiment 1. It becomes difficult to specify the location on the receiving side.
  • the calling place of the caller since the voice signal obtained by decoding the voice data from the transmitting side and the voice signal obtained in advance are synthesized, the calling place of the caller can be further reduced.
  • the advantage is that it can be prevented from being specified by the.
  • the voice to be synthesized by switching the voice to be synthesized based on the date and time information, it is possible to obtain a more natural effect of concealing the calling place of the caller.
  • FIG. 4 is a block diagram showing a configuration of a video transmitting / receiving device according to Embodiment 3 of the present invention.
  • reference numerals 31 to 38 denote object cutout sections to line interface sections similar to the object cutout section 1 to line interface section 8 in the first embodiment, respectively.
  • 4 to 4 denote the same object separation unit and object synthesis unit as those of the object separation unit 12, the object synthesis unit 14, the object decoding unit 15, and the speech decoding unit 16 in the second embodiment.
  • a call control unit 39 having the functions of the call control unit 9 according to the first embodiment and the call control unit 22 according to the second embodiment.
  • the transmission means 38 and the call control section 39 constitute a transmission processing section, and a line interface section (stream receiving means) 38, an object separation section 41, a recording medium (scan).
  • Stream storage means 34, object synthesis section (reception stream synthesis means) 42, object decoding section (media decoding means) 43, voice decoding section (media decoding means) 44, voice addition Part 35, voice decoding part (media decoding means) 37 and
  • the call control unit 39 forms a reception processing unit. That is, the recording medium 34, the voice addition unit 35, the voice decoding unit 37, and the line interface unit 38 are also used as a transmission processing unit and a reception processing unit.
  • the video transmitting / receiving device shown in FIG. This can be realized by adding an object extracting unit 31, an object encoding unit 32, an object synthesizing unit 33, and a speech encoding unit 36 to the unit. That is, the video transmitting / receiving apparatus can be easily realized by making small changes to the video receiving / decoding apparatus.
  • the transmission processing section operates in the same manner as the video encoding / transmission apparatus according to the first embodiment, and the reception processing section operates in the same manner as the video reception / decoding apparatus according to the second embodiment.
  • the transmission processing unit and the reception processing unit described above are provided, two-way communication can be performed, and the effects and effects of the first embodiment can be achieved.
  • the same effect as the effect of mode 2 can be obtained.
  • a part of the transmission processing unit and a part of the reception processing unit can be shared, and the effects and implementation of the first embodiment can be achieved without greatly increasing the circuit scale. The same effect as the effect of Embodiment 2 can be obtained.
  • FIG. 5 is a diagram showing an example of a network provided with a video transmission system according to Embodiment 4 of the present invention
  • FIG. 6 is a diagram showing a configuration of a video transmission system according to Embodiment 4 of the present invention.
  • reference numerals 61 to 63 denote the same video codes as those of the video coding and transmitting apparatus according to the first embodiment, which are connected to a network 64 by predetermined lines (for example, public telephone lines and mobile telephone lines).
  • This is a terminal device having a generalized transmission device.
  • reference numeral 71 denotes an image from an imaging device 72 such as a CCD camera.
  • a signal and an audio signal from a sound collection device 73 such as a microphone are processed, and image data and audio data are transmitted to another terminal device.
  • the same video encoded transmission device as the video encoded transmission device according to the first embodiment.
  • a device 74 receives video data and audio data from another terminal device through the line interface unit 77, decodes the data by the decoding unit 78, and converts the video signal into a display device such as a display device. And a sound signal to a sound output device 76 such as a speaker.
  • the video signal and the audio signal are respectively encoded by the video encoding and transmitting device 71 in the same manner as in the first embodiment, and the encoded data is transmitted to the network 64. Is transmitted to the other terminal devices 62 and 61 via the. The data is received by the receiving device 74 of the other terminal devices 62 and 61, and is decoded into a video signal and an audio signal.
  • the embodiment since the video encoding and transmitting apparatus according to the first embodiment is used for a video transmission system, the embodiment is applied to a video transmission system for remotely transmitting and receiving video and audio. The effect of 1 can be obtained.
  • Embodiment 5 since the video encoding and transmitting apparatus according to the first embodiment is used for a video transmission system, the embodiment is applied to a video transmission system for remotely transmitting and receiving video and audio. The effect of 1 can be obtained.
  • FIG. 7 is a block diagram showing a configuration of a video transmission system according to Embodiment 5 of the present invention.
  • reference numeral 81 denotes a video signal from an imaging device 72 such as a CCD camera and an audio signal from a sound collection device 73 such as a microphone, which are subjected to object coding by a coding unit 82, and are connected to a line interface.
  • This is a video receiving and decoding device similar to the video receiving and decoding device according to the second embodiment. Next, the operation will be described.
  • the video signal and the audio signal are respectively object-coded by the transmitting device 8 1, and the encoded data is transmitted to the other terminal devices 6 2 and 6 Transmitted to 1. Then, the data is received by the video receiving / decoding device 84 in the other terminal devices 62, 61 in the same manner as in the second embodiment, and is decoded into a video signal or an audio signal. At this time, if only a part of the video data is transmitted from the transmission device 81, the amount of transmission data is reduced.
  • the video receiving / decoding device since the video receiving / decoding device according to the second embodiment is used for a video transmission system, the video transmission system for remotely transmitting and receiving video and audio according to the second embodiment is used. The effect that the effect can be enjoyed is obtained.
  • the video transmitting / receiving device instead of the transmitting device 81 and the video receiving / decoding device 84 in the fifth embodiment, the video transmitting / receiving device according to the third embodiment may be provided.
  • the video encoding / transmitting device, the video receiving / decoding device, the video transmitting / receiving device, and the video transmission system according to the present invention transmit a video so that the caller's calling place is not specified on the receiving side. Suitable for reducing the amount of data to be transmitted.

Abstract

On the transmitting side, a video signal is object-encoded by an object extraction unit (1) and an object encoding unit (2), a part or all of the object encoded by an object synthesis unit (3) and an object which is object-encoded in advance are combined, and then video data after the combining is transmitted by a circuit interface unit (8).

Description

明 細 書 映像符号化送信装置、 映像受信復号装置、 映像送受信装置および映像伝送システム 技術分野  Description Video encoding and transmitting device, video receiving and decoding device, video transmitting and receiving device, and video transmission system
この発明は、 映像や音声を所定の回線を介して伝送するための映像符 号化送信装置、 映像受信復号装置、 映像送受信装置および映像伝送シス テムに関し、 特にオブジェク ト符号化技術を使用した映像符号化送信装 置、 映像受信復号装置、 映像送受信装置および映像伝送システムに関す るものである。 背景技術  The present invention relates to a video encoding and transmitting device, a video receiving and decoding device, a video transmitting and receiving device, and a video transmitting system for transmitting video and audio via a predetermined line, and more particularly to a video using an object encoding technology. The present invention relates to an encoding transmission device, a video reception / decoding device, a video transmission / reception device, and a video transmission system. Background art
第 1図は例えば特開平 1 0— 42 2 7 5号公報に記載の従来の映像符 号化送信装置を示すプロ ック図である。 図において、 1 0 1は C CD ( C h a r g e C o up l e d D e v i c e) などの撮像素子を使用 して撮影するビデオカメラからの映像信号に NT S C (N a t i o n a 1 T e l e v i s i o n S y s t em C omm i t t e e ) デコ ー ド、 A/D変換などの信号処理を施すカメラ信号処理部であ り、 1 0 2は A/D変換後の映像信号を H . 2 6 1方式で動画像データとして符 号化する動画像データ符号化部であ り、 1 0 3は A/D変換後の映像信 号を J P E G J o i n t P h o t o g r a p h i c Ex e r t s G r o u p) 方式で静止画像データとして符号化する静止画像デ一 夕符号化部であり、 1 04は送信する画像データを切り換える画像デ一 夕切換部であり、 1 0 5はマイ クロフォンからの音声信号に A/D変換 などの信号処理を施す音声信号処理部であり、 1 0 6は A/D変換後の 音声信号を符号化する音声データ符号化部であり、 1 0 7は画像データ および音声データを多重化する多重分離部であり、 1 0 8は多重化後の データを送信する回線ィ ン夕フ ェース部である。 FIG. 1 is a block diagram showing a conventional video encoding and transmitting apparatus described in, for example, Japanese Patent Application Laid-Open No. 10-42275. In the figure, reference numeral 101 denotes an NTSC (Nationa 1 Television System Comm ittee) video signal from a video camera that uses an image sensor such as a CCD (Charge Coup led Device). ) A camera signal processing unit that performs signal processing such as decoding and A / D conversion.102 is a unit that encodes video signals after A / D conversion as moving image data using the H.261 method. 103 is a moving image data encoding unit that encodes the video signal after A / D conversion as still image data using the JPEG Joint Photographic Experts Group (JPEG) method. 104 is an image data switching unit for switching image data to be transmitted, and 105 is an audio signal processing unit for performing signal processing such as A / D conversion on an audio signal from the microphone. 106 is the value after A / D conversion An audio data encoding unit for encoding an audio signal, 107 is a demultiplexing unit for multiplexing image data and audio data, and 108 is a line interface for transmitting the multiplexed data. Ace department.
次に動作について説明する。  Next, the operation will be described.
C C Dなどの撮像素子を使用して撮影するビデオカメ ラからの映像信 号に対してカメラ信号処理部 1 0 1が NT S Cデコー ド、 A/D変換な どの信号処理を施した後、 動画像データ符号化部 1 0 2がその AZD変 換後の映像信号を H . 2 6 1方式で動画像データとして符号化するとと もに、 静止画像デ一夕符号化部 1 0 3がその AZD変換後の映像信号を J P E G方式で静止画像データとして符号化する。  After the camera signal processor 101 performs signal processing such as NTSC decoding and A / D conversion on the video signal from the video camera that captures images using an image sensor such as a CCD, The data encoding unit 102 encodes the video signal after the AZD conversion as moving image data according to the H.261 method, and the still image data encoding unit 103 performs the AZD conversion. The subsequent video signal is encoded as still image data in JPEG format.
そして画像データ切換部 1 04は、 画像中の物体の動きに応じて、 送 信する画像データを切り換え、 動画像データまたは静止画像データのい ずれかを多重分離部 1 0 7に供給する。  Then, the image data switching unit 104 switches the image data to be transmitted according to the movement of the object in the image, and supplies either the moving image data or the still image data to the demultiplexing unit 107.
一方、 マイ クロフォンからの音声信号に対して音声信号処理部 1 0 5 が A/D変換などの信号処理を施した後、 音声データ符号化部 1 0 6が AZD変換後の音声信号を符号化し、 その音声デ一夕を多重分離部 1 0 7に供給する。  On the other hand, the audio signal processing unit 105 performs signal processing such as A / D conversion on the audio signal from the microphone, and the audio data encoding unit 106 encodes the audio signal after AZD conversion. The audio data is supplied to the demultiplexer 107.
そして多重分離部 1 0 7は画像データおよび音声データを多重化し、 回線イ ン夕フェース部 1 0 8が多重化後のデ一夕を I S DN回線などの 回線を介して送信する。  The demultiplexing unit 107 multiplexes the image data and the audio data, and the line interface unit 108 transmits the multiplexed data via a line such as an ISDN line.
なお、 上記の従来の技術に関連するものが特開平 7— 1 547 6 5号 公報に記載されている。  The one related to the above-mentioned conventional technology is described in Japanese Patent Application Laid-Open No. 7-154567 / 1995.
従来の映像符号化送信装置は以上のように構成されているので、 不要 な背景が映像に含まれているため、 伝送するデ一夕量を低減することが 困難であり、 また、 通話者の発信場所が受信側で特定されてしまうなど の課題があつた。 この発明は上記のような課題を解決するためになされたもので、 送信 側において映像信号をオブジェク ト符号化し、 符号化したオブジェク ト の一部または全部と予めオブジェク ト符号化されたオブジェク ト とを合 成し、 合成後の映像データを伝送するようにして、 通話者の発信場所が 受信側で特定されないように映像を伝送することができる映像符号化送 信装置、 映像送受信装置および映像伝送システムを得ることを目的とす また、 この発明は、 送信側において映像信号をオブジェク ト符号化し 、 符号化したオブジェク トの一部のみを送信し、 受信側において、 受信 したオブジェク ト と予めオブジェク ト符号化されたオブジェク 卜 とを合 成し、 合成後の映像データを復号するようにして、 通話者の発信場所が 受信側で特定されないように映像を伝送することができるとともに、 伝 送するデータ量を低減することができる映像受信復号装置、 映像送受信 装置および映像伝送システムを得ることを目的とする。 発明の開示 Since the conventional video coding and transmitting apparatus is configured as described above, it is difficult to reduce the amount of data to be transmitted because unnecessary background is included in the video. There were issues such as the transmission location being specified on the receiving side. The present invention has been made in order to solve the above-described problem. An object of the present invention is to encode a video signal on a transmission side, and a part or all of the encoded object and a previously object-coded object. Video transmission device, video transmission / reception device, and video transmission that can transmit video data by combining the video data and transmitting the video so that the calling side of the caller is not specified on the receiving side. Another object of the present invention is to provide a system in which a video signal is object-coded on a transmitting side, only a part of the coded object is transmitted, and the received object is previously encoded with a received object on a receiving side. The coded object is synthesized and the synthesized video data is decoded so that the caller's calling place can be determined on the receiving side. It is an object of the present invention to obtain a video receiving / decoding device, a video transmitting / receiving device, and a video transmitting system capable of transmitting a video so as not to be specified and reducing the amount of data to be transmitted. Disclosure of the invention
この発明に係る映像符号化送信装置は、 外部から供給された映像信号 をオブジェク ト符号化するメディ ア符号化手段と、 メディ ァ符号化手段 によ り符号化されたオブジェク 卜の一部または全部と予めオブジェク ト 符号化されたオブジェク ト とを合成する送信ス ト リーム合成手段と、 送 信ス ト リーム合成手段によ り合成された映像デ一夕を送信するス ト リー ム送信手段とを備えるようにしたものである。  A video encoding and transmitting apparatus according to the present invention includes: a media encoding unit that subjects an externally supplied video signal to object encoding; and a part or all of the object encoded by the media encoding unit. Transmission stream synthesizing means for synthesizing an object encoded in advance with an object, and stream transmitting means for transmitting the video image synthesized by the transmission stream synthesizing means. It is prepared for.
このことによって、 通話者の発信場所が受信側で特定されないように 映像を伝送することができ、 伝送するデータ量を低減するという効果を 奏する。  This makes it possible to transmit the video so that the caller's calling location is not specified on the receiving side, and has the effect of reducing the amount of data to be transmitted.
この発明に係る映像符号化送信装置は、 予めオブジェク ト符号化され たォブジェク トを記録するス 卜 リーム蓄積手段を備えるようにしたもの である。 The video encoding and transmitting apparatus according to the present invention is configured so that object encoding is performed in advance. It is equipped with a stream storage means for recording objects.
このことによって、 一部のオブジェク トのみを伝送すればよいから、 伝送するデ一夕量を低減することができ、 さらに、 通話者の発信場所が 受信側で特定されないようにすることができるという効果を奏する。  As a result, only a part of the objects needs to be transmitted, so that the amount of data to be transmitted can be reduced, and furthermore, it is possible to prevent the caller's calling location from being specified on the receiving side. It works.
この発明に係る映像符号化送信装置は、 送信ス ト リーム合成手段が、 ス ト リーム蓄積手段から出力される映像データを、 メディ ア符号化手段 によ り符号化された映像データに対して背景と して合成処理するように したものである。  In the video encoding and transmitting apparatus according to the present invention, the transmission stream synthesizing unit may be configured to convert the video data output from the stream storage unit into a background with respect to the video data encoded by the media encoding unit. In this case, the composition processing is performed.
このことによって、 一部のオブジェク トのみを伝送すればよいから 、 伝送するデータ量を低減することができ、 さらに、 通話者の発信場所 が受信側で特定されないようにすることができるという効果を奏する。  As a result, only a part of the objects needs to be transmitted, so that the amount of data to be transmitted can be reduced, and furthermore, it is possible to prevent the caller's calling location from being specified on the receiving side. Play.
この発明に係る映像符号化送信装置は、 映像デ一夕が動画像または静 止画像であるようにしたものである。  A video encoding and transmitting apparatus according to the present invention is configured such that the video image is a moving image or a still image.
このことによって、 通話者の発信場所が受信側で特定されないように することができるという効果を奏する。  This has the effect of preventing the caller's originating location from being specified on the receiving side.
この発明に係る映像符号化送信装置は、 送信先に応じて送信ス ト リー ム合成手段を制御する制御手段を備えるようにしたものである。  A video encoding and transmitting apparatus according to the present invention includes a control unit that controls a transmission stream combining unit according to a transmission destination.
このことによって、 送信先に応じて送信する映像デ一夕に含まれるォ ブジェク トを変更することができるから、 通話者の発信場所が受信側で 特定されないようにすることができ、 さらに、 伝送するデータ量を低減 することができるという効果を奏する。  This makes it possible to change the object included in the video image to be transmitted according to the transmission destination, so that the receiving side cannot identify the caller's calling place, and furthermore, the transmission This has the effect of reducing the amount of data required.
この発明に係る映像符号化送信装置は、 外部から供給された音声信号 と予め取得されている音声信号とを合成した後、 合成後の音声信号に対 応する音声データを映像データとともに送信するようにしたものである このことによって、 よ り通話者の発信場所が受信側で特定されないよ うにすることができるという効果を奏する。 A video encoding and transmitting apparatus according to the present invention is configured to combine an audio signal supplied from the outside with a previously acquired audio signal, and then transmit audio data corresponding to the synthesized audio signal together with the video data. Is This has the effect of making it possible to prevent the caller's originating location from being specified on the receiving side.
この発明に係る映像符号化送信装置は、 送信ス ト リーム合成手段が、 外部から供給された音声データまたはス ト リーム蓄積手段から供給され た音声データと、 外部から供給された映像データまたはス ト リーム蓄積 手段から供給された映像データとを合成するようにしたものである。  In the video encoding and transmitting apparatus according to the present invention, the transmission stream synthesizing means may include an externally supplied audio data or an audio data supplied from the stream storage means and an externally supplied video data or stream. This is to combine the video data supplied from the ream storage means.
このことによって、 よ り通話者の発信場所が受信側で特定されないよ うにすることができるという効果を奏する。  This has the effect of making it possible to prevent the caller's originating location from being specified on the receiving side.
この発明に係る映像符号化送信装置は、 ス ト リーム蓄積手段から予め オブジェク ト符号化されたオブジェク トを読み出すようにしたものであ このことによって、 合成するためのオブジェク 卜の交換を簡単にする ことができるとともに、 合成するためのオブジェク トの可搬性が向上し 、 例えば過去に行ったことのない場所の背景のオブジェク トを合成させ ることができるという効果を奏する。  The video encoding / transmitting apparatus according to the present invention is configured to read out the object encoded in advance from the stream storage means, thereby simplifying the exchange of the object for synthesis. In addition to this, the portability of the object to be synthesized is improved, and for example, an effect of being able to synthesize an object in the background of a place that has not been visited in the past is obtained.
この発明に係る映像符号化送信装置は、 ス ト リーム蓄積手段は予めォ ブジェク ト符号化された映像デ一夕および音声データのどちらか一方ま たは両方を記録するようにしたものである。  In the video encoding and transmitting apparatus according to the present invention, the stream storage means records one or both of the video data and the audio data which have been previously encoded.
このことによって、 よ り通話者の発信場所が受信側で特定されないよ うにすることができるという効果を奏する。  This has the effect of making it possible to prevent the caller's originating location from being specified on the receiving side.
この発明に係る映像符号化送信装置は、 制御手段が通信相手または通 信日時に基づいてオブジェク ト符号化された複数のオブジェク トを記録 しているス ト リーム蓄積手段から出力するオブジェク トを選択するよう にしたものである。  In the video encoding / transmitting apparatus according to the present invention, the control unit selects an object to be output from the stream storage unit that records a plurality of objects encoded based on the communication partner or the communication date and time. This is what we do.
このことによって、 送信先によつて通話者の発信場所が受信側で特定 されないようにすることができ、 さらに、 伝送するデータ量を低減する ことができるという効果を奏する。 As a result, it is possible to prevent the receiving party from specifying the caller's calling place by the transmission destination, and further reduce the amount of data to be transmitted. It has the effect of being able to do so.
この発明に係る映像符号化送信装置は、 M P E G— 4方式で符号化し て映像デ一夕および音声デ一夕を生成するようにしたものである。  A video encoding and transmitting apparatus according to the present invention is configured to generate video data and audio data by performing coding according to the MPEG-4 system.
このことによって、 M P E G— 4方式対応機器が普及した場合に広く 本発明を利用することができるという効果を奏する。  As a result, there is an effect that the present invention can be widely used when a device compatible with the MPEG-4 system is widely used.
この発明に係る映像受信復号装置は、 オブジェク ト符号化された映像 データを受信するス ト リーム受信手段と、 ス ト リーム受信手段によ り受 信された映像デ一夕における一部または全部のオブジェク 卜 と予めォブ ジェク ト符号化されたオブジェク ト とを合成する受信ス ト リーム合成手 段と、 受信ス ト リーム合成手段によ り合成された映像データを復号する メディ ア復号手段とを備えるものである。  A video receiving and decoding apparatus according to the present invention includes: a stream receiving unit that receives object-encoded video data; and a part or all of the video data received by the stream receiving unit. A receiving stream synthesizing means for synthesizing an object and an object which has been previously coded, and a media decoding means for decoding video data synthesized by the receiving stream synthesizing means. It is provided.
このことによって、 通話者の発信場所が受信側で特定されないように 映像を伝送することができ、 伝送するデータ量を低減するという効果を 奏する。  This makes it possible to transmit the video so that the caller's calling location is not specified on the receiving side, and has the effect of reducing the amount of data to be transmitted.
この発明に係る映像受信復号装置は、 予めオブジェク ト符号化された オブジェク トを記録するス ト リ一ム蓄積手段を備えるようにしたもので ある。  A video receiving / decoding apparatus according to the present invention includes stream storage means for recording an object encoded in advance.
このことによって、 一部のオブジェク トのみを伝送すればよいから、 伝送するデータ量を低減することができ、 さらに、 通話者の発信場所が 受信側で特定されないようにすることができるという効果を奏する。  As a result, only a part of the objects needs to be transmitted, so that the amount of data to be transmitted can be reduced, and furthermore, it is possible to prevent the caller's originating location from being specified on the receiving side. Play.
この発明に係る映像受信復号装置は、 受信ス ト リーム合成手段がス ト リーム蓄積手段から出力される映像データを、 ス ト リーム受信手段によ り受信された映像デ一夕に対して背景として合成処理するようにしたも のである。  In the video reception decoding apparatus according to the present invention, the reception stream synthesizing means uses the video data output from the stream storage means as a background with respect to the video data received by the stream reception means. It is a combination process.
このことによって、 一部のオブジェク トのみを伝送すればよいから、 伝送するデータ量を低減することができ、 さらに、 通話者の発信場所が 受信側で特定されないようにすることができるという効果を奏する。 この発明に係る映像受信復号装置は、 映像データが動画像または静止 画像であるようにしたものである。 As a result, only a part of the objects needs to be transmitted, so that the amount of data to be transmitted can be reduced. This has the effect that it can be prevented from being specified on the receiving side. A video receiving / decoding device according to the present invention is such that video data is a moving image or a still image.
このことによって、 通話者の発信場所が受信側で特定されないように することができるという効果を奏する。  This has the effect of preventing the caller's originating location from being specified on the receiving side.
この発明に係る映像受信復号装置は、 ス ト リーム受信手段によ り受信 された人物部分のオブジェク ト と予めオブジェク ト符号化された背景部 分のオブジェク ト とを合成するようにしたものである。  A video receiving / decoding apparatus according to the present invention is configured to combine an object of a person portion received by a stream receiving means with an object of a background portion which has been object-coded in advance. .
このことによって、 一部のォブジヱク トのみを伝送すればよいから、 伝送するデータ量を低減することができ、 さらに、 通話者の発信場所が 受信側で特定されないようにすることができるという効果を奏する。  As a result, since only a part of the objects need to be transmitted, the amount of data to be transmitted can be reduced, and further, it is possible to prevent the caller's originating location from being specified on the receiving side. Play.
この発明に係る映像受信復号装置は、 送信元に応じて受信ス ト リーム 合成手段を制御する制御手段を備えるようにしたものである。  A video receiving and decoding apparatus according to the present invention includes a control unit that controls a receiving stream combining unit according to a transmission source.
このことによって、 送信元に応じてオブジェク トの合成を実行するか 否かを適宜選択でき、 伝送されるデータ量を低減することができるとい う効果を奏する。  With this, it is possible to appropriately select whether or not to execute object combining according to the transmission source, and it is possible to reduce the amount of data to be transmitted.
この発明に係る映像受信復号装置は、 ス ト リーム受信手段によ り受信 された音声データに対応する音声信号と予め取得されている音声信号と を合成するようにしたものである。  A video receiving / decoding device according to the present invention is configured to synthesize an audio signal corresponding to audio data received by stream receiving means with an audio signal obtained in advance.
このことによって、 よ り通話者の発信場所が受信側で特定されないよ うにすることができるという効果を奏する。  This has the effect of making it possible to prevent the caller's originating location from being specified on the receiving side.
この発明に係る映像受信復号装置は、 受信ス ト リーム合成手段が、 外 部から供給された音声データまたはス ト リーム蓄積手段から供給された 音声デ一夕と、 外部から供給された映像データまたはス ト リーム蓄積手 段から供給された映像デ一夕とを合成するようにしたものである。  In the video receiving / decoding device according to the present invention, the receiving stream synthesizing means may include an externally supplied audio data or an audio data supplied from the stream storage means, and an externally supplied video data or This is to combine the video data supplied from the stream storage means with the video data.
このことによって、 通話者の発信場所が受信側で特定されないように 映像を伝送することができ、 伝送するデ一夕量を低減するという効果を 奏する。 This ensures that the caller does not know where the caller is calling from Video can be transmitted, and the amount of transmitted data can be reduced.
この発明に係る映像受信復号装置は、 ス ト リーム蓄積手段から予めォ ブジェク ト符号化されたオブジェク トを読み出すようにしたものである このことによって、 合成するためのオブジェク 卜の交換を簡単にする ことができるとともに、 合成するためのォブジェク 卜の可搬性が向上し 、 例えば過去に行ったことのない場所の背景のオブジェク トを合成させ ることができるという効果を奏する。  The video receiving / decoding device according to the present invention is configured to read out an object which has been previously coded from the stream storage means, thereby simplifying the exchange of the object for synthesis. In addition to this, the portability of the object to be synthesized is improved, and for example, it is possible to synthesize an object in the background of a place that has not been visited in the past.
この発明に係る映像受信復号装置は、 ス ト リーム蓄積手段が、 予めォ ブジェク ト符号化された映像データおよび音声データのどちらか一方ま たは両方を記録するようにしたものである。  In the video receiving / decoding device according to the present invention, the stream storage means records one or both of the video data and the audio data which have been object-coded in advance.
このことによって、 通話者の発信場所が受信側で特定されないように 映像を伝送することができ、 伝送するデータ量を低減するという効果を 奏する。  This makes it possible to transmit the video so that the caller's calling location is not specified on the receiving side, and has the effect of reducing the amount of data to be transmitted.
この発明に係る映像受信復号装置は、 制御手段が通信相手または通信 日時に基づいてオブジェク ト符号化された複数のオブジェク トを記録し ているス ト リーム蓄積手段から出力するオブジェク トを選択するように したものである。  In the video receiving / decoding device according to the present invention, the control unit selects an object to be output from the stream storage unit that records a plurality of objects that are object-encoded based on the communication partner or communication date and time. It is the one that was adopted.
このことによって、 よ り通話者の発信場所が受信側で特定されないよ うにすることができるという効果を奏する。  This has the effect of making it possible to prevent the caller's originating location from being specified on the receiving side.
この発明に係る映像受信復号装置は、 M P E G— 4方式で符号化して 映像データおよび音声データを生成するようにしたものである。  A video receiving / decoding device according to the present invention is configured to generate video data and audio data by performing encoding according to the MPEG-4 method.
このことによって、 M P E G— 4方式対応機器が普及した場合に広く 本発明を利用することができるという効果を奏する。  As a result, there is an effect that the present invention can be widely used when a device compatible with the MPEG-4 system is widely used.
この発明に係る映像送受信装置は、 外部から供給された映像信号およ び音声信号のどちらか一方も しく は両方をオブジェク ト符号化するメデ ィ ァ符号化手段、 メディ ア符号化手段によ り符号化されたオブジェク ト の一部または全部と予めオブジェク ト符号化されたオブジェク ト とを合 成する送信ス ト リーム合成手段、 および送信ス ト リーム合成手段によ り 合成された映像データおよび音声データのどちらか一方も しくは両方を 送信するス ト リーム送信手段を有する送信処理部と、 オブジェク ト符号 化された映像データおよび音声データのどちらか一方も しくは両方を受 信するス ト リーム受信手段、 ス ト リーム受信手段によ り受信された映像 データおよび音声データのどちらか一方も しく は両方におけるオブジェ ク ト と予めオブジェク ト符号化されたオブジェク ト とを合成する受信ス ト リーム合成手段、 および受信ス ト リーム合成手段によ り合成された映 像データおよび音声データのどちらか一方も しくは両方を復号するメデ ィ ァ復号手段を有する受信処理部とを備えるようにしたものである。 このことによって、 回路規模を大き く増加させることなく双方向の通 信をすることができるとともに、 通話者の発信場所が受信側で特定され ないように映像を伝送することができ、 また、 伝送するデータ量を低減 することができるという効果を奏する。 The video transmission / reception device according to the present invention includes a video signal and a video signal supplied from the outside. Encoding means for encoding one or both of the audio signal and the audio signal, and a part or all of the object encoded by the media encoding means and the object encoded in advance. Transmission stream synthesizing means for synthesizing the object and the video data and / or audio data synthesized by the transmission stream synthesizing means. And a stream receiving unit for receiving one or both of the object-coded video data and audio data, and the video data and audio received by the stream receiving unit. An object that combines objects in one or both of the data with pre-encoded objects. Stream receiving means, and a reception processing unit having a media decoding means for decoding one or both of the video data and the audio data combined by the receiving stream combining means. It was made. This allows two-way communication without significantly increasing the circuit scale, and also allows video transmission so that the caller's calling location is not specified on the receiving side. This has the effect of reducing the amount of data required.
この発明に係る映像伝送システムは、 外部から供給された映像信号お よび音声信号のどちらか一方も しく は両方をオブジェク ト符号化するメ ディ ァ符号化手段、 メディ ア符号化手段によ り符号化されたオブジェク 卜の一部または全部と予めオブジェク ト符号化されたオブジェク ト とを 合成する送信ス ト リーム合成手段、 および送信ス ト リーム合成手段によ り合成された映像データおよび音声デ一夕のどちらか一方も しく は両方 を送信するス ト リーム送信手段を有する映像符号化送信装置と、 映像符 号化送信装置からの映像デ一夕および音声デ一夕のどちらか一方も しく は両方を受信し復号する受信装置とを備えるようにしたものである。 このことによって、 回路規模を大き く増加させることなく双方向の通 信をすることができるとともに、 通話者の発信場所が受信側で特定され ないように映像を伝送することができ、 また、 伝送するデ一夕量を低減 することができるという効果を奏する。 A video transmission system according to the present invention is characterized in that a video signal and / or an audio signal supplied from the outside are encoded by a media encoding unit for encoding an object or both of them, and a media encoding unit. Transmission stream synthesizing means for synthesizing a part or all of the coded object and an object coded in advance, and video data and audio data synthesized by the transmission stream synthesizing means. Video coded transmission device having a stream transmission means for transmitting one or both of the video and video data and / or audio data from the video coded transmission device. And a receiving device that receives and decodes both. This allows two-way communication without significantly increasing the circuit scale, and also allows video transmission so that the caller's calling location is not specified on the receiving side. This has the effect of reducing the amount of data that can be generated.
この発明に係る映像伝送システムは、 外部から供給される映像信号お よび音声信号のどちらか一方も しくは両方をオブジェク ト符号化し、 ォ ブジェク ト符号化された映像データおよび音声データのどちらか一方も しくは両方のうちの一部のオブジェク トを送信する送信装置と、 送信装 置からのオブジェク ト符号化された映像データおよび音声データのどち らか一方も しくは両方を受信するス ト リーム受信手段、 ス ト リ一ム受信 手段によ り受信された映像データおよび音声データのどちらか一方も し くは両方におけるオブジェク 卜 と予めオブジェク ト符号化されたォブジ ェク ト とを合成する受信ス ト リーム合成手段、 および受信ス ト リーム合 成手段によ り合成された映像データおよび音声データのどちらか一方も しくは両方を復号するメディ ァ復号手段を有する映像受信復号装置とを 備えるようにしたものである。  The video transmission system according to the present invention is characterized in that one or both of a video signal and an audio signal supplied from the outside are object-coded, and one of the object-coded video data and audio data is provided. A transmitting device that transmits one or both of the objects, and a stream that receives one or both of the object-coded video data and the audio data from the transmitting device. A receiver that combines an object in one or both of video data and audio data received by the receiving means and the stream receiving means with an object that has been previously encoded. Either video data or audio data synthesized by the stream synthesizing means and the receiving stream synthesizing means Is provided with a video receiving and decoding device having media decoding means for decoding both.
このことによって、 回路規模を大き く増加させることなく双方向の通 信をすることができるとともに、 通話者の発信場所が受信側で特定され ないように映像を伝送することができ、 また、 伝送するデータ量を低減 することができるという効果を奏する。 図面の簡単な説明  This allows two-way communication without significantly increasing the circuit scale, and also allows video transmission so that the caller's calling location is not specified on the receiving side. This has the effect of reducing the amount of data required. BRIEF DESCRIPTION OF THE FIGURES
第 1図は、 従来の映像符号化送信装置を示すプロック図である。 第 2図は、 この発明の実施の形態 1 による映像符号化送信装置の構 成を示すブロック図である。  FIG. 1 is a block diagram showing a conventional video encoding and transmitting device. FIG. 2 is a block diagram showing a configuration of a video encoding and transmitting apparatus according to Embodiment 1 of the present invention.
第 3図は、 この発明の実施の形態 2 による映像受信復号装置の構成 を示すブロック図である。 FIG. 3 is a block diagram of a video receiving and decoding apparatus according to Embodiment 2 of the present invention. FIG.
第 4図は、 この発明の実施の形態 3による映像送受信装置の構成を 示すブロ ック図である。  FIG. 4 is a block diagram showing a configuration of a video transmitting / receiving device according to Embodiment 3 of the present invention.
第 5図は、 この発明の実施の形態 4による映像伝送システムが設け られたネッ トワークの一例を示す図である。  FIG. 5 is a diagram showing an example of a network provided with a video transmission system according to Embodiment 4 of the present invention.
第 6図は、 この発明の実施の形態 4による映像伝送システムの構成 を示すブロ ック図である。  FIG. 6 is a block diagram showing a configuration of a video transmission system according to Embodiment 4 of the present invention.
第 7図は、 この発明の実施の形態 5による映像伝送システムの構成 を示すブロック図である。 発明を実施するための最良の形態  FIG. 7 is a block diagram showing a configuration of a video transmission system according to Embodiment 5 of the present invention. BEST MODE FOR CARRYING OUT THE INVENTION
以下、 この発明をよ り詳細に説明するために、 この発明を実施するた めの最良の形態について、 添付の図面に従ってこれを説明する。  Hereinafter, in order to explain this invention in greater detail, the preferred embodiments of the present invention will be described with reference to the accompanying drawings.
実施の形態 1. Embodiment 1.
第 2図はこの発明の実施の形態 1による映像符号化送信装置の構成を 示すブロック図である。 図において、 1は C C Dなどの撮像素子を使用 して撮影するカメラからの映像信号を処理して映像デ一夕を各ォブジェ ク トに分割するオブジェク ト切出部であり、 2はこのオブジェク ト切出 部 1からのデ一夕に基づいて映像信号を例えば M P E G (Mo v i n g P i c t u r e Ex p e r t s G r o u p) — 4方式などの所定の オブジェク ト符号化方式でオブジェク ト符号化するオブジェク ト符号部 (メディ ア符号化手段) であり、 3はオブジェク ト符号部 2からのォブ ジェク ト符号化後の映像データを、 記録媒体 4 (ス ト リーム蓄積手段) における予め符号化された映像データ、 音声データなどと合成するォブ ジェク ト合成部 (送信ス ト リーム合成手段) である。  FIG. 2 is a block diagram showing a configuration of a video encoding and transmitting apparatus according to Embodiment 1 of the present invention. In the figure, reference numeral 1 denotes an object extracting unit that processes a video signal from a camera that captures images using an image sensor such as a CCD and divides a video image into objects, and 2 denotes an object extracting unit. An object encoding unit that encodes a video signal based on the data from the clipping unit 1 using a predetermined object encoding method such as MPEG (Moving Picture Ex- perts Group) -4. Media encoding means), 3 is the video data after the object encoding from the object encoding unit 2 is pre-encoded on the recording medium 4 (stream storage means), This is the object synthesis unit (transmission stream synthesis means) that synthesizes with data.
4はオブジェク ト符号部 2、 音声符号部 (メディ ア符号化手段) 6お よび外部からのォブジェク ト符号化済みの映像データおよび符号化済み の音声データを保存するフラッシュメモリ、 ディスク型記録媒体 (光デ イスク、 磁気ディスク、 光磁気ディ スク) などの記録媒体である。 4 is the object coding section 2, the voice coding section (media coding means) 6 and It is a recording medium such as a flash memory and a disk-type recording medium (optical disk, magnetic disk, magneto-optical disk) that stores video data and audio data that have been encoded from outside and object encoded.
5はマイ クロフォンなどから入力された音声信号と音声復号部 7によ り復号された音声信号とを加算する音声加算部 (音声合成手段) であり 、 6は音声加算部 5からの音声信号を所定の方式で符号化する音声符号 部であり、 7は記録媒体 4に保存された符号化済みの音声データを復号 する音声復号部である。  Reference numeral 5 denotes a voice adding unit (voice synthesizing means) for adding a voice signal input from a microphone or the like and a voice signal decoded by the voice decoding unit 7, and 6 denotes a voice signal from the voice adding unit 5. Reference numeral 7 denotes an audio decoding unit for encoding in a predetermined format, and 7 denotes an audio decoding unit for decoding encoded audio data stored in the recording medium 4.
8はォブジェク ト合成部 3からのデータを所定の回線を介して受信側 に送信する回線ィ ン夕フェース部 (ス ト リーム送信手段) である。  Reference numeral 8 denotes a line interface unit (stream transmitting means) for transmitting data from the object synthesizing unit 3 to the receiving side via a predetermined line.
9は送信する制御情報および通信相手の受信側装置に応じてォブジェ ク ト合成部 3および記録媒体 4を制御する呼制御部 (制御手段) である o  Reference numeral 9 denotes a call control unit (control means) for controlling the object synthesizing unit 3 and the recording medium 4 according to the control information to be transmitted and the receiving side device of the communication partner.
次に動作について説明する。  Next, the operation will be described.
映像信号が供給されると、 オブジェク ト切出部 1はその映像信号を動 きや色情報をもとに処理をおこない映像データを各オブジェク トに分割 し、 オブジェク ト符号部 2がそれらをオブジェク ト符号化する。  When a video signal is supplied, the object extracting unit 1 processes the video signal based on motion and color information, divides the video data into each object, and the object encoding unit 2 divides them into objects. Encoding.
オブジェク ト符号化された映像データは、 オブジェク ト合成部 3 また は記録媒体 4に供給される。 なお、 必要に応じて、 この映像デ一夕はォ ブジェク 卜合成部 3および記録媒体 4の両方に供給される。  The object-encoded video data is supplied to the object synthesizing unit 3 or the recording medium 4. This video image is supplied to both the object synthesizing unit 3 and the recording medium 4 as necessary.
オブジェク ト合成部 3は、 その映像デ一夕が供給されると、 そのォブ ジェク 卜の一部または全部と、 記録媒体 4における予めオブジェク ト符 号化されたオブジェク トなどとを合成し、 合成後のデ一夕を回線ィ ン夕 フェース部 8に供給する。 例えばオブジェク ト符号化された映像データ のうち、 通話者の人物部分のオブジェク ト と、 予めオブジェク ト符号化 された背景部分の映像データ とが合成される。 このときオブジェク ト合成部 3は、 呼制御部 9からの制御信号に応じ てォブジヱク ト符号部 2からのオブジェク ト符号化後の映像デ一夕の一 部 (例えば映像中の人物部分のオブジェク ト) または全部をそのまま回 線イ ンタフェース部 8に供給するか、 合成後のデ一夕を供給する。 例え ば、 所定の通信相手との間で映像の送受信を実行する場合のみ、 ォブジ ェク ト合成部 3からの合成後のデータが回線ィ ン夕フェース部 8に供給 される。 When the image data is supplied, the object synthesizing unit 3 synthesizes a part or all of the object with an object encoded in advance on the recording medium 4 and the like. The combined data is supplied to the line interface section 8. For example, of the object-coded video data, the object of the person part of the caller and the video data of the background portion which has been previously object-coded are synthesized. At this time, the object synthesizing unit 3 responds to the control signal from the call control unit 9 by a part of the video image after the object coding from the object coding unit 2 (for example, the object of the person part in the video). ) Or supply all or the whole to the line interface section 8 or supply the data after synthesis. For example, only when transmitting / receiving a video to / from a predetermined communication partner, the combined data from the object combining unit 3 is supplied to the line interface unit 8.
そして回線イ ンタフェース部 8は、 供給されたデ一夕を所定の回線を 介して通信相手である受信側端末装置に送信する。  Then, the line interface unit 8 transmits the supplied data to the receiving terminal device, which is the communication partner, via a predetermined line.
一方、 記録媒体 4は、 映像デ一夕が供給されると、 その映像デ一夕を 保存する。 記録媒体 4に保存された映像データは、 その後、 通信時にリ アルタイムでオブジェク ト合成部 3 において合成される映像データ (ォ ブジェク ト) として適宜利用される。  On the other hand, when the video data is supplied, the recording medium 4 stores the video data. Thereafter, the video data stored in the recording medium 4 is appropriately used as video data (object) to be synthesized by the object synthesizing unit 3 in real time during communication.
また、 マイクロフォンなどからの音声信号が供給されると、 音声加算 部 5は、 その音声信号と、 記録媒体 4における音声データを音声復号部 7によ り復号した音声信号とを合成し、 合成後の音声信号を音声符号部 6 に供給する。 音声符号部 6はその音声信号を符号化し、 符号化後の音 声データをオブジェク ト合成部 3 または記録媒体 4に供給する。 なお、 符号化後の音声デ一夕は、 必要に応じて、 オブジェク ト合成部 3および 記録媒体 4の両方に供給される。  When an audio signal from a microphone or the like is supplied, the audio addition unit 5 combines the audio signal with the audio signal obtained by decoding the audio data in the recording medium 4 by the audio decoding unit 7, and Is supplied to the audio encoding unit 6. The audio encoding unit 6 encodes the audio signal, and supplies the encoded audio data to the object synthesizing unit 3 or the recording medium 4. The encoded audio data is supplied to both the object synthesizing unit 3 and the recording medium 4 as necessary.
オブジェク ト合成部 3は、 その音声データを供給されると、 上述の映 像データ (オブジェク ト) と合成する。  When supplied with the audio data, the object synthesizing unit 3 synthesizes the image data with the above-described video data (object).
一方、 記録媒体 4は、 その音声データが供給されると、 その音声デ一 夕を保存する。 記録媒体 4に保存された音声デ一夕は、 その後、 通信時 にリアルタイムで音声復号部 7によ り復号され、 復号後の音声信号は音 声加算部 5 において合成される音声信号として適宜利用される。 さらに、 呼制御部 9は、 通信する日時および通信相手に関する情報な どに基づいてオブジェク ト合成部 3および記録媒体 4を制御し、 予め符 号化された映像データや音声データをォブジェク ト合成部 3に供給させ たりする。 これによ り、 特定の通信相手に対してのみ、 背景画像の入れ 替えを実行するようにしたり、 または実行しないようにすることができ る。 また、 通信相手に応じて背景画像を切り換えることができ、 予定 · イベン ト · 時節に応じた背景 ' 音声の組み合わせを選ぶことができる。 さらに、 現在映像を送信している場所での映像を送信せず、 予め保存さ れた画像を送出するようにすることも可能であり、 留守番機能を実現で ぎる。 On the other hand, when the audio data is supplied, the recording medium 4 stores the audio data. The audio data stored in the recording medium 4 is then decoded by the audio decoding unit 7 in real time during communication, and the decoded audio signal is used as appropriate as an audio signal synthesized in the audio adding unit 5 Is done. Further, the call control unit 9 controls the object synthesizing unit 3 and the recording medium 4 based on information such as the date and time of communication and the communication partner, and converts the encoded video data and audio data to the object synthesizing unit. Or to 3 In this way, it is possible to execute or not execute the replacement of the background image only for a specific communication partner. In addition, the background image can be switched according to the communication partner, and the combination of background and sound according to the schedule, event, and time can be selected. Furthermore, it is also possible to transmit a pre-stored image without transmitting the video at the place where the video is currently being transmitted, and the answering machine function can be realized.
また、 呼制御部 9は通信相手との間で制御情報を授受し、 通信相手の 端末装置がオブジェク ト符号化に対応しているか否かを判断し、 本方式 による送信を行うか否かを自動的に識別することができる。  Also, the call control unit 9 exchanges control information with the communication partner, determines whether the terminal device of the communication partner supports object coding, and determines whether or not to perform transmission using this method. Can be automatically identified.
以上のように、 この実施の形態 1 によれば、 送信側において映像信号 をォブジェク ト符号化し、 符号化したオブジェク 卜の一部または全部と 予めオブジェク ト符号化されたオブジェク ト とを合成し、 合成後の映像 データを伝送するようにしたので、 映像中の人物部分のオブジェク 卜に 予め符号化された背景部分のオブジェク トを リアルタイムで合成するこ とによ り、 通話者の発信場所が受信側で特定されないように映像を伝送 することができるという効果が得られる。  As described above, according to the first embodiment, the video signal is object-coded on the transmitting side, and a part or all of the coded object is combined with the object coded in advance. Since the synthesized video data is transmitted, the object of the background part, which is encoded in advance, is synthesized in real time with the object of the person part in the video, so that the calling place of the caller can be received. The advantage is that the video can be transmitted without being specified on the side.
また、 この実施の形態 1 によれば、 日時情報に基づき合成する背景を 切り替えることによ り、 よ り 自然な通話者の発信場所を秘匿できる効果 が得られる。  Further, according to the first embodiment, by switching the background to be synthesized based on the date and time information, it is possible to obtain an effect of concealing a more natural calling place of the caller.
また、 この実施の形態 1 によれば、 外部から供給された音声信号と予 め取得されている音声信号とを合成し、 音声信号に対応する音声デ一夕 を映像データとともに送信するようにしたので、 よ り通話者の発信場所 が受信側で特定されないようにすることができるという効果が得られる また、 この実施の形態 1 によれば、 日時情報に基づき合成する音声を 切り替えることによ り、 よ り 自然な通話者の発信場所を秘匿できる効果 が得られる。 Further, according to the first embodiment, an audio signal supplied from the outside and an audio signal obtained in advance are synthesized, and the audio data corresponding to the audio signal is transmitted together with the video data. So more caller calling place According to the first embodiment, the voice to be synthesized is switched based on the date and time information, so that a more natural caller's call can be transmitted. The effect of concealing the place is obtained.
さらに、 この実施の形態 1 によれば、 呼制御部 9によ り通信相手の端 末装置がオブジェク ト符号化に対応していることを自動的に識別するよ うにしたので、 特定の送信先に対しては例えばリアルタイムでオブジェ ク ト符号化した映像デ一夕の背景を送信せず、 人物部分のみのオブジェ ク トを送信し、 背景部分のオブジェク トを受信側の端末装置で合成する ことによ り、 伝送するデータ量を低減することができるという効果が得 られる。  Furthermore, according to the first embodiment, since the call control unit 9 automatically identifies that the terminal device of the communication partner supports the object coding, the specific destination For example, instead of transmitting the background of the video image encoded in real time, the object of only the person part is transmitted, and the object of the background part is synthesized by the receiving terminal device. Accordingly, the effect that the amount of data to be transmitted can be reduced is obtained.
さらに、 記録媒体 4から予めオブジェク ト符号化されたオブジェク ト を読み出すようにしたので、 合成するためのォブジェク トの交換を簡単 にすることができるとともに、 合成するためのォブジェク トの可搬性が 向上し、 例えば過去に行ったことのない場所の背景のオブジェク トを合 成させることができるという効果が得られる。  Furthermore, since the object encoded in advance is read from the recording medium 4, it is possible to simplify the exchange of the object to be synthesized and to improve the portability of the object to be synthesized. However, for example, it is possible to synthesize an object in the background of a place that has not been visited in the past.
さらに、 M P E G— 4方式で符号化して映像データおよび音声データ を生成するようにしたので、 M P E G— 4方式対応機器が普及した場合 に広く本発明を利用することができるという効果が得られる。 実施の形態 2 .  Furthermore, since the video data and the audio data are generated by encoding in the MPEG-4 system, the present invention can be used widely when equipment compatible with the MPEG-4 system becomes widespread. Embodiment 2
第 3図はこの発明の実施の形態 2 による映像受信復号装置の構成を示 すブロ ック図である。 図において、 1 1 は回線を介して送信されて く る データを受信する回線イ ンタフヱース部 (ス ト リーム受信手段) であり 、 1 2は受信されたデータを映像データのオブジェク ト と音声データの オブジェク ト とに分離するォブジェク ト分離部である。 FIG. 3 is a block diagram showing a configuration of a video reception / decoding device according to Embodiment 2 of the present invention. In the figure, reference numeral 11 denotes a line interface unit (stream receiving means) for receiving data transmitted via a line, and 12 denotes a data processing unit which converts the received data into an image data object and an audio data. This is the object separation unit that separates objects.
1 3はオブジェク ト分離部 1 2、 オブジェク ト符号部 2 0、 音声符号 部 2 1および外部からのオブジェク ト符号化済みの映像データおよび符 号化済みの音声デ一夕を保存するフラッシュメモリ、 ディスク型記録媒 体 (光ディスク、 磁気ディスク、 光磁気ディスク) などの記録媒体 (ス ト リーム蓄積手段) である。  13 is a flash memory that stores the object separation unit 12, the object coding unit 20, the audio coding unit 21 and externally coded video data and coded audio data from outside, It is a recording medium (stream storage means) such as a disk-type recording medium (optical disk, magnetic disk, magneto-optical disk).
1 4はオブジェク ト分離部 1 2からの映像データの一部または全部の オブジェク 卜と、 記録媒体 1 3に保存された予めオブジェク ト符号化さ れた映像データとを合成するオブジェク ト合成部 (受信ス ト リーム合成 手段) であり、 1 5はォブジヱク ト合成部 1 4からの映像デ一夕を復号 するオブジェク ト復号部 (メディ ア復号手段) である。  Reference numeral 14 denotes an object synthesizing unit which synthesizes a part or all of the video data from the object separating unit 12 and video data encoded in advance and stored in the recording medium 13. And 15 is an object decoding unit (media decoding unit) for decoding the video data from the object combining unit 14.
1 6はォブジェク ト分離部 1 2からの音声データを復号する音声復号 部 (メディ ア復号手段) であり、 1 7は記録媒体 1 3に保存された予め 符号化された音声データを復号する音声復号部 (メディ ア復号手段) で あり、 1 8は音声復号部 1 6からの音声信号と音声復号部 1 7からの音 声信号とを合成し出力する音声加算部 (音声合成手段) である。  Reference numeral 16 denotes an audio decoding unit (media decoding means) for decoding audio data from the object separation unit 12, and reference numeral 17 denotes audio for decoding pre-encoded audio data stored in the recording medium 13. A decoding unit (media decoding means) 18 is a speech adding unit (speech synthesis means) for synthesizing and outputting the speech signal from the speech decoding unit 16 and the speech signal from the speech decoding unit 17. .
1 9は、 C C Dなどの撮像素子を使用して撮影するカメラからの映像 信号を処理して映像データを各ォブジェク トに分割するォブジェク ト切 出部であり、 2 0はこのオブジェク ト切出部 1 9からのデータに基づい て映像信号を例えば M P E G— 4方式などの所定のオブジェク ト符号化 方式でオブジェク ト符号化するオブジェク ト符号部 (メディ ア符号化手 段) であり、 2 1は外部からの音声信号を所定の方式で符号化する音声 符号部 (メディ ア符号化手段) である。  Reference numeral 19 denotes an object cutout unit that processes a video signal from a camera that captures images using an image sensor such as a CCD and divides the image data into objects, and 20 denotes an object cutout unit. 19 is an object coding section (media coding means) for subjecting the video signal to a predetermined object coding method such as the MPEG-4 method based on the data from 19; This is an audio encoding unit (media encoding means) that encodes the audio signal from the audio signal according to a predetermined method.
2 2は受信した制御情報および通信相手の送信側装置に応じて記録媒 体 1 3およびオブジェク ト合成部 1 4を制御する呼制御部 (制御手段) である。 次に動作について説明する。 Reference numeral 22 denotes a call control unit (control means) for controlling the recording medium 13 and the object synthesizing unit 14 in accordance with the received control information and the transmitting device of the communication partner. Next, the operation will be described.
回線を介して送信されて く るデ一夕を回線イ ン夕フェース部 1 1が受 信し、 オブジェク ト分離部 1 2がそのデ一夕を映像データ と音声デ一夕 とに分離し、 その映像データを記録媒体 1 3 も しく はオブジェク ト合成 部 1 4、 またはそれらの両方に供給し、 その音声データを記録媒体 1 3 も しくは音声復号部 1 6、 またはそれらの両方に供給する。 記録媒体 1 3に供給された映像データおよび音声データは保存される。 記録媒体 1 3に保存された映像データおよび音声データは、 以後に受信される映像 データや音声データにリアルタイムで合成するためのデータとして適宜 利用される。  The line interface 11 receives the data transmitted via the line, and the object separation unit 12 separates the data into video data and audio data. The video data is supplied to the recording medium 13 or the object synthesizing unit 14 or both, and the audio data is supplied to the recording medium 13 or the audio decoding unit 16 or both. . The video data and the audio data supplied to the recording medium 13 are stored. The video data and audio data stored in the recording medium 13 are appropriately used as data for synthesizing video data and audio data received thereafter in real time.
次にオブジェク ト合成部 1 4は呼制御部 2 2からの制御信号に応じて 、 映像データの一部または全部のオブジェク ト と、 記録媒体 1 3 に保存 された映像データとを合成し、 合成後の映像データをオブジェク ト復号 部 1 5 に供給する。 オブジェク ト復号部 1 5はォブジェク ト合成部 1 4 からの映像データを復号し、 復号後の映像信号を出力する。  Next, the object synthesizing unit 14 synthesizes a part or all of the video data and the video data stored in the recording medium 13 in accordance with the control signal from the call control unit 22, and synthesizes them. The subsequent video data is supplied to the object decoding unit 15. The object decoding unit 15 decodes the video data from the object synthesizing unit 14 and outputs the decoded video signal.
例えば、 オブジェク ト符号化された映像データが人物部分のオブジェ ク ト と背景部分のオブジェク 卜で構成される場合、 その人物部分のォブ ジェク ト と、 記録媒体 1 3 に保存されている他の背景部分のオブジェク ト とが合成される。  For example, when the object-encoded video data is composed of an object of a person part and an object of a background part, the object of the person part and other objects stored in the recording medium 13 are stored. The object with the background part is synthesized.
また、 例えば、 オブジェク ト符号化された映像データが人物部分のォ ブジェク トのみで構成される場合、 その人物部分のオブジェク ト と、 記 録媒体 1 3に保存されている背景部分のオブジェク ト とが合成される。 一方、 音声復号部 1 6は、 音声データを供給されると、 その音声デー 夕を復号し、 復号後の音声信号を音声加算部 1 8 に供給する。 また、 音 声復号部 1 7は記録媒体 1 3に保存された予め符号化された音声データ を復号し、 復号後の音声信号を音声加算部 1 8に供給する。 そして音声 加算部 1 8は音声復号部 1 6からの音声信号と音声復号部 1 7からの音 声信号とを合成し、 合成後の音声信号を出力する。 Further, for example, when the object-encoded video data is composed of only the object of the person, the object of the person and the object of the background stored in the recording medium 13 are used. Are synthesized. On the other hand, when supplied with the audio data, the audio decoding unit 16 decodes the audio data and supplies the decoded audio signal to the audio adding unit 18. The audio decoding unit 17 decodes the pre-encoded audio data stored in the recording medium 13 and supplies the decoded audio signal to the audio adding unit 18. And voice The adder 18 combines the audio signal from the audio decoder 16 with the audio signal from the audio decoder 17 and outputs the synthesized audio signal.
また、 オブジェク ト切出部 1 9およびオブジェク ト符号部 2 0 によ り オブジェク ト符号化された映像データを記録媒体 1 3に保存しておき、 受信した映像デ一夕と リアルタイムで合成するためのデータとして使用 することができ、 また、 音声符号部 2 1 によ り符号化された音声データ を記録媒体 1 3に保存しておき、 受信した音声データと リアルタイムで 合成するためのデータとして使用することができる。  In addition, the video data coded by the object clipping unit 19 and the object coding unit 20 is stored in the recording medium 13 so as to be combined with the received video data in real time. The audio data encoded by the audio encoding unit 21 is stored in the recording medium 13 and used as data for synthesizing received audio data in real time. can do.
さらに、 呼制御部 2 2は、 通信日時および通信相手に関する情報など に基づいて記録媒体 1 3およびオブジェク ト合成部 1 4を制御し、 予め 符号化された映像デ一夕や音声データをオブジェク ト合成部 1 4や音声 復号部 1 7に供給させたりする。 これによ り、 特定の通信相手に対して のみ、 背景画像の入れ替えを実行するように、 または実行しないように することができる。 また、 通信相手に応じて背景画像を切り換えること ができ、 予定 ' イベン ト ' 時節に応じた背景 · 音声の組み合わせを選ぶ ことができる。  Further, the call control unit 22 controls the recording medium 13 and the object synthesizing unit 14 based on the communication date and time and information on the communication partner, and converts the pre-encoded video data and audio data into an object. It is supplied to the synthesizing unit 14 and the audio decoding unit 17. This makes it possible to execute or not execute the replacement of the background image only for a specific communication partner. In addition, the background image can be switched according to the communication partner, and the combination of background and sound can be selected according to the scheduled 'event' time.
また、 呼制御部 2 2は通信相手の送信側端末装置と通信し、 その装置 が本方式による送信を行うか否かを自動的に識別し、 それに対応した受 信処理を実行することができる。 さらに、 送信側から受信側へ適宜制御 信号を供給して、 通信開始時における送信側からの映像データを記録媒 体 1 3に保存しておき、 その後は、 送信側から人物部分の映像データだ けを送信し、 背景部分は記録媒体 1 3 に保存した通信開始時の映像デー 夕と合成するようにしてもよい。 このとき日時情報にも とづき予定 * ィ ベン ト · 時節に応じた映像 · 音声データと合成するようにしてもよい。 以上のように、 この実施の形態 2 によれば、 送信側からのオブジェク ト符号化された映像デ一夕を受信し、 受信したオブジェク 卜の一部また は全部と予めオブジェク ト符号化されたオブジェク ト とを合成し、 合成 後の映像データを復号するようにしたので、 映像中の人物部分のォブジ ェク 卜に予め符号化された背景部分のオブジェク トを リアルタイムに合 成することによ り、 通話者の発信場所が受信側で特定されないように映 像を伝送することができるという効果が得られる。 Also, the call control unit 22 can communicate with the transmitting terminal device of the communication partner, automatically identify whether or not the device performs transmission according to the present method, and execute a receiving process corresponding thereto. . Further, a control signal is appropriately supplied from the transmission side to the reception side, and the video data from the transmission side at the start of communication is stored in the recording medium 13, and thereafter, the video data of the person portion is transmitted from the transmission side. The background portion may be combined with the video data at the start of communication stored in the recording medium 13. At this time, the data may be combined with the video / audio data according to the schedule / event / timetable based on the date and time information. As described above, according to the second embodiment, an object-encoded video image is received from the transmitting side, and a part or a part of the received object is received. Combines the entire object with the object encoded in advance and decodes the combined video data, so that the object of the background part encoded in advance in the object of the person part in the video is By synthesizing the video in real time, it is possible to obtain an effect that the video can be transmitted so that the transmitting side of the caller is not specified on the receiving side.
また、 この実施の形態 2 によれば、 日時情報に基づき合成する背景を 切り替えることによ り、 よ り 自然な通話者の発信場所を秘匿できる効果 が得られる。  Further, according to the second embodiment, by switching the background to be synthesized based on the date and time information, it is possible to obtain a more natural effect of concealing the calling place of the caller.
すなわち、 オブジェク ト合成部 1 4によ り受信したオブジェク ト符号 化された映像データの人物以外の背景部分を、 以前に記録媒体 1 3に保 存した映像デ一夕の背景部分にリアルタイムで入れ替えることによ り、 現在映像を送信している場所とは異なる背景になるため、 送信側に実施 の形態 1 に示すような背景部分を入れ替えるための機能がない場合でも 現在映像を送信している場所を受信側において特定することが困難にな る。  That is, the background portion other than the person of the object-encoded video data received by the object synthesizing section 14 is replaced in real time with the background portion of the video data previously stored in the recording medium 13. As a result, the background is different from the place where the video is currently being transmitted, so the video is currently transmitted even if the transmitting side does not have the function to replace the background as shown in Embodiment 1. It becomes difficult to specify the location on the receiving side.
また、 この実施の形態 2 によれば、 送信側からの音声データを復号し た音声信号と予め取得されている音声信号とを合成するようにしたので 、 よ り通話者の発信場所が受信側で特定されないようにすることができ るという効果が得られる。  Further, according to the second embodiment, since the voice signal obtained by decoding the voice data from the transmitting side and the voice signal obtained in advance are synthesized, the calling place of the caller can be further reduced. The advantage is that it can be prevented from being specified by the.
また、 この実施の形態 2 によれば、 日時情報に基づき合成する音声を 切り替えることによ り、 よ り 自然な通話者の発信場所を秘匿できる効果 が得られる。  Further, according to the second embodiment, by switching the voice to be synthesized based on the date and time information, it is possible to obtain a more natural effect of concealing the calling place of the caller.
さらに、 この実施の形態 2 によれば、 映像の一部である人物部分のォ ブジェク トのみを送信側から受信し、 予めオブジェク ト符号化された映 像デ一夕の背景部分をリアルタイムに合成するようにしたので、 一部の オブジェク トのみを伝送すればよ く、 伝送するデータ量を低減すること ができるという効果が得られる。 実施の形態 3 . Further, according to the second embodiment, only the object of the person portion, which is a part of the video, is received from the transmitting side, and the background portion of the video object which has been encoded in advance is synthesized in real time. Transmission, so that only some of the objects need to be transmitted, reducing the amount of data to be transmitted. Is obtained. Embodiment 3.
第 4図はこの発明の実施の形態 3 による映像送受信装置の構成を示す ブロック図である。 図において、 3 1〜 3 8は実施の形態 1 におけるォ ブジェク ト切出部 1〜回線イ ン夕フェース部 8 と同様のオブジェク ト切 出部〜回線イ ン夕フ ェース部であり、 4 1〜 4 4は実施の形態 2 におけ るオブジェク ト分離部 1 2、 オブジェク ト合成部 1 4、 オブジェク ト復 号部 1 5および音声復号部 1 6 と同様のオブジェク ト分離部、 オブジェ ク ト合成部、 オブジェク ト復号部および音声復号部であ り、 3 9は実施 の形態 1 における呼制御部 9および実施の形態 2 における呼制御部 2 2 の機能を有する呼制御部である。  FIG. 4 is a block diagram showing a configuration of a video transmitting / receiving device according to Embodiment 3 of the present invention. In the figure, reference numerals 31 to 38 denote object cutout sections to line interface sections similar to the object cutout section 1 to line interface section 8 in the first embodiment, respectively. 4 to 4 denote the same object separation unit and object synthesis unit as those of the object separation unit 12, the object synthesis unit 14, the object decoding unit 15, and the speech decoding unit 16 in the second embodiment. A call control unit 39 having the functions of the call control unit 9 according to the first embodiment and the call control unit 22 according to the second embodiment.
なお、 オブジェク ト切出部 3 1、 オブジェク ト符号部 (メディ ア符号 化手段) 3 2、 ォブジ Iク ト合成部 (送信ス ト リーム合成手段) 3 3、 記録媒体 (ス ト リーム蓄積手段) 3 4、 音声加算部 (音声合成手段) 3 5、 音声符号部 (メディ ア符号化手段) 3 6、 音声復号部 (メディ ア復 号手段) 3 7、 回線イ ンタフヱ一ス部 (ス ト リーム送信手段) 3 8およ び呼制御部 3 9が送信処理部を構成し、 回線イ ンタ フ ェース部 (ス ト リ ーム受信手段) 3 8、 オブジェク ト分離部 4 1、 記録媒体 (ス ト リーム 蓄積手段) 3 4、 オブジェク ト合成部 (受信ス ト リーム合成手段) 4 2 、 オブジェク ト復号部 (メディ ア復号手段) 4 3、 音声復号部 (メディ ァ復号手段) 4 4、 音声加算部 3 5、 音声復号部 (メディ ア復号手段) 3 7および呼制御部 3 9が受信処理部を構成する。 すなわち、 記録媒体 3 4、 音声加算部 3 5、 音声復号部 3 7および回線イ ン夕フ ェース部 3 8は、 送信処理部および受信処理部として兼用される。  It should be noted that the object extracting unit 31, the object coding unit (media coding unit) 32, the object combining unit (transmission stream combining unit) 33, and the recording medium (stream storage unit) 34, voice adder (voice synthesizer) 35, voice coder (media encoder) 36, voice decoder (media decoder) 37, line interface (stream) The transmission means 38 and the call control section 39 constitute a transmission processing section, and a line interface section (stream receiving means) 38, an object separation section 41, a recording medium (scan). Stream storage means) 34, object synthesis section (reception stream synthesis means) 42, object decoding section (media decoding means) 43, voice decoding section (media decoding means) 44, voice addition Part 35, voice decoding part (media decoding means) 37 and The call control unit 39 forms a reception processing unit. That is, the recording medium 34, the voice addition unit 35, the voice decoding unit 37, and the line interface unit 38 are also used as a transmission processing unit and a reception processing unit.
また、 第 4図に示す映像送受信装置は、 第 3図に示す映像受信復号装 置にオブジェク ト切出部 3 1、 オブジェク ト符号部 3 2、 オブジェク ト 合成部 3 3および音声符号部 3 6 を追加することによ り実現することが できる。 すなわち、 映像受信復号装置に小さな変更を加えることによ り 映像送受信装置を簡単に実現することができる。 Further, the video transmitting / receiving device shown in FIG. This can be realized by adding an object extracting unit 31, an object encoding unit 32, an object synthesizing unit 33, and a speech encoding unit 36 to the unit. That is, the video transmitting / receiving apparatus can be easily realized by making small changes to the video receiving / decoding apparatus.
次に動作について説明する。  Next, the operation will be described.
上記送信処理部は実施の形態 1 による映像符号化送信装置と同様に動 作し、 上記受信処理部は実施の形態 2 による映像受信復号装置と同様に 動作する。  The transmission processing section operates in the same manner as the video encoding / transmission apparatus according to the first embodiment, and the reception processing section operates in the same manner as the video reception / decoding apparatus according to the second embodiment.
以上のように、 この実施の形態 3によれば、 上述の送信処理部と受信 処理部とを備えたので、 双方向の通信をすることができるとともに、 実 施の形態 1 による効果および実施の形態 2 による効果と同様の効果が得 られる。  As described above, according to the third embodiment, since the transmission processing unit and the reception processing unit described above are provided, two-way communication can be performed, and the effects and effects of the first embodiment can be achieved. The same effect as the effect of mode 2 can be obtained.
また、 この実施の形態 3によれば、 送信処理部の一部と受信処理部の 一部とを兼用することができ、 回路規模を大き く増加させることなく実 施の形態 1 による効果および実施の形態 2 による効果と同様の効果が得 られる。 実施の形態 4 .  Further, according to the third embodiment, a part of the transmission processing unit and a part of the reception processing unit can be shared, and the effects and implementation of the first embodiment can be achieved without greatly increasing the circuit scale. The same effect as the effect of Embodiment 2 can be obtained. Embodiment 4.
第 5図はこの発明の実施の形態 4による映像伝送システムが設けられ たネッ トワークの一例を示す図であ り、 第 6図はこの発明の実施の形態 4による映像伝送システムの構成を示すプロ ック図である。  FIG. 5 is a diagram showing an example of a network provided with a video transmission system according to Embodiment 4 of the present invention, and FIG. 6 is a diagram showing a configuration of a video transmission system according to Embodiment 4 of the present invention. FIG.
第 5図において、 6 1〜 6 3はそれそれ所定の回線 (例えば公衆電話 回線や携帯電話回線) によるネッ トワーク 6 4に接続され、 実施の形態 1 による映像符号化送信装置と同様の映像符号化送信装置を有する端末 装置である。  In FIG. 5, reference numerals 61 to 63 denote the same video codes as those of the video coding and transmitting apparatus according to the first embodiment, which are connected to a network 64 by predetermined lines (for example, public telephone lines and mobile telephone lines). This is a terminal device having a generalized transmission device.
第 6図において、 7 1 は C C Dカメラなどの撮像装置 7 2からの映像 信号、 およびマイクロフォンなどの集音装置 7 3からの音声信号を処理 し、 映像データや音声データを他の端末装置へ送信する実施の形態 1に よる映像符号化送信装置と同様の映像符号化送信装置であり、 7 4は他 の端末装置からの映像データや音声データを回線イ ンタフェース部 7 7 により受信し、 復号部 7 8によりそれそれ復号し、 映像信号をディスプ レイなどの表示装置 7 5に供給し、 音声信号をスピーカなどの音声出力 装置 7 6に供給する受信装置である。 In FIG. 6, reference numeral 71 denotes an image from an imaging device 72 such as a CCD camera. A signal and an audio signal from a sound collection device 73 such as a microphone are processed, and image data and audio data are transmitted to another terminal device. The same video encoded transmission device as the video encoded transmission device according to the first embodiment. A device 74 receives video data and audio data from another terminal device through the line interface unit 77, decodes the data by the decoding unit 78, and converts the video signal into a display device such as a display device. And a sound signal to a sound output device 76 such as a speaker.
次に動作について説明する。  Next, the operation will be described.
各端末装置 6 1 , 6 2において映像符号化送信装置 7 1により映像信 号および音声信号が実施の形態 1の場合と同様にそれそれ符号化され、 その符号化後のデータがネッ トワーク 6 4を介して他の端末装置 6 2, 6 1に伝送される。 そして他の端末装置 6 2, 6 1における受信装置 7 4によりそのデ一夕が受信され、 映像信号や音声信号に復号される。 以上のように、 この実施の形態 4によれば、 実施の形態 1による映像 符号化送信装置を映像伝送システムに使用したので、 遠隔間で映像や音 声を授受する映像伝送システムにおいて実施の形態 1 による効果を享受 することができるという効果が得られる。 実施の形態 5 .  In each of the terminal devices 6 1 and 6 2, the video signal and the audio signal are respectively encoded by the video encoding and transmitting device 71 in the same manner as in the first embodiment, and the encoded data is transmitted to the network 64. Is transmitted to the other terminal devices 62 and 61 via the. The data is received by the receiving device 74 of the other terminal devices 62 and 61, and is decoded into a video signal and an audio signal. As described above, according to the fourth embodiment, since the video encoding and transmitting apparatus according to the first embodiment is used for a video transmission system, the embodiment is applied to a video transmission system for remotely transmitting and receiving video and audio. The effect of 1 can be obtained. Embodiment 5
第 7図はこの発明の実施の形態 5による映像伝送システムの構成を示 すブロック図である。 図において、 8 1は C C Dカメラなどの撮像装置 7 2からの映像信号、 およびマイ クロフォンなどの集音装置 7 3からの 音声信号を符号部 8 2によ りオブジェク ト符号化し、 回線イ ン夕フエ一 ス部 8 3によ り映像データや音声データを他の端末装置へ送信する送信 装置であり、 8 4は他の端末装置からの映像デ一夕や音声データを処理 し、 映像信号や音声信号を表示装置 Ί 5や音声出力装置 7 6に出力する 実施の形態 2 による映像受信復号装置と同様の映像受信復号装置である 次に動作について説明する。 FIG. 7 is a block diagram showing a configuration of a video transmission system according to Embodiment 5 of the present invention. In the figure, reference numeral 81 denotes a video signal from an imaging device 72 such as a CCD camera and an audio signal from a sound collection device 73 such as a microphone, which are subjected to object coding by a coding unit 82, and are connected to a line interface. A transmission unit for transmitting video data and audio data to another terminal device by the face unit 83, and a processing unit 84 for processing video data and audio data from the other terminal device, and Output audio signal to display device Ί5 or audio output device 7.6 This is a video receiving and decoding device similar to the video receiving and decoding device according to the second embodiment. Next, the operation will be described.
各端末装置 6 1, 6 2において送信装置 8 1 により映像信号および音 声信号がそれぞれオブジェク ト符号化され、 その符号化後のデータがネ ッ トワーク 6 4を介して他の端末装置 6 2 , 6 1 に伝送される。 そして 他の端末装置 6 2, 6 1 における映像受信復号装置 8 4によ り実施の形 態 2の場合と同様にそのデータが受信され、 映像信号や音声信号に復号 される。 この際、 送信装置 8 1から、 映像デ一夕の一部のオブジェク ト だけを送信するようにすれば、 伝送データ量が低減される。  In each of the terminal devices 6 1 and 6 2, the video signal and the audio signal are respectively object-coded by the transmitting device 8 1, and the encoded data is transmitted to the other terminal devices 6 2 and 6 Transmitted to 1. Then, the data is received by the video receiving / decoding device 84 in the other terminal devices 62, 61 in the same manner as in the second embodiment, and is decoded into a video signal or an audio signal. At this time, if only a part of the video data is transmitted from the transmission device 81, the amount of transmission data is reduced.
以上のように、 この実施の形態 5 によれば、 実施の形態 2 による映像 受信復号装置を映像伝送システムに使用したので、 遠隔間で映像や音声 を授受する映像伝送システムにおいて実施の形態 2 による効果を享受す ることができるという効果が得られる。  As described above, according to the fifth embodiment, since the video receiving / decoding device according to the second embodiment is used for a video transmission system, the video transmission system for remotely transmitting and receiving video and audio according to the second embodiment is used. The effect that the effect can be enjoyed is obtained.
なお、 実施の形態 5 における送信装置 8 1および映像受信復号装置 8 4の代わり に、 実施の形態 3 による映像送受信装置を設けるようにして もよい。 産業上の利用可能性  Note that, instead of the transmitting device 81 and the video receiving / decoding device 84 in the fifth embodiment, the video transmitting / receiving device according to the third embodiment may be provided. Industrial applicability
以上のように、 この発明に係る映像符号化送信装置、 映像受信復号装 置、 映像送受信装置および映像伝送システムは、 通話者の発信場所が受 信側で特定されないように映像を伝送し、 さらに伝送するデータ量を低 減することに適している。  As described above, the video encoding / transmitting device, the video receiving / decoding device, the video transmitting / receiving device, and the video transmission system according to the present invention transmit a video so that the caller's calling place is not specified on the receiving side. Suitable for reducing the amount of data to be transmitted.

Claims

請 求 の 範 囲 The scope of the claims
1 . 外部から供給された映像信号をオブジェク ト符号化するメディ ァ 符号化手段と、 前記メディ ア符号化手段によ り符号化されたオブジェク 卜の一部または全部と予めオブジェク ト符号化されたオブジェク ト とを 合成する送信ス ト リーム合成手段と、 前記送信ス ト リーム合成手段によ り合成された映像データを送信するス ト リーム送信手段とを備えたこと を特徴とする映像符号化送信装置。 1. Media encoding means for object encoding a video signal supplied from the outside, and a part or all of the object encoded by the media encoding means, which is previously object-encoded with some or all of the objects Video coded transmission comprising: a transmission stream synthesizing means for synthesizing an object; and a stream transmission means for transmitting video data synthesized by the transmission stream synthesizing means. apparatus.
2 . 予めオブジェク ト符号化されたオブジェク トを記録するス ト リ一 ム蓄積手段を備えることを特徴とする請求の範囲第 1項記載の映像符号 化送信装置。 2. The video encoding and transmitting apparatus according to claim 1, further comprising stream storage means for recording an object which has been previously encoded.
3 . 送信ス ト リーム合成手段は、 ス ト リーム蓄積手段から出力される 映像データを、 メディァ符号化手段によ り符号化された映像データに対 して背景として合成処理することを特徴とする請求の範囲第 2項記載の 映像符号化送信装置。 3. The transmission stream synthesizing means performs a synthesizing process on the video data output from the stream storage means with the video data encoded by the media encoding means as a background. 3. The video encoding and transmitting device according to claim 2.
4 . 映像デ一夕は動画像であるこ とを特徴とする請求の範囲第 3項記 載の映像符号化送信装置。 4. The video encoding and transmitting apparatus according to claim 3, wherein the video data is a moving image.
5 . 映像データは静止画像であることを特徴とする請求の範囲第 3項 記載の映像符号化送信装置。 5. The video encoding and transmitting apparatus according to claim 3, wherein the video data is a still image.
6 . 送信先に応じて送信ス ト リーム合成手段を制御する制御手段を備 えることを特徴とする請求の範囲第 1項記載の映像符号化送信装置。 6. The video encoding and transmitting apparatus according to claim 1, further comprising control means for controlling a transmission stream synthesizing means according to a transmission destination.
7 . 送信先に応じて送信ス ト リーム合成手段を制御する制御手段を備 えることを特徴とする請求の範囲第 2項記載の映像符号化送信装置。 7. The video encoding and transmitting apparatus according to claim 2, further comprising control means for controlling a transmission stream synthesizing means according to a transmission destination.
8 . 外部から供給された音声信号と予め取得されている音声信号とを 合成する音声合成手段を備え、 ス ト リーム送信手段は、 映像データとと もに、 前記音声合成手段によ り合成された音声信号に対応する音声デー 夕を送信することを特徴とする請求の範囲第 1項記載の映像符号化送信 8. An audio synthesizing means for synthesizing an audio signal supplied from the outside and an audio signal obtained in advance is provided, and the stream transmitting means is synthesized by the audio synthesizing means together with the video data. 2. The video encoding transmission according to claim 1, wherein the audio data corresponding to the audio signal transmitted is transmitted.
9 . 外部から供給された音声信号と予め取得されている音声信号とを 合成する音声合成手段を備え、 送信ス ト リーム合成手段は、 映像データ とともに、 前記音声合成手段によ り合成された音声信号に対応する音声 データを合成処理することを特徴とする請求の範囲第 1項記載の映像符 号化送信装置。 9. Speech synthesizing means for synthesizing an audio signal supplied from the outside and an audio signal obtained in advance, and the transmission stream synthesizing means, together with the video data, the audio synthesized by the audio synthesizing means. 2. The video encoding and transmitting apparatus according to claim 1, wherein the video encoding and transmitting apparatus synthesizes audio data corresponding to the signal.
1 0 . 送信ス ト リーム合成手段は、 ス ト リーム蓄積手段から予めォブ ジェク ト符号化されたオブジェク トを読み出すことを特徴とする請求の 範囲第 2項記載の映像符号化送信装置。 10. The video encoding transmission device according to claim 2, wherein the transmission stream synthesizing unit reads out an object that has been subjected to object encoding in advance from the stream storage unit.
1 1 . 音声デ一夕は、 ス ト リーム蓄積手段から出力されることを特徴 とする請求の範囲第 1 0項記載の映像符号化送信装置。 11. The video encoding and transmitting apparatus according to claim 10, wherein the audio data is output from a stream storage unit.
1 2 . ス ト リーム蓄積手段は、 予めォブジヱク ト符号化された映像デ —夕および音声デ一夕のどちらか一方または両方を記録することを特徴 とする請求の範囲第 2項記載の映像符号化送信装置。 12. The video codec according to claim 2, wherein the stream storage means records one or both of video data and video data which have been encoded in advance. Transmission device.
1 3 . 外部から供給された音声信号と予め取得されている音声信号と を合成する音声合成手段を備え、 送信ス ト リーム合成手段は、 前記音声 合成手段により合成された音声信号に対応する音声データと、 ス ト リー ム蓄積手段から出力される映像データを合成処理することを特徴とする 請求の範囲第 2項記載の映像符号化送信装置。 13. A voice synthesizing means for synthesizing a voice signal supplied from the outside and a voice signal obtained in advance, wherein the transmission stream synthesizing means comprises a voice corresponding to the voice signal synthesized by the voice synthesizing means. 3. The video encoding and transmitting apparatus according to claim 2, wherein the data and the video data output from the stream storage unit are combined.
1 4 . 制御手段は、 通信相手に基づいて、 オブジェク ト符号化された 複数のオブジェク トを記録しているス ト リーム蓄積手段から出力するォ ブジェク トを選択することを特徴とする請求の範囲第 7項記載の映像符 号化送信装置。 14. The control means selects, based on a communication partner, an object to be output from a stream storage means which records a plurality of object-coded objects. Item 8. The video encoding transmission device according to Item 7.
1 5 . 制御手段は、 通信日時に基づいて、 オブジェク ト符号化された 複数のォブジェク トを記録しているス ト リーム蓄積手段から出力するォ ブジェク トを選択することを特徴とする請求の範囲第 7項記載の映像符 号化送信装置。 15. The control means selects, based on a communication date and time, an object to be output from a stream storage means which records a plurality of object-coded objects. Item 7. The video encoding transmission device according to Item 7.
1 6 . 映像デ一夕は、 M P E G— 4方式で符号化されたものであるこ とを特徴とする請求の範囲第 1項記載の映像符号化送信装置。 16. The video encoding and transmitting apparatus according to claim 1, wherein the video data is encoded by an MPEG-4 system.
1 7 . 音声データは、 M P E G— 4方式で符号化されたものであるこ とを特徴とする請求の範囲第 8項記載の映像符号化送信装置。 17. The video encoding and transmitting apparatus according to claim 8, wherein the audio data is encoded according to the MPEG-4 system.
1 8 . オブジェク ト符号化された映像デ一夕を受信するス ト リーム受 信手段と、 前記ス ト リーム受信手段により受信された映像データにおけ る一部または全部のオブジェク 卜と予めオブジェク ト符号化されたォプ ジ工ク ト とを合成する受信ス ト リ ーム合成手段と、 前記受信ス ト リーム 合成手段によ り合成された映像データを復号するメディ ア復号手段とを 備えたことを特徴とする映像受信復号装置。 18. Stream receiving means for receiving the object-encoded video data, a part or all of the objects in the video data received by the stream receiving means, and an object in advance. Encoded op A video stream comprising: a receiving stream synthesizing means for synthesizing a video signal; and a media decoding means for decoding video data synthesized by the receiving stream synthesizing means. Receiving decoding device.
1 9 . 予めオブジェク ト符号化されたオブジェク トを記録するス ト リ ーム蓄積手段を備えることを特徴とする請求の範囲第 1 8項記載の映像 受信復号装置。 19. The video reception / decoding device according to claim 18, further comprising a stream storage unit that records an object that has been previously encoded.
2 0 . 受信ス ト リーム合成手段は、 ス ト リーム蓄積手段から出力され る映像デ一夕を、 ス ト リーム受信手段によ り受信された映像データに対 して背景として合成処理することを特徴とする請求の範囲第 1 9項記載 の映像受信復号装置。 20. The receiving stream synthesizing means performs a synthesizing process on the video data output from the stream storing means with the video data received by the stream receiving means as a background. 10. The video receiving and decoding apparatus according to claim 19, wherein the video receiving and decoding apparatus is characterized in that:
2 1 . 映像デ一夕は動画像であることを特徴とする請求の範囲第 2 0 項記載の映像受信復号装置。 21. The video receiving and decoding apparatus according to claim 20, wherein the video image is a moving image.
2 2 . 映像データは静止画像であることを特徴とする請求の範囲第 2 0項記載の映像受信復号装置。 22. The video receiving / decoding apparatus according to claim 20, wherein the video data is a still image.
2 3 . 受信ス ト リーム合成手段は、 ス ト リーム受信手段によ り受信さ れた人物部分のオブジェク ト と予めオブジェク ト符号化された背景部分 のオブジェク 卜 とを合成することを特徴とする請求の範囲第 1 8項記載 の映像受信復号装置。 23. The receiving stream combining means combines the object of the person portion received by the stream receiving means with the object of the background portion which has been object-coded in advance. 19. The video receiving and decoding device according to claim 18, wherein:
2 4 . 送信元に応じて受信ス ト リーム合成手段を制御する制御手段を 備えることを特徴とする請求の範囲第 1 9項記載の映像受信復号装置。 24. The video receiving and decoding apparatus according to claim 19, further comprising control means for controlling a receiving stream combining means according to a transmission source.
2 5 . ス ト リーム受信手段は、 映像データとともに音声デ一夕を受信 し、 前記ス ト リーム受信手段により受信された音声データに対応する音 声信号と予め取得されている音声信号とを合成する音声合成手段を備え ることを特徴とする請求の範囲第 1 8項記載の映像受信復号装置。 25. The stream receiving means receives the audio data together with the video data, and synthesizes an audio signal corresponding to the audio data received by the stream receiving means with a previously acquired audio signal. 19. The video receiving / decoding device according to claim 18, further comprising a voice synthesizing unit that performs the decoding.
2 6 . ス ト リーム受信手段から受信された音声信号と予め取得されて いる音声信号とを合成する音声合成手段を備え、 受信ス ト リーム合成手 段は、 映像データとともに、 前記音声合成手段により合成された音声信 号に対応する音声データを合成処理することを特徴とする請求の範囲第26. A voice synthesizing means for synthesizing an audio signal received from the stream receiving means and a previously acquired audio signal, wherein the receiving stream synthesizing means is provided together with video data by the voice synthesizing means. The audio data corresponding to the synthesized audio signal is synthesized.
1 8項記載の映像受信復号装置。 18. The video receiving / decoding device according to item 8.
2 7 . 受信ス ト リーム合成手段は、 ス ト リーム蓄積手段から予めォブ ジェク ト符号化されたオブジェク トを読み出すことを特徴とする請求の 範囲第 1 9項記載の映像受信復号装置。 27. The video receiving / decoding apparatus according to claim 19, wherein the receiving stream synthesizing means reads out an object which has been subjected to object encoding in advance from the stream storing means.
2 8 . 音声デ一夕は、 ス ト リーム蓄積手段から出力されることを特徴 とする請求の範囲第 2 6項記載の映像受信復号装置。 28. The video reception / decoding device according to claim 26, wherein the audio data is output from the stream storage means.
2 9 . ス ト リーム蓄積手段は、 予めォブジヱク ト符号化された映像デ 一夕および音声デ一夕のどちらか一方または両方を記録することを特徴 とする請求の範囲第 1 9項記載の映像受信復号装置。 29. The video according to claim 19, wherein the stream storage means records one or both of video data and audio data which have been encoded in advance. Receiving decoding device.
3 0 . ス ト リーム受信手段から受信された音声信号と予め取得されて いる音声信号とを合成する音声合成手段を備え、 受信ス ト リーム合成手 段は、 前記音声合成手段により合成された音声信号に対応する音声デ一 夕と、 ス ト リーム蓄積手段から出力される映像データを合成処理するこ とを特徴とする請求の範囲第 1 9項記載の映像受信復号装置。 30. Speech synthesizing means for synthesizing a speech signal received from the stream receiving means and a previously acquired speech signal, wherein the receiving stream synthesizing means comprises a speech synthesized by the speech synthesizing means. Audio data corresponding to the signal 10. The video reception decoding apparatus according to claim 19, wherein the video data output from the stream storage means is combined with the video data in the evening.
3 1 . ス ト リーム受信手段から受信された音声信号と予め取得されて いる音声信号とを合成する音声合成手段を備え、 受信ス ト リーム合成手 段は、 前記音声合成手段によ り合成された音声信号に対応する音声デー 夕とス ト リーム蓄積手段から出力される映像データとを合成処理し、 合 成処理された前記音声データと前記映像デ一夕 とをス ト リーム蓄積手段 に蓄積することを特徴とする請求の範囲第 1 9項記載の映像受信復号装 31. Speech synthesizing means for synthesizing an audio signal received from the stream receiving means and a previously acquired audio signal, wherein the receiving stream synthesizing means is synthesized by the speech synthesizing means. The audio data corresponding to the audio signal and the video data output from the stream storage means are synthesized, and the synthesized audio data and the video data are stored in the stream storage means. 10. The video receiving / decoding device according to claim 19, wherein:
3 2 . 制御手段は、 通信相手に基づいて、 オブジェク ト符号化された 複数のオブジェク トを記録しているス ト リ一ム蓄積手段から出力するォ ブジェク トを選択することを特徴とする請求の範囲第 2 4項記載の映像 受信復号装置。 32. The control means selects, based on a communication partner, an object to be output from the stream storage means which records a plurality of object-coded objects. 25. The video receiving / decoding device according to item 24.
3 3 . 制御手段は、 通信日時に基づいて、 オブジェク ト符号化された 複数のオブジェク 卜を記録しているス ト リーム蓄積手段から出力するォ ブジェク トを選択することを特徴とする請求の範囲第 2 4項記載の映像 受信復号装置。 33. The control means selects, based on a communication date and time, an object to be output from a stream storage means which records a plurality of object-coded objects. Item 26. The video reception / decoding device according to Item 24.
3 4 . 映像データは、 M P E G— 4方式で符号化されたものであるこ とを特徴とする請求の範囲第 1 8項記載の映像受信復号装置。 34. The video receiving / decoding apparatus according to claim 18, wherein the video data is coded according to the MPEG-4 method.
3 5 . 音声データは、 M P E G— 4方式で符号化されたものであるこ とを特徴とする請求の範囲第 2 5項記載の映像受信復号装置。 35. The video receiving / decoding apparatus according to claim 25, wherein the audio data is encoded by the MPEG-4 system.
3 6 . 外部から供給された映像信号および音声信号のどちらか一方も しくは両方をオブジェク ト符号化するメディ ァ符号化手段、 前記メディ ァ符号化手段によ り符号化されたオブジェク 卜の一部または全部と予め オブジェク ト符号化されたオブジェク ト とを合成する送信ス ト リ一ム合 成手段、 および前記送信ス ト リーム合成手段によ り合成された映像デー 夕および音声デ一夕のどちらか一方も しく は両方を送信するス ト リ一ム 送信手段を有する送信処理部と、 オブジェク ト符号化された映像データ および音声データのどちらか一方も しく は両方を受信するス ト リーム受 信手段、 前記ス ト リーム受信手段によ り受信された映像デ一夕および音 声データのどちらか一方も しくは両方におけるオブジェク ト と予めォブ ジェク ト符号化されたオブジェク ト とを合成する受信ス ト リーム合成手 段、 および前記受信ス ト リ一ム合成手段によ り合成された映像データお よび音声データのどちらか一方も しくは両方を復号するメディ ア復号手 段を有する受信処理部とを備えることを特徴とする映像送受信装置。 36. Media encoding means for object encoding one or both of a video signal and an audio signal supplied from the outside, and one of the objects encoded by the media encoding means. Transmission stream synthesizing means for synthesizing a part or all of the object and an object coded in advance, and video data and audio data synthesized by the transmission stream synthesizing means. A transmission processing unit having a stream transmission means for transmitting one or both of them, and a stream reception unit for receiving one or both of the object-encoded video data and audio data. Communication means, the object in one or both of the video data and / or the audio data received by the stream receiving means. Receiving stream synthesizing means for synthesizing the object and the image data and / or audio data synthesized by the receiving stream synthesizing means. And a reception processing section having a media decoding means for decoding the video.
3 7 . 外部から供給された映像信号および音声信号のどちらか一方も しくは両方をオブジェク ト符号化するメディ ァ符号化手段、 前記メディ ァ符号化手段によ り符号化されたオブジェク トの一部または全部と予め オブジェク ト符号化されたォブジェク ト とを合成する送信ス ト リ一ム合 成手段、 および前記送信ス ト リーム合成手段により合成された映像デ一 夕および音声データのどちらか一方も しくは両方を送信するス ト リ一ム 送信手段を有する映像符号化送信装置と、 前記映像符号化送信装置から の映像データおよび音声データのどちらか一方も しくは両方を受信し復 号する受信装置とを備えることを特徴とする映像伝送システム。 37. Media encoding means for object encoding one or both of a video signal and an audio signal supplied from the outside, and one of the objects encoded by the media encoding means. Transmission stream synthesizing means for synthesizing a part or all of the object and an object coded in advance, and either one of video data and audio data synthesized by the transmission stream synthesizing means Or a video encoding and transmitting apparatus having a stream transmitting means for transmitting both, and receiving and decoding either or both of the video data and the audio data from the video encoding and transmitting apparatus A video transmission system comprising a receiving device.
3 8 . 外部から供給される映像信号および音声信号のどちらか一方も しくは両方をオブジェク ト符号化し、 オブジェク ト符号化された映像デ —夕および音声データのどちらか一方も しくは両方のオブジェク トの一 部を送信する送信装置と、 前記送信装置からのオブジェク ト符号化され た映像デ一夕および音声デ一夕のどちらか一方も しく は両方を受信する ス ト リーム受信手段、 前記ス ト リーム受信手段によ り受信された映像デ 一夕および音声デ一夕のどちらか一方も しくは両方におけるオブジェク ト と予めオブジェク ト符号化されたオブジェク ト とを合成する受信ス ト リーム合成手段、 および前記受信ス ト リーム合成手段によ り合成された 映像データおよび音声データのどちらか一方も しく は両方を復号するメ ディ ァ復号手段を有する映像受信復号装置とを備えることを特徴とする 映像伝送システム。 3 8. Either or both of the externally supplied video signal and audio signal are object-encoded, and the object-encoded video data — one or both of the evening and audio data. A transmitting device for transmitting a part of the data, a stream receiving means for receiving one or both of the object-encoded video data and the audio data from the transmitting device, and the stream. A receiving stream synthesizing means for synthesizing an object in one or both of the video data and / or the audio data received by the stream receiving means and a pre-encoded object. , And a media that decodes one or both of the video data and the audio data synthesized by the reception stream synthesis means. Video transmission system, comprising a video receiver-decoder apparatus having decoding means.
PCT/JP2000/008603 1999-12-07 2000-12-05 Video encoding/transmitting device, video receiving/decoding device, video transmitting/receiving device, and video transmitting system WO2001043443A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP11/348081 1999-12-07
JP34808199 1999-12-07

Publications (1)

Publication Number Publication Date
WO2001043443A1 true WO2001043443A1 (en) 2001-06-14

Family

ID=18394624

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2000/008603 WO2001043443A1 (en) 1999-12-07 2000-12-05 Video encoding/transmitting device, video receiving/decoding device, video transmitting/receiving device, and video transmitting system

Country Status (2)

Country Link
CN (1) CN1409928A (en)
WO (1) WO2001043443A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006287482A (en) * 2005-03-31 2006-10-19 Nec Corp Video telephone method and mobile terminal

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024489B (en) * 2012-12-24 2016-05-11 京东方科技集团股份有限公司 Image processing apparatus and system, video frequency collection card, display device, Set Top Box

Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56119582A (en) * 1980-02-25 1981-09-19 Toppan Printing Co Ltd Video device for accompaniment play
JPH01101087A (en) * 1987-10-14 1989-04-19 Toshiba Corp Picture transmission equipment
JPH0222986A (en) * 1988-07-12 1990-01-25 Mitsubishi Electric Corp Image transmission equipment
JPH02128584A (en) * 1988-11-09 1990-05-16 Nec Corp Still-picture video telephone set
JPH02241285A (en) * 1989-03-15 1990-09-25 Matsushita Electric Ind Co Ltd Highly efficient encoder for moving image signal
JPH0349492A (en) * 1989-07-18 1991-03-04 Mitsubishi Electric Corp Still picture video telephone equipment
JPH03241993A (en) * 1990-02-19 1991-10-29 Mitsubishi Electric Corp Picture transmitter
JPH0457582A (en) * 1990-06-27 1992-02-25 Nec Corp Video telephone set
JPH04310086A (en) * 1991-04-08 1992-11-02 Sharp Corp Video telephone set
JPH0591407A (en) * 1991-09-30 1993-04-09 Nippon Telegr & Teleph Corp <Ntt> Video communication equipment
JPH05145914A (en) * 1991-11-21 1993-06-11 Nec Corp Image transmitter
JPH06165173A (en) * 1992-11-17 1994-06-10 Nippon Telegr & Teleph Corp <Ntt> System for attaining virtual society
JPH06186988A (en) * 1992-12-18 1994-07-08 Brother Ind Ltd Centralized control system of acoustic device
JPH06319130A (en) * 1993-05-08 1994-11-15 Fujitsu General Ltd Picture transmission system
JPH0730888A (en) * 1993-06-24 1995-01-31 Canon Inc Moving image transmitter and moving image receiver
JPH07250312A (en) * 1994-03-08 1995-09-26 Fujitsu Ltd Portrait segmentation transmission method
JPH08275132A (en) * 1995-03-31 1996-10-18 Sumitomo Electric Ind Ltd Two-way image transmission conversation system
JPH09130799A (en) * 1995-11-02 1997-05-16 Toshiba Corp Image compression processing method and video conference system
JPH09326846A (en) * 1996-06-04 1997-12-16 Nec Corp Telephone set with alibi function
JPH10224760A (en) * 1997-02-03 1998-08-21 Oki Electric Ind Co Ltd Video conference method and its device
JPH11317909A (en) * 1998-02-02 1999-11-16 Matsushita Electric Ind Co Ltd Picture synthesis method/device and data recording medium

Patent Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56119582A (en) * 1980-02-25 1981-09-19 Toppan Printing Co Ltd Video device for accompaniment play
JPH01101087A (en) * 1987-10-14 1989-04-19 Toshiba Corp Picture transmission equipment
JPH0222986A (en) * 1988-07-12 1990-01-25 Mitsubishi Electric Corp Image transmission equipment
JPH02128584A (en) * 1988-11-09 1990-05-16 Nec Corp Still-picture video telephone set
JPH02241285A (en) * 1989-03-15 1990-09-25 Matsushita Electric Ind Co Ltd Highly efficient encoder for moving image signal
JPH0349492A (en) * 1989-07-18 1991-03-04 Mitsubishi Electric Corp Still picture video telephone equipment
JPH03241993A (en) * 1990-02-19 1991-10-29 Mitsubishi Electric Corp Picture transmitter
JPH0457582A (en) * 1990-06-27 1992-02-25 Nec Corp Video telephone set
JPH04310086A (en) * 1991-04-08 1992-11-02 Sharp Corp Video telephone set
JPH0591407A (en) * 1991-09-30 1993-04-09 Nippon Telegr & Teleph Corp <Ntt> Video communication equipment
JPH05145914A (en) * 1991-11-21 1993-06-11 Nec Corp Image transmitter
JPH06165173A (en) * 1992-11-17 1994-06-10 Nippon Telegr & Teleph Corp <Ntt> System for attaining virtual society
JPH06186988A (en) * 1992-12-18 1994-07-08 Brother Ind Ltd Centralized control system of acoustic device
JPH06319130A (en) * 1993-05-08 1994-11-15 Fujitsu General Ltd Picture transmission system
JPH0730888A (en) * 1993-06-24 1995-01-31 Canon Inc Moving image transmitter and moving image receiver
JPH07250312A (en) * 1994-03-08 1995-09-26 Fujitsu Ltd Portrait segmentation transmission method
JPH08275132A (en) * 1995-03-31 1996-10-18 Sumitomo Electric Ind Ltd Two-way image transmission conversation system
JPH09130799A (en) * 1995-11-02 1997-05-16 Toshiba Corp Image compression processing method and video conference system
JPH09326846A (en) * 1996-06-04 1997-12-16 Nec Corp Telephone set with alibi function
JPH10224760A (en) * 1997-02-03 1998-08-21 Oki Electric Ind Co Ltd Video conference method and its device
JPH11317909A (en) * 1998-02-02 1999-11-16 Matsushita Electric Ind Co Ltd Picture synthesis method/device and data recording medium

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
H. MIKI: "Tasaina eizo, onsei wo jizai ni fugouka suru MPEG-4 no subete", KOGYO CHOSAKAI, 1998, pages 37 - 116, 116-152, XP002937325 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006287482A (en) * 2005-03-31 2006-10-19 Nec Corp Video telephone method and mobile terminal

Also Published As

Publication number Publication date
CN1409928A (en) 2003-04-09

Similar Documents

Publication Publication Date Title
US5550593A (en) Multiplex communication system using separated and multiplexed data
KR100605935B1 (en) Method for taking moving picture
US5333137A (en) Coding system having data controlling mechanism activated when error is detected
JPS62200994A (en) Animation communication system
US5900906A (en) Image communication apparatus having automatic answering and recording function
WO2001043443A1 (en) Video encoding/transmitting device, video receiving/decoding device, video transmitting/receiving device, and video transmitting system
JP2002290973A (en) Multimedia communication equipment
US6430221B1 (en) Transmitter, receiver, transmitting method and receiving method
JPS62200883A (en) Graphic display device for electronic conference system
JPS62226781A (en) Still picture information transmission system in electronic conference system
JP3300471B2 (en) Communication control device
JPS6390953A (en) Multi-media communication equipment
JP2003348222A (en) Portable telephone set with video telephone function
JP2862249B2 (en) TV teleconference system, interframe encoder and composite device
JP3728812B2 (en) Image communication terminal
JP2988686B2 (en) Radiation receiving system
JP3444905B2 (en) Video communication method
JPH1132337A (en) Data structure for transmitting picture and encoding method and decoding method
JPH08331537A (en) Dynamic image communication equipment
JP2002094996A (en) Receiver
JPH09130263A (en) Data communication equipment, encoding device and decoding device
JPH09149395A (en) Communication equipment
JPH11275560A (en) Monitoring system, and data processor using the system
JP3475541B2 (en) Image communication terminal device
JP2005057362A (en) Transmitting/receiving and recording system for voice and picture

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref country code: JP

Ref document number: 2001 543019

Kind code of ref document: A

Format of ref document f/p: F

AK Designated states

Kind code of ref document: A1

Designated state(s): CN JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

WWE Wipo information: entry into national phase

Ref document number: 09890435

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)

Free format text: (EXCEPT JP, US)

WWE Wipo information: entry into national phase

Ref document number: 00816908X

Country of ref document: CN

122 Ep: pct application non-entry in european phase