WO2020149164A1 - 多地点制御方法、装置及びプログラム - Google Patents

多地点制御方法、装置及びプログラム Download PDF

Info

Publication number
WO2020149164A1
WO2020149164A1 PCT/JP2020/000101 JP2020000101W WO2020149164A1 WO 2020149164 A1 WO2020149164 A1 WO 2020149164A1 JP 2020000101 W JP2020000101 W JP 2020000101W WO 2020149164 A1 WO2020149164 A1 WO 2020149164A1
Authority
WO
WIPO (PCT)
Prior art keywords
code
sound signal
terminal device
bit string
communication terminal
Prior art date
Application number
PCT/JP2020/000101
Other languages
English (en)
French (fr)
Inventor
守谷 健弘
優 鎌本
亮介 杉浦
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to EP20741280.0A priority Critical patent/EP3913622B1/en
Priority to US17/422,711 priority patent/US11810581B2/en
Priority to CN202080009239.9A priority patent/CN113302686A/zh
Publication of WO2020149164A1 publication Critical patent/WO2020149164A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/561Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities by multiplexing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/006Networks other than PSTN/ISDN providing telephone service, e.g. Voice over Internet Protocol (VoIP), including next generation networks with a packet-switched transport layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/40Support for services or applications
    • H04L65/403Arrangements for multi-party communication, e.g. for conferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/80Responding to QoS

Definitions

  • the present invention is at least one of a control technology in a multipoint control unit (Multipoint Control Unit, MCU) for conducting a telephone conference at multiple points, a sound signal encoding technology at each point, and a sound signal decoding technology at each point.
  • MCU Multipoint Control Unit
  • Patent Document 1 uses embedded coding by basic quality coding and quality extension coding.
  • the sound signal coding device at each point performs embedded coding by basic quality coding and quality extension coding on the input sound signal to obtain a code and outputs it to the multipoint control device.
  • the multipoint control device decodes the code of all points to obtain a sound signal, mixes the obtained sound signal, encodes the mixed sound signal, and after mixing.
  • the code obtained from the sound signal of is transmitted to each point.
  • the multipoint control device selects the code of the most important one point and sends the code to each point for the quality extension coding part, or the code of a plurality of points having high importance. Is decoded to obtain a sound signal, the obtained sound signal is mixed, the mixed sound signal is encoded, and the code obtained from the mixed sound signal is transmitted to each point.
  • the decoding device for the sound signal at each point decodes the code transmitted by the multipoint control device to obtain a sound signal including the basic quality part of all points and the quality extension part of the point of high importance.
  • the multi-point control device always decodes the basic quality part before coding, and the pair of coding and decoding is connected in tandem. Therefore, when the technique of Patent Document 1 is implemented by using a high-compression encoding/decoding method having a large amount of arithmetic processing and a large amount of required memory such as used in mobile communication, a pair of encoding and decoding is connected in tandem. There is a problem that the sound quality is significantly deteriorated due to this, and that a large amount of arithmetic processing and a required memory amount of the multipoint control device increase because many decoding processes and encoding processes are performed.
  • a first communication network terminal device at an M point (M is an integer of 2 or more) and a second communication network terminal device at an N point (N is an integer of 1 or more) communicate with each other.
  • an extension code CFE m including a code representing information corresponding to the difference between the input sound signals of two or more channels, as a code string representing the sound signal, and each second communication network terminal device.
  • the bit string input from the device to the multipoint control device via the communication path is a monaural code obtained by encoding the 1-channel sound signal input to the second communication network communication terminal device by the first encoding method.
  • a multi-point control device is a bit string including CMM n (n is an integer of 1 or more and N or less) as a code representing a sound signal, and the multipoint control device is a first communication network terminal device of M point and a second communication network terminal device of N point.
  • the present invention it is possible to reduce the occurrence of sound quality deterioration due to tandem connection of a pair of encoding and decoding even when implemented using a high compression encoding method used in mobile communication. In addition, it is possible to reduce the calculation processing amount and the required memory amount of the multipoint control device.
  • the block diagram which shows the example of a multipoint telephone connection system The block diagram which shows the example of a fixed communication terminal device.
  • the block diagram which shows the example of a multipoint control apparatus The figure which showed typically the example of the code string showing the sound signal in case selection point information is the information of case 1.
  • the figure which showed typically the example of the code string showing the sound signal in case selection point information is the information of case 2.
  • the figure which showed typically the example of the code string showing the sound signal in case selection point information is the information of case 3.
  • the figure which showed typically the example of the code string showing the sound signal in case selection point information is the information of case 4.
  • the figure which showed typically the example of the code string showing the sound signal in case selection point information is the information of case 5.
  • the flowchart which shows the example of a process of the sound signal fixed transmission side apparatus of a fixed communication terminal device.
  • the flowchart which shows the example of a process of the sound signal fixed receiving side apparatus of a fixed communication terminal device.
  • the flowchart which shows the example of a process of the sound signal fixed transmission side apparatus of a mobile communication terminal device.
  • the flowchart which shows the example of a process of the sound signal fixed reception side apparatus of a mobile communication terminal device.
  • the flowchart which shows the example of a process of a multipoint control apparatus.
  • the multipoint telephone connection system 10 includes a multipoint control device 100, a first communication network terminal device 200-m (m is an integer of 1 or more and M or less), and a second communication network terminal device 300. -N (n is an integer of 1 or more and N or less).
  • the multipoint control device 100 and each first communication network terminal device 200-m are connected via each transmission line 400-m of the first communication network.
  • the multipoint control device 100 and each second communication network terminal device 300-n are connected via each transmission line 500-n of the second communication network.
  • the first communication network and the second communication network are communication networks having different communication capacities capable of real-time transmission.
  • the communication capacity in each direction of each transmission path 400-m of the first communication network is K times or more (K is an integer of 2 or more) the communication capacity in each direction of each transmission path 500-n of the second communication network,
  • the total number of the first communication network terminal device and the second communication network terminal device is K+1 or more, and at least one first communication network terminal device and at least one second communication network terminal for K+1 or more terminal devices. It is assumed that each terminal device can reproduce a decoded sound signal corresponding to the sound signal of the terminal device at the maximum K point. That is, in the present invention, M is 1 or more, N is 1 or more, and M+N is K+1 or more.
  • each communication network is fixed communication or mobile communication. That is, there is no restriction on whether the transmission path of each communication network is a wired transmission path or a wireless transmission path.
  • the present invention is also applicable, for example, when the first communication network is an existing fixed telephone communication network and the second communication network is an existing mobile telephone communication network. Therefore, in consideration of ease of understanding, in each of the following embodiments, it is assumed that the first communication network is an existing fixed telephone communication network and the second communication network is an existing mobile telephone communication network.
  • the first communication network terminal device 200-m is the fixed communication terminal device 200-m
  • the second communication network terminal device 300-n is the mobile communication terminal device 300-n.
  • the transmission line 400-m of the first communication network is the fixed transmission line 400-m
  • the transmission line 500-n of the second communication network is the mobile transmission line 500-n.
  • the multipoint telephone connection system 10 of the first embodiment includes a multipoint control device 100 and a plurality (M) of fixed communication terminal devices 200-m (m is an integer of 1 or more and M or less). ) And a plurality (N) of mobile communication terminal devices 300-n (n is an integer of 1 or more and N or less).
  • M is an integer of 2 or more
  • N is an integer of 2 or more.
  • the multipoint control device 100 and each fixed communication terminal device 200-m are one of the telephone band voice coding systems for fixed telephones, such as a transmission line of 64 kbps in each direction for the upward and downward directions for fixed telephone voice lines. They are connected via fixed transmission lines 400-m each having a communication capacity capable of transmitting codes for channels in real time.
  • the telephone band voice coding system for fixed telephones is, for example, ITU-T G.711.
  • the multipoint control device 100 and each mobile communication terminal device 300-n are based on a telephone band voice encoding system for a mobile phone, such as a transmission line of 13.2 kbps in each direction for going up and down for a voice line of a mobile phone.
  • the telephone band voice coding method for mobile phones is, for example, the 13.2 kbps mode of the 3GPP EVS standard (3GPP TS26.442).
  • the fixed communication terminal device 200-m is, for example, a high-performance telephone or a PC equipped with a microphone and a speaker, and as shown in FIG. 2, a sound signal fixed transmission side device 210-m and a sound signal fixed reception side device 220-m.
  • the sound signal fixed transmission side device 210-m includes a sound collection unit 211-m, an encoding unit 212-m, and a control information addition unit 213-m.
  • the sound signal fixed reception side device 220-m includes a control information analysis unit 221-m, a decoding unit 222-m, and a reproduction unit 223-m.
  • the sound signal fixed transmission side device 210-m of the fixed communication terminal device 200-m performs the processing of FIG. 10 and step S211 to step S213 exemplified below, and the sound signal fixed reception side device of the fixed communication terminal device 200-m. 220-m performs the processing of FIG. 11 and steps S221 to S223 illustrated below.
  • the sound signal fixed transmission side device 210-m obtains a fixed terminal transmission bit string which is a bit string containing codes corresponding to digital sound signals of two channels, for example, every predetermined time period of 20 ms, that is, for each frame. Output to the fixed transmission path 400-m. That is, the sound signal fixed transmission side device 210-m outputs the fixed terminal transmission bit string to the multipoint control device 100 via the fixed transmission line 400-m.
  • the sound collection unit 211-m of the sound signal fixed transmission side device 210-m includes two microphones and two AD conversion units. Each microphone is associated with one-to-one correspondence with each AD converter.
  • the microphone collects the sound generated in the spatial region around the microphone, converts the sound into an analog electric signal, and outputs the analog electric signal to the AD conversion unit.
  • the AD conversion unit converts the input analog electric signal into a digital sound signal that is a PCM signal with a sampling frequency of 8 kHz, for example, and outputs the digital sound signal.
  • the sound pickup unit 211-m outputs a digital sound signal of two channels corresponding to the sound picked up by each of the two microphones, for example, a two-channel stereo digital sound signal of the left channel and the right channel.
  • the signal is output to the encoding unit 212-m of the fixed signal transmission side apparatus 210-m (step S211).
  • the encoding unit 212-m of the sound signal fixed transmission side device 210-m is a code representing a signal obtained by mixing the digital sound signals of the two channels input from the sound collection unit 211-m for each frame.
  • a code and an extension code that can represent each of the two input digital sound signals by using the extension code in addition to the monaural code are obtained, and the obtained monaural code and extension code are fixed as the sound signal.
  • the data is output to the control information addition unit 213-m of the transmission side device 210-m (step S212). That is, the extension code obtained by the encoding unit 212-m is a code that cannot obtain the decoded digital sound signals of the two channels even if only the extension code is used. It is a code that can obtain both the decoded digital sound signals of the two channels, and is a code that includes a code that represents information corresponding to the difference between the input digital sound signals of the two channels.
  • a signal obtained by mixing digital sound signals of two channels is, for example, a series obtained by adding corresponding samples of digital sound signals of two channels, and an average of corresponding samples of digital sound signals of two channels.
  • the code representing the information corresponding to the difference between the digital sound signals of the two channels is a code obtained by coding the information of the waveform representing the difference between the digital sound signals of the two channels, and the digital sound of the two channels.
  • the waveform information representing the difference between the digital sound signals of the two channels is, for example, a series of values obtained by subtracting the corresponding samples of the digital sound signals of the other channel from the samples of the digital sound signal of the other channel.
  • a series of values obtained by subtracting the corresponding sample of the digital sound signal of the other channel from the sample of the digital sound signal of the other channel, by 2 and at least one of the digital sound signals of the two channels A sequence obtained by performing the above-mentioned subtraction or subtraction and division with respect to the one obtained by transforming or giving a time delay, a sequence obtained by transforming the sequence obtained by the above-mentioned subtraction or subtraction and division, any one of the above Is part of the series.
  • the characteristic parameter representing the difference between the digital sound signals of the two channels is the channel such as the energy difference of each frequency band of the digital sound signals of the two channels, the correlation of each frequency band, and the phase difference of each frequency band. It is one or a plurality of feature quantities indicating the relationship between signals and the degree of difference.
  • the encoding unit 212-m encodes, for each frame, a signal obtained by mixing the digital sound signals of the two channels input from the sound collection unit 211-m using a predetermined first encoding method.
  • a monaural code obtain an extended code including a code representing information corresponding to the difference between the digital sound signals of the two input channels, and transmit the obtained monaural code and the extended code in a fixed sound signal. It is output to the control information addition unit 213-m of the side device 210-m.
  • the encoding unit 212-m corresponds to the difference between the digital audio signals of the two input channels.
  • the information to be encoded is encoded by a predetermined second encoding method to obtain a code.
  • the encoding unit 212-m determines a predetermined first series of a series (that is, a well-known MS stereo M channel signal) obtained by averaging corresponding samples of the digital sound signals of the two input channels.
  • the signals are encoded by a coding method to obtain a monaural code and output, and the corresponding samples of the input digital sound signals of the two channels are converted from the samples of the digital sound signals of the first channel to the second digital sound signal.
  • the sequence obtained by subtracting the value obtained by subtracting the sample of the channel of the sound signal by 2 (the signal of the well-known MS stereo S channel) is encoded by a predetermined second encoding method to obtain a code,
  • the obtained code is output as an extension code.
  • the coding units 212-m of all the sound signal fixed transmission side devices 210-m and the coding units 312-n of all the sound signal mobile transmission side devices 310-n are used. Use the same encoding scheme. Therefore, as the first encoding method, it is necessary to use an encoding method in which the bit rate of the monaural code is equal to or less than the communication capacity of the mobile transmission path 500-n. Therefore, as the first encoding method, an encoding method of a telephone band voice for mobile phones, for example, the above-mentioned 13.2 kbps mode of the 3GPP EVS standard may be used.
  • the bit rate of the extended code must be less than or equal to the value obtained by subtracting the bit rate of the monaural code from the communication capacity of the fixed transmission path 400-m. Therefore, when encoding the information corresponding to the difference between the input digital sound signals of the two channels, the second encoding method is to encode all the sound signal fixed transmission side devices 210-m. It is necessary to use the same encoding method in the unit 212-m, and the encoding method in which the bit rate of the extension code is equal to or less than the value obtained by subtracting the bit rate of the monaural code from the communication capacity of the fixed transmission path 400-m. is there.
  • the second encoding method information corresponding to a difference between sound signals of two channels, for example, a difference signal between sound signals of two channels, within a range in which the bit rate of the extension code satisfies the above-mentioned condition. It suffices to use an encoding method capable of efficiently encoding
  • the same coding method as the first coding method may be used as the second coding method, and, for example, the above-mentioned 13.2 kbps mode of the 3GPP EVS standard may be used as the second coding method.
  • the extension code is a code for obtaining, on the decoding side, a decoded signal regarding a quantization error when a signal obtained by mixing input digital sound signals of two channels is encoded by the first encoding method. May be included. That is, the encoding unit 212-m also obtains and obtains a code representing the quantization error when the signal obtained by mixing the input digital sound signals of the two channels is encoded by the first encoding method.
  • the extension code may include a code indicating the quantization error and a code indicating the information corresponding to the difference described above.
  • the code representing the quantization error is also referred to as an error code
  • the code representing the information corresponding to the difference is also referred to as a difference code.
  • the encoding unit 212-m determines a predetermined first series of a series (that is, a well-known MS stereo M channel signal) obtained by averaging corresponding samples of the digital sound signals of the two input channels.
  • a provisional decoded digital sound signal obtained by decoding the monaural code by the first decoding method, which is a decoding method corresponding to the first encoding method .
  • the corresponding sample of the provisionally decoded digital sound signal is subtracted from the sample of the signal that is a mixture of the input digital sound signals of the two channels to obtain the quantization error sequence, and the obtained quantization error sequence is encoded.
  • the error code is obtained, and the corresponding samples of the input digital sound signals of the two channels are obtained by subtracting the sample of the second digital sound signal channel from the sample of the digital sound signal of the first channel.
  • the extended code including the error code and the difference code is obtained by encoding a sequence (a known MS stereo S channel signal) obtained by dividing the obtained value by 2 by a predetermined second encoding method to obtain a differential code. Is output.
  • Control information adding unit 213-m The control information addition unit 213-m of the sound signal fixed transmission side device 210-m includes the input monaural code and the extension code as a code representing the sound signal for each frame, and determines the code string representing the sound signal.
  • the code information represented by the control code included in the fixed terminal transmission bit string output by the control information adding unit 213-m always indicates that "the code included in the code string representing the sound signal is one set of monaural code and extension code”. Information”.
  • the code representing the sound signal included in the bit string is a set of monaural code and extension code. Therefore, for the purpose of inputting to the multipoint control device 100, it is not necessary to include a control code, which is a code indicating code information indicating what kind of code the code string indicating the sound signal includes, in the fixed terminal transmission bit string.
  • the audio signal fixed transmission side device 210-m is not provided with the control information addition unit 213-m, and the encoding unit 212-m includes the monaural code and the extension code as a code representing the audio signal, and is a fixed terminal transmission bit string. It may be obtained and output.
  • the fixed terminal transmission bit string the information that identifies the terminal device that has obtained the fixed terminal transmission bit string, the information that identifies the frame to which the fixed terminal transmission bit string corresponds, and whether the frame is voiced or silent.
  • auxiliary information such as.
  • the sound signal fixed reception side device 220-m outputs, for each frame, a sound based on the bit string for the fixed terminal input from the fixed transmission path 400-m. However, the sound signal fixed reception side device 220-m may not output the sound depending on the input fixed terminal bit string.
  • the fixed terminal bit string input from the fixed transmission path 400-m is the fixed terminal bit string output from the multipoint control device 100 to the fixed communication terminal device 200-m.
  • the control information analysis unit 221-m of the sound signal fixed reception side device 220-m includes, for each frame, the code information represented by the control code included in the input fixed terminal bit string and the input fixed terminal bit string.
  • Each code included in the code string representing the sound signal to be reproduced is output to the decoding unit 222-m of the sound signal fixed reception side device 220-m (step S221).
  • the control information analysis unit 221-m does not output the code. That is, when the input fixed terminal bit string includes a code string representing a sound signal for each frame, the control information analysis unit 221-m includes a control code included in the input fixed terminal bit string.
  • the code information represented by and the respective codes included in the code string representing the sound signal included in the input fixed terminal bit string are output, and the input fixed terminal bit string does not include the code string representing the sound signal.
  • the code information represented by the control code included in the input fixed terminal bit string is output.
  • the combination of the code information represented by the control code included in the fixed terminal bit string and each code included in the code string representing the sound signal included in the fixed terminal bit string is Either of Case A to Case D below. Therefore, the control information analysis unit 221-m outputs at least code information of any one of the following cases A to D, and when the bit string for fixed terminals includes the code string representing the sound signal, the code representing the sound signal. The code included in the column is also output.
  • Case A The code information is “information indicating that the codes included in the code string representing the sound signal are one set of monaural code and extended code”. The code included in the code string representing the sound signal is a set of monaural code and extended code.
  • Case B The code information is “information indicating that the codes included in the code string representing the sound signal are two monaural codes”. The codes included in the code string representing the sound signal are two monaural codes.
  • Case C The code information is “information indicating that the code included in the code string representing the sound signal is one monaural code”. The code included in the code string representing the sound signal is one monaural code.
  • Case D The code information is “information indicating that there is no code string representing a sound signal”. There is no code included in the code string representing the sound signal.
  • ⁇ Decoding unit 222-m> The decoding unit 222-m of the sound signal fixed reception side device 220-m decodes the input code for each frame based on the input code information and decodes the input code, if any. Alternatively, two decoded digital sound signals are obtained and output to the reproduction unit 223-m of the sound signal fixed reception side device 220-m (step S222). Specifically, the decoding unit 222-m performs any of the following cases A to D for each frame.
  • the decoding unit 222-m receives the input monaural code when the input code information is “information indicating that the code included in the code string representing the sound signal is a set of monaural code and extended code”. Is decoded by a predetermined first decoding method to obtain a provisionally decoded digital sound signal, and decoding difference information is obtained from a code (difference code) representing information corresponding to the difference included in the input extension code, From the tentative decoded digital sound signal and the decoded difference information, it is considered that the tentative decoded digital sound signal is a signal in which two decoded digital sound signals are mixed, and the decoded difference information is the decoded digital sound signal of the two decoded digital sound signals.
  • the difference code is encoded information, that is, the difference between the digital sound signals of the two channels to which the encoding units 212-m of the corresponding sound signal fixed transmission side devices 210-m are input. If a difference code is obtained by encoding the information corresponding to the above by the predetermined second encoding method, the decoding unit 222-m causes the difference code included in the input extension code to be obtained by the predetermined second decoding. Decoding is performed by the method to obtain the decoding difference information.
  • the decoding unit 222-m decodes the input monaural code by the predetermined first decoding method to obtain the first provisionally decoded digital sound signal, and sets the differential code included in the input extension code to the predetermined value.
  • the second provisional decoded digital sound signal is obtained by decoding the second provisional decoded digital sound signal
  • the first provisional decoded digital sound signal is a well-known MS stereo M channel signal.
  • the sound signal is a well-known MS stereo S channel signal
  • a first decoding that is a series of values obtained by adding corresponding samples of the first provisional decoded digital sound signal and the corresponding samples of the second provisional decoded digital sound signal.
  • a digital sound signal and a second decoded digital sound signal which is a sequence obtained by subtracting the sample of the second provisional decoded digital sound signal from the samples of the first provisional decoded digital sound signal for corresponding samples; , And output.
  • the decoding unit 222-m decodes the input monaural code by the predetermined first decoding method to generate the temporary decoded digital sound signal. Then, the decoding error information is obtained from the error code included in the input extension code, the decoding difference information is obtained from the difference code included in the input extension code, and the provisional decoded digital sound signal and the decoding error information are obtained. And the decoding difference information, the provisional decoded digital sound signal is regarded as a signal in which two decoded digital sound signals are mixed, and the decoding error information is information corresponding to the error of the provisional decoded digital sound signal. Considering that the decoded difference information is the information corresponding to the difference between the two decoded digital sound signals, two decoded digital sound signals are obtained and output.
  • the decoding unit 222-m decodes the input monaural code by the predetermined first decoding method to obtain the first provisionally decoded digital sound signal, and includes it in the input extension code.
  • the error code that is generated is decoded to obtain a third provisionally decoded digital sound signal
  • the differential code included in the input extension code is decoded by the predetermined second decoding method to obtain the second provisionally decoded digital sound signal.
  • the first tentative decoded digital sound signal and the third tentative decoded digital sound signal are added to obtain a fourth tentative decoded digital sound signal, and the fourth tentative decoded digital sound signal is a known MS stereo signal.
  • the second provisional decoded digital sound signal is a known MS stereo S channel signal.
  • Correspondence between the fourth provisional decoded digital sound signal and the second provisional decoded digital sound signal Obtained by subtracting the sample of the second tentative decoded digital sound signal from the sample of the fourth tentative decoded digital sound signal for the corresponding sample and the first decoded digital sound signal which is a series of values obtained by adding the samples. And outputs a second decoded digital sound signal which is a sequence of the values.
  • the decoding unit 222-m receives the two input monaural codes. Each is decoded by a predetermined first decoding method to obtain and output two decoded digital sound signals.
  • the decoding unit 222-m determines the input monaural code as predetermined.
  • the first decoding method is used to obtain one decoded digital sound signal and output it.
  • the decoding unit 222-m determines, as another decoded digital sound signal, a decoded digital sound signal corresponding to silence, that is, a decoded digital sound signal in which the amplitudes of all the samples are 0.
  • a signal may be obtained and output.
  • the decoding unit 222-m uses, as another decoded digital sound signal, a decoded digital sound signal corresponding to the background noise signal generated according to the predetermined rule, for example, white noise having a small amplitude or A decoded digital sound signal such as a signal obtained by filtering the white noise may be obtained and output.
  • a decoded digital sound signal corresponding to the background noise signal generated according to the predetermined rule, for example, white noise having a small amplitude or A decoded digital sound signal such as a signal obtained by filtering the white noise may be obtained and output.
  • the decoding unit 222-m When the information is "information indicating that there is no code string representing a sound signal", the decoding unit 222-m does not decode the code and does not output the decoded digital sound signal. In this case, the decoding unit 222-m obtains and outputs one or two decoded digital sound signals corresponding to silence, that is, decoded digital sound signals in which the amplitudes of all the samples are 0. You may. Further, in this case, the decoding unit 222-m decodes the decoded digital sound signal corresponding to the background noise signal generated according to the predetermined rule, for example, white noise having a small amplitude or a signal obtained by filtering the white noise. One or two digital sound signals may be obtained and output.
  • the decoding unit 222-m uses the coding unit 212-m of the sound signal fixed transmission side device 210-m and the coding unit 312-n of the sound signal mobile transmission side device 310-n.
  • the decoding method corresponding to the first encoding method used in step 1 is used.
  • the decoding unit 222-m uses, as the second decoding system, a decoding system corresponding to the second coding system used in the coding unit 212-m of the sound signal fixed transmission side device 210-m.
  • the reproduction unit 223-m of the sound signal fixed reception side device 220-m outputs a sound corresponding to the input one or two decoded digital sound signals (step S223). If no decoded digital sound signal is input, no sound is output.
  • the reproduction unit 223-m includes, for example, two DA conversion units and two speakers.
  • the DA conversion unit converts the input decoded digital sound signal into an analog electric signal and outputs it.
  • the speaker generates a sound corresponding to the analog electric signal input from the DA converter.
  • the speaker may be provided in stereo headphones or stereo earphones.
  • the reproduction unit 223-m associates the DA conversion unit and the speaker with each other in a one-to-one correspondence, and outputs two decoded digital sound signals respectively. The sound corresponding to is generated from each of the two speakers.
  • the reproduction unit 223-m obtains one analog electric signal using one DA conversion unit and obtains one analog signal obtained.
  • the electric signal of is input to one or two speakers to generate sound from the one or two speakers.
  • the two analog electric signals obtained by the DA converter are mixed and input to one or two speakers to input one or two. Sound may be generated from the speaker, or only one speaker may be provided. That is, the reproducing unit 223-m may have any configuration as long as it generates sounds corresponding to all the input decoded digital sound signals.
  • Each mobile communication terminal device 300-n is, for example, a mobile phone, and as shown in FIG. 3, includes a sound signal mobile transmission side device 310-n and a sound signal mobile reception side device 320-n.
  • the sound signal movement/transmission side device 310-n includes a sound collection unit 311-n, an encoding unit 312-n, and a transmission code generation unit 313-n.
  • the sound signal mobile receiving side device 320-n includes an input code separating unit 321-n, a decoding unit 322-n, and a reproducing unit 323-n.
  • the sound signal mobile transmission/reception side device 310-n of the mobile communication terminal device 300-n performs the processing of FIG.
  • the device 320-m performs the processes of FIG. 13 and steps S321 to S323 illustrated below.
  • the sound signal mobile transmission side device 310-n obtains a mobile terminal transmission bit string which is a bit string including a code corresponding to the digital sound signal of one channel for each frame, and outputs the bit string to the mobile transmission path 500-n. That is, the sound signal mobile transmission side device 310-n outputs the mobile terminal transmission bit string to the multipoint control device 100 via the mobile transmission line 500-n.
  • the sound pickup unit 311-n of the sound signal movement/transmission side device 310-n includes one microphone and one AD conversion unit.
  • the microphone collects the sound generated in the spatial region around the microphone, converts the sound into an analog electric signal, and outputs the analog electric signal to the AD conversion unit.
  • the AD conversion unit converts the input analog electric signal into a digital sound signal that is a PCM signal with a sampling frequency of 8 kHz, for example, and outputs the digital sound signal. That is, the sound pickup unit 311-n outputs the digital sound signal of one channel corresponding to the sound picked up by one microphone to the encoding unit 312-n of the sound signal mobile transmission side device 310-n. (Step S311).
  • the encoding unit 312-n of the sound signal mobile transmission side device 310-n uses the above-described first encoding method to process the digital sound signal of one channel input from the sound collecting unit 311-n for each frame. Encoding is performed to obtain a monaural code, and the obtained monaural code is output to the transmission code generation unit 313-n of the sound signal mobile transmission side device 310-n (step S312).
  • the transmission code generation unit 313-n of the sound signal mobile transmission side device 310-n obtains a mobile terminal transmission bit string including the input monaural code as a code representing a sound signal for each frame, and outputs it to the mobile transmission path 500-n. It is output (step S313).
  • the mobile terminal transmission bit string information for identifying the terminal device that has obtained the mobile terminal transmission bit string, information for identifying the frame to which the mobile terminal transmission bit string corresponds, whether the frame is voiced or silent.
  • information for specifying whether or not the power of the digital sound signal of the frame is equal to or more than a predetermined threshold value information for specifying the position of each code included in the mobile terminal sending bit string in the mobile terminal sending bit string, May be included, or a control code, which is code indicating code information indicating what kind of code the code string representing the sound signal includes.
  • the sound signal mobile transmission side device 310-n is not provided with the transmission code generation section 313-n, and the encoding section 312-n obtains a mobile terminal transmission bit string including a monaural code as a code representing a sound signal. You may make it output.
  • the sound signal mobile reception side device 320-n outputs a sound based on the bit string for mobile terminals input from the mobile transmission path 500-n for each frame. However, the sound signal mobile reception side device 320-n may not output sound depending on the inputted bit string for mobile terminal.
  • the bit string for mobile terminals input from the mobile transmission path 500-n is the bit string for mobile terminals output by the multipoint control device 100 to the mobile communication terminal device 300-n.
  • the input code separation unit 321-n of the sound signal moving receiving side device 320-n moves one monaural code included in the code string representing the sound signal included in the input mobile terminal bit string for each frame.
  • the data is output to the decoding unit 322-n of the reception side device 320-n (step S321).
  • the input code separation unit 321-n does not output the code when the input bit string for the mobile terminal does not include the code string representing the sound signal. That is, when the input mobile terminal bit string includes a code string representing a sound signal for each frame, the input code separating unit 321-n includes a sound signal included in the input mobile terminal bit string.
  • One monaural code included in the code string representing is output, and if the input bit string for the mobile terminal does not include the code string representing the sound signal, the code is not output.
  • ⁇ Decoding unit 322-n> When a monaural code is input for each frame, the decoding unit 322-n of the sound signal mobile reception side device 320-n decodes one input monaural code by the above-described first decoding method. As a result, one decoded digital sound signal is obtained and output to the reproducing unit 323-n of the sound signal mobile reception side device 320-n (step S322). The decoding unit 322-n does not output the decoded digital sound signal when the code is not input. However, if no code is input, the decoding unit 322-n obtains and outputs a decoded digital sound signal corresponding to silence, that is, a decoded digital sound signal in which the amplitudes of all samples are 0. You may.
  • the decoding unit 322-n filters the decoded digital sound signal corresponding to the background noise signal generated according to the predetermined rule, for example, white noise having a small amplitude or the white noise. It is also possible to obtain and output a decoded digital sound signal such as the above-mentioned signal.
  • the reproduction unit 323-n of the sound signal mobile reception side device 320-n outputs the sound corresponding to the input one decoded digital sound signal (step S323). If no decoded digital sound signal is input, no sound is output.
  • the playback unit 323-n includes, for example, one or more DA converters and one or more speakers.
  • the DA conversion unit converts the input decoded digital sound signal into an analog electric signal and outputs it.
  • the speaker generates a sound corresponding to the analog electric signal input from the DA converter.
  • the speaker may be included in a headset, headphones, or earphones. When a plurality of speakers such as stereo headphones and stereo earphones are used as the speakers, an analog electric signal output from one DA converter may be input to the plurality of speakers or may be input.
  • one decoded digital sound signal may be input to a plurality of DA converters to obtain a plurality of analog electric signals and be input to a plurality of speakers. That is, the reproducing unit 323-n may have any configuration as long as it generates a sound corresponding to one input decoded digital sound signal.
  • the multipoint control device 100 includes a point selection unit 110 and a bit string generation unit 120.
  • the multipoint control device 100 performs the processes of FIG. 12 and steps S110 to S120 illustrated below.
  • a fixed terminal transmission bit string is input from the fixed transmission line 400-m
  • a mobile terminal transmission bit string is input from the mobile transmission line 500-n. That is, the fixed terminal transmission bit string output by the sound signal fixed transmission side device 210-m of each fixed communication terminal device 200-m is input via each fixed transmission path 400-m, and the mobile communication terminal device 300-n of each fixed communication terminal device 300-n.
  • the mobile terminal transmission bit string output by the sound signal mobile transmission side device 310-n is input via each mobile transmission line 500-n.
  • the multipoint control device 100 generates, for each frame, a fixed terminal bit string for each fixed communication terminal device 200-m based on the input fixed terminal transmission bit string and mobile terminal transmission bit string, and each fixed transmission path 400.
  • -M a bit string for mobile terminals for each mobile communication terminal device 300-n is generated and output to each mobile transmission path 500-n. That is, the multipoint control device 100 generates, for each frame, a bit string for a fixed terminal for the sound signal fixed reception side device 220-m of each fixed communication terminal device 200-m, and transmits it via each fixed transmission line 400-m.
  • ⁇ Point selection unit 110 The fixed point transmission bit string input to the multipoint control device 100 and the mobile terminal transmission bit string input to the multipoint control device 100 are input to the point selection unit 110.
  • the point selection unit 110 selects, for each frame, one or two points from all points connected to the multipoint control device 100, that is, M fixed communication terminal devices and N mobile communication terminal devices. Then, the information capable of specifying the selected point is output (step S110).
  • the point selection unit 110 may select a point on the basis of a predetermined selection criterion. As the selection criterion, a criterion for selecting a point having a high degree of importance is set in advance, and the point selection unit 110 can execute the selection. You can do it like this.
  • the point selecting unit 110 includes, for each frame, the monaural code included in the input M fixed terminal transmission bit strings and the N mobile terminal transmission bit strings.
  • the information indicating the power of each of the M+N decoded digital sound signals is obtained from each of the generated monaural codes, and the terminal device corresponding to the decoded digital sound signal having the maximum power among the M+N decoded digital sound signals can be specified.
  • Information and information capable of specifying the terminal device corresponding to the decoded digital sound signal having the second largest power of the M+N decoded digital sound signals and being equal to or higher than a predetermined threshold value, and the selected point information is obtained.
  • To the bit string generator 120 To the bit string generator 120.
  • the threshold value is, for example, a value larger than the power when the decoded digital sound signal is assumed to include only background noise, and may be set in advance by experiments or the like.
  • the spot selection unit 110 selects one or two spots from all the spots connected to the multi-spot control device 100, and outputs information that can identify the selected spot.
  • the point selection unit 110 sets "Fix-1" as the information that can identify the fixed communication terminal device 200-1. You just need to get the information. Further, for example, if the terminal device having the second highest power of the decoded digital sound signal and equal to or higher than the predetermined threshold is the mobile communication terminal device 300-2, the point selecting unit 110 selects the mobile communication terminal device 300-2.
  • the information "Mobile-2" may be obtained as the identifiable information. That is, the spot selection unit 110 outputs any one of the following information from Case 1 to Case 5 as the selected spot information.
  • Case 1 “Fix-M 1 ”(where M 1 is any integer from 1 to M)
  • Case 2 “Mobile-N 1 ”(where N 1 is any integer from 1 to N).
  • Case 3 A pair of “Fix-M 1 ”and “Fix-M 2 ”(where M 1 is any one integer of 1 or more and M or less, M 2 is 1 or more and M or less, and M 1 is Any one different integer.
  • Case 4 A pair of “Fix-M 1 ”and “Mobile-N 1 ”(where M 1 is any integer of 1 or more and M or less, and N 1 is any integer of 1 or more and N or less) .
  • Case 5 A set of “Mobile-N 1 ”and “Mobile-N 2 ”(where N 1 is any one integer of 1 or more and N or less, N 2 is 1 or more and N or less, and N 1 is Any one different integer.)
  • the information indicating the power of each decoded digital sound signal may be obtained from each of the input M fixed terminal transmission bit strings and N input mobile terminal transmission bit strings by a known method.
  • the point selection unit 110 described above for each frame, the above-mentioned first decoding method for each of the monaural code included in the input M fixed terminal transmission bit strings and the monaural code included in the N mobile terminal transmission bit strings.
  • M+N decoded digital sound signals may be decoded to obtain the power of each of the obtained M+N decoded digital sound signals, and the calculated power may be obtained as information indicating the power.
  • the point selection unit 110 includes, for each frame, a code indicating the power included in the monaural code included in the input M fixed terminal transmission bit strings and the monaural code included in the N mobile terminal transmission bit strings.
  • the value represented by each of the codes representing the generated power may be obtained as the information representing the power.
  • the point selection unit 110 inputs the frame by frame.
  • the information that can specify the selected terminal device is selected as a selection point.
  • the information may be output to the bit string generation unit 120 as information.
  • the bit string generation unit 120 includes a fixed terminal transmission bit string input to the multipoint control device 100, a mobile terminal transmission bit string input to the multipoint control device 100, and selected point information output by the point selection unit 110. Is entered. For each frame, the bit string generation unit 120 uses the input fixed terminal sending bit string and the input mobile terminal sending bit string for each fixed communication terminal device 200-m based on the input selected point information. A fixed terminal bit string to be output and a mobile terminal bit string to be output to each mobile communication terminal device 300-n are generated and output (step S120). Specifically, the bit string generation unit 120 performs any of the following processes for each frame.
  • FIG. 5 is a diagram schematically showing a code string representing the sound signal in this case.
  • the monaural code and the extension code included in the fixed terminal transmission bit string output by the fixed communication terminal apparatus 200-m are represented as CFM m and CFE m , respectively, and the mobile communication terminal
  • the monaural code included in the mobile terminal transmission bit string output by the device 300-n is represented as CMM n .
  • the first bit string output by the bit string generation unit 120 is a fixed terminal bit string that does not include a code string representing a sound signal.
  • the fact that the selection point information is “Fix-M 1 ” means that the sound required by each terminal device is only the sound picked up by the fixed communication terminal device 200-M 1 .
  • the multipoint control device 100 fixes the fixed communication terminal device 200-M 1 to the fixed communication terminal device 200-M 1 . It is not necessary to convey the sound picked up by the communication terminal device 200-M 1 .
  • the bit string generation unit 120 generates a fixed terminal bit string that does not include a code string representing a sound signal, and outputs the fixed terminal bit string to the fixed communication terminal apparatus 200-M 1 .
  • the bit string generation unit 120 does not include a code string that represents a sound signal, but includes a control code that indicates that the code information is “information that indicates that there is no code string that represents a sound signal”. And outputs it to the fixed transmission line 400-M 1 to which the fixed communication terminal device 200-M 1 is connected.
  • the second bit string output by the bit string generation unit 120 includes a fixed code including the monaural code CFM M1 and the extension code CFE M1 included in the fixed terminal transmission bit string output by the fixed communication terminal apparatus 200-M 1 as a code representing a sound signal. It is a bit string for terminals.
  • the fact that the selection point information is “Fix-M 1 ” means that the sound required by each terminal device is only the sound picked up by the fixed communication terminal device 200-M 1 .
  • the fixed communication terminal device 200-m the else other than the fixed communication terminal device 200-M 1 (m else is 1 or M or less each integer different from M 1) fixed communication terminal device 200-M 1 at the It is preferable to output the collected sound with the highest quality possible.
  • the bit string generation unit 120 generates a fixed terminal bit string that includes the monaural code CFM M1 and the extended code CFE M1 included in the fixed terminal transmission bit string output by the fixed communication terminal device 200-M 1 as codes that represent sound signals. And outputs it to each fixed communication terminal device 200- melse .
  • the bit string generation unit 120 includes the monaural code CFM M1 and the extension code CFE M1 included in the fixed terminal transmission bit string output by the fixed communication terminal apparatus 200-M 1 as codes indicating sound signals, and the code information is
  • Each fixed communication terminal device generates a bit string for a fixed terminal including a control code indicating that "the code included in the code string representing the sound signal is a set of monaural code and information indicating that it is an extended code".
  • 200- melse is output to each fixed transmission line 400- melse connected. That is, the code string representing the sound signal contained in the fixed terminal for the bit sequence of the fixed communication terminal device 200-m the else for, are included as code indicating the monaural coding CFM M1 extended sign CFE M1 Gaoto signal.
  • the third bit string output by the bit string generator 120 is a mobile terminal bit string that includes the monaural code CFM M1 included in the fixed terminal transmission bit string output by the fixed communication terminal apparatus 200-M 1 as a code representing a sound signal. ..
  • the fact that the selection point information is “Fix-M 1 ” means that the sound required by each terminal device is only the sound picked up by the fixed communication terminal device 200-M 1 . Therefore, it is preferable that each mobile communication terminal device 300-n (n is an integer of 1 or more and N or less) outputs the sound picked up by the fixed communication terminal device 200-M 1 as high quality as possible.
  • the bit string generation unit 120 generates a bit string for mobile terminals that includes the monaural code CFM M1 included in the fixed terminal transmission bit string output by the fixed communication terminal device 200-M 1 as a code representing a sound signal, and then performs mobile communication.
  • Output to the terminal device 300-n that is, output to each mobile transmission line 500-n to which each mobile communication terminal device 300-n is connected. That is, the monaural code CFM M1 is included as a code representing the sound signal in the code string representing the sound signal included in the mobile terminal bit string for the mobile communication terminal apparatus 300-n.
  • FIG. 6 is a diagram schematically showing a code string representing the sound signal in this case.
  • the first bit string output from the bit string generator 120 is a mobile terminal bit string that does not include a code string representing a sound signal.
  • the selection point information being “Mobile-N 1 ”means that the sound required by each terminal device is only the sound picked up by the mobile communication terminal device 300-N 1 .
  • the movement since the mobile communication terminal device 300-N 1 sound the mobile communication terminal device 300-N 1 is picked up is present, the multi-point control unit 100 to the mobile communication terminal device 300-N 1 It is not necessary to convey the sound picked up by the communication terminal device 300-N 1 .
  • the bit string generation unit 120 generates a bit string for mobile terminals that does not include a code string representing a sound signal and outputs it to the mobile communication terminal device 300-N 1 , that is, the mobile communication terminal device 300-N 1 It outputs to the connected mobile transmission path 500-N 1 .
  • the second bit string output by the bit string generating unit 120 is a mobile terminal bit string that includes the monaural code CMM N1 included in the mobile terminal sending bit string output by the mobile communication terminal apparatus 300-N 1 as a code representing a sound signal. ..
  • the fact that the selected point information is “Mobile-N 1 ” means that the sound required by each terminal device is only the sound picked up by the mobile communication terminal device 300-N 1 .
  • the mobile communication terminal device 300-N 1 except for each mobile communication terminal device 300-n else (n else is 1 or more N or less N 1 each integer different from) the mobile communication terminal device 300-N 1 in the It is preferable to output the collected sound with the highest quality possible.
  • the bit string generation unit 120 generates a bit string for mobile terminals that includes the monaural code CMM N1 included in the mobile terminal transmission bit string output by the mobile communication terminal apparatus 300-N 1 as a code indicating a sound signal, and then performs mobile communication.
  • Output to the terminal device 300-n else that is, output to each mobile transmission line 500-n else to which each mobile communication terminal device 300-n else is connected. That is, the monaural code CMM N1 is included as a code representing the sound signal in the code string representing the sound signal included in the mobile terminal bit string for the mobile communication terminal apparatus 300-n else .
  • the third bit string output by the bit string generator 120 is a fixed terminal bit string that includes the monaural code CMM N1 included in the mobile terminal sending bit string output by the mobile communication terminal apparatus 300-N 1 as a code representing a sound signal. ..
  • the fact that the selected point information is “Mobile-N 1 ” means that the sound required by each terminal device is only the sound picked up by the mobile communication terminal device 300-N 1 . Therefore, it is preferable that each fixed communication terminal device 200-m (m is an integer of 1 or more and M or less) outputs the sound picked up by the mobile communication terminal device 300-N 1 as high quality as possible.
  • the code representing the sound signal included in the mobile terminal transmission bit string output by the mobile communication terminal apparatus 300-N 1 is only the monaural code CMM N1 , and the code is included in the mobile terminal transmission bit string output by the mobile communication terminal apparatus 300-N 1. Does not include extension codes. Therefore, the bit string generation unit 120 generates a fixed terminal bit string including the monaural code CMM N1 included in the mobile terminal transmission bit string output from the mobile communication terminal apparatus 300-N 1 as a code representing a sound signal, and then performs each fixed communication. Output to the terminal device 200-m.
  • the bit string generation unit 120 includes the monaural code CMM N1 included in the mobile terminal transmission bit string output from the mobile communication terminal apparatus 300-N 1 as a code representing a sound signal, and the code information is “a sound signal.
  • a bit string for fixed terminals including a control code indicating that the code contained in the code string is “information indicating that the code is one monaural code” is generated, and each fixed communication terminal device 200-m is connected to each bit string.
  • the monaural code CMM N1 is included as a code representing the sound signal in the code string representing the sound signal included in the bit string for the fixed terminal for the fixed communication terminal device 200-m.
  • FIG. 7 is a diagram schematically showing a code string representing the sound signal in this case.
  • the first bit string output by the bit string generation unit 120 includes a fixed code including the monaural code CFM M2 and the extended code CFE M2 included in the fixed terminal transmission bit string output by the fixed communication terminal apparatus 200-M 2 as a code representing a sound signal. It is a bit string for terminals.
  • the selection point information being “Fix-M 1 ”and “Fix-M 2 ”means that the sound required by each terminal device is the sound collected by the fixed communication terminal device 200-M 1 and the fixed communication terminal device 200. -M 2 is the collected sound.
  • the multipoint control device 100 fixes the fixed communication terminal device 200-M 1 to the fixed communication terminal device 200-M 1 . It is not necessary to convey the sound picked up by the communication terminal device 200-M 1 . Therefore, it is preferable that the fixed communication terminal device 200-M 1 outputs the sound picked up by the fixed communication terminal device 200-M 2 with the highest possible quality. Therefore, the bit string generation unit 120 generates a fixed terminal bit string that includes the monaural code CFM M2 and the extended code CFE M2 included in the fixed terminal transmission bit string output by the fixed communication terminal device 200-M 2 as codes that represent sound signals.
  • the bit string generation unit 120 includes the monaural code CFM M2 and the extension code CFE M2 included in the fixed terminal transmission bit string output by the fixed communication terminal apparatus 200-M 2 as codes representing the sound signal, and the code information is
  • the fixed communication terminal device 200 is generated by generating a fixed terminal bit string including a control code indicating that “the code included in the code string representing the sound signal is a set of monaural code and information indicating that the code is extended code”.
  • the second bit string output by the bit string generation unit 120 includes a fixed code including the monaural code CFM M1 and the extension code CFE M1 included in the fixed terminal transmission bit string output by the fixed communication terminal apparatus 200-M 1 as a code representing a sound signal. It is a bit string for terminals.
  • the selection point information is “Fix-M 1 ”and “Fix-M 2 ”means that the sound required by each terminal device is fixed and the sound collected by the communication terminal device 200-M 1 is fixed. This is the sound picked up by the communication terminal device 200-M 2 .
  • the multipoint control device 100 fixes the fixed communication terminal device 200-M 2 to the fixed communication terminal device 200-M 2 . It is not necessary to convey the sound picked up by the communication terminal device 200-M 2 . Therefore, it is preferable that the fixed communication terminal device 200-M 2 outputs the sound picked up by the fixed communication terminal device 200-M 1 as high quality as possible. Therefore, the bit string generation unit 120 generates a fixed terminal bit string that includes the monaural code CFM M1 and the extended code CFE M1 included in the fixed terminal transmission bit string output by the fixed communication terminal device 200-M 1 as codes that represent sound signals. And outputs to fixed communication terminal apparatus 200-M 2 .
  • the bit string generation unit 120 includes the monaural code CFM M1 and the extension code CFE M1 included in the fixed terminal transmission bit string output by the fixed communication terminal apparatus 200-M 1 as codes indicating sound signals, and the code information is
  • the fixed communication terminal apparatus 200 is generated by generating a bit string for fixed terminals, which includes a control code indicating that "the code included in the code string representing the sound signal is a set of monaural code and information indicating that it is an extended code".
  • the third bit string output by the bit string generator 120 is a monaural code CFM M1 included in the fixed terminal sending bit string output by the fixed communication terminal apparatus 200-M 1 and the fixed terminal output by the fixed communication terminal apparatus 200-M 2. It is a bit string for fixed terminals that includes the monaural code CFM M2 included in the transmission bit string as a code representing a sound signal.
  • the selection point information is “Fix-M 1 ”and “Fix-M 2 ”means that the sound required by each terminal device is fixed and the sound collected by the communication terminal device 200-M 1 is fixed. This is the sound picked up by the communication terminal device 200-M 2 .
  • each fixed communication terminal device 200- melse ( melse is not less than 1 and not more than M and is an integer different from both M 1 and M 2) that is neither the fixed communication terminal device 200-M 1 nor the fixed communication terminal device 200-M 2.
  • the communication capacity of the fixed transmission path 400- melse through the multipoint control device 100 and each fixed communication terminal device 200- melse is not large enough to send an extension code in addition to two monaural codes.
  • the fixed communication terminal apparatus 200-M 1 outputs the 2-channel decoded digital sound signal by decoding the monaural code CFM M1 and the extension code CFE M1 included in the fixed terminal transmission bit string output by the fixed communication terminal apparatus 200-M 1. Decoding the monaural code CFM M2 and the extension code CFE M2 included in the fixed terminal transmission bit string output by M 2 to obtain a decoded digital sound signal of two channels, and mixing two decoded digital sound signals for each of the two channels.
  • the bit string generation unit 120 includes the monaural code CFM M1 included in the fixed terminal sending bit string output by the fixed communication terminal apparatus 200-M 1 and the monaural code included in the fixed terminal sending bit string output by the fixed communication terminal apparatus 200-M 2.
  • a bit string for a fixed terminal including the code CFM M2 as a code representing a sound signal is generated and output to the fixed communication terminal device 200- melse .
  • the bit string generation unit 120 converts the monaural code CFM M1 included in the fixed terminal sending bit string output by the fixed communication terminal apparatus 200-M 1 into the fixed terminal sending bit string output by the fixed communication terminal apparatus 200-M 2.
  • a control code that includes the included monaural code CFM M2 as a code that represents a sound signal and that the code information is “information that the code included in the code string that represents the sound signal is two monaural codes”.
  • a bit string for the fixed terminal including the fixed bit line is generated and output to each fixed transmission path 400- melse to which each fixed communication terminal device 200- melse is connected. That is, the code string representing the sound signal contained in the fixed terminal for the bit sequence of the fixed communication terminal device 200-m the else for, are included as code indicating the monaural coding CFM M1 and mono code CFM M2 Gaoto signal.
  • the fourth bit string output by the bit string generator 120 is a monaural code CFM M1 included in the fixed terminal sending bit string output by the fixed communication terminal apparatus 200-M 1 and a fixed terminal output by the fixed communication terminal apparatus 200-M 2. It is a bit string for mobile terminals that includes a monaural code CTM M1M2 obtained by mixing and encoding decoded digital sound signals obtained by decoding each of the monaural codes CFM M2 included in the transmission bit string as a code representing the sound signal.
  • the selection point information is “Fix-M 1 ”and “Fix-M 2 ”means that the sound required by each terminal device is fixed and the sound collected by the communication terminal device 200-M 1 is fixed.
  • each mobile communication terminal device 300-n (n is an integer of 1 or more and N or less), the sound collected by the fixed communication terminal device 200-M 1 and the sound collected by the fixed communication terminal device 200-M 2 are collected. It is preferable to output and as high quality as possible. However, the communication capacity of the mobile transmission path 500-n via the multipoint control device 100 and each mobile communication terminal device 300-n is not large enough to send two monaural codes. Then, in each mobile communication terminal device 300-n, the sound quality of the sound collected by the fixed communication terminal device 200-M 1 and the sound collected by the fixed communication terminal device 200-M 2 is degraded. It is desirable to be able to output at least.
  • the bit string generation unit 120 decodes the monaural code CFM M1 included in the fixed terminal transmission bit string output by the fixed communication terminal device 200-M 1 to obtain the first decoded digital sound signal, and the fixed communication terminal device 200.
  • the first decoded digital sound signal and the second decoded digital sound signal are mixed to obtain a mixed digital sound signal by, for example, obtaining a sequence based on the average value of the samples, and the mixed digital sound signal is subjected to the above-described first encoding.
  • a monaural code CTM M1M2 is obtained by encoding according to the method, a bit string for mobile terminals including the monaural code CTM M1M2 obtained from the mixed digital sound signal as a code representing a sound signal is generated, and is generated in each mobile communication terminal device 300-n.
  • the code string representing the sound signal included in the mobile terminal bit string for the mobile communication terminal device 300-n includes the monaural code CTM M1M2 as a code representing the sound signal.
  • the point selecting unit 110 obtains M+N decoded digital sound signals
  • the first decoded digital sound signal and the second decoded digital signal are M+N decoded digital sound signals obtained by the point selecting unit 110. Since it is the same as two of the signals, instead of the bit string generation unit 120 decoding the monaural code to obtain the decoded digital sound signal, the decoded digital sound signal obtained by the point selection unit 110 is used as the point selection unit 110. May be output to the bit string generation unit 120, and the bit string generation unit 120 may use the decoded digital sound signal input from the point selection unit 110.
  • FIG. 8 is a diagram schematically showing a code string representing the sound signal in this case.
  • the first bit string output by the bit string generator 120 is a fixed terminal bit string that includes the monaural code CMM N1 included in the mobile terminal sending bit string output by the mobile communication terminal apparatus 300-N 1 as a code representing a sound signal.
  • the selection point information being “Fix-M 1 ”and “Mobile-N 1 ”means that the sound required by each terminal device is the sound picked up by the fixed communication terminal device 200-M 1 and the mobile communication terminal device 300.
  • -N 1 is the collected sound.
  • the multipoint control device 100 fixes the fixed communication terminal device 200-M 1 to the fixed communication terminal device 200-M 1 .
  • the fixed communication terminal device 200-M 1 outputs the sound picked up by the mobile communication terminal device 300-N 1 in the highest quality possible.
  • the code representing the sound signal included in the mobile terminal transmission bit string output by the mobile communication terminal apparatus 300-N 1 is only the monaural code CMM N1 , and the code is included in the mobile terminal transmission bit string output by the mobile communication terminal apparatus 300-N 1. Does not include extension codes.
  • the bit string generation unit 120 generates a fixed terminal bit string including the monaural code CMM N1 included in the mobile terminal transmission bit string output by the mobile communication terminal apparatus 300-N 1 as a code representing a sound signal, and then the fixed communication terminal Output to the device 200-M 1 .
  • the bit string generation unit 120 includes the monaural code CMM N1 included in the mobile terminal transmission bit string output from the mobile communication terminal apparatus 300-N 1 as a code representing a sound signal, and the code information is “a sound signal.
  • a fixed terminal connected to the fixed communication terminal device 200-M 1 is generated by generating a bit string for fixed terminals, which includes a control code indicating that the code included in the code string is one piece of information indicating that the code is a monaural code.
  • the monaural code CMM N1 is included as a code representing the sound signal in the code string representing the sound signal included in the bit string for the fixed terminal for the fixed communication terminal apparatus 200-M 1 .
  • the second bit string output by the bit string generation unit 120 is a bit string for mobile terminals that includes the monaural code CFM M1 included in the fixed terminal transmission bit string output by the fixed communication terminal apparatus 200-M 1 as a code representing a sound signal. ..
  • the selection point information being “Fix-M 1 ”and “Mobile-N 1 ”means that the sound required by each terminal device is the sound picked up by the fixed communication terminal device 200-M 1 and the movement. This is the sound picked up by the communication terminal device 300-N 1 .
  • the multi-point control unit 100 to the mobile communication terminal device 300-N 1 It is not necessary to convey the sound picked up by the communication terminal device 300-N 1 . Therefore, it is preferable that the mobile communication terminal device 300-N 1 outputs the sound picked up by the fixed communication terminal device 200-M 1 in the highest quality possible.
  • the communication capacity of the mobile transmission line 500-N 1 via the multipoint control device 100 and the mobile communication terminal device 300-N 1 is not large enough to send an extension code in addition to one monaural code.
  • the bit string generation unit 120 generates a bit string for mobile terminals, which includes the monaural code CFM M1 included in the fixed terminal transmission bit string output by the fixed communication terminal device 200-M 1 as a code representing a sound signal, and the mobile communication terminal Output to the device 300-N 1 , that is, output to the mobile transmission line 500-N 1 to which the mobile communication terminal device 300-N 1 is connected. That is, the monaural code CFM M1 is included as a code representing the sound signal in the code string representing the sound signal included in the mobile terminal bit string for the mobile communication terminal apparatus 300-N 1 .
  • the third bit string output by the bit string generator 120 is a monaural code CFM M1 included in the fixed terminal sending bit string output by the fixed communication terminal apparatus 200-M 1 and a mobile terminal output by the mobile communication terminal apparatus 300-N 1. It is a bit string for fixed terminals that includes the monaural code CMM N1 included in the transmission bit string as a code representing a sound signal.
  • the selection point information being “Fix-M 1 ”and “Mobile-N 1 ”means that the sound required by each terminal device is the sound picked up by the fixed communication terminal device 200-M 1 and the movement. This is the sound picked up by the communication terminal device 300-N 1 .
  • the fixed communication terminal device 200-m the else other than the fixed communication terminal device 200-M 1 (m else is 1 or M or less each integer different from M 1) fixed communication terminal device 200-M 1 at the It is preferable to output the collected sound and the sound collected by the mobile communication terminal device 300-N 1 with the highest possible quality.
  • the communication capacity of the fixed transmission path 400- melse through the multipoint control device 100 and each fixed communication terminal device 200- melse is not large enough to send an extension code in addition to two monaural codes.
  • the monaural code CFM M1 and the extended code CFE M1 included in the fixed terminal transmission bit string output by the fixed communication terminal apparatus 200-M 1 are decoded to obtain a decoded digital sound signal of 2 channels
  • the mobile communication terminal apparatus 300- The monaural code CMM N1 included in the mobile terminal transmission bit string output by N 1 is decoded to obtain a monaural decoded digital sound signal, and a decoded digital sound signal of one of two channels and a monaural decoded sound digital sound are obtained.
  • the multipoint control device 100 If the signals are mixed and the decoded digital sound signal of the other channel of the two channels and the monaural decoded sound digital sound signal are mixed and encoded to obtain the monaural code and the extension code, the multipoint control device 100 and it can be a set of monaural coding and extended sign to fit in the communication capacity of the fixed transmission line 400-m the else via the fixed communication terminal device 200-m else, encoding and decoding a set becomes the tandem connection As a result, the sound quality deteriorates. Therefore, the bit string generation unit 120 includes the monaural code CFM M1 included in the fixed terminal sending bit string output by the fixed communication terminal device 200-M 1 and the monaural code included in the mobile terminal sending bit string output by the mobile communication terminal device 300-N 1.
  • a fixed terminal bit string including the code CMM N1 as a code indicating a sound signal is generated and output to the fixed communication terminal apparatus 200- melse .
  • the bit string generation unit 120 generates the monaural code CFM M1 included in the fixed terminal sending bit string output by the fixed communication terminal apparatus 200-M 1 and the mobile terminal sending bit string output by the mobile communication terminal apparatus 300-N 1. It includes a monaural code CMM N1 included therein as a code indicating a sound signal, and includes a control code indicating that the code information is “information indicating that the code included in the code string representing the sound signal is two monaural codes”.
  • the code string representing the sound signal contained in the fixed terminal for the bit sequence of the fixed communication terminal device 200-m the else for, are included as code indicating the monaural coding CFM M1 and mono code CMM N1 Gaoto signal.
  • the fourth bit string output by the bit string generator 120 is a monaural code CFM M1 included in the fixed terminal sending bit string output by the fixed communication terminal apparatus 200-M 1 and a mobile terminal output by the mobile communication terminal apparatus 300-N 1. It is a bit string for mobile terminals that includes a monaural code CTM M1N1 obtained by mixing and encoding the decoded digital sound signals obtained by decoding each of the monaural codes CMM N1 included in the transmission bit string.
  • the selection point information being “Fix-M 1 ”and “Mobile-N 1 ”means that the sound required by each terminal device is the sound picked up by the fixed communication terminal device 200-M 1 and the movement. This is the sound picked up by the communication terminal device 300-N 1 .
  • the mobile communication terminal device 300-N 1 each mobile communication terminal apparatus other than-300 n else (n else is 1 or more N or less N 1 and each integer different from) the fixed communication terminal device 200-M 1 in It is preferable to output the collected sound and the sound collected by the mobile communication terminal device 300-N 1 with the highest possible quality.
  • the communication capacity of the mobile transmission line 500-n else through the multipoint control device 100 and each mobile communication terminal device 300-n else is not large enough to send two monaural codes.
  • the sound quality of the sound collected by the fixed communication terminal device 200-M 1 and the sound collected by the mobile communication terminal device 300-N 1 is deteriorated.
  • the bit string generation unit 120 decodes the monaural code CFM M1 included in the fixed terminal transmission bit string output by the fixed communication terminal device 200-M 1 to obtain the first decoded digital sound signal, and the mobile communication terminal device 300.
  • the first decoded digital sound signal and the second decoded digital sound signal are mixed to obtain a mixed digital sound signal by, for example, obtaining a sequence based on the average value of the samples, and the mixed digital sound signal is subjected to the above-described first encoding.
  • a monaural code CTM M1N1 is obtained by encoding in accordance with the method, and a bit string for a mobile terminal including the monaural code CTM M1N1 obtained from the mixed digital sound signal as a code representing a sound signal is generated, and the mobile communication terminal device 300-n else is generated. It outputs to each mobile communication terminal device 300-n else to each mobile transmission line 500-n else connected. That is, the monaural code CTM M1N1 is included as a code representing a sound signal in the code string representing the sound signal included in the mobile terminal bit string for the mobile communication terminal apparatus 300-n else .
  • the point selecting unit 110 obtains M+N decoded digital sound signals
  • the first decoded digital sound signal and the second decoded digital signal are M+N decoded digital sound signals obtained by the point selecting unit 110. Since it is the same as two of the signals, instead of the bit string generation unit 120 decoding the monaural code to obtain the decoded digital sound signal, the decoded digital sound signal obtained by the point selection unit 110 is used as the point selection unit 110. May be output to the bit string generation unit 120, and the bit string generation unit 120 may use the decoded digital sound signal input from the point selection unit 110.
  • FIG. 9 is a diagram schematically showing a code string representing the sound signal in this case.
  • the first bit string output by the bit string generation unit 120 is a bit string for mobile terminals that includes the monaural code CMM N2 included in the mobile terminal sending bit string output by the mobile communication terminal apparatus 300-N 2 as a code representing a sound signal. ..
  • the selection point information being “Mobile-N 1 ”and “Mobile-N 2 ”means that the sound required by each terminal device is the sound picked up by the mobile communication terminal device 300-N 1 and the mobile communication terminal device 300. -N 2 is the collected sound.
  • the multi-point control unit 100 to the mobile communication terminal device 300-N 1 It is not necessary to convey the sound picked up by the communication terminal device 300-N 1 . Therefore, it is preferable that the mobile communication terminal device 300-N 1 outputs the sound picked up by the mobile communication terminal device 300-N 2 as high quality as possible. Therefore, the bit string generation unit 120 generates a bit string for mobile terminals, which includes the monaural code CMM N2 included in the mobile terminal transmission bit string output by the mobile communication terminal apparatus 300-N 2 as a code representing a sound signal, and the mobile communication terminal.
  • the monaural code CMM N2 is included in the code string representing the sound signal included in the mobile terminal bit string for the mobile communication terminal apparatus 300-N 1 as a code representing the sound signal.
  • the second bit string output by the bit string generating unit 120 is a mobile terminal bit string that includes the monaural code CMM N1 included in the mobile terminal sending bit string output by the mobile communication terminal apparatus 300-N 1 as a code representing a sound signal. ..
  • the fact that the selected point information is “Mobile-N 1 ”and “Mobile-N 2 ” means that the sound required by each terminal device is the same as the sound picked up by the mobile communication terminal device 300-N 1. This is the sound picked up by the communication terminal device 300-N 2 .
  • the multi-point control unit 100 to the mobile communication terminal device 300-N 2 It is not necessary to convey the sound picked up by the communication terminal device 300-N 2 . Therefore, it is preferable that the mobile communication terminal device 300-N 2 outputs the sound picked up by the mobile communication terminal device 300-N 1 with the highest quality possible. Therefore, the bit string generation unit 120 generates a bit string for mobile terminals that includes the monaural code CMM N1 included in the mobile terminal sending bit string output by the mobile communication terminal apparatus 300-N 1 as a code representing a sound signal, and the mobile communication terminal.
  • the monaural code CMM N1 is included as a code representing the sound signal in the code string representing the sound signal included in the mobile terminal bit string for the mobile communication terminal apparatus 300-N 2 .
  • the third bit string output by the bit string generator 120 is a monaural code CMM N1 included in the mobile terminal sending bit string output by the mobile communication terminal apparatus 300-N 1 and a mobile terminal output by the mobile communication terminal apparatus 300-N 2. It is a bit string for mobile terminals that includes a monaural code CTM N1N2 obtained by mixing and encoding decoded digital sound signals obtained by decoding each of the monaural codes CMM N2 included in the transmission bit string, as a code representing a sound signal.
  • the fact that the selected point information is “Mobile-N 1 ”and “Mobile-N 2 ”means that the sound required by each terminal device is the same as the sound picked up by the mobile communication terminal device 300-N 1.
  • each mobile communication terminal device 300-n else (n else is not less than 1 and not more than N, and each integer different from N 1 or N 2 ) that is neither the mobile communication terminal device 300-N 1 nor the mobile communication terminal device 300-N 2. Then, it is preferable to output the sound picked up by the mobile communication terminal device 300-N 1 and the sound picked up by the mobile communication terminal device 300-N 2 as high quality as possible.
  • the communication capacity of the mobile transmission line 500-n else through the multipoint control device 100 and each mobile communication terminal device 300-n else is not large enough to send two monaural codes.
  • the bit string generation unit 120 decodes the monaural code CMM N1 included in the mobile terminal transmission bit string output by the mobile communication terminal apparatus 300-N 1 to obtain the first decoded digital sound signal, and the mobile communication terminal apparatus 300. -Decoding the monaural code CMM N2 included in the mobile terminal transmission bit string output by -N 2 to obtain a second decoded digital sound signal, and corresponding the first decoded digital sound signal and the second decoded digital sound signal.
  • the first decoded digital sound signal and the second decoded digital sound signal are mixed to obtain a mixed digital sound signal by, for example, obtaining a sequence based on the average value of the samples, and the mixed digital sound signal is subjected to the above-described first encoding.
  • a monaural code CTM N1N2 is obtained by encoding in accordance with the method, a bit string for mobile terminals including the monaural code CTM N1N2 obtained from the mixed digital sound signal as a code representing a sound signal is generated, and each mobile communication terminal device 300-n else , Ie, to each mobile transmission line 500-n else to which each mobile communication terminal device 300-n else is connected. That is, the code string representing the sound signal contained in the mobile terminal for the bit sequence of the mobile communication terminal 300-n the else for is included as a code representing the monophonic code CTM N1N2 Gaoto signal.
  • the point selecting unit 110 obtains M+N decoded digital sound signals
  • the first decoded digital sound signal and the second decoded digital signal are M+N decoded digital sound signals obtained by the point selecting unit 110. Since it is the same as two of the signals, instead of the bit string generation unit 120 decoding the monaural code to obtain the decoded digital sound signal, the decoded digital sound signal obtained by the point selection unit 110 is used as the point selection unit 110. May be output to the bit string generation unit 120, and the bit string generation unit 120 may use the decoded digital sound signal input from the point selection unit 110.
  • the fourth bit string output by the bit string generator 120 is a monaural code CMM N1 included in the mobile terminal sending bit string output by the mobile communication terminal apparatus 300-N 1 and a mobile terminal output by the mobile communication terminal apparatus 300-N 2. It is a bit string for fixed terminals that includes the monaural code CMM N2 included in the transmission bit string as a code representing a sound signal. As described above, the fact that the selected point information is “Mobile-N 1 ”and “Mobile-N 2 ”means that the sound required by each terminal device is the same as the sound picked up by the mobile communication terminal device 300-N 1. This is the sound picked up by the communication terminal device 300-N 2 .
  • the bit string generation unit 120 includes the monaural code CMM N1 included in the mobile terminal sending bit string output by the mobile communication terminal apparatus 300-N 1 and the monaural code included in the mobile terminal sending bit string output by the mobile communication terminal apparatus 300-N 2.
  • a fixed terminal bit string including the code CMM N2 as a code representing a sound signal is generated and output to the fixed communication terminal device 200-m.
  • the bit string generation unit 120 converts the monaural code CMM N1 included in the fixed terminal sending bit string output by the mobile communication terminal apparatus 300-N 1 into the mobile terminal sending bit string output by the mobile communication terminal apparatus 300-N 2.
  • a bit string for fixed terminals, including the above, is generated and output to each fixed transmission path 400-m to which each fixed communication terminal device 200-m is connected. That is, the code string representing the sound signal included in the fixed terminal bit string for the fixed communication terminal device 200-m includes the monaural code CMM N1 and the monaural code CMM N2 as codes representing the sound signal.
  • the multipoint telephone connection system 10 performs the same operation in any of the cases described below up to the point where the bit string is transmitted from each terminal device to the multipoint control device 100.
  • each fixed communication terminal device 200-m encodes a signal obtained by mixing the digital sound signals of the two collected channels by the first encoding method.
  • a monaural code CFM m obtains a code representing information corresponding to the difference between the collected digital sound signals of the two channels as an extension code CFE m , and obtain the obtained monaural code CFM m and extension code CFE m .
  • each mobile communication terminal device 300-n obtains a monaural code CMM n by encoding the collected digital sound signal of one channel by the first encoding method.
  • the obtained monaural code CMM n is output to the multipoint control device 100 as a code representing a digital sound signal of one channel that has been picked up.
  • the multipoint telephone connection system 10 performs the following operation in each case described below after the bit string is transmitted from each terminal device to the multipoint control device 100.
  • the point selection unit 110 of the multipoint control device 100 outputs the selection point information of case 1 described above, and the bit string generation unit 120 of the multipoint control device 100 described above [selection point information is case 1 In the case of the information], the multipoint telephone connection system 10 operates as follows, including the operations of the following terminal devices.
  • the multipoint control device 100 does not output a code representing a sound signal to the fixed communication terminal device 200-M 1 .
  • Fixed communication terminal apparatus 200-M 1 does not decode the code representing the sound signal, and does not obtain the decoded sound signal.
  • the fixed communication terminal apparatus 200-M 1 instructs the fixed communication terminal device 200-M 1 other than the fixed communication terminal device 200-m else (m else is at least 1 M or less each integer different from M 1),
  • the fixed communication terminal apparatus 200-M 1 outputs a monaural code CFM M1 and an expansion code CFE M1 that represent a sound signal of 2-channel stereo picked up by the fixed communication terminal apparatus 200-M 1 .
  • Each fixed communication terminal device 200- mel performs the processing of case A described above from the monaural code CFM M1 and the extension code CFE M1 output by the multipoint control device 100, and the fixed communication terminal device 200-M 1 receives the fixed communication terminal device 200-M 1.
  • a 2-channel stereo decoded sound signal corresponding to the sounded 2-channel stereo sound signal is obtained.
  • the multipoint control device 100 for each mobile communication terminal device 300-n (n is an integer of 1 or more and N or less), is a 2-channel stereo sound signal picked up by the fixed communication terminal device 200-M 1. Only the monaural code CFM M1 out of the codes representing is output. Each mobile communication terminal device 300-n mixes a monaural code CFM M1 output by the multipoint control device 100 with a two-channel stereo sound signal collected by the fixed communication terminal device 200-M 1 to obtain a monaural decoded sound. Get the signal.
  • the multipoint telephone connection system 10 operates as follows.
  • the multipoint control device 100 does not output a code representing a sound signal to the fixed communication terminal device 200-M 1 at the vocalization point.
  • Fixed communication terminal apparatus 200-M 1 does not decode the code representing the sound signal, and does not obtain the decoded sound signal.
  • the multipoint control device 100 outputs a monaural code CFM M1 and an extension code CFE M1 that represent a 2-channel stereo sound signal at the vocalization point to each fixed communication terminal device 200- Melse other than the vocalization point.
  • Each fixed communication terminal device 200- Melse other than the utterance point performs the above-described processing of case A from the monaural code CFM M1 and the extension code CFE M1 output by the multipoint control device 100 to perform 2-channel stereo of the utterance point.
  • a two-channel stereo decoded sound signal is obtained, which is a sound signal corresponding to the sound signal of ##EQU1## and a sound signal whose encoding and decoding are not tandem connection.
  • the multipoint control device 100 outputs, to each mobile communication terminal device 300-n, only the monaural code CFM M1 of the codes representing the two-channel stereo sound signal at the vocalization point.
  • Each mobile communication terminal device 300-n is a sound signal in which a monaural code CFM M1 output by the multipoint control device 100 is mixed with a two-channel stereo sound signal at the utterance point, and a pair of encoding and decoding is in tandem. Obtain a monaural decoded sound signal that is a sound signal that is not connected.
  • the mobile communication terminal device 300-N 1 has the largest power of the sound signal among the M+N terminal devices, and the power is second. This case corresponds to the case where the power of the loud sound signal is smaller than the threshold value.
  • the point selection unit 110 of the multipoint control device 100 outputs the selection point information of case 2 described above, and the bit string generation unit 120 of the multipoint control device 100 described above [selection point information is case 2 In the case of the information], the multipoint telephone connection system 10 operates as follows, including the operations of the following terminal devices.
  • the multipoint control device 100 does not output a code representing a sound signal to the mobile communication terminal device 300-N 1 .
  • the mobile communication terminal apparatus 300-N 1 does not decode the code representing the sound signal and does not obtain the decoded sound signal.
  • the multi-point control unit 100 instructs the mobile communication terminal device 300-N 1 except for each mobile communication terminal device 300-n else (n else is at least 1 N or less each integer different from N 1),
  • the monaural code CMM N1 representing the monaural sound signal picked up by the mobile communication terminal device 300-N 1 is output.
  • Each mobile communication terminal device 300-n else outputs a monaural decoded sound signal corresponding to the monaural sound signal picked up by the mobile communication terminal device 300-N 1 from the monaural code CMM N1 output by the multipoint control device 100.
  • the multipoint control device 100 represents a monaural sound signal picked up by the mobile communication terminal device 300-N 1 for each fixed communication terminal device 200-m (m is an integer of 1 or more and M or less).
  • the monaural code CMM N1 is output.
  • Each fixed communication terminal device 200-m from monaural coding CMM N1 of the multi-point control unit 100 is output, by performing the processing of the case C described above, a monaural sound signal which the mobile communication terminal device 300-N 1 is picked up A monaural decoded sound signal corresponding to is obtained.
  • the multipoint telephone connection system 10 operates as follows.
  • the multipoint control device 100 does not output a code representing a sound signal to the mobile communication terminal device 300-N 1 at the vocalization point.
  • the mobile communication terminal apparatus 300-N 1 does not decode the code representing the sound signal and does not obtain the decoded sound signal.
  • the multipoint control device 100 outputs a monaural code CMM N1 representing a monaural sound signal at the vocalization point to each mobile communication terminal device 300-n else other than the vocalization point.
  • Each mobile communication terminal device 300-n else other than the utterance point is a sound signal corresponding to the monaural sound signal of the utterance point from the monaural code CMM N1 output by the multipoint control device 100, and is encoded.
  • a monaural decoded sound signal which is a sound signal which is not a tandem connection.
  • the multipoint control device 100 outputs, to each fixed communication terminal device 200-m, a monaural code CMM N1 representing a monaural sound signal at the utterance point.
  • Each fixed communication terminal device 200-m is a sound signal corresponding to the monaural sound signal at the utterance point by performing the processing of the above-mentioned case C from the monaural code CMM N1 output by the multipoint control device 100, A monaural decoded sound signal is obtained, which is a sound signal whose combination of decoding and decoding is not a tandem connection.
  • the point selection unit 110 of the multipoint control device 100 outputs the selection point information of case 3 described above, and the bit string generation unit 120 of the multipoint control device 100 described above [selection point information is case 3 In the case of the information], the multipoint telephone connection system 10 operates as follows, including the operations of the following terminal devices.
  • the multipoint control device 100 with respect to the fixed communication terminal device 200-M 1 , is a monaural code CFM M2 and an expansion code CFE M2 that represent a 2-channel stereo sound signal picked up by the fixed communication terminal device 200-M 2. Is output.
  • the fixed communication terminal apparatus 200-M 1 performs the above-described processing of case A from the monaural code CFM M2 and the extension code CFE M2 output by the multipoint control apparatus 100, and the fixed communication terminal apparatus 200-M 2 collects the sound.
  • a 2-channel stereo decoded sound signal corresponding to the 2-channel stereo sound signal is obtained.
  • the multipoint control device 100 with respect to the fixed communication terminal device 200-M 2 , is a monaural code CFM M1 and an expanded code CFE M1 that represent a two-channel stereo sound signal picked up by the fixed communication terminal device 200-M 1. Is output.
  • the fixed communication terminal apparatus 200-M 2 performs the above-described processing of case A from the monaural code CFM M1 and the extension code CFE M1 output by the multipoint control apparatus 100, and the fixed communication terminal apparatus 200-M 1 collects the sound.
  • a 2-channel stereo decoded sound signal corresponding to the 2-channel stereo sound signal is obtained.
  • the multipoint control device 100 is not the fixed communication terminal device 200-M 1 or the fixed communication terminal device 200-M 2.
  • Each fixed communication terminal device 200- melse ( melse is 1 or more and M or less, and both M 1 and M 1 2 for each integer)
  • the monaural code CFM M1 and the fixed communication terminal 200-M 2 among the codes representing the two-channel stereo sound signal collected by the fixed communication terminal 200-M 1 are collected.
  • the monaural code CFM M2 of the codes representing the sounded 2-channel stereo sound signal is output.
  • Each fixed communication terminal device 200- mel performs the processing of case B described above from the two monaural codes CFM M1 and CFM M2 output by the multipoint control device 100, and the fixed communication terminal device 200-M 1 A monaural decoded sound signal in which the collected two-channel stereo sound signal is mixed, and a monaural decoded sound signal in which the two-channel stereo sound signal collected by the fixed communication terminal device 200-M 2 are mixed.
  • the decoded sound signals of two channels in total are obtained.
  • the multipoint control device 100 for each mobile communication terminal device 300-n (n is an integer of 1 or more and N or less), is a 2-channel stereo sound signal picked up by the fixed communication terminal device 200-M 1. decodes the monaural coding CFM M1 of the code representing the two-channel stereo sound signals monaural coding CFM M1 decoded sound signal obtained by the fixed communication terminal apparatus 200-M 2 is picked up out of the code representing the The monaural code CTM M1M2 obtained by mixing with the obtained sound signal and then encoding is output.
  • each mobile communication terminal apparatus from a single monaural code CTM M1M2 the multipoint control unit 100 is output, the fixed communication terminal device 200-M 1 is picked-up two-channel stereo sound signals and a fixed communication terminal apparatus
  • One monaural decoded sound signal corresponding to the sound signal in which the 2-channel stereo sound signals picked up by 200-M 2 are mixed is obtained.
  • a frame in which the fixed communication terminal device 200-M 1 and the fixed communication terminal device 200-M 2 are the utterance points corresponds to this case.
  • the multipoint control device 100 for each of the fixed communication terminal device 200-M 1 and the fixed communication terminal device 200-M 2 at the vocalization point, represents a monaural code representing a two-channel stereo sound signal at the other vocalization point.
  • the CFM Mx (x is 1 or 2) and the extension code CFE Mx are output.
  • Each of the fixed communication terminal device 200-M 1 and the fixed communication terminal device 200-M 2 at the voicing point performs the process of case A described above from the monaural code CFM Mx and the extension code CFE Mx output by the multipoint control device 100.
  • a 2-channel stereo decoded sound signal which is a sound signal corresponding to the 2-channel stereo sound signal at the other utterance point and which is a sound signal whose encoding and decoding are not in tandem connection is obtained.
  • the multipoint control device 100 for each fixed communication terminal device 200- melse other than the vocalization point, is a monaural code CFM M1 of the codes representing the 2-channel stereo sound signals of each of the two vocalization points. And CFM M2 are output.
  • Each fixed communication terminal device 200- melse other than the utterance point performs the process of the above-mentioned case B from the two monaural codes CFM M1 and CFM M2 output by the multipoint control device 100 to detect the 2
  • a channel stereo sound signal is two monaural sound signals corresponding to sound signals mixed at each vocalization point, and a pair of coding and decoding is a sound signal not in tandem connection. Obtain the decoded sound signal.
  • the multipoint control device 100 decodes, for each mobile communication terminal device 300-n, the monaural codes CFM M1 and CFM M2 of the codes representing the two-channel stereo sound signals of each of the two vocalization points.
  • a monaural code CTM M1M2 representing one sound signal obtained by mixing and encoding the two sound signals obtained as described above is output.
  • Each mobile communication terminal device 300-n is a monaural sound signal in which all the sound signals of two vocalization points are mixed from one monaural code CTM M1M2 output by the multipoint control device 100, and is encoded.
  • a decoding set obtains one decoded sound signal which is a tandem-connected sound signal.
  • [Fixed communication terminal device 200-M 1 (M 1 is any one integer of 1 or more and M or less) and mobile communication terminal device 300-N 1 (N 1 is any one integer of 1 or more and N or less) are selected.
  • the fixed communication terminal device has the largest power of the sound signal and the second largest power of the sound signal of the M+N terminal devices. This case corresponds to the case of 200-M 1 and mobile communication terminal device 300-N 1 .
  • the point selection unit 110 of the multipoint control device 100 outputs the selection point information of case 4 described above, and the bit string generation unit 120 of the multipoint control device 100 described above [selection point information is case 4 In the case of the information], the multipoint telephone connection system 10 operates as follows, including the operation of each terminal device thereafter.
  • the multipoint control device 100 outputs a monaural code CMM N1 representing a monaural sound signal picked up by the mobile communication terminal device 300-N 1 to the fixed communication terminal device 200-M 1 .
  • the fixed communication terminal device 200-M 1 performs the above-mentioned processing of case C from one monaural code CMM N1 output by the multipoint control device 100, and the monaural sound picked up by the mobile communication terminal device 300-N 1 is recorded.
  • a monaural decoded sound signal corresponding to the sound signal of is obtained.
  • the multipoint control device 100 for the mobile communication terminal device 300-N 1 , uses the monaural code CFM M1 of the codes representing the sound signals of the two-channel stereo collected by the fixed communication terminal device 200-M 1. Output.
  • the mobile communication terminal device 300-N 1 is a monaural mixture of one monaural code CFM M1 output by the multipoint control device 100 and a two-channel stereo sound signal collected by the fixed communication terminal device 200-M 1. To obtain the decoded sound signal of.
  • And multi-point control unit 100 instructs the not fixed communication terminal apparatus 200-M 1 each fixed communication terminal device 200-m else (m else is at least 1 M or less each integer different from M 1), mono code CMM of fixed communication terminal device 200-M 1 represents a monaural sound signal monaural coding CFM M1 and the mobile communication terminal device 300-N 1 is picked up out of the code representing the sound signal of two-channel stereo picked up And N1 are output.
  • Each fixed communication terminal device 200- mel performs the processing of case B described above from the two monaural codes CFM M1 and CMM N1 output by the multipoint control device 100, and the fixed communication terminal device 200-M 1 A total of two channels: a monaural sound signal in which the collected 2-channel stereo sound signals are mixed, and a monaural sound signal corresponding to the monaural sound signal collected by the mobile communication terminal 300-N 1. To obtain the decoded sound signal of.
  • And multi-point control unit 100 instructs the mobile communication terminal device 300-N 1 each mobile communication terminal device 300-n the else not a (n the else is at least 1 N or less each integer different from N 1),
  • a monaural code CTM M1N1 obtained by mixing the sound signal obtained by decoding the monaural code CMM N1 representing the sound signal and then encoding is output.
  • Each mobile communication terminal 300-n the else from one monaural code CTM M1N1 the multipoint control unit 100 is output, the mobile communication terminal the sound signals of the two-channel stereo for fixed communication terminal device 200-M 1 is picked up and The device 300-N 1 obtains one monaural decoded sound signal corresponding to the mixed sound signal of the monaural sound signals collected.
  • a frame in which the fixed communication terminal device 200-M 1 and the mobile communication terminal device 300-N 1 are the utterance points corresponds to this case.
  • the multipoint control device 100 outputs the monaural code CMM N1 representing the sound signal of the other vocalization point to the fixed communication terminal device 200-M 1 at the vocalization point.
  • the fixed communication terminal apparatus 200-M 1 at the vocalization point performs the processing of the above-described case C from one monaural code CMM N1 output by the multipoint control apparatus 100 to convert the monaural sound signal of the other vocalization point.
  • the multipoint control device 100 outputs only the monaural code CFM M1 of the codes representing the two-channel stereo sound signal of the other vocalization point to the mobile communication terminal device 300-N 1 at the vocalization point.
  • the mobile communication terminal apparatus 300-N 1 is a sound signal obtained by mixing one monaural code CFM M1 output from the multipoint control apparatus 100 with a two-channel stereo sound signal at the other utterance point, and Obtain a monaural decoded sound signal whose decoding set is a sound signal that is not a tandem connection.
  • the multipoint control device 100 outputs two monaural codes CFM M1 and CMM N1 representing sound signals of two vocalization points to each fixed communication terminal device 200- melse other than the vocalization point. That is, the monaural code CFM M1 of the codes representing the two-channel stereo sound signal at one vocalization point and the monaural code CMM N1 representing the monaural sound signal at another vocalization point are output.
  • Each fixed communication terminal device 200- melse other than the vocalization point performs the processing of case B described above from the two monaural codes CFM M1 and CMM N1 output by the multipoint control device 100 to perform the two vocalization points.
  • a decoded sound signal of a total of two channels is obtained, which is a sound signal corresponding to each monaural sound signal, and is a sound signal whose encoding and decoding are not tandem connection.
  • the sound signal corresponding to the monaural sound signal of each of the two vocalization points is the sound signal corresponding to the sound signal in which the two-channel stereo sound signals of one vocalization point are mixed, and the monaural signal of the other vocalization point.
  • a sound signal corresponding to the sound signal is the sound signals obtained by decoding the monaural codes CFM M1 and CMM N1 of the two vocalization points for each mobile communication terminal device 300-n else other than the vocalization point.
  • a monophonic code CTM M1N1 representing one sound signal obtained by encoding is output.
  • Each mobile communication terminal device 300-n else other than the utterance point is a monaural sound signal in which all the sound signals of the two utterance points are mixed from one monaural code CTM M1N1 output by the multipoint control device 100. That is, one decoded sound signal is obtained, which is a mixed sound signal in which the encoding and decoding sets are tandem-connected.
  • Mobile communication terminal device 300-N 1 (N 1 is any one integer from 1 to N or less) and mobile communication terminal device 300-N 2 (N 2 is from 1 to N and is different from N 1) Case where 1 integer) is selected]
  • the mobile communication terminal device has the largest power of the sound signal and the second largest power of the sound signal out of the M+N terminal devices.
  • 300-N 1 (N 1 is any one integer of 1 or more and N or less)
  • mobile communication terminal device 300-N 2 (N 2 is any integer of 1 or more and N or less and different from N 1 ) There are cases where this is the case.
  • the point selection unit 110 of the multipoint control device 100 outputs the selection point information of case 5 described above, and the bit string generation unit 120 of the multipoint control device 100 described above [selection point information is case 5 In the case of the information], the multipoint telephone connection system 10 operates as follows, including the operations of the following terminal devices.
  • the multipoint control device 100 outputs to the mobile communication terminal device 300-N 1 a monaural code CMM N2 representing a monaural sound signal picked up by the mobile communication terminal device 300-N 2 .
  • the mobile communication terminal device 300-N 1 outputs a monaural decoded sound corresponding to a monaural sound signal picked up by the mobile communication terminal device 300-N 2 from one monaural code CMM N2 output by the multipoint control device 100.
  • the multipoint control device 100 outputs to the mobile communication terminal device 300-N 2 a monaural code CMM N1 representing a monaural sound signal picked up by the mobile communication terminal device 300-N 1 .
  • the mobile communication terminal device 300-N 2 outputs a monaural decoded sound corresponding to a monaural sound signal picked up by the mobile communication terminal device 300-N 1 from one monaural code CMM N1 output by the multipoint control device 100. Get the signal.
  • the multipoint control device 100 is neither the mobile communication terminal device 300-N 1 nor the mobile communication terminal device 300-N 2 , and each mobile communication terminal device 300-n else (n else is 1 or more and N or less and N 1 or N 1).
  • the sound signal obtained by decoding the monaural code CMM N1 representing the monaural sound signal picked up by the mobile communication terminal device 300-N 1 and the mobile communication terminal device 300-N 2 Outputs a monaural code CMM N1N2 obtained by mixing the sound signal obtained by decoding the monaural code CMM N2 representing the collected monaural sound signal and encoding the mixture.
  • Each mobile communication terminal device 300-n else has a monaural sound signal picked up by the mobile communication terminal device 300-N 1 and the mobile communication terminal device 300 from one monaural code CMM N1N2 output by the multipoint control device 100. Obtain one monaural decoded sound signal corresponding to the sound signal in which the monaural sound signals picked up by -N 2 are mixed.
  • the multipoint control device 100 represents a monaural sound signal picked up by the mobile communication terminal device 300-N 1 for each fixed communication terminal device 200-m (m is an integer of 1 or more and M or less).
  • the monaural code CMM N1 and the monaural code CMM N2 representing the monaural sound signal picked up by the mobile communication terminal apparatus 300-N 2 are output.
  • Each fixed communication terminal device 200-m performs the processing of case B described above from the two monaural codes CMM N1 and CMM N2 output by the multipoint control device 100, and the mobile communication terminal device 300-N 1 receives the same.
  • a decoded sound signal of a total of two channels that is, a sound signal corresponding to the sound signal of the monaural sound and a sound signal corresponding to the sound signal of the monaural sound picked up by the mobile communication terminal apparatus 300-N 2 are obtained.
  • a frame in which the mobile communication terminal device 300-N 1 and the mobile communication terminal device 300-N 2 are the utterance points corresponds to this case, and the multipoint telephone connection system 10 is used.
  • the multipoint control device 100 for each of the mobile communication terminal devices 300-N 1 and 300-N 2 at the vocalization point, represents a monaural code CMM Mx representing a monaural sound signal at the other vocalization point. (X is 1 or 2) is output.
  • Each of the mobile communication terminal device 300-N 1 and the mobile communication terminal device 300-N 2 at the vocalization point outputs one monaural code CMM Mx output from the multipoint control device 100 to a monaural sound signal at the other vocalization point.
  • the multipoint control device 100 decodes the monaural codes CMM M1 and CMM M2 representing the monaural sound signals of the two vocalization points for each mobile communication terminal device 300-n else other than the vocalization point.
  • a monaural code CTM M1M2 representing one sound signal obtained by mixing and encoding the obtained sound signals is output.
  • Each mobile communication terminal device 300-n else other than the utterance point is a monaural sound signal in which all sound signals of two utterance points are mixed from one monaural code CTM M1M2 output by the multipoint control device 100.
  • one decoded sound signal is obtained, which is a mixed sound signal in which the encoding and decoding sets are tandem-connected.
  • the multipoint control device 100 outputs, to each fixed communication terminal device 200-m, two monaural codes CMM M1 and CMM M2 that represent monaural sound signals at two vocalization points.
  • Each fixed communication terminal device 200-m performs the processing of the above-mentioned case B from the two monaural codes CMM M1 and CMM M2 output by the multipoint control device 100 to perform the monaural sound of each of the two vocalization points.
  • a decoded sound signal of two channels in total is obtained, which is two monaural sound signals corresponding to the signals and a sound signal whose encoding and decoding are not tandem connection.
  • ⁇ Second embodiment> In the encoding unit of the fixed communication terminal device of the first embodiment, it is a code that cannot obtain the decoded digital sound signals of the two channels by using only the extension code, and by using it together with the monaural code.
  • a code capable of obtaining both decoded digital sound signals of two channels was obtained as an extension code. However, by using only the extension code without using the monaural code, it is possible to obtain a decoded digital signal of two channels.
  • a code capable of obtaining both sound signals may be obtained as an extension code. This form will be described as a second embodiment.
  • the configuration of the multipoint telephone connection system 10 of the second embodiment and the configuration of each device included in the multipoint telephone connection system 10 are the same as the configuration of the multipoint telephone connection system 10 and the multipoint telephone connection system 10 of the first embodiment. It is the same as each device included in.
  • the second embodiment is different from the first embodiment in that the sound signal fixing of the fixed communication terminal device 200-m and the encoding unit 212-m of the transmitting side device 210-m and the sound signal fixing of the fixed communication terminal device 200-m are fixed. Since this is the operation of the decoding unit 222-m of the reception-side device 220-m, the difference between the second embodiment and the first embodiment will be described below.
  • the encoding unit 212-m of the second embodiment encodes, for each frame, the signal obtained by mixing the digital sound signals of the two channels input from the sound collection unit 211-m by the above-described first encoding method. To obtain a monaural code, and stereo-encode the input digital sound signals of the two channels by a predetermined third encoding method to obtain an extension code, and control the obtained monaural code and extension code. The information is output to the information adding unit 213-m.
  • the same encoding method is used in the encoding units 212-m of all sound signal fixed transmission side devices 210-m.
  • the third encoding method it is necessary to use an encoding method in which the bit rate of the extension code is equal to or less than the value obtained by subtracting the bit rate of the monaural code from the communication capacity of the fixed transmission path 400-m.
  • the third coding method if the bit rate of the extension code satisfies the above-mentioned conditions, it is possible to use only the extension code without using together with the monaural code obtained by the first encoding method.
  • a coding method capable of efficiently coding the sound signals of the two channels may be used so that the code that can obtain both the decoded digital sound signals of the channels is obtained as the extension code.
  • the third encoding method a method of encoding the sound signals of the two channels by the above-described first encoding method may be used.
  • the sound signals of the two channels are described above.
  • the encoding may be performed in the 13.2 kbps mode of the 3GPP EVS standard.
  • the decoding unit 222-m of the second embodiment inputs an input code for each frame based on the input code information.
  • the decoded code is decoded to obtain one or two decoded digital sound signals and output to the reproduction unit 223-m.
  • the decoding unit 222-m of the second embodiment performs the following case A′ processing instead of the above-described case A of the decoding unit 222-m of the first embodiment.
  • the decoding unit 222-m of the second embodiment when the input code information is “information indicating that the code included in the code string representing the sound signal is a set of monaural code and extended code”, The input extension code is decoded by the predetermined third decoding method to obtain and output two decoded digital sound signals. That is, the decoding unit 222-m decodes only the extension code without decoding the monaural code to obtain and output two decoded digital sound signals.
  • the decoding unit 222-m of the second embodiment uses, as the third decoding method, the third code used in the encoding unit 212-m of the sound signal fixed transmission side device 210-m of the second embodiment. The decoding method corresponding to the encryption method is used.
  • ⁇ Modification 1 of the second embodiment> The decoding unit of the fixed communication terminal device of the second embodiment does not use the monaural code in case A′ described above. Therefore, in this case, the control information analysis unit of the fixed communication terminal device may not output the monaural code.
  • This embodiment will be described as a modified example 1 of the second embodiment, and differences from the second embodiment will be described.
  • control information analysis unit 221-m In the control information analysis unit 221-m of the first modification of the second embodiment, the code information represented by the control code contained in the input fixed terminal bit string is “a set of monaural codes included in the code string representing the sound signal”.
  • the control information analysis unit 221-m of the modified example 1 of the second embodiment that is, the code information represented by the control code included in the input fixed terminal bit string is “a code string representing a sound signal is If the included code is other than "information indicating that it is a set of monaural code and extended code", the same operation as the control information analysis unit 221-m of the second embodiment is performed.
  • ⁇ Modification 2 of the second embodiment> The decoding unit of the fixed communication terminal device of the second embodiment does not use the monaural code in case A′ described above. Therefore, in this case, the bit string generation unit of the multipoint control device may not output the monaural code.
  • This embodiment will be described as a modified example 2 of the second embodiment, and the points different from the second embodiment will be described.
  • the bit string generation unit 120 of the second modification of the second embodiment determines the input fixed terminal transmission bit string based on the input selection point information for each frame.
  • a bit string for fixed terminals to be output to each fixed communication terminal device 200-m and a bit string for mobile terminals to be output to each mobile communication terminal device 300-n are generated using the input mobile terminal transmission bit string. Output.
  • the selected point information is the information “Fix-M 1 ”
  • the bit string generation unit 120 of the modified example 2 of the second embodiment each fixed communication terminal device 200 other than the fixed communication terminal device 200-M 1.
  • the control information analysis unit 221-m of the second modification of the second embodiment is an extension in which the code information represented by the control code contained in the input fixed terminal bit string is “one code included in the code string representing the sound signal.
  • the code information represents the code information represented by the control code included in the input fixed terminal bit string and the code representing the sound signal included in the input fixed terminal bit string 1 Outputs two extension codes and.
  • control information analysis unit 221-m of the modified example 2 of the second embodiment that is, the code information represented by the control code included in the input fixed terminal bit string is “a code string representing a sound signal is
  • the included code is other than "information indicating that it is one extension code”
  • the same operation as the control information analysis unit 221-m of the second embodiment is performed.
  • ⁇ Decoding unit 222-m> When the input code information is “information indicating that the code included in the code string representing the sound signal is one extension code”, the decoding unit 222-m of the second modification of the second embodiment , The input extension code is decoded by the above-described third decoding method to obtain and output two decoded digital sound signals.
  • the decoding unit 222-m of the second modification of the second embodiment represents the case other than the above, that is, the input code information is “the code included in the code string representing the sound signal is one extension code”. If it is other than “information”, the same operation as the decoding unit 222-m of the second embodiment is performed.
  • the extension code obtained by the encoding unit of the fixed communication terminal device is a code that cannot obtain the decoded digital sound signals of the two channels even if only the extension code is used.
  • This is a code that can be used in combination to obtain both decoded digital sound signals of two channels.
  • two channels can be obtained by using only the extension code without using the monaural code together. Although it is a code that can obtain both the decoded digital sound signals of the above, even if any one of the extension code of the first embodiment and the extension code of the second embodiment is selected for each frame. Good.
  • This form will be described as a third embodiment.
  • the configuration of the multipoint telephone connection system 10 of the third embodiment and the configuration of each device included in the multipoint telephone connection system 10 are the same as those of the multipoint telephone connection system 10 of the first embodiment and the second embodiment. It is the same as each device included in the telephone connection system 10. The differences between the third embodiment and the first embodiment will be described below.
  • the encoding unit 212-m according to the third embodiment like the encoding unit 212-m according to the first and second embodiments, includes two input units from the sound pickup unit 211-m for each frame.
  • a signal obtained by mixing the digital sound signals of the channels is coded by the above-described first coding method to obtain a monaural code, and the obtained monaural code is the control information adding unit 213-m of the sound signal fixed transmission side device 210-m Output to.
  • the encoding unit 212-m of the third embodiment uses an extension code including a code representing information corresponding to the difference between the digital sound signals of the two input channels, or the extension code of the two input channels.
  • the extension code obtained by stereo-coding the digital sound signal by the above-described third coding method is output to the control information addition unit 213-m of the sound signal fixed transmission side device 210-m.
  • the encoding unit 212-m obtains a monaural code by encoding the input mixed signal of the digital sound signals of the two channels by the above-described first encoding method.
  • the monaural code is decoded by the first decoding method to obtain the provisionally decoded digital sound signal, and the information corresponding to the difference between the input digital sound signals of the two channels is obtained by the second coding method described above.
  • the first provisional extension code is encoded to obtain the first provisional extension code, and the obtained first provisional extension code is decoded by the second decoding method to obtain decoding information corresponding to the difference.
  • the provisional decoded digital sound signal is considered to be a signal in which the first decoded digital sound signal of two channels is mixed, and the decoded information corresponding to the difference is two channels. Is regarded as information corresponding to the difference between the first provisional decoded digital sound signals of, and the first provisional decoded digital sound signals of two channels are obtained. Also, the encoding unit 212-m encodes the digital sound signals of the two channels by the above-described third encoding method to obtain the second provisional extension code, and obtains the obtained second provisional extension code. Decoding is performed by the third decoding method to obtain the second provisional decoded digital sound signals of two channels.
  • the coding unit 212-m receives coding distortion obtained from the input digital sound signals of the two channels and the first provisional decoded digital sound signals of the two channels, and the input two channels.
  • the temporary extension code corresponding to the smaller one of the coding distortions obtained from the digital sound signal of No. 2 and the second provisional decoded digital sound signals of the two channels and having the smaller coding distortion is output as the extension code.
  • the encoding unit 212-m of the third embodiment obtains the estimated value of the encoding distortion of the first provisional decoded digital sound signal as the first estimated encoding distortion, and outputs the second provisional decoded digital sound.
  • the estimated value of the coding distortion of the signal is obtained as the second estimated coding distortion, and the coding processing with the smaller estimated coding distortion of the first estimated coding distortion and the second estimated coding distortion is performed.
  • the extension code is obtained and output.
  • the encoding unit 212-m of the third embodiment encodes the information corresponding to the difference between the input digital sound signals of the two channels by the above-described second encoding method to perform the first provisional operation.
  • the extension code is obtained, the input digital sound signals of the two channels are stereo-encoded by the above-described third encoding method to obtain the second provisional extension code, and the first provisional extension code and the second provisional extension code are obtained.
  • One of the provisional extension codes having the smaller code amount is selected and output as the extension code.
  • the encoding unit 212-m of the third embodiment uses the extension code obtained by encoding the information corresponding to the difference between the input digital sound signals of the two channels by the above-described second encoding method.
  • An estimated value is obtained as a second estimated code amount, and one of the first estimated code amount and the second estimated code amount, which has the smaller estimated code amount, is subjected to encoding processing to obtain and output an extended code.
  • the encoding unit 212-m of the third embodiment analyzes the input digital sound signals of the two channels, and according to the analysis result, the difference between the input digital sound signals of the two channels.
  • the obtained extension code is output.
  • the encoding unit 212-m of the third embodiment under the control of the control unit (not shown) of the fixed communication terminal device 200-m, outputs the information corresponding to the difference between the input digital sound signals of the two channels. It is obtained by performing an operation of obtaining an extension code including the indicated code or stereo-encoding the input digital sound signals of two channels by the above-mentioned third encoding method to obtain the extension code. Output the extension code.
  • the encoding unit 212-m of the third embodiment inputs the extension code including the code representing the information corresponding to the difference between the input digital sound signals of the two channels, as the extension code to be output.
  • Information for specifying which one of the extension code obtained by stereo-encoding the digital sound signals of the two channels by the above-described third encoding method is obtained and output to the control information addition unit 213-m. ..
  • Control information adding unit 213-m When the code representing the sound signal is the monaural code and the extension code, the control information adding unit 213-m of the third embodiment reads “a set of the monaural code and the extension code included in the code string representing the sound signal”. Information indicating that the extension code is any of the above-mentioned extension codes, that is, "whether the extension code includes a code indicating information corresponding to a difference or a third code The control code representing the code information including "information for specifying whether or not the code is obtained by the coding method" is output.
  • the decoding unit 222-m of the third embodiment is that the extension code includes a code representing information corresponding to the difference.
  • the processing of the above-described case A of the decoding unit 222-m of the first embodiment is performed, and the input code information is “a set of monaural codes including a code included in a code string representing a sound signal”.
  • the third embodiment may be modified in the same manner as the modification of the second embodiment to Modification 1 or Modification 2 of the second embodiment.
  • the multipoint telephone connection system of each of the above-described embodiments includes two or more fixed communication terminal devices and two or more mobile communication terminal devices.
  • the number of terminal devices included in the multipoint telephone connection system of each of the above-described embodiments is not limited to this, and the multipoint telephone connection system of each of the above-described embodiments includes one or more fixed communication terminal devices.
  • the point selection unit 110 of the multipoint control device 100 when M is 1, that is, when the multipoint telephone connection system includes one fixed communication terminal device and two or more mobile communication terminal devices, the point selection unit 110 of the multipoint control device 100. Since neither of the points selected by is a fixed communication terminal device, the point selection information output by the point selection unit 110 is not Case 3, and the point selection information output by the point selection unit 110 is the case. It will be one of 1, 2, 4, and 5. Further, in this case, since the fixed communication terminal device is included in the spot selected by the spot selection unit 110, the fixed communication terminal device is not included in the spot not selected by the spot selection unit 110.
  • the bit string generation unit 120 of the multipoint control device 100 outputs the second bit string when the point selection information is the information of case 1, and the third bit string when the point selection information is the information of case 4.
  • the point selection information is the information of Case 1
  • the first and third bit strings are output
  • the point selection information is the information of Case 4
  • the first and second bits are output.
  • the fourth bit string is output.
  • the decoding unit 222-1 of the sound signal fixed reception side device 220-1 of the fixed communication terminal device 200-1 does not perform the processing of case A described above, and the decoding unit 222-1 described above. Either of the cases B to D is performed.
  • the point selection unit 110 of the multipoint control device 100 When N is 1, that is, when the multipoint telephone connection system includes two or more fixed communication terminal devices and one mobile communication terminal device, the point selection unit 110 of the multipoint control device 100. Since neither of the points selected by is a mobile communication terminal device, the point selection information output by the point selection unit 110 is not Case 5, and the point selection information output by the point selection unit 110 is the case. It will be one of 1 to 4. Further, in this case, when the point selected by the point selecting unit 110 includes the mobile communication terminal device, the point not selected by the point selecting unit 110 does not include the mobile communication terminal device.
  • the bit string generation unit 120 of the multipoint control device 100 outputs the second bit string when the point selection information is the case 2 information, and the fourth bit string when the point selection information is the case 4 information. If the point selection information is case 2 information, the first and third bit strings are output, and if the point selection information is case 4 information, the first and second bit strings are output. The bit string of the third and third patterns is output.
  • the point selection unit 110 of the multipoint control device 100 selects one or two points.
  • the number of points selected by the point selection unit 110 is not limited to this, and the monaural code obtained by the above-described first encoding method is within the communication capacity range that can be transmitted in real time on the transmission line for the voice line of the fixed telephone. The number may be three or more as long as it is within the range. That is, the point selection unit 110 of the multipoint control device 100 may select a maximum of K points (K is an integer of 2 or more).
  • K is an integer of 2 or more.
  • the bit string generator 120 of the multipoint control device 100, each fixed communication terminal device 200-m, and each mobile communication terminal device 300-n operate as follows.
  • the number of selected points is one (that is, when K is 1)
  • the number of selected points other than the own point is 0 for the terminal device at the selected point.
  • the bit string generation unit 120 of the multipoint control device 100 for the communication terminal device in which the number of selected points other than its own point is 0, is the code string representing the sound signal. Is not output.
  • the communication terminal device in which the number of selected points other than its own point is 0 does not decode the code string representing the sound signal and does not obtain the decoded sound signal.
  • bit string generation unit 120 of the multipoint control device 100 determines the number of selected points.
  • the bit string generation unit 120 of the multipoint control device 100 determines that the selected point is a fixed communication terminal device with respect to the fixed communication terminal device in which the number of selected points other than the own point is one. Generates and outputs a bit string including a monaural code and an extension code as a code representing a sound signal at the selected point, and when the selected point is a mobile communication terminal device, a monaural signal at the selected point is generated.
  • a bit string including a code as a code representing a sound signal is generated and output.
  • the decoding unit of the fixed communication terminal device in which the number of selected points other than its own point is one, decodes the monaural code of the selected point and expands the selected point.
  • the extension code at the selected point is also decoded to obtain the decoded sound signal at the selected point.
  • the decoding unit of the mobile communication terminal device in which the number of selected points other than its own point is one the decoding of the selected point is performed by decoding the monaural code of the selected point. Get a sound signal.
  • the number of selected points is 3 or more (that is, when K is 3 or more)
  • the number of selected points other than the own point is 2 or more for the terminal device of the selected point. is there.
  • the number of selected points is two or more (that is, when K is two or more)
  • the number of selected points other than the own point is 2 for the terminal device of the unselected points. More than one.
  • the bit string generation unit 120 of the multipoint control device 100 selects two or more (k number, k is 2) for a fixed communication terminal device in which the number of selected points other than its own point is two or more.
  • Monaural code k included in the bit string output by each of the communication terminal devices of (K or more and an integer less than or equal to K) is included as a code representing the sound signal, and the code information is “monaural code having k code included in the code string representing the sound signal
  • a bit string for a fixed terminal including a control code indicating "information indicating that" is generated and output.
  • the control information analysis unit of the sound signal fixed receiving side device of the fixed communication terminal device in which the number of the selected points other than the own point is two or more is “a monaural code whose code string representing the sound signal includes k codes”.
  • the code information, which is the information "representing the following.”, and k monaural codes are output to the decoding unit.
  • the decoding unit of the sound signal fixed reception side device of the fixed communication terminal device in which the number of selected points other than the own point is two or more is determined by the above-described first decoding method for each of the k input monaural codes. After decoding, k decoded digital sound signals are obtained and output.
  • the reproduction unit of the sound signal fixed reception side device of each fixed communication terminal device may include a maximum of K DA conversion units and a maximum of K speakers.
  • the bit string generation unit 120 of the multipoint control device 100 selects two or more (k number, k is 2) for a mobile communication terminal device in which the number of selected points other than its own point is two or more.
  • the above integers of K or less) are decoded to obtain monaural codes included in the bit strings output by the respective communication terminal devices, to obtain k decoded digital sound signals, and the k decoded digital sound signals obtained are mixed to obtain a mixed digital signal.
  • the decoding unit of the mobile communication terminal device in which the number of selected points other than its own point is two or more decodes one monaural code by the above-described first decoding method to generate one decoded digital sound signal. Get and output.
  • the monaural code obtained by the above-mentioned first encoding method falls within the range of communication capacity that can be transmitted in real time through the transmission line for the voice line of the fixed telephone.
  • K is an integer of 2 or more
  • the point selection unit 110 of the multipoint control device 100 selects a maximum of K points, and one or more fixed communication terminal devices are included. Therefore, it is sufficient that at least one mobile communication terminal device is included, and the total of K+1 or more fixed communication terminal devices and mobile communication terminal devices is included. That is, in the multipoint telephone connection system of each of the above-described embodiments, M may be 1 or more, N may be 1 or more, and M+N may be K+1 or more.
  • the sound signal fixed transmission side device 210-m of the fixed communication terminal device 200-m includes a bit string including codes corresponding to digital sound signals of two channels. This is explained in the example of obtaining and outputting.
  • the number of channels is not limited to this and may be two or more. Assuming that the number of channels is C (C is an integer of 2 or more), in this case, the sound pickup unit 211-m of the sound signal fixed transmission side device 210-m of the fixed communication terminal device 200-m has C microphones.
  • the encoding unit 212-m of the sound signal fixed transmission side device 210-m of the fixed communication terminal device 200-m collects the sound collection unit 211-m for each frame.
  • a signal obtained by mixing the digital sound signals of the C channels input from is encoded by a predetermined first coding method to obtain a monaural code, and is equivalent to the difference between the digital sound signals of the C channels input. It suffices to obtain an extension code including a code indicating the information to be processed.
  • the decoding unit 222-m of the sound signal fixed reception side device 220-m of the fixed communication terminal device 200-m replaces the case A described above with the input monaural code with a predetermined first value.
  • the temporary decoded digital sound signal is obtained by decoding by the decoding method, the decoded difference information is obtained from the code representing the information corresponding to the difference included in the input extension code, and the obtained temporary decoded digital sound signal and the decoded difference information are obtained. From this, it is considered that the provisional decoded digital sound signal is a signal in which the C decoded digital sound signals are mixed, and the decoded difference information is information corresponding to the difference between the C decoded digital sound signals. Then, C decoded digital sound signals may be obtained and output. Further, when the input extension code includes an error code in addition to the difference code which is a code representing information corresponding to the difference, the decoding unit 222-m further adds the input extension code to the extension code.
  • Decoding error information is obtained from the included error code, and the provisional decoded digital sound signal, the decoding error information, and the decoded difference information are regarded as a signal in which the C decoded sound signals are mixed.
  • the decoding error information is regarded as information corresponding to the error of the provisional decoded digital sound signal
  • the decoding difference information is regarded as information corresponding to the difference of the C decoded digital sound signals, and C It suffices to obtain and output each decoded digital sound signal.
  • the reproduction unit 223-m of the sound signal fixed reception side device 220-m of the fixed communication terminal device 200-m may include a maximum of C DA conversion units and a maximum of C speakers.
  • the encoding unit 212-m uses the channels of the digital sound signals of the C input channels.
  • the information corresponding to the difference is encoded by a predetermined second encoding method to obtain a code representing the information corresponding to the difference and include it in the extension code, and the decoding unit 222-m includes it in the input extension code. It is only necessary to decode the code representing the information corresponding to the difference obtained by the second predetermined decoding method to obtain the decoded difference information.
  • the second decoding method and the second encoding method are, for example, the multi-channel decoding method of the MPEG-4 ALS standard (ISO/IEC 14496-3 11.6.8.1.2) and the encoding method corresponding thereto. Any known processing technique may be used.
  • the information corresponding to the difference between the digital sound signals of the C channels is the waveform information representing the difference between the digital sound signals of the C channels, C, as in the first embodiment. It is a characteristic parameter representing the difference between the digital sound signals of the individual channels.
  • the processes of the respective units of the first communication network terminal device 200-m, the second communication network terminal device 300-n, and the multipoint control device 100 may be realized by a computer.
  • the processing of the steps may be executed by a computer.
  • the processing of each step of the method corresponding to the second communication network terminal device 300-n may be executed by a computer.
  • the processing of each step of the multipoint control method corresponding to the multipoint control device 100 may be executed by a computer.
  • each step is described by the program. Then, by executing this program on a computer, the processing of each step is realized on the computer.
  • Each of the programs describing these processing contents can be recorded in a computer-readable recording medium.
  • the computer-readable recording medium may be, for example, a magnetic recording device, an optical disc, a magneto-optical recording medium, a semiconductor memory or the like.
  • the processing of each unit may be configured by executing a predetermined program on a computer, or at least part of these processing may be realized by hardware. It goes without saying that other changes can be made without departing from the spirit of the present invention.

Abstract

符号化と復号の組のタンデム接続による音質劣化の発生を少なくすることができ、また、多地点制御装置の演算処理量や所要メモリ量を少なくすることができる技術を提供する。通信容量が異なる複数の通信網(例えば、固定電話回線と携帯電話回線)の端末間の多地点接続において、通信容量が小さいほうの通信網のモノラル符号化方式を含むマルチチャンネル符号化を通信容量が大きいほうの通信網で用い、通信容量が大きいほうの通信網に端末に対して複数地点の音を伝える場合に、これら複数地点のモノラル符号を出力するように制御を行う。

Description

多地点制御方法、装置及びプログラム
 本発明は、多地点で電話会議をするための多地点制御装置(Multipoint Control Unit, MCU)における制御技術、各地点における音信号の符号化技術、各地点における音信号の復号技術、の少なくとも何れかに関する。
 多地点で電話会議をするための多地点制御装置における制御、各地点における音信号の符号化、各地点における音信号の復号の先行技術としては、特許文献1の技術がある。特許文献1の技術は、基本品質符号化と品質拡張符号化によるエンベデッド符号化を用いるものである。各地点の音信号の符号化装置は、入力された音信号について基本品質符号化と品質拡張符号化によるエンベデッド符号化を行って符号を得て多地点制御装置に対して出力する。多地点制御装置は、基本品質符号化の部分については、全地点の符号を復号して音信号を得て、得た音信号をミキシングして、ミキシング後の音信号を符号化して、ミキシング後の音信号から得た符号を各地点に対して送出する。一方、多地点制御装置は、品質拡張符号化の部分については、最重要の1地点の符号を選択してその符号を各地点に対して送出するか、または、重要度が高い複数地点の符号を復号して音信号を得て、得た音信号をミキシングして、ミキシング後の音信号を符号化して、ミキシング後の音信号から得た符号を各地点に対して送出する。各地点の音信号の復号装置は、多地点制御装置が送出した符号を復号することで、全地点の基本品質部分と重要度が高い地点の品質拡張部分とを含む音信号を得る。
特開2005-229259公報
 特許文献1の技術では、基本品質部分については多地点制御装置において必ず復号してから符号化しており、符号化と復号の組がタンデム接続されている。従って、特許文献1の技術を移動通信で用いられるような高圧縮で演算処理量や所要メモリ量が多い符号化復号方式を用いて実装した場合には、符号化と復号の組がタンデム接続されることによる音質の劣化が顕著となる課題や、多くの復号処理と符号化処理を行うために多地点制御装置の演算処理量や所要メモリ量が多くなってしまう課題がある。
 本発明の一態様による多地点制御方法は、M地点(Mは2以上の整数)の第一通信網端末装置とN地点(Nは1以上の整数)の第二通信網端末装置とが通信路を介して接続された多地点制御装置における多地点制御方法であって、各時間区間について、各第一通信網端末装置から多地点制御装置に通信路を介して入力されるビット列は、該第一通信網端末装置に入力された2個以上のチャンネルの音信号を混合した信号を第1の符号化方式で符号化して得られたモノラル符号CFM(mは1以上M以下の各整数)と、入力された2個以上のチャンネルの音信号の差分に相当する情報を表す符号を含む拡張符号CFEと、を音信号を表す符号として含むビット列であり、各第二通信網端末装置から多地点制御装置に通信路を介して入力されるビット列は、該第二通信網通信端末装置に入力された1チャンネルの音信号を第1の符号化方式で符号化して得られたモノラル符号CMM(nは1以上N以下の各整数)を音信号を表す符号として含むビット列であり、多地点制御装置が、M地点の第一通信網端末装置とN地点の第二通信網端末装置のうちから1地点または2地点を選択する地点選択ステップと、多地点制御装置が、選択された地点がM地点とM地点の2地点(Mは1以上M以下の整数、Mは1以上M以下でありMとは異なる整数)の第一通信網端末装置である場合に、選択されなかった地点の各第一通信網端末装置に対するビット列として、M地点の音信号を表す符号のうちのモノラル符号CFMM1とM地点の音信号を表す符号のうちのモノラル符号CFMM2とを音信号を表す符号として含むビット列を生成して出力するビット列生成ステップと、を有する。
 本発明によれば、移動通信で用いられるような高圧縮な符号化方式を用いて実装した場合であっても、符号化と復号の組のタンデム接続による音質劣化の発生を少なくすることができ、また、多地点制御装置の演算処理量や所要メモリ量を少なくすることができる。
多地点電話接続システムの例を示すブロック図。 固定通信端末装置の例を示すブロック図。 移動通信端末装置の例を示すブロック図。 多地点制御装置の例を示すブロック図。 選択地点情報がケース1の情報である場合の音信号を表す符号列の例を模式的に示した図。 選択地点情報がケース2の情報である場合の音信号を表す符号列の例を模式的に示した図。 選択地点情報がケース3の情報である場合の音信号を表す符号列の例を模式的に示した図 選択地点情報がケース4の情報である場合の音信号を表す符号列の例を模式的に示した図。 選択地点情報がケース5の情報である場合の音信号を表す符号列の例を模式的に示した図。 固定通信端末装置の音信号固定送信側装置の処理の例を示す流れ図。 固定通信端末装置の音信号固定受信側装置の処理の例を示す流れ図。 移動通信端末装置の音信号固定送信側装置の処理の例を示す流れ図。 移動通信端末装置の音信号固定受信側装置の処理の例を示す流れ図。 多地点制御装置の処理の例を示す流れ図。
 多地点電話接続システム10は、図1に示す通り、多地点制御装置100と、第一通信網端末装置200-m(mは1以上M以下の各整数)と、第二通信網端末装置300-n(nは1以上N以下の各整数)と、を含む。多地点制御装置100と各第一通信網端末装置200-mは、第一通信網の各伝送路400-mを介して接続されている。多地点制御装置100と各第二通信網端末装置300-nは、第二通信網の各伝送路500-nを介して接続されている。第一通信網と第二通信網とは、リアルタイム伝送可能な通信容量が異なる通信網である。第一通信網の各伝送路400-mの各方向の通信容量は第二通信網の各伝送路500-nの各方向の通信容量のK倍以上(Kは2以上の整数)であり、第一通信網端末装置と第二通信網端末装置の合計個数はK+1以上であり、K+1個以上の端末装置には少なくとも1個の第一通信網端末装置と少なくとも1個の第二通信網端末装置が含まれており、各端末装置では最大K地点の端末装置の音信号に対応する復号音信号を再生可能であるとする。すなわち、本発明では、Mが1以上であり、かつ、Nが1以上であり、かつ、M+NがK+1以上であればよく、本発明には、各通信網が固定通信であるか移動通信であるか、すなわち、各通信網の伝送路が有線伝送路であるか無線伝送路であるか、などの制約はない。
 本発明は、例えば、第一通信網が既存の固定電話の通信網であり第二通信網が既存の携帯電話の通信網である場合にも適用可能である。そこで、理解し易さを考慮して、以降の各実施形態では、第一通信網が既存の固定電話の通信網であり第二通信網が既存の携帯電話の通信網であることを想定した例、具体的には、図1に示す通り、第一通信網端末装置200-mが固定通信端末装置200-mであり、第二通信網端末装置300-nが移動通信端末装置300-nであり、第一通信網の伝送路400-mが固定伝送路400-mであり、第二通信網の伝送路500-nが移動伝送路500-nである例で説明する。
<第一実施形態>
 まず、第一実施形態の多地点電話接続システムの構成と多地点電話接続システムに含まれる各装置について説明する。
≪多地点電話接続システム10≫
 第一実施形態の多地点電話接続システム10は、図1に示す通り、多地点制御装置100と、複数個(M個)の固定通信端末装置200-m(mは1以上M以下の各整数)と、複数個(N個)の移動通信端末装置300-n(nは1以上N以下の各整数)と、を含む。本実施形態では、固定通信端末装置200-mと移動通信端末装置300-nがそれぞれ2個以上であるとして説明する。すなわち、本実施形態では、Mは2以上の整数であり、Nは2以上の整数であるとする。多地点制御装置100と各固定通信端末装置200-mは、例えば固定電話の音声回線用の上り下りの各方向が64kbpsの伝送路などの、固定電話用の電話帯域音声の符号化方式の1チャンネル分の符号をリアルタイム伝送可能な通信容量の各固定伝送路400-mを介して接続されている。固定電話用の電話帯域音声の符号化方式とは、例えばITU-T G.711である。多地点制御装置100と各移動通信端末装置300-nは、例えば携帯電話の音声回線用の上り下りの各方向が13.2kbpsの伝送路などの、携帯電話用の電話帯域音声の符号化方式の1チャンネル分の符号をリアルタイム伝送可能な通信容量の各移動伝送路500-nを介して接続されている。携帯電話用の電話帯域音声の符号化方式とは、例えば3GPP EVS規格(3GPP TS26.442)の13.2kbpsモードである。
≪固定通信端末装置200-m≫
 固定通信端末装置200-mは、例えば高機能電話機やマイクロホンとスピーカを備えたPCであり、図2に示す通り、音信号固定送信側装置210-mと音信号固定受信側装置220-mを含む。音信号固定送信側装置210-mは収音部211-mと符号化部212-mと制御情報付与部213-mを含む。音信号固定受信側装置220-mは制御情報解析部221-mと復号部222-mと再生部223-mを含む。
 固定通信端末装置200-mの音信号固定送信側装置210-mは、図10及び以下に例示するステップS211からステップS213の処理を行い、固定通信端末装置200-mの音信号固定受信側装置220-mは、図11及び以下に例示するステップS221からステップS223の処理を行う。
<<音信号固定送信側装置210-m>>
 音信号固定送信側装置210-mは、例えば20msの所定の時間区間ごとに、すなわちフレームごとに、2個のチャンネルのディジタル音信号に対応する符号を含むビット列である固定端末送出ビット列を得て固定伝送路400-mに出力する。すなわち、音信号固定送信側装置210-mは固定端末送出ビット列を固定伝送路400-mを介して多地点制御装置100に対して出力する。
<収音部211-m>
 音信号固定送信側装置210-mの収音部211-mは、2個のマイクロホンと2個のAD変換部を含む。各マイクロホンと各AD変換部は一対一に対応付けられている。マイクロホンは、マイクロホンの周辺の空間領域で発生した音を収音してアナログの電気信号に変換してAD変換部に出力する。AD変換部は、入力されたアナログの電気信号を例えばサンプリング周波数が8kHzのPCM信号であるディジタル音信号に変換して出力する。すなわち、収音部211-mは、2個のマイクロホンのそれぞれで収音した音に対応する2個のチャンネルのディジタル音信号、例えば左チャンネルと右チャンネルの2チャンネルステレオのディジタル音信号、を音信号固定送信側装置210-mの符号化部212-mに出力する(ステップS211)。
<符号化部212-m>
 音信号固定送信側装置210-mの符号化部212-mは、フレームごとに、収音部211-mから入力された2個のチャンネルのディジタル音信号を混合した信号を表す符号であるモノラル符号と、モノラル符号に加えて拡張符号も用いることで入力された2個のチャンネルのディジタル音信号それぞれを表すことができる拡張符号と、を得て、得たモノラル符号と拡張符号を音信号固定送信側装置210-mの制御情報付与部213-mに出力する(ステップS212)。すなわち、符号化部212-mが得る拡張符号は、拡張符号のみを用いても2個のチャンネルの復号ディジタル音信号の何れも得ることができない符号であり、モノラル符号と併せて用いることで2個のチャンネルの復号ディジタル音信号の両方を得ることができる符号であり、入力された2個のチャンネルのディジタル音信号の差分に相当する情報を表す符号を含む符号である。
 2個のチャンネルのディジタル音信号を混合した信号とは、例えば、2個のチャンネルのディジタル音信号の対応するサンプル同士の加算による系列、2個のチャンネルのディジタル音信号の対応するサンプル同士の平均値による系列、2個のチャンネルのディジタル音信号の少なくとも何れかを変形したり時間遅れを与えたものの加算や平均値による系列、これらの加算や平均値による系列を変形して得た系列、などであり、2個のチャンネルのディジタル音信号の和に相当する信号である。
 2個のチャンネルのディジタル音信号の差分に相当する情報を表す符号とは、2個のチャンネルのディジタル音信号の差分を表す波形の情報を符号化して得られる符号、2個のチャンネルのディジタル音信号の差分を表す特徴パラメータを表す符号、などである。2個のチャンネルのディジタル音信号の差分を表す波形の情報とは、例えば、一方のチャンネルのディジタル音信号のサンプルから他方のチャンネルのディジタル音信号の対応するサンプルを減算して得た値による系列、一方のチャンネルのディジタル音信号のサンプルから他方のチャンネルのディジタル音信号の対応するサンプルを減算して得た値を2で除算した値による系列、2個のチャンネルのディジタル音信号の少なくとも何れかを変形したり時間遅れを与えたものについて前記の減算または減算と除算をして得た系列、前記の減算または減算と除算をして得た系列を変形して得た系列、前記の何れかの系列の一部、である。2個のチャンネルのディジタル音信号の差分を表す特徴パラメータとは、2個のチャンネルのディジタル音信号の周波数帯域ごとのエネルギーの差、周波数帯域ごとの相関、周波数帯域ごとの位相差などの、チャンネル間の信号の関係や相違の度合いを表す1つまたは複数の特徴量である。
 具体的には、符号化部212-mは、フレームごとに、収音部211-mから入力された2個のチャンネルのディジタル音信号を混合した信号を所定の第1の符号化方式で符号化してモノラル符号を得て、また、入力された2個のチャンネルのディジタル音信号の差分に相当する情報を表す符号を含む拡張符号を得て、得たモノラル符号と拡張符号を音信号固定送信側装置210-mの制御情報付与部213-mに出力する。なお、入力された2個のチャンネルのディジタル音信号の差分に相当する情報を符号化する場合には、符号化部212-mは、入力された2個のチャンネルのディジタル音信号の差分に相当する情報を所定の第2の符号化方式で符号化して符号を得る。
 例えば、符号化部212-mは、入力された2個のチャンネルのディジタル音信号の対応するサンプル同士の平均値による系列(すなわち、周知のMSステレオのMチャンネルの信号)を所定の第1の符号化方式で符号化してモノラル符号を得て出力し、また、入力された2個のチャンネルのディジタル音信号の対応するサンプル同士について、第1のチャンネルのディジタル音信号のサンプルから第2のディジタル音信号のチャンネルのサンプルを減算して得た値を2で除算した値による系列(周知のMSステレオのSチャンネルの信号)を所定の第2の符号化方式で符号化して符号を得て、得た符号を拡張符号として出力する。
 第1の符号化方式としては、全ての音信号固定送信側装置210-mの符号化部212-mと、全ての音信号移動送信側装置310-nの符号化部312-nと、で同じ符号化方式を用いる。従って、第1の符号化方式としては、モノラル符号のビットレートが移動伝送路500-nの通信容量以下である符号化方式を用いる必要がある。そこで、第1の符号化方式としては、携帯電話用の電話帯域音声の符号化方式、例えば上述した3GPP EVS規格の13.2kbpsモード、を用いればよい。
 拡張符号のビットレートは、固定伝送路400-mの通信容量からモノラル符号のビットレートを減算した値以下である必要がある。従って、入力された2個のチャンネルのディジタル音信号の差分に相当する情報を符号化する場合には、第2の符号化方式としては、全ての音信号固定送信側装置210-mの符号化部212-mで同じ符号化方式であり、かつ、拡張符号のビットレートが、固定伝送路400-mの通信容量からモノラル符号のビットレートを減算した値以下である符号化方式を用いる必要がある。第2の符号化方式としては、拡張符号のビットレートが上述した条件を満たす範囲内で、2個のチャンネルの音信号の差分に相当する情報、例えば2個のチャンネルの音信号の差信号、を効率良く符号化できる符号化方式を用いればよい。もちろん、第2の符号化方式として第1の符号化方式と同じ符号化方式を用いてもよく、例えば上述した3GPP EVS規格の13.2kbpsモードを第2の符号化方式として用いてもよい。
 なお、拡張符号には、入力された2個のチャンネルのディジタル音信号を混合した信号を第1の符号化方式で符号化したときの量子化誤差についての復号信号を復号側で得るための符号も含めてもよい。すなわち、符号化部212-mは、入力された2個のチャンネルのディジタル音信号を混合した信号を第1の符号化方式で符号化したときの量子化誤差を表す符号も得て、得た量子化誤差を表す符号と上述した差分に相当する情報を表す符号とを拡張符号に含めるようにしてもよい。以下では、量子化誤差を表す符号を誤差符号とも呼び、差分に相当する情報を表す符号を差分符号とも呼ぶ。
 例えば、符号化部212-mは、入力された2個のチャンネルのディジタル音信号の対応するサンプル同士の平均値による系列(すなわち、周知のMSステレオのMチャンネルの信号)を所定の第1の符号化方式で符号化してモノラル符号を得て出力し、第1の符号化方法に対応する復号方法である第1の復号方式でモノラル符号を復号して得られる暫定復号ディジタル音信号を得て、入力された2個のチャンネルのディジタル音信号を混合した信号のサンプルから暫定復号ディジタル音信号の対応するサンプルを減算して量子化誤差系列を得て、得た量子化誤差系列を符号化して誤差符号を得て、入力された2個のチャンネルのディジタル音信号の対応するサンプル同士について、第1のチャンネルのディジタル音信号のサンプルから第2のディジタル音信号のチャンネルのサンプルを減算して得た値を2で除算した値による系列(周知のMSステレオのSチャンネルの信号)を所定の第2の符号化方式で符号化して差分符号を得て、誤差符号と差分符号とを含む拡張符号を出力する。
<制御情報付与部213-m>
 音信号固定送信側装置210-mの制御情報付与部213-mは、フレームごとに、入力されたモノラル符号と拡張符号を音信号を表す符号として含み、音信号を表す符号列がどのような符号を含むのかを表す符号情報を表す符号である制御符号を含む、固定端末送出ビット列を得て固定伝送路400-mに出力する(ステップS213)。
 制御情報付与部213-mが出力する固定端末送出ビット列に含まれる制御符号が表す符号情報は、必ず“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”である。後述する多地点制御装置100では、入力されたビット列が固定端末送出ビット列であれば、そのビット列に含まれる音信号を表す符号が1組のモノラル符号と拡張符号であることは把握可能である。従って、多地点制御装置100に入力する目的だけであれば、音信号を表す符号列がどのような符号を含むのかを表す符号情報を表す符号である制御符号を固定端末送出ビット列に含める必要はなく、音信号固定送信側装置210-mが制御情報付与部213-mを備えないようにして、符号化部212-mがモノラル符号と拡張符号を音信号を表す符号として含む固定端末送出ビット列を得て出力するようにしてもよい。なお、固定端末送出ビット列には、その固定端末送出ビット列を得た端末装置を特定する情報、その固定端末送出ビット列が対応するフレームを特定する情報、そのフレームが有音であるか無音であるか(例えば、そのフレームのディジタル音信号のパワーが所定の閾値以上であるか否か)を特定する情報、固定端末送出ビット列に含まれる各符号の固定端末送出ビット列内での位置を特定する情報、などの補助情報を含めてもよい。
<<音信号固定受信側装置220-m>>
 音信号固定受信側装置220-mは、フレームごとに、固定伝送路400-mから入力された固定端末向けビット列に基づく音を出力する。ただし、入力された固定端末向けビット列次第では、音信号固定受信側装置220-mが音を出力しない場合もある。なお、固定伝送路400-mから入力された固定端末向けビット列は、多地点制御装置100が固定通信端末装置200-mに対して出力した固定端末向けビット列である。
<制御情報解析部221-m>
 音信号固定受信側装置220-mの制御情報解析部221-mは、フレームごとに、入力された固定端末向けビット列に含まれる制御符号が表す符号情報と、入力された固定端末向けビット列に含まれる音信号を表す符号列が含む各符号とを、音信号固定受信側装置220-mの復号部222-mに出力する(ステップS221)。ただし、制御情報解析部221-mは、入力された固定端末向けビット列に音信号を表す符号列が含まれない場合には、符号は出力しない。すなわち、制御情報解析部221-mは、フレームごとに、入力された固定端末向けビット列に音信号を表す符号列が含まれている場合には、入力された固定端末向けビット列に含まれる制御符号が表す符号情報と、入力された固定端末向けビット列に含まれる音信号を表す符号列が含む各符号とを出力し、入力された固定端末向けビット列に音信号を表す符号列が含まれていない場合には、入力された固定端末向けビット列に含まれる制御符号が表す符号情報を出力する。
 多地点制御装置100の説明箇所において後述する通り、固定端末向けビット列に含まれる制御符号が表す符号情報と、固定端末向けビット列に含まれる音信号を表す符号列が含む各符号と、の組は下記のケースAからケースDの何れかである。従って、制御情報解析部221-mは、下記のケースAからケースDの何れかの符号情報を少なくとも出力し、固定端末向けビット列が音信号を表す符号列を含む場合には音信号を表す符号列が含む符号も出力する。
ケースA:符号情報は、“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”。音信号を表す符号列が含む符号は、1組のモノラル符号と拡張符号。
ケースB:符号情報は、“音信号を表す符号列が含む符号が2個のモノラル符号であることを表す情報”。音信号を表す符号列が含む符号は、2個のモノラル符号。
ケースC:符号情報は、“音信号を表す符号列が含む符号が1個のモノラル符号であることを表す情報”。音信号を表す符号列が含む符号は、1個のモノラル符号。
ケースD:符号情報は、“音信号を表す符号列が無いことを表す情報”。音信号を表す符号列が含む符号は、無し。
<復号部222-m>
 音信号固定受信側装置220-mの復号部222-mは、フレームごとに、入力された符号情報に基づいて、入力された符号がある場合には、入力された符号を復号して1個または2個の復号ディジタル音信号を得て、音信号固定受信側装置220-mの再生部223-mに出力する(ステップS222)。具体的には、復号部222-mはフレームごとに下記のケースAからケースDの何れかの処理を行う。
[ケースA]
 復号部222-mは、入力された符号情報が“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”である場合には、入力されたモノラル符号を所定の第1の復号方式で復号して暫定復号ディジタル音信号を得て、入力された拡張符号に含まれる差分に相当する情報を表す符号(差分符号)から復号差分情報を得て、得た暫定復号ディジタル音信号と復号差分情報とから、暫定復号ディジタル音信号が2個の復号ディジタル音信号が混合された信号であると見做し、復号差分情報が2個の復号ディジタル音信号の差分に相当する情報であると見做して、2個の復号ディジタル音信号を得て出力する。なお、差分符号が符号化された情報である場合には、すなわち、対応する音信号固定送信側装置210-mの符号化部212-mが入力された2個のチャンネルのディジタル音信号の差分に相当する情報を所定の第2の符号化方式で符号化して差分符号を得た場合には、復号部222-mは、入力された拡張符号に含まれる差分符号を所定の第2の復号方式で復号して復号差分情報を得る。
 例えば、復号部222-mは、入力されたモノラル符号を所定の第1の復号方式で復号して第1の暫定復号ディジタル音信号を得て、入力された拡張符号に含まれる差分符号を所定の第2の復号方式で復号して第2の暫定復号ディジタル音信号を得て、第1の暫定復号ディジタル音信号が周知のMSステレオのMチャンネルの信号であるとし、第2の暫定復号ディジタル音信号が周知のMSステレオのSチャンネルの信号であるとして、第1の暫定復号ディジタル音信号と第2の暫定復号ディジタル音信号の対応するサンプル同士を加算した値による系列である第1の復号ディジタル音信号と、対応するサンプル同士について第1の暫定復号ディジタル音信号のサンプルから第2の暫定復号ディジタル音信号のサンプルを減算して得た値による系列である第2の復号ディジタル音信号と、を得て出力する。
 なお、拡張符号に差分符号と誤差符号とが含まれている場合には、復号部222-mは、入力されたモノラル符号を所定の第1の復号方式で復号して暫定復号ディジタル音信号を得て、入力された拡張符号に含まれる誤差符号から復号誤差情報を得て、入力された拡張符号に含まれる差分符号から復号差分情報を得て、得た暫定復号ディジタル音信号と復号誤差情報と復号差分情報とから、暫定復号ディジタル音信号が2個の復号ディジタル音信号が混合された信号であると見做し、復号誤差情報が暫定復号ディジタル音信号の誤差に相当する情報であると見做し、復号差分情報が2個の復号ディジタル音信号の差分に相当する情報であると見做して、2個の復号ディジタル音信号を得て出力する。
 この場合には、例えば、復号部222-mは、入力されたモノラル符号を所定の第1の復号方式で復号して第1の暫定復号ディジタル音信号を得て、入力された拡張符号に含まれる誤差符号を復号して第3の暫定復号ディジタル音信号を得て、入力された拡張符号に含まれる差分符号を所定の第2の復号方式で復号して第2の暫定復号ディジタル音信号を得て、第1の暫定復号ディジタル音信号と第3の暫定復号ディジタル音信号を加算して第4の暫定復号ディジタル音信号を得て、第4の暫定復号ディジタル音信号が周知のMSステレオのMチャンネルの信号であるとし、第2の暫定復号ディジタル音信号が周知のMSステレオのSチャンネルの信号であるとして、第4の暫定復号ディジタル音信号と第2の暫定復号ディジタル音信号の対応するサンプル同士を加算した値による系列である第1の復号ディジタル音信号と、対応するサンプル同士について第4の暫定復号ディジタル音信号のサンプルから第2の暫定復号ディジタル音信号のサンプルを減算して得た値による系列である第2の復号ディジタル音信号と、を得て出力する。
[ケースB]
 復号部222-mは、入力された符号情報が“音信号を表す符号列が含む符号が2個のモノラル符号であることを表す情報”である場合には、入力された2個のモノラル符号それぞれを所定の第1の復号方式で復号して2個の復号ディジタル音信号を得て出力する。
[ケースC]
 復号部222-mは、入力された符号情報が、“音信号を表す符号列が含む符号が1個のモノラル符号であることを表す情報”である場合には、入力されたモノラル符号を所定の第1の復号方式で復号して1個の復号ディジタル音信号を得て出力する。なお、この場合には、復号部222-mは、もう1個の復号ディジタル音信号として、無音であることに対応する復号ディジタル音信号、すなわち、全てのサンプルの振幅が0である復号ディジタル音信号を得て出力してもよい。また、この場合には、復号部222-mは、もう1個の復号ディジタル音信号として、所定の規則により発生させた背景雑音信号に対応する復号ディジタル音信号、例えば、振幅が小さい白色雑音やその白色雑音をフィルタリングした信号などの復号ディジタル音信号を得て出力してもよい。
[ケースD]
 復号部222-mは、“音信号を表す符号列が無いことを表す情報”である場合には、符号の復号はせずに、復号ディジタル音信号は出力しない。なお、この場合には、復号部222-mは、無音であることに対応する復号ディジタル音信号、すなわち、全てのサンプルの振幅が0である復号ディジタル音信号を1個または2個得て出力してもよい。また、この場合には、復号部222-mは、所定の規則により発生させた背景雑音信号に対応する復号ディジタル音信号、例えば、振幅が小さい白色雑音やその白色雑音をフィルタリングした信号などの復号ディジタル音信号を1個または2個得て出力してもよい。
 なお、復号部222-mは、第1の復号方式としては、音信号固定送信側装置210-mの符号化部212-mと音信号移動送信側装置310-nの符号化部312-nで用いた第1の符号化方式に対応する復号方式を用いる。また、復号部222-mは、第2の復号方式としては、音信号固定送信側装置210-mの符号化部212-mで用いた第2の符号化方式に対応する復号方式を用いる。
<再生部223-m>
 音信号固定受信側装置220-mの再生部223-mは、入力された1個または2個の復号ディジタル音信号に対応する音を出力する(ステップS223)。復号ディジタル音信号が入力されなかった場合には、音を出力しない。
 再生部223-mは、例えば、2個のDA変換部と2個のスピーカを含む。DA変換部は、入力された復号ディジタル音信号をアナログの電気信号に変換して出力する。スピーカは、DA変換部から入力されたアナログの電気信号に対応する音を発生する。スピーカは、ステレオヘッドフォンやステレオイヤホンに備えられたものであってもよい。この場合には、例えば、再生部223-mは、2個の復号ディジタル音信号が入力された場合には、DA変換部とスピーカを一対一に対応付けて、2個の復号ディジタル音信号それぞれに対応する音を2個のスピーカそれぞれから発生する。また、再生部223-mは、1個の復号ディジタル音信号が入力された場合には、1個のDA変換部を用いて1個のアナログの電気信号を得て、得た1個のアナログの電気信号を1個または2個のスピーカに入力して1個または2個のスピーカから音を発生する。もちろん、2個の復号ディジタル音信号が入力された場合でも、DA変換部が得た2個のアナログの電気信号を混合して1個または2個のスピーカに入力して1個または2個のスピーカから音を発生するようにしてもよいし、スピーカを1個のみ備えるようにしてもよい。すなわち、再生部223-mは、入力された全ての復号ディジタル音信号に対応する音を発生するようにすれば、どのような構成であってもよい。
≪移動通信端末装置300-n≫
 それぞれの移動通信端末装置300-nは、例えば携帯電話機であり、図3に示す通り、音信号移動送信側装置310-nと音信号移動受信側装置320-nを含む。音信号移動送信側装置310-nは収音部311-nと符号化部312-nと送出符号生成部313-nを含む。音信号移動受信側装置320-nは入力符号分離部321-nと復号部322-nと再生部323-nを含む。
 移動通信端末装置300-nの音信号移動送送信側装置310-nは、図12及び以下に例示するステップS311からステップS313の処理を行い、移動通信端末装置300-nの音信号移動受信側装置320-mは、図13及び以下に例示するステップS321からステップS323の処理を行う。
<<音信号移動送信側装置310-n>>
 音信号移動送信側装置310-nは、フレームごとに、1個のチャンネルのディジタル音信号に対応する符号を含むビット列である移動端末送出ビット列を得て、移動伝送路500-nに出力する。すなわち、音信号移動送信側装置310-nは移動端末送出ビット列を移動伝送路500-nを介して多地点制御装置100に対して出力する。
<収音部311-n>
 音信号移動送信側装置310-nの収音部311-nは、1個のマイクロホンと1個のAD変換部を含む。マイクロホンは、マイクロホンの周辺の空間領域で発生した音を収音してアナログの電気信号に変換してAD変換部に出力する。AD変換部は、入力されたアナログの電気信号を例えばサンプリング周波数が8kHzのPCM信号であるディジタル音信号に変換して出力する。すなわち、収音部311-nは、1個のマイクロホンで収音した音に対応する1個のチャンネルのディジタル音信号を音信号移動送信側装置310-nの符号化部312-nに出力する(ステップS311)。
<符号化部312-n>
 音信号移動送信側装置310-nの符号化部312-nは、フレームごとに、収音部311-nから入力された1個のチャンネルのディジタル音信号を上述した第1の符号化方式で符号化してモノラル符号を得て、得たモノラル符号を音信号移動送信側装置310-nの送出符号生成部313-nに出力する(ステップS312)。
<送出符号生成部313-n>
 音信号移動送信側装置310-nの送出符号生成部313-nは、フレームごとに、入力されたモノラル符号を音信号を表す符号として含む移動端末送出ビット列を得て移動伝送路500-nに出力する(ステップS313)。
 なお、移動端末送出ビット列には、その移動端末送出ビット列を得た端末装置を特定する情報、その移動端末送出ビット列が対応するフレームを特定する情報、そのフレームが有音であるか無音であるか(例えば、そのフレームのディジタル音信号のパワーが所定の閾値以上であるか否か)を特定する情報、移動端末送出ビット列に含まれる各符号の移動端末送出ビット列内での位置を特定する情報、などの補助情報を含めてもよいし、音信号を表す符号列がどのような符号を含むのかを表す符号情報を表す符号である制御符号を含めてもよい。また、音信号移動送信側装置310-nが送出符号生成部313-nを備えないようにして、符号化部312-nがモノラル符号を音信号を表す符号として含む移動端末送出ビット列を得て出力するようにしてもよい。
<<音信号移動受信側装置320-n>>
 音信号移動受信側装置320-nは、フレームごとに、移動伝送路500-nから入力された移動端末向けビット列に基づく音を出力する。ただし、入力された移動端末向けビット列次第では、音信号移動受信側装置320-nが音を出力しない場合もある。なお、移動伝送路500-nから入力された移動端末向けビット列は、多地点制御装置100が移動通信端末装置300-nに対して出力した移動端末向けビット列である。
<入力符号分離部321-n>
 音信号移動受信側装置320-nの入力符号分離部321-nは、フレームごとに、入力された移動端末向けビット列に含まれる音信号を表す符号列が含む1個のモノラル符号を音信号移動受信側装置320-nの復号部322-nに出力する(ステップS321)。ただし、入力符号分離部321-nは、入力された移動端末向けビット列に音信号を表す符号列が含まれない場合には、符号は出力しない。すなわち、入力符号分離部321-nは、フレームごとに、入力された移動端末向けビット列に音信号を表す符号列が含まれている場合には、入力された移動端末向けビット列に含まれる音信号を表す符号列が含む1個のモノラル符号を出力し、入力された移動端末向けビット列に音信号を表す符号列が含まれていない場合には、符号を出力しない。
<復号部322-n>
 音信号移動受信側装置320-nの復号部322-nは、フレームごとに、モノラル符号が入力された場合には、入力された1個のモノラル符号を上述した第1の復号方式で復号して1個の復号ディジタル音信号を得て、音信号移動受信側装置320-nの再生部323-nに出力する(ステップS322)。復号部322-nは、符号が入力されなかった場合には、復号部322-nは復号ディジタル音信号を出力しない。ただし、符号が入力されなかった場合には、復号部322-nは、無音であることに対応する復号ディジタル音信号、すなわち、全てのサンプルの振幅が0である復号ディジタル音信号を得て出力してもよい。また、符号が入力されなかった場合には、復号部322-nは、所定の規則により発生させた背景雑音信号に対応する復号ディジタル音信号、例えば、振幅が小さい白色雑音やその白色雑音をフィルタリングした信号などの復号ディジタル音信号を得て出力してもよい。
<再生部323-n>
 音信号移動受信側装置320-nの再生部323-nは、入力された1個の復号ディジタル音信号に対応する音を出力する(ステップS323)。復号ディジタル音信号が入力されなかった場合には、音を出力しない。
 再生部323-nは、例えば、1個以上のDA変換部と1個以上のスピーカを含む。DA変換部は、入力された復号ディジタル音信号をアナログの電気信号に変換して出力する。スピーカは、DA変換部から入力されたアナログの電気信号に対応する音を発生する。スピーカは、ヘッドセットやヘッドフォンやイヤホンに備えられたものであってもよい。スピーカとしてステレオヘッドフォンやステレオイヤホンなどの複数個のスピーカを用いる場合には、1個のDA変換部が出力したアナログの電気信号を複数個のスピーカに入力するようにしてもよいし、入力された1個の復号ディジタル音信号を複数個のDA変換部に入力して複数個のアナログの電気信号を得て複数個のスピーカに入力するようにしてもよい。すなわち、再生部323-nは、入力された1個の復号ディジタル音信号に対応する音を発生するようにすれば、どのような構成としてもよい。
<<多地点制御装置100>>
 多地点制御装置100は、図4に示す通り、地点選択部110とビット列生成部120を含む。多地点制御装置100は、図12及び以下に例示するステップS110からステップS120の処理を行う。多地点制御装置100には、固定伝送路400-mから固定端末送出ビット列が入力され、移動伝送路500-nから移動端末送出ビット列が入力される。すなわち、各固定通信端末装置200-mの音信号固定送信側装置210-mが出力した固定端末送出ビット列が各固定伝送路400-mを介して入力され、各移動通信端末装置300-nの音信号移動送信側装置310-nが出力した移動端末送出ビット列が各移動伝送路500-nを介して入力される。多地点制御装置100は、フレームごとに、入力された固定端末送出ビット列と移動端末送出ビット列とに基づいて、各固定通信端末装置200-mに対する固定端末向けビット列を生成して各固定伝送路400-mに出力し、各移動通信端末装置300-nに対する移動端末向けビット列を生成して各移動伝送路500-nに出力する。すなわち、多地点制御装置100は、フレームごとに、各固定通信端末装置200-mの音信号固定受信側装置220-mに対する固定端末向けビット列を生成して各固定伝送路400-mを介して各固定通信端末装置200-mの音信号固定受信側装置220-mに対して出力し、各移動通信端末装置300-nの音信号移動受信側装置320-nに対する移動端末向けビット列を生成して各移動伝送路500-nを介して各移動通信端末装置300-nの音信号移動受信側装置320-nに対して出力する。
<地点選択部110>
 地点選択部110には、多地点制御装置100に入力された固定端末送出ビット列と、多地点制御装置100に入力された移動端末送出ビット列と、が入力される。地点選択部110は、フレームごとに、多地点制御装置100に接続された全地点、すなわち、M個の固定通信端末装置とN個の移動通信端末装置、から1個または2個の地点を選択して、選択した地点を特定可能な情報を出力する(ステップS110)。地点選択部110は、予め定めた選択基準に基づいて地点を選択すればよく、選択基準としては、重要度合いが高い地点を選択できる基準を予め定めておき、地点選択部110が選択を実行できるようにしておけばよい。
 例えば、選択基準として音信号のパワーを用いるのであれば、地点選択部110は、フレームごとに、入力されたM個の固定端末送出ビット列に含まれるモノラル符号とN個の移動端末送出ビット列に含まれるモノラル符号のそれぞれからM+N個の復号ディジタル音信号それぞれのパワーを表す情報を得て、M+N個の復号ディジタル音信号のうちのパワーが最大である復号ディジタル音信号に対応する端末装置を特定可能な情報と、M+N個の復号ディジタル音信号のうちのパワーが2番目に大きくかつ所定の閾値以上である復号ディジタル音信号に対応する端末装置を特定可能な情報と、を得て、選択地点情報としてビット列生成部120に出力する。閾値は、例えば、復号ディジタル音信号が背景雑音のみを含むと想定される場合のパワーより大きな値などであり、予め実験等により定めておけばよい。これにより、地点選択部110は、多地点制御装置100に接続された全地点から1個または2個の地点を選択して、選択した地点を特定可能な情報を出力することになる。
 例えば、地点選択部110は、復号ディジタル音信号のパワーが最大である端末装置が固定通信端末装置200-1であれば、固定通信端末装置200-1を特定可能な情報として“Fix-1”という情報を得ればよい。また、例えば、地点選択部110は、復号ディジタル音信号のパワーが2番目に大きくかつ所定の閾値以上である端末装置が移動通信端末装置300-2であれば、移動通信端末装置300-2を特定可能な情報として“Mobile-2”という情報も得ればよい。すなわち、地点選択部110は、下記のケース1からケース5の何れかの情報を選択地点情報として出力する。
ケース1:“Fix-M”(ただし、Mは1以上M以下の何れか1つの整数。)
ケース2:“Mobile-N”(ただし、Nは1以上N以下の何れか1つの整数。)
ケース3:“Fix-M”と“Fix-M”の組(ただし、Mは1以上M以下の何れか1つの整数であり、Mは1以上M以下でありMとは異なる何れか1つの整数。)
ケース4:“Fix-M”と“Mobile-N”の組(ただし、Mは1以上M以下の何れか1つの整数であり、Nは1以上N以下の何れか1つの整数。)
ケース5:“Mobile-N”と“Mobile-N”の組(ただし、Nは1以上N以下の何れか1つの整数であり、Nは1以上N以下でありNとは異なる何れか1つの整数。)
 なお、各復号ディジタル音信号のパワーを表す情報は、入力されたM個の固定端末送出ビット列とN個の移動端末送出ビット列のそれぞれから周知の方法で得ればよい。例えば、地点選択部110は、フレームごとに、入力されたM個の固定端末送出ビット列に含まれるモノラル符号とN個の移動端末送出ビット列に含まれるモノラル符号のそれぞれを上述した第1の復号方式で復号してM+N個の復号ディジタル音信号を得て、得たM+N個の復号ディジタル音信号それぞれのパワーを計算してパワーを表す情報として得てもよい。また例えば、地点選択部110は、フレームごとに、入力されたM個の固定端末送出ビット列に含まれるモノラル符号に含まれるパワーを表す符号とN個の移動端末送出ビット列に含まれるモノラル符号に含まれるパワーを表す符号のそれぞれが表す値をパワーを表す情報として得てもよい。
 また、固定端末送出ビット列と移動端末送出ビット列のそれぞれにそのフレームが有音であるか無音であるかを特定する情報が含まれている場合には、地点選択部110は、フレームごとに、入力されたM+N個の有音であるか無音であるかを特定する情報を用いて周知の方法により1個または2個の端末装置を選択して、選択した端末装置を特定可能な情報を選択地点情報としてビット列生成部120に出力してもよい。
<ビット列生成部120>
 ビット列生成部120には、多地点制御装置100に入力された固定端末送出ビット列と、多地点制御装置100に入力された移動端末送出ビット列と、地点選択部110が出力した選択地点情報と、が入力される。ビット列生成部120は、フレームごとに、入力された選択地点情報に基づいて、入力された固定端末送出ビット列と入力された移動端末送出ビット列を用いて、各固定通信端末装置200-mに対して出力する固定端末向けビット列と各移動通信端末装置300-nに対して出力する移動端末向けビット列を生成して出力する(ステップS120)。具体的には、ビット列生成部120はフレームごとに下記の何れかの処理を行う。
[選択地点情報がケース1の情報である場合]
 ビット列生成部120は、選択地点情報が“Fix-M”という情報である場合には、下記の3通りのビット列を生成して出力する。図5は、この場合の音信号を表す符号列を模式的に示した図である。
 なお、図5及び後述する図6から図9では、固定通信端末装置200-mが出力した固定端末送出ビット列に含まれるモノラル符号と拡張符号をそれぞれCFMとCFEと表記し、移動通信端末装置300-nが出力した移動端末送出ビット列に含まれるモノラル符号をCMMnと表記してある。
 ビット列生成部120が出力する1通り目のビット列は、音信号を表す符号列を含まない固定端末向けビット列である。選択地点情報が“Fix-M”であるということは、各端末装置で必要な音は固定通信端末装置200-Mが収音した音のみである。しかし、固定通信端末装置200-Mには固定通信端末装置200-Mが収音した音は存在しているので、多地点制御装置100が固定通信端末装置200-Mに対して固定通信端末装置200-Mが収音した音を伝える必要は無い。そこで、ビット列生成部120は、音信号を表す符号列を含まない固定端末向けビット列を生成して固定通信端末装置200-Mに対して出力する。具体的には、ビット列生成部120は、音信号を表す符号列を含まず、符号情報が“音信号を表す符号列が無いことを表す情報”であることを表す制御符号を含む、固定端末向けビット列を生成して固定通信端末装置200-Mが接続された固定伝送路400-Mに出力する。
 ビット列生成部120が出力する2通り目のビット列は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と拡張符号CFEM1を音信号を表す符号として含む固定端末向けビット列である。上述した通り、選択地点情報が“Fix-M”であるということは、各端末装置で必要な音は固定通信端末装置200-Mが収音した音のみである。従って、固定通信端末装置200-M以外の各固定通信端末装置200-melse(melseは、1以上M以下でありMとは異なる各整数)では固定通信端末装置200-Mが収音した音を可能な限り高品質に出力するのが好ましい。そこで、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と拡張符号CFEM1を音信号を表す符号として含む固定端末向けビット列を生成して、各固定通信端末装置200-melseに対して出力する。具体的には、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と拡張符号CFEM1を音信号を表す符号として含み、符号情報が“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”であることを表す制御符号を含む、固定端末向けビット列を生成して、各固定通信端末装置200-melseが接続された各固定伝送路400-melseに出力する。すなわち、固定通信端末装置200-melse向けの固定端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CFMM1と拡張符号CFEM1が音信号を表す符号として含まれる。
 ビット列生成部120が出力する3通り目のビット列は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1を音信号を表す符号として含む移動端末向けビット列である。上述した通り、選択地点情報が“Fix-M”であるということは、各端末装置で必要な音は固定通信端末装置200-Mが収音した音のみである。従って、各移動通信端末装置300-n(nは、1以上N以下の各整数)では固定通信端末装置200-Mが収音した音を可能な限り高品質に出力するのが好ましい。しかし、多地点制御装置100と各移動通信端末装置300-nを介する移動伝送路500-nの通信容量は、1個のモノラル符号に加えて拡張符号も送れるほど大きくない。そこで、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1を音信号を表す符号として含む移動端末向けビット列を生成して、各移動通信端末装置300-nに対して出力する、すなわち、各移動通信端末装置300-nが接続された各移動伝送路500-nに出力する。すなわち、移動通信端末装置300-n向けの移動端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CFMM1が音信号を表す符号として含まれる。
[選択地点情報がケース2の情報である場合]
 ビット列生成部120は、選択地点情報が“Mobile-N”という情報である場合には、下記の3通りのビット列を生成して出力する。図6は、この場合の音信号を表す符号列を模式的に示した図である。
 ビット列生成部120が出力する1通り目のビット列は、音信号を表す符号列を含まない移動端末向けビット列である。選択地点情報が“Mobile-N”であるということは、各端末装置で必要な音は移動通信端末装置300-Nが収音した音のみである。しかし、移動通信端末装置300-Nには移動通信端末装置300-Nが収音した音は存在しているので、多地点制御装置100が移動通信端末装置300-Nに対して移動通信端末装置300-Nが収音した音を伝える必要は無い。そこで、ビット列生成部120は、音信号を表す符号列を含まない移動端末向けビット列を生成して移動通信端末装置300-Nに対して出力する、すなわち、移動通信端末装置300-Nが接続された移動伝送路500-Nに出力する。
 ビット列生成部120が出力する2通り目のビット列は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を音信号を表す符号として含む移動端末向けビット列である。上述した通り、選択地点情報が“Mobile-N”であるということは、各端末装置で必要な音は移動通信端末装置300-Nが収音した音のみである。従って、移動通信端末装置300-N以外の各移動通信端末装置300-nelse(nelseは、1以上N以下でありNとは異なる各整数)では移動通信端末装置300-Nが収音した音を可能な限り高品質に出力するのが好ましい。そこで、ビット列生成部120は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を音信号を表す符号として含む移動端末向けビット列を生成して、各移動通信端末装置300-nelseに対して出力する、すなわち、各移動通信端末装置300-nelseが接続された各移動伝送路500-nelseに出力する。すなわち、移動通信端末装置300-nelse向けの移動端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CMMN1が音信号を表す符号として含まれる。
 ビット列生成部120が出力する3通り目のビット列は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を音信号を表す符号として含む固定端末向けビット列である。上述した通り、選択地点情報が“Mobile-N”であるということは、各端末装置で必要な音は移動通信端末装置300-Nが収音した音のみである。従って、各固定通信端末装置200-m(mは、1以上M以下の各整数)では移動通信端末装置300-Nが収音した音を可能な限り高品質に出力するのが好ましい。ただし、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれる音信号を表す符号はモノラル符号CMMN1のみであり、移動通信端末装置300-Nが出力した移動端末送出ビット列には拡張符号は含まれない。そこで、ビット列生成部120は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を音信号を表す符号として含む固定端末向けビット列を生成して、各固定通信端末装置200-mに対して出力する。具体的には、ビット列生成部120は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を音信号を表す符号として含み、符号情報が“音信号を表す符号列が含む符号が1個のモノラル符号であることを表す情報”であることを表す制御符号を含む、固定端末向けビット列を生成して、各固定通信端末装置200-mが接続された各固定伝送路400-mに出力する。すなわち、固定通信端末装置200-m向けの固定端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CMMN1が音信号を表す符号として含まれる。
[選択地点情報がケース3の情報である場合]
 ビット列生成部120は、選択地点情報が“Fix-M”と“Fix-M”という情報である場合には、下記の4通りのビット列を生成して出力する。ただし、M=2の場合には、下記の3通り目のビット列を生成して出力する必要は無いため、下記の1通り目と2通り目と4通り目の3通りのビット列を生成して出力する。図7は、この場合の音信号を表す符号列を模式的に示した図である。
 ビット列生成部120が出力する1通り目のビット列は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM2と拡張符号CFEM2を音信号を表す符号として含む固定端末向けビット列である。選択地点情報が“Fix-M”と“Fix-M”であるということは、各端末装置で必要な音は固定通信端末装置200-Mが収音した音と固定通信端末装置200-Mが収音した音である。しかし、固定通信端末装置200-Mには固定通信端末装置200-Mが収音した音は存在しているので、多地点制御装置100が固定通信端末装置200-Mに対して固定通信端末装置200-Mが収音した音を伝える必要は無い。従って、固定通信端末装置200-Mでは固定通信端末装置200-Mが収音した音を可能な限り品質に出力するのが好ましい。そこで、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM2と拡張符号CFEM2を音信号を表す符号として含む固定端末向けビット列を生成して、固定通信端末装置200-Mに対して出力する。具体的には、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM2と拡張符号CFEM2を音信号を表す符号として含み、符号情報が“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”であることを表す制御符号を含む、固定端末向けビット列を生成して、固定通信端末装置200-Mが接続された固定伝送路400-Mに出力する。すなわち、固定通信端末装置200-M向けの固定端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CFMM2と拡張符号CFEM2が音信号を表す符号として含まれる。
 ビット列生成部120が出力する2通り目のビット列は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と拡張符号CFEM1を音信号を表す符号として含む固定端末向けビット列である。上述した通り、選択地点情報が“Fix-M”と“Fix-M”であるということは、各端末装置で必要な音は固定通信端末装置200-Mが収音した音と固定通信端末装置200-Mが収音した音である。しかし、固定通信端末装置200-Mには固定通信端末装置200-Mが収音した音は存在しているので、多地点制御装置100が固定通信端末装置200-Mに対して固定通信端末装置200-Mが収音した音を伝える必要は無い。従って、固定通信端末装置200-Mでは固定通信端末装置200-Mが収音した音を可能な限り高品質に出力するのが好ましい。そこで、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と拡張符号CFEM1を音信号を表す符号として含む固定端末向けビット列を生成して、固定通信端末装置200-Mに対して出力する。具体的には、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と拡張符号CFEM1を音信号を表す符号として含み、符号情報が“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”であることを表す制御符号を含む、固定端末向けビット列を生成して、固定通信端末装置200-Mが接続された固定伝送路400-Mに出力する。すなわち、固定通信端末装置200-M向けの固定端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CFMM1と拡張符号CFEM1が音信号を表す符号として含まれる。
 ビット列生成部120が出力する3通り目のビット列は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM2とを音信号を表す符号として含む固定端末向けビット列である。上述した通り、選択地点情報が“Fix-M”と“Fix-M”であるということは、各端末装置で必要な音は固定通信端末装置200-Mが収音した音と固定通信端末装置200-Mが収音した音である。従って、固定通信端末装置200-Mでも固定通信端末装置200-Mでもない各固定通信端末装置200-melse(melseは、1以上M以下でありMともMとも異なる各整数)では固定通信端末装置200-Mが収音した音と固定通信端末装置200-Mが収音した音とを可能な限り高品質に出力するのが好ましい。しかし、多地点制御装置100と各固定通信端末装置200-melseを介する固定伝送路400-melseの通信容量は、2個のモノラル符号に加えて拡張符号も送れるほど大きくない。また、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と拡張符号CFEM1を復号して2チャンネルの復号ディジタル音信号を得て、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM2と拡張符号CFEM2を復号して2チャンネルの復号ディジタル音信号を得て、2チャンネルそれぞれについて2個の復号ディジタル音信号を混合してから符号化してモノラル符号と拡張符号を得れば、多地点制御装置100と各固定通信端末装置200-melseを介する固定伝送路400-melseの通信容量に収まる1組のモノラル符号と拡張符号とすることができるが、符号化と復号の組がタンデム接続になってしまうため、音質が劣化してしまう。そこで、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM2とを音信号を表す符号として含む固定端末向けビット列を生成して、固定通信端末装置200-melseに対して出力する。具体的には、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM2とを音信号を表す符号として含み、符号情報が“音信号を表す符号列が含む符号が2個のモノラル符号であることを表す情報”であることを表す制御符号を含む、固定端末向けビット列を生成して、各固定通信端末装置200-melseが接続された各固定伝送路400-melseに出力する。すなわち、固定通信端末装置200-melse向けの固定端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CFMM1とモノラル符号CFMM2が音信号を表す符号として含まれる。
 ビット列生成部120が出力する4通り目のビット列は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM2のそれぞれを復号して得た復号ディジタル音信号を混合してから符号化して得たモノラル符号CTMM1M2を音信号を表す符号として含む移動端末向けビット列である。上述した通り、選択地点情報が“Fix-M”と“Fix-M”であるということは、各端末装置で必要な音は固定通信端末装置200-Mが収音した音と固定通信端末装置200-Mが収音した音である。従って、各移動通信端末装置300-n(nは、1以上N以下の各整数)では固定通信端末装置200-Mが収音した音と固定通信端末装置200-Mが収音した音とを可能な限り高品質に出力するのが好ましい。しかし、多地点制御装置100と各移動通信端末装置300-nを介する移動伝送路500-nの通信容量は、2個のモノラル符号を送れるほど大きくない。そうすると、各移動通信端末装置300-nでは、固定通信端末装置200-Mが収音した音と固定通信端末装置200-Mが収音した音とを、音質が劣化してしまったとしても最低限出力できるようにするのが望ましい。そこで、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1を復号して第1の復号ディジタル音信号を得て、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM2を復号して第2の復号ディジタル音信号を得て、第1の復号ディジタル音信号と第2の復号ディジタル音信号の対応するサンプル同士の平均値による系列を得るなどによって第1の復号ディジタル音信号と第2の復号ディジタル音信号を混合して混合ディジタル音信号を得て、混合ディジタル音信号を上述した第1の符号化方式で符号化してモノラル符号CTMM1M2を得て、混合ディジタル音信号から得たモノラル符号CTMM1M2を音信号を表す符号として含む移動端末向けビット列を生成して、各移動通信端末装置300-nに対して出力する、すなわち、各移動通信端末装置300-nが接続された各移動伝送路500-nに出力する。すなわち、移動通信端末装置300-n向けの移動端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CTMM1M2が音信号を表す符号として含まれる。
 なお、地点選択部110がM+N個の復号ディジタル音信号を得た場合には、第1の復号ディジタル音信号と第2の復号ディジタル信号は、地点選択部110が得たM+N個の復号ディジタル音信号のうちの2個と同じであるので、ビット列生成部120がモノラル符号を復号して復号ディジタル音信号を得ることに代えて、地点選択部110が得た復号ディジタル音信号を地点選択部110がビット列生成部120に出力して、ビット列生成部120では地点選択部110から入力された復号ディジタル音信号を用いるようにしてもよい。
[選択地点情報がケース4の情報である場合]
 ビット列生成部120は、選択地点情報が“Fix-M”と“Mobile-N”という情報である場合には、下記の4通りのビット列を生成して出力する。図8は、この場合の音信号を表す符号列を模式的に示した図である。
 ビット列生成部120が出力する1通り目のビット列は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を音信号を表す符号として含む固定端末ビット列である。選択地点情報が“Fix-M”と“Mobile-N”であるということは、各端末装置で必要な音は固定通信端末装置200-Mが収音した音と移動通信端末装置300-Nが収音した音である。しかし、固定通信端末装置200-Mには固定通信端末装置200-Mが収音した音は存在しているので、多地点制御装置100が固定通信端末装置200-Mに対して固定通信端末装置200-Mが収音した音を伝える必要は無い。従って、固定通信端末装置200-Mでは移動通信端末装置300-Nが収音した音を可能な限り高品質に出力するのが好ましい。ただし、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれる音信号を表す符号はモノラル符号CMMN1のみであり、移動通信端末装置300-Nが出力した移動端末送出ビット列には拡張符号は含まれない。そこで、ビット列生成部120は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を音信号を表す符号として含む固定端末向けビット列を生成して、固定通信端末装置200-Mに対して出力する。具体的には、ビット列生成部120は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を音信号を表す符号として含み、符号情報が“音信号を表す符号列が含む符号が1個のモノラル符号であることを表す情報”であることを表す制御符号を含む、固定端末向けビット列を生成して、固定通信端末装置200-Mが接続された固定伝送路400-Mに出力する。すなわち、固定通信端末装置200-M向けの固定端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CMMN1が音信号を表す符号として含まれる。
 ビット列生成部120が出力する2通り目のビット列は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1を音信号を表す符号として含む移動端末向けビット列である。上述した通り、選択地点情報が“Fix-M”と“Mobile-N”であるということは、各端末装置で必要な音は固定通信端末装置200-Mが収音した音と移動通信端末装置300-Nが収音した音である。しかし、移動通信端末装置300-Nには移動通信端末装置300-Nが収音した音は存在しているので、多地点制御装置100が移動通信端末装置300-Nに対して移動通信端末装置300-Nが収音した音を伝える必要は無い。従って、移動通信端末装置300-Nでは固定通信端末装置200-Mが収音した音を可能な限り高品質に出力するのが好ましい。しかし、多地点制御装置100と移動通信端末装置300-Nを介する移動伝送路500-Nの通信容量は、1個のモノラル符号に加えて拡張符号も送れるほど大きくない。そこで、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1を音信号を表す符号として含む移動端末向けビット列を生成して、移動通信端末装置300-Nに対して出力する、すなわち、移動通信端末装置300-Nが接続された移動伝送路500-Nに出力する。すなわち、移動通信端末装置300-N向けの移動端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CFMM1が音信号を表す符号として含まれる。
 ビット列生成部120が出力する3通り目のビット列は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1とを音信号を表す符号として含む固定端末向けビット列である。上述した通り、選択地点情報が“Fix-M”と“Mobile-N”であるということは、各端末装置で必要な音は固定通信端末装置200-Mが収音した音と移動通信端末装置300-Nが収音した音である。従って、固定通信端末装置200-M以外の各固定通信端末装置200-melse(melseは、1以上M以下でありMとは異なる各整数)では固定通信端末装置200-Mが収音した音と移動通信端末装置300-Nが収音した音とを可能な限り高品質に出力するのが好ましい。ただし、多地点制御装置100と各固定通信端末装置200-melseを介する固定伝送路400-melseの通信容量は、2個のモノラル符号に加えて拡張符号も送れるほど大きくない。また、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と拡張符号CFEM1を復号して2チャンネルの復号ディジタル音信号を得て、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を復号してモノラルの復号ディジタル音信号を得て、2チャンネルのうちの一方のチャンネルの復号ディジタル音信号とモノラルの復号音ディジタル音信号を混合し、2チャンネルのうちのもう一方のチャンネルの復号ディジタル音信号とモノラルの復号音ディジタル音信号を混合してから符号化してモノラル符号と拡張符号を得れば、多地点制御装置100と各固定通信端末装置200-melseを介する固定伝送路400-melseの通信容量に収まる1組のモノラル符号と拡張符号とすることができるが、符号化と復号の組がタンデム接続になってしまうため、音質が劣化してしまう。そこで、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1とを音信号を表す符号として含む固定端末向けビット列を生成して、固定通信端末装置200-melseに対して出力する。具体的には、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1とを音信号を表す符号として含み、符号情報が“音信号を表す符号列が含む符号が2個のモノラル符号であることを表す情報”であること表す制御符号を含む、固定端末向けビット列を生成して、各固定通信端末装置200-melseが接続された各固定伝送路400-melseに出力する。すなわち、固定通信端末装置200-melse向けの固定端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CFMM1とモノラル符号CMMN1が音信号を表す符号として含まれる。
 ビット列生成部120が出力する4通り目のビット列は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1と移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1のそれぞれを復号して得た復号ディジタル音信号を混合してから符号化して得たモノラル符号CTMM1N1を音信号を表す符号として含む移動端末向けビット列である。上述した通り、選択地点情報が“Fix-M”と“Mobile-N”であるということは、各端末装置で必要な音は固定通信端末装置200-Mが収音した音と移動通信端末装置300-Nが収音した音である。従って、移動通信端末装置300-N以外の各移動通信端末装置300-nelse(nelseは、1以上N以下でありNとは異なる各整数)では固定通信端末装置200-Mが収音した音と移動通信端末装置300-Nが収音した音とを可能な限り高品質に出力するのが好ましい。しかし、多地点制御装置100と各移動通信端末装置300-nelseを介する移動伝送路500-nelseの通信容量は、2個のモノラル符号を送れるほど大きくはない。そうすると、各移動通信端末装置300-nelseでは、固定通信端末装置200-Mが収音した音と移動通信端末装置300-Nが収音した音とを、音質が劣化してしまったとしても最低限出力できるようにするのが望ましい。そこで、ビット列生成部120は、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれるモノラル符号CFMM1を復号して第1の復号ディジタル音信号を得て、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を復号して第2の復号ディジタル音信号を得て、第1の復号ディジタル音信号と第2の復号ディジタル音信号の対応するサンプル同士の平均値による系列を得るなどによって第1の復号ディジタル音信号と第2の復号ディジタル音信号を混合して混合ディジタル音信号を得て、混合ディジタル音信号を上述した第1の符号化方式で符号化してモノラル符号CTMM1N1を得て、混合ディジタル音信号から得たモノラル符号CTMM1N1を音信号を表す符号として含む移動端末向けビット列を生成して、移動通信端末装置300-nelseに対して出力する、すなわち、各移動通信端末装置300-nelseが接続された各移動伝送路500-nelseに出力する。すなわち、移動通信端末装置300-nelse向けの移動端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CTMM1N1が音信号を表す符号として含まれる。
 なお、地点選択部110がM+N個の復号ディジタル音信号を得た場合には、第1の復号ディジタル音信号と第2の復号ディジタル信号は、地点選択部110が得たM+N個の復号ディジタル音信号のうちの2個と同じであるので、ビット列生成部120がモノラル符号を復号して復号ディジタル音信号を得ることに代えて、地点選択部110が得た復号ディジタル音信号を地点選択部110がビット列生成部120に出力して、ビット列生成部120では地点選択部110から入力された復号ディジタル音信号を用いるようにしてもよい。
[選択地点情報がケース5の情報である場合]
 ビット列生成部120は、選択地点情報が“Mobile-N”と“Mobile-N”という情報である場合には、下記の4通りの何れかであるビット列を生成して出力する。ただし、N=2の場合には、下記の3通り目のビット列を生成して出力する必要は無いため、下記の1通り目と2通り目と4通り目の3通りのビット列を生成して出力する。図9は、この場合の音信号を表す符号列を模式的に示した図である。
 ビット列生成部120が出力する1通り目のビット列は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN2を音信号を表す符号として含む移動端末向けビット列である。選択地点情報が“Mobile-N”と“Mobile-N”であるということは、各端末装置で必要な音は移動通信端末装置300-Nが収音した音と移動通信端末装置300-Nが収音した音である。しかし、移動通信端末装置300-Nには移動通信端末装置300-Nが収音した音は存在しているので、多地点制御装置100が移動通信端末装置300-Nに対して移動通信端末装置300-Nが収音した音を伝える必要は無い。従って、移動通信端末装置300-Nでは移動通信端末装置300-Nが収音した音を可能な限り高品質に出力するのが好ましい。そこで、ビット列生成部120は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN2を音信号を表す符号として含む移動端末向けビット列を生成して、移動通信端末装置300-Nに対して出力する、すなわち、移動通信端末装置300-Nが接続された移動伝送路500-Nに出力する。すなわち、移動通信端末装置300-N向けの移動端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CMMN2が音信号を表す符号として含まれる。
 ビット列生成部120が出力する2通り目のビット列は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を音信号を表す符号として含む移動端末向けビット列である。上述した通り、選択地点情報が“Mobile-N”と“Mobile-N”であるということは、各端末装置で必要な音は移動通信端末装置300-Nが収音した音と移動通信端末装置300-Nが収音した音である。しかし、移動通信端末装置300-Nには移動通信端末装置300-Nが収音した音は存在しているので、多地点制御装置100が移動通信端末装置300-Nに対して移動通信端末装置300-Nが収音した音を伝える必要は無い。従って、移動通信端末装置300-Nでは移動通信端末装置300-Nが収音した音を可能な限り高品質に出力するのが好ましい。そこで、ビット列生成部120は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を音信号を表す符号として含む移動端末向けビット列を生成して、移動通信端末装置300-Nに対して出力する、すなわち、移動通信端末装置300-Nが接続された移動伝送路500-Nに出力する。すなわち、移動通信端末装置300-N向けの移動端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CMMN1が音信号を表す符号として含まれる。
 ビット列生成部120が出力する3通り目のビット列は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1と移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN2のそれぞれを復号して得た復号ディジタル音信号を混合してから符号化して得たモノラル符号CTMN1N2を音信号を表す符号として含む移動端末向けビット列である。上述した通り、選択地点情報が“Mobile-N”と“Mobile-N”であるということは、各端末装置で必要な音は移動通信端末装置300-Nが収音した音と移動通信端末装置300-Nが収音した音である。従って、移動通信端末装置300-Nでも移動通信端末装置300-Nでもない各移動通信端末装置300-nelse(nelseは1以上N以下でありNともNとも異なる各整数)では移動通信端末装置300-Nが収音した音と移動通信端末装置300-Nが収音した音とを可能な限り高品質に出力するのが好ましい。しかし、多地点制御装置100と各移動通信端末装置300-nelseを介する移動伝送路500-nelseの通信容量は、2個のモノラル符号を送れるほど大きくない。そうすると、各移動通信端末装置300-nelseでは、移動通信端末装置300-Nが収音した音と移動通信端末装置300-Nが収音した音とを、音質が劣化してしまったとしても最低限出力できるようにするのが望ましい。そこで、ビット列生成部120は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1を復号して第1の復号ディジタル音信号を得て、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN2を復号して第2の復号ディジタル音信号を得て、第1の復号ディジタル音信号と第2の復号ディジタル音信号の対応するサンプル同士の平均値による系列を得るなどによって第1の復号ディジタル音信号と第2の復号ディジタル音信号を混合して混合ディジタル音信号を得て、混合ディジタル音信号を上述した第1の符号化方式で符号化してモノラル符号CTMN1N2を得て、混合ディジタル音信号から得たモノラル符号CTMN1N2を音信号を表す符号として含む移動端末向けビット列を生成して、各移動通信端末装置300-nelseに対して出力する、すなわち、各移動通信端末装置300-nelseが接続された各移動伝送路500-nelseに出力する。すなわち、移動通信端末装置300-nelse向けの移動端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CTMN1N2が音信号を表す符号として含まれる。
 なお、地点選択部110がM+N個の復号ディジタル音信号を得た場合には、第1の復号ディジタル音信号と第2の復号ディジタル信号は、地点選択部110が得たM+N個の復号ディジタル音信号のうちの2個と同じであるので、ビット列生成部120がモノラル符号を復号して復号ディジタル音信号を得ることに代えて、地点選択部110が得た復号ディジタル音信号を地点選択部110がビット列生成部120に出力して、ビット列生成部120では地点選択部110から入力された復号ディジタル音信号を用いるようにしてもよい。
 ビット列生成部120が出力する4通り目のビット列は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1と移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN2とを音信号を表す符号として含む固定端末向けビット列である。上述した通り、選択地点情報が“Mobile-N”と“Mobile-N”であるということは、各端末装置で必要な音は移動通信端末装置300-Nが収音した音と移動通信端末装置300-Nが収音した音である。従って、各固定通信端末装置200-m(mは1以上M以下の各整数)では移動通信端末装置300-Nが収音した音と移動通信端末装置300-Nが収音した音とを可能な限り高品質に出力するのが好ましい。そこで、ビット列生成部120は、移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN1と移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN2とを音信号を表す符号として含む固定端末向けビット列を生成して、固定通信端末装置200-mに対して出力する。具体的には、ビット列生成部120は、移動通信端末装置300-Nが出力した固定端末送出ビット列に含まれるモノラル符号CMMN1と移動通信端末装置300-Nが出力した移動端末送出ビット列に含まれるモノラル符号CMMN2とを音信号を表す符号として含み、符号情報が“音信号を表す符号列が含む符号が2個のモノラル符号であることを表す情報”であることを表す制御符号を含む、固定端末向けビット列を生成して、各固定通信端末装置200-mが接続された各固定伝送路400-mに出力する。すなわち、固定通信端末装置200-m向けの固定端末向けビット列に含まれる音信号を表す符号列には、モノラル符号CMMN1とモノラル符号CMMN2が音信号を表す符号として含まれる。
≪多地点電話接続システム10の動作≫
 次に、第一実施形態の多地点電話接続システム10のフレームごとの動作、すなわち、第一実施形態の多地点電話接続システム10がフレームごとに行う多地点電話接続方法を説明する。
 多地点電話接続システム10は、多地点制御装置100に各端末装置からビット列が伝えられるところまでは、後述する何れのケースの場合でも同じ動作をする。具体的には、後述する何れのケースの場合でも、各固定通信端末装置200-mは、収音した2個のチャンネルのディジタル音信号が混合された信号を第1の符号化方式で符号化してモノラル符号CFMを得て、収音した2個のチャンネルのディジタル音信号の差分に相当する情報を表す符号を拡張符号CFEとして得て、得たモノラル符号CFMと拡張符号CFEとを収音した2個のチャンネルのディジタル音信号を表す符号として多地点制御装置100に対して出力する。また、後述する何れのケースの場合でも、各移動通信端末装置300-nは、収音した1個のチャンネルのディジタル音信号を第1の符号化方式で符号化してモノラル符号CMMを得て、得たモノラル符号CMMを収音した1個のチャンネルのディジタル音信号を表す符号として多地点制御装置100に対して出力する。
 一方、多地点電話接続システム10は、多地点制御装置100に各端末装置からビット列が伝えられた後は、後述するケースごとに下記の動作をする。
[固定通信端末装置200-M(Mは1以上M以下の何れか1つの整数)のみが選択されるケース]
 選択基準として音信号のパワーを用いる上述した例であれば、M+N個の端末装置のうちの音信号のパワーが最大であるのが固定通信端末装置200-Mであり、パワーが2番目に大きい音信号はパワーが閾値より小さい場合がこのケースに該当する。
 このケースの場合には、多地点制御装置100の地点選択部110が上述したケース1の選択地点情報を出力し、多地点制御装置100のビット列生成部120が上述した[選択地点情報がケース1の情報である場合]の動作を行うことから、以降の各端末装置の動作も含めると、多地点電話接続システム10としては下記のように動作することになる。
・多地点制御装置100は、固定通信端末装置200-Mに対しては、音信号を表す符号を出力しない。固定通信端末装置200-Mは、音信号を表す符号を復号せずに、復号音信号を得ない。
・多地点制御装置100は、固定通信端末装置200-M以外の各固定通信端末装置200-melse(melseは1以上M以下でありMとは異なる各整数)に対しては、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号を表すモノラル符号CFMM1と拡張符号CFEM1を出力する。各固定通信端末装置200-melseは、多地点制御装置100が出力したモノラル符号CFMM1と拡張符号CFEM1から、上述したケースAの処理を行って、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号に対応する2チャンネルステレオの復号音信号を得る。
・多地点制御装置100は、各移動通信端末装置300-n(nは1以上N以下の各整数)に対しては、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号を表す符号のうちのモノラル符号CFMM1のみを出力する。各移動通信端末装置300-nは、多地点制御装置100が出力したモノラル符号CFMM1から、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号が混合されたモノラルの復号音信号を得る。
 なお、音声会議の例であれば、固定通信端末装置200-Mのみが発声地点であるフレームがこのケースに相当し、多地点電話接続システム10としては下記のように動作することになる。
・多地点制御装置100は、発声地点の固定通信端末装置200-Mに対しては、音信号を表す符号を出力しない。固定通信端末装置200-Mは、音信号を表す符号を復号せずに、復号音信号を得ない。
・多地点制御装置100は、発声地点以外の各固定通信端末装置200-Melseに対しては、発声地点の2チャンネルステレオの音信号を表すモノラル符号CFMM1と拡張符号CFEM1を出力する。発声地点以外の各固定通信端末装置200-Melseは、多地点制御装置100が出力したモノラル符号CFMM1と拡張符号CFEM1から、上述したケースAの処理を行って、発声地点の2チャンネルステレオの音信号に対応する音信号であり、符号化と復号の組がタンデム接続ではない音信号である、2チャンネルステレオの復号音信号を得る。
・多地点制御装置100は、各移動通信端末装置300-nに対しては、発声地点の2チャンネルステレオの音信号を表す符号のうちのモノラル符号CFMM1のみを出力する。各移動通信端末装置300-nは、多地点制御装置100が出力したモノラル符号CFMM1から、発声地点の2チャンネルステレオの音信号が混合された音信号であり、符号化と復号の組がタンデム接続ではない音信号である、モノラルの復号音信号を得る。
[移動通信端末装置300-N(Nは1以上N以下の何れか1つの整数)のみが選択されるケース]
 選択基準として音信号のパワーを用いる上述した例であれば、M+N個の端末装置のうちの音信号のパワーが最大であるのが移動通信端末装置300-Nであり、パワーが2番目に大きい音信号はパワーが閾値より小さい場合がこのケースに該当する。
 このケースの場合には、多地点制御装置100の地点選択部110が上述したケース2の選択地点情報を出力し、多地点制御装置100のビット列生成部120が上述した[選択地点情報がケース2の情報である場合]の動作を行うことから、以降の各端末装置の動作も含めると、多地点電話接続システム10としては下記のように動作することになる。
・多地点制御装置100は、移動通信端末装置300-Nに対しては、音信号を表す符号を出力しない。移動通信端末装置300-Nは、音信号を表す符号を復号せずに、復号音信号を得ない。
・多地点制御装置100は、移動通信端末装置300-N以外の各移動通信端末装置300-nelse(nelseは1以上N以下でありNとは異なる各整数)に対しては、移動通信端末装置300-Nが収音したモノラルの音信号を表すモノラル符号CMMN1を出力する。各移動通信端末装置300-nelseは、多地点制御装置100が出力したモノラル符号CMMN1から、移動通信端末装置300-Nが収音したモノラルの音信号に対応するモノラルの復号音信号を得る。
・多地点制御装置100は、各固定通信端末装置200-m(mは1以上M以下の各整数)に対しては、移動通信端末装置300-Nが収音したモノラルの音信号を表すモノラル符号CMMN1を出力する。各固定通信端末装置200-mは、多地点制御装置100が出力したモノラル符号CMMN1から、上述したケースCの処理を行って、移動通信端末装置300-Nが収音したモノラルの音信号に対応するモノラルの復号音信号を得る。
 なお、音声会議の例であれば、移動通信端末装置300-Nのみが発声地点であるフレームがこのケースに相当し、多地点電話接続システム10としては下記のように動作することになる。
・多地点制御装置100は、発声地点の移動通信端末装置300-Nに対しては、音信号を表す符号を出力しない。移動通信端末装置300-Nは、音信号を表す符号を復号せずに、復号音信号を得ない。
・多地点制御装置100は、発声地点以外の各移動通信端末装置300-nelseに対しては、発声地点のモノラルの音信号を表すモノラル符号CMMN1を出力する。発声地点以外の発声地点以外の各移動通信端末装置300-nelseは、多地点制御装置100が出力したモノラル符号CMMN1から、発声地点のモノラルの音信号に対応する音信号であり、符号化と復号の組がタンデム接続ではない音信号である、モノラルの復号音信号を得る。
・多地点制御装置100は、各固定通信端末装置200-mに対しては、発声地点のモノラルの音信号を表すモノラル符号CMMN1を出力する。各固定通信端末装置200-mは、多地点制御装置100が出力したモノラル符号CMMN1から、上述したケースCの処理を行って、発声地点のモノラルの音信号に対応する音信号であり、符号化と復号の組がタンデム接続ではない音信号である、モノラルの復号音信号を得る。
[固定通信端末装置200-M(Mは1以上M以下の何れか1つの整数)と固定通信端末装置200-M(Mは1以上M以下でありMとは異なる何れか1つの整数)が選択されるケース]
 選択基準として音信号のパワーを用いる上述した例であれば、M+N個の端末装置のうちの音信号のパワーが最大のものとパワーが2番目に大きく閾値以上であるものが、固定通信端末装置200-Mと固定通信端末装置200-Mである場合がこのケースに該当する。
 このケースの場合には、多地点制御装置100の地点選択部110が上述したケース3の選択地点情報を出力し、多地点制御装置100のビット列生成部120が上述した[選択地点情報がケース3の情報である場合]の動作を行うことから、以降の各端末装置の動作も含めると、多地点電話接続システム10としては下記のように動作することになる。
・多地点制御装置100は、固定通信端末装置200-Mに対しては、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号を表すモノラル符号CFMM2と拡張符号CFEM2を出力する。固定通信端末装置200-Mは、多地点制御装置100が出力したモノラル符号CFMM2と拡張符号CFEM2から、上述したケースAの処理を行って、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号に対応する2チャンネルステレオの復号音信号を得る。
・多地点制御装置100は、固定通信端末装置200-Mに対しては、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号を表すモノラル符号CFMM1と拡張符号CFEM1を出力する。固定通信端末装置200-Mは、多地点制御装置100が出力したモノラル符号CFMM1と拡張符号CFEM1から、上述したケースAの処理を行って、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号に対応する2チャンネルステレオの復号音信号を得る。
・多地点制御装置100は、固定通信端末装置200-Mでも固定通信端末装置200-Mでもない各固定通信端末装置200-melse(melseは1以上M以下でありMともMとも異なる各整数)に対しては、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号を表す符号のうちのモノラル符号CFMM1と固定通信端末装置200-Mが収音した2チャンネルステレオの音信号を表す符号のうちのモノラル符号CFMM2とを出力する。各固定通信端末装置200-melseは、多地点制御装置100が出力した2個のモノラル符号CFMM1とCFMM2から、上述したケースBの処理を行って、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号が混合されたモノラルの復号音信号と、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号が混合されたモノラルの復号音信号と、の計2個のチャンネルの復号音信号を得る。
・多地点制御装置100は、各移動通信端末装置300-n(nは1以上N以下の各整数)に対しては、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号を表す符号のうちのモノラル符号CFMM1を復号して得た音信号と固定通信端末装置200-Mが収音した2チャンネルステレオの音信号を表す符号のうちのモノラル符号CFMM1を復号して得た音信号とを混合してから符号化して得たモノラル符号CTMM1M2を出力する。各移動通信端末装置300-nは、多地点制御装置100が出力した1個のモノラル符号CTMM1M2から、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号と固定通信端末装置200-Mが収音した2チャンネルステレオの音信号が混合された音信号に対応する1個のモノラルの復号音信号を得る。
 なお、音声会議の例であれば、固定通信端末装置200-Mと固定通信端末装置200-Mの2地点が発声地点であるフレームがこのケースに相当し、多地点電話接続システム10としては下記のように動作することになる。
・多地点制御装置100は、発声地点の固定通信端末装置200-Mと固定通信端末装置200-Mのそれぞれに対しては、他方の発声地点の2チャンネルステレオの音信号を表すモノラル符号CFMMx(xは1または2)と拡張符号CFEMxを出力する。発声地点の固定通信端末装置200-Mと固定通信端末装置200-Mのそれぞれは、多地点制御装置100が出力したモノラル符号CFMMxと拡張符号CFEMxから、上述したケースAの処理を行って、他方の発声地点の2チャンネルステレオの音信号に対応する音信号であり、符号化と復号の組がタンデム接続ではない音信号である、2チャンネルステレオの復号音信号を得る。
・多地点制御装置100は、発声地点以外の各固定通信端末装置200-melseに対しては、2個の発声地点それぞれの2チャンネルステレオの音信号を表す符号のうちののモノラル符号CFMM1とCFMM2を出力する。発声地点以外の各固定通信端末装置200-melseは、多地点制御装置100が出力した2個のモノラル符号CFMM1とCFMM2から、上述したケースBの処理を行って、各発声地点の2チャンネルステレオの音信号が発声地点ごとに混合された音信号に対応する2個のモノラルの音信号であり、符号化と復号の組がタンデム接続ではない音信号である、計2個のチャンネルの復号音信号を得る。
・多地点制御装置100は、各移動通信端末装置300-nに対しては、2個の発声地点それぞれの2チャンネルステレオの音信号を表す符号のうちのモノラル符号CFMM1とCFMM2を復号して得た2個の音信号を混合して符号化して得た1個の音信号を表すモノラル符号CTMM1M2を出力する。各移動通信端末装置300-nは、多地点制御装置100が出力した1個のモノラル符号CTMM1M2から、2個の発声地点の全ての音信号が混合されたモノラルの音信号であり、符号化と復号の組がタンデム接続された音信号である、1個の復号音信号を得る。
[固定通信端末装置200-M(Mは1以上M以下の何れか1つの整数)と移動通信端末装置300-N(Nは1以上N以下の何れか1つの整数)が選択されるケース]
 選択基準として音信号のパワーを用いる上述した例であれば、M+N個の端末装置のうちの音信号のパワーが最大のものとパワーが2番目に大きく閾値以上であるものが、固定通信端末装置200-Mと移動通信端末装置300-Nである場合がこのケースに該当する。
 このケースの場合には、多地点制御装置100の地点選択部110が上述したケース4の選択地点情報を出力し、多地点制御装置100のビット列生成部120が上述した[選択地点情報がケース4の情報である場合]の動作を行うことから、以降の各端末装置の動作も含めると、多地点電話接続システム10としては下記のように動作することになる。
・多地点制御装置100は、固定通信端末装置200-Mに対しては、移動通信端末装置300-Nが収音したモノラルの音信号を表すモノラル符号CMMN1を出力する。固定通信端末装置200-Mは、多地点制御装置100が出力した1個のモノラル符号CMMN1から、上述したケースCの処理を行って、移動通信端末装置300-Nが収音したモノラルの音信号に対応するモノラルの復号音信号を得る。
・多地点制御装置100は、移動通信端末装置300-Nに対しては、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号を表す符号のうちのモノラル符号CFMM1を出力する。移動通信端末装置300-Nは、多地点制御装置100が出力した1個のモノラル符号CFMM1から、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号が混合されたモノラルの復号音信号を得る。
・多地点制御装置100は、固定通信端末装置200-Mではない各固定通信端末装置200-melse(melseは1以上M以下でありMとは異なる各整数)に対しては、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号を表す符号のうちのモノラル符号CFMM1と移動通信端末装置300-Nが収音したモノラルの音信号を表すモノラル符号CMMN1とを出力する。各固定通信端末装置200-melseは、多地点制御装置100が出力した2個のモノラル符号CFMM1とCMMN1から、上述したケースBの処理を行って、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号が混合されたモノラルの音信号と、移動通信端末装置300-Nが収音したモノラルの音信号に対応するモノラルの音信号と、の計2個のチャンネルの復号音信号を得る。
・多地点制御装置100は、移動通信端末装置300-Nではない各移動通信端末装置300-nelse(nelseは1以上N以下でありNとは異なる各整数)に対しては、固定通信端末装置200-Mが収音した2チャンネルステレオ音信号を表す符号のうちのモノラル符号CFMM1を復号して得た音信号と移動通信端末装置300-Nが収音したモノラルの音信号を表すモノラル符号CMMN1を復号して得た音信号とを混合してから符号化して得たモノラル符号CTMM1N1を出力する。各移動通信端末装置300-nelseは、多地点制御装置100が出力した1個のモノラル符号CTMM1N1から、固定通信端末装置200-Mが収音した2チャンネルステレオの音信号と移動通信端末装置300-Nが収音したモノラルの音信号が混合された音信号に対応する1個のモノラルの復号音信号を得る。
 なお、音声会議の例であれば、固定通信端末装置200-Mと移動通信端末装置300-Nの2地点が発声地点であるフレームがこのケースに相当し、多地点電話接続システム10としては下記のように動作することになる。
・多地点制御装置100は、発声地点の固定通信端末装置200-Mに対しては、他方の発声地点の音信号を表すモノラル符号CMMN1を出力する。発声地点の固定通信端末装置200-Mは、多地点制御装置100が出力した1個のモノラル符号CMMN1から、上述したケースCの処理を行って、他方の発声地点のモノラルの音信号に対応するモノラルの音信号であり、符号化と復号の組がタンデム接続ではない音信号である、モノラルの復号音信号を得る。
・多地点制御装置100は、発声地点の移動通信端末装置300-Nに対しては、他方の発声地点の2チャンネルステレオの音信号を表す符号のうちのモノラル符号CFMM1のみを出力する。移動通信端末装置300-Nは、多地点制御装置100が出力した1個のモノラル符号CFMM1から、他方の発声地点の2チャンネルステレオの音信号が混合された音信号であり、符号化と復号の組がタンデム接続ではない音信号である、モノラルの復号音信号を得る。
・多地点制御装置100は、発声地点以外の各固定通信端末装置200-melseに対しては、2個の発声地点の音信号を表す2個のモノラル符号CFMM1とCMMN1を出力する。すなわち、1つの発声地点の2チャンネルステレオの音信号を表す符号のうちのモノラル符号CFMM1と別の発声地点のモノラルの音信号を表すモノラル符号CMMN1を出力する。発声地点以外の各固定通信端末装置200-melseは、多地点制御装置100が出力した2個のモノラル符号CFMM1とCMMN1から、上述したケースBの処理を行って、2個の発声地点それぞれのモノラルの音信号に対応する音信号であり、符号化と復号の組がタンデム接続ではない音信号である、計2個のチャンネルの復号音信号を得る。2個の発声地点それぞれのモノラルの音信号に対応する音信号とは、1つの発声地点の2チャンネルステレオの音信号が混合された音信号に対応する音信号と、別の発声地点のモノラルの音信号に対応する音信号と、である。
・多地点制御装置100は、発声地点以外の各移動通信端末装置300-nelseに対しては、2個の発声地点のモノラル符号CFMM1とCMMN1を復号して得た音信号を混合して符号化して得た1個の音信号を表すモノラル符号CTMM1N1を出力する。発声地点以外の各移動通信端末装置300-nelseは、多地点制御装置100が出力した1個のモノラル符号CTMM1N1から、2個の発声地点の全ての音信号が混合されたモノラルの音信号であり、符号化と復号の組がタンデム接続され混合された音信号である、1個の復号音信号を得る。
[移動通信端末装置300-N(Nは1以上N以下の何れか1つの整数)と移動通信端末装置300-N(Nは1以上N以下でありNとは異なる何れか1つの整数)が選択されるケース]
 選択基準として音信号のパワーを用いる上述した例であれば、M+N個の端末装置のうちの音信号のパワーが最大のものとパワーが2番目に大きく閾値以上であるものが、移動通信端末装置300-N(Nは1以上N以下の何れか1つの整数)と移動通信端末装置300-N(Nは1以上N以下でありNとは異なる何れか1つの整数)である場合がこのケースに該当する。
 このケースの場合には、多地点制御装置100の地点選択部110が上述したケース5の選択地点情報を出力し、多地点制御装置100のビット列生成部120が上述した[選択地点情報がケース5の情報である場合]の動作を行うことから、以降の各端末装置の動作も含めると、多地点電話接続システム10としては下記のように動作することになる。
・多地点制御装置100は、移動通信端末装置300-Nに対しては、移動通信端末装置300-Nが収音したモノラルの音信号を表すモノラル符号CMMN2を出力する。移動通信端末装置300-Nは、多地点制御装置100が出力した1個のモノラル符号CMMN2から、移動通信端末装置300-Nが収音したモノラルの音信号に対応するモノラルの復号音信号を得る。
・多地点制御装置100は、移動通信端末装置300-Nに対しては、移動通信端末装置300-Nが収音したモノラルの音信号を表すモノラル符号CMMN1を出力する。移動通信端末装置300-Nは、多地点制御装置100が出力した1個のモノラル符号CMMN1から、移動通信端末装置300-Nが収音したモノラルの音信号に対応するモノラルの復号音信号を得る。
・多地点制御装置100は、移動通信端末装置300-Nでも移動通信端末装置300-Nでもない各移動通信端末装置300-nelse(nelseは1以上N以下でありNともNとも異なる各整数)に対しては、移動通信端末装置300-Nが収音したモノラルの音信号を表すモノラル符号CMMN1を復号して得た音信号と移動通信端末装置300-Nが収音したモノラルの音信号を表すモノラル符号CMMN2を復号して得た音信号とを混合してから符号化して得たモノラル符号CMMN1N2を出力する。各移動通信端末装置300-nelseは、多地点制御装置100が出力した1個のモノラル符号CMMN1N2から、移動通信端末装置300-Nが収音したモノラルの音信号と移動通信端末装置300-Nが収音したモノラルの音信号が混合された音信号に対応する1個のモノラルの復号音信号を得る。
・多地点制御装置100は、各固定通信端末装置200-m(mは1以上M以下の各整数)に対しては、移動通信端末装置300-Nが収音したモノラルの音信号を表すモノラル符号CMMN1と移動通信端末装置300-Nが収音したモノラルの音信号を表すモノラル符号CMMN2とを出力する。各固定通信端末装置200-mは、多地点制御装置100が出力した2個のモノラル符号CMMN1とCMMN2から、上述したケースBの処理を行って、移動通信端末装置300-Nが収音したモノラルの音信号に対応する音信号と、移動通信端末装置300-Nが収音したモノラルの音信号に対応する音信号と、の計2個のチャンネルの復号音信号を得る。
 なお、音声会議の例であれば、移動通信端末装置300-Nと移動通信端末装置300-Nの2地点が発声地点であるフレームがこのケースに相当し、多地点電話接続システム10としては下記のように動作することになる。
・多地点制御装置100は、発声地点の移動通信端末装置300-Nと移動通信端末装置300-Nのそれぞれに対しては、他方の発声地点のモノラルの音信号を表すモノラル符号CMMMx(xは1または2)を出力する。発声地点の移動通信端末装置300-Nと移動通信端末装置300-Nのそれぞれは、多地点制御装置100が出力した1個のモノラル符号CMMMxから、他方の発声地点のモノラルの音信号に対応する音信号であり、符号化と復号の組がタンデム接続ではない音信号である、モノラルの復号音信号を得る。
・多地点制御装置100は、発声地点以外の各移動通信端末装置300-nelseに対しては、2個の発声地点それぞれのモノラルの音信号を表すモノラル符号CMMM1とCMMM2を復号して得た音信号を混合して符号化して得た1個の音信号を表すモノラル符号CTMM1M2を出力する。発声地点以外の各移動通信端末装置300-nelseは、多地点制御装置100が出力した1個のモノラル符号CTMM1M2から、2個の発声地点の全ての音信号が混合されたモノラルの音信号であり、符号化と復号の組がタンデム接続され混合された音信号である、1個の復号音信号を得る。
・多地点制御装置100は、各固定通信端末装置200-mに対しては、2個の発声地点のモノラルの音信号を表す2個のモノラル符号CMMM1とCMMM2を出力する。各固定通信端末装置200-mは、多地点制御装置100が出力した2個のモノラル符号CMMM1とCMMM2から、上述したケースBの処理を行って、2個の発声地点それぞれのモノラルの音信号に対応する2個のモノラルの音信号であり、符号化と復号の組がタンデム接続ではない音信号である、計2個のチャンネルの復号音信号を得る。
<第二実施形態>
 第一実施形態の固定通信端末装置の符号化部では、拡張符号のみを用いても2個のチャンネルの復号ディジタル音信号の何れも得ることができない符号であり、モノラル符号と併せて用いることで2個のチャンネルの復号ディジタル音信号の両方を得ることができる符号を拡張符号として得るようにしていたが、モノラル符号と併せて用いずに拡張符号のみを用いることで2個のチャンネルの復号ディジタル音信号の両方を得ることができる符号を拡張符号として得るようにしてもよい。この形態を第二実施形態として説明する。
 第二実施形態の多地点電話接続システム10の構成及びと多地点電話接続システム10に含まれる各装置の構成は、第一実施形態の多地点電話接続システム10の構成及び多地点電話接続システム10に含まれる各装置と同じである。第二実施形態が第一実施形態と異なるのは、固定通信端末装置200-mの音信号固定送信側装置210-mの符号化部212-mと固定通信端末装置200-mの音信号固定受信側装置220-mの復号部222-mの動作であるので、以下では第二実施形態が第一実施形態と異なる点について説明する。
<符号化部212-m>
 第二実施形態の符号化部212-mは、フレームごとに、収音部211-mから入力された2個のチャンネルのディジタル音信号を混合した信号を上述した第1の符号化方式で符号化してモノラル符号を得て、また、入力された2個のチャンネルのディジタル音信号を所定の第3の符号化方式でステレオ符号化して拡張符号を得て、得たモノラル符号と拡張符号を制御情報付与部213-mに出力する。
 第3の符号化方式としては、全ての音信号固定送信側装置210-mの符号化部212-mで同じ符号化方式を用いる。第3の符号化方式としては、拡張符号のビットレートが固定伝送路400-mの通信容量からモノラル符号のビットレートを減算した値以下である符号化方式を用いる必要がある。第3の符号化方式としては、拡張符号のビットレートが上述した条件を満たす範囲内で、第1の符号化方式で得たモノラル符号と併せて用いずに拡張符号のみを用いることで2個のチャンネルの復号ディジタル音信号の両方を得ることができる符号を拡張符号として得るように、2個のチャンネルの音信号を効率良く符号化できる符号化方式を用いればよい。もちろん、第3の符号化方式として、2個のチャンネルの音信号それぞれを上述した第1の符号化方式で符号化する方式を用いてもよく、例えば、2個のチャンネルの音信号それぞれを上述した3GPP EVS規格の13.2kbpsモードで符号化するようにしてもよい。
<復号部222-m>
 第二実施形態の復号部222-mは、第一実施形態の復号部222-mと同様に、フレームごとに、入力された符号情報に基づいて、入力された符号がある場合には入力された符号を復号して1個または2個の復号ディジタル音信号を得て、再生部223-mに出力する。ただし、第二実施形態の復号部222-mは、第一実施形態の復号部222-mの上述したケースAに代えて、下記のケースA’の処理を行う。
[ケースA’]
 第二実施形態の復号部222-mは、入力された符号情報が“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”である場合には、入力された拡張符号を所定の第3の復号方式で復号して2個の復号ディジタル音信号を得て出力する。すなわち、復号部222-mは、モノラル符号は復号せずに、拡張符号のみを復号して2個の復号ディジタル音信号を得て出力する。なお、第二実施形態の復号部222-mは、第3の復号方式としては、第二実施形態の音信号固定送信側装置210-mの符号化部212-mで用いた第3の符号化方式に対応する復号方式を用いる。
<第二実施形態の変形例1>
 第二実施形態の固定通信端末装置の復号部では、上述したケースA’の場合にはモノラル符号は用いない。従って、この場合には固定通信端末装置の制御情報解析部はモノラル符号を出力しないでもよい。この形態を第二実施形態の変形例1として、第二実施形態と異なる点について説明する。
<制御情報解析部221-m>
 第二実施形態の変形例1の制御情報解析部221-mは、入力された固定端末向けビット列に含まれる制御符号が表す符号情報が“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”である場合には、入力された固定端末向けビット列に含まれる制御符号が表す符号情報と、入力された固定端末向けビット列に含まれる音信号を表す符号のうちの拡張符号と、を出力する。第二実施形態の変形例1の制御情報解析部221-mは、上記以外の場合、すなわち、入力された固定端末向けビット列に含まれる制御符号が表す符号情報が“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”以外である場合には、第二実施形態の制御情報解析部221-mと同じ動作をする。
<第二実施形態の変形例2>
 第二実施形態の固定通信端末装置の復号部では、上述したケースA’の場合にはモノラル符号は用いない。従って、この場合には多地点制御装置のビット列生成部はモノラル符号を出力しないでもよい。この形態を第二実施形態の変形例2として、第二実施形態と異なる点について説明する。
<ビット列生成部120>
 第二実施形態の変形例2のビット列生成部120は、第二実施形態のビット列生成部120と同様に、フレームごとに、入力された選択地点情報に基づいて、入力された固定端末送出ビット列と入力された移動端末送出ビット列を用いて、各固定通信端末装置200-mに対して出力する固定端末向けビット列と各移動通信端末装置300-nに対して出力する移動端末向けビット列を生成して出力する。ただし、第二実施形態の変形例2のビット列生成部120は、選択地点情報が“Fix-M”という情報である場合に、固定通信端末装置200-M以外の各固定通信端末装置200-melse(melseは、1以上M以下でありMとは異なる各整数)に対しては、固定通信端末装置200-Mが出力した固定端末送出ビット列に含まれる拡張符号CFEM1のみを音信号を表す符号として含み、符号情報が“音信号を表す符号列が含む符号が1個の拡張符号であることを表す情報”であることを表す制御符号を含む、固定端末向けビット列を生成して、各固定通信端末装置200-melseが接続された各固定伝送路400-melseに出力する。
<制御情報解析部221-m>
 第二実施形態の変形例2の制御情報解析部221-mは、入力された固定端末向けビット列に含まれる制御符号が表す符号情報が“音信号を表す符号列が含む符号が1個の拡張符号であることを表す情報”である場合には、入力された固定端末向けビット列に含まれる制御符号が表す符号情報と、入力された固定端末向けビット列に含まれる音信号を表す符号である1つの拡張符号と、を出力する。第二実施形態の変形例2の制御情報解析部221-mは、上記以外の場合、すなわち、入力された固定端末向けビット列に含まれる制御符号が表す符号情報が“音信号を表す符号列が含む符号が1個の拡張符号であることを表す情報”以外である場合には、第二実施形態の制御情報解析部221-mと同じ動作をする。
<復号部222-m>
 第二実施形態の変形例2の復号部222-mは、入力された符号情報が“音信号を表す符号列が含む符号が1個の拡張符号であることを表す情報”である場合には、入力された拡張符号を上述した第3の復号方式で復号して2個の復号ディジタル音信号を得て出力する。第二実施形態の変形例2の復号部222-mは、上記以外の場合、すなわち、入力された符号情報が“音信号を表す符号列が含む符号が1個の拡張符号であることを表す情報”以外である場合には、第二実施形態の復号部222-mと同じ動作をする。
<第三実施形態>
 固定通信端末装置の符号化部が得る拡張符号は、第一実施形態では、拡張符号のみを用いても2個のチャンネルの復号ディジタル音信号の何れも得ることができない符号であり、モノラル符号と併せて用いることで2個のチャンネルの復号ディジタル音信号の両方を得ることができる符号であり、第二実施形態では、モノラル符号と併せて用いずに拡張符号のみを用いることで2個のチャンネルの復号ディジタル音信号の両方を得ることができる符号であったが、第一実施形態の拡張符号と第二実施形態の拡張符号のうちの何れか1つをフレームごとに選択するようにしてもよい。この形態を第三実施形態として説明する。
 第三実施形態の多地点電話接続システム10の構成及び多地点電話接続システム10に含まれる各装置の構成は、第一実施形態及び第二実施形態の多地点電話接続システム10の構成及び多地点電話接続システム10に含まれる各装置と同じである。以下では第三実施形態が第一実施形態と異なる点について説明する。
<符号化部212-m>
 第三実施形態の符号化部212-mは、第一実施形態及び第二実施形態の符号化部212-mと同様に、フレームごとに、収音部211-mから入力された2個のチャンネルのディジタル音信号を混合した信号を上述した第1の符号化方式で符号化してモノラル符号を得て、得たモノラル符号を音信号固定送信側装置210-mの制御情報付与部213-mに出力する。
 また、第三実施形態の符号化部212-mは、入力された2個のチャンネルのディジタル音信号の差分に相当する情報を表す符号を含む拡張符号、または、入力された2個のチャンネルのディジタル音信号を上述した第3の符号化方式でステレオ符号化して得た拡張符号を、音信号固定送信側装置210-mの制御情報付与部213-mに出力する。
 例えば、第三実施形態の符号化部212-mは、入力された2個のチャンネルのディジタル音信号を混合した信号を上述した第1の符号化方式で符号化してモノラル符号を得て、得たモノラル符号を第1の復号方式で復号をして暫定復号ディジタル音信号を得て、入力された2個のチャンネルのディジタル音信号の差分に相当する情報を上述した第2の符号化方式で符号化して第1の暫定拡張符号を得て、得た第1の暫定拡張符号を第2の復号方式で復号をして差分に相当する復号情報を得て、得た暫定復号ディジタル音信号と差分に相当する復号情報とから、暫定復号ディジタル音信号が2個のチャンネルの第1の復号ディジタル音信号が混合された信号であると見做し、差分に相当する復号情報が2個のチャンネルの第1の暫定復号ディジタル音信号の差分に相当する情報であると見做して、2個のチャンネルの第1の暫定復号ディジタル音信号を得る。また、符号化部212-mは、2個のチャンネルのディジタル音信号を上述した第3の符号化方式で符号化して第2の暫定拡張符号を得て、得た第2の暫定拡張符号を第3の復号方式で復号をして2個のチャンネルの第2の暫定復号ディジタル音信号を得る。そして、符号化部212-mは、入力された2個のチャンネルのディジタル音信号と2個のチャンネルの第1の暫定復号ディジタル音信号とから求まる符号化歪みと、入力された2個のチャンネルのディジタル音信号と2個のチャンネルの第2の暫定復号ディジタル音信号とから求まる符号化歪みと、のうちの符号化歪みが小さいほうに対応する暫定拡張符号を拡張符号として出力する。また例えば、第三実施形態の符号化部212-mは、第1の暫定復号ディジタル音信号の符号化歪みの推定値を第1の推定符号化歪みとして得て、第2の暫定復号ディジタル音信号の符号化歪みの推定値を第2の推定符号化歪みとして得て、第1の推定符号化歪みと第2の推定符号化歪みのうちの推定符号化歪みが少ないほうの符号化処理を行って拡張符号を得て出力する。
 また例えば、第三実施形態の符号化部212-mは、入力された2個のチャンネルのディジタル音信号の差分に相当する情報を上述した第2の符号化方式で符号化して第1の暫定拡張符号を得て、入力された2個のチャンネルのディジタル音信号を上述した第3の符号化方式でステレオ符号化して第2の暫定拡張符号を得て、第1の暫定拡張符号と第2の暫定拡張符号のうちの符号量が少ないほうを選択して拡張符号として出力する。また例えば、第三実施形態の符号化部212-mは、入力された2個のチャンネルのディジタル音信号の差分に相当する情報を上述した第2の符号化方式で符号化して得られる拡張符号の符号量の推定値を第1の推定符号量として得て、入力された2個のチャンネルのディジタル音信号を上述した第3の符号化方式でステレオ符号化して得られる拡張符号の符号量の推定値を第2の推定符号量として得て、第1の推定符号量と第2の推定符号量のうちの推定符号量が少ないほうの符号化処理を行って拡張符号を得て出力する。
 また例えば、第三実施形態の符号化部212-mは、入力された2個のチャンネルのディジタル音信号を分析して、その分析結果に従って、入力された2個のチャンネルのディジタル音信号の差分に相当する情報を表す符号を含む拡張符号を得るか、または、入力された2個のチャンネルのディジタル音信号を上述した第3の符号化方式でステレオ符号化して拡張符号を得るかの動作をして、得た拡張符号を出力する。また例えば、第三実施形態の符号化部212-mは、固定通信端末装置200-mの図示しない制御部による制御に従って、入力された2個のチャンネルのディジタル音信号の差分に相当する情報を表す符号を含む拡張符号を得るか、または、入力された2個のチャンネルのディジタル音信号を上述した第3の符号化方式でステレオ符号化して拡張符号を得るかの動作をして、得た拡張符号を出力する。
 さらに、第三実施形態の符号化部212-mは、出力する拡張符号が、入力された2個のチャンネルのディジタル音信号の差分に相当する情報を表す符号を含む拡張符号と、入力された2個のチャンネルのディジタル音信号を上述した第3の符号化方式でステレオ符号化して得た拡張符号と、の何れであるかを特定する情報を得て制御情報付与部213-mに出力する。
<制御情報付与部213-m>
 第三実施形態の制御情報付与部213-mは、音信号を表す符号がモノラル符号と拡張符号である場合には、“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”に加えて、拡張符号が上述した何れの拡張符号であるかを特定する情報、すなわち、“拡張符号が差分に相当する情報を表す符号を含むものであるのか第3の符号化方式で得たものであるのかを特定する情報”も含む符号情報を表す制御符号を出力する。
<復号部222-m>
 第三実施形態の復号部222-mは、入力された符号情報が“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”である場合のうちの“拡張符号が差分に相当する情報を表す符号を含むものであるのか第3の符号化方式で得たものであるのかを特定する情報”が拡張符号が差分に相当する情報を表す符号を含むものであることを特定する場合には、第一実施形態の復号部222-mの上述したケースAの処理を行い、入力された符号情報が“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”である場合のうちの“拡張符号が差分に相当する情報を表す符号を含むものであるのか第3の符号化方式で得たものであるのかを特定する情報”が拡張符号が第3の符号化方式で得たものであることを特定する場合には、第二実施形態の復号部222-mの上述したケースA’の処理を行う。第三実施形態の復号部222-mは、それ以外の場合、すなわち、入力された符号情報が“音信号を表す符号列が含む符号が1組のモノラル符号と拡張符号であることを表す情報”以外である場合には、第一実施形態及び第二実施形態の復号部222-mと同じ動作をする。
 なお、第3実施形態についても、第2実施形態を第2実施形態の変形例1や変形例2に変形したのと同様の変形をしてもよい。
<その他の実施形態>
≪地点選択部が最大2個の地点を選択する構成における端末装置の個数≫
 上述した各実施形態では、説明を簡単化するために、多地点電話接続システムには2個以上の固定通信端末装置と2個以上の移動通信端末装置が含まれる例で説明した。しかし、上述した各実施形態の多地点電話接続システムに含まれる端末装置の個数はこの限りではなく、上述した各実施形態の多地点電話接続システムには、固定通信端末装置が1個以上含まれていて、移動通信端末装置が1個以上含まれていて、固定通信端末装置と移動通信端末装置が合計3個以上含まれていればよい。すなわち、上述した各実施形態の多地点電話接続システムは、Mが1以上、かつ、Nが1以上、かつ、M+Nが3以上、であればよい。
 ただし、Mが1である場合、すなわち、多地点電話接続システムに1個の固定通信端末装置と2個以上の移動通信端末装置が含まれる場合には、多地点制御装置100の地点選択部110が選択する地点が2地点とも固定通信端末装置であることはないので、地点選択部110が出力する地点選択情報はケース3となることはなく、地点選択部110が出力する地点選択情報はケース1、2、4、5の何れかとなる。またこの場合には、地点選択部110が選択した地点に固定通信端末装置が含まれているときには地点選択部110が選択しなかった地点に固定通信端末装置が含まれていることはないので、多地点制御装置100のビット列生成部120は、地点選択情報がケース1の情報である場合の2通り目のビット列、地点選択情報がケース4の情報である場合の3通り目のビット列を出力することはなく、地点選択情報がケース1の情報である場合には1通り目と3通り目のビット列を出力し、地点選択情報がケース4の情報である場合には1通り目と2通り目と4通り目のビット列を出力する。またこの場合には、固定通信端末装置200-1の音信号固定受信側装置220-1の復号部222-1が上述したケースAの処理を行うことはなく、復号部222-1は上述したケースBからDの何れかの処理を行う。
 また、Nが1である場合、すなわち、多地点電話接続システムに2個以上の固定通信端末装置と1個の移動通信端末装置が含まれる場合には、多地点制御装置100の地点選択部110が選択する地点が2地点とも移動通信端末装置であることはないので、地点選択部110が出力する地点選択情報はケース5となることはなく、地点選択部110が出力する地点選択情報はケース1から4の何れかとなる。またこの場合には、地点選択部110が選択した地点に移動通信端末装置が含まれているときには、地点選択部110が選択しなかった地点に移動通信端末装置が含まれていることはないので、多地点制御装置100のビット列生成部120は、地点選択情報がケース2の情報である場合の2通り目のビット列、地点選択情報がケース4の情報である場合の4通り目のビット列を出力することはなく、地点選択情報がケース2の情報である場合には1通り目と3通り目のビット列を出力し、地点選択情報がケース4の情報である場合には1通り目と2通り目と3通り目のビット列を出力する。
≪地点選択部が選択する地点の個数≫
 また、上述した各実施形態では、説明を簡単化するために、多地点制御装置100の地点選択部110が1個または2個の地点を選択する例で説明した。しかし、地点選択部110が選択する地点の個数はこの限りではなく、上述した第1の符号化方式が得るモノラル符号が固定電話の音声回線用の伝送路でリアルタイム伝送可能な通信容量の範囲内に収まる個数であれば3個以上であってもよい。すなわち、多地点制御装置100の地点選択部110は最大K個(Kは2以上の整数)の地点を選択するようにすればよい。この場合には、多地点制御装置100のビット列生成部120と各固定通信端末装置200-mと各移動通信端末装置300-nと以下のように動作する。
[自地点以外の選択された地点の個数が0個の通信端末装置と、その通信端末装置に対するビット列生成部の動作]
 選択された地点が1個である場合(すなわち、Kが1である場合)には、選択された地点の端末装置については、自地点以外の選択された地点の個数が0個である。多地点制御装置100のビット列生成部120は、自地点以外の選択された地点の個数が0個である通信端末装置に対しては、第一実施形態で上述した通り、音信号を表す符号列を出力しない。自地点以外の選択された地点の個数が0個である通信端末装置は、第一実施形態で上述した通り、音信号を表す符号列を復号せずに、復号音信号を得ない。
[自地点以外の選択された地点の個数が1個の固定通信端末装置と、その固定通信端末装置に対するビット列生成部の動作]
 選択された地点が2個である場合(すなわち、Kが2である場合)には、選択された地点の端末装置については、自地点以外の選択された地点の個数が1個である。また、選択された地点が1個である場合(すなわち、Kが1である場合)には、選択されなかった地点の端末装置については、自地点以外の選択された地点の個数が1個である。多地点制御装置100のビット列生成部120は、自地点以外の選択された地点の個数が1個である固定通信端末装置に対しては、第一実施形態で上述した通り、選択された地点のモノラル符号を音信号を表す符号として少なくとも含み、選択された地点の拡張符号がある場合には選択された地点の拡張符号も音信号を表す符号として含む、ビット列を生成して出力する。すなわち、多地点制御装置100のビット列生成部120は、自地点以外の選択された地点の個数が1個である固定通信端末装置に対しては、選択された地点が固定通信端末装置である場合には、選択された地点のモノラル符号と拡張符号を音信号を表す符号として含むビット列を生成して出力し、選択された地点が移動通信端末装置である場合には、選択された地点のモノラル符号を音信号を表す符号として含むビット列を生成して出力する。自地点以外の選択された地点の個数が1個である固定通信端末装置の復号部は、第一実施形態で上述した通り、選択された地点のモノラル符号を復号し、選択された地点の拡張符号がある場合には選択された地点の拡張符号も復号して、選択された地点の復号音信号を得る。
[自地点以外の選択された地点の個数が1個の移動通信端末装置と、その移動通信端末装置に対するビット列生成部の動作]
 選択された地点が2個である場合(すなわち、Kが2である場合)には、選択された地点の端末装置については、自地点以外の選択された地点の個数が1個である。また、選択された地点が1個である場合(すなわち、Kが1である場合)には、選択されなかった地点の端末装置については、自地点以外の選択された地点の個数が1個である。多地点制御装置100のビット列生成部120は、自地点以外の選択された地点の個数が1個である移動通信端末装置に対しては、第一実施形態で上述した通り、選択された地点のモノラル符号を音信号を表す符号として含むビット列を生成して出力する。自地点以外の選択された地点の個数が1個である移動通信端末装置の復号部は、第一実施形態で上述した通り、選択された地点のモノラル符号を復号して選択された地点の復号音信号を得る。
[自地点以外の選択された地点の個数が2個以上の固定通信端末装置と、その固定通信端末装置に対するビット列生成部の動作]
 選択された地点が3個以上である場合(すなわち、Kが3以上である場合)には、選択された地点の端末装置については、自地点以外の選択された地点の個数が2個以上である。また、選択された地点が2個以上である場合(すなわち、Kが2以上である場合)には、選択されなかった地点の端末装置については、自地点以外の選択された地点の個数が2個以上である。多地点制御装置100のビット列生成部120は、自地点以外の選択された地点の個数が2個以上である固定通信端末装置に対しては、選択された2個以上(k個、kは2以上K以下の整数)の通信端末装置それぞれが出力したビット列に含まれるモノラル符号k個を音信号を表す符号として含み、符号情報が“音信号を表す符号列が含む符号がk個のモノラル符号であることを表す情報”であることを表す制御符号を含む、固定端末向けビット列を生成して出力する。自地点以外の選択された地点の個数が2個以上である固定通信端末装置の音信号固定受信側装置の制御情報解析部は、“音信号を表す符号列が含む符号がk個のモノラル符号であることを表す情報”である符号情報とk個のモノラル符号を復号部に出力する。自地点以外の選択された地点の個数が2個以上である固定通信端末装置の音信号固定受信側装置の復号部は、入力されたk個のモノラル符号それぞれを上述した第1の復号方式で復号してk個の復号ディジタル音信号を得て出力する。なお、各固定通信端末装置の音信号固定受信側装置の再生部が最大K個のDA変換部と最大K個のスピーカを含むようにしてもよい。
[自地点以外の選択された地点の個数が2個以上の移動通信端末装置と、その移動通信端末装置に対するビット列生成部の動作]
 選択された地点が3個以上である場合(すなわち、Kが3以上である場合)には、選択された地点の端末装置については、自地点以外の選択された地点の個数が2個以上である。また、選択された地点が2個以上である場合(すなわち、Kが2以上である場合)には、選択されなかった地点の端末装置については、自地点以外の選択された地点の個数が2個以上である。多地点制御装置100のビット列生成部120は、自地点以外の選択された地点の個数が2個以上である移動通信端末装置に対しては、選択された2個以上(k個、kは2以上K以下の整数)の通信端末装置それぞれが出力したビット列に含まれるモノラル符号それぞれ復号してk個の復号ディジタル音信号を得て、得たk個の復号ディジタル音信号を混合して混合ディジタル音信号を得て、混合ディジタル音信号を上述した第1の符号化方式で符号化してモノラル符号を得て、混合ディジタル音信号から得た1個のモノラル符号を音信号を表す符号として含む移動端末向けビット列を生成して出力する。自地点以外の選択された地点の個数が2個以上である移動通信端末装置の復号部は、1個のモノラル符号を上述した第1の復号方式で復号して1個の復号ディジタル音信号を得て出力する。
≪地点選択部がK個の地点を選択する構成における端末装置の個数≫
 以上の2つの説明から分かる通り、多地点電話接続システムは、上述した第1の符号化方式が得るモノラル符号が固定電話の音声回線用の伝送路でリアルタイム伝送可能な通信容量の範囲内に収まる個数をK(Kは2以上の整数)としたとき、多地点制御装置100の地点選択部110が最大K個の地点を選択する構成であって、固定通信端末装置が1個以上含まれていて、移動通信端末装置が1個以上含まれていて、固定通信端末装置と移動通信端末装置が合計K+1個以上含まれていればよい。すなわち、上述した各実施形態の多地点電話接続システムは、Mが1以上、かつ、Nが1以上、かつ、M+NがK+1以上、であればよい。
≪固定通信端末装置の音信号のチャンネル数≫
 また、上述した各実施形態では、説明を簡単化するために、固定通信端末装置200-mの音信号固定送信側装置210-mが2個のチャンネルのディジタル音信号に対応する符号を含むビット列を得て出力する例で説明した。しかし、チャンネル数はこの限りではなく2以上であればよい。このチャンネル数をC(Cは2以上の整数)とすると、この場合は、固定通信端末装置200-mの音信号固定送信側装置210-mの収音部211-mはC個のマイクロホンとC個のAD変換部を含むようにすればよく、固定通信端末装置200-mの音信号固定送信側装置210-mの符号化部212-mは、フレームごとに、収音部211-mから入力されたC個のチャンネルのディジタル音信号を混合した信号を所定の第1の符号化方式で符号化してモノラル符号を得て、入力されたC個のチャンネルのディジタル音信号の差分に相当する情報を表す符号を含む拡張符号を得るようにすればよい。また、この場合は、固定通信端末装置200-mの音信号固定受信側装置220-mの復号部222-mは、上述したケースAに代えて、入力されたモノラル符号を所定の第1の復号方式で復号して暫定復号ディジタル音信号を得て、入力された拡張符号に含まれる差分に相当する情報を表す符号から復号差分情報を得て、得た暫定復号ディジタル音信号と復号差分情報とから、暫定復号ディジタル音信号がC個の復号ディジタル音信号が混合された信号であると見做し、復号差分情報がC個の復号ディジタル音信号の差分に相当する情報であると見做して、C個の復号ディジタル音信号を得て出力するようにすればよい。また、入力された拡張符号に、差分に相当する情報を表す符号である差分符号に加えて誤差符号も含まれている場合には、復号部222-mは、更に、入力された拡張符号に含まれる誤差符号から復号誤差情報を得て、暫定復号ディジタル音信号と復号誤差情報と復号差分情報とから、暫定復号ディジタル音信号がC個の復号音信号が混合された信号であると見做し、復号誤差情報が暫定復号ディジタル音信号の誤差に相当する情報であると見做し、復号差分情報がC個の復号ディジタル音信号の差分に相当する情報であると見做して、C個の復号ディジタル音信号を得て出力するようにすればよい。またこれらの場合は、固定通信端末装置200-mの音信号固定受信側装置220-mの再生部223-mが最大C個のDA変換部と最大C個のスピーカを含むようにしてもよい。なお、入力されたC個のチャンネルのディジタル音信号の差分に相当する情報を符号化する場合には、符号化部212-mは、入力されたC個のチャンネルのディジタル音信号のチャンネル間の差分に相当する情報を所定の第2の符号化方式で符号化して差分に相当する情報を表す符号を得て拡張符号に含めるようにし、復号部222-mは、入力された拡張符号に含まれる差分に相当する情報を表す符号を所定の第2の復号方式で復号して復号差分情報を得るようにすればよい。第2の復号方式と第2の符号化方式としては、例えば、MPEG-4 ALS規格のマルチチャンネル復号方式(ISO/IEC 14496-3 11.6.8.1.2)とこれに対応した符号化方式で使われている処理技術を用いればよい。なお、C個のチャンネルのディジタル音信号のチャンネル間の差分に相当する情報とは、第一実施形態で上述したのと同様に、C個のチャンネルのディジタル音信号の差分を表す波形情報、C個のチャンネルのディジタル音信号の差分を表す特徴パラメータなどである。
<プログラム及び記録媒体>
 第一通信網端末装置200-m、第二通信網端末装置300-n、多地点制御装置100のそれぞれの各部の処理をコンピュータにより実現してもよい。言い換えれば、第一通信網端末装置200-mに対応する符号化側の方法である符号化方法、第一通信網端末装置200-mに対応する復号側の方法である復号方法のそれぞれの各ステップの処理をコンピュータによって実行してもよい。また、第二通信網端末装置300-nに対応する方法の各ステップの処理をコンピュータによって実行してもよい。また、多地点制御装置100に対応する多地点制御方法の各ステップの処理をコンピュータによって実行してもよい。この場合、各ステップの処理はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各ステップの処理がコンピュータ上で実現される。
 これらの処理内容を記述したプログラムのそれぞれは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
 また、各部の処理は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理の少なくとも一部をハードウェア的に実現することとしてもよい。
 その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。

Claims (7)

  1. M地点(Mは2以上の整数)の第一通信網端末装置とN地点(Nは1以上の整数)の第二通信網端末装置とが通信路を介して接続された多地点制御装置における多地点制御方法であって、
    各時間区間について、
    前記各第一通信網端末装置から前記多地点制御装置に通信路を介して入力されるビット列は、該第一通信網端末装置に入力された2個以上のチャンネルの音信号を混合した信号を第1の符号化方式で符号化して得られたモノラル符号CFM(mは1以上M以下の各整数)と、前記入力された2個以上のチャンネルの音信号の差分に相当する情報を表す符号を含む拡張符号CFEと、を音信号を表す符号として含むビット列であり、
    前記各第二通信網端末装置から前記多地点制御装置に通信路を介して入力されるビット列は、該第二通信網通信端末装置に入力された1チャンネルの音信号を前記第1の符号化方式で符号化して得られたモノラル符号CMM(nは1以上N以下の各整数)を音信号を表す符号として含むビット列であり、
    前記多地点制御装置が、M地点の前記第一通信網端末装置とN地点の第二通信網端末装置のうちから1地点または2地点を選択する地点選択ステップと、
    前記多地点制御装置が、前記選択された地点がM地点とM地点の2地点(Mは1以上M以下の整数、Mは1以上M以下でありMとは異なる整数)の前記第一通信網端末装置である場合に、選択されなかった地点の前記各第一通信網端末装置に対するビット列として、前記M地点の音信号を表す符号のうちのモノラル符号CFMM1と前記M地点の音信号を表す符号のうちのモノラル符号CFMM2とを音信号を表す符号として含むビット列を生成して出力するビット列生成ステップと、
    を含む多地点制御方法。
  2. 請求項1に記載の多地点制御方法であって、
    前記ビット列生成ステップは、
    前記選択された地点が前記M地点と前記M地点の前記第一通信網端末装置である場合に、更に、
    前記M地点と前記M地点の前記第一通信網端末装置それぞれに対するビット列として、前記選択された地点のうちの自地点以外の地点m’(m’はMまたはM)の音信号を表す符号であるモノラル符号CFMm’と拡張符号CFEm’を音信号を表す符号として含むビット列を生成して出力する、
    多地点制御方法。
  3. 請求項1または2に記載の多地点制御方法であって、
    前記ビット列生成ステップは、
    前記選択された地点が前記M地点と前記M地点の前記第一通信網端末装置である場合に、更に、
    前記M地点の音信号を表す符号のうちのモノラル符号CFMM1を前記第1の符号化方式に対応する第1の復号方式で復号して第1復号音信号を得て、前記M地点の音信号を表す符号のうちのモノラル符号CFMM2を前記第1の復号方式で復号して第2復号音信号を得て、前記第1復号音信号と前記第2復号音信号を混合して混合音信号を得て、前記混合音信号を前記第1の符号化方式で符号化してモノラル符号CTMM1M2を得て、前記混合音信号から得た前記モノラル符号CTMM1M2を音信号を表す符号として含むビット列を前記各第二通信網端末装置に対するビット列として生成して出力する、
    多地点制御方法。 
  4. M地点(Mは2以上の整数)の第一通信網端末装置とN地点(Nは1以上の整数)の第二通信網端末装置とが通信路を介して接続された多地点制御装置であって、
    各時間区間について、
    前記各第一通信網端末装置から前記多地点制御装置に通信路を介して入力されるビット列は、該第一通信網端末装置に入力された2個以上のチャンネルの音信号を混合した信号を第1の符号化方式で符号化して得られたモノラル符号CFM(mは1以上M以下の各整数)と、前記入力された2個以上のチャンネルの音信号の差分に相当する情報を表す符号を含む拡張符号CFEと、を音信号を表す符号として含むビット列であり、
    前記各第二通信網端末装置から前記多地点制御装置に通信路を介して入力されるビット列は、該第二通信網通信端末装置に入力された1チャンネルの音信号を前記第1の符号化方式で符号化して得られたモノラル符号CMM(nは1以上N以下の各整数)を音信号を表す符号として含むビット列であり、
    M地点の前記第一通信網端末装置とN地点の第二通信網端末装置のうちから1地点または2地点を選択する地点選択部と、
    前記選択された地点がM地点とM地点の2地点(Mは1以上M以下の整数、Mは1以上M以下でありMとは異なる整数)の前記第一通信網端末装置である場合に、選択されなかった地点の前記各第一通信網端末装置に対するビット列として、前記M地点の音信号を表す符号のうちのモノラル符号CFMM1と前記M地点の音信号を表す符号のうちのモノラル符号CFMM2とを音信号を表す符号として含むビット列を生成して出力するビット列生成部と、
    を含む多地点制御装置。
  5. 請求項4に記載の多地点制御装置であって、
    前記ビット列生成部は、
    前記選択された地点が前記M地点と前記M地点の前記第一通信網端末装置である場合に、更に、
    前記M地点と前記M地点の前記第一通信網端末装置それぞれに対するビット列として、前記選択された地点のうちの自地点以外の地点m’(m’はMまたはM)の音信号を表す符号であるモノラル符号CFMm’と拡張符号CFEm’を音信号を表す符号として含むビット列を生成して出力する、
    多地点制御装置。
  6. 請求項4または5に記載の多地点制御装置であって、
    前記ビット列生成部は、
    前記選択された地点が前記M地点と前記M地点の前記第一通信網端末装置である場合に、更に、
    前記M地点の音信号を表す符号のうちのモノラル符号CFMM1を前記第1の符号化方式に対応する第1の復号方式で復号して第1復号音信号を得て、前記M地点の音信号を表す符号のうちのモノラル符号CFMM2を前記第1の復号方式で復号して第2復号音信号を得て、前記第1復号音信号と前記第2復号音信号を混合して混合音信号を得て、前記混合音信号を前記第1の符号化方式で符号化してモノラル符号CTMM1M2を得て、前記混合音信号から得た前記モノラル符号CTMM1M2を音信号を表す符号として含むビット列を前記各第二通信網端末装置に対するビット列として生成して出力する、
    多地点制御装置。
  7. 請求項1から3の何れかの多地点制御方法の各ステップをコンピュータに実行させるためのプログラム。
PCT/JP2020/000101 2019-01-17 2020-01-07 多地点制御方法、装置及びプログラム WO2020149164A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP20741280.0A EP3913622B1 (en) 2019-01-17 2020-01-07 Multipoint control method, device, and program
US17/422,711 US11810581B2 (en) 2019-01-17 2020-01-07 Multipoint control method, apparatus and program
CN202080009239.9A CN113302686A (zh) 2019-01-17 2020-01-07 多点控制方法、装置及程序

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-006306 2019-01-17
JP2019006306A JP7176418B2 (ja) 2019-01-17 2019-01-17 多地点制御方法、装置及びプログラム

Publications (1)

Publication Number Publication Date
WO2020149164A1 true WO2020149164A1 (ja) 2020-07-23

Family

ID=71613836

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/000101 WO2020149164A1 (ja) 2019-01-17 2020-01-07 多地点制御方法、装置及びプログラム

Country Status (5)

Country Link
US (1) US11810581B2 (ja)
EP (1) EP3913622B1 (ja)
JP (1) JP7176418B2 (ja)
CN (1) CN113302686A (ja)
WO (1) WO2020149164A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0983987A (ja) * 1995-09-08 1997-03-28 Mitsubishi Electric Corp 多地点間通信制御装置
JP2011182142A (ja) * 2010-02-26 2011-09-15 Nippon Telegr & Teleph Corp <Ntt> 音信号擬似定位システム、方法、音信号擬似定位復号装置及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7619995B1 (en) * 2003-07-18 2009-11-17 Nortel Networks Limited Transcoders and mixers for voice-over-IP conferencing
JP4033840B2 (ja) 2004-02-12 2008-01-16 日本電信電話株式会社 音声ミキシング方法、音声ミキシング装置、音声ミキシングプログラム及びこれを記録した記録媒体
EP2082397B1 (en) * 2006-10-16 2011-12-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
US8351589B2 (en) * 2009-06-16 2013-01-08 Microsoft Corporation Spatial audio for audio conferencing
CN101877643B (zh) * 2010-06-29 2014-12-10 中兴通讯股份有限公司 多点混音远景呈现方法、装置及系统
JP5331249B2 (ja) * 2010-07-05 2013-10-30 日本電信電話株式会社 符号化方法、復号方法、装置、プログラムおよび記録媒体
CN102760437B (zh) * 2011-04-29 2014-03-12 上海交通大学 实时声道控制转换的音频解码装置
EP2829048B1 (en) * 2012-03-23 2017-12-27 Dolby Laboratories Licensing Corporation Placement of sound signals in a 2d or 3d audio conference
FR3003683A1 (fr) * 2013-03-25 2014-09-26 France Telecom Mixage optimise de flux audio codes selon un codage par sous-bandes
JP6721977B2 (ja) * 2015-12-15 2020-07-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声音響信号符号化装置、音声音響信号復号装置、音声音響信号符号化方法、及び、音声音響信号復号方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0983987A (ja) * 1995-09-08 1997-03-28 Mitsubishi Electric Corp 多地点間通信制御装置
JP2011182142A (ja) * 2010-02-26 2011-09-15 Nippon Telegr & Teleph Corp <Ntt> 音信号擬似定位システム、方法、音信号擬似定位復号装置及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
3GPP TS26.442

Also Published As

Publication number Publication date
JP7176418B2 (ja) 2022-11-22
EP3913622A4 (en) 2022-10-12
US11810581B2 (en) 2023-11-07
EP3913622A1 (en) 2021-11-24
US20220084530A1 (en) 2022-03-17
JP2020115611A (ja) 2020-07-30
EP3913622B1 (en) 2024-03-27
CN113302686A (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
CN101107505A (zh) 语音编码装置和语音编码方法
KR100636145B1 (ko) 확장된 고해상도 오디오 신호 부호화 및 복호화 장치
JP7205626B2 (ja) 音信号受信復号方法、音信号符号化送信方法、音信号復号方法、音信号符号化方法、音信号受信側装置、音信号送信側装置、復号装置、符号化装置、プログラム及び記録媒体
JP7192986B2 (ja) 音信号受信復号方法、音信号復号方法、音信号受信側装置、復号装置、プログラム及び記録媒体
WO2020149164A1 (ja) 多地点制御方法、装置及びプログラム
WO2020149166A1 (ja) 多地点制御方法、装置及びプログラム
WO2020149167A1 (ja) 多地点制御方法、装置及びプログラム
WO2020149165A1 (ja) 多地点制御方法、装置及びプログラム
WO2020149163A1 (ja) 符号化復号方法、復号方法、これらの装置及びプログラム
JP7192987B2 (ja) 音信号受信復号方法、音信号復号方法、音信号受信側装置、復号装置、プログラム及び記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20741280

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2020741280

Country of ref document: EP

Effective date: 20210817