JP2007025375A - Repeating device, communication terminal device, signal decoding device, signal processing method, and signal processing program - Google Patents
Repeating device, communication terminal device, signal decoding device, signal processing method, and signal processing program Download PDFInfo
- Publication number
- JP2007025375A JP2007025375A JP2005208933A JP2005208933A JP2007025375A JP 2007025375 A JP2007025375 A JP 2007025375A JP 2005208933 A JP2005208933 A JP 2005208933A JP 2005208933 A JP2005208933 A JP 2005208933A JP 2007025375 A JP2007025375 A JP 2007025375A
- Authority
- JP
- Japan
- Prior art keywords
- communication terminal
- information
- unit
- signal
- terminal device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 404
- 238000003672 processing method Methods 0.000 title claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 235
- 230000005540 biological transmission Effects 0.000 claims abstract description 103
- 230000010354 integration Effects 0.000 claims description 27
- 238000000926 separation method Methods 0.000 claims description 19
- 238000000034 method Methods 0.000 abstract description 87
- 238000004364 calculation method Methods 0.000 abstract description 12
- 230000006866 deterioration Effects 0.000 abstract description 11
- 230000005284 excitation Effects 0.000 description 87
- 230000008569 process Effects 0.000 description 46
- 238000002360 preparation method Methods 0.000 description 45
- 230000003044 adaptive effect Effects 0.000 description 40
- 238000007726 management method Methods 0.000 description 29
- 238000013139 quantization Methods 0.000 description 24
- 230000015572 biosynthetic process Effects 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q2213/00—Indexing scheme relating to selecting arrangements in general and for multiplex systems
- H04Q2213/13034—A/D conversion, code compression/expansion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q2213/00—Indexing scheme relating to selecting arrangements in general and for multiplex systems
- H04Q2213/13106—Microprocessor, CPU
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q2213/00—Indexing scheme relating to selecting arrangements in general and for multiplex systems
- H04Q2213/1324—Conference call
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
本発明は、信号を符号化して伝送する通信システムに用いられる中継装置、通信端末装置、信号復号化装置、信号処理方法、および信号処理プログラムに関する。 The present invention relates to a relay device, a communication terminal device, a signal decoding device, a signal processing method, and a signal processing program used in a communication system that encodes and transmits a signal.
近年、多地点会議システム等に代表される、3者以上の間で通話を行う多者通話システムが、広く利用されてきている。通常、3者以上の間で通話を行うためには、ISDN等の通信網で行われているデジタル通信のように、各端末から送信された音声に対し端末毎にチャネルを割り当てて1本の回線を介して送信することによって、多者通話を実現するという方法がとられる。 2. Description of the Related Art In recent years, multi-party call systems that make a call between three or more parties, represented by a multipoint conference system, have been widely used. Usually, in order to make a call between three or more parties, a channel is assigned to each terminal for the voice transmitted from each terminal as in digital communication performed in a communication network such as ISDN. A method of realizing a multi-party call by transmitting via a line is used.
また、別の方法としては、交換機、通信サーバ、電話装置等の通信装置それ自体に多者通話を可能にする機能を持たせる方法がある。具体的には、各交換機等の通信装置において、各端末から送信された信号を復号化し、復号化して得られた各信号を重畳すると共に再度符号化して所定の端末に送信するという方法がとられる。また、電話装置が多者通話機能を有する場合は、他の端末から送信され受信した信号を復号化し、受信した電話装置に入力された音声信号を重畳すると共に再度符号化して交換機に送信するという方法がとられる。上記の多者通話の通信技術は、例えば、特許文献1に記載されている。
As another method, there is a method in which a communication device itself such as an exchange, a communication server, and a telephone device has a function enabling a multi-party call. Specifically, in a communication apparatus such as each exchange, a method of decoding a signal transmitted from each terminal, superimposing each signal obtained by decoding, re-encoding and transmitting to a predetermined terminal It is done. Also, when the telephone device has a multi-party call function, the received signal transmitted from another terminal is decoded, and the received voice signal input to the telephone device is superimposed and re-encoded and transmitted to the exchange. The method is taken. The communication technology for the above-described multi-party call is described in
また、近年、音声信号、楽音信号の符号化において、符号化情報の一部からでも音声・楽音信号を復号化でき、パケット損失が発生するような状況においても音質劣化を抑制することができるスケーラブル符号化技術が開発されている(例えば、特許文献2参照)。このスケーラブル符号化技術は、符号化情報の一部からでも音声、楽音信号を復号化できるように音声信号、楽音信号を符号化するものであり、パケット損失が発生するような状況においても音質劣化を抑制することができる。具体的には、第1階層で入力信号を符号化して符号化情報を生成し、上位の第(i−1)目の階層(iは2以上の整数)で、入力信号と第(i−1)階層の符号化情報に応じて得られる復号化信号との差である残差信号を生成し、さらに上位の第i階層で残差信号に応じて符号化することを繰り返す方法が知られている。
しかしながら、このような従来の多者通話の機能を有する電話装置では、受信した符号化情報を一旦復号化し、復号化した信号を他の音声信号と重畳し再度符号化する処理を行うため、多大な計算コストを要すると共に、符号化が複数回行われた音声を復号化して得られる音声の品質は、きわめて劣化してしまうという問題があった。参加者数に応じて回線数を増やす方法も考えられるが、参加者数が増えれば必要な回線が増え、通信コストおよび回線使用率が高くなると共に、実現性に問題も生じてくる。 However, in such a telephone device having a conventional multi-party call function, since the received encoded information is once decoded, and the decoded signal is superimposed on another audio signal and encoded again, a large amount is required. In addition to requiring a high calculation cost, there is a problem that the quality of speech obtained by decoding speech that has been encoded a plurality of times is extremely deteriorated. A method of increasing the number of lines according to the number of participants is also conceivable, but as the number of participants increases, the number of necessary lines increases, the communication cost and the line usage rate increase, and a problem arises in feasibility.
本発明はこのような問題を解決するためになされたもので、従来の通信装置、通信方法等よりも、処理における計算コストを増大させることなく、さらに、復号化音声の大きな劣化を防ぐ多者通話システムを実現することが可能な中継装置、通信端末装置、信号復号化装置、信号処理方法、および信号処理プログラムを提供するものである。 The present invention has been made in order to solve such problems, and does not increase the calculation cost in processing and prevents a large deterioration in decoded speech, compared to conventional communication apparatuses and communication methods. The present invention provides a relay device, a communication terminal device, a signal decoding device, a signal processing method, and a signal processing program capable of realizing a call system.
本発明の中継装置は、多者通話に参加している各通信端末装置から送信され、スケーラブル符号化によってレイヤ毎に符号化された符号化情報を、受信する受信部と、前記受信部が各前記通信端末装置から受信した前記符号化情報を前記レイヤ単位で組み合わせるための制御情報を作成する再構成処理部と、前記再構成処理部が作成した前記制御情報に基づいて、前記受信部が各前記通信端末装置から受信した前記符号化情報を、スケーラブルに前記レイヤ単位で組み合わせて統合すると共に、統合した前記符号化情報を送信する統合送信部とを備えた構成を有している。 The relay device of the present invention includes a receiving unit that receives encoded information that is transmitted from each communication terminal device participating in a multi-party call and is encoded for each layer by scalable encoding, and the receiving unit includes Based on the reconfiguration processing unit that creates control information for combining the encoded information received from the communication terminal device in units of layers, and the control information generated by the reconfiguration processing unit, the receiving unit The encoded information received from the communication terminal apparatus is integrated and combined in a scalable manner in units of layers, and an integrated transmission unit that transmits the integrated encoded information.
この構成により、入力された符号化情報を復号化せずに再構成して送信するため、従来の通信装置、通信方法等よりも、処理における計算コストを増大させることなく、さらに、復号化音声の大きな劣化を防ぐ多者通話システムを実現することが可能な中継装置を実現することができる。 With this configuration, since the input encoded information is reconstructed and transmitted without decoding, the decoded speech can be further increased without increasing the calculation cost in processing compared to conventional communication apparatuses, communication methods, and the like. It is possible to realize a relay device capable of realizing a multi-party call system that prevents major deterioration of the communication.
また、本発明の中継装置は、前記多者通話に参加している前記通信端末装置毎に設定した、過去の送信の伝送ビットレートを含む制御パラメータを有し、前記再構成処理部が、前記制御パラメータに基づいて、各前記通信端末装置に送信する前記符号化情報を組み合わせるための前記制御情報を作成することを特徴とする構成を有している。 Further, the relay device of the present invention has a control parameter including a transmission bit rate of past transmission set for each of the communication terminal devices participating in the multiparty call, and the reconfiguration processing unit includes the The control information for combining the encoded information to be transmitted to each of the communication terminal devices is created based on a control parameter.
この構成により、過去の送信の伝送ビットレートを含む制御パラメータに基づいて、各通信端末装置に送信する符号化情報を組み合わせるための制御情報を作成するため、新たに伝送ビットレートを検出して制御情報を作成する処理の負荷を軽減することが可能な中継装置を実現することができる。 With this configuration, in order to create control information for combining encoded information to be transmitted to each communication terminal device based on control parameters including transmission bit rates of past transmissions, a new transmission bit rate is detected and controlled. It is possible to realize a relay apparatus that can reduce the processing load for creating information.
また、本発明の中継装置は、前記再構成処理部が、各前記通信端末装置から送信された各前記符号化情報に基づいて再生される音声の音声レベルと、各前記通信端末装置との通信に用いる回線の回線状況を含む通信状態に関する情報とに基づいて、前記制御パラメータを設定することを特徴とする構成を有している。 Further, in the relay device according to the present invention, the reconfiguration processing unit communicates the audio level of the audio reproduced based on the encoded information transmitted from the communication terminal devices and the communication terminal devices. The control parameter is set on the basis of information on the communication state including the line state of the line used for the control.
この構成により、再生される音声の音声レベルと回線状況を含む通信状態に基づいて制御パラメータを設定するため、受信側で聴き取りやすい音声を再生するレイヤ構成を実現することが可能な中継装置を実現することができる。 With this configuration, since the control parameters are set based on the communication state including the audio level of the audio to be reproduced and the line status, a relay device capable of realizing a layer configuration that reproduces audio that can be easily heard on the receiving side. Can be realized.
また、本発明の中継装置は、新たな通信端末装置を前記多者通話に参加させるとき、または、前記多者通話に参加している前記通信端末装置が前記多者通話をやめるとき、前記再構成処理部が、前記制御パラメータを更新することを特徴とする構成を有している。 In addition, the relay device of the present invention is configured such that when a new communication terminal device participates in the multi-party call or when the communication terminal device participating in the multi-party call stops the multi-party call, A configuration processing unit updates the control parameter.
この構成により、多者通話の参加数を変化させるときに制御パラメータを更新するため、制御情報を作成する処理の負荷をさらに軽減することが可能な中継装置を実現することができる。 With this configuration, since the control parameter is updated when the number of participants in the multiparty call is changed, it is possible to realize a relay device that can further reduce the processing load for creating control information.
また、本発明の中継装置は、前記再構成処理部が、各前記通信端末装置から受信した前記符号化情報のうちの、基本レイヤから所定レイヤ分の前記符号化情報を、前記制御パラメータに基づいて選択して組み合わせることを特徴とする構成を有している。 Further, in the relay device according to the present invention, the reconfiguration processing unit, based on the control parameter, encodes the encoded information for a predetermined layer from a base layer among the encoded information received from each of the communication terminal devices. Selected and combined.
この構成により、制御パラメータに基づいて符号化情報を選択して組み合わせるため、処理の負荷を軽減することが可能な中継装置を実現することができる。 With this configuration, since the encoding information is selected and combined based on the control parameter, it is possible to realize a relay device that can reduce the processing load.
また、本発明の中継装置は、前記再構成処理部が、前記多者通話に参加している各前記通信端末装置が各時間帯で送信した前記符号化情報のうち、同一の前記時間帯に送信された前記符号化情報を受信してから次の前記時間帯に送信された前記符号化情報を受信することを特徴とする構成を有している。 In the relay device according to the present invention, the reconfiguration processing unit may transmit the encoded information transmitted in each time zone by each of the communication terminal devices participating in the multi-party call in the same time zone. After receiving the transmitted encoded information, the encoded information transmitted in the next time zone is received.
この構成により、同一の時間帯に送信された符号化情報を受信してから次の時間帯に送信された符号化情報を受信するため、処理の明確化を図ることが可能な中継装置を実現することができる。 With this configuration, since the encoded information transmitted in the same time zone is received and the encoded information transmitted in the next time zone is received, a relay device capable of clarifying the processing is realized. can do.
また、本発明の中継装置は、新たな通信端末装置を前記多者通話に参加させるとき、前記新たな通信端末装置を前記多者通話に参加させようとする前記通信端末装置と前記新たな通信端末装置とを、前記多者通話を行っている回線とは別の回線で接続することを特徴とする構成を有している。 In addition, the relay device according to the present invention, when a new communication terminal device participates in the multiparty call, the communication terminal device and the new communication that attempt to cause the new communication terminal device to participate in the multiparty call. The terminal device is connected by a line different from the line on which the multi-party call is performed.
この構成により、多者通話を行っている回線とは別の回線で割り込みに係る2つの通信端末装置を接続するため、多者通話を中断させることなく割り込みに関する処理を行うことが可能な中継装置を実現することができる。 With this configuration, since the two communication terminal devices related to the interruption are connected by a line different from the line on which the multi-party call is performed, the relay apparatus capable of performing the process related to the interruption without interrupting the multi-party call Can be realized.
また、本発明の中継装置は、前記多者通話に参加している前記通信端末装置と新たな通信端末装置とを通話させるとき、前記多者通話に参加している前記通信端末装置と前記新たな通信端末装置とを、前記多者通話を行っている回線とは別の回線で接続することを特徴とする構成を有している。 In addition, the relay device of the present invention enables the communication terminal device participating in the multi-party call and the new communication terminal device to communicate with the communication terminal device participating in the multi-party call and the new communication terminal device. The communication terminal device is connected by a line different from the line on which the multi-party call is performed.
この構成により、多者通話を行っている回線とは別の回線で割り込みに係る2つの通信端末装置を接続するため、多者通話を中断させることなく割り込みに関する処理を行うことが可能な中継装置を実現することができる。 With this configuration, since the two communication terminal devices related to the interruption are connected by a line different from the line on which the multi-party call is performed, the relay apparatus capable of performing the process related to the interruption without interrupting the multi-party call Can be realized.
また、本発明の通信端末装置は、スケーラブル符号化によってレイヤ毎に符号化された符号化情報を受信する受信部と、前記受信部が受信した前記符号化情報に含まれる制御情報に基づいて、スケーラブル復号化によって音声信号を復号化する復号化部と、前記受信部が受信した前記符号化情報に含まれる前記制御情報に基づいて、スケーラブル符号化によって音声信号を符号化する符号化部と、前記符号化部が符号化して得られた前記符号化情報を送信する送信部とを備える構成を有している。 Further, the communication terminal device of the present invention is based on a receiving unit that receives encoded information encoded for each layer by scalable encoding, and control information included in the encoded information received by the receiving unit, A decoding unit that decodes a speech signal by scalable decoding, and a coding unit that encodes a speech signal by scalable coding based on the control information included in the coding information received by the reception unit; The encoding unit includes a transmission unit that transmits the encoded information obtained by encoding.
この構成により、入力された符号化情報を復号化せずに再構成して送信するため、従来の通信装置、通信方法等よりも、処理における計算コストを増大させることなく、さらに、復号化音声の大きな劣化を防ぐ多者通話システムを実現することが可能な通信端末装置を実現することができる。 With this configuration, since the input encoded information is reconstructed and transmitted without decoding, the decoded speech can be further increased without increasing the calculation cost in processing compared to conventional communication apparatuses, communication methods, and the like. It is possible to realize a communication terminal device capable of realizing a multi-party call system that prevents major deterioration of the communication.
また、本発明の信号復号化装置は、スケーラブル符号化によって複数のレイヤで構成された符号化情報から情報源符号および制御情報を分離する符号化情報分離部と、前記制御情報に基づいて前記符号化情報をレイヤ毎に復号化する復号化部とを備えることを特徴とする構成を有している。 The signal decoding apparatus according to the present invention includes an encoded information separation unit that separates an information source code and control information from encoded information configured by a plurality of layers by scalable encoding, and the code based on the control information. And a decoding unit for decoding the conversion information for each layer.
この構成により、制御情報に基づいて符号化情報をレイヤ毎に復号化するため、異なる通信端末装置から送信され異なるレイヤに統合された符号化情報を復号化することが可能な信号復号化装置を実現することができる。 With this configuration, since the encoded information is decoded for each layer based on the control information, a signal decoding apparatus capable of decoding encoded information transmitted from different communication terminal apparatuses and integrated in different layers is provided. Can be realized.
また、本発明の信号復号化装置は、前記復号化部が、基本レイヤから所定レイヤ分の、レイヤ毎に符号化された前記符号化情報を復号化することを特徴とする構成を有している。 Further, the signal decoding apparatus according to the present invention has a configuration in which the decoding unit decodes the encoded information encoded for each layer from a base layer to a predetermined layer. Yes.
この構成により、レイヤ毎に符号化された前記符号化情報を基本レイヤから復号化するため、伝送ビットレートが低下したときでも適切に復号化することが可能な信号復号化装置を実現することができる。 With this configuration, since the encoded information encoded for each layer is decoded from the base layer, it is possible to realize a signal decoding apparatus that can appropriately decode even when the transmission bit rate is reduced. it can.
また、本発明の信号処理方法は、多者通話に参加している各通信端末装置から送信され、スケーラブル符号化によってレイヤ毎に符号化された符号化情報を受信機が受信する受信ステップと、前記受信ステップで各前記通信端末装置から受信した前記符号化情報を、レイヤ単位で組み合わせるための制御情報を、再構成処理部が作成する再構成ステップと、前記再構成処理部が作成した前記制御情報に基づいて、各前記通信端末装置から受信した前記符号化情報を、統合送信部がスケーラブルにレイヤ単位で組み合わせて統合する統合ステップと、前記統合ステップで統合した前記符号化情報を、前記統合送信部が送信する送信ステップとを備えることを特徴とする構成を有している。 The signal processing method of the present invention includes a reception step in which a receiver receives encoded information that is transmitted from each communication terminal device participating in a multi-party call and is encoded for each layer by scalable encoding; A reconstruction step in which a reconstruction processing unit creates control information for combining the encoded information received from each of the communication terminal devices in the reception step in units of layers, and the control created by the reconstruction processing unit Based on the information, an integration step in which the encoded information received from each of the communication terminal devices is integrated and combined in units of layers in an integrated manner, and the encoded information integrated in the integration step is integrated. And a transmission step for transmission by the transmission unit.
この構成により、入力された符号化情報を復号化せずに再構成して送信するため、従来の通信装置、通信方法等よりも、処理における計算コストを増大させることなく、さらに、復号化音声の大きな劣化を防ぐ多者通話システムを実現することが可能な信号処理方法を実現することができる。 With this configuration, since the input encoded information is reconstructed and transmitted without decoding, the decoded speech can be further increased without increasing the calculation cost in processing compared to conventional communication apparatuses, communication methods, and the like. Thus, it is possible to realize a signal processing method capable of realizing a multi-party call system that prevents major deterioration of the communication.
また、本発明の信号処理プログラムは、コンピュータに、多者通話に参加している各通信端末装置から送信され、スケーラブル符号化によってレイヤ毎に符号化された符号化情報を受信する受信ステップと、前記受信ステップで各前記通信端末装置から受信した前記符号化情報を、レイヤ単位で組み合わせるための制御情報を作成する再構成ステップと、前記再構成ステップで作成した前記制御情報に基づいて、前記受信ステップで各前記通信端末装置から受信した前記符号化情報をスケーラブルにレイヤ単位で組み合わせて統合する統合ステップと、前記統合ステップで統合した前記符号化情報を、送信する送信ステップとを実行させることを特徴とする構成を有している。 In addition, the signal processing program of the present invention is a reception step of receiving encoded information that is transmitted from each communication terminal device participating in a multi-party call to a computer and encoded for each layer by scalable encoding; Based on the reconfiguration step of creating control information for combining the encoded information received from each of the communication terminal devices in the reception step in units of layers, and the control information generated in the reconfiguration step, the reception Performing an integration step in which the encoded information received from each of the communication terminal devices in a step is combined and integrated in units of layers, and a transmission step of transmitting the encoded information integrated in the integration step. It has a characteristic configuration.
この構成により、入力された符号化情報を復号化せずに再構成して送信するため、従来の通信装置、通信方法等よりも、処理における計算コストを増大させることなく、さらに、復号化音声の大きな劣化を防ぐ多者通話システムを実現することが可能な信号処理プログラムを実現することができる。 With this configuration, since the input encoded information is reconstructed and transmitted without decoding, the decoded speech can be further increased without increasing the calculation cost in processing compared to conventional communication apparatuses, communication methods, and the like. It is possible to realize a signal processing program capable of realizing a multi-party call system that prevents major deterioration of the communication.
本発明は、入力された符号化情報を復号化せずに再構成して送信するため、従来の通信装置、通信方法等よりも、処理における計算コストを増大させることなく、さらに、復号化音声の大きな劣化を防ぐ多者通話システムを実現することができるという効果を有する中継装置、通信端末装置、信号復号化装置、信号処理方法、および信号処理プログラムを提供することができる。 In the present invention, since the input encoded information is reconstructed and transmitted without decoding, the decoded speech is further increased without increasing the calculation cost in processing compared to conventional communication apparatuses, communication methods, and the like. It is possible to provide a relay device, a communication terminal device, a signal decoding device, a signal processing method, and a signal processing program that have the effect of realizing a multi-party call system that prevents large deterioration of the communication.
以下、本発明の実施の形態について、図面を用いて説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
(第1の実施の形態)
図1は、本発明の実施の形態に係る中継装置および通信端末装置を有する通信システムのブロック構成を示す図である。図1において、通信システムは、多者通話可能な通信端末装置1A〜1N等、中継装置10、および通信端末装置1A〜1N等と中継装置10とを接続する伝送路2A〜2Nを備え、通信端末装置1A〜1Nは、中継装置10を介して相互に多者通話可能な状態となっている。
(First embodiment)
FIG. 1 is a diagram showing a block configuration of a communication system having a relay device and a communication terminal device according to an embodiment of the present invention. In FIG. 1, the communication system includes
以下、多者通話機能を実現するという観点から、上記の通信システムを構成する中継装置10について説明する。二者間通話機能に関しては、従来と同様であるため、その説明を省略する。また、符号化および復号化は、CELP(Code−Excited Linear Prediction)方法を用いて、階層的に行われることとする。
Hereinafter, the
ここで、各階層(以下、「レイヤ」という。)の下の方から、それぞれ、「基本レイヤ」、「第1の拡張レイヤ」、「第2の拡張レイヤ」、「第3の拡張レイヤ」等といい、基本レイヤ以外のレイヤを「拡張レイヤ」という。このように階層化することによって、通信速度を表すビットレートが充分確保できるときは、全てのレイヤのデータを送信し、ビットレートが充分確保できなくなったとき、ビットレートに応じて下位のレイヤから所定のレイヤまでのデータを送信し、スケーラビリティを確保するものである。 Here, “base layer”, “first enhancement layer”, “second enhancement layer”, “third enhancement layer” from the bottom of each hierarchy (hereinafter referred to as “layer”), respectively. The layers other than the base layer are called “extended layers”. By hierarchizing in this way, when a sufficient bit rate representing the communication speed can be secured, data of all layers is transmitted, and when a sufficient bit rate cannot be secured, a lower layer is used according to the bit rate. Data up to a predetermined layer is transmitted to ensure scalability.
図2は、本発明の第1の実施の形態に係る中継装置10のブロック構成を示す図である。中継装置10は、図2に示すように、通信端末装置1A〜1N等から送信された信号を受信する受信部11と、受信した信号中に割り込み信号が含まれているか否かを判定する割込判定部12と、上記の割り込み信号に応じて割り込み処理を行う第1の割込パターン処理部20、第2の割込パターン処理部30、および第3の割込パターン処理部40と、受信した信号中の符号化情報(以下、「受信符号化情報」という。)の所定の部分を逐次分離する符号化情報分離部13と、符号化情報分離部13が逐次分離した情報を管理する符号化情報管理部14と、通信端末装置1A〜1N等に送信する符号化情報を再構成する再構成処理部15と、再構成した符号化情報等を統合する符号化情報統合部16aと、統合化した符号化情報を各通信端末装置1A〜1N等に送信する送信部16bと、上記の割り込み信号に応じて接続が切り替わる制御スイッチ18a、18bと、回線接続および回線切断を行う通信処理部19とを備える。ここで、符号化情報統合部16aと送信する送信部16bとを合わせたものを「統合送信部16」という。
FIG. 2 is a diagram illustrating a block configuration of the
受信部11は、各伝送路2A〜2N等を介して各通信端末装置1A〜1N等から送信された信号を受信し、受信した信号を割込判定部12に出力するようになっている。
The receiving
割込判定部12は、受信部11が出力した信号が入力され、入力された信号中に多者通話の参加数を増減させるように通信端末装置の接続を変更するための割り込み信号が含まれているか否かを判定し、割り込み信号が含まれると判定したとき、割り込み信号のパターンを判断し、割り込み信号のパターンに応じて割り込み信号を割込パターン処理部20、30、40に出力し、割り込み信号が含まれないと判定したとき、入力された信号を符号化情報分離部13に出力するようになっている。
The interrupt
以下、特に断る場合を除き、多者通話は、通信端末装置1A〜1N間で行われているものとする。ここで、上記の割り込み信号は、以下の3つのパターンを有する。まず、第1のパターンの割り込み信号は、通信端末装置1A〜1Nが多者通話中に通信端末装置1A〜1N以外の通信端末装置1Zを多者通話に参加させるときに、通信端末装置1A〜1Nのいずれかから送信される参加要求信号である。第2のパターンの割り込み信号は、上記のように多者通話を行っているときに、通信端末装置1A〜1N以外の通信端末装置1Zが、多者通話に参加している通信端末装置1A〜1Nのいずれか(以下、通信端末装置1Aとする。)と通信することを要求する参加要求信号である。第3のパターンの割り込み信号は、上記のように多者通話を行っているときに、多者通話に参加しているいずれかの通信端末装置1A〜1N(以下、通信端末装置1Nとする。)が、多者通話の終了を要求するときに送信する回線切断要求信号である。図2に、割込判定部12が、制御スイッチ18a、18bをそれぞれ端子A、A'側に接続し、第1のパターンの割り込み信号を第1の割込パターン処理部20に出力している様子を示す。
Hereinafter, unless otherwise specified, it is assumed that the multi-party call is performed between the
符号化情報分離部13は、割込判定部12から出力された信号が入力され、入力された信号に含まれる受信符号化情報を情報源符号の成分(以下、「情報源符号成分」という。)と制御情報の成分(以下、「制御情報成分」という。)とに逐次分離し、逐次分離した情報源符号成分と制御情報成分を符号化情報管理部14に出力する。
The encoded
ここで、情報源符号とは、各通信端末装置1A〜1Nから送信された通話内容等の符号化された音声情報をいう。また、制御情報とは、各通信端末装置1A〜1Nが送信する際の伝送ビットレートの情報(以下、「端末送信モード情報」という。)を含む、情報源符号に関する情報、誤り訂正情報、誤り検出情報等をいう。
Here, the information source code refers to encoded voice information such as call contents transmitted from each of the
符号化情報管理部14は、符号化情報分離部13が出力した情報源符号成分と制御情報成分が入力され、多者通話に参加している各通信端末装置1A〜1Nから各時間帯で送信された上記の情報源符号成分と制御情報成分を逐次蓄積して管理し、各通信端末装置1A〜1Nから同一時間帯に送信された上記の情報源符号と制御情報が得られたとき、蓄積して得られた情報源符号と制御情報を再構成処理部15に出力するようになっている。
The encoded
再構成処理部15は、符号化情報管理部14が出力した上記の同一時間帯の情報源符号と制御情報、および、割込パターン処理部20、30、40からの出力(以下、「割込処理出力」という。)が入力され、中継装置10に設定されている制御パラメータに基づいて、各通信端末装置1A〜1N等に送信する情報源符号および制御情報を再構成し、再構成して得られた情報(情報源符号および制御情報)を符号化情報統合部16aに出力する。ここで、制御パラメータは、通信端末装置1A〜1N等毎に設定された各通信端末装置1A〜1N等に送信する際の伝送ビットレートを含む所定のパラメータであり、中継装置10内に設定される(再構成処理部15に設定されるものとする。)。また、割込パターン処理部20、30、40からの割込処理出力が再構成処理部15に入力されたとき、上記の制御パラメータは、割込処理出力に応じて更新される。
The
以下に、再構成処理部15が、制御パラメータに基づいて各通信端末装置1A〜1N等に送信する情報源符号を再構成する処理について詳細に説明する。まず、再構成処理部15は、再構成処理部15内に設定されている制御パラメータを参照し、各通信端末装置1A〜1Nから送信された情報源符号から必要なレイヤ分の情報源符号を抜き出す。このとき、各通信端末装置1A〜1Nに対して設定された制御パラメータのうちの伝送ビットレートが、受信符号化情報中の端末送信モード情報が示す伝送ビットレートよりも大きいときは、受信の伝送ビットレートに応じたレイヤ分の情報源符号を抜き出す。
Below, the process which the
レイヤ数が4で、伝送ビットレートがBR1、BR2、BR3、およびBR4(BR1<BR2<BR3<BR4)をとりうる通信形態を例にとり説明する。再構成処理部15は、例えば、通信端末装置1Aに対して設定された伝送ビットレートがBR2であり、通信端末装置1Aから受信した受信符号化情報中の端末送信モード情報が示す伝送ビットレートがBR3であるとき、再構成処理部15は、低い方の伝送ビットレートに対応するように、基本レイヤと第1拡張レイヤの情報源符号(以下、それぞれ、「基本レイヤ情報源符号」、「第1拡張レイヤ情報源符号」という。)を選択し抜き出す。
Description will be made by taking as an example a communication mode in which the number of layers is 4 and the transmission bit rates are BR1, BR2, BR3, and BR4 (BR1 <BR2 <BR3 <BR4). In the
逆に、通信端末装置1Aに対して設定された伝送ビットレートがBR3であり、通信端末装置1Aから受信した受信符号化情報中の端末送信モード情報が示す伝送ビットレートがBR2であるとき、再構成処理部15は、上記と同様に、低い方の伝送ビットレートに対応するように、基本レイヤ情報源符号と第1拡張レイヤ情報源符号を選択し抜き出す。
Conversely, when the transmission bit rate set for the
再構成処理部15は、通信端末装置1A〜1N毎に受信符号化情報から各レイヤの情報源符号を抜き出したとき、抜き出した情報源符号と制御情報とを再構成し、再構成して得られた情報を符号化情報統合部16aに出力する。具体的には、多者通話に参加中のある通信端末装置(通信端末装置1Aとする)に対して伝送する情報源符号は、全通信端末装置1A〜1Nからこの通信端末装置1Aを除いた通信端末装置1B〜1Nから出力された各情報源符号から、上記の処理で抜き出した各レイヤの情報源符号とする。また、各通信端末装置1A〜1Nに送信する制御情報は、以下に示す中継装置送信モード情報および情報源構成情報から成る。
When the
まず、中継装置送信モード情報とは、各通信端末装置1A〜1Nへの送信の際の伝送ビットレートを指示する情報であり、予め定められた複数の伝送ビットレートの中から1つ選択される。なお、本発明の第1の実施の形態においては、中継装置送信モード情報は、予め定められた4種類の伝送ビットレートBR1、BR2、BR3、BR4(BR1<BR2<BR3<BR4)の値を取り得るものとする。
First, the relay device transmission mode information is information indicating a transmission bit rate at the time of transmission to each of the
また、情報源構成情報とは、各通信端末装置1A〜1Nに送信する情報源符号が、どの通信端末装置1A〜1Nから受信した情報源符号の、どのレイヤの情報源符号で構成されているかを示す情報である。例えば、通信端末装置1Aに送信する情報源符号が、通信端末装置1Bから受信した基本レイヤ情報源符号と第1拡張レイヤ情報源符号、および、通信端末装置1Cから受信した第2拡張レイヤ情報源符号と第3拡張レイヤ情報源符号で構成されている場合、情報源構成情報は「B:L2(base,enh1),C:L2(enh2,enh3)」のように構成される。ここで、通信端末装置ID以下のL2とは、このIDの通信端末装置から受信し、再編成した情報源符号が占めるレイヤ数(占有レイヤ数)を意味し、占有レイヤ数が1つの場合はL1、3つの場合はL3となる。また、占有レイヤ数以下の括弧内は、各情報源符号が送信の際にどのレイヤを占めるかを示す。ここで、base、enh1、enh2、enh3はそれぞれ基本レイヤ情報源符号、第1拡張レイヤ情報源符号、第2拡張レイヤ情報源符号、第3拡張レイヤ情報源符号を意味する。
Also, the information source configuration information is the information source code of which layer of the information source code received from which
次に、第1の割込パターン処理部20、第2の割込パターン処理部30および第3の割込パターン処理部40からの割込処理出力が再構成処理部15に入力されたときに、再構成処理部15が行う制御パラメータの更新処理について説明する。
Next, when the interrupt processing output from the first interrupt
まず、割込パターン処理部20、30、40に割り込み信号が入力されたとき、割り込み信号が入力された割込パターン処理部20、30、40から多者通話に参加する通信端末装置を示す情報(以下、「端末集合情報」という。)を含む割込処理出力が入力される。この端末集合情報は、上記の割込処理出力があった時点で、多者通話に参加する通信端末装置を示す情報である。再構成処理部15は、得られた端末集合情報に基づき、各通信端末装置に送信する符号化情報の各レイヤをどの通信端末装置から受信した情報源符号に割り当てるかを決定する。割込処理出力には、例えば、割込パターン処理部20、30、40に入力された割り込み信号が含まれるのでもよい。この場合、再構成処理部15は、割り込み信号が割込パターン処理部20、30、40から再構成処理部15に入力されたとき、設定されている現在の制御パラメータを維持する。
First, when an interrupt signal is input to the interrupt
具体的には、例えば4層のスケーラブル通信において、通信端末装置1A、1B、1Cの3者間で多者通話が行われているとき、各通信端末装置1A、1B、1Cには、残りの2つの通信端末装置から送られる情報源符号をどのように4層に割り当てるかを決定する。割り当て方法として、例えば、残りの2つの通信端末装置のそれぞれに対して2層ずつ割り当てるのでもよい。この場合、制御パラメータは「A:L2,B:L2,C:L2」と更新される。また、他の割り当て方法として、例えば、各通信端末装置から送信された各符号化情報に基づいて再生される音声の音声レベルと、各通信端末装置との通信に用いる回線の回線状況を含む通信状態に関する情報とに基づいて、レイヤを非均等に割り当てるのでもよい。再構成処理部15は、各通信端末装置に送信する情報源符号の割り当て方を決定した後、各通信端末装置に割り当てたレイヤ数を、新たな制御パラメータとして更新する。
Specifically, for example, in a four-layer scalable communication, when a multi-party call is performed between three
符号化情報統合部16aは、再構成処理部15が出力した、再構成された情報源符号および制御情報が入力され、入力された情報源符号および制御情報を、送信先の通信端末装置1A〜1N等毎に統合して送信部16bに出力するようになっている。
The encoded
送信部16bは、符号化情報統合部16aが通信端末装置1A〜1N等毎に統合して出力した情報源符号および制御情報を各通信端末装置1A〜1N等に送信する。
The transmitting
通信処理部19は、割込パターン処理部20、30、40から出力された信号に応じて回線接続および回線切断を行う。図2において、実線の矢印は信号が流れる方向を示し、破線の矢印は、制御の方向を示す。
The
図3は、本発明の第1の実施の形態に係る第1の割込パターン処理部20のブロック構成を示す図である。第1の割込パターン処理部20は、人数判定部21、第1パターン切替処理部22、接続準備部23、許可判定部24、切断準備部25、第3パターン切替処理部26、第2パターン切替処理部27および制御スイッチ201〜203を有する。
FIG. 3 is a diagram showing a block configuration of the first interrupt
まず、人数判定部21は、割込判定部12が出力した第1のパターンの割り込み信号が入力され、多者通話に現在参加している通信端末装置の数が多者通話可能な通信端末装置の最大数(以下、「最大端末装置数」という。)より小さいか否かを判断し、多者通話に参加している通信端末装置の数が最大端末装置数より小さいときは、制御スイッチ201を端子P1側に接続し、第1パターン切替処理部22に割り込み信号および多者通話に参加している通信端末装置の数を出力する。ここで、上記の最大端末装置数を、例えば、スケーラブル符号化のレイヤ数以下の所定数とすることができる。また、人数判定部21は、現在、多者通話に参加している通信端末装置の数が最大端末装置数より少なくないときは、制御スイッチ201を端子Q1側に接続し、再構成処理部15に割り込み信号および多者通話に参加している通信端末装置の数を出力する。
First, the number determination unit 21 receives a first pattern interrupt signal output from the interrupt
第1パターン切替処理部22は、制御スイッチ201が端子P1側に接続されているとき、人数判定部21が出力した割り込み信号および多者通話に参加している通信端末装置の数が入力され、第1のパターンの割り込み信号に含まれている、通信端末装置1Zを多者通話に参加させる参加要求信号を送信した通信端末装置(以下、通信端末装置1Aとする。)を、多者通話に参加している通信端末装置1A〜1Nから除いた残りの通信端末装置の端末集合情報(1B〜1N)を再構成処理部15に出力する。また、第1パターン切替処理部22は、制御スイッチ201が端子P1側に接続されているとき、第1のパターンの割り込み信号を接続準備部23に出力する。また、第1パターン切替処理部22は、制御スイッチ201が端子Q1側に接続されているとき、何も動作しない。
When the
接続準備部23は、第1パターン切替処理部22が出力した第1のパターンの割り込み信号が入力され、第1のパターンの割り込み信号に含まれる、参加要求信号を送信した通信端末装置1Aおよび参加させる通信端末装置1Zを表す情報を通信処理部19に出力する。また、接続準備部23は、制御スイッチ202に第1のパターンの割り込み信号を出力する。
The
図2に示す通信処理部19は、図3に示す接続準備部23が出力した、参加要求信号を送信した通信端末装置1Aおよび参加させる通信端末装置1Zを表す情報が入力され、通信端末装置1Aと通信端末装置1Zとを、多者通話に用いている回線とは別の回線で接続する。次に、通信処理部19は、上記の2つの通信端末装置1A、1Z間の接続が確立したとき、制御スイッチ202を端子Y1側に接続し、接続が確立しないとき、制御スイッチ202を端子N1側に接続するように制御する。また、通信処理部19は、上記の別回線で2つの通信端末装置1A、1Zが通話中に、通信端末装置1Zからの送信された信号であって多者通話に参加するか否かの参加可否信号を受信したとき、受信した参加可否信号を許可判定部24に出力する。以下、多者通話に参加することを示す信号を「参加承認信号」といい、参加しないことを示す信号を「参加否認信号」という。また、通信処理部19は、参加可否信号を許可判定部24に出力したとき、切断準備部25からの制御により、別回線で行っている通話の切断(終了)処理を行う。
The
許可判定部24は、制御スイッチ202が端子Y1側に接続されているとき、接続準備部23から出力された第1のパターンの割り込み信号、および通信処理部19から出力された参加可否信号が入力される。許可判定部24は、通信処理部19から入力された参加可否信号が参加承認信号であるとき、制御スイッチ203を端子A1側に接続し、第1のパターンの割り込み信号を切断準備部25に出力する。また、許可判定部24は、入力された参加可否信号が参加否認信号であるとき、制御スイッチ203を端子D1側に接続し、第1のパターンの割り込み信号を切断準備部25に出力する。また、許可判定部24は、制御スイッチ202が端子N1側に接続されているときは、何も動作しない。
When the
第2パターン切替処理部27は、制御スイッチ202が端子N1側に接続されているとき、接続準備部23が出力した第1のパターンの割り込み信号が入力され、多者通話に参加している通信端末装置1Aから送信された第1のパターンの割り込み信号に含まれている、通信端末装置1Aを示す情報を現在の端末集合情報(1B〜1N)に加えた端末集合情報(1A〜1N)を再構成処理部15に出力する。また、第2パターン切替処理部27は、制御スイッチ203が端子D1側に接続されているとき、切断準備部25が出力した第1のパターンの割り込み信号が入力され、通信端末装置1Aから送信された第1のパターンの割り込み信号に含まれている、通信端末装置1Aを示す情報を現在の端末集合情報(1B〜1N)に加えた端末集合情報(1A〜1N)を再構成処理部15に出力する。また、第2パターン切替処理部27は、制御スイッチ202が端子N1側に接続され制御スイッチ203が端子D1側に接続されているときは、何も動作しない。
When the
切断準備部25は、許可判定部24が出力した第1のパターンの割り込み信号が入力され、制御スイッチ203が端子D1側に接続されているとき、第2パターン切替処理部27に第1のパターンの割り込み信号を出力する。また、切断準備部25は、制御スイッチ203が端子A1側に接続されているとき、許可判定部24から入力される第1のパターンの割り込み信号を第3パターン切替処理部26に出力する。また、切断準備部25は、通信処理部19に現在別回線で行っている通話の切断(終了)処理を行わせるように制御する。
When the interrupt signal of the first pattern output from the
第3パターン切替処理部26は、制御スイッチ203が端子A1側に接続されているとき、切断準備部25が出力した第1のパターンの割り込み信号が入力され、通信端末装置1Aから送信された第1のパターンの割り込み信号に含まれている、通信端末装置1Aを示す情報と通信端末装置1Zを示す情報を現在の端末集合情報(1B〜1N)に加えた端末集合情報(1A〜1N、1Z)を再構成処理部15に出力する。また、第3パターン切替処理部26は、制御スイッチ203が端子D1側に接続されているとき、何も動作しない。
When the
図4は、本発明の第1の実施の形態に係る第2の割込パターン処理部30のブロック構成を示す図である。第2の割込パターン処理部30は、接続準備部31、第1パターン切替処理部32、許可判定部33、人数判定部34、切断準備部35、37、第3パターン切替処理部36、第2パターン切替処理部38および制御スイッチ39a〜39cを有する。
FIG. 4 is a diagram showing a block configuration of the second interrupt
まず、接続準備部31は、割込判定部12が出力した第2のパターンの割り込み信号が入力され、第2のパターンの割り込み信号に含まれる、通信端末装置1Zが回線接続要求を発信して接続しようとする多者通話中の通信端末装置1A、および通信端末装置1Zを表す情報を通信処理部19に出力する。また、接続準備部31は、制御スイッチ39aに第2のパターンの割り込み信号を出力する。
First, the
図2に示す通信処理部19は、図4に示す接続準備部31が出力した、通信端末装置1A、1Zを表す情報が入力され、通信端末装置1Aと通信端末装置1Zとを、多者通話に用いている回線とは別の回線で接続する。次に、通信処理部19は、上記の2つの通信端末装置1A、1Z間の接続が確立したとき、制御スイッチ39aを端子Y2側に接続し、接続が確立しないとき、制御スイッチ39aを端子N2側に接続するように制御する。
The
また、図2に示す通信処理部19は、上記の別回線で2つの通信端末装置1A、1Zが通話中に、通信端末装置1Aからの参加承認信号または参加否認信号が入力されたとき、参加承認信号または参加否認信号を許可判定部33に出力する。また、通信処理部19は、参加承認信号または参加否認信号を許可判定部33に出力したとき、切断準備部35、37からの制御により、別回線で行っている通話の切断(終了)処理を行う。ただし、ここでは、通信処理部19は、別回線で通信を行っている2つの通信端末装置1A、1Zからの切断要求信号があったときも、回線の切断(終了)処理を行うものとする。
The
図3に示す第1パターン切替処理部32は、制御スイッチ39aが端子Y2側に接続されているとき、接続準備部31が出力した第2のパターンの割り込み信号が入力され、第2のパターンの割り込み信号に含まれる通信端末装置1Aを現在の端末集合(1A〜1N)から除いた端末集合情報(1B〜1N)を再構成処理部15に出力する。また、第1パターン切替処理部32は、制御スイッチ39aが端子Y2側に接続されているとき、第2のパターンの割り込み信号を許可判定部33に出力する。また、第1パターン切替処理部32は、制御スイッチ39aが端子N2側に接続されているとき、何も動作しない。
When the control switch 39a is connected to the terminal Y2 side, the first pattern switching
許可判定部33は、第1パターン切替処理部32が出力する第2のパターンの割り込み信号、および、通信処理部19が出力する参加承認信号または参加否認信号が入力される。許可判定部33は、通信処理部19から参加承認信号が入力されたとき、制御スイッチ39bを端子A2側に接続し、第2のパターンの割り込み信号を人数判定部34に出力する。また、許可判定部33は、通信処理部19から参加否認信号が入力されたとき、制御スイッチ39bを端子D2側に接続し、第2のパターンの割り込み信号を切断準備部37に出力する。
The
人数判定部34は、制御スイッチ39bが端子A2側に接続されているとき、許可判定部33から第2のパターンの割り込み信号が入力される。また、人数判定部34は、多者通話に現在参加している通信端末装置の数と多者通話が可能な最大端末装置数とを比較し、現在、多者通話に参加している通信端末装置の数が最大端末装置数より小さいときは、制御スイッチ39cを端子P2側に接続し、切断準備部35に第2のパターンの割り込み信号を出力する。ここで、上記の最大端末装置数を、例えば、スケーラブル符号化のレイヤ数以下の所定数とすることができる。また、人数判定部34は、現在、多者通話に参加している通信端末装置の数が最大端末装置数より少なくないときは、制御スイッチ39cを端子Q2側に接続し、切断準備部35に第2のパターンの割り込み信号を出力する。
The
切断準備部37は、制御スイッチ39bが端子D2側に接続されているとき、許可判定部33が出力した第2のパターンの割り込み信号が入力され、入力された第2のパターンの割り込み信号を第2パターン切替処理部38に出力する。また、切断準備部37は、制御スイッチ39bが端子D2側に接続されているとき、通信処理部19に現在別回線で行っている通話の切断(終了)処理を行わせるように制御する。また、切断準備部37は、制御スイッチ39bが端子A2側に接続されているとき、何も動作しない。
When the
切断準備部35は、人数判定部34が出力した第2のパターンの割り込み信号が入力され、制御スイッチ39cが端子Q2側に接続されているとき、入力された第2のパターンの割り込み信号を第2パターン切替処理部38に出力し、制御スイッチ39cが端子P2側に接続されているとき、入力された第2のパターンの割り込み信号を第3パターン切替処理部36に出力する。また、切断準備部35は、通信処理部19に現在別回線で行っている通話の切断(終了)処理を行わせるように制御する。
When the interrupt signal of the second pattern output from the
第2パターン切替処理部38は、制御スイッチ39bが端子D2側に接続されているとき、切断準備部37が出力した第2のパターンの割り込み信号が入力され、多者通話に参加している通信端末装置1Zから送信された第2のパターンの割り込み信号に含まれている、通信端末装置1Aを示す情報を現在の端末集合情報(1B〜1N)に加えた端末集合情報(1A〜1N)を再構成処理部15に出力する。また、第2パターン切替処理部38は、制御スイッチ39cが端子Q2側に接続されているとき、切断準備部35が出力した第2のパターンの割り込み信号が入力され、通信端末装置1Aから送信された第1のパターンの割り込み信号に含まれている、通信端末装置1Aを示す情報を現在の端末集合情報(1B〜1N)に加えた端末集合情報(1A〜1N)を再構成処理部15に出力する。また、第2パターン切替処理部38は、制御スイッチ39bが端子D2側に接続され制御スイッチ39cが端子Q2側に接続されているときは、何も動作しない。
When the
第3パターン切替処理部36は、制御スイッチ39cが端子P2側に接続されているとき、切断準備部35が出力した第2のパターンの割り込み信号が入力され、第2のパターンの割り込み信号に含まれている通信端末装置1Aを示す情報、および通信端末装置1Zを示す情報を現在の端末集合情報(1B〜1N)に加えた端末集合情報(1A〜1N、1Z)を再構成処理部15に出力する。また、第3パターン切替処理部36は、制御スイッチ39bが端子D2側に接続されているときは、何も動作しない。
When the
図5は、本発明の第1の実施の形態に係る第3の割込パターン処理部40のブロック構成を示す図である。第3の割込パターン処理部40は、人数判定部41、切断準備部42、第4パターン切替処理部43および制御スイッチ44を有する。
FIG. 5 is a diagram showing a block configuration of the third interrupt
人数判定部41は、割込判定部12が出力した第3のパターンの割り込み信号が入力される。また、人数判定部41は、多者通話に現在参加している通信端末装置の数が2以下か否かを判断し、2以下でないと判断したときは、制御スイッチ44を端子P3側に接続し、切断準備部42に第3のパターンの割り込み信号を出力する。また、人数判定部41は、現在、多者通話に参加している通信端末装置の数が2以下と判断したときは、制御スイッチ44を端子Q3側に接続し、通信処理部19に第3のパターンの割り込み信号を出力する。
The
切断準備部42は、人数判定部41が上記で2以下でないと判断したとき、第3のパターンの割り込み信号が入力され、入力された第3のパターンの割り込み信号を通信処理部19に送信し、第3のパターンの割り込み信号で特定される通信端末装置1Nの切断を要求する。切断準備部42は、また、入力された第3のパターンの割り込み信号を第4パターン切替処理部43に出力する。人数判定部41が上記で2以下であると判断したとき、切断準備部42は、上記の処理を行わない。
When the
第4パターン切替処理部43は、切断準備部42から第3のパターンの割り込み信号が入力されると、第3のパターンの割り込み信号が含む通信端末装置1Nを示す情報を端末集合情報(1A〜1N)から除いた端末集合情報(1A〜1M)を再構成処理部15に出力する。人数判定部41が上記で2以下であると判断したとき、第4パターン切替処理部43は、上記の処理を行わない。
When the third pattern interrupt signal is input from the
図2に示す通信処理部19は、図5に示す人数判定部41が出力した第3のパターンの割り込み信号が入力されたとき、通話の終了処理を行う。通話の終了処理は、2者間で行われる通常の通話の処理と同様に行うことができるため、その説明を省略する。
The
図6は、本発明の第1の実施の形態に係る中継装置10の動作を説明するためのフローチャートである。
FIG. 6 is a flowchart for explaining the operation of
まず、中継装置10の受信部11は、各通信端末装置1A〜1N等からパケットとして送信された信号を受信し、受信した信号を割込判定部12に出力する(S1)。
First, the
次に、中継装置10の割込判定部12は、ステップS1で受信した各通信端末装置からの信号中に多者通話の参加数を増減させるように通信端末装置の接続を変更するための割り込み信号が含まれているか否かを判定し(S2)、割り込み信号が含まれると判定したとき、処理はステップS8に移り、割り込み信号が含まれないと判定したとき、符号化情報を符号化情報分離部13に出力し、処理はステップS3に進む。ここで、上記のステップS2で割り込み信号が含まれると判断したときでも、割り込み信号が含まれない他の受信信号については、処理はステップS3に進む。
Next, the interrupt
ステップS2で割り込み信号が含まれないと判定したとき、中継装置10の符号化情報分離部13は、割込判定部12から出力された受信符号化情報を含む信号が入力され、受信符号化情報を情報源符号成分と制御情報成分とに逐次分離し、逐次分離した情報源符号成分と制御情報成分を符号化情報管理部14に出力する(S3)。
When it is determined in step S2 that the interrupt signal is not included, the encoded
ステップS3で情報源符号成分と制御情報成分を符号化情報管理部14に出力したとき、中継装置10の符号化情報管理部14は、情報源符号と制御情報が得られるまで情報源符号成分と制御情報成分を逐次蓄積する(S4)。
When the information source code component and the control information component are output to the encoded
次に、中継装置10の符号化情報管理部14は、ステップS4で情報源符号成分と制御情報成分を逐次蓄積して情報源符号と制御情報が得られたか否かを判断し(S5)、情報源符号と制御情報が得られていないと判断したとき、上記のステップS1以降の処理を繰り返し、情報源符号と制御情報が得られたと判断したとき、処理はステップS6に進む。
Next, the encoded
ステップS2で割り込み信号を含むと判定したとき、中継装置10の割込判定部12は、割り込み信号のパターンを判断し、割り込み信号のパターンに応じて割り込み信号を割込パターン処理部20、30、40に出力する(S8)。
When it is determined in step S2 that the interrupt signal is included, the interrupt
ステップS8で割り込み信号のパターンが第1のパターンと判断したとき、割込判定部12が第1のパターンの割り込み信号を第1の割込パターン処理部20に出力し、第1の割込パターン処理部20は、後述する第1の割込パターン処理を行い、得られた割込処理出力を再構成処理部15に出力する(S91)。
When it is determined in step S8 that the interrupt signal pattern is the first pattern, the interrupt
ステップS8で割り込み信号のパターンが第2のパターンと判断したとき、割込判定部12が第2のパターンの割り込み信号を第2の割込パターン処理部30に出力し、第2の割込パターン処理部30は、後述する第2の割込パターン処理を行い、得られた割込処理出力を再構成処理部15に出力する(S92)。
When it is determined in step S8 that the interrupt signal pattern is the second pattern, the interrupt
ステップS8で割り込み信号のパターンが第3のパターンと判断したとき、割込判定部12が第3のパターンの割り込み信号を第3の割込パターン処理部40に出力し、第3の割込パターン処理部40は、後述する第3の割込パターン処理を行い、得られた割込処理出力を再構成処理部15に出力する(S93)。
When it is determined in step S8 that the interrupt signal pattern is the third pattern, the interrupt
ステップS5で情報源符号と制御情報が得られたと判断したとき、中継装置10の再構成処理部15は、制御パラメータに基づいて、各通信端末装置1A〜1N等に送信する情報源符号を再構成すると共に制御情報を生成し、符号化情報統合部16aに出力する(S6)。
When it is determined in step S5 that the information source code and the control information have been obtained, the
ステップS6で再構成した情報源符号と生成された制御情報が符号化情報統合部16aに出力されたとき、中継装置10の符号化情報統合部16aは、再構成した情報源符号と生成された制御情報とを各通信端末装置1A〜1N等に送信する(S7)。
When the reconstructed information source code and the generated control information are output to the encoded
図7は、本発明の第1の実施の形態に係る第1の割込パターン処理を説明するためのフローチャートである。 FIG. 7 is a flowchart for explaining the first interrupt pattern processing according to the first embodiment of the present invention.
まず、第1の割込パターン処理部20の人数判定部21は、現在、多者通話に参加している通信端末装置1A〜1Nの数が、多者通話が可能な最大端末装置数より少ないか否かを判断し(S101)、最大端末装置数より少ないと判断したとき、処理はステップS102に進み、最大端末装置数より少なくないと判断したとき、処理はステップS110に移る。
First, the number determination unit 21 of the first interrupt
ステップS101で最大端末装置数より少ないと判断したとき、通信処理部19は、通信端末装置1Aを、多者通話を行っている回線(以下、「多者通話回線」という。)から一時的に切り離し、人数判定部21は、端末集合情報(1B〜1N)を生成して再構成処理部15に出力する(S102)。
When it is determined in step S101 that the number is less than the maximum number of terminal devices, the
ステップS102で通信端末装置1Aを多者通話回線から一時的に切り離したとき、通信処理部19は、新たに多者通話に参加させる通信端末装置1Zの電話番号を通信端末装置1Aから受信する(S103)。
When the
ステップS103で通信端末装置1Aから通信端末装置1Zの電話番号を受信したとき、通信処理部19は、多者通話回線とは別回線で通信端末装置1Aと通信端末装置1Zとの接続処理を行う(S104)。
When the telephone number of the communication terminal device 1Z is received from the
ステップS104で接続処理を行ったとき、通信処理部19は、通信端末装置1Aと通信端末装置1Zとの接続が確立したか否かを判断し(S105)、接続が確立したと判断したとき、処理はステップS106に進み、接続が確立しないと判断したとき、処理はステップS111に移る。
When the connection processing is performed in step S104, the
ステップS105で接続が確立したと判断したとき、通信処理部19は、通信端末装置1Zから参加可否信号を受信する(S106)。
When it is determined in step S105 that the connection has been established, the
ステップS106で通信処理部19が通信端末装置1Zから参加可否信号を受信したとき、許可判定部24は、受信した参加可否信号が参加承認信号か否かを判断し(S107)、受信した参加可否信号が参加承認信号であると判断したとき、処理はステップS108に進み、受信した参加可否信号が参加承認信号でなく参加否認信号であると判断したとき、処理はステップS112に移る。
When the
ステップS107で受信した参加可否信号が参加承認信号であると判断したとき、通信処理部19は、通信端末装置1Aと通信端末装置1Zとの接続を一時的に切り離す(S108)。
When determining that the participation permission signal received in step S107 is a participation approval signal, the
ステップS108で通信端末装置1Aと通信端末装置1Zとの接続を一時的に切り離したとき、通信処理部19は、通信端末装置1Aと通信端末装置1Zとを多者通話に参加させるように多者通話回線に接続する(S109)。
When the connection between the
ステップS105で接続が確立しないと判断したとき、通信処理部19は、通信端末装置1Aを多者通話回線に接続し、通信端末装置1A〜1Nで多者通話ができるようにする(S111)。
When it is determined in step S105 that the connection is not established, the
ステップS107で受信した参加可否信号が参加否認信号であると判断したとき、通信処理部19は、通信端末装置1Aと通信端末装置1Zとの接続を切り離す(S112)。
When determining that the participation permission signal received in step S107 is a participation rejection signal, the
ステップS112で通信端末装置1Aと通信端末装置1Zとの接続を切り離したとき、通信処理部19は、通信端末装置1Aを多者通話回線に接続し、通信端末装置1A〜1Nで多者通話ができるようにする(S113)。
When the connection between the
ステップS101で多者通話に参加している通信端末装置1A〜1Nの数が最大端末装置数より少なくないと判断したとき、ステップS109で通信端末装置1Aと通信端末装置1Zとを多者通話回線に接続したとき、ステップS111で通信端末装置1Aを多者通話回線に接続したとき、または、ステップS113で通信端末装置1Aを多者通話回線に接続したとき、端末集合情報等の割込処理出力を再構成処理部15に出力する(S110)。
When it is determined in step S101 that the number of
ステップS110で生成する割込処理出力は、それぞれ、ステップS101で多者通話に参加している通信端末装置1A〜1Nの数が最大端末装置数より少なくないと判断したときは、第1の割り込み信号であり、ステップS109で通信端末装置1Aと通信端末装置1Zとを多者通話回線に接続したときは、端末集合情報(1A〜1N、1Z)であり、ステップS111で通信端末装置1Aを多者通話回線に接続したとき、および、ステップS113で通信端末装置1Aを多者通話回線に接続したときは、端末集合情報(1A〜1N)である。
When the interrupt processing output generated in step S110 determines that the number of
図8は、本発明の第1の実施の形態に係る第2の割込パターン処理を説明するためのフローチャートである。 FIG. 8 is a flowchart for explaining the second interrupt pattern processing according to the first embodiment of the present invention.
まず、第2の割込パターン処理部30の接続準備部31は、第2のパターンの割り込み信号が入力されたとき、第2のパターンの割り込み信号を通信処理部19に出力し、通信処理部19は、第2のパターンの割り込み信号を送信した通信端末装置1Zと通信端末装置1Zが接続をしようとする通信端末装置(以下、通信端末装置1Aとする。)とを、多者通話回線とは別回線で接続する接続処理を行う(S201)。
First, the
ステップS201で接続処理を行ったとき、通信処理部19は、通信端末装置1Aと通信端末装置1Zとの接続が確立したか否かを判断し(S202)、接続が確立したと判断したとき、処理はステップS203に進み、接続が確立しないと判断したとき、処理はステップS209に移る。
When the connection processing is performed in step S201, the
ステップS202で接続が確立したと判断したとき、通信処理部19は、通信端末装置1Aを、多者通話を行っている回線(以下、「多者通話回線」という。)から一時的に切り離し、端末集合情報(1B〜1N)を生成して再構成処理部15に出力する(S203)。
When it is determined in step S202 that the connection has been established, the
ステップS203で通信端末装置1Aを一時的に切り離したとき、通信処理部19は、通信端末装置1Aから参加可否信号を受信する(S204)。
When the
ステップS204で通信処理部19が通信端末装置1Aから参加可否信号を受信したとき、許可判定部33は、受信した参加可否信号が参加承認信号か否かを判断し(S205)、受信した参加可否信号が参加承認信号であると判断したとき、処理はステップS206に進み、受信した参加可否信号が参加承認信号でなく参加否認信号であると判断したとき、処理はステップS210に移る。
When the
ステップS205で受信した参加可否信号が参加承認信号であると判断したとき、人数判定部34は、多者通話に参加している通信端末装置の数が最大端末装置数より小さいか否かを判断し(S206)、最大端末装置数より小さいと判断したとき、処理はステップS207に進み、最大端末装置数より小さくないと判断したとき、処理はステップS210に移る。
When determining that the participation permission signal received in step S205 is a participation approval signal, the
ステップS206で最大端末装置数より小さいと判断したとき、通信処理部19は、通信端末装置1Aと通信端末装置1Zとの接続を一時的に切り離す(S207)。
When it is determined in step S206 that the number is smaller than the maximum number of terminal devices, the
ステップS207で通信端末装置1Aと通信端末装置1Zとの接続を一時的に切り離したとき、通信処理部19は、通信端末装置1Aと通信端末装置1Zとを多者通話に参加させるように多者通話回線に接続する(S208)。
When the connection between the
ステップS205で参加可否信号が参加否認信号であると判断したとき、通信処理部19は、切断要求信号が入力されるのを待ち(S210)、切断要求信号が入力されたと判断したとき、処理はステップS211に進む。
When it is determined in step S205 that the participation permission / prohibition signal is a participation rejection signal, the
ステップS210で切断要求信号が入力されたと判断したとき、通信処理部19は、通信端末装置1Aと通信端末装置1Zとの接続を一時的に切り離す(S211)。
When determining that the disconnection request signal has been input in step S210, the
ステップS211で通信端末装置1Aと通信端末装置1Zとの接続を一時的に切り離したとき、通信処理部19は、通信端末装置1Aを多者通話に参加させるように多者通話回線に接続する(S212)。
When the connection between the
ステップS202で接続が確立しないと判断したとき、ステップS208で通信端末装置1Aと通信端末装置1Zとを多者通話回線に接続したとき、または、ステップS212で通信端末装置1Aを多者通話回線に接続したとき、端末集合情報等の割込処理出力を再構成処理部15に出力する(S209)。
When it is determined in step S202 that the connection is not established,
ステップS209で生成する割込処理出力は、それぞれ、ステップS202で接続が確立しないと判断したときは、第2の割り込み信号であり、ステップS208で通信端末装置1Aと通信端末装置1Zとを多者通話回線に接続したときは、端末集合情報(1A〜1N、1Z)であり、ステップS212で通信端末装置1Aを多者通話回線に接続したときは、端末集合情報(1A〜1N)である。
The interrupt process output generated in step S209 is a second interrupt signal when it is determined that the connection is not established in step S202, and in step S208, the
図9は、本発明の第1の実施の形態に係る第3の割込パターン処理を説明するためのフローチャートである。 FIG. 9 is a flowchart for explaining a third interrupt pattern process according to the first embodiment of the present invention.
まず、第3の割込パターン処理部40の人数判定部41は、第3のパターンの割り込み信号が入力されたとき、多者通話に参加している通信端末装置1A〜1Nの数が2を超えるか否かを判断し(S301)、2を超えると判断したとき、処理はステップS302に進み、2を超えないと判断したとき、処理はステップS304に移る。
First, when the interrupt signal of the third pattern is input, the
ステップS301で2を超えると判断したとき、通信処理部19は、第3のパターンの割り込み信号を送信した通信端末装置1Nを多者通話回線から切り離し、通信端末装置1A〜1M間の通信に切り替える(S302)。
When determining that the number exceeds 2 in step S301, the
ステップS302で通信端末装置1Nを多者通話回線から切り離したとき、第4パターン切替処理部43は、第3のパターンの割り込み信号が含む通信端末装置1Nを示す情報を端末集合情報(1A〜1N)から除いた端末集合情報(1A〜1M)を再構成処理部15に出力する(S303)。
When the
ステップS301で2以下と判断したとき、人数判定部41は、第3のパターンの割り込み信号を通信処理部19に出力し、通信処理部19は、通信を終了させる処理を行う(S304)。ここで、通信を終了させる処理は、周知であり、ここでは、その説明を省略する。
When it is determined in step S301 that the number is 2 or less, the
以上説明したように、本発明の第1の実施の形態に係る中継装置は、入力された符号化情報を復号化せずに再構成して送信するため、従来の通信装置、通信方法等よりも、通信コストおよび回線使用率を抑え、処理における計算コストを増大させることなく、さらに、復号化音声の大きな劣化を防ぐ多者通話システムを実現することができる。 As described above, since the relay apparatus according to the first embodiment of the present invention reconfigures and transmits input encoded information without decoding, the conventional communication apparatus, communication method, and the like. However, it is possible to realize a multi-party call system that suppresses communication cost and line usage rate, and does not increase calculation cost in processing, and further prevents a large deterioration of decoded speech.
スケーラブル符号化技術を用いて音声・楽音信号等を伝送する中継装置を含めた通信システムにおいて、中継装置内で複数の通信端末装置から送信される符号化情報をレイヤ単位の符号化情報に分割し再構成し、各通信端末装置1A〜1N等に伝送する。これにより、3者以上の多者通話を柔軟に実現することができる。また、符号化情報をレイヤ単位で再構成することにより、中継装置において複数の通信端末装置からの符号化情報を一度復号化し重畳した後再符号化するという従来技術と比べ、復号化信号の著しい品質劣化がない多者通話を実現することができる。
In a communication system including a relay device that transmits a voice / music signal using scalable coding technology, the encoded information transmitted from a plurality of communication terminal devices in the relay device is divided into encoded information in units of layers. It reconfigure | reconstructs and transmits to each
また、過去の送信の伝送ビットレートを含む制御パラメータに基づいて、各通信端末装置に送信する符号化情報を組み合わせるための制御情報を作成するため、新たに伝送ビットレートを検出して制御情報を作成する処理の負荷を軽減することができる。 In addition, based on the control parameters including the transmission bit rate of the past transmission, in order to create control information for combining the encoded information to be transmitted to each communication terminal apparatus, the control information is newly detected by detecting the transmission bit rate. The processing load to be created can be reduced.
また、再生される音声の音声レベルと回線状況を含む通信状態に基づいて制御パラメータを設定するため、受信側で聴き取りやすい音声を再生するレイヤ構成を実現することができる。 Further, since the control parameters are set based on the communication state including the sound level of the sound to be reproduced and the line status, it is possible to realize a layer configuration that reproduces the sound that can be easily heard on the receiving side.
また、多者通話の参加数を変化させるときに制御パラメータを更新するため、制御情報を作成する処理の負荷をさらに軽減することができる。 In addition, since the control parameter is updated when the number of participants in the multiparty call is changed, it is possible to further reduce the processing load for creating the control information.
また、制御パラメータに基づいて符号化情報を選択して組み合わせるため、処理の負荷を軽減することができる。 In addition, since the encoding information is selected and combined based on the control parameter, the processing load can be reduced.
また、同一の時間帯に送信された符号化情報を受信してから次の時間帯に送信された符号化情報を受信するため、処理の明確化を図ることができる。 In addition, since the encoded information transmitted in the next time zone is received after the encoded information transmitted in the same time zone is received, the processing can be clarified.
また、多者通話を行っている回線とは別の回線で割り込みに係る2つの通信端末装置を接続するため、多者通話を中断させることなく割り込みに関する処理を行うことができる。 In addition, since the two communication terminal devices related to the interruption are connected through a line different from the line on which the multi-party call is performed, the processing related to the interruption can be performed without interrupting the multi-party call.
また、多者通話を行っている回線とは別の回線で割り込みに係る2つの通信端末装置を接続するため、多者通話を中断させることなく割り込みに関する処理を行うことができる。 In addition, since the two communication terminal devices related to the interruption are connected through a line different from the line on which the multi-party call is performed, the processing related to the interruption can be performed without interrupting the multi-party call.
また、本発明の第1の実施の形態に係る信号処理方法は、入力された符号化情報を復号化せずに再構成して送信するため、従来の通信装置、通信方法等よりも、処理における計算コストを増大させることなく、さらに、復号化音声の大きな劣化を防ぐ多者通話システムを実現することができる。 In addition, since the signal processing method according to the first embodiment of the present invention reconstructs and transmits input encoded information without decoding, the processing is more efficient than conventional communication devices and communication methods. Further, it is possible to realize a multi-party call system that prevents the decoded speech from being greatly deteriorated without increasing the calculation cost.
なお、本発明の第1の実施の形態では、中継装置が、多者通話を行うための信号処理を行う信号処理動作について説明したが、本発明は、コンピュータにこの信号処理動作を行わせる信号処理プログラムにも同様に適用される。また、信号処理プログラムを、メモリ、ディスク、テープ、CD、DVD等の機械読み取り可能な記録媒体に記録、書き込みをし、動作を行う場合についても、本発明は適用することができ、本実施の形態と同様の作用・効果を得ることができる。 In the first embodiment of the present invention, the signal processing operation in which the relay device performs signal processing for performing multi-party calls has been described. However, the present invention is a signal that causes a computer to perform this signal processing operation. The same applies to the processing program. The present invention can also be applied to a case where a signal processing program is recorded and written on a machine-readable recording medium such as a memory, a disk, a tape, a CD, or a DVD, and the operation is performed. The same action and effect as the form can be obtained.
(第2の実施の形態)
図10は、本発明の第2の実施の形態に係る通信端末装置のブロック構成を示す図である。図10において、通信端末装置1A〜1N等は、符号化情報受信分離部110、制御情報分離部120、復号化部130、符号化部210、および、符号化情報送信統合部230を含むように構成される。以下、各処理ブロックについて詳細に説明する。
(Second Embodiment)
FIG. 10 is a diagram showing a block configuration of a communication terminal apparatus according to the second embodiment of the present invention. In FIG. 10,
符号化情報受信分離部110は、伝送路2A〜2N、2Zを介して中継装置10から送信された符号化情報が入力され、符号化情報から情報源符号(以下、「受信情報源符号」という。)と制御情報とを分離して抽出し、得られた受信情報源符号を復号化部130に出力し、制御情報を制御情報分離部120に出力する。
The encoded information reception /
制御情報分離部120は、符号化情報受信分離部110から制御情報が入力され、制御情報を解析する。制御情報分離部120は、制御情報を解析した後、復号化に利用される情報源符号構成情報と、符号化に利用される伝送モード情報とに分離し、情報源符号構成情報を復号化部130に出力し、伝送モード情報を符号化部210に出力する。ここで、情報源符号構成情報は、情報源符号のレイヤ構成を示す情報であり、伝送モード情報は、伝送ビットレートを含む所定の情報である。具体的には、制御情報分離部120は、制御情報中の情報源符号構成情報を復号化部130に出力し、制御情報中の伝送モード情報を符号化部210に出力する。
The
復号化部130は、符号化情報受信分離部110から受信情報源符号が入力され、また制御情報分離部120から情報源符号構成情報を入力する。復号化部130は、入力された情報源符号構成情報に基づいて情報源符号を復号化し、出力信号を得る。
The
符号化部210は、音声信号等の入力信号が入力されると共に、制御情報分離部120から伝送モード情報が入力され、入力された伝送モード情報に基づいて入力信号を符号化し、送信情報源符号を生成する。符号化部210は、得られた情報源符号、および伝送モード情報を符号化情報送信統合部230に出力する。
The
符号化情報送信統合部230は、符号化部210から情報源符号および伝送モード情報が入力され、入力された情報源符号および伝送モード情報を統合して送信符号化情報を生成し、送信符号化情報を伝送路2A〜2N、2Z経由で中継装置10に出力する。
The encoded information
図11は、本発明の第2の実施の形態に係る符号化部210のブロック構成を示す図である。以下、符号化部210は、入力信号をNサンプルずつのデータに区切り(Nは自然数)、得られたNサンプルのデータを1フレームとしてフレーム毎に符号化を行うものとする。
FIG. 11 is a diagram illustrating a block configuration of an
符号化部210は、符号化動作制御部211、制御スイッチ222a、222b、224a、224b、226a、226b、基本レイヤ符号化部221a、基本レイヤ復号化部221b、第1拡張レイヤ符号化部223a、第1拡張レイヤ復号化部223b、第2拡張レイヤ符号化部225a、第2拡張レイヤ復号化部225b、第3拡張レイヤ符号化部227、および加算器212、213、214を有する。
The
符号化動作制御部211には、伝送モード情報が入力される。符号化動作制御部211は、入力した伝送モード情報に応じて、制御スイッチ222a、222b、224a、224b、226a、226bのオン/オフ制御を行う。具体的には、符号化動作制御部211は、伝送モード情報がBR4である場合、制御スイッチ222a、222b、224a、224b、226a、226bを全てオンにする。
Transmission mode information is input to the encoding
また、符号化動作制御部211は、伝送モード情報がBR3である場合、制御スイッチ222a、222b、224a、224bをオンにし、制御スイッチ226a、226bをオフにする。また、符号化動作制御部211は、伝送モード情報がBR2である場合、制御スイッチ222a、222bをオンにし、制御スイッチ224a、224b、226a、226bをオフにする。
Further, when the transmission mode information is BR3, the encoding
また、符号化動作制御部211は、伝送モード情報がBR1である場合、制御スイッチ222a、222b、224a、224b、226a、226bを全てオフにする。また、符号化動作制御部211は、伝送モード情報を符号化情報送信統合部230に出力する。このように、符号化動作制御部211が伝送モード情報に応じて制御スイッチ群をオン/オフ制御することにより、入力信号の符号化に用いる符号化部の組み合わせが決定される。
Also, when the transmission mode information is BR1, the encoding
基本レイヤ符号化部221aは、音声信号等の入力信号が入力され、入力信号に対してCELPタイプの音声符号化方法を用いて符号化を行って基本レイヤ情報源符号を生成し、生成した基本レイヤ情報源符号を符号化情報送信統合部230および制御スイッチ222bに出力する。なお、基本レイヤ符号化部221aの構成については後述する。
The base
基本レイヤ復号化部221bは、制御スイッチ222bがオンのとき、基本レイヤ符号化部221aから出力された基本レイヤ情報源符号に対してCELPタイプの音声復号化方法を用いて復号化を行って基本レイヤ復号化信号を生成し、生成した基本レイヤ復号化信号を加算器212に出力する。なお、基本レイヤ復号化部221bは、制御スイッチ222bがオフのときには何も動作しない。なお、基本レイヤ復号化部221bの構成については後述する。
When the
加算器212は、制御スイッチ222a、222bがオンのとき、入力信号に、基本レイヤ復号化信号の極性を反転させて加算して第1差分信号を生成し、加算して得られた第1差分信号を第1拡張レイヤ符号化部223aおよび制御スイッチ224aに出力する。なお、加算器212は、制御スイッチ222a、222bがオフのときには何も動作しない。
When the
第1拡張レイヤ符号化部223aは、制御スイッチ222a、222bがオンのとき、加算器212から得られる第1差分信号に対してCELPタイプの音声符号化方法を用いて符号化を行って第1拡張レイヤ情報源符号を生成し、生成した第1拡張レイヤ情報源符号を制御スイッチ224bおよび符号化情報送信統合部230に出力する。なお、第1拡張レイヤ符号化部223aは、制御スイッチ222a、222bがオフのときには何も動作しない。
When the
第1拡張レイヤ復号化部223bは、制御スイッチ224bがオンのとき、第1拡張レイヤ符号化部223aから出力された第1拡張レイヤ情報源符号に対してCELPタイプの音声復号化方法を用いて復号化を行って第1拡張レイヤ復号化信号を生成し、生成した第1拡張レイヤ復号化信号を加算器213に出力する。なお、第1拡張レイヤ復号化部223bは、制御スイッチ224bがオフのときには何も動作しない。
When the
加算器213は、制御スイッチ224a、224bがオンのとき、制御スイッチ224aから得られる第1差分信号に、第1拡張レイヤ復号化信号の極性を反転させて加算して第2差分信号を生成し、生成した第2差分信号を第2拡張レイヤ符号化部225aに出力する。なお、加算器213は、制御スイッチ224a、224bがオフのときには何も動作しない。
When the
第2拡張レイヤ符号化部225aは、制御スイッチ224a、224bがオンのとき、加算器213から出力される第2差分信号に対してCELPタイプの音声符号化方法を用いて符号化を行って第2拡張レイヤ情報源符号を生成し、生成した第2拡張レイヤ情報源符号を符号化情報送信統合部230に出力する。なお、第2拡張レイヤ符号化部225aは、制御スイッチ224a、224bがオフのときには何も動作しない。
When the
第2拡張レイヤ復号化部225bは、制御スイッチ226a、226bがオンのとき、第2拡張レイヤ符号化部225aから出力された第2拡張レイヤ情報源符号に対してCELPタイプの音声復号化方法を用いて復号化を行って第2拡張レイヤ復号化信号を生成し、生成した第2拡張レイヤ復号化信号を加算器214に出力する。なお、第2拡張レイヤ復号化部225bは、制御スイッチ226bがオフのときには何も動作しない。
When the
加算器214は、制御スイッチ226a、226bがオンのとき、制御スイッチ226aから得られる第2差分信号に、第2拡張レイヤ復号化信号の極性を反転させた信号を加算し、加算結果である第3差分信号を第3拡張レイヤ符号化部227に出力する。なお、加算器214は、制御スイッチ226a、226bがオフのときには何も動作しない。
When the
第3拡張レイヤ符号化部227は、制御スイッチ226a、226bがオンのとき、加算器214から出力される第3差分信号に対してCELPタイプの音声符号化方法を用いて符号化を行い、符号化により得られた情報源符号(以下、「第3拡張レイヤ情報源符号」という。)を符号化情報送信統合部230に出力する。なお、第3拡張レイヤ符号化部227は、制御スイッチ226a、226bがオフのときには何も動作しない。
The third enhancement
符号化情報送信統合部230は、基本レイヤ符号化部221a、第1拡張レイヤ符号化部223a、第2拡張レイヤ符号化部225a、および第3拡張レイヤ符号化部227から出力された情報源符号と符号化動作制御部211から出力された伝送モード情報とを統合して符号化情報を生成し、生成した符号化情報を伝送路2Aに出力する。
The encoded information
次に、伝送前符号化情報のデータ構造(ビットストリーム)について図12を用いて説明する。伝送モード情報が伝送ビットレートがBR1を示すとき、符号化情報は、図12(a)に示すように、制御情報、基本レイヤ情報源符号および冗長部によって構成される。伝送モード情報がBR2である場合、符号化情報は、図12(b)に示すように、制御情報、基本レイヤ情報源符号、第1拡張レイヤ情報源符号および冗長部によって構成される。 Next, the data structure (bit stream) of the pre-transmission encoded information will be described with reference to FIG. When the transmission mode information indicates that the transmission bit rate is BR1, the encoded information is composed of control information, a base layer information source code, and a redundant part as shown in FIG. When the transmission mode information is BR2, the encoded information is configured by control information, a base layer information source code, a first enhancement layer information source code, and a redundant part, as shown in FIG. 12 (b).
伝送モード情報が伝送ビットレートがBR3を示すとき、符号化情報は、図12(c)に示すように、制御情報、基本レイヤ情報源符号、第1拡張レイヤ情報源符号、第2拡張レイヤ情報源符号および冗長部によって構成される。伝送モード情報が伝送ビットレートがBR4を示すとき、符号化情報は、図12(d)に示すように、制御情報、基本レイヤ情報源符号、第1拡張レイヤ情報源符号、第2拡張レイヤ情報源符号、第3拡張レイヤ情報源符号および冗長部によって構成される。 When the transmission mode information indicates that the transmission bit rate is BR3, the encoded information includes control information, a base layer information source code, a first enhancement layer information source code, and a second enhancement layer information, as shown in FIG. It consists of a source code and a redundant part. When the transmission mode information indicates that the transmission bit rate is BR4, the encoded information includes control information, a base layer information source code, a first enhancement layer information source code, and a second enhancement layer information, as shown in FIG. It consists of a source code, a third enhancement layer information source code and a redundant part.
ここで、図12中のデータ構造における冗長部とは、ビットストリーム中に用意される冗長的なデータ格納部であり、伝送誤り検出・訂正用のビットおよび、パケットの同期をとるためのカウンタ等に利用される。 Here, the redundant part in the data structure in FIG. 12 is a redundant data storage part prepared in the bit stream, such as a bit for transmission error detection / correction, a counter for synchronizing packets, and the like. Used for
図13は、本発明の第2の実施の形態に係る基本レイヤ符号化部221aのブロック構成を示す図である。以下、基本レイヤ符号化部221aが、CELPタイプの音声符号化方法を用いて音声符号化を行う場合を例にとり説明する。
FIG. 13 is a diagram showing a block configuration of base
基本レイヤ符号化部221aは、前処理手段301と、LPC分析手段302と、LPC量子化手段303と、合成フィルタ304と、加算器305、311と、適応音源符号帳306と、量子化利得生成手段307と、固定音源符号帳308と、乗算器309、310と、聴覚重み付け手段312と、パラメータ決定手段313と、多重化部314とによって構成される。
The base
前処理手段301は、符号化前の入力信号が入力され、入力信号に対し、DC成分を取り除くハイパスフィルタ処理や後続する符号化処理の性能改善につながるような波形整形処理、所謂プリエンファシス処理等の処理を行い、処理して得られた信号XinをLPC分析手段302および加算器305に出力する。
The
LPC分析手段302は、前処理手段301が出力した信号Xinが入力され、信号Xinに対して線形予測分析処理を行って線形予測係数を生成し、得られた線形予測係数をLPC量子化手段303に出力する。 The LPC analysis means 302 receives the signal Xin output from the preprocessing means 301, performs linear prediction analysis processing on the signal Xin to generate linear prediction coefficients, and uses the obtained linear prediction coefficients as LPC quantization means 303. Output to.
LPC量子化手段303は、LPC分析手段302が出力した線形予測係数が入力され、線形予測係数(LPC)に対して量子化処理を行って量子化LPCを生成し、得られた量子化LPCを合成フィルタ304に出力すると共に、合成フィルタ304が量子化LPCに基づいて合成フィルタ(フィルタ合成とあった。)処理を行うことを示す符号Lを多重化部314に出力する。
The
合成フィルタ304は、後述する加算器311からの出力信号と、LPC量子化手段303から出力された線形予測係数とが入力され、量子化LPCに基づいて合成フィルタ処理のフィルタ係数を決定し、加算器311からの出力信号に対して合成フィルタ処理を施して合成信号を生成し、得られた合成信号を加算器305に出力する。
The
加算器305は、前処理手段301が出力した信号Xinと、合成フィルタ304が出力した合成信号とが入力され、合成信号の極性を反転させて信号Xinに加算することにより誤差信号を算出し、得られた誤差信号を聴覚重み付け手段312に出力する。
The
適応音源符号帳306は、後述するパラメータ決定手段313が出力した適応音源ベクトル符号Aが入力され、この適応音源ベクトル符号Aに応じて特定される過去の駆動音源(整合)から1フレーム分のサンプルを適応音源ベクトルとして切り出して乗算器309に出力する。ここで、上記の駆動音源は、過去に加算器311が出力した駆動音源をバッファに記憶しているものとする。
The
量子化利得生成手段307は、後述するパラメータ決定手段313が出力した音源利得符号Gが入力され、入力された音源利得符号Gに応じて量子化適応音源利得と量子化固定音源利得とを特定し、特定した量子化適応音源利得と量子化固定音源利得とをそれぞれ乗算器309と乗算器310とに出力する。ここで、量子化適応音源利得とは、適応音源符号帳306が出力した適応音源ベクトルを増幅するための利得であり、量子化固定音源利得とは、後述する固定音源符号帳308が出力する固定音源ベクトルを増幅するための利得である。
The quantization
固定音源符号帳308は、後述するパラメータ決定手段313が出力した固定音源ベクトル符号Fが入力され、入力された固定音源ベクトル符号Fに応じて特定される形状を有するパルス音源ベクトルに拡散ベクトルを乗算して固定音源ベクトルを生成し、得られた固定音源ベクトルを乗算器310に出力する。
乗算器309は、適応音源符号帳306が出力した適応音源ベクトルと、量子化利得生成手段307が出力した量子化適応音源利得とが入力され、量子化適応音源利得を適応音源ベクトルに乗じて、加算器311に出力する。乗算器310は、固定音源符号帳308が出力した固定音源ベクトルと、量子化利得生成手段307が出力した量子化固定音源利得とが入力され、量子化固定音源利得を固定音源ベクトルに乗じて、加算器311に出力する。
The
加算器311は、乗算器309が出力した利得乗算後の適応音源ベクトルと、乗算器310が出力した固定音源ベクトルとが入力され、適応音源ベクトルと固定音源ベクトルとをベクトル加算して駆動音源を生成し、得られた駆動音源を合成フィルタ304および適応音源符号帳306に出力する。なお、適応音源符号帳306に入力された駆動音源は、バッファに記憶される。
The
聴覚重み付け手段312は、加算器305から出力された誤差信号が入力され、この誤差信号に対して聴覚を考慮した重み付けを行って符号化歪みを生成し、得られた符号化歪みをパラメータ決定手段313に出力する。
The perceptual weighting means 312 receives the error signal output from the
パラメータ決定手段313は、聴覚重み付け手段312から出力された符号化歪みが入力され、この符号化歪みを最小にする適応音源ベクトル、固定音源ベクトルおよび量子化利得を、それぞれ、適応音源符号帳306、固定音源符号帳308および量子化利得生成手段307が有するデータの中から選択して適応音源ベクトル符号A、固定音源ベクトル符号Fおよび音源利得符号Gを生成し、多重化部314に出力する。ここで、適応音源ベクトル符号は、パラメータ決定手段313が選択した適応音源ベクトルを特定する情報であり、固定音源ベクトル符号は固定音源ベクトルを特定する情報であり、音源利得符号は、量子化適応音源利得と量子化固定音源利得を特定する情報である。
The
多重化部314は、LPC量子化手段303が出力した量子化LPCを表す符号Lと、パラメータ決定手段313が出力した適応音源ベクトル符号A、固定音源ベクトル符号Fおよび音源利得符号Gとを入力とし、これらの情報を多重化して基本レイヤ情報源符号を生成して出力する。
The
図11に示す第1拡張レイヤ符号化部223a、第2拡張レイヤ符号化部225a、および第3拡張レイヤ符号化部227の構成の説明については、基本レイヤ符号化部221aと同一であるため、その説明を省略する。ただし、第1拡張レイヤ符号化部223a、第2拡張レイヤ符号化部225a、および第3拡張レイヤ符号化部227に入力される信号と出力される情報源符号とは異なる。
Since the configuration of the first enhancement
図14は、本発明の第2の実施の形態に係る基本レイヤ復号化部221bのブロック構成を示す図である。以下、基本レイヤ復号化部221bが、CELPタイプの音声復号化方法を用いて音声復号化を行う場合を例にとり説明する。
FIG. 14 is a diagram illustrating a block configuration of the base
図14において、基本レイヤ復号化部221bは、多重化分離手段401と、LPC復号化手段402と、合成フィルタ403と、後処理手段404と、適応音源符号帳405と、量子化利得生成手段406と、固定音源符号帳407と、乗算器408、409と、加算器410とを有する。
In FIG. 14, the base
多重化分離手段401は、基本レイヤ復号化部221bに入力された基本レイヤ情報源符号が入力され、基本レイヤ情報源符号から符号L、A、G、Fを分離し、それぞれ、LPC復号化手段402、適応音源符号帳405、量子化利得生成手段406、固定音源符号帳407に出力する。
The multiplexing / separating means 401 receives the base layer information source code input to the base
LPC復号化手段402は、多重化分離手段401が出力した符号Lが入力され、符号Lに基づいて量子化LPCを復号化し、得られた量子化LPCを合成フィルタ403に出力する。
The
適応音源符号帳405は、多重化分離手段401が出力した符号Aが入力され、符号Aで指定される駆動音源の1フレーム分のサンプルを、記憶している過去の駆動音源のうちから選択し、適応音源ベクトルとして乗算器408に出力する。
The
量子化利得生成手段406は、多重化分離手段401が出力した音源利得符号Gが入力され、音源利得符号Gで指定される量子化適応音源利得と量子化固定音源利得を復号化し、量子化適応音源利得を乗算器408に出力し、量子化固定音源利得を乗算器409に出力する。
The quantization gain generation means 406 receives the excitation gain code G output from the multiplexing / separation means 401, decodes the quantization adaptive excitation gain and the quantization fixed excitation gain specified by the excitation gain code G, and performs quantization adaptation. The sound source gain is output to the
固定音源符号帳407は、多重化分離手段401が出力した符号Fが入力され、符号Fで指定される固定音源ベクトルを生成し、生成した固定音源ベクトルを乗算器409に出力する。
The fixed
乗算器408は、適応音源符号帳405が出力した適応音源ベクトルと、量子化利得生成手段406が出力した量子化適応音源利得とが入力され、適応音源ベクトルに量子化適応音源利得を乗算し、利得乗算後の適応音源ベクトルを加算器410に出力する。
The
乗算器409は、固定音源符号帳407が出力した固定音源ベクトルと、量子化利得生成手段406が出力した量子化固定音源利得とが入力され、固定音源ベクトルに量子化固定音源利得を乗算し、利得乗算後の固定音源ベクトルを加算器410に出力する。
The
加算器410は、乗算器408、409から出力された利得乗算後の適応音源ベクトルと固定音源ベクトルとを加算して駆動音源を生成し、得られた駆動音源を合成フィルタ403および適応音源符号帳405に出力する。
合成フィルタ403は、LPC復号化手段402が出力した量子化LPCと、加算器410が出力した駆動音源とが入力され、量子化LPCに基づいてフィルタ係数を決定し、入力された駆動音源のフィルタ合成処理を行い、得られた(合成した)信号を後処理手段404に出力する。
The
後処理手段404は、合成フィルタ403が出力した信号が入力され、入力された信号に対して、ホルマント強調、ピッチ強調等の音声の主観的品質を改善する処理、定常雑音の主観的品質を改善する処理等を施し、基本レイヤ復号化信号として出力する。
The post-processing means 404 receives the signal output from the
図11に示す第1拡張レイヤ復号化部223bおよび第2拡張レイヤ復号化部225bの構成の説明については、基本レイヤ復号化部221bと同一であるため、その説明を省略する。ただし、第1拡張レイヤ復号化部223bおよび第2拡張レイヤ復号化部225bに入力される情報源符号の種類と出力される復号化信号とは異なる。
The description of the configuration of the first enhancement
図15は、本発明の第2の実施の形態に係る復号化部130のブロック構成を示す図である。以下、復号化部130が、CELPタイプの音声復号化方法を用いて音声復号化を行う場合を例にとり説明する。
FIG. 15 is a diagram illustrating a block configuration of the
復号化部130は、符号化情報管理部131と、復号化動作制御部132と、基本レイヤ復号化部133と、第1拡張レイヤ復号化部135と、第2拡張レイヤ復号化部137と、第3拡張レイヤ復号化部139と、制御スイッチ134、136、138と、加算器140〜142と、合成音管理部143とを有する。
The
符号化情報管理部131には、符号化情報受信分離部110が出力した情報源符号と、制御情報分離部120が出力した情報源符号構成情報とが入力される。符号化情報管理部131は、入力された情報源符号構成情報に基づいて、所定データ量の情報源符号が入力されるまで、入力された情報源符号および制御情報を内部メモリに格納する。具体的には、符号化情報管理部131は、多者通話に参加している全通信端末装置1A〜1N等から送信された所定データ量の情報源符号が全て揃うまで格納する。符号化情報管理部131は、また、所定データ量の情報源符号が全て入力されたとき、内部メモリに格納した情報源符号および情報源符号構成情報を復号化動作制御部132に出力する。
The encoded
復号化動作制御部132は、符号化情報管理部131が出力した情報源符号および情報源符号構成情報が入力され、情報源符号構成情報に基づいて、受信した各通信端末装置1A〜1N等からの情報源符号毎に、制御スイッチ134、136、138のオン/オフを制御し、基本レイヤ復号化部133、第1拡張レイヤ復号化部135、第2拡張レイヤ復号化部137および第3拡張レイヤ復号化部139に、対応するレイヤの信号を出力する。
The decoding
具体的には、復号化動作制御部132は、各通信端末装置1A〜1N等毎に、符号化情報管理部131から得られる情報源符号構成情報の占有レイヤ数(L1、L2、...)を参照し、占有レイヤ数が1(情報源符号構成情報がL1)の場合、制御スイッチ134、136、138を全てオフにし、この通信端末装置からの情報源符号を基本レイヤ復号化部133に出力する。また、復号化動作制御部132は、占有レイヤ数が2(情報源符号構成情報がL2)の場合、制御スイッチ134をオンにし、制御スイッチ136、138をオフにし、この通信端末装置からの情報源符号を下位のレイヤから順番に、基本レイヤ復号化部133および第1拡張レイヤ復号化部135にそれぞれ出力する。また、復号化動作制御部132は、占有レイヤ数が3(情報源符号構成情報がL3)の場合、制御スイッチ134、136をオンにし、制御スイッチ138をオフにし、この通信端末装置からの情報源符号を下位のレイヤから順番に、基本レイヤ復号化部133、第1拡張レイヤ復号化部135および第2拡張レイヤ復号化部137にそれぞれ出力する。また、復号化動作制御部132は、占有レイヤ数が4(情報源符号構成情報がL4)の場合、制御スイッチ134、136、138を全てオンにし、この通信端末装置からの情報源符号を下位のレイヤに対応する情報源符号から、基本レイヤ復号化部133、第1拡張レイヤ復号化部135、第2拡張レイヤ復号化部137および第3拡張レイヤ復号化部139にそれぞれ出力する。
Specifically, the decoding
また、復号化動作制御部132は、各通信端末装置1A〜1N等から送信された情報源符号が全て復号化されるまで、得られた各通信端末装置1A〜1N等毎の復号化信号を内部メモリに格納するように、合成音管理部143に制御信号を送り、合成音管理部143の動作を制御する。
In addition, the decoding
例えば、4層のスケーラブル通信によって3者(通信端末装置1A、1B、1C)間通話を行っている状態で、通信端末装置1Aの復号化動作制御部132が受信した情報源符号構成情報が、「B:L2(base,enh1)C:L2(enh2,enh3)」であった場合を例にとり説明する。この場合、復号化動作制御部132は、制御スイッチ134をオンにし、制御スイッチ136、138をオフにし、通信端末装置1Bから伝送された情報源符号である基本レイヤ情報源符号を基本レイヤ復号化部133に出力し、第1拡張レイヤ情報源符号を第1拡張レイヤ復号化部135に出力する。また、復号化動作制御部132は、合成音管理部143に制御信号を出力し、基本レイヤ復号化部133および第1拡張レイヤ復号化部135が復号化して得られた各通信端末装置1B、1Cからの復号化信号を合成音管理部143に記憶させる。次に、復号化動作制御部132は、制御スイッチ134をオンにし、制御スイッチ136、138をオフにし、通信端末装置1Cから伝送された情報源符号である、第2拡張レイヤ情報源符号を基本レイヤ復号化部133に出力し、第3拡張レイヤ情報源符号を第1拡張レイヤ復号化部135に出力する。
For example, the information source code configuration information received by the decoding
基本レイヤ復号化部133は、復号化動作制御部132から出力された基本レイヤ情報源符号等の情報源符号に対してCELPタイプの音声復号化方法を用いて復号化を行い、復号化により得られた復号化信号(以下、「基本レイヤ復号化信号」という。)を加算器142に出力する。
The base
第1拡張レイヤ復号化部135は、制御スイッチ134がオンのとき、復号化動作制御部132から出力された第1拡張レイヤ情報源符号等の情報源符号に対してCELPタイプの音声復号化方法を用いて復号化を行い、復号化により得られた復号化信号(以下、「第1拡張レイヤ復号化信号」という。)を加算器141に出力する。また、第1拡張レイヤ復号化部135は、制御スイッチ134がオフのときは、何も動作しない。
The first enhancement
第2拡張レイヤ復号化部137は、制御スイッチ136がオンのとき、復号化動作制御部132から出力された第2拡張レイヤ情報源符号等の情報源符号に対してCELPタイプの音声復号化方法を用いて復号化を行い、復号化により得られた復号化信号(以下、「第2レイヤ復号化信号」という。)を加算器140に出力する。また、第2拡張レイヤ復号化部137は、制御スイッチ136がオフのときは、何も動作しない。
The second enhancement
第3拡張レイヤ復号化部139は、制御スイッチ138がオンのとき、復号化動作制御部132から出力された第3拡張レイヤ情報源符号等の情報源符号に対してCELPタイプの音声復号化方法を用いて復号化を行い、復号化により得られた復号化信号(以下、「第3拡張レイヤ復号化信号」という。)を加算器140に出力する。また、第3拡張レイヤ復号化部139は、制御スイッチ138がオフのときは、何も動作しない。
Third enhancement
加算器140は、制御スイッチ136、138がオンのとき、第3拡張レイヤ復号化部139から出力された第3拡張レイヤ復号化信号と第2拡張レイヤ復号化部137から出力された第2拡張レイヤ復号化信号とを加算し、加算後の信号を加算器141に出力する。また、加算器140は、制御スイッチ138がオフであり、かつ、制御スイッチ136がオンのとき、第2拡張レイヤ復号化部137から出力された第2拡張レイヤ復号化信号を加算器141に出力する。なお、加算器140は、制御スイッチ136、138がオフのとき、何も動作しない。
When the control switches 136 and 138 are ON, the
加算器141は、制御スイッチ134、136がオンのとき、第2拡張レイヤ復号化部137から出力された第2拡張レイヤ復号化信号と第1拡張レイヤ復号化部135から出力された第1拡張レイヤ復号化信号とを加算し、加算後の信号を加算器142に出力する。また、加算器141は、制御スイッチ136がオフであり、かつ、制御スイッチ134がオンのとき、第1拡張レイヤ復号化部135から出力された第1拡張レイヤ復号化信号を加算器142に出力する。なお、加算器141は、制御スイッチ134、136がオフのとき、何も動作しない。
When the control switches 134 and 136 are on, the
加算器142は、制御スイッチ134がオンのとき、加算器141から出力された復号化信号と基本レイヤ復号化部133から出力された基本レイヤ復号化信号とを加算し、加算後の信号を合成音管理部143に出力する。なお、加算器142は、制御スイッチ134がオフのとき、基本レイヤ復号化部133から得られる基本レイヤ復号化信号を合成音管理部143に出力する。
When the
合成音管理部143は、加算器142から出力される復号化信号が入力され、復号化動作制御部132からの制御に基づき、入力された復号化信号を内部メモリに格納する。また、合成音管理部143は、復号化動作制御部132からの制御に基づき、内部メモリに格納された複数の復号化信号を重畳加算し、得られた加算信号を出力信号として出力する。
The synthesized
具体的には、合成音管理部143は、復号化動作制御部132から制御信号として、制御部(中継装置)から伝送された情報源符号を構成する通信端末装置数を得て、この通信端末装置数分だけ、内部メモリに復号化信号を格納する。合成音管理部143は、指定された通信端末装置数分、復号化信号を格納した後、格納した全ての復号化信号を重畳加算し、得られた加算信号を出力信号として出力する。
Specifically, the synthesized
なお、基本レイヤ復号化部133、第1拡張レイヤ復号化部135、第2拡張レイヤ復号化部137、および第3拡張レイヤ復号化部139の内部構成は、上述した基本レイヤ復号化部221bと同一であり、入力される情報源符号の種類および出力される信号の種類のみが異なるので、その説明は省略する。
The internal configurations of base
以上説明したように、本発明の第2の実施の形態に係る通信端末装置は、入力された符号化情報を復号化せずに再構成して送信するため、従来の通信装置、通信方法等よりも、処理における計算コストを増大させることなく、さらに、復号化音声の大きな劣化を防ぐ多者通話システムを実現することができる。 As described above, since the communication terminal apparatus according to the second embodiment of the present invention reconfigures and transmits input encoded information without decoding, a conventional communication apparatus, communication method, etc. In addition, it is possible to realize a multi-party call system that prevents a large deterioration in decoded speech without increasing the calculation cost in processing.
また、制御情報に基づいて符号化情報をレイヤ毎に復号化するため、異なる通信端末装置から送信され異なるレイヤに統合された符号化情報を復号化することができる。 Further, since the encoded information is decoded for each layer based on the control information, it is possible to decode the encoded information transmitted from different communication terminal apparatuses and integrated in different layers.
また、レイヤ毎に符号化された前記符号化情報を基本レイヤから復号化するため、伝送ビットレートが低下したときでも適切に復号化することができる。 In addition, since the encoded information encoded for each layer is decoded from the base layer, it can be appropriately decoded even when the transmission bit rate is lowered.
また、本発明は階層を限定するものではなく、複数階層で構成された階層的な信号符号化または復号化方法において、下位レイヤでの入力信号と出力信号との差である残差信号を上位レイヤで符号化する場合について適用することができる。 Further, the present invention does not limit the hierarchy, and in the hierarchical signal encoding or decoding method composed of a plurality of hierarchies, the residual signal, which is the difference between the input signal and the output signal in the lower layer, is assigned to the upper layer. This can be applied to the case of encoding in layers.
また、本発明は同時に多者通話可能な通信端末装置数を限定するものではなく、スケーラブル符号化技術の階層数以上の通信端末装置間で多者通話を行う場合についても、階層数以上の通信端末装置から送信される符号化情報を一度復号化し重畳した後再符号化するという技術と組み合わせることで適用することができる。 In addition, the present invention does not limit the number of communication terminal devices capable of simultaneous multi-party calls, and communication when more than the number of hierarchies is performed even when multi-party calls are made between communication terminal devices higher than the number of scalable coding technology layers. The present invention can be applied in combination with a technique in which encoded information transmitted from a terminal device is once decoded and superimposed and then re-encoded.
また、本発明は同時に多者通話中に、各通信端末装置1A〜1N等へのレイヤ数の割り当て方法を限定するものではなく、各通信端末装置1A〜1N等へのレイヤ数の割り当てを出来る限り均等にするような場合の他に、通信端末装置から送信される音声レベルが高い端末、あるいは中継装置間との回線状況が良い端末等に優先的にレイヤ数を割り当てる場合などにも適用することができ、より柔軟な多者通話を実現することができる。
Further, the present invention does not limit the method of assigning the number of layers to each of the
また、本発明は多者通話システムの参加方式、脱退方式を限定するものではなく、本実施の形態では、各通信端末装置1A〜1N等の脱退時に自ら回線切断要求を送信することで脱退していたが、他の通信端末装置により強制的に脱退させられるという場合などにも適用することができる。
In addition, the present invention does not limit the participation method and withdrawal method of the multi-party call system. In this embodiment, the
本発明に係る中継装置、通信端末装置、信号復号化装置、信号処理方法、および信号処理プログラムは、従来の通信装置、通信方法等よりも、処理における計算コストを増大させることなく、さらに、復号化音声の大きな劣化を防ぐ多者通話システムを実現することができるという効果を有し、多者通話が可能な中継装置、通信端末装置、信号復号化装置、信号処理方法、および信号処理プログラム等として有用である。 The relay device, the communication terminal device, the signal decoding device, the signal processing method, and the signal processing program according to the present invention can be further decoded without increasing the calculation cost in processing compared to the conventional communication device, the communication method, and the like. A relay device, a communication terminal device, a signal decoding device, a signal processing method, a signal processing program, and the like that have the effect of realizing a multi-party call system that can prevent a large deterioration in digitized voice Useful as.
1A〜1N 通信端末装置
2A〜2N 伝送路
10 中継装置
11 受信部
12 割込判定部
13 符号化情報分離部
14 符号化情報管理部
15 再構成処理部
16 統合送信部
16a 符号化情報統合部
16b 送信部
18a、18b、39a、39b、39c、44、134、136、138、201、202、203、222a、222b、224a、224b、226a、226b 制御スイッチ
19 通信処理部
20、30、40 割込パターン処理部
21、34、41 人数判定部
22、26、27、32、36、38、43 パターン切替処理部
23、31 接続準備部
24、33 許可判定部
25、35、37、42 切断準備部
110 符号化情報受信分離部
120 制御情報分離部
130 復号化部
131 符号化情報管理部
132 復号化動作制御部
133、221b 基本レイヤ復号化部
135、223b 第1拡張レイヤ復号化部
137、225b 第2拡張レイヤ復号化部
139 第3拡張レイヤ復号化部
140、141、142、212、213、214、305、311、410 加算器
143 合成音管理部
210 符号化部
211 符号化動作制御部
230 符号化情報送信統合部
221a 基本レイヤ符号化部
223a 第1拡張レイヤ符号化部
225a 第2拡張レイヤ符号化部
227 第3拡張レイヤ符号化部
301 前処理手段
302 LPC分析手段
303 LPC量子化手段
304、403 合成フィルタ
306、405 適応音源符号帳
307、406 量子化利得生成手段
308、407 固定音源符号帳
309、310、408、409 乗算器
312 聴覚重み付け手段
313 パラメータ決定手段
314 多重化部
401 多重化分離手段
402 LPC復号化手段
404 後処理手段
1A to 1N Communication terminal devices 2A to 2N Transmission path 10 Relay device 11 Reception unit 12 Interruption determination unit 13 Encoded information separation unit 14 Encoded information management unit 15 Reconfiguration processing unit 16 Integrated transmission unit 16a Encoded information integration unit 16b Transmitter 18a, 18b, 39a, 39b, 39c, 44, 134, 136, 138, 201, 202, 203, 222a, 222b, 224a, 224b, 226a, 226b Control switch 19 Communication processing unit 20, 30, 40 Interrupt Pattern processing unit 21, 34, 41 Number determination unit 22, 26, 27, 32, 36, 38, 43 Pattern switching processing unit 23, 31 Connection preparation unit 24, 33 Permission determination unit 25, 35, 37, 42 Cutting preparation unit 110 Encoding Information Reception Separation Unit 120 Control Information Separation Unit 130 Decoding Unit 131 Encoded Information Management Unit 132 Encoding operation control unit 133, 221b Base layer decoding unit 135, 223b First enhancement layer decoding unit 137, 225b Second enhancement layer decoding unit 139 Third enhancement layer decoding unit 140, 141, 142, 212, 213 , 214, 305, 311, 410 Adder 143 Synthesis sound management unit 210 Coding unit 211 Coding operation control unit 230 Coding information transmission integration unit 221 a Base layer coding unit 223 a First enhancement layer coding unit 225 a Second enhancement Layer coding unit 227 Third enhancement layer coding unit 301 Preprocessing means 302 LPC analysis means 303 LPC quantization means 304, 403 Synthesis filter 306, 405 Adaptive excitation codebook 307, 406 Quantization gain generation means 308, 407 Fixed excitation Codebook 309, 310, 408, 409 Multiplier 312 Satoru weighting means 313 parameter determining means 314 multiplexing unit 401 demultiplexing unit 402 LPC decoding means 404 postprocessing means
Claims (13)
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005208933A JP4936688B2 (en) | 2005-07-19 | 2005-07-19 | Relay device, communication terminal device, signal decoding device, signal processing method, and signal processing program |
US11/995,718 US20090129576A1 (en) | 2005-07-19 | 2006-07-14 | Relay device, communication terminal, signal decoder, signal processing method, and signal processing program |
PCT/JP2006/314039 WO2007010844A1 (en) | 2005-07-19 | 2006-07-14 | Relay device, communication terminal, signal decoder, signal processing method, and signal processing program |
CN2006800325488A CN101258539B (en) | 2005-07-19 | 2006-07-14 | Relay device and signal processing method |
EP06781113A EP1906387A1 (en) | 2005-07-19 | 2006-07-14 | Relay device, communication terminal, signal decoder, signal processing method, and signal processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005208933A JP4936688B2 (en) | 2005-07-19 | 2005-07-19 | Relay device, communication terminal device, signal decoding device, signal processing method, and signal processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007025375A true JP2007025375A (en) | 2007-02-01 |
JP4936688B2 JP4936688B2 (en) | 2012-05-23 |
Family
ID=37668725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005208933A Expired - Fee Related JP4936688B2 (en) | 2005-07-19 | 2005-07-19 | Relay device, communication terminal device, signal decoding device, signal processing method, and signal processing program |
Country Status (5)
Country | Link |
---|---|
US (1) | US20090129576A1 (en) |
EP (1) | EP1906387A1 (en) |
JP (1) | JP4936688B2 (en) |
CN (1) | CN101258539B (en) |
WO (1) | WO2007010844A1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010090019A1 (en) * | 2009-02-04 | 2010-08-12 | パナソニック株式会社 | Connection apparatus, remote communication system, and connection method |
JP2013528832A (en) * | 2010-11-12 | 2013-07-11 | ポリコム,インク. | Scalable audio processing in a multipoint environment |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5340296B2 (en) * | 2009-03-26 | 2013-11-13 | パナソニック株式会社 | Decoding device, encoding / decoding device, and decoding method |
JP5828090B2 (en) * | 2011-04-20 | 2015-12-02 | パナソニックIpマネジメント株式会社 | Relay device |
KR101437386B1 (en) * | 2014-04-15 | 2014-09-05 | 단국대학교 산학협력단 | Mobile relay, means of transportation including thereof and terminal operatiing to the mobile relay |
US20230291511A1 (en) * | 2022-03-10 | 2023-09-14 | Ramesh Annavajjala | Method and Apparatus for Multi-Dimensional Complex-Valued Sample Encoding and Decoding |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0983655A (en) * | 1995-09-14 | 1997-03-28 | Fujitsu Ltd | Voice interactive system |
JP2000174909A (en) * | 1998-12-08 | 2000-06-23 | Nec Corp | Conference terminal controller |
JP2002100994A (en) * | 2000-07-14 | 2002-04-05 | Nokia Mobile Phones Ltd | Scalable encoding method for media stream, scalable encoder and multimedia terminal |
JP2004022194A (en) * | 2002-06-12 | 2004-01-22 | Auto Network Gijutsu Kenkyusho:Kk | Terminal |
JP2004222194A (en) * | 2003-01-17 | 2004-08-05 | Sharp Corp | Telephone device |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07264144A (en) * | 1994-03-16 | 1995-10-13 | Toshiba Corp | Signal compression coder and compression signal decoder |
JPH1097295A (en) | 1996-09-24 | 1998-04-14 | Nippon Telegr & Teleph Corp <Ntt> | Coding method and decoding method of acoustic signal |
US6205124B1 (en) * | 1996-12-31 | 2001-03-20 | Compaq Computer Corporation | Multipoint digital simultaneous voice and data system |
US7139249B2 (en) * | 2001-12-12 | 2006-11-21 | Intel Corporation | Method and apparatus for an audio bridge |
-
2005
- 2005-07-19 JP JP2005208933A patent/JP4936688B2/en not_active Expired - Fee Related
-
2006
- 2006-07-14 WO PCT/JP2006/314039 patent/WO2007010844A1/en active Application Filing
- 2006-07-14 EP EP06781113A patent/EP1906387A1/en not_active Withdrawn
- 2006-07-14 US US11/995,718 patent/US20090129576A1/en not_active Abandoned
- 2006-07-14 CN CN2006800325488A patent/CN101258539B/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0983655A (en) * | 1995-09-14 | 1997-03-28 | Fujitsu Ltd | Voice interactive system |
JP2000174909A (en) * | 1998-12-08 | 2000-06-23 | Nec Corp | Conference terminal controller |
JP2002100994A (en) * | 2000-07-14 | 2002-04-05 | Nokia Mobile Phones Ltd | Scalable encoding method for media stream, scalable encoder and multimedia terminal |
JP2004022194A (en) * | 2002-06-12 | 2004-01-22 | Auto Network Gijutsu Kenkyusho:Kk | Terminal |
JP2004222194A (en) * | 2003-01-17 | 2004-08-05 | Sharp Corp | Telephone device |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010090019A1 (en) * | 2009-02-04 | 2010-08-12 | パナソニック株式会社 | Connection apparatus, remote communication system, and connection method |
US8504184B2 (en) | 2009-02-04 | 2013-08-06 | Panasonic Corporation | Combination device, telecommunication system, and combining method |
US8831932B2 (en) | 2010-07-01 | 2014-09-09 | Polycom, Inc. | Scalable audio in a multi-point environment |
JP2013528832A (en) * | 2010-11-12 | 2013-07-11 | ポリコム,インク. | Scalable audio processing in a multipoint environment |
Also Published As
Publication number | Publication date |
---|---|
WO2007010844A1 (en) | 2007-01-25 |
CN101258539B (en) | 2012-03-21 |
CN101258539A (en) | 2008-09-03 |
JP4936688B2 (en) | 2012-05-23 |
US20090129576A1 (en) | 2009-05-21 |
EP1906387A1 (en) | 2008-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102228994B1 (en) | Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals | |
JP5173795B2 (en) | Scalable encoding apparatus and scalable encoding method | |
JP5542306B2 (en) | Scalable encoding and decoding of audio signals | |
JP5265358B2 (en) | A concept to bridge the gap between parametric multi-channel audio coding and matrix surround multi-channel coding | |
KR101100221B1 (en) | A method and an apparatus for decoding an audio signal | |
JP5046653B2 (en) | Speech coding apparatus and speech coding method | |
JP4999846B2 (en) | Stereo speech coding apparatus, stereo speech decoding apparatus, and methods thereof | |
JP5153791B2 (en) | Stereo speech decoding apparatus, stereo speech encoding apparatus, and lost frame compensation method | |
JP4936688B2 (en) | Relay device, communication terminal device, signal decoding device, signal processing method, and signal processing program | |
JP6010176B2 (en) | Audio signal decoding method and apparatus | |
KR101414412B1 (en) | An apparatus | |
KR20120061828A (en) | Transcoding method, device, apparatus and system | |
JP4216364B2 (en) | Speech encoding / decoding method and speech signal component separation method | |
KR20070042142A (en) | Relay device and signal decoding device | |
CN103548329B (en) | Message register | |
JP3207281B2 (en) | Stereo speech encoding / decoding system, stereo speech decoding device, and single speech / multiple simultaneous speech discrimination device | |
JP4108396B2 (en) | Speech coding transmission system for multi-point control equipment | |
JP2011512564A (en) | Background noise information decoding method and background noise information decoding means | |
JP2006345289A (en) | Repeater and terminal device | |
JP7176418B2 (en) | Multipoint control method, device and program | |
JP7092047B2 (en) | Coding / decoding method, decoding method, these devices and programs | |
JP2008311752A (en) | Encoder, encoding method, program, and recording medium | |
EP2285025A1 (en) | Method and apparatus for coding/decoding a stereo audio signal into a mono audio signal | |
JP2009134187A (en) | Encoder, decoder and method thereof | |
JP2006352306A (en) | Contents data distribution apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080718 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110524 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110722 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120131 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120221 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150302 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |