JP2009094630A - Distribution system and method - Google Patents
Distribution system and method Download PDFInfo
- Publication number
- JP2009094630A JP2009094630A JP2007261066A JP2007261066A JP2009094630A JP 2009094630 A JP2009094630 A JP 2009094630A JP 2007261066 A JP2007261066 A JP 2007261066A JP 2007261066 A JP2007261066 A JP 2007261066A JP 2009094630 A JP2009094630 A JP 2009094630A
- Authority
- JP
- Japan
- Prior art keywords
- terminal
- voice data
- distribution
- data
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、配信サーバと通信端末へのデータの配信、および配信サーバと通信端末との利用者間におけるコミュニケーションを行う際の音声の品質を向上させる技術に関する。 The present invention relates to a technique for improving the quality of voice when data is distributed to a distribution server and a communication terminal, and communication between users of the distribution server and the communication terminal is performed.
テレビ放送などを各通信端末に対して、通信網を介して配信するシステムにおいて、配信側の配信サーバと、受信側の通信端末との間でコミュニケーションを行う場合がある。このとき、配信サーバ、または通信端末におけるマイクロフォンとスピーカとの音響結合から生じるエコーを消去するエコーキャンセラが設けられ、音声の品質を保つようになっている。 In a system that distributes television broadcasting to each communication terminal via a communication network, communication may be performed between a distribution-side distribution server and a reception-side communication terminal. At this time, an echo canceller for canceling an echo generated from acoustic coupling between a microphone and a speaker in the distribution server or the communication terminal is provided to maintain the quality of the voice.
ところで、配信サーバが、そのコミュニケーションの状況についても通信網を介して、各通信端末に配信することにより、コミュニケーションの当事者以外についてもその状況を視聴することができるようなシステムの場合には、通信網を介して配信されるときに発生する遅延の影響を受けることがある。例えば、テレビ放送の音声に含まれる通信端末の利用者の音声は、利用者自らが発声してから遅延して届くことがあり、違和感があるとともに、音響結合により音声の品質の悪化を招くことがあった。このような品質の悪化を改善するために、通信端末の利用者が発言している間には、その通信端末に対して配信サーバから配信される各通信端末からの音声データを遮断して放音させないようにする技術が開示されている(例えば特許文献1)。
しかし、特許文献1に記載の技術においては、複数の通信端末の利用者が発言していた場合、自らの発言に係る音声データを通信端末において遮断するだけでなく、他の通信端末の利用者の発言に係る音声データも遮断してしまうために、通信端末の利用者が発言中には配信サーバからの音声だけしか聞くことができなかった。
However, in the technique described in
本発明は、上述の事情に鑑みてなされたものであり、通信端末の利用者の発言だけをその通信端末において遮断することにより、発言中においても他の通信端末の利用者の発言を聞くことができるとともに、音声の品質を保つことができる配信システムおよび配信方法を提供することを目的とする。 The present invention has been made in view of the above-mentioned circumstances, and by listening only to the speech of the user of the communication terminal at the communication terminal, the speech of the user of another communication terminal can be heard even during the speech. An object of the present invention is to provide a distribution system and a distribution method that can maintain voice quality.
上述の課題を解決するため、本発明は、通信網を介して通信を行う配信サーバと複数の通信端末とを有する配信システムにおいて、前記配信サーバは、前記通信端末に対して、複数のチャンネルにより構成される配信音声データを送信する配信音声データ送信手段と、前記通信端末から、端末音声データを受信する端末音声データ受信手段と、ストリーミング形式の音声データが入力される音声データ入力手段と、前記音声データ入力手段に入力された音声データと前記端末音声データ受信手段が受信した通信端末ごとの端末音声データとの各々について、前記配信音声データの複数のチャンネルの各々に割り当てる割当手段とを具備し、前記通信端末は、ストリーミング形式の端末音声データが入力される端末音声データ入力手段と、前記端末音声データ入力手段に入力された端末音声データを前記配信サーバに送信する端末音声データ送信手段と、前記配信サーバから配信音声データを受信する受信手段と、前記受信手段によって受信された配信音声データの複数チャンネルのうち、前記端末音声データ送信手段によって送信された端末音声データが割り当てられたチャンネルを特定する特定手段と、前記受信手段によって受信された配信音声データの複数チャンネルのうち、前記特定手段が特定したチャンネル以外のチャンネルの配信音声データを出力する出力手段とを具備することを特徴とする配信システムを提供する。 In order to solve the above-described problem, the present invention provides a distribution system including a distribution server that performs communication via a communication network and a plurality of communication terminals. Distribution voice data transmitting means for transmitting the distribution voice data configured; terminal voice data receiving means for receiving terminal voice data from the communication terminal; voice data input means for receiving streaming-format voice data; Allocating means for allocating each of the voice data input to the voice data input means and the terminal voice data for each communication terminal received by the terminal voice data receiving means to each of the plurality of channels of the distributed voice data. The communication terminal includes terminal voice data input means for inputting terminal voice data in a streaming format, Terminal voice data transmitting means for transmitting terminal voice data input to the terminal voice data input means to the distribution server, receiving means for receiving distribution voice data from the distribution server, and distribution voice data received by the receiving means Among the plurality of channels, the specifying means for specifying the channel to which the terminal voice data transmitted by the terminal voice data transmitting means is allocated, and the specifying means among the plurality of channels of the distribution voice data received by the receiving means Output means for outputting delivery audio data of a channel other than the specified channel.
また、別の好ましい態様において、前記端末音声データ受信手段は、端末音声データを受信するときに、当該端末音声データを送信した通信端末を特定する端末情報をさらに受信し、前記配信音声データ送信手段は、前記割当手段によって前記端末音声データに割り当てられたチャンネルと当該端末音声データを送信した通信端末とを対応付けた割当情報を生成し、前記通信端末に当該割当情報をさらに送信し、前記端末音声データ送信手段は、端末音声データを送信するときに、前記配信サーバに自端末を特定する端末情報をさらに送信し、前記受信手段は、前記配信サーバから割当情報をさらに受信し、前記特定手段におけるチャンネルの特定は、前記受信手段によって受信された割当情報に基づいて行われてもよい。 In another preferred aspect, when receiving the terminal voice data, the terminal voice data receiving means further receives terminal information specifying a communication terminal that has transmitted the terminal voice data, and the distributed voice data transmitting means Generates allocation information in which the channel allocated to the terminal voice data by the allocation means is associated with the communication terminal that has transmitted the terminal voice data, and further transmits the allocation information to the communication terminal, The voice data transmitting means further transmits terminal information for specifying its own terminal to the distribution server when transmitting terminal voice data, the receiving means further receives allocation information from the distribution server, and the specifying means The channel may be specified based on the allocation information received by the receiving means.
また、別の好ましい態様において、前記特定手段におけるチャンネルの特定は、前記受信手段によって受信された配信音声データの複数のチャンネル各々が示す音声パターンと前記端末音声データ送信手段によって送信された端末音声データが示す音声パターンとの比較に基づいて行われてもよい。 In another preferred embodiment, the channel in the specifying unit is specified by the voice pattern indicated by each of a plurality of channels of the distribution voice data received by the receiving unit and the terminal voice data transmitted by the terminal voice data transmitting unit. May be performed based on a comparison with the voice pattern indicated by.
また、別の好ましい態様において、前記割当手段は、前記端末音声データ受信手段が受信した通信端末ごとの端末音声データのうち、所定の条件を満たした端末音声データの各々について、前記配信音声データの複数のチャンネルの各々に割り当ててもよい。 In another preferred aspect, the allocating means includes, for each of the terminal voice data satisfying a predetermined condition among the terminal voice data for each communication terminal received by the terminal voice data receiving means, It may be assigned to each of a plurality of channels.
また、別の好ましい態様において、前記割当手段は、前記端末音声データ受信手段が受信した通信端末ごとの端末音声データのうち、所定の条件を満たした端末音声データの各々について、前記配信音声データの複数のチャンネルの各々に割り当て、所定の条件を満たさない端末音声データについては、当該所定の条件を満たさない音声データを合成したデータとして1のチャンネルに割り当ててもよい。 In another preferred aspect, the allocating means includes, for each of the terminal voice data satisfying a predetermined condition among the terminal voice data for each communication terminal received by the terminal voice data receiving means, Terminal audio data that is assigned to each of a plurality of channels and does not satisfy a predetermined condition may be assigned to one channel as synthesized data of audio data that does not satisfy the predetermined condition.
また、本発明は、通信網を介して通信を行う配信サーバと複数の通信端末とを有する配信システムに用いられる方法であって、前記配信サーバにおいて用いられる方法は、前記通信端末に対して、複数のチャンネルにより構成される配信音声データを送信する配信音声データ送信過程と、前記通信端末から、端末音声データを受信する端末音声データ受信過程と、ストリーミング形式の音声データが入力される音声データ入力過程と、前記音声データ入力過程において入力された音声データと前記端末音声データ受信過程によって受信された通信端末ごとの端末音声データとの各々について、前記配信音声データの複数のチャンネルの各々に割り当てる割当過程とを備え、前記通信端末は、ストリーミング形式の端末音声データが入力される端末音声データ入力過程と、前記端末音声データ入力過程において入力された端末音声データを前記配信サーバに送信する端末音声データ送信過程と、前記配信サーバから配信音声データを受信する受信過程と、前記受信過程によって受信された配信音声データの複数チャンネルのうち、前記端末音声データ送信過程によって送信された端末音声データが割り当てられたチャンネルを特定する特定過程と、前記受信過程によって受信された配信音声データの複数チャンネルのうち、前記特定過程によって特定されたチャンネル以外のチャンネルの配信音声データを出力する出力過程とを備えることを特徴とする配信方法を提供する。 In addition, the present invention is a method used in a distribution system having a distribution server and a plurality of communication terminals that communicate via a communication network, and the method used in the distribution server is for the communication terminal, Distribution audio data transmission process for transmitting distribution audio data composed of a plurality of channels, terminal audio data reception process for receiving terminal audio data from the communication terminal, and audio data input for receiving audio data in streaming format Assigning to each of a plurality of channels of the distributed audio data for each of the audio data input in the audio data input process and the terminal audio data for each communication terminal received in the terminal audio data receiving process And the communication terminal receives streaming terminal audio data. Terminal voice data input process, terminal voice data transmission process for transmitting terminal voice data input in the terminal voice data input process to the distribution server, reception process for receiving distribution voice data from the distribution server, and the reception Among a plurality of channels of distribution voice data received by the process, a specifying process for identifying a channel to which the terminal voice data transmitted by the terminal voice data transmission process is assigned, and a distribution voice data received by the reception process And providing an output process of outputting distribution audio data of a channel other than the channel specified by the specifying process among the plurality of channels.
本発明によれば、通信端末の利用者の発言だけをその通信端末において遮断することにより、発言中においても他の通信端末の利用者の発言を聞くことができるとともに、音声の品質を保つことができる配信システムおよび配信方法を提供することができる。 According to the present invention, by blocking only the communication terminal user's remarks at the communication terminal, it is possible to hear the remarks of other communication terminal users even during remarks and to maintain the voice quality. It is possible to provide a distribution system and a distribution method capable of performing the above.
以下、本発明の一実施形態について説明する。 Hereinafter, an embodiment of the present invention will be described.
<実施形態>
本発明の実施形態に係る配信システムは、図1に示すように、配信サーバ1および複数の通信端末として通信端末2−A、2−Bを有する。以下、通信端末2−Aと通信端末2−Bを区別しない場合には、単に通信端末2という。配信サーバ1と通信端末2とは、通信網1000を介して接続され、各種データの送受信を行う。また、配信サーバ1は、複数の通信端末2に対して、マルチキャストでの通信を行うことができる。以下、配信サーバ1、通信端末2の構成について順に説明する。
<Embodiment>
As shown in FIG. 1, the distribution system according to the embodiment of the present invention includes a
配信サーバ1は、図示しないCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などを有する制御部を有し、CPUは、ROMに記憶されたプログラムをRAMにロードして実行する。また、図2に示すように、配信サーバ1は、通信部10、音声出力部12、音声入力部13を有し、CPUによって、デコード部11、チャンネル割当部14、エンコード部15を構成するように、配信サーバ1を制御する。図2は、配信サーバ1の構成を示すブロック図である。
The
通信部10は、有線、無線などによって、通信網1000を介して通信端末2とデータの送受信を行う通信手段である。本実施形態においては、通信端末2へは配信データを送信し、通信端末2からは端末データを受信する。配信データ、端末データについては後述する。
The
デコード部11は、通信部10が通信端末2から受信した端末データに対してデコードを行う。端末データは、後述するように通信端末2においてエンコードが行われた端末音声データと、端末データを送信した通信端末2を特定する端末情報とを有する。デコード部11は、端末データに対してデコードを行うことによって端末音声データと端末情報とを生成して、端末音声データを音声出力部12とチャンネル割当部14とに出力するとともに、チャンネル割当部14には、端末情報についても端末音声データと対応付けて出力する。
The
ここで、通信部10が複数の通信端末2から端末データを受信した場合においては、デコード部11は、通信端末2ごとに区別して端末音声データと端末情報とを出力する。
Here, when the
音声出力部12は、スピーカなどの放音手段を有し、デコード部11から入力されるオーディオデータである端末音声データに基づいて放音する。また、複数の端末音声データが入力された場合には、これらをミキシングして放音する。音声入力部13は、収音を行うマイクロフォンを有し、マイクロフォンの収音に基づいたストリーミング形式のオーディオデータである入力音声データを生成して、チャンネル割当部14に出力する。本実施形態においては、入力音声データは、Lチャンネル、Rチャンネルの2チャンネルにより構成されるオーディオデータとする。
The
チャンネル割当部14は、音声入力部13から入力される入力音声データと、デコード部11から入力される端末音声データとについて、それぞれ異なるチャンネルに割り当てて、複数チャンネルのオーディオデータである配信音声データを生成する。また、各チャンネルとそのチャンネルに割り当てられたオーディオデータの内容を示す割当情報を生成する。オーディオデータの内容とは、端末音声データについては、その端末音声データに係る端末データを送信した通信端末2を示し、通信端末2−Aは通信端末Aと、通信端末2−Bは通信端末Bと示されるものとする。この端末データを送信した通信端末2は、デコード部11から入力された端末情報によって特定される。一方、入力音声データについては、Lチャンネルについては配信サーバLと、Rチャンネルについては配信サーバRとして示されるものとする。
The
本実施形態においては、配信音声データは3チャンネルにより構成されるものとし、割当情報は図3に示すようなテーブルとして生成される。例えば、図3(a)においては、通信端末2から端末データが送信されていない場合を示し、チャンネル1には入力音声データのLチャンネル、チャンネル2には入力音声データのRチャンネルが割り当てられている。このときチャンネル3には割り当てるデータがないから未使用となっている。
In this embodiment, it is assumed that the distribution audio data is composed of three channels, and the allocation information is generated as a table as shown in FIG. For example, FIG. 3A shows a case where terminal data is not transmitted from the
図3(b)においては、通信端末2−Aから端末データが送信されている場合を示し、図3(a)におけるチャンネル3に通信端末2−Aから送信された端末データに係る端末音声データが割り当てられている。一方、図3(c)においては、通信端末2−A、2−Bから端末データが同時に送信されている場合を示し、チャンネル1には入力音声データのLチャンネルとRチャンネルとをミキシングすることにより、1つのチャンネルとして割り当てられ、チャンネル2には通信端末2−Aから送信された端末データに係る端末音声データ、チャンネル3には通信端末2−Bから送信された端末データに係る端末音声データがそれぞれ割り当てられている。なお、通信端末2−A、2−Bから端末データが交互に送信されるような場合には、図3(b)におけるチャンネル3にそれぞれの端末音声データを交互に割り当てるようにすればよい。このように、チャンネル割当部14は、通信端末2からの端末データの受信の状況に応じて、各オーディオデータの各チャンネルへの割り当てを行い、この割り当ては随時行われるから、割当情報の内容についても、割り当てに応じて随時変化する。
FIG. 3B shows a case where terminal data is transmitted from the communication terminal 2-A, and terminal voice data related to the terminal data transmitted from the communication terminal 2-A to the
図2に戻って説明を続ける。エンコード部15は、チャンネル割当部14から入力された配信音声データに対して所定のエンコードを行って配信データを生成する。この配信データには、チャンネル割当部14から入力された割当情報も含まれる。そして、エンコード部15において生成された配信データは、通信部10に出力されて、各通信端末2へ送信される。以上が配信サーバ1の構成の説明である。
Returning to FIG. 2, the description will be continued. The
次に、通信端末2の構成について図4を用いて説明する。図4は、通信端末2の構成を示すブロック図である。
Next, the configuration of the
デコード部21は、通信部20が配信サーバ1から受信した配信データに対してデコードを行う。配信データは、上述したように所定のエンコードが行われた配信音声データと割当情報を有し、デコード部21は、配信データに対してデコードを行うことによって、配信音声データと割当情報とを生成して、ミュート部26に出力する。
The
ミュート部26は、デコード部21から入力された割当情報に基づいて、自らの通信端末2に対応するチャンネルを特定することにより、自らの通信端末2が送信した端末データに係る端末音声データが割り当てられたチャンネルを特定する。ミュート部26は、特定されたチャンネルが存在するときには、デコード部21から入力された配信音声データの複数チャンネルのうち、特定されたチャンネル以外のチャンネルの配信音声データを音声出力部22に出力し、特定されたチャンネルが存在しないときには、全てのチャンネルの配信音声データを音声出力部22に出力する。以下、ミュート部26から出力される配信音声データを出力音声データという。
The
音声出力部22は、スピーカなどの放音手段を有し、ミュート部26から入力される複数チャンネルのオーディオデータである出力音声データに基づいて放音する。ここで、スピーカが1つだけの場合などモノラルによる放音のみに対応している場合には、出力音声データに含まれる各チャンネルに係る音をミキシングして放音する。一方、複数のスピーカが存在する場合などにおいて多チャンネルの放音に対応している場合には、各チャンネルに係る音を放出するスピーカを予め設定しておけばよい。
The
音声入力部23は、収音を行うマイクロフォンを有し、マイクロフォンの収音に基づいたストリーミング形式のオーディオデータである端末音声データを生成して、エンコード部25に出力する。端末情報記憶部24は、自らの通信端末2を特定する端末情報を記憶する記憶手段である。
The
エンコード部25は、音声入力部23から入力された端末音声データに対して所定のエンコードを行って端末データを生成する。また、エンコード部25は、端末情報記憶部24から端末情報を読み出し、この端末データにその端末情報が含まれるようにして、端末データを通信部20に出力する。そして、通信部20は、配信サーバ1へ端末データを送信する。以上が通信端末2の構成の説明である。
The
次に、本発明の実施形態に係る配信システムの動作について説明する。この説明においては、通信端末2−Aの利用者を利用者A、通信端末2−Bの利用者を利用者B、配信サーバ1の利用者を利用者Cという。
Next, the operation of the distribution system according to the embodiment of the present invention will be described. In this description, the user of the communication terminal 2-A is called user A, the user of the communication terminal 2-B is called user B, and the user of the
利用者Cは、配信サーバ1が設置された音楽スタジオにおいて、楽器の生演奏(以下、ライブ演奏という)を行っている。このとき利用者Cは、図示しない配信サーバ1の操作部を操作して、通信部10が配信データの送信を行う一方、端末データの受信を行わないように、CPUに制御させる。
A user C performs a live performance of a musical instrument (hereinafter referred to as a live performance) in a music studio where the
音声入力部13は、ライブ演奏を録音した音声(以下、ライブ音声という)を示す入力音声データを生成してチャンネル割当部14に出力する。一方、通信部10が端末データの受信をしないため、チャンネル割当部14には、端末音声データ、端末情報は入力されない。これにより、チャンネル割当部14は、チャンネル1にライブ音声のLチャンネル、チャンネル2にライブ音声のRチャンネルが割り当てられた配信音声データをエンコード部15に出力するとともに、図3(a)に示すような割当情報を生成し、エンコード部15に出力する。そして、エンコード部15において、配信音声データに対してエンコードを行ったデータと割当情報とを有する配信データが、通信部10を介して、通信端末2−A、2−Bに送信される。
The
一方、通信端末2−A、2−Bの通信部20は配信データを受信し、デコード部21においてデコードが行われ、ミュート部26に配信音声データ、割当情報が入力される。ミュート部26は、割当情報を参照し、自らの通信端末2に対応するチャンネルを特定するが、入力される割当情報は、図3(a)に示すような割当情報であるから、チャンネルを特定することがなく、配信音声データの複数チャンネルの全てのチャンネルをそのまま出力音声データとして音声出力部22に出力する。これにより、通信端末2−A、2−Bにおいては、ライブ音声がステレオで放音され、利用者A、Bはライブ音声を楽しむことができる。
On the other hand, the
そして、利用者Cはライブ演奏を終了して、利用者A、利用者Bに対して、コミュニケーションをとるために、配信サーバ1の操作部を操作して、CPUに通信部10において端末データの受信が行われるように制御させる。また、利用者Cは、音声入力部13を介してその旨を利用者A、Bに対して提案する。ここで、利用者Aが会話を開始すると、通信端末2−Aの音声入力部23は、利用者Aの会話を録音した音声(以下、会話音声Aという)を示す端末音声データ(以下、端末音声データAという)を生成して、エンコード部25に出力する。エンコード部25は、入力された端末音声データAに対してエンコードを行うとともに、通信端末2−Aを示す端末情報を端末情報記憶部24から読み出して端末データ(以下、端末データAという)を生成し、通信部20を介して配信サーバ1に端末データAを送信させる。
Then, the user C finishes the live performance and operates the operation unit of the
配信サーバ1のデコード部11は、通信部10によって受信した端末データAに対してデコードを行い、音声出力部12に端末音声データAを出力して会話音声Aを放音させる。また、チャンネル割当部14には、デコード部11から端末音声データAと通信端末2−Aを示す端末情報とが入力される一方、利用者Cの会話を録音した音声(以下、会話音声Cという)を示す入力音声データが音声入力部13から入力される。
The
チャンネル割当部14は、端末音声データAが新たに入力されたことにより、配信音声データのチャンネル3にその端末音声データAを割り当てるとともに、図3(b)に示すような割当情報を生成してエンコード部15に出力する。そして、エンコード部15によって出力される配信データは、通信部10を介して、通信端末2−A、2−Bに送信される。
When the terminal voice data A is newly input, the
通信端末2−Aは、配信サーバ1から配信データを受信すると、ミュート部26には、図3(b)に示す割当情報、配信音声データが入力される。ミュート部26は、割当情報を参照し、自らの通信端末2−Aを示すチャンネルがチャンネル3であることを特定し、配信音声データの複数のチャンネルのうち、端末音声データAが割り当てられたチャンネル3を除去し、チャンネル3以外のチャンネル1、2を有する出力音声データを音声出力部22に出力する。これにより、音声出力部22からは、会話音声Cが放音され、利用者Aの会話である会話音声Aは放音されないため、利用者Aは自らの発言が遅延した状態で聞かなくてもよいから違和感を生じることがなく、音声の品質を悪化させることがない。
When the communication terminal 2-A receives the distribution data from the
一方、通信端末2−Bにおいては、ミュート部26は、割当情報を参照しても自らの通信端末2−Bを示すチャンネルを特定することがないから、音声出力部22からは、会話音声Aと会話音声Cとが放音され、利用者Aと利用者Cとの双方の会話を聞くことができる。
On the other hand, in the communication terminal 2-B, the
次に、さらに利用者Bも会話を開始し、通信端末2−Bにおける音声入力部23からその会話の音声(以下、会話音声Bという)を録音して端末音声データ(以下、端末音声データBという)が生成されると、配信サーバ1におけるチャンネル割当部14には、音声入力部13から会話音声Cを示す入力音声データが入力されるとともに、デコード部11からは、通信端末2−Aを示す端末情報と端末音声データAとの組、および通信端末2−Bを示す端末情報と端末音声データBとの組が入力される。この結果、チャンネル割当部14は、入力音声データのLチャンネルとRチャンネルをミキシングしたデータをチャンネル1、端末音声データAをチャンネル2、端末音声データBをチャンネル3に割り当てた配信音声データを生成するとともに、図3(c)に示す割当情報を生成する。
Next, the user B also starts a conversation, records the conversation voice (hereinafter referred to as conversation voice B) from the
そして、配信サーバ1においては、会話音声A、会話音声Bが放音され、通信端末2−Aにおいては、会話音声B、会話音声Cが放音され、通信端末2−Bにおいては、会話音声A、会話音声Cが放音されることにより、利用者A、B、Cはそれぞれ自らの発言以外の音声を聞くことができる。
Then, in the
なお、利用者Aが所定時間発言を中止すると、配信サーバ1のチャンネル割当部14に端末音声データAが入力されないようにしてもよい。これは、配信サーバ1側で端末音声データAが示す会話音声Aの音量が所定値以下の状態が所定時間以上続いた場合に利用者Aが発言していないと判断して、チャンネル割当部14に入力されないようにしてもよいし、通信端末2−A側で判断して、端末データが通信部20から送信されないようにしてもよい。そして、チャンネル割当部14に入力される端末音声データが端末音声データBだけになった場合には、チャンネル1を入力音声データのLチャンネル、チャンネル2を入力音声データのRチャンネル、チャンネル3を端末音声データBとして割り当て、図3(b)におけるチャンネル3の内容を通信端末Bとした割当情報を生成するようにして、随時チャンネルの割り当て内容を変更するようにしてもよい。
Note that if the user A stops speaking for a predetermined time, the terminal voice data A may not be input to the
このように、本発明の配信システムは、配信サーバ1は、配信サーバ1において生成した入力音声データと各通信端末2から送信された端末音声データとがチャンネルごとに割り当てられた配信音声データと、その割り当ての内容を示す割当情報とを各通信端末2に送信する。一方、各通信端末2は、割当情報に基づいて、自らの通信端末2が送信した端末データに係る端末音声データが割り当てられたチャンネル以外のチャンネルの配信音声データを放音することにより、その通信端末2の利用者は、自らの発言以外の音声を聞くことができる。これにより、利用者は違和感を生じることなく、また配信サーバ1の利用者と通信端末2の利用者とのコミュニケーションに係る音声の品質を保つことができる。
As described above, in the distribution system of the present invention, the
以上、本発明の実施形態について説明したが、本発明は以下のように、さまざまな態様で実施可能である。 As mentioned above, although embodiment of this invention was described, this invention can be implemented in various aspects as follows.
<変形例1>
上述した実施形態においては、通信端末2は、端末情報を送信し、割当情報を受信することにより、通信端末2のミュート部26は、割当情報に基づいて、配信サーバ1から受信した配信音声データの複数のチャンネルのうち、自らの通信端末2が送信した端末データに係る端末音声データが割り当てられたチャンネルを特定したが、端末情報および割当情報を用いずに、別の方法によって特定してもよい。
<
In the embodiment described above, the
例えば、図5に示すように通信端末2に解析部27を設ける。解析部27は、音声入力部23から端末音声データが入力され、デコード部21から配信音声データが入力される。そして、配信音声データの各チャンネルの音声パターンと、端末音声データの音声パターンとを比較することによって、配信音声データの複数のチャンネルのうち、この端末音声データが割り当てられたチャンネルがあるか否かを判断するとともに、ある場合には、そのチャンネルを特定する。このような音声パターンの比較は、端末音声データに係る音声の音量変化、周波数分布などのスペクトルなどを用いて比較し、双方のスペクトルが一致、または類似の程度を示す類似度が所定値以上であれば、同一とみなすようにすればよい。
For example, an
このとき、端末音声データが音声入力部23から解析部27に入力されてから、配信音声データとしてデコード部21から解析部27に入力されるまでには、処理遅延、通信遅延による時間の遅れがあるから、音声入力部23から解析部27に入力された端末音声データについては、その時間の遅れに相当する時間の遅延処理を施してから、デコード部21から入力される配信音声データの各チャンネルと音声パターンの比較することが望ましい。また、解析部27は、音声入力部23から入力された端末音声データの最初の数秒などの所定の区間を記憶し、デコード部21から入力される配信音声データの各チャンネルの音声パターンと、記憶した所定の区間の端末音声データの音声パターンを比較するようにし、同一とみなせるチャンネルを特定するようにしてもよい。
At this time, there is a time delay due to processing delay and communication delay from when the terminal voice data is input from the
このように、音声入力部23において生成した端末音声データとデコード部21から出力される配信音声データの各チャンネルとの音声パターンを比較することにより、自らの通信端末2が送信した端末データに係る端末音声データが割り当てられたチャンネルを特定すれば、端末情報、割当情報を用いなくても、実施形態と同様な効果を得ることができる。
As described above, the terminal voice data generated by the
<変形例2>
上述した実施形態においては、利用者Cが配信サーバ1の操作部を操作することによって、配信サーバ1が各通信端末2から送信される端末データを受信するか否かを制御し、受信可能な状態であるときには、全ての通信端末2からの端末データを受信可能な状態としていたが、端末データを受信可能とする通信端末2の対象を制限するようにしてもよい。これは、配信サーバ1の操作部を操作することによって通信端末2の制限を行なってもよいし、配信音声データのチャンネル数に応じて、対象となる通信端末2の数を制限してもよい。
<
In the above-described embodiment, the user C operates the operation unit of the
チャンネル数に応じて制限するときには、例えば、チャンネル数が6の場合には、配信サーバ1の入力音声データ用の1チャンネルを最低限確保しておけばよいから、通信端末2の数を5に制限しておけば、すべての端末音声データにチャンネルを割り当てることができる。また、入力音声データ用のチャンネルが3チャンネル必要であれば、通信端末2の数を2に制限しておけばよい。なお、このような制限を行った場合には、各通信端末2と割り当てられるチャンネルとを予め設定しておいてもよい。このとき、入力音声データ用に必要なチャンネルが固定数で変化しなければ、割当情報の内容は固定とすることもできる。
When limiting according to the number of channels, for example, when the number of channels is 6, the number of
<変形例3>
上述した実施形態においては、通信端末2は通信端末2−A、2−Bの2つであったため、配信サーバ1で同時に端末データを受信しても、チャンネル割当部14は、それぞれの端末音声データを各チャンネルに割り当てることができたが、さらに通信端末2の数が多い場合には、以下のようにすればよい。
<
In the above-described embodiment, since there are two
まず、第1の方法として、チャンネル割当部14に入力される複数の端末音声データについて、その音量レベルに基づいて、割り当て可能なチャンネル数(実施形態の場合には、最大2チャンネル)の端末音声データを特定すればよい。例えば、音量レベルが大きい方から2つの端末音声データを特定して割り当てればよい。また、割り当て時点の所定時間前から、割り当て時点までの期間のうち、音量レベルが所定値以上になっている期間が多い順に割り当てるようにしてもよいし、平均音量レベルが大きい順に割り当てるようにしてもよい。そして、所定時間ごと、またはリアルタイムで、この割り当てを行なうようにすればよい。すなわち、所定の条件を設け、その条件を満たさずに割り当てられなかった端末音声データについては、配信音声データに含まれずに除外されるものとすればよい。なお、所定の条件については、音量レベルに基づく条件に限られず、端末音声データから抽出可能な物理量などに基づく条件であれば、どのような条件を用いてもよい。
First, as a first method, for a plurality of terminal audio data input to the
第2の方法として、第1の方法と同様に所定の条件を設けて、その条件を満たした端末音声データについては、1つのチャンネルが割り当てられ、条件を満たさない残りの端末音声データについては、これらのデータを合成して、まとめて1つのチャンネルが割り当てられるようにしてもよい。例えば、音量レベルが最大の端末音声データに1のチャンネルに割り当て、残りの端末音声データについては、ミキシングするなどして合成し、まとめて1のチャンネルに割り当てるようにすればよい。そして、まとめて割り当てられた端末音声データを送信した通信端末2については、割当情報に基づいて、そのチャンネルを音声出力部22に出力してもよいし、出力しないようにしてもよい。音声出力部22に出力したとしても、音量レベルが小さければ音声の品質の悪化は少ないものとすることができる。
As a second method, a predetermined condition is set in the same manner as the first method. For terminal voice data that satisfies the condition, one channel is allocated, and for the remaining terminal voice data that does not satisfy the condition, These data may be combined so that one channel is assigned collectively. For example, the terminal audio data with the maximum volume level may be assigned to one channel, and the remaining terminal audio data may be combined by mixing or the like and collectively assigned to one channel. And about the
第3の方法として、第2の方法のようにまとめて割り当てるときに、配信音声データの1つのチャンネルを時間軸方向に分割して、複数の端末音声データの各々を分割したチャンネルの各々に交互に割り当てるようにしてもよい。この場合は、複数の端末音声データの各々を時間軸方向に圧縮し、割り当てるようにして、時間軸方向のデータの欠落が発生しないようにしてもよい。例えば、2つの端末音声データを1つのチャンネルに割り当てるときには、それぞれの端末音声データを1秒ずつ分割して、それぞれ分割された1秒の端末音声データを時間軸方向に2倍に圧縮して0.5秒ずつの端末音声データとし、交互に1つのチャンネルに割り当てるようにすればよい。この場合、割当情報は0.5秒ずつ変更されることになる。そして、通信端末2におけるミュート部26において、0.5秒に圧縮された端末音声データを1秒に伸長し、自らが送信した端末データに係る端末音声データ以外について、音声出力部22に出力するようにすればよい。このようにすれば、チャンネル数を事実上増加させることができる。
As a third method, when the channels are assigned together as in the second method, one channel of the distribution audio data is divided in the time axis direction, and each of the plurality of terminal audio data is alternately assigned to each of the divided channels. You may make it allocate to. In this case, each of the plurality of terminal audio data may be compressed and allocated in the time axis direction so that no data loss in the time axis direction occurs. For example, when allocating two terminal audio data to one channel, each terminal audio data is divided by 1 second, and each divided 1-second terminal audio data is compressed twice in the time axis direction to 0. The terminal voice data may be assigned every 5 seconds and alternately assigned to one channel. In this case, the allocation information is changed every 0.5 seconds. Then, the
<変形例4>
上述した実施形態において、音声入力部13のマイクロフォンに音声出力部12からの放音が収音されることに伴う音声結合によるエコーの発声を防止するために、音声入力部13にエコーキャンセラ回路を設けてもよい。
<Modification 4>
In the above-described embodiment, an echo canceller circuit is provided in the
1…配信サーバ、2,2−A,2−B…通信端末、10,20…通信部、11,21…デコード部、12,22…音声出力部、13,23…音声入力部、14…チャンネル割当部、15,25…エンコード部、24…端末情報記憶部、26…ミュート部、27…解析部、1000…通信網
DESCRIPTION OF
Claims (6)
前記配信サーバは、
前記通信端末に対して、複数のチャンネルにより構成される配信音声データを送信する配信音声データ送信手段と、
前記通信端末から、端末音声データを受信する端末音声データ受信手段と、
ストリーミング形式の音声データが入力される音声データ入力手段と、
前記音声データ入力手段に入力された音声データと前記端末音声データ受信手段が受信した通信端末ごとの端末音声データとの各々について、前記配信音声データの複数のチャンネルの各々に割り当てる割当手段と
を具備し、
前記通信端末は、
ストリーミング形式の端末音声データが入力される端末音声データ入力手段と、
前記端末音声データ入力手段に入力された端末音声データを前記配信サーバに送信する端末音声データ送信手段と、
前記配信サーバから配信音声データを受信する受信手段と、
前記受信手段によって受信された配信音声データの複数チャンネルのうち、前記端末音声データ送信手段によって送信された端末音声データが割り当てられたチャンネルを特定する特定手段と、
前記受信手段によって受信された配信音声データの複数チャンネルのうち、前記特定手段が特定したチャンネル以外のチャンネルの配信音声データを出力する出力手段と
を具備する
ことを特徴とする配信システム。 In a distribution system having a distribution server that communicates via a communication network and a plurality of communication terminals,
The distribution server
Distribution audio data transmitting means for transmitting distribution audio data constituted by a plurality of channels to the communication terminal;
Terminal voice data receiving means for receiving terminal voice data from the communication terminal;
Audio data input means for inputting audio data in a streaming format;
Allocating means for allocating each of the voice data input to the voice data input means and the terminal voice data for each communication terminal received by the terminal voice data receiving means to each of a plurality of channels of the distributed voice data. And
The communication terminal is
Terminal voice data input means for inputting terminal voice data in a streaming format;
Terminal voice data transmitting means for transmitting terminal voice data input to the terminal voice data input means to the distribution server;
Receiving means for receiving distribution audio data from the distribution server;
A specifying unit for specifying a channel to which the terminal voice data transmitted by the terminal voice data transmitting unit is allocated among a plurality of channels of the distribution voice data received by the receiving unit;
A distribution system comprising: output means for outputting distribution audio data of a channel other than the channel specified by the specifying means among a plurality of channels of the distribution audio data received by the receiving means.
前記配信音声データ送信手段は、前記割当手段によって前記端末音声データに割り当てられたチャンネルと当該端末音声データを送信した通信端末とを対応付けた割当情報を生成し、前記通信端末に当該割当情報をさらに送信し、
前記端末音声データ送信手段は、端末音声データを送信するときに、前記配信サーバに自端末を特定する端末情報をさらに送信し、
前記受信手段は、前記配信サーバから割当情報をさらに受信し、
前記特定手段におけるチャンネルの特定は、前記受信手段によって受信された割当情報に基づいて行われる
ことを特徴とする請求項1に記載の配信システム。 When receiving the terminal voice data, the terminal voice data receiving means further receives terminal information specifying a communication terminal that has transmitted the terminal voice data;
The delivery voice data transmitting unit generates allocation information in which the channel allocated to the terminal voice data by the allocation unit is associated with the communication terminal that has transmitted the terminal voice data, and the allocation information is transmitted to the communication terminal. Send more,
When transmitting the terminal voice data, the terminal voice data transmitting means further transmits terminal information for identifying the terminal itself to the distribution server,
The receiving means further receives allocation information from the distribution server;
2. The distribution system according to claim 1, wherein the channel is specified by the specifying unit based on the allocation information received by the receiving unit.
ことを特徴とする請求項1に記載の配信システム。 The specification of the channel in the specifying means is performed by comparing the sound pattern indicated by each of the plurality of channels of the distribution sound data received by the receiving means with the sound pattern indicated by the terminal sound data transmitted by the terminal sound data transmitting means. The distribution system according to claim 1, wherein the distribution system is based on.
ことを特徴とする請求項1乃至請求項3のいずれかに記載の配信システム。 The assigning means assigns each of the terminal voice data satisfying a predetermined condition among the terminal voice data for each communication terminal received by the terminal voice data receiving means to each of the plurality of channels of the distribution voice data. The distribution system according to any one of claims 1 to 3, wherein:
ことを特徴とする請求項1乃至請求項3のいずれかに記載の配信システム。 The assigning means assigns each of the terminal voice data satisfying a predetermined condition among the terminal voice data for each communication terminal received by the terminal voice data receiving means to each of the plurality of channels of the distribution voice data, 4. The distribution according to claim 1, wherein terminal audio data that does not satisfy a predetermined condition is assigned to one channel as synthesized data of audio data that does not satisfy the predetermined condition. 5. system.
前記配信サーバにおいて用いられる方法は、
前記通信端末に対して、複数のチャンネルにより構成される配信音声データを送信する配信音声データ送信過程と、
前記通信端末から、端末音声データを受信する端末音声データ受信過程と、
ストリーミング形式の音声データが入力される音声データ入力過程と、
前記音声データ入力過程において入力された音声データと前記端末音声データ受信過程によって受信された通信端末ごとの端末音声データとの各々について、前記配信音声データの複数のチャンネルの各々に割り当てる割当過程と
を備え、
前記通信端末は、
ストリーミング形式の端末音声データが入力される端末音声データ入力過程と、
前記端末音声データ入力過程において入力された端末音声データを前記配信サーバに送信する端末音声データ送信過程と、
前記配信サーバから配信音声データを受信する受信過程と、
前記受信過程によって受信された配信音声データの複数チャンネルのうち、前記端末音声データ送信過程によって送信された端末音声データが割り当てられたチャンネルを特定する特定過程と、
前記受信過程によって受信された配信音声データの複数チャンネルのうち、前記特定過程によって特定されたチャンネル以外のチャンネルの配信音声データを出力する出力過程と
を備える
ことを特徴とする配信方法。 A method used in a distribution system having a distribution server and a plurality of communication terminals that communicate via a communication network,
The method used in the distribution server is:
A delivery voice data transmission process of sending delivery voice data composed of a plurality of channels to the communication terminal;
A terminal voice data receiving process for receiving terminal voice data from the communication terminal;
An audio data input process in which streaming audio data is input;
Assigning each of the voice data input in the voice data input process and the terminal voice data for each communication terminal received in the terminal voice data reception process to each of a plurality of channels of the distributed voice data; Prepared,
The communication terminal is
Terminal audio data input process in which streaming terminal audio data is input,
A terminal voice data transmission process for transmitting the terminal voice data input in the terminal voice data input process to the distribution server;
A receiving process of receiving distribution voice data from the distribution server;
A specifying step of identifying a channel to which the terminal voice data transmitted by the terminal voice data transmission step is assigned among a plurality of channels of the distribution voice data received by the reception step;
A distribution method comprising: an output process of outputting distribution audio data of a channel other than the channel specified by the specifying process among a plurality of channels of the distribution audio data received by the receiving process.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007261066A JP2009094630A (en) | 2007-10-04 | 2007-10-04 | Distribution system and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007261066A JP2009094630A (en) | 2007-10-04 | 2007-10-04 | Distribution system and method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009094630A true JP2009094630A (en) | 2009-04-30 |
Family
ID=40666185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007261066A Pending JP2009094630A (en) | 2007-10-04 | 2007-10-04 | Distribution system and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009094630A (en) |
-
2007
- 2007-10-04 JP JP2007261066A patent/JP2009094630A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9858936B2 (en) | Methods and systems for selecting layers of encoded audio signals for teleconferencing | |
US8718285B2 (en) | Decoding device, coding and decoding device, and decoding method | |
US20050281421A1 (en) | First person acoustic environment system and method | |
US8208653B2 (en) | Method and apparatus for reproducing multi-channel sound using cable/wireless device | |
JP4418493B2 (en) | Frequency-based coding of channels in parametric multichannel coding systems. | |
US20140328485A1 (en) | Systems and methods for stereoisation and enhancement of live event audio | |
US20150055770A1 (en) | Placement of Sound Signals in a 2D or 3D Audio Conference | |
JP2016521380A (en) | Method and system for generating and rendering object-based audio with conditional rendering metadata | |
US9628630B2 (en) | Method for improving perceptual continuity in a spatial teleconferencing system | |
US10009475B2 (en) | Perceptually continuous mixing in a teleconference | |
JP2013528832A (en) | Scalable audio processing in a multipoint environment | |
US20130034247A1 (en) | Method, device, and system for mixing processing of audio signal | |
WO2010105695A1 (en) | Multi channel audio coding | |
US20200174742A1 (en) | Portable system for processing audio signals from multiple sources | |
US6937718B2 (en) | Method and apparatus for personalized conference and hands-free telephony using audio beaming | |
CN111863011A (en) | Audio processing method and electronic equipment | |
JP2009118316A (en) | Voice communication device | |
JPH0974446A (en) | Voice communication controller | |
JP2009094630A (en) | Distribution system and method | |
JP2006180251A (en) | Voice signal processor for enabling callers to perform simultaneous utterance, and program | |
US7489773B1 (en) | Stereo conferencing | |
JP4919077B2 (en) | Voice communication terminal and voice communication system | |
KR20080034253A (en) | Apparatus and method for multi-channel sounding in portable terminal | |
JP2016528829A (en) | Method and apparatus for encoding participants in conference setting | |
US20210377687A1 (en) | Centralized processing of an incoming audio stream |