JP4207701B2 - Call device, call method, and call system - Google Patents
Call device, call method, and call system Download PDFInfo
- Publication number
- JP4207701B2 JP4207701B2 JP2003280435A JP2003280435A JP4207701B2 JP 4207701 B2 JP4207701 B2 JP 4207701B2 JP 2003280435 A JP2003280435 A JP 2003280435A JP 2003280435 A JP2003280435 A JP 2003280435A JP 4207701 B2 JP4207701 B2 JP 4207701B2
- Authority
- JP
- Japan
- Prior art keywords
- gain
- output
- adjusting
- decoding
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Description
本発明は高い音質環境下での通話を可能とする例えばインターネットのようなネットワークを用いた通話装置及び通話方法に関し、通話音声の他にバックグランドミュージック(Back ground music:BGM)或いは効果音(Sound effect:SE)を送受信する通話装置及び通話方法に関する。 The present invention relates to a call device and a call method using a network such as the Internet, which enables a call in a high sound quality environment, and in addition to call voice, background music (BGM) or sound effects (Sound effect: SE) relates to the communication device and call method for transmitting and receiving.
本件出願人は、特開2002−237873号公報にて、音楽データの再生機能を有するデジタル携帯電話機にあって、イヤホンにて音楽を聞いているときに、電話の着信があると音楽に重ねて着信音をイヤホンから放音し、オンフック/オフフックボタンの操作に応じて音楽の再生を停止し、さらに本体の切り替えスイッチの操作に応じて、イヤホンと外部マイクロフォンという組み合わせでの通話にするか、或いは電話機本体のスピーカとマイクロフォンという組み合わせでの通話にするかを切り替えるという技術を開示している。 In Japanese Patent Application Laid-Open No. 2002-237873, the applicant of the present application is a digital mobile phone having a music data reproduction function, and when listening to music with an earphone, if there is an incoming call, it is superimposed on the music. Release the ringtone from the earphone, stop the music playback according to the operation of the on-hook / off-hook button, and make a call with the combination of the earphone and the external microphone according to the operation of the switch on the main unit, or A technique of switching whether to make a call using a combination of a speaker of a telephone body and a microphone is disclosed.
また、近年、インターネットを用いての電話が普及してきたが、通話装置として例えばパーソナルコンピュータを用いた場合には、キーボードやマウス等の操作に備えて使用者の両手をフリーにするこによりハンドセットを用いず、またエコー対策のためにPC本体のスピーカとマイクロホンを用いず、ヘッドフォンとマイクロホンをセットにしたヘッドセットを用いることが多い。 In recent years, telephones using the Internet have become widespread. However, for example, when a personal computer is used as a communication device, a handset can be used by freeing both hands of a user in preparation for operations such as a keyboard and a mouse. In many cases, a headset including a headphone and a microphone is used instead of using a speaker and a microphone of the PC main body for preventing echoes.
特に、PC本体のスピーカとマイクロホンを使った場合、エコーキャンセラーが必要になる。エコーキャンセラーがないと自分が発音した声が通信により相手のスピーカ、相手のマイクロホンという経路で戻ってきてしまい、非常に話しづらくなる。特に、ステレオ音声での通話を行う場合には、益々困難になる。 In particular, when a PC main body speaker and microphone are used, an echo canceller is required. If there is no echo canceller, the voice you pronounced will come back through the other party's speaker and the other party's microphone via communication, making it very difficult to speak. In particular, it becomes more and more difficult to make a stereo voice call.
ところで、インターネット電話にて、前記特許文献1に開示された技術を用いると、ヘッドセットをPCに挿し、耳から離した状態では、着信音が聞こえなくなる。PCの前から退席した状態でも着信音を聞きとることができないと電話がかかってきても判らないことになる。そこで、ヘッドセットとPC内蔵のスピーカの両方から着信音を再生することが考えられる。しかし、スピーカで遠くでも音が聞こえるように設定していて、たまたまヘッドセットをかけて着信したときには、思わず大きな音を着信することになり、使用者にとっては使いかっての悪いものになってしまう。 By the way, when the technique disclosed in Patent Document 1 is used in an Internet telephone, a ring tone cannot be heard when the headset is inserted into the PC and separated from the ear. If you can't hear the ringtone even when you are away from the PC, you won't know if you get a call. Therefore, it is conceivable to reproduce the ringtone from both the headset and the speaker built in the PC. However, if the speaker is set so that sound can be heard even in the distance, and if you accidentally receive a call with a headset, you will receive a loud sound unintentionally, making it unusable for the user.
携帯電話装置についても同様の事が言える。携帯電話を離れた場所においた場合、着信音を聞こえるように大きな音に設定していて、たまたまヘッドセットをかけて着信したときにも大きな音で着信することになる。 The same is true for mobile phone devices. When the mobile phone is placed away from the mobile phone, it is set to a loud sound so that it can hear the ringtone.
本発明に係る通話装置は、前記課題を解決するために、ネットワークを介して音声による対話のための双方向通信を行う通話装置において、送信系として、収音した音声を電気信号に変換する音声変換手段からの音声信号に可変のゲイン係数を乗じてゲインを調整する第1のゲイン調整手段と、音のデータをファイル単位で記憶している第1の音データ記憶手段と、前記第1の音データ記憶手段から読み出したファイル単位の音データをデコードする第1のデコード手段と、前記第1のデコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第2のゲイン調整手段と、音のデータをファイル単位で記憶している第2の音データ記憶手段と、前記第2の音データ記憶手段から読み出したファイル単位の音データをデコードする第2のデコード手段と、前記第2のデコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第3のゲイン調整手段と、前記第1のゲイン調整手段からの第1の出力と前記第2のゲイン調整手段からの第2の出力と前記第3のゲイン調整手段からの第3の出力とを合成する合成手段と、前記合成手段の合成出力をエンコードするエンコード手段と、前記エンコード手段からのエンコード出力を前記ネットワークに送信する送信手段とを備え、受信系として、前記ネットワークを介して他の通話装置の送信手段から送信されてきたエンコード出力を受信する受信手段と、前記受信手段で受信されたエンコードデータをデコードする受信データデコード手段と、前記受信データデコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第4のゲイン調整手段と、着信音データをファイル単位で記憶している着信音データ記憶手段と、前記着信音データ記憶手段からのデータに可変のゲイン係数を乗じてゲインを調整する第5のゲイン調整手段と、前記第4のゲイン調整手段からの第4の出力と前記第5のゲイン調整手段からの第5の出力とを合成する第2の合成手段と、第2の合成手段の出力に基づいてヘッドフォンを駆動するヘッドフォン再生手段と、前記着信音データ記憶手段からのデータに可変のゲイン係数を乗じてゲインを調整する第6のゲイン調整手段と、前記第6のゲイン調整手段の出力に基づいてスピーカを駆動するスピーカ再生手段とを備える。 Call device according to the present invention, in order to solve the above problems, to convert the communication device that performs two-way communication for voice dialog via the network, a transmission system, the voice picked up into an electrical signal sound First gain adjusting means for adjusting the gain by multiplying the audio signal from the converting means by a variable gain coefficient; first sound data storing means for storing sound data in units of files; and First decoding means for decoding sound data in units of files read from the sound data storage means, and second gain adjusting means for adjusting the gain by multiplying the decode output from the first decoding means by a variable gain coefficient Second sound data storage means for storing sound data in file units, and decoding of sound data in file units read from the second sound data storage means. Second decoding means, a third gain adjusting means for adjusting a gain by multiplying a decode output from the second decoding means by a variable gain coefficient, and a first gain from the first gain adjusting means. Combining means for combining the output, the second output from the second gain adjusting means, and the third output from the third gain adjusting means, and encoding means for encoding the combined output of the combining means; Transmitting means for transmitting the encoded output from the encoding means to the network, and as a receiving system, receiving means for receiving the encoded output transmitted from the transmitting means of another call device via the network; Received data decoding means for decoding encoded data received by the receiving means, and variable to decode output from the received data decoding means A fourth gain adjuster for adjusting the gain by multiplying the gain coefficient, the ringtone data storage means for storing ring tone data in file units, the variable gain coefficient data from the ring tone data storage means A fifth gain adjusting means for adjusting the gain by multiplication; a second combining means for combining the fourth output from the fourth gain adjusting means and the fifth output from the fifth gain adjusting means; And a headphone reproducing means for driving the headphones based on the output of the second synthesizing means; a sixth gain adjusting means for adjusting the gain by multiplying the data from the ring tone data storing means by a variable gain coefficient; Speaker reproducing means for driving the speaker based on the output of the sixth gain adjusting means.
本発明に係る通話方法は、前記課題を解決するために、ネットワークを介して音声による対話のための双方向通信を行う通話方法において、送信系として、収音した音声を電気信号に変換する音声変換手段からの音声信号に可変のゲイン係数を乗じてゲインを調整する第1のゲイン調整工程と、第1の音データ記憶手段にファイル単位で記憶している音のデータを読み出してデコードする第1のデコード工程と、前記第1のデコード工程からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第2のゲイン調整工程と、第2の音データ記憶手段にファイル単位で記憶している音のデータを読み出してデコードする第2のデコード工程と、前記第2のデコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第3のゲイン調整工程と、前記第1のゲイン調整工程からの第1の出力と前記第2のゲイン調整工程からの第2の出力と前記第3のゲイン調整工程からの第3の出力とを合成する第1の合成工程と、前記第1の合成工程の合成出力をエンコードするエンコード工程と、前記エンコード手段からのエンコード出力を前記ネットワークに送信する送信工程とを備え、受信系として、前記ネットワークを介して他の通話装置から送信されてきたエンコード出力を受信する受信工程と、前記受信工程で受信されたエンコードデータをデコードする受信データデコード工程と、前記受信データデコード工程からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第4のゲイン調整工程と、着信音データ記憶手段にファイル単位で記憶されている着信音データの着信音に可変のゲイン係数を乗じてゲインを調整する第5のゲイン調整工程と、前記第4のゲイン調整工程からの第4の出力と前記第5のゲイン調整工程からの第5の出力とを合成する第2の合成工程と、第2の合成工程の出力に基づいてヘッドフォンを駆動するヘッドフォン再生工程と、前記着信音データ記憶手段からのデータに可変のゲイン係数を乗じてゲインを調整する第6のゲイン調整工程と、前記第6のゲイン調整工程の出力に基づいてスピーカを駆動するスピーカ再生工程とを備える。 Call method according to the present invention, in order to solve the above problems, in the call method for bidirectional communication for voice dialog via the network, converts a transmission system, the voice picked up into an electrical signal sound A first gain adjustment step of adjusting the gain by multiplying the audio signal from the conversion means by a variable gain coefficient, and a first read out and decoding of sound data stored in file units in the first sound data storage means. 1 decoding step, a second gain adjusting step for adjusting the gain by multiplying the decoded output from the first decoding step by a variable gain coefficient, and storing the file in the second sound data storage means in units of files. A second decoding step of reading out and decoding the sound data of the sound, and a gain adjustment by multiplying the decoding output from the second decoding means by a variable gain coefficient A first output from the first gain adjustment step, a second output from the second gain adjustment step, and a third output from the third gain adjustment step. A first synthesizing step, an encoding step for encoding the synthesized output of the first synthesizing step, and a transmitting step for transmitting the encoded output from the encoding means to the network. A receiving step for receiving an encoded output transmitted from another communication device, a received data decoding step for decoding the encoded data received in the receiving step, and a decode output from the received data decoding step. a fourth gain adjustment step of adjusting the gain is multiplied by a gain coefficient, stored on a file basis to the ring tone data storage means A fifth gain adjustment step of adjusting the gain multiplied by the variable gain coefficient ringtone ring tone data, first from the fourth output and the fifth gain adjustment step from the fourth gain adjustment step A second synthesizing step for synthesizing the output of No. 5, a headphone reproducing step for driving headphones based on the output of the second synthesizing step, and multiplying the data from the ring tone data storing means by a variable gain coefficient. comprising a sixth gain adjustment step of adjusting the gain, a speaker reproducing step of driving a speaker based on an output of the sixth gain adjustment step.
本発明の通話装置によれば、第1のゲイン調整手段が着信音データ記憶手段からのデータに可変のゲイン係数を乗じてゲインを調整する。ヘッドフォン再生手段が第1のゲイン調整手段の出力に基づいてヘッドフォンを駆動する。第2のゲイン調整手段が、着信音データ記憶手段からのデータに可変のゲイン係数を乗じてゲインを調整する。スピーカ再生手段が第2のゲイン調整手段の出力に基づいてスピーカを駆動する。したがって、ヘッドセットとスピーカで最適な音量調節をすることができる。また、遠くでも聞こえるようにスピーカの着信音だけを大きくすることも可能である。 According to the communication device of the present invention, the first gain adjustment means adjusts the gain by multiplying the data from the ring tone data storage means by a variable gain coefficient. The headphone reproducing means drives the headphones based on the output of the first gain adjusting means. The second gain adjustment means adjusts the gain by multiplying the data from the ring tone data storage means by a variable gain coefficient. The speaker reproducing means drives the speaker based on the output of the second gain adjusting means. Therefore, optimal volume adjustment can be performed with the headset and the speaker. It is also possible to increase only the ringtone of the speaker so that it can be heard from a distance.
本発明の通話方法によれば、第1のゲイン調整工程が着信音データ記憶手段からのデータに可変のゲイン係数を乗じてゲインを調整する。ヘッドフォン再生工程が第1のゲイン調整手段の出力に基づいてヘッドフォンを駆動する。第2のゲイン調整工程が、着信音データ記憶手段からのデータに可変のゲイン係数を乗じてゲインを調整する。スピーカ再生工程が第2のゲイン調整工程の出力に基づいてスピーカを駆動する。したがって、ヘッドセットとスピーカで最適な音量調節をすることができる。また、遠くでも聞こえるようにスピーカの着信音だけを大きくすることも可能である。 According to the calling method of the present invention, the first gain adjustment step adjusts the gain by multiplying the data from the ring tone data storage means by a variable gain coefficient. The headphone playback step drives the headphones based on the output of the first gain adjusting means. In the second gain adjustment step, the gain is adjusted by multiplying the data from the ring tone data storage means by a variable gain coefficient. The speaker reproduction process drives the speaker based on the output of the second gain adjustment process. Therefore, optimal volume adjustment can be performed with the headset and the speaker. It is also possible to increase only the ringtone of the speaker so that it can be heard from a distance.
本発明の通話システムによれば、通話装置の受信系にあって第1のゲイン調整手段が着信音データ記憶手段からのデータに可変のゲイン係数を乗じてゲインを調整する。ヘッドフォン再生手段が第1のゲイン調整手段の出力に基づいてヘッドフォンを駆動する。第2のゲイン調整手段が、着信音データ記憶手段からのデータに可変のゲイン係数を乗じてゲインを調整する。スピーカ再生手段が第2のゲイン調整手段の出力に基づいてスピーカを駆動する。したがって、ヘッドセットとスピーカで最適な音量調節をすることができる。また、遠くでも聞こえるようにスピーカの着信音だけを大きくすることも可能である。 According to the calling system of the present invention, in the receiving system of the calling device, the first gain adjusting means adjusts the gain by multiplying the data from the ring tone data storing means by the variable gain coefficient. The headphone reproducing means drives the headphones based on the output of the first gain adjusting means. The second gain adjustment means adjusts the gain by multiplying the data from the ring tone data storage means by a variable gain coefficient. The speaker reproducing means drives the speaker based on the output of the second gain adjusting means. Therefore, optimal volume adjustment can be performed with the headset and the speaker. It is also possible to increase only the ringtone of the speaker so that it can be heard from a distance.
以下、本発明を実施するための最良の形態としてボイス・オーバー・アイピー(Voice over IP:VoIP)と呼ばれるインターネット電話のプロトコルに従ったVoIP通話システムと、このVoIP通話システムに用いられるVoIPクライアントを挙げる。 Hereinafter, as a best mode for carrying out the present invention, a VoIP call system in accordance with an Internet telephone protocol called Voice over IP (VoIP) and a VoIP client used in the VoIP call system will be described. .
先ず、VoIP通話システム1の概略について説明する。このVoIP通話システムは、VoIPクライアント間の通話音声の他にバックグランドミュージック(Back ground music:BGM)或いは効果音(Sound effect:SE)を送受信する。 First, an outline of the VoIP call system 1 will be described. This VoIP call system transmits and receives background music (BGM) or sound effect (SE) in addition to call voice between VoIP clients.
図1に示すように、VoIPクライアント(Client)2は、例えば公衆回線等3によりインターネット4に接続され、同じくインターネット4に接続されている他のVoIPクライアント5と音声による対話のための双方向の通信を行う。インターネット4には、VoIPサーバ(Server)6も接続されており、VoIPに基づいた通信の制御等を行う。なお、このVoIP通話システム1では、VoIPクライアント2とVoIPクライアント5の二者間の通話を例に挙げるが、VoIPクライアントは二つに限らず、よって通話システムへの参加者は2以上であることはもちろんである。
As shown in FIG. 1, a VoIP client (Client) 2 is connected to the Internet 4 via, for example, a
インターネット4は、一般公衆回線などの通信回線や、情報通信ネットワークを複数接続することによって世界中に拡がったネットワーク環境である。現在、広帯域、高速な通信回線の普及によってブロードバンド伝送(Broadband Transmission)を可能としている。光ファイバー、非対称ディジタル加入者線、無線等を用い、500kbps以上の通信回線でネットワークを構成している。 The Internet 4 is a network environment that is spread all over the world by connecting a plurality of communication lines such as general public lines and information communication networks. Currently, broadband transmission is enabled by the widespread use of broadband and high-speed communication lines. The network is composed of communication lines of 500kbps or higher using optical fiber, asymmetric digital subscriber line, radio, etc.
VoIPサーバ6は、VoIP通話システム1にあって契約者のIPアドレスの管理や、認証、あるいは通信の制御を行う。ワークステーションのようなコンピュータより構成されている。もちろん、課金処理のためのサーバや、契約者のIPアドレス他管理情報を処理するサーバを別に設けてもよい。
The
VoIPクライアント2は、マイクロフォンとスピーカ、又はマイクロフォン7aとヘッドフォン7bとをセットにしたヘッドセット7を接続した例えばパーソナルコンピュータ(Personal computer:PC)である。PCがソフトウェアで実現されるVoIPクライアントプログラム2aを実行することによりVoIPクライアント2になる。なお、以下では、VoIPクライアント2がVoIPクライアント5に電話をかける場合、つまりVoIPクライアント2が始めに送信し、VoIPクライアント5が受信するという状況を想定する。もちろん、VoIPクライアント5も、VoIPクライアントプログラム5aを実行するPCよりなり、始めに送信側となるときには同様の動作を行う。
The
送信側であるVoIPクライアント2は、VoIP通話中に背景音として例えば数分間単位の連続した時間継続する音である音楽(Back ground music:BGM)等や、例えば数秒間単位の効果音(Sound effect:SE)を通話音声にミキシングすることができる。VoIPクライアント2は、通話音はもちろん、背景音や効果音の音量レベルも個別に調整する。
The
また、VoIPクライアント2は受信側となるとき、ヘッドセット7とスピーカで着信音の音量を独立に調節できる。
Further, when the
以下、VoIPクライアント2が背景音や効果音の音量レベルを個別に調整できる構成及び動作、さらにヘッドセット7とスピーカで着信音の音量を独立に調節できる構成及び動作について図2を参照して説明する。VoIPクライアント2は、VoIPクライアントプログラム2aを実行することにより、送信系、受信系がそれぞれ機能的に以下に説明するように構成される。先ず、送信系10にあって、マイクロフォン7aにて収音されて電気信号に変換されたユーザの音声に基づく電気信号はマイクキャプチャー部11にて取り込まれる。マイクキャプチャー部11が取り込んだ音声に基づく電気信号には、ユーザが設定するマイク音量レベルであるゲイン係数k1がゲイン調整部12により乗算される。このゲイン調整部12の乗算出力は、加算部13に供給される。
Hereinafter, a configuration and operation in which the
また、VoIPクライアント2は、例えば、マシンガンの銃声、雷鳴、拍手音、笑い声など、数秒間単位の効果音を例えばPCMデータにしてからそれぞれMP3(MPEG-1 Audio Layer-III)や、MPEG4、あるいはATRAC(Adaptive Transform Acoustic Coding)等の圧縮技術により予め圧縮し、ファイル単位のSEデータとしてSEファイル記憶部14に複数ファイル分記憶している。SEファイル記憶部14としては、後述するようなハードディスクドライブ(HDD)や、ROM、光磁気ディスクが挙げられる。
In addition, the
また、VoIPクライアント2は、例えば、波の音、小鳥のさえずり、或いは様々なジャンルの音楽などよりなる、数分間単位の背景音を例えばPCMデータにしてからそれぞれMP3や、MPEG4、あるいはATRAC等の圧縮技術により予め圧縮し、ファイル単位のBGMデータとしてBGMファイル記憶部15に複数ファイル分記憶している。
In addition, the
SEファイル記憶部14に記憶されているSEファイルは、使用者の所望によって選択されるとSEファイル読み出し部16によって図示しないRAMに読み出されながらデコード部17にてデコードされてPCMデータとなる。デコード部17のデコード出力(PCMデータ)には、ユーザが設定するSE音量レベルであるゲイン係数k2がゲイン調整部18により乗算される。このゲイン調整部18の乗算出力は、加算部13に供給される。
When the SE file stored in the SE file storage unit 14 is selected as desired by the user, it is decoded by the
BGMファイル記憶部15に記憶されているBGMファイルも、使用者の所望によって選択されるとBGMファイル読み出し部17によって図示しないRAMに読み出されながらデコード部20にてデコードされてPCMデータとなる。デコード部20のデコード出力には、ユーザが設定するBGM音量レベルであるゲイン係数k3がゲイン調整部21により乗算される。このゲイン調整部21の乗算出力は、加算部13に供給される。加算部13は、3つのゲイン調整部12、18、21の乗算出力を飽和処理をしつつ加算し、加算出力をエンコード部22に供給する。
When the BGM file stored in the BGM
エンコード部22は、加算部13の加算出力(PCMデータ)をMP3や、MPEG4、あるいはATRAC等の圧縮技術により数十kbps、例えば64kbpsに圧縮する。このエンコード部22が行う、MP3や、MPEG4、あるいはATRAC等の圧縮技術は、CDで採用されているPCMオーディオデータ等に対して施される高能率の音響圧縮符号化復号化技術である。よって、パケット化されてからインターネットを介して伝送され、受信側にて再生されたオーディオは、ステレオ2チャンネル化が可能であり、また高音質である。
The encoding unit 22 compresses the addition output (PCM data) of the
この圧縮データは、リアルタイム・トランスポート・プロトコル(Real-time Transport Protocol:RTP)に従ってデータをパケット化するRTPパケット化(packetize)部23に供給される。RTPパケット化部23は、前記圧縮データをRTPのパケットに入れ、さらにUDP、IPとパケッタイズする。RTPに従ったパケット化については詳細を後述する。パケット化されたパケットデータは送信処理部24からインターネットに送られる。
This compressed data is supplied to an
受信系30にあって、インターネット4を介して他のVoIPクライアント5から送信されてきたパケットデータは受信処理部31によって受信される。受信処理部31で受信されたパケット化データは、RTPデパケット化(depacketize)部32にて解かれる。デジッタ(de-jitter)部33は、RTPデパケット化部32にてIP、UDPから解かれたRTPのタイムスタンプ、シーケンシャルナンバーを基に到着時間の補正を行う。
In the
パケット補償(packet loss compensator)部34は前記RTPのタイムスタンプ、シーケンシャルナンバーを基にパケット損失の補償を行い、補償データをデコード部35に送る。デコード部35は、到着時間の補正、パケットロスの補償が行われた圧縮データをPCMデータにデコードし、PCMデータをゲイン調整部36に送る。ゲイン調整部36は、前記PCMデータに使用者が設定する再生音量レベルであるゲイン係数k5を乗算する。このゲイン調整部36の乗算出力は加算部37に送られる。また、送信される音声を通話相手と共有するため、ゲイン調整部38において送信音声データに使用者が設定するループバック音量レベルであるゲイン係数k4を乗算する。ゲイン調整部38の乗算出力も加算部37に供給される。
A
さらに、このVoIPクライアント2は、着信音(Ring Tone)を例えばPCMデータにしてからそれぞれMP3や、MPEG4、あるいはATRAC等の圧縮技術により予め圧縮し、ファイル単位の着信音データとして着信音ファイル記憶部39に複数ファイル分記憶している。
Further, the
着信音ファイル記憶部39からの着信音ファイルは、使用者の所望によって予め選択されており、着信のタイミングに従ってリングトーン読み出し部40によって図示しないRAMに読み出され、デコード部41にてPCMデータにデコードされる。デコード部41のデコード出力は、ゲイン調整部42及びゲイン調整部43に供給される。ゲイン調整部42は、使用者が設定するヘッドフォン着信音量レベルであるゲイン係数k6をリングトーンのデコード出力(PCMデータ)に乗算して加算部37に供給する。加算部37は、ゲイン調整部36の乗算出力である通話音声と背景音等のミキシング出力(PCMデータ)にゲイン調整部38の乗算出力である自分の通話音のPCMデータとを加算し、加算出力をヘッドフォン再生部44に供給する。ヘッドフォン再生部44は、前記加算出力をアナログ信号に変換してから増幅し、ヘッドフォン7bに供給する。ヘッドフォン7bは、使用者の耳に前記ミキシング出力を発音する。
The ring tone file from the ring tone
また、加算部37は、他のVoIPクライアント5からの電話がかかってきたタイミングにて、リングトーンファイル読み出し部40が読み出したリングトーンファイルのデコード出力(PCMデータ)に使用者が設定したヘッドフォン着信音量レベルであるゲイン係数k6の乗算されたデータを、ヘッドフォン再生部44に供給する。ヘッドフォン再生部44は、前記ゲイン係数k6の乗算されたリングトーンデータをアナログ信号に変換してからヘッドフォン7bに供給する。よって、ヘッドフォン7bは他のVoIPクライアント5からの電話がかかってきたタイミングで、使用者が設定したヘッドフォン着信音量レベルの着信音を使用者の耳に発音する。
In addition, the adding
ゲイン調整部43は、デコード部41からのデコード出力であるリングトーンのPCMデータに使用者の設定するスピーカ着信音音量レベルであるゲイン係数k7を乗算し、スピーカ再生部45に供給する。スピーカ再生部45は、前記乗算出力をアナログ信号に変換してから増幅しスピーカ46に供給する。スピーカ46は、使用者がスピーカ用に設定したスピーカ着信音音量レベルの着信音を発音する。
The
したがって、VoIPクライアント2は、受信側となるとき、ヘッドセット7とスピーカで着信音の音量を独立に調節できる。
Therefore, when the
次に、RTPに基づいたパケット化及びデパケット化について説明しておく。RTPは、インターネット等のIPネットワークにおいて、リアルタイムに音声や動画を送信/受信するトランスポートプロトコルである。RFC1889で勧告されている。RTPは、トランスポート層に位置し、一般にユーザ・データグラム・プトロコル(User Datagram Protocol:UDP)上でリアルタイム・コントロール・プトロコル(Real-time Control Protcol)とともに用いられる。 Next, packetization and depacketization based on RTP will be described. RTP is a transport protocol for transmitting / receiving voice and moving images in real time in an IP network such as the Internet. It is recommended in RFC1889. RTP is located in the transport layer and is generally used with Real-time Control Protocol over User Datagram Protocol (UDP).
RTPパケットは、図3に示すように、IPヘッダ、UDPヘッダ、RTPヘッダ及びRTPデータからなる。RTPヘッダには、バージョン情報(Verasion:V)、パディング(Padding:P)、拡張ヘッダ(extension:X)の有無、送信元(Contoributing source:CRSC)数、マーカ情報(Marker:M)、ペイロードタイプ(Payload Type:PT)、シーケンス番号(Sequence Number)、RTPタイムスタンプ、同期送信元(Sychronization Source:SSRC)識別子、及び寄与送信元(Contoributeing source:CRSC)識別子を格納する各フィールドが設けられている。 As shown in FIG. 3, the RTP packet includes an IP header, a UDP header, an RTP header, and RTP data. The RTP header includes version information (Verasion: V), padding (Padding: P), presence / absence of extension header (extension: X), number of transmission sources (Contoributing source: CRSC), marker information (Marker: M), payload type (Payload Type: PT), sequence number (Sequence Number), RTP time stamp, synchronization transmission source (Sychronization Source: SSRC) identifier, and each field storing a contribution transmission source (Contoributeing source: CRSC) identifier is provided. .
図2におけるRTPパケット化部23は、エンコード部22の出力である圧縮データを、前述したRTPに従ってパケット化する。圧縮データそのものは図3に示すRTPペイロード部分に含まれる。このRTPパケットを送信処理部24からインターネット4を介して他のVoIPクライアント(例えば図1のVoIPクライアント5)に送る。
The
他のVoIPクライアント5の受信系30では、受信処理部31により前記RTPパケットを受信する。ここでは、他のVoIPクライアント5の動作になるが、図2を用いて説明する。RTPデパケット化部32は、RTPヘッダとRTPデータをIPヘッダ、UDPヘッダから分離する。RTPヘッダに格納されているシーケンス番号及びタイプスタンプをデジッタ部33に送る。
In the
デジッタ部33は、前記シーケンス番号及びタイプスタンプを基に到着時刻の不均等を補正する。RTPパケットは、他のデータが伝送されているインターネットによって送信されてくるので、伝送が込んでいるときの影響を受けたりし、その到着時刻は等間隔ではない。時間軸上で詰まったり、伸びたりして、通信間隔が不均等になることがある。そこで、デジッタ部33は、前記シーケンス番号及びタイプスタンプを基に補正し、等間隔とする。
The
また、パケット補償部34は、前記シーケンス番号及びタイプスタンプを基にパケットの損失を補正する。RTPパケットは、インターネットによって送受信されるので、パケットが欠落したり、受信不能になることがある。そこで、パケット補償部34は、欠落したパケットの代わりにその前又は後ろのパケットと同じパケットを使用したり、欠落したデータを0にする等してパケットの損失を補償する。
The
そして、デコード部35は、到着時刻が補正され、パケット損失が補償された前記通話音と背景音等のミキシングデータをデコードし、PCMデータにする。
Then, the
このような機能構成のVoIPクライアント2にあって、本発明を適用することにより、特徴的となるのは、通話音はもちろん、背景音の音量レベルも個別に調整することができることである。
In the
通話音の音量レベルの調整は、ゲイン調整部12にて音声データにユーザが設定するマイク音量レベルであるゲイン係数k1を乗算することによって行われる。また、効果音又はBGMの音量レベルの調整は、ゲイン調整部18、又はゲイン調整部21にて各オーディオデータにユーザが設定するSE音量レベルであるゲイン係数k2、又はBGM音量レベルであるゲイン係数k3を乗算することによって行われる。
The volume level of the call sound is adjusted by multiplying the audio data by a gain coefficient k1, which is a microphone volume level set by the user, in the
各ゲイン調整部12、ゲイン調整部18、ゲイン調整部21にて音量レベルが調整された後の、通話音データ、効果音又はBGMのオーディオデータは加算部13にて合成され、エンコード部22にてエンコードされた後、RTPパケット化部23にてパケット化され、送信処理部24から通話相手の他のVoIPクライアント5に送信される。
The call sound data, the sound effect, or the BGM audio data after the volume level is adjusted by each
通話相手のVoIPクライアント5は、インターネット4を介して伝送されてきたRTPパケットを受信処理部31にて受信し、RTPデパケット化部32によりデパケット化し、デジッタ部33により到着時刻の間隔を補正し、パケット補償部34によりパケット損失を補償した後、デコード部35にてPCMデータにデコードする。デコードされた後のオーディオデータ(PCMデータ)には、受信側使用者により、音量レベルであるゲイン係数k5がゲイン調整部36により乗算されて、送信者からの通話音を、BGM又はSEとミキシングした状態でヘッドフォン44により聞くことができる。
The other party's
このVoIPクライアント2は、次の図4に示す開放型システム間相互接続(Open System Interconnection:OSI)のアーキテクチャに基づく各階層のプロトコルに応じたソフトウェアモジュールを実行することにより前記図2に示した機能を達成する。
The
図4において下位層から上位層に向かって各階層を説明する。先ず、物理層としての機能にはユニバーサル・シリアル・バス(Universal Serial Bus:USB)カメラドライバー、USBオーディオドライバ及び各種ドライバがある。カメラドライバからのビデオデータやオーディオドライバからのオーディオデータの伝送条件の物理的条件を合わせるレイヤである。次に、データリンク層としての機能には、オペレーティングシステム(Operating System:OS)がある。隣接ノード間の誤りのないデータ転送を実行するためのものである。 In FIG. 4, each layer will be described from the lower layer to the upper layer. First, functions as a physical layer include a universal serial bus (USB) camera driver, a USB audio driver, and various drivers. This layer matches the physical conditions of the transmission conditions of video data from the camera driver and audio data from the audio driver. Next, the function as the data link layer includes an operating system (OS). This is for executing error-free data transfer between adjacent nodes.
ネットワーク層としての機能には、インターネットプロトコル(Internet Protocol:IP)がある。ネットワーク層は、データ送受信に使用する通信経路を選択し、フロー制御・品質制御などの通信制御を行うところである。信頼性を追求しないコネクションレス(Conectionless)パケット転送プロトコルであるIPは、信頼性保証機能、フロー制御機能、エラー回復機能を上位階層(トランスポート層とアプリケーション層)に任せている。 As a function of the network layer, there is the Internet Protocol (IP). The network layer selects a communication path used for data transmission / reception and performs communication control such as flow control and quality control. IP, which is a connectionless packet transfer protocol that does not pursue reliability, leaves the reliability assurance function, flow control function, and error recovery function to the upper layers (transport layer and application layer).
トランスポート層としての機能には、トランスポート・コントロール・プロトコル(Transport Control Protocol)/ユーザ・データグラム・プロトコル(User Datagram Protocol)がある。トランスポート層では、IPアドレスを使用してエンド・ツー・エンドの伝送を行う。ネットワークの種類に依存せず、要求される品質クラスに従ってフロー制御や順序制御を行う。TCPは信頼性保証機能を持ち、転送したデータの各バイトにシーケンス番号を付け、受信側から受け取り通知(ACK)が送られてこなければデータを再送する。UDPは、アプリケーション間のデータグラムの送信機能を提供する。IPネットワークを用いて、音声・動画像をストリーミング再生する場合、一般にエラー時に再送を行うTCPのようなトランスポートプロトコルは使用できない。また、TCPは、1対1通信用のプロトコルであり、複数の相手に情報を送信することができない。そこで、このような用途には、UDPが用いられる。 The functions as the transport layer include the Transport Control Protocol / User Datagram Protocol. In the transport layer, end-to-end transmission is performed using an IP address. Regardless of the type of network, flow control and sequence control are performed according to the required quality class. TCP has a reliability guarantee function, attaches a sequence number to each byte of transferred data, and retransmits data if a reception notification (ACK) is not sent from the receiving side. UDP provides a function for transmitting datagrams between applications. When streaming audio / video images using an IP network, a transport protocol such as TCP that retransmits when an error occurs cannot generally be used. TCP is a protocol for one-to-one communication, and information cannot be transmitted to a plurality of partners. Therefore, UDP is used for such applications.
UDPは、アプリケーションのプロセスがリモートマシン上の他のアプリケーションのプロセスへデータを転送することを、最小のオーバーヘッドで行えるように設計されている。そのため、UDPのヘッダに入る情報は、送信元ポート番号、宛先ポート番号、データ長、チェックサムのみであり、TCPにあるパケットの順序を表す番号を入れるフィールドがないので、ネットワーク上で異なる経路を介して伝送されるなどによりパケットの順序が入れ替わってしまった場合に、その順序を正しい状態に戻す処理を行うことができない。また、送信時のタイムスタンプ等の時間情報を入れるフィールドは、TCPにもUDPにもない。 UDP is designed to allow application processes to transfer data to other application processes on a remote machine with minimal overhead. Therefore, the information entered in the UDP header is only the source port number, destination port number, data length, and checksum, and there is no field for entering the number indicating the order of packets in TCP. When the order of the packets is changed due to transmission through the network, processing for returning the order to the correct state cannot be performed. Also, there is no field for inputting time information such as a time stamp at the time of transmission in TCP or UDP.
セッション層としての機能には、セッション・イニシエーション・プロトコル(Session Initiation Protocol:SIP)と、本発明の要部となる前記通話音とBGM又はSEの合成処理ソフトウェアに必要とされるモジュールがある。保留音発生とBGM合成と着信音発生とコーデック(codec)とRTPである。セッション層は、情報の転送制御を行う。アプリケーション間における対話モードを管理して会話単位の制御を行う。SIPは、IPネットワーク上でマルチメディアセッションを確立・変更・終了するための、アプリケーション層のシグナリングプロトコルである。RFC3261で標準化されている。 The function as the session layer includes a session initiation protocol (SIP) and a module required for the software for synthesizing the speech sound and BGM or SE, which is a main part of the present invention. On-hold tone generation, BGM synthesis, ring tone generation, codec, and RTP. The session layer controls information transfer. Manage conversation modes between applications and control conversation units. SIP is an application layer signaling protocol for establishing, changing and terminating multimedia sessions on an IP network. It is standardized by RFC3261.
プレゼンテーション層としての機能には、VoIP通話制御がある。プレゼンテーション層では、アプリケーションで送受信する情報の表現形式を管理して、データの変換や暗号化を行う。 As a function as a presentation layer, there is VoIP call control. The presentation layer manages the expression format of information transmitted and received by the application, and performs data conversion and encryption.
アプリケーション層としての機能には、グラフィカルユーザインターフェース(Graphical User Interface:GUI)がある。アプリケーション層では、ユーザプログラムで使用する通信機能の外部仕様を管理して、それに基づく情報のやり取りを行う。 As a function as an application layer, there is a graphical user interface (GUI). In the application layer, the external specification of the communication function used in the user program is managed, and information is exchanged based thereon.
次に、実際に前記ソフトウェアモジュールを実行するVoIPクライアント2のハードウェア構成を説明する。図5はVoIPクライアント2の構成を表している。図5において、CPU(Central Processing Unit)51は、ROM(Read Only Memory)52に記憶されている前記ソフトウェアモジュールを構成する各種プログラム、または記憶部58からRAM(Random Access Memory)53にロードされた前記ソフトウェアモジュールを構成する各種プログラムに従って各種の処理を実行する。RAM53にはまた、CPU51が各種の処理を実行する上において必要なデータなども適宜記憶される。
Next, a hardware configuration of the
CPU51,ROM52及びRAM53は、バス54を介して相互に接続されている。このバス54にはまた、入出力インターフェース55も接続されている。入出力インタフェース55には、キーボード、マウスなどよりなる入力部56、CRT、LCDなどよりなるディスプレイ、並びに、ヘッドフォンやスピーカなどよりなる出力部57、ハードディスクなどより構成される記憶部58、モデム、ターミナルアダプタなどより構成される通信部59が接続されている。ヘッドセット7のマイクロフォン7aは入力部56に含まれる。また、ヘッドフォン7bは出力部57に含まれる。
The
通信部59は、インターネット4を介しての通信処理を行う。CPU51から提供されたデータを送信する。また通信部59は通信相手から受信したデータをCPU51、RAM53、記憶部58に出力する。記憶部58はCPU51との間でやり取りし、情報の保存・消去を行う。通信部59はまた、他のクライアントとの間で、アナログ信号またはデジタル信号の通信処理を行う。
The
入出力インタフェース55にはまた、必要に応じてドライブ60が接続され、磁気ディスク61、光ディスク62、光磁気ディスク63、或いは半導体メモリ64などが適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部58にインストールされる。
A
なお、記憶部58は例えばHDDであり、図2に示したSEファイル記憶部14、BGMファイル記憶部15、着信音ファイル記憶部39を構成する。
The
以上のハードウェア構成は、VoIPクライアント2及び5の構成を示すとともに、VoIPサーバ6や、後述のWebサーバの構成を示すものでもある。
The above hardware configuration shows the configuration of the
次に、出力部57を構成するディスプレイに表示されるGUI(Graphical Use Interface)について図6を参照して説明する。このGUIは、VoIPクライアントのアプリケーション層に属する。PCをユーザが視覚的に操作するためのインターフェースであり、ユーザの手入力情報をハンドリングする。このGUIは、上部から下部に向かって、アプリケーション制御部71、情報表示部72、ダイヤル部73、ヘッドセットボリューム部74、スピーカボリューム部75、効果音(SE)選択表示部76、SE制御部77、BGM選択表示部78、BGM制御部79を備えている。
Next, GUI (Graphical Use Interface) displayed on the display constituting the
アプリケーション制御部71は、VoIPクライアントアプリケーションの終了処理を行う。情報表示部72は、ダイヤル番号、相手情報(話中等)を表示する。ダイヤル部73は、VoIP相手先をダイヤルするテンキーである。ヘッドセットボリューム部74は、ヘッドセット7のヘッドフォン7bから出力される音量を調節するためのものである。使用者がマウスを用いてスライダ74aを左右に移動することにより、ゲイン調整部36におけるゲイン係数k5を設定することになる。また、ヘッドフォン7bから出力される着信音の音量を調節するために用いてもよい。この場合には、使用者がマウスを用いてスライダ74aを左右に移動することにより、ゲイン調整部42におけるゲイン係数k6を設定することになる。
The
スピーカボリューム部75は、スピーカ46から出力される着信音のボリュームを調整するためのものである。使用者がマウスを用いてスライダ75aを左右に移動することにより、ゲイン調整部43におけるゲイン係数k7を設定することになる。
The
SE選択表示部76は、ユーザに選択させる使用可能なSE音源データファイル(SEファイル記憶部14に記憶されているSEファイル)を表示するものであり、例えば銃声音、雷音、拍手の音、歓声等の効果音を使用者に選択させるために表示する。SE制御部77は、効果音の再生及び停止、並びに音量調整を、再生ボタン77b、停止ボタン77c及びスライダ77aを用いた使用者にマウス等の入力部を介して行わせる。
The SE
例えば、使用者がマウスを用いてSE選択表示部76にて所望のSEを選択し、スライダ77aを適切な位置に移動し、再生ボタン77bをクリックしたとする。すると、デコード部17は、SEファイル読み出し部16で読み出された所望のSEファイルをデコードし、ゲイン調整部18にてスライダ77aに対応したSE音量レベルであるゲイン係数k2がSEファイルのPCMデータに乗算され加算部13に出力される。これにより、効果音の各種効果音で使用者が通話相手への気持ち等を表現することができる。
For example, it is assumed that the user selects a desired SE on the SE
BGM選択表示部78は、ユーザに選択させる使用可能なBGM音源データファイルを表示する。BGM制御部70は、BGMの再生及び停止、並びに音量調整を、再生ボタン79b、停止ボタン79c及びスライダ79aを用いた使用者にマウス等の入力部を介して行わせる。例えば、使用者がマウスを用いてBGM選択表示部78にて所望のBGMを選択し、スライダ79aを適切な位置に移動し、再生ボタン79bをクリックしたとする。すると、デコード部20は、BGMファイル読み出し部19で読み出された所望のBGMファイルをデコードし、ゲイン調整部21にてスライダ79aに対応したBGM音量レベルであるゲイン係数k3がBGMファイルのPCMデータに乗算され加算部13に出力される。これにより、SEと同様、使用者自身が選択し、調節した音量により、使用者の気分やその場の雰囲気を通信相手へ伝えることができる。
The BGM
したがって、VoIPクライアント2は、前記ソフトウェアモジュールを構成する各種プログラムを実行することにより、ヘッドセット7とスピーカ46で着信音の音量を独立に調節できる。
Accordingly, the
1 VoIPシステム、2,5 VoIPクライアント、4 インターネット、6 VoIPサーバ、7 ヘッドセット、12 ゲイン調整部、13 合成部、14 SEファイル、15 BGMファイル、17 デコード部、18 ゲイン調整部、21 ゲイン調整部、22 エンコード、36 ゲイン調整部、42 ゲイン調整部、43 ゲイン調整部 1 VoIP system, 2,5 VoIP client, 4 Internet, 6 VoIP server, 7 headset, 12 gain adjustment unit, 13 synthesis unit, 14 SE file, 15 BGM file, 17 decoding unit, 18 gain adjustment unit, 21 gain adjustment Unit, 22 encoding, 36 gain adjusting unit, 42 gain adjusting unit, 43 gain adjusting unit
Claims (2)
送信系として、
収音した音声を電気信号に変換する音声変換手段からの音声信号に可変のゲイン係数を乗じてゲインを調整する第1のゲイン調整手段と、
音のデータをファイル単位で記憶している第1の音データ記憶手段と、
前記第1の音データ記憶手段から読み出したファイル単位の音データをデコードする第1のデコード手段と、
前記第1のデコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第2のゲイン調整手段と、
音のデータをファイル単位で記憶している第2の音データ記憶手段と、
前記第2の音データ記憶手段から読み出したファイル単位の音データをデコードする第2のデコード手段と、
前記第2のデコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第3のゲイン調整手段と、
前記第1のゲイン調整手段からの第1の出力と前記第2のゲイン調整手段からの第2の出力と前記第3のゲイン調整手段からの第3の出力とを合成する合成手段と、
前記合成手段の合成出力をエンコードするエンコード手段と、
前記エンコード手段からのエンコード出力を前記ネットワークに送信する送信手段とを備え、
受信系として、
前記ネットワークを介して他の通話装置の送信手段から送信されてきたエンコード出力を受信する受信手段と、
前記受信手段で受信されたエンコードデータをデコードする受信データデコード手段と、
前記受信データデコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第4のゲイン調整手段と、
着信音データをファイル単位で記憶している着信音データ記憶手段と、
前記着信音データ記憶手段からのデータに可変のゲイン係数を乗じてゲインを調整する第5のゲイン調整手段と、
前記第4のゲイン調整手段からの第4の出力と前記第5のゲイン調整手段からの第5の出力とを合成する第2の合成手段と、
第2の合成手段の出力に基づいてヘッドフォンを駆動するヘッドフォン再生手段と、
前記着信音データ記憶手段からのデータに可変のゲイン係数を乗じてゲインを調整する第6のゲイン調整手段と、
前記第6のゲイン調整手段の出力に基づいてスピーカを駆動するスピーカ再生手段と
を備えることを特徴とする通話装置。 In a communication device that performs two-way communication for voice conversation over a network,
As a transmission system,
First gain adjusting means for adjusting the gain by multiplying the audio signal from the audio converting means for converting the collected sound into an electric signal by a variable gain coefficient;
First sound data storage means for storing sound data in units of files;
First decoding means for decoding sound data in units of files read from the first sound data storage means;
Second gain adjusting means for adjusting the gain by multiplying the decode output from the first decoding means by a variable gain coefficient;
Second sound data storage means for storing sound data in file units;
Second decoding means for decoding sound data in units of files read from the second sound data storage means;
Third gain adjusting means for adjusting the gain by multiplying the decode output from the second decoding means by a variable gain coefficient;
Combining means for combining the first output from the first gain adjusting means, the second output from the second gain adjusting means, and the third output from the third gain adjusting means;
Encoding means for encoding the combined output of the combining means;
Transmission means for transmitting the encoded output from the encoding means to the network,
As a receiving system,
Receiving means for receiving the encoded output transmitted from the transmitting means of another telephone device via the network;
Received data decoding means for decoding the encoded data received by the receiving means;
A fourth gain adjusting means for adjusting the gain by multiplying the decoded output from the received data decoding means by a variable gain coefficient;
Ringtone data storage means for storing ringtone data in units of files;
Fifth gain adjusting means for adjusting the gain by multiplying the data from the ring tone data storing means by a variable gain coefficient;
Second combining means for combining the fourth output from the fourth gain adjusting means and the fifth output from the fifth gain adjusting means;
Headphones reproducing means for driving the headphones based on the output of the second synthesizing means ;
Sixth gain adjusting means for adjusting the gain by multiplying the data from the ring tone data storing means by a variable gain coefficient;
And a speaker reproducing means for driving the speaker based on the output of the sixth gain adjusting means.
送信系として、
収音した音声を電気信号に変換する音声変換手段からの音声信号に可変のゲイン係数を乗じてゲインを調整する第1のゲイン調整工程と、
第1の音データ記憶手段にファイル単位で記憶している音のデータを読み出してデコードする第1のデコード工程と、
前記第1のデコード工程からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第2のゲイン調整工程と、
第2の音データ記憶手段にファイル単位で記憶している音のデータを読み出してデコードする第2のデコード工程と、
前記第2のデコード手段からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第3のゲイン調整工程と、
前記第1のゲイン調整工程からの第1の出力と前記第2のゲイン調整工程からの第2の出力と前記第3のゲイン調整工程からの第3の出力とを合成する第1の合成工程と、
前記第1の合成工程の合成出力をエンコードするエンコード工程と、
前記エンコード手段からのエンコード出力を前記ネットワークに送信する送信工程とを備え、
受信系として、
前記ネットワークを介して他の通話装置から送信されてきたエンコード出力を受信する受信工程と、
前記受信工程で受信されたエンコードデータをデコードする受信データデコード工程と、
前記受信データデコード工程からのデコード出力に可変のゲイン係数を乗じてゲインを調整する第4のゲイン調整工程と、
着信音データ記憶手段にファイル単位で記憶されている着信音データの着信音に可変のゲイン係数を乗じてゲインを調整する第5のゲイン調整工程と、
前記第4のゲイン調整工程からの第4の出力と前記第5のゲイン調整工程からの第5の出力とを合成する第2の合成工程と、
第2の合成工程の出力に基づいてヘッドフォンを駆動するヘッドフォン再生工程と、
前記着信音データ記憶手段からのデータに可変のゲイン係数を乗じてゲインを調整する第6のゲイン調整工程と、
前記第6のゲイン調整工程の出力に基づいてスピーカを駆動するスピーカ再生工程と
を備えることを特徴とする通話方法。 In a call method that performs two-way communication for voice conversation over a network,
As a transmission system,
A first gain adjustment step of adjusting the gain by multiplying the audio signal from the audio conversion means for converting the collected audio into an electric signal by a variable gain coefficient;
A first decoding step of reading out and decoding sound data stored in file units in the first sound data storage means;
A second gain adjustment step of adjusting the gain by multiplying the decode output from the first decoding step by a variable gain coefficient;
A second decoding step of reading out and decoding the sound data stored in units of files in the second sound data storage means;
A third gain adjustment step of adjusting the gain by multiplying the decode output from the second decoding means by a variable gain coefficient;
A first combining step of combining the first output from the first gain adjustment step, the second output from the second gain adjustment step, and the third output from the third gain adjustment step. When,
An encoding step for encoding the combined output of the first combining step;
A transmission step of transmitting the encoded output from the encoding means to the network,
As a receiving system,
A receiving step of receiving an encoded output transmitted from another communication device via the network;
A received data decoding step for decoding the encoded data received in the receiving step;
A fourth gain adjusting step of adjusting the gain by multiplying the decoded output from the received data decoding step by a variable gain coefficient;
A fifth gain adjustment step of adjusting the gain multiplied by the variable gain coefficient ringtone ringtone data stored in files in the ring tone data storage means,
A second combining step of combining the fourth output from the fourth gain adjustment step and the fifth output from the fifth gain adjustment step;
A headphone playback step of driving the headphones based on the output of the second synthesis step ;
A sixth gain adjustment step of adjusting the gain by multiplying the data from the ring tone data storage means by a variable gain coefficient;
And a speaker reproduction step of driving the speaker based on the output of the sixth gain adjustment step.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003280435A JP4207701B2 (en) | 2003-07-25 | 2003-07-25 | Call device, call method, and call system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003280435A JP4207701B2 (en) | 2003-07-25 | 2003-07-25 | Call device, call method, and call system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005045742A JP2005045742A (en) | 2005-02-17 |
JP4207701B2 true JP4207701B2 (en) | 2009-01-14 |
Family
ID=34266266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003280435A Expired - Fee Related JP4207701B2 (en) | 2003-07-25 | 2003-07-25 | Call device, call method, and call system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4207701B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3996611B2 (en) * | 2005-08-29 | 2007-10-24 | Necインフロンティア株式会社 | Voice call system for computer terminals |
GB2461058C (en) | 2008-06-18 | 2017-01-18 | Skype | Audio device control method and apparatus |
KR101099239B1 (en) | 2009-08-07 | 2011-12-27 | 대덕대학산학협력단 | Terminal apparatus for softphone with easy telephone bell sound recognition |
JP5733445B1 (en) * | 2014-03-25 | 2015-06-10 | Nttエレクトロニクス株式会社 | Automatic packet receiver |
-
2003
- 2003-07-25 JP JP2003280435A patent/JP4207701B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005045742A (en) | 2005-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20030224815A1 (en) | Method and apparatus for wideband conferencing | |
JP2005526466A5 (en) | ||
JP2005045738A (en) | Calling device, calling method, and calling system | |
WO2009067954A1 (en) | A method and device for processing an audio stream | |
US7280650B2 (en) | Method and apparatus to manage a conference | |
US20030067922A1 (en) | Communication method, communication device, and communication terminal | |
KR20050094052A (en) | Telephone communications apparatus | |
US20020057333A1 (en) | Video conference and video telephone system, transmission apparatus, reception apparatus, image communication system, communication apparatus, communication method | |
US20070230449A1 (en) | Telephone system and telephone terminal apparatus | |
JP2005044310A (en) | Equipment for telephone conversation, copyright protection method, and system for telephone conversation | |
US20070140456A1 (en) | Method and apparatus for wideband conferencing | |
JP4207701B2 (en) | Call device, call method, and call system | |
US20110235632A1 (en) | Method And Apparatus For Performing High-Quality Speech Communication Across Voice Over Internet Protocol (VoIP) Communications Networks | |
US7813378B2 (en) | Wideband-narrowband telecommunication | |
JP4218456B2 (en) | Call device, call method, and call system | |
JP2002185573A (en) | Communication system | |
JP4572697B2 (en) | Method, terminal and program for reproducing video content data during call connection based on IP telephone function | |
JP2010512075A (en) | Method for call session, telephone system and telephone terminal | |
JP2005045737A (en) | Apparatus, method and system for telephone communication | |
KR20010099216A (en) | SIP-Phone Wireless Bridge Unifing terminal And Control method thereof | |
JP4193669B2 (en) | Call system and image information transmission / reception method | |
JP5210788B2 (en) | Speech signal communication system, speech synthesizer, speech synthesis processing method, speech synthesis processing program, and recording medium storing the program | |
JP2008271415A (en) | Received voice output apparatus | |
JP2005045739A (en) | Apparatus, method and system for telephone conversation | |
CN113079267B (en) | Audio conferencing in a room |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060725 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080108 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080930 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081013 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111031 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121031 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |