JP4425172B2 - Call device, call system, and program - Google Patents
Call device, call system, and program Download PDFInfo
- Publication number
- JP4425172B2 JP4425172B2 JP2005113628A JP2005113628A JP4425172B2 JP 4425172 B2 JP4425172 B2 JP 4425172B2 JP 2005113628 A JP2005113628 A JP 2005113628A JP 2005113628 A JP2005113628 A JP 2005113628A JP 4425172 B2 JP4425172 B2 JP 4425172B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- call device
- voice
- call
- conversation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Mobile Radio Communication Systems (AREA)
- Telephone Function (AREA)
Description
本発明は、通話装置、通話システム、及びプログラム、より詳細には、電話通信などネットワークを介して双方向音声通話を行なう際に、通常の音声通話で扱っている話者の声や周りの音を意味する会話音声と、ネットワーク上にある動画ファイルの音声やビデオデッキに録画された番組などのコンテンツの音を意味するコンテンツ音声といった複数の音声を同時に出力しながら音声コミュニケーションを行なう通話装置、通話システム、及びプログラムに関する。 The present invention relates to a call device , a call system, and a program , and more specifically, when a two-way voice call is made via a network such as a telephone communication, a voice of a speaker and a surrounding sound handled in a normal voice call. Conversation device that communicates while simultaneously outputting multiple voices, such as voice of video files on the network and content voice that means the sound of content such as programs recorded on a video deck on the network. The present invention relates to a system and a program .
従来、通話する相手(通話相手)に自分の声を聞かせるために、通話相手の通話装置の音量を制御する技術が知られている。例えば、特許文献1には、自動車などの車両に搭載されて、交通事故、急病などの緊急時に警察、緊急通報センタなど緊急通報システムを管轄するセンタに現在の車両の位置情報、登録車両などのデータを送信する緊急通報システム端末機器に関し、特に、緊急通報連絡時のハンズフリーによる音声通話において、緊急通報システムを管轄するセンタからの音声信号の音量レベル制御を行なう緊急通報システムが開示されている。この技術を用いることにより、緊急通報時のハンズフリー通話の音量レベルが一定レベル以上になるように制御することによって、緊急通報センタからの受信音声を確実に鳴音させることが可能となる。
しかしながら、会話音声とコンテンツ音声といった複数の音声を同時に出力しながら音声コミュニケーションを行なうような状況で会話音声を相手に確実に聞かせるためには、相手の通話装置で会話音声の音量レベルが一定レベル以上になるように制御するだけでは不十分である。 However, in order to ensure that the conversation voice is heard by the other party in a situation where voice communication is performed while simultaneously outputting a plurality of voices such as the conversation voice and the content voice, the volume level of the conversation voice is constant at the other party's call device. It is not sufficient to control only the above.
図30は、従来のシステムにおいて会話音声とコンテンツ音声といった複数の音声を同時に出力しながら音声コミュニケーションを行なう状況を説明するための概念図で、図中、501aはAさん宅の通話装置である情報処理端末、501bはBさん宅の通話装置である情報処理端末、502はネットワーク、503は各種コンテンツを提供可能なコンテンツサーバを示す。本例では、運動会のビデオコンテンツを音声コミュニケーション両方の端末(情報処理端末501aと情報処理端末501b)で流しながら会話を行なっている。すなわち、情報処理端末501aでは、運動会のビデオコンテンツの音声「わーわー」と相手(情報処理端末501bのユーザであるBさん)の会話音声「よかったね」とが出力されている。また、情報処理端末501bでは、運動会のビデオコンテンツの音声「わーわー」と相手(情報処理端末501aのユーザであるAさん)の会話音声「運動会楽しかったよ」とが出力されている。
FIG. 30 is a conceptual diagram for explaining a situation in which voice communication is performed while simultaneously outputting a plurality of voices such as conversation voices and content voices in a conventional system. In the figure,
このような状況で、会話を確実に相手側に聞かせたいときに、相手側で出音される会話音声の音量レベルが一定レベル以上になるよう制御できる機能を備えているだけでは、会話を確実に相手に聞かせられるとは限らない。その詳細を下記の図31に基づいて説明する。 In such a situation, when you want to make sure that the other party hears the conversation, simply having a function that can control the volume level of the conversational sound output by the other party to be above a certain level will ensure the conversation. Is not always heard by the other party. Details thereof will be described with reference to FIG. 31 below.
図31は、図30に示した従来システムで発生する問題点を説明するための図である。まず、Aさんが会話を確実に相手に聞かせるために、Bさん側で出音される会話音声の音量レベルを上げたとすると、情報処理端末501bで出力される会話音声「運動会楽しかったよ」の音量が大きくなる。しかし、そのときBさんがビデオコンテンツの音声の音量レベルを会話音声の音量レベルと同等、もしくは上回るよう調整したとする。この場合、情報処理端末501bで出力されるビデオコンテンツの音声「わーわー」の音量が、会話音声「運動会楽しかったよ」の音量と同等もしくは上回って設定されるため、Bさん側では会話音声がコンテンツ音声にかき消されて、Bさんは会話音声を十分に聞き取れない。つまり、Aさんの意図と異なりBさんに会話を聞かすことができず、コミュニケーション不良を引き起こすという問題がある。
FIG. 31 is a diagram for explaining problems that occur in the conventional system shown in FIG. First, suppose that Mr. A raises the volume level of the conversational sound produced by Mr. B in order to ensure that the conversation is spoken to the other party, the conversational voice “It was fun at the athletic meet” that is output from the
本発明は、上述のごとき実情に鑑みてなされたものであり、会話音声とコンテンツ音声といった複数の音声を同時に出力しながら音声コミュニケーションを行なう状況においても、送話側から操作することにより、相手(受話)側において会話音声あるいはコンテンツ音声の出音を優先させて、いずれか一方の音声を確実に相手に聞かせることができる通話装置、通話システム、及びプログラムを提供すること、をその目的とする。 The present invention has been made in view of the above circumstances, and even in a situation where voice communication is performed while simultaneously outputting a plurality of voices such as a conversation voice and a content voice, the partner ( The object is to provide a call device, a call system, and a program that give priority to the output of conversational sound or content sound on the receiver side and can reliably hear either one of the other party 's sounds. .
例えば、会話音声を優先して相手に聞かせたい場合、自分(送話)側から操作することにより、相手(受話)側の出音レベル設定が変更されて会話音声が優先して出音されるように設定し、同時に、相手の操作による出音レベル設定の調整を禁止もしくは制限する手段を提供することにある。 For example , if you want to give the conversation voice priority to the other party, you can operate from your own (sending) side, and the sound level setting on the other party (receiving) side will be changed and the conversation voice will be given priority. And a means for prohibiting or limiting the adjustment of the sound output level setting by the other party's operation.
上記課題を解決するために、本発明の第1の技術手段は、他の通話装置と会話音声を含む通話を行うと共に、音声を含むコンテンツを同期して視聴することが可能な通話装置であって、前記通話装置は、前記他の通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置に送信する手段を備え、前記通話装置の会話音量レベルが一定量を上回ったときに、前記通話装置から前記他の通話装置に出音レベル設定変更指示情報を送信することを特徴としたものである。
なお、ここで述べる通話装置は、少なくとも音声通信を備えるが、通常のテレビ電話と同様に音声通信と共に映像通信を行なってもよく、固定電話、テレビ電話、携帯電話、PCなど様々な形態が考えられる。
In order to solve the above-described problem, the first technical means of the present invention is a call device capable of making a call including a conversation voice with another call device and simultaneously viewing a content including the sound. The call device further includes means for transmitting to the other call device sound output level setting change instruction information for setting the sound output with priority given to either the conversation voice or the content sound in the other call device. provided, when the speech loudness level of the communication device exceeds a predetermined amount, is from the communication device that features that you send the sound output level setting change instruction information to the other communication device.
The communication device described here includes at least voice communication. However, video communication may be performed together with voice communication in the same manner as a normal videophone, and various forms such as a fixed phone, a videophone, a mobile phone, and a PC are considered. It is done.
第2の技術手段は、他の通話装置と会話音声を含む通話を行うと共に、音声を含むコンテンツを同期して視聴することが可能な通話装置であって、前記通話装置は、前記他の通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置に送信する手段を備え、前記他の通話装置の出音設定は、エコーキャンセラの設定を変更することを特徴としたものである。 The second technical means is a call device capable of making a call including a conversation voice with another call device and simultaneously viewing a content including the sound, wherein the call device includes the other call device. Means for transmitting sound output level setting change instruction information for setting sound output by giving priority to either conversational sound or content sound at the device, and setting sound output of the other call device Is characterized by changing the setting of the echo canceller.
第3の技術手段は、他の通話装置と会話音声を含む通話を行うと共に、音声を含むコンテンツを同期して視聴することが可能な通話装置であって、前記通話装置は、前記他の通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置に送信する手段を備え、前記他の通話装置の出音設定は、会話音声の音量を上げて、コンテンツ音声の音量を下げることを特徴としたものである。 A third technical means is a call device capable of making a call including a conversation voice with another call device and simultaneously viewing a content including the sound, wherein the call device includes the other call device. Means for transmitting sound output level setting change instruction information for setting sound output by giving priority to either conversational sound or content sound at the device, and setting sound output of the other call device Is characterized in that the volume of the conversation audio is increased and the volume of the content audio is decreased.
第4の技術手段は、他の通話装置と会話音声を含む通話を行うと共に、音声を含むコンテンツを同期して視聴することが可能な通話装置であって、前記通話装置は、前記他の通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置に送信する手段を備え、前記他の通話装置の出音設定は、異なるスピーカで出音させることを特徴としたものである。 A fourth technical means is a call device capable of making a call including a conversation voice with another call device and simultaneously viewing a content including the sound, wherein the call device includes the other call device. Means for transmitting sound output level setting change instruction information for setting sound output by giving priority to either conversational sound or content sound at the device, and setting sound output of the other call device Is characterized by sound output from different speakers.
第5の技術手段は、第1〜第4の技術手段のいずれか1において、前記通話装置は、前記他の通話装置の出音設定を変更した後に、所定時間、前記他の通話装置の操作による出音設定の変更を禁止もしくは制限することを特徴としたものである。 According to a fifth technical means, in any one of the first to fourth technical means, the call device operates the other call device for a predetermined time after changing the sound output setting of the other call device. It is characterized by prohibiting or restricting the change of the sound output setting by.
第6の技術手段は、第1〜第5の技術手段のいずれか1において、前記通話装置は、前記他の通話装置の出音設定を変更した場合に、これに連動して前記通話装置の出音設定を変更することを特徴としたものである。 A sixth technical means is any one of the first to fifth technical means, in which, when the call device changes the sound output setting of the other call device, The sound output setting is changed.
第7の技術手段は、他の通話装置と会話音声を含む通話を行うと共に、音声を含むコンテンツを同期して視聴することが可能な通話装置であって、前記通話装置は、該通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置から受信する手段を備え、該受信した出音レベル設定変更指示情報に従って、前記通話装置の出音設定として、エコーキャンセラの設定を変更することを特徴としたものである。 A seventh technical means is a call device capable of making a call including a conversation voice with another call device and simultaneously viewing a content including the sound, wherein the call device is connected to the call device. Means for receiving sound output level setting change instruction information for setting sound output by giving priority to either conversational sound or content sound from the other call device, and according to the received sound level setting change instruction information The setting of the echo canceller is changed as the sound output setting of the communication device .
第8の技術手段は、他の通話装置と会話音声を含む通話を行うと共に、音声を含むコンテンツを同期して視聴することが可能な通話装置であって、前記通話装置は、該通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置から受信する手段を備え、該受信した出音レベル設定変更指示情報に従って、前記通話装置の出音設定として、会話音声の音量を上げて、コンテンツ音声の音量を下げることを特徴としたものである。 The eighth technical means is a call device capable of making a call including a conversation voice with another call device and allowing the content including the sound to be synchronized and viewed, wherein the call device is connected to the call device. Means for receiving sound output level setting change instruction information for setting sound output by giving priority to either conversational sound or content sound from the other call device, and according to the received sound level setting change instruction information as sound output setting of the communication devices, to increase the volume of the conversation voice, is obtained by said lowering the sound volume of content sound.
第9の技術手段は、他の通話装置と会話音声を含む通話を行うと共に、音声を含むコンテンツを同期して視聴することが可能な通話装置であって、前記通話装置は、該通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置から受信する手段を備え、該受信した出音レベル設定変更指示情報に従って、前記通話装置の出音設定として、異なるスピーカで出音することを特徴としたものである。 A ninth technical means is a call device capable of making a call including a conversation voice with another call device and simultaneously viewing a content including the sound, wherein the call device is connected to the call device. Means for receiving sound output level setting change instruction information for setting sound output by giving priority to either conversational sound or content sound from the other call device, and according to the received sound level setting change instruction information As a sound output setting of the call device, sound is output from different speakers.
第10の技術手段は、第7〜第9のいずれか1の技術手段において、前記通話装置は、該通話装置の出音設定を変更した後に、所定時間、前記通話装置の操作による出音設定の変更を禁止もしくは制限することを特徴としたものである。 According to a tenth technical means, in any one of the seventh to ninth technical means, the call device changes the sound output setting of the call device, and then sets the sound output by operating the call device for a predetermined time. It is characterized by prohibiting or restricting the change of
第11の技術手段は、第7〜第9の技術手段のいずれか1において、前記通話装置は、前記他の通話装置から出音レベル設定変更指示情報を受信した場合に、該出音レベル設定変更指示情報による出音設定の指示を無効化し、前記通話装置の出音設定を変更しないことを特徴としたものである。 In an eleventh technical means according to any one of the seventh to ninth technical means, when the communication device receives the sound output level setting change instruction information from the other communication device, the sound output level setting is performed. The sound output setting instruction based on the change instruction information is invalidated, and the sound output setting of the call device is not changed.
第12の技術手段は、他の通話装置と会話音声を含む通話を行うと共に、音声を含むコンテンツを同期して視聴することが可能な通話装置であって、前記通話装置は、前記他の通話装置から受信した混合音量比情報に従って会話音声とコンテンツ音声を混合した混合音声を前記他の通話装置に送信する手段と、前記他の通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音するように、前記他の通話装置に送信する混合音声の混合音量比を変更する手段とを備え、前記通話装置の会話音量レベルが一定量を上回ったときに、前記他の通話装置に送信する混合音声の混合音量比を変更することを特徴としたものである。 A twelfth technical means is a call device capable of making a call including a conversation voice with another call device and simultaneously viewing a content including the sound, wherein the call device includes the other call device. Means for transmitting to the other call device a mixed sound obtained by mixing the conversation sound and the content sound in accordance with the mixed volume ratio information received from the device, and giving priority to either the conversation sound or the content sound in the other call device. Means for changing a mixed sound volume ratio of the mixed sound to be transmitted to the other call device so as to make a sound, and when the conversation volume level of the call device exceeds a certain amount, it is obtained by the features that you change the mixing volume ratio of the mixed sound to be transmitted.
第13の技術手段は、第12の技術手段のいずれか1において、前記通話装置は、前記他の通話装置に送信する混合音声の混合音量比として、会話音声の音量を上げて、コンテンツ音声の音量を下げることを特徴としたものである。 In a thirteenth technical means according to any one of the twelfth technical means, the call device raises the volume of the conversational sound as a mixed sound volume ratio of the mixed sound transmitted to the other call device, It is characterized by lowering the volume.
第14の技術手段は、第12又は第13の技術手段のいずれか1において、前記通話装置は、前記他の通話装置に送信する混合音声の混合音量比を変更した後に、所定時間、前記他の通話装置の操作による混合音量比の変更を禁止もしくは制限することを特徴としたものである。 In a fourteenth technical means according to any one of the twelfth and thirteenth technical means, the communication device changes the mixed sound volume ratio of the mixed sound to be transmitted to the other communication device, and then the other device for a predetermined time. The change of the mixed sound volume ratio by the operation of the communication device is prohibited or restricted.
第15の技術手段は、第12〜第14の技術手段のいずれか1において、前記通話装置は、前記他の通話装置に送信する混合音声の混合音量比を変更した場合に、これに連動して前記通話装置にて会話音声とコンテンツ音声のいずれかを優先するよう出音設定を変更することを特徴としたものである。 According to a fifteenth technical means, in any one of the twelfth to fourteenth technical means, when the communication device changes a mixed sound volume ratio of mixed sound to be transmitted to the other communication device, it is interlocked with this. Thus, the sound output setting is changed so that priority is given to either the conversation sound or the content sound in the call device.
第16の技術手段は、第1〜第15の技術手段のいずれか1における通話装置と他の通話装置とで構成される通話システムである。 The sixteenth technical means is a call system comprising the call device according to any one of the first to fifteenth technical means and another call device.
第17の技術手段は、第1〜第15の技術手段のいずれか1における通話装置としての機能を実行するためのプログラムである。 The seventeenth technical means is a program for executing a function as a communication device in any one of the first to fifteenth technical means.
本発明によれば、会話音声とコンテンツ音声といった複数の音声を同時に出力しながら音声コミュニケーションを行なう状況においても、任意のタイミングで、相手(受話側)に自分(送話側)の会話音声あるいはコンテンツ音声を明瞭に聞かせることができる。
具体的には、送話側から操作することにより、相手(受話)側で会話音声の音量レベルを上げることにより会話音声を聞きやすくしたり、逆に、コンテンツ音声の音量レベルを下げることにより会話音声を聞きやすくしたり、さらに、会話音声の音量レベルを上げつつコンテンツ音声の音量レベルを下げることにより会話音声を聞きやすくする。他にも、ステレオスピーカにてコンテンツ音声と会話音声を異なるチャネルで分けて出音させることによりコンテンツ音声と会話音声を聞き分けやすくする。
According to the present invention, even in a situation where voice communication is performed while simultaneously outputting a plurality of voices such as a conversation voice and a content voice, the conversation voice or content of the user (sending side) can be sent to the other party (receiving side) at an arbitrary timing. The voice can be heard clearly.
Specifically, by operating from the sending side, the other party (receiving side) can increase the volume level of the conversational voice to make it easier to hear the conversational voice, or conversely, by lowering the volume level of the content voice. It makes it easy to hear the speech, and further makes it easy to hear the speech by lowering the volume level of the content sound while raising the volume level of the conversation sound. In addition, the content sound and the conversation sound can be easily distinguished from each other by outputting the content sound and the conversation sound through different channels using a stereo speaker.
(実施例1)
本発明の通話装置の動作例を、以下に示す各実施例を用いて具体的に説明する。
図1は、本発明を適用した情報処理システムにおいて会話音声とコンテンツ音声といった複数の音声を同時に出力しながら音声コミュニケーションを行なう状況の一例を説明するための概念図で、図中、101aはAさん宅の通話装置である情報処理端末、101bはBさん宅の通話装置である情報処理端末、102はネットワーク、103はコンテンツを提供可能なコンテンツサーバを示す。
Example 1
An example of the operation of the communication device of the present invention will be specifically described with reference to the following embodiments.
FIG. 1 is a conceptual diagram for explaining an example of a situation in which voice communication is performed while simultaneously outputting a plurality of voices such as conversation voices and content voices in an information processing system to which the present invention is applied. In FIG. An information processing terminal that is a home call device, 101b is an information processing terminal that is a call device at Mr. B's home, 102 is a network, and 103 is a content server that can provide content.
図1において、まず、AさんがBさんに会話音声を優先して聞かせるための操作を行なわず、通常に会話をしていたとする。この場合、Bさんは自分の端末の出音レベル設定を任意に変更できる。ここで、Aさんが会話音声を優先して相手に聞かせるため、リモコンなどで情報処理端末101aの操作を行ったとする。この場合、Bさん宅の情報処理端末101bは、会話音声(本例では、「運動会楽しかったよ」)が優先して出音される設定に変更され、同時に、Bさんは自分の情報処理端末101bの出音レベル設定を変更できなくなる。つまり、この間は、Bさんの操作に関わらず、Aさんからの会話音声「運動会楽しかったよ」を、確実にBさんに聞かせることができるようになる。
In FIG. 1, first, suppose that Mr. A does not perform an operation for preferentially listening to Mr. B, but has a normal conversation. In this case, Mr. B can arbitrarily change the sound level setting of his terminal. Here, it is assumed that Mr. A operates the
そして、Aさんが会話音声を優先して相手(Bさん)に聞かせるのをやめようと、リモコンなどで情報処理端末101aの操作を行ったとする。この場合、Bさん宅の情報処理端末101bは、会話音声が優先して出音される直前の設定に戻り、同時に、Bさんは自分の情報処理端末101bの出音レベル設定を変更できるようになる。
Then, it is assumed that Mr. A operates the
本実施例の情報処理(通話)システムでは、ネットワーク102上のWWW(World Wide Web)サーバ、すなわちコンテンツサーバ103上に格納されている運動会の動画ファイルなどネットワーク102上にあるコンテンツを、Aさん宅の情報処理端末101aとBさん宅の情報処理端末101bの両方で同期出力し、同時にAさんとBさんの間で会話も楽しむことができる。つまり、本実施例の情報処理端末からなる情報処理システムは、コンテンツを共有しながら会話できるため、今まで以上につながり感のあるコミュニケーションが実現できるように構成されている。ここでいう同期出力とは、Aさん宅とBさん宅において同じタイミングでコンテンツが再生されることを示しており、同じタイミングとは、完全にタイミングが一致したものである必要はなく、通信網の遅延などによる多少のタイミングの不一致を許容するものとする。
In the information processing (calling) system of the present embodiment, content on the
図2は、実施例1の情報処理システムの概要構成例を説明するための図である。本実施例の情報処理システムは、ネットワーク102を介して接続された情報処理端末101a(Aさん宅)と情報処理端末101b(Bさん宅)とコンテンツサーバ103とによって構成される。ここでは、例えば、情報処理端末101aはAさんが操作するテレビ電話機、情報処理端末101bはBさんが操作するテレビ電話機を想定する。また、コンテンツサーバ103は、コンテンツを保持するWWWサーバを想定しており、指定されたコンテンツをストリームデータとして情報処理端末101aと情報処理端末101bとに同時に配信する。
FIG. 2 is a diagram for explaining a schematic configuration example of the information processing system according to the first embodiment. The information processing system according to this embodiment includes an
情報処理端末101aは、Aさんの会話音声11aを情報処理端末101bへ送信すると共に、ネットワーク102を介してコンテンツサーバ103から受信したコンテンツ音声13aと情報処理端末101bから受信したBさんの会話音声12aとを混合して混合音声14aとして出音する。同様に、情報処理端末101bは、Bさんの会話音声12bを情報処理端末101aへ送信すると共に、ネットワーク102を介してコンテンツサーバ103から受信したコンテンツ音声13bと情報処理端末101aから受信したAさんの会話音声11bとを混合して混合音声14bとして出音する。なお、本実施例の情報処理システムでは、通常のテレビ電話と同様に音声通信と共に映像通信も行なうが、本発明は音声通信に関するものであるため、映像通信に関する説明は省略する。
The
図3は、実施例1の情報処理端末101aの構成例を示すブロック図で、情報処理端末101aは、通信部110、会話音声入力部111、音声出力部112、会話音声送信部113、会話音声受信部114、コンテンツ音声受信部115、出音音声混合部116、混合音量変更入力部117、モード変更入力部118、モード変更送信部119、モード変更受信部120、及び出音制御部121によって構成される。なお、情報処理端末101aと情報処理端末101bは同じ構成とする。以下、情報処理端末101aあるいは情報処理端末101bをしばしば情報処理端末101という。
FIG. 3 is a block diagram illustrating a configuration example of the
通信部110は、ネットワーク102を介して通信相手の情報処理端末(情報処理端末101b)やコンテンツサーバ103と有線通信または無線通信を行なう手段であり、例えばネットワークカードやLAN(Local Area Network)接続端子などで構成される。
The
会話音声入力部111は、Aさんの発する音声や周囲の音を電気信号に変換して会話音声を生成する手段であり、具体的にはマイクなどの音声入力装置である。音声出力部112は、通信相手であるBさんの会話音声とコンテンツ音声とを混合した電気信号である混合音声を出音する手段であり、具体的にはスピーカなどの音声出力装置である。会話音声送信部113は、会話音声入力部111から伝えられた会話音声を、通信部110を介してネットワーク102へ送信する手段である。
The conversation
会話音声受信部114は、ネットワーク102を介して情報処理端末101bから会話音声を受信する手段である。また、コンテンツ音声受信部115は、ネットワーク102を介してコンテンツサーバ103からコンテンツ音声を受信する手段である。
The conversation
出音音声混合部116は、定められた混合音量情報に基づき、会話音声受信部114で受信した会話音声と、コンテンツ音声受信部115で受信したコンテンツ音声との音量をそれぞれ設定し、混合して混合音声を生成する。混合音量情報は、例えば、会話音声とコンテンツ音声との音量比率を「7:3」のような形で指定する。その場合、出音音声混合部116は、会話音声の音量とコンテンツ音声の音量の比率が7対3になるように設定して混合する。なお、比率を算出するときに必要な基準単位は、TVの音量レベルの目盛りのようなものや、dBなど音響学的な音の単位など、何でもよい。また、混合音量情報は必ずしも比率でなくともよく、各々の絶対音量を指定する形式であってもよい。
The output
混合音量変更入力部117は、Aさんが情報処理端末101aで出音する音声の混合音量情報を変更するときに操作する手段であり、Aさんの操作に応じた混合音量変更信号を生成する。具体的にはリモコンなどの操作装置である。
The mixed volume
モード変更入力部118は、Aさんが通信相手であるBさんの情報処理端末101bのモードを切り替えるときに操作する手段であり、Aさんの操作に応じたモード変更信号(すなわち、本発明の出音レベル設定変更指示情報)を生成する。具体的にはリモコンなどの操作装置である。なお、モードの種類は、例えば、通常通りの出音レベル設定で会話を行なう通常モードと、会話音声を優先して出音する会話優先出音モードの2種類である。なお、モード変更信号が会話優先出音モードである場合は、通信相手であるBさんの情報処理端末101bの出音レベル設定をこちら(Aさん側)から強制的に変更することになるため、この効果はあくまでも一時的なものとなるように考慮する。例えば、図28において後述するリモコン1013にモードボタン1016を設けて、Aさんがリモコンの所定の操作キーを押し続けている間だけ有効とする、もしくは、リモコンの操作キーを押下してから所定時間(例えば10秒間)のみ有効とする、などの方法が考えられる。このモードボタン1016をリモコン1013に実装した例については、図28を用いて詳細に説明する。
The mode
モード変更送信部119は、モード変更入力部118から伝えられたモード変更信号を、通信部110を介してネットワーク102へ送信する手段である。送信されたモード変更信号が会話優先出音モードの場合、情報処理端末101bでは会話音声が優先して出音されるような設定に変更され、同時に、Bさんの操作によって情報処理端末101bの出音レベル設定が変更されることが禁止あるいは制限される。
The mode change transmission unit 119 is a means for transmitting the mode change signal transmitted from the mode
ここで、情報処理端末101aは、情報処理端末101bにモード変更信号(出音レベル設定変更指示情報)を送信した後から、その出音レベル設定変更指示を解除するための出音レベル設定変更終了指示情報を送信するまでの期間、情報処理端末101bによる出音レベル設定の変更を禁止もしくは制限されるようにしてもよい。上記出音レベル設定変更終了指示情報は、モード変更信号により出音レベル設定変更指示した情報処理端末101bに対して、その出音レベル設定変更指示を解除するためのモード解除信号で、情報処理端末101aから送信される。
Here, after the
例えば、情報処理端末101aを操作するリモコンにモード変更信号を送信するための操作キーを備え、情報処理端末101aの利用者が操作キーを押下したとき、情報処理端末101bにモード変更信号を送信し(会話優先出音モードが有効)、利用者が操作キーの押下をやめたときに、情報処理端末101bにモード解除信号を送信するようにしてもよい。
For example, an operation key for transmitting a mode change signal is provided to a remote controller for operating the
また、情報処理端末101aの利用者が操作キーを押下したときに、情報処理端末101bにモード変更信号を送信し、そのモード変更信号を送信してから所定時間(例えば10秒)が経過した後に、情報処理端末101bにモード解除信号を送信するようにしてもよい。モード解除信号を受信した情報処理端末101bは、出音レベル設定の操作が可能となり、出音レベル設定の禁止もしくは制限される直前の出音レベル設定、すなわち、会話音声の優先出音レベル設定前の出音レベル設定に戻すようにしてもよい。
Further, when a user of the
また、上記方法と異なる方法として、情報処理端末101aが情報処理端末101bにモード変更信号(出音レベル設定変更指示情報)を送信した後から、一定時間の間、情報処理端末101bによる出音レベル設定の変更が禁止もしくは制限されるようにしてもよい。この場合、出音レベル設定変更終了指示情報は必要なく、情報処理端末101bは、出音レベル設定変更指示情報を受信して一定時間が経過すると、出音レベル設定の操作が可能となる。また、このとき出音レベル設定の禁止もしくは制限される直前の出音レベル設定、すなわち、会話音声の優先出音レベル設定前の出音レベル設定に戻すようにしてもよい。
Further, as a method different from the above method, the sound output level by the
モード変更受信部120は、通信部110を介してネットワーク102から、情報処理端末101bからのモード変更信号を受信する手段である。この際、受信したモード変更信号が会話優先出音モードの場合は、情報処理端末101aでは会話音声が優先して出音されるような設定に変更され、同時に、Aさんの操作によって情報処理端末101aの出音レベル設定が変更されることが禁止あるいは制限される。
The mode
出音制御部121は、情報処理端末101aの混合音量変更信号と情報処理端末101bから受信したモード変更信号を入力し、それに基づいた混合音量情報を決定し、保持する手段である。
The sound
図4は、出音制御部121の詳細な構成例を示すブロック図で、出音制御部121は、混合音量制御部121a、混合音量情報保持部121b、モード情報保持部121c、元設定混合音量情報保持部121d、会話優先混合音量情報保持部121eによって構成されている。
FIG. 4 is a block diagram illustrating a detailed configuration example of the sound
混合音量制御部121aは、情報処理端末101aの混合音量変更信号123と、情報処理端末101bから受信したモード変更信号124を入力し、それに基づいた混合音量情報122を決定し、混合音量情報保持部121bへ書き込む手段である。このとき、混合音量制御部121aは、必要に応じて、混合音量情報保持部121b、モード情報保持部121c、元設定混合音量情報保持部121d、会話優先混合音量情報保持部121eの4つの情報保持部に対して情報を書き込み、あるいは、4つの情報保持部から情報を読み込む処理を行う。
The mixed
混合音量情報保持部121bは、混合音量情報を保持する。モード情報保持部121cは、会話優先出音モードであるか通常モードであるかのモード情報を保持する。元設定混合音量情報保持部121dは、会話優先出音モードから通常モードになった場合に設定する混合音量情報を保持する。このときの混合音量情報は、会話優先出音モードになる直前の出音レベル設定である。会話優先混合音量保持部121eは、会話優先出音モードの場合に設定する混合音量情報を保持する。なお、この混合音量情報はあらかじめ決定されていてもよいし、情報処理端末101bから指定するようにしてもよい。
The mixed volume
実施例1における情報処理端末101aの動作例を以下に示すフロー図を用いて説明する。なお、情報処理端末101aを中心に説明するが、情報処理端末101bの動作も同様である。
(音声通話)
図5は、実施例1における情報処理端末101aの音声通話処理の一例を説明するためのフロー図である。尚、本例は、図3及び図4に示した構成に基づいて説明するものとする。また、実際には送信プロセスと受信プロセスは同時に行なわれているが、説明のためそれぞれのプロセスを分けて示している。
An operation example of the
(Voice call)
FIG. 5 is a flowchart for explaining an example of the voice call process of the
図5(A)に示す送信プロセスにおいて、まず、情報処理端末101aは、Aさんの会話音声を会話音声入力部111により取り込み(ステップS1)、取り込んだ会話音声を通信部110を介してネットワーク102へ送信する(ステップS2)。一方、図5(B)に示す受信プロセスにおいて、情報処理端末101aは、通信部110を介してネットワーク102からBさんの会話音声を受信し、同時にコンテンツ音声を受信する(ステップS3)。続いて、出音音声混合部116は、これらふたつの音声を混合するため、混合音量情報保持部121bから混合音量情報を読み出し(ステップS4)、その比率に基づいて会話音声とコンテンツ音声を混合して混合音声を生成し(ステップS5)、生成した混合音声を、音声出力部112から出音する(ステップS6)。なお、ステップS1〜S2の送信プロセスと、ステップS3〜S6の受信プロセスは同時に実行されているものとする。
In the transmission process shown in FIG. 5A, first, the
(混合音量変更)
図6は、実施例1における情報処理端末101aで出音される音声の混合音量変更処理の一例を説明するためのフロー図である。尚、本例は、図3及び図4に示した構成に基づいて説明するものとする。まず、情報処理端末101aは、Aさんが混合音量を変更するために行なった操作により入力された信号を、混合音量変更入力部117を通して混合音量変更信号123に変換し(ステップS11)、その混合音量変更信号123を混合音量制御部121aに入力する。次に、混合音量制御部121aは、モード情報保持部121cから今のモード情報を読み出し、会話優先出音モードであるか通常モードであるかをチェックする(ステップS12)。
(Mixed volume change)
FIG. 6 is a flowchart for explaining an example of the mixed sound volume changing process for the sound output from the
次に、混合音量制御部121aは、ステップS12において、通常モードである場合(図中、通常モードの場合)、混合音量変更信号123に基づいた混合音量情報122を混合音量情報保持部121bへ書き込み、混合音量情報122を変更し(ステップS14)、その結果を表示する(ステップS15)。一方、ステップS12において、会話優先出音モードである場合(図中、会話優先出音モードの場合)、混合音量情報122を変更しないで、その結果を表示する(ステップS13)。
Next, in step S12, the mixed
ここで、図7に示すように、通常モードにおいて、情報処理端末101aで出音される音声の混合音量を変更できれば、変更できたことを利用者に伝えるための情報を情報処理端末101aの画面に表示する。本例の情報処理端末101aは、「変更しました 会話X:コンテンツY」を表示する。なお、会話X:コンテンツYとは、会話音声とコンテンツ音声の音量比率がX:Yであることを示す。一方、会話優先出音モードにおいて、情報処理端末101aで出音される音声の混合音量を変更することができなければ、変更できないことを利用者に伝えるための情報を情報処理端末101aの画面に表示する。本例の情報処理端末101aは、「変更できません 会話優先出音中」を表示する。
Here, as shown in FIG. 7, in the normal mode, if the mixed sound volume of the sound output from the
(会話優先送信)
図8は、実施例1において情報処理端末101aが情報処理端末101bに対してモード変更の操作を行なった際の動作例を説明するためのフロー図である。尚、本例は、図3及び図4に示した構成に基づいて説明する。まず、情報処理端末101aは、Aさんが情報処理端末101bのモードを切り替えるために行なった操作により入力された信号を、モード変更入力部118を通してモード変更信号に変換し(ステップS21)、そのモード変更信号をモード変更送信部119によって、通信部110を介してネットワーク102へ送信する(ステップS22)。
(Conversation priority transmission)
FIG. 8 is a flowchart for explaining an operation example when the
次に、情報処理端末101aは、送信したモード変更信号が通常モードか会話優先出音モードかをチェックし(ステップS23)、会話優先出音モードの場合(図中、会話優先出音モードの場合)、その結果を表示する(ステップS24)。一方、ステップS23において、通常モードの場合(図中、通常モードの場合)、その結果を表示する(ステップS25)。上記ステップS24及びステップS25における送信結果の表示例を図9に示す。このように、送信したモード変更信号が会話優先出音モード、通常モードのどちらであるかを知らせるための情報を、情報処理端末101aの画面に表示させ、利用者に伝える。
Next, the
図9に示す画面例において、会話優先出音モードが送信された場合、情報処理端末101aは、その画面上に「会話優先送信中」を表示し、通常モードが送信された場合、「会話優先送信解除」を表示する。
In the screen example shown in FIG. 9, when the conversation priority sound output mode is transmitted, the
(会話優先受信)
図10は、実施例1において情報処理端末101aが情報処理端末101bからモード変更の操作を受けた際の動作例を説明するためのフロー図である。尚、本例は、図3及び図4に示した構成に基づいて説明する。まず、情報処理端末101aは、情報処理端末101bからモード変更信号124をモード変更受信部120で受信し、混合音量制御部121aへ伝える(ステップS31)。続いて、混合音量制御部121aは、このモード変更信号124が会話優先出音モードか通常モードかをチェックし(ステップS32)、会話優先出音モードである場合(図中、会話優先出音モードの場合)、混合音量制御部121aは、モード情報保持部121cへモード情報として会話優先出音モードを書き込む(ステップS33)。次に、元設定の混合音量情報を保持しておくため、混合音量情報保持部121bから現在の混合音量情報を読み出し、元設定混合音量情報保持部121dへ書き込み(ステップS34)、その後、会話優先混合音量情報保持部121eから会話優先出音モード用の出音レベル設定を読み出し、混合音量情報保持部121bへ書き込む(ステップS35)。最後に、どちらのモードを受信したか示す情報を画面上に表示する(ステップS36)。
(Conversation priority reception)
FIG. 10 is a flowchart for explaining an operation example when the
一方、ステップS32において、モード変更信号124が通常モードである場合(図中、通常モードの場合)、混合音量制御部121aは、モード情報保持部121cへモード情報として通常モードを書き込む(ステップS37)。次に、元設定の混合音量に戻すため、元設定混合音量情報保持部121dから混合音量情報を読み出し、混合音量情報保持部121bへ書き込む(ステップS38)。最後に、どちらのモードを受信したか示す情報を画面上に表示する(ステップS39)。上記ステップS36及びステップS39における受信結果の表示例を図11に示す。このように、受信したモード変更信号が会話優先出音モード、通常モードのどちらであるかを知らせるための情報を、情報処理端末101aの画面に表示させ、利用者に伝える。
On the other hand, when the
図11に示す画面例において、会話優先出音モードを受信した場合、情報処理端末101aは、その画面上に「会話優先出音中」を表示し、通常モードを受信した場合、「会話優先出音解除 会話X:コンテンツY」を表示する。この会話X:コンテンツYは、モード変更前の元の出音レベル設定を示す。
In the screen example shown in FIG. 11, when the conversation priority sound output mode is received, the
図12は、混合音量情報及びモード情報のデータ構造の一例を示す図である。図12(A)に示す混合音量情報及び混合音量変更信号は、会話音声とコンテンツ音声の比率で表される。このとき、比率の値を音量レベルとみなすことにより、比率だけではなく絶対音量の情報を付け加えることも可能である。また、図12(B)に示すモード情報及びモード変更信号は、会話音声を優先して出音するための会話優先出音モード、通常の出音レベル設定で会話を行うための通常モードのいずれかで表される。 FIG. 12 is a diagram illustrating an example of a data structure of the mixed volume information and mode information. The mixed sound volume information and mixed sound volume change signal shown in FIG. 12A are represented by the ratio of conversational sound and content sound. At this time, by regarding the value of the ratio as a volume level, it is possible to add not only the ratio but also information on the absolute volume. Further, the mode information and the mode change signal shown in FIG. 12 (B) are either a conversation priority sound output mode for outputting a sound with priority to a conversation sound or a normal mode for performing a conversation with a normal sound output level setting. It is represented by
(会話優先出音モードにならない機能)
本実施例の情報処理システムの使用場面を想定すると、コンテンツをじっくりと観たいときなど、コンテンツ音声を集中して聞きたい場合があると思われる。そういう場合のために、情報処理端末101に会話優先出音モードにならない機能を備えるようにしてもよい。この機能を有効にすると、通信相手から受信したモード変更信号を無視して、情報処理端末101の出音レベル設定を任意に設定でき、コンテンツ音声を集中して聞くことができる。例えば、情報処理端末101を操作するリモコンなどにモード変更信号を無効にするための操作キーを備え、利用者により操作キーが押下されると、モード変更信号を受信した場合でも情報処理端末101の出音レベル設定が変更されないようにしてもよい。
(Function that does not enter conversation priority sound output mode)
Assuming the usage scene of the information processing system of this embodiment, there may be a case where the user wants to listen to the content sound in a concentrated manner, for example, when he wants to watch the content carefully. For such a case, the information processing terminal 101 may be provided with a function that does not enter the conversation priority sound output mode. If this function is enabled, the mode change signal received from the communication partner can be ignored, the sound output level setting of the information processing terminal 101 can be arbitrarily set, and the content sound can be listened in a concentrated manner. For example, an operation key for invalidating a mode change signal is provided in a remote controller or the like that operates the information processing terminal 101, and when the operation key is pressed by the user, even if the mode change signal is received, the information processing terminal 101 The sound output level setting may not be changed.
(会話優先出音モードでもある程度操作できる機能)
また、本実施例の情報処理システムの使用場面を想定すると、会話優先出音モードになったときの出音レベル設定を、自分が聞きやすいように微調整したい場合があると思われる。そういう場合のために、会話優先出音モードであっても、情報処理端末101にある程度出音操作できる機能を備えるようにしてもよい。この機能を有効にすると、会話優先出音モード中であっても、会話音声が優先して出力されるような範囲内で情報処理端末101の出音レベル設定を調整することができる。
(Function that can be operated to some extent even in conversation priority sound output mode)
Further, assuming the use situation of the information processing system of the present embodiment, it may be desired to finely adjust the sound output level setting when the conversation priority sound output mode is entered so that the user can easily hear it. For such a case, even in the conversation priority sound output mode, the information processing terminal 101 may be provided with a function capable of performing sound output to some extent. If this function is enabled, it is possible to adjust the sound output level setting of the information processing terminal 101 within a range in which the conversation voice is preferentially output even in the conversation priority sound output mode.
(お互いに会話優先出音モードになる機能)
また、本実施例の情報処理システムの使用場面を想定すると、相手側に会話音声を優先して出音させたいときは、お互いに会話をするのが目的であることが多いため、相手からの会話音声もこちらで優先して出音したい場合があると思われる。そういう場合のために、情報処理端末101にお互いに会話優先出音モードになる機能を備えるようにしてもよい。この機能を有効にすると、相手(受話)側に会話音声を優先して出音させようとモード変更の操作を行なった場合、相手(受話)側の情報処理端末101が会話優先出音モードになるとともに、自分(送話)側の情報処理端末101でも相手からの会話音声が優先して出音されるような設定に変更される。
(Function to switch to conversation priority sound output mode)
Assuming that the information processing system of the present embodiment is used, when the other party wants to give priority to the conversation voice, it is often the purpose of talking to each other. There may be cases where you want to prioritize the conversation voice here. For such a case, the information processing terminal 101 may be provided with a function of entering the conversation priority sound output mode. When this function is enabled, when the mode change operation is performed so that the conversation (speech) side gives priority to the conversation voice, the information processing terminal 101 on the partner (reception) side enters the conversation priority sound output mode. At the same time, the information processing terminal 101 on its own (sending) side is also changed to a setting that gives priority to the conversation voice from the other party.
(ステレオスピーカを用いて出力音声をチャネルで分ける機能)
また、コンテンツ音声を会話音声とコンテンツ音声が明瞭に聞き分けられるように、それぞれの音声を別の場所から出音させる機能があってもよい。図13は、ステレオスピーカを用いて出力音声をチャネルで分ける機能の一例を説明するための概念図である。
(Function to divide output audio by channel using stereo speakers)
Further, there may be a function of outputting each sound from another place so that the content sound can be clearly distinguished from the conversation sound and the content sound. FIG. 13 is a conceptual diagram for explaining an example of a function of dividing output sound by channel using a stereo speaker.
図13に示す例では、左右2つのスピーカを用いて左チャネルと右チャネルの2チャネルの音声、つまりステレオ音声を出音できるステレオスピーカを想定している。通常の場合は、会話音声とコンテンツ音声が同時に出音される。すなわち、左スピーカからは会話音声のL音声とコンテンツ音声のL音声が混合された音声が、右スピーカからは、会話音声のR音声とコンテンツ音声のR音声とが混合された音声が、それぞれ出音される。この場合、会話音声もコンテンツ音声も2チャンネルのステレオ音声で出音されるため、臨場感あふれる音声を聞くことができるが、左スピーカでも右スピーカでも会話音声とコンテンツ音声が混合した音が出音されるため、会話音声とコンテンツ音声を聞き分けることが困難である。そこで、会話音声とコンテンツ音声を聞き分けたい場合、すなわち、情報処理端末101bからモード変更の操作を受けた際は、会話音声とコンテンツ音声それぞれに関して、会話音声を左チャネル、コンテンツ音声を右チャネルというようにチャネルを分けて別々のスピーカから独立して出音する。このとき、元の音声信号がステレオ音声である場合は、ステレオ音声を合成して1チャネルの音声であるモノラル音声を生成してからチャネルを分けて出音させる。このような制御により、会話音声とコンテンツ音声は別々のスピーカから独立して出音されるため、聞き分けやすくなるという効果が期待できる。
The example shown in FIG. 13 assumes a stereo speaker that can output two-channel sound of the left channel and the right channel, that is, stereo sound, using two left and right speakers. In a normal case, conversation voice and content voice are output simultaneously. That is, the left speaker outputs a sound in which the conversation sound L sound and the content sound L sound are mixed, and the right speaker outputs a sound in which the conversation sound R sound and the content sound R sound are mixed. Sounded. In this case, both the conversational sound and the content sound are output as two-channel stereo sound, so that you can hear a sound that is full of realism, but the sound that is a mixture of the conversational sound and the content sound is output from either the left speaker or the right speaker. Therefore, it is difficult to distinguish between the conversation voice and the content voice. Therefore, when it is desired to distinguish between the conversation voice and the content voice, that is, when a mode change operation is received from the
(コンテンツ音声を優先して相手側で出音させる機能)
また、本実施例の情報処理システムの使用場面を想定すると、コンテンツ共有時に、重要な見せ場など特定のシーンを強調して相手に聞かせたい場合があると考えられる。そういう場合のために、会話音声を優先させる会話優先出音モードと同様に、コンテンツ音声を優先させるモードがあってもよい。一例として、ボタンを押している間だけ相手側でコンテンツ音声が優先して出音されるという方法が考えられる。
(Function that allows content audio to be output on the other party's priority)
Assuming the usage scene of the information processing system of the present embodiment, it is considered that there is a case where a specific scene such as an important display place is emphasized and told to the other party when sharing contents. For such a case, there may be a mode in which the content sound is prioritized similarly to the conversation priority sound output mode in which the conversation sound is prioritized. As an example, there may be a method in which content audio is preferentially output on the other party only while the button is pressed.
(エコーキャンセラの設定がモードと連動して切り替わる機能)
本実施例の情報処理システムをハンズフリーで使用する場合、エコーキャンセラが必須となる。また、会話優先出音モードの場合は交互に会話をやりとりする半二重通話の状態が多くなり、通常モードの場合は同時に音声が流れる全二重通話の状態が多くなる。つまり、モードにより通話の特徴が異なるため、エコーキャンセラの適切な設定はモード毎に異なる。
(Function to switch the echo canceller setting in conjunction with the mode)
When the information processing system of this embodiment is used in a hands-free manner, an echo canceller is essential. Further, in the conversation priority sound output mode, the state of half-duplex calls in which conversations are alternately exchanged increases, and in the normal mode, the state of full-duplex calls in which voice flows simultaneously increases. That is, since the characteristics of the call differ depending on the mode, the appropriate setting of the echo canceller differs for each mode.
このことを考慮して、会話優先出音モードを設定した側(情報処理端末101a側)では、自分の会話音声11aを積極的に相手に送るが、相手からの会話音声12aはあまり送られてこないという状況に合わせてエコーキャンセラの設定を行ない、一方、会話優先出音モードを受けた側(情報処理端末101b側)では、相手からの会話音声11bは積極的に送られてくるが自分の会話音声12bはあまり送らないという状況に合わせてエコーキャンセラの設定を行なう、そして、通常モードでは、双方向で音声を送受信するという状況に合わせてエコーキャンセラの設定を行なうという機能があってもよい。
In consideration of this, the side that has set the conversation priority sound output mode (
(コンテンツを共有してないとき会話優先出音モードを自動的に無効にする機能)
また、コンテンツ共有をしていない場合、相手側は会話に適した出音レベル設定にしていると思われ、会話優先出音モードの機能はあまり意味がない。したがって、コンテンツを共有していない場合は、常に通常モードとなるようにしてもよい。
(Function to automatically disable conversation priority sound output mode when content is not shared)
If the content is not shared, the other party seems to have set the sound output level suitable for conversation, and the function of the conversation priority sound output mode is not very meaningful. Therefore, when the content is not shared, the normal mode may always be set.
(会話音声の音量レベルに応じてモード変更する機能)
会話優先出音モードと通常モードの切り替えを、会話音声11aに応じて行なう機能があってもよい。具体的には、波形を解析してAさんの会話音声が入力されたと認識したら会話優先出音モードになる、あるいは、会話音声11aの音量レベルに応じてモード変更を行なうという例が考えられる。
(Function to change the mode according to the volume level of the conversation voice)
There may be a function of switching between the conversation priority sound output mode and the normal mode according to the conversation sound 11a. Specifically, an example is considered in which when the waveform is analyzed and it is recognized that Mr. A's conversation voice is input, the conversation priority sound output mode is set, or the mode is changed according to the volume level of the conversation voice 11a.
図14を用いて、音量レベルに応じてモード変更を行なう例について説明する。図14に示すグラフ(特性曲線)は会話音声の音量レベルの時間変化の一例を表したものである。会話優先出音モードへの切り替えは、会話音声の音量レベルが一定時間以上、設定レベル以上のときに行なう。一方、通常モードへの切り替えは、会話音声の音量レベルが一定時間以下、解除レベル以下のときに行なう。なお、モードが頻繁に切り替わることを防ぐため、一度モードが切り替わったら、そのモードは切り替えアルゴリズムに関わらず一定期間は続くものとする。 An example in which the mode is changed according to the volume level will be described with reference to FIG. The graph (characteristic curve) shown in FIG. 14 represents an example of the temporal change in the volume level of the conversational voice. The switching to the conversation priority sound output mode is performed when the volume level of the conversation voice is equal to or higher than a set level for a predetermined time or longer. On the other hand, switching to the normal mode is performed when the volume level of the conversation voice is below a certain time and below the cancellation level. In order to prevent the mode from switching frequently, once the mode is switched, the mode continues for a certain period regardless of the switching algorithm.
図14において、時刻t1では音量レベルが設定レベル以上になっているが、その時間帯Aが一定時間以上でないため会話優先出音モードにはならない、一方、時刻t2では、音量レベルが設定レベル以上になっている時間帯Bが一定時間以上であるため会話優先出音モードに切り替わっている。また、時刻t3では、音量レベルが解除レベル以下であり、その時間帯Cが一定時間以上であるため、通常モードに切り替わる条件は満たしているが、会話優先出音モードに切り替わってから一定期間内であるため、モードは切り替わらない。最後に、時刻t4では、音量レベルが解除レベル以下になっている時間帯Dが一定時間以上であり、さらに、会話優先出音モードに切り替わってから一定期間後であるため、通常モードに切り替わっている。 In FIG. 14, the sound volume level is equal to or higher than the set level at time t 1 , but the conversation priority sound output mode is not set because the time zone A is not equal to or longer than a certain time, while the sound volume level is set at time t 2. Since the time zone B that is higher than the level is longer than a certain time, the mode is switched to the conversation priority sound output mode. At time t 3 , the volume level is equal to or lower than the release level, and the time zone C is equal to or longer than a certain time. Therefore, the condition for switching to the normal mode is satisfied, but for a certain period after switching to the conversation priority sound output mode. Because it is within, the mode is not switched. Finally, at time t 4, the time period D the volume level is equal to or less than cancellation level is at a predetermined time or more, further, since it is after a predetermined period after switching to conversation priority sound output mode, it switched to the normal mode ing.
なお、前述した会話優先出音モードにならない機能、会話優先出音モードでもある程度操作できる機能、お互いに会話優先出音モードになる機能、ステレオスピーカを用いて出力音声をチャネルで分ける機能、コンテンツ音声を優先して相手側で出音させる機能、エコーキャンセラの設定がモードと連動して切り替わる機能、コンテンツを共有してないとき会話優先出音モードを自動的に無効にする機能、会話音声の音量レベルに応じてモード変更する機能の各機能は、実施例1だけでなく、以下に説明する実施例2,3にも同様に適用することができる。 In addition, the function which does not become the conversation priority sound output mode mentioned above, the function which can be operated to some extent even in the conversation priority sound output mode, the function which becomes the conversation priority sound output mode to each other, the function which divides the output sound by the channel using the stereo speaker, the content sound A function that allows the other party to output sound with priority, a function that switches the echo canceller setting in conjunction with the mode, a function that automatically disables the conversation priority sound output mode when content is not shared, the volume of the conversation voice Each function of changing the mode according to the level can be applied not only to the first embodiment but also to the second and third embodiments described below.
(実施例2)
図15は、実施例2の情報処理システムの概要構成例を説明するための図である。本実施例の情報処理システムの特徴は、Aさんが所有しているコンテンツを共有しながらAさんとBさんで会話を楽しめるというものである。Aさんが所有しているコンテンツは、例えば、情報処理端末に録画されたものでもよいし、ビデオデッキやデジタルビデオカメラなどを情報処理端末の外部入力端子に接続して読み込んだものでもよいし、SD(Secure Digital)メモリーカードなどの記録媒体を情報処理端末のメモリーカードスロットに挿入して読み込んだものでもよく、様々な形態が考えられる。
(Example 2)
FIG. 15 is a diagram for explaining a schematic configuration example of the information processing system according to the second embodiment. A feature of the information processing system of the present embodiment is that A and B can enjoy a conversation while sharing the contents owned by A. The content owned by Mr. A may, for example, be recorded on the information processing terminal, or may be read by connecting a video deck or digital video camera to the external input terminal of the information processing terminal, A recording medium such as an SD (Secure Digital) memory card may be read by inserting it into a memory card slot of the information processing terminal, and various forms are possible.
本実施例の情報処理システムは、ネットワーク202を介して接続された情報処理端末201aと情報処理端末201bとコンテンツ保持部203とによって構成される。本実施例の情報処理システムが、前述の実施例1と大きく異なる点は、コンテンツ保持部203と情報処理端末201aが接続され、Aさんの情報処理端末201aからBさんの情報処理端末201bにコンテンツを送信するようにした点である。本例のコンテンツ保持部203は、例えば、情報処理端末201aに内蔵された記憶媒体や、情報処理端末201aに外部接続可能な記憶媒体など、コンテンツを保持、提供可能なものであればよく、実施例1と同様にネットワーク上のコンテンツサーバであってもよい。
The information processing system according to the present exemplary embodiment includes an information processing terminal 201a, an information processing terminal 201b, and a
情報処理端末201aは、Aさんの会話音声21aを情報処理端末201bへ送信すると共に、コンテンツ保持部203から取得したコンテンツ音声23aと情報処理端末201bから受信したBさんの会話音声22aとを混合して混合音声24aとして出音する。同様に、情報処理端末201bは、Bさんの会話音声22bを情報処理端末201aへ送信すると共に、情報処理端末201aから受信したコンテンツ音声23bと情報処理端末201aから受信したAさんの会話音声21bとを混合して混合音声24bとして出音する。
The information processing terminal 201a transmits Mr. A's
図16は、実施例2の情報処理端末201aの構成例を示すブロック図で、情報処理端末201aは、通信部210、会話音声入力部211、音声出力部212、会話音声送信部213、会話音声受信部214、出音音声混合部215、混合音量変更入力部216、モード変更入力部217、モード変更送信部218、モード変更受信部219、コンテンツ音声抽出部220、コンテンツ音声送信部221、出音制御部222、及びコンテンツ保持部203によって構成される。なお、本例における情報処理端末201bは、前述の図3に示した実施例1の情報処理端末101aと同じ構成をとるものとする。
FIG. 16 is a block diagram illustrating a configuration example of the information processing terminal 201a according to the second embodiment. The information processing terminal 201a includes a
図16において、コンテンツ音声抽出部220、コンテンツ音声送信部221、コンテンツ保持部203以外の各部(すなわち、通信部210、会話音声入力部211、音声出力部212、会話音声送信部213、会話音声受信部214、出音音声混合部215、混合音量変更入力部216、モード変更入力部217、モード変更送信部218、モード変更受信部219、出音制御部222)は、図3に示した実施例1の各部と同じ機能となるため、ここでの説明は省略する。なお、出音制御部222は、図4に示した出音制御部121と同様に、混合音量制御部、混合音量情報保持部、モード情報保持部、元設定混合音量情報保持部、会話優先混合音量情報保持部によって構成されている。
16, each unit other than the content
コンテンツ音声抽出部220は、コンテンツ保持部203からコンテンツ音声を抽出する手段である。コンテンツ音声送信部221は、コンテンツ音声抽出部220から伝えられたコンテンツ音声を、通信部210を介してネットワーク202へ送信する手段である。
The content
以下、図17に示すフローに基づいて、情報処理端末201aの動作例を中心に説明する。なお、情報処理端末201bの動作例は、前述の図5、図6、図8、図10に示した実施例1のフローと同様であるため説明を省略する。 Hereinafter, based on the flow shown in FIG. 17, the operation example of the information processing terminal 201a will be mainly described. Note that the operation example of the information processing terminal 201b is the same as the flow of the first embodiment shown in FIG. 5, FIG. 6, FIG. 8, and FIG.
(音声通話)
図17は、実施例2の情報処理端末201aの音声通話処理の一例を説明するためのフロー図である。尚、本例は、図16に示した構成に基づいて説明する。また、実際には送信プロセスと受信プロセスは同時に行なわれているが、説明のためそれぞれのプロセスを分けて示している。
(Voice call)
FIG. 17 is a flowchart for explaining an example of the voice call processing of the information processing terminal 201a according to the second embodiment. This example will be described based on the configuration shown in FIG. In addition, although the transmission process and the reception process are actually performed at the same time, each process is shown separately for explanation.
図17(A)に示す送信プロセスにおいて、まず、情報処理端末201aは、Aさんの会話音声を会話音声入力部211により取り込み、同時にコンテンツ音声をコンテンツ音声抽出部220により取り込む(ステップS41)。その後、情報処理端末201aは、会話音声送信部213により会話音声を、コンテンツ音声送信部221によりコンテンツ音声を、通信部210を介してネットワーク202へ送信する(ステップS42)。
In the transmission process shown in FIG. 17A, first, the information processing terminal 201a captures Mr. A's conversation voice by the conversation
一方、図17(B)に示す受信プロセスにおいて、まず、情報処理端末201aは、通信部210を介してネットワーク202からBさんからの会話音声を受信し、同時にコンテンツ音声をコンテンツ音声抽出部220により取り込む(ステップS43)。続いて、実施例1の場合と同様に、出音音声混合部215は、これらふたつの音声を混合するため、出音制御部222の混合音量情報保持部から混合音量情報を読み出し(ステップS44)、その比率に基づいて会話音声とコンテンツ音声を混合して混合音声を生成し(ステップS45)、生成した混合音声を、音声出力部212から出音する(ステップS46)。なお、ステップS41〜S42の送信プロセスと、ステップS43〜S46の受信プロセスは同時に実行されているものとする。
On the other hand, in the reception process shown in FIG. 17B, first, the information processing terminal 201a receives conversation voice from Mr. B from the
その他の処理、すなわち、混合音量変更、会話優先送信,会話優先受信の処理フローは、前述の図6、図8、図10に示した実施例1の場合と同様であるため説明を省略する。 The other processes, that is, the mixed sound volume change, conversation priority transmission, and conversation priority reception process flows are the same as those in the first embodiment shown in FIGS.
(外部入力端子が接続されていないときコンテンツを共有してないと判断する機能)
本発明の情報処理端末において、コンテンツサーバのデータを入力する外部入力端子に何も接続されていないときは、コンテンツを共有していないと判断する機能があってもよい。コンテンツを共有していないと判断した後、実施例1で記述した(コンテンツを共有してないときに会話優先出音モードを自動的に無効にする機能)を用いてもよい。
(Function to determine that content is not shared when the external input terminal is not connected)
The information processing terminal of the present invention may have a function of determining that content is not shared when nothing is connected to an external input terminal for inputting data of the content server. After determining that the content is not shared, the function described in the first embodiment (a function of automatically disabling the conversation priority sound output mode when the content is not shared) may be used.
なお、上記外部入力端子が接続されていないときコンテンツを共有してないと判断する機能は実施例2だけでなく、以下に説明する実施例3にも同様に適用することができる。 Note that the function of determining that content is not shared when the external input terminal is not connected is applicable not only to the second embodiment but also to the third embodiment described below.
(実施例3)
図18は、実施例3の情報処理システムの概要構成例を説明するための図である。本実施例の情報処理システムの特徴は、前述の実施例2と同様に、Aさんが所有しているコンテンツを共有しながらAさんとBさんで会話を楽しめるというものであるが、実施例2と異なる点は、AさんからBさんへ会話音声とコンテンツ音声を別々に送信するのではなく、Aさんの情報処理端末で混合してから送信するという点である。つまり、音声信号をひとつのデータとして送信できるため、既存のTV電話システムを利用できる。さらに、別々にふたつのデータとして送信していたときと比べて通信帯域を1/2に節約できるなどの効果を奏する。ただし、本実施例では、会話優先出音モードにおける出音レベル設定は絶対音量ではなく音量比率に制限される。
(Example 3)
FIG. 18 is a diagram for explaining a schematic configuration example of the information processing system according to the third embodiment. The characteristic of the information processing system of the present embodiment is that, like the second embodiment described above, A and B can enjoy a conversation while sharing the content owned by Mr. A. The difference is that conversation voice and content voice are not transmitted separately from Mr. A to Mr. B, but are mixed and transmitted at Mr. A's information processing terminal. That is, since an audio signal can be transmitted as one data, an existing TV phone system can be used. Furthermore, there is an effect that the communication band can be reduced to ½ compared to when the data is transmitted separately as two data. However, in this embodiment, the sound output level setting in the conversation priority sound output mode is not limited to the absolute sound volume but limited to the sound volume ratio.
本実施例の情報処理システムは、ネットワーク302を介して接続された情報処理端末301aと情報処理端末301bとコンテンツ保持部303とによって構成される。本実施例の情報処理システムが実施例2と大きく異なる点は、情報処理端末301aから情報処理端末301bへ送る音声が、会話音声とコンテンツ音声ではなく、既に混合された混合音声であるという点である。
The information processing system according to the present exemplary embodiment includes an
情報処理端末301aは、コンテンツ保持部303から取得したコンテンツ音声33aとAさんの会話音声31aとを混合して混合音声35aとしてBさんの情報処理端末301bに送信すると共に、コンテンツ保持部303から取得したコンテンツ音声33aと情報処理端末301bから受信したBさんの会話音声32aとを混合して混合音声34aとして出音する。同様に、情報処理端末301bは、Bさんの会話音声32bを情報処理端末201aへ送信すると共に、情報処理端末301aから受信した混合音声31bを出音する。
The
図19は、実施例3の情報処理端末301aの構成例を示すブロック図で、情報処理端末301aは、通信部310、会話音声入力部311、音声出力部312、会話音声受信部313、出音音声混合部314a,314b、混合音量変更入力部315、モード変更入力部316、モード変更受信部317、コンテンツ音声抽出部318、混合音声送信部319、混合音量変更受信部320、出音制御部321a,321b、及びコンテンツ保持部303によって構成される。
FIG. 19 is a block diagram illustrating a configuration example of the
図19において、出音音声混合部314b、混合音量変更受信部320、混合音声送信部319、出音制御部321b以外の各部(すなわち、コンテンツ保持部303、通信部310、会話音声入力部311、音声出力部312、会話音声受信部313、出音音声混合部314a、混合音量変更入力部315、モード変更入力部316、モード変更受信部317、コンテンツ音声抽出部318、出音制御部321a)は、図16に示した実施例2の各部と同じ機能となるため、ここでの説明は省略する。なお、出音制御部321a,321bは、図4に示した出音制御部121と同様に、混合音量制御部、混合音量情報保持部、モード情報保持部、元設定混合音量情報保持部、会話優先混合音量情報保持部によって構成されている。
In FIG. 19, each unit other than the sound output sound mixing unit 314b, the mixed sound volume
出音音声混合部314bは、会話音声入力部311からの会話音声と、コンテンツ音声抽出部318からのコンテンツ音声とを混合して混合音声を混合音声送信部319に入力する。混合音声送信部319は、出音音声混合部314bから伝えられた混合音声を、通信部310を介してネットワーク302へ送信する。混合音量変更受信部320は、通信部310を介してネットワーク302から、情報処理端末301bからの混合音量変更情報(音声比率の変更情報)を受信し、その混合音量変更情報を出音制御部321bへ入力する。出音音声混合部314bは、出音制御部321bの混合音量情報保持部から混合音量情報を読み出し、その比率に基づいて混合音声を生成し、生成した混合音声は混合音声送信部319からネットワーク302へ送信される。
The output sound mixing unit 314 b mixes the conversation sound from the conversation
(音声通話)
図20は、実施例3の情報処理端末301aの音声通話処理の一例を説明するためのフロー図である。尚、本例は、図19に示した構成に基づいて説明する。また、実際には送信プロセスと受信プロセスは同時に行なわれているが、説明のためそれぞれのプロセスを分けて示している。
(Voice call)
FIG. 20 is a flowchart for explaining an example of the voice call process of the
図20(A)に示す送信プロセスでは、まず、情報処理端末301aは、Aさんの会話音声が会話音声力部311により取り込まれ、同時に、コンテンツ音声がコンテンツ音声抽出部318により取り込まれる(ステップS51)。次に、出音音声混合部314bは、これらふたつの音声を混合するため、出音制御部321bの混合音量情報保持部から混合音量情報を読み出し(ステップS52)、その比率に基づいて混合音声を生成する(ステップS53)。その後、情報処理端末301aは、生成した混合音声を通信部310を介してネットワーク302へ送信する(ステップS54)。
In the transmission process shown in FIG. 20A, first, in the
一方、図20(B)に示す受信プロセスにおいて、まず、情報処理端末301aは、通信部310を介してネットワーク302からBさんからの会話音声を受信し、同時にコンテンツ音声をコンテンツ音声抽出部318により取り込む(ステップS55)。続いて、実施例2の場合と同様に、出音音声混合部314aは、これらふたつの音声を混合するため、出音制御部321aの混合音量情報保持部から混合音量情報を読み出し(ステップS56)、その比率に基づいて会話音声とコンテンツ音声を混合して混合音声を生成し(ステップS57)、生成した混合音声を、音声出力部312から出音する(ステップS58)。なお、ステップS51〜S54の送信プロセスと、ステップS55〜S58の受信プロセスは同時に実行されているものとする。
On the other hand, in the reception process shown in FIG. 20B, first, the
なお、情報処理端末301aにおける混合音量変更プロセスは、図6に示した実施例1の場合と同様であるため説明を省略する。
The mixed sound volume changing process in the
(会話優先送信)
図21は、実施例3において情報処理端末301aが情報処理端末301bに対してモード変更の操作を行なった際の動作例を説明するためのフロー図である。尚、本例は、図19に示した構成に基づいて説明する。まず、情報処理端末301aは、Aさんが情報処理端末301aのモードを切り替えるために行なった操作により入力された信号を、モード変更入力部316を通してモード変更信号に変換する(ステップS61)。続いて、モード変更信号を出音制御部321b内の混合音量制御部へ伝え、混合音量制御部は、このモード変更信号が会話優先出音モードか通常モードかをチェックし(ステップS62)、会話優先出音モードである場合(図中、会話優先出音モードの場合)、混合音量制御部は、モード情報保持部へモード情報として会話優先出音モードを書き込む(ステップS63)。
(Conversation priority transmission)
FIG. 21 is a flowchart for explaining an operation example when the
次に、元設定の混合音量情報を保持しておくため、混合音量情報保持部から現在の混合音量情報を読み出し、元設定混合音量情報保持部へ書き込み(ステップS64)、その後、会話優先混合音量情報保持部から会話優先出音モード用の出音レベル設定を読み出し、混合音量情報保持部へ書き込む(ステップS65)。最後に、どちらのモードを送信したか示す情報を画面上に表示する(ステップS66)。 Next, in order to retain the original mixed sound volume information, the current mixed sound volume information is read from the mixed sound volume information holding unit and written to the original set mixed sound volume information holding unit (step S64). The sound level setting for the conversation priority sound output mode is read from the information holding unit and written to the mixed sound volume information holding unit (step S65). Finally, information indicating which mode is transmitted is displayed on the screen (step S66).
一方、ステップS62において、モード変更信号が通常モードである場合(図中、通常モードの場合)、混合音量制御部は、モード情報保持部へモード情報として通常モードを書き込む(ステップS67)。次に、元設定の混合音量に戻すため、元設定混合音量情報保持部から混合音量情報を読み出し、混合音量情報保持部へ書き込む(ステップS68)。最後に、どちらのモードを送信したか示す情報を画面上に表示する(ステップS69)。上記ステップS66及びステップS69における受信結果の表示例を図9に示す。このように、送信したモード変更信号が会話優先出音モード、通常モードのどちらであるかを知らせるための情報を、情報処理端末301aの画面に表示させ、利用者(Aさん)に伝える。
On the other hand, when the mode change signal is the normal mode in step S62 (in the case of the normal mode in the figure), the mixed sound volume control unit writes the normal mode as mode information in the mode information holding unit (step S67). Next, in order to return to the original mixed sound volume, the mixed sound volume information is read from the original mixed sound volume information holding unit and written to the mixed sound volume information holding unit (step S68). Finally, information indicating which mode is transmitted is displayed on the screen (step S69). FIG. 9 shows a display example of the reception results in steps S66 and S69. In this way, information for notifying whether the transmitted mode change signal is the conversation priority sound output mode or the normal mode is displayed on the screen of the
なお、情報処理端末301aにおける会話優先受信プロセスは、図10に示した実施例1の場合と同様であるため説明を省略する。
The conversation priority reception process in the
(混合音量変更:通信相手の出音レベル設定)
図22は、実施例3の情報処理端末301aにおいて、情報処理端末301bから受信した混合音量変更信号に応じて、情報処理端末301bの出音レベル設定を変更する際の動作例を説明するためのフロー図である。尚、本例は、図19に示した構成に基づいて説明する。まず、情報処理端末301aは、情報処理端末301bから混合音量変更信号を混合音量変更受信部320で受信し、出音制御部321bの混合音量制御部に伝える(ステップS71)。次に、混合音量制御部は、モード情報保持部から今のモード情報を読み出し、会話優先出音モードであるか通常モードであるかをチェックする(ステップS72)。その結果、通常モードである場合(図中、通常モードの場合)、情報処理端末301bからの混合音量変更信号に基づいた混合音量情報を混合音量情報保持部へ書き込み、情報処理端末301bの混合音量情報を変更する(ステップS73)。一方、ステップS72において、会話優先出音モードである場合(図中、会話優先出音モードの場合)、混合音量情報を変更しないでそのまま終了する。
(Mixed volume change: Setting of the other party's output level)
FIG. 22 is a diagram for explaining an operation example when the sound output level setting of the
図23は、実施例3の情報処理端末301bの構成例を示すブロック図で、情報処理端末301bは、通信部410、会話音声入力部411、音声出力部412、会話音声送信部413、混合音量変更入力部414、モード変更入力部415、モード変更送信部416、混合音声受信部417、及び混合音量変更送信部418によって構成される。
FIG. 23 is a block diagram illustrating a configuration example of the
図23において、混合音声受信部417、混合音量変更送信部418以外の各部(すなわち、通信部410、会話音声入力部411、音声出力部412、会話音声送信部413、混合音量変更入力部414、モード変更入力部415、モード変更送信部416)は、図6に示した実施例2の各部と同じ機能となるため、ここでの説明は省略する。
In FIG. 23, each unit other than the mixed
混合音声受信部417は、通信部410を介してネットワーク302から混合音声を受信する手段である。混合音量変更送信部418は、混合音量変更入力部414から伝えられた混合音量変更信号を、通信部410を介してネットワーク302へ送信する手段である。
The mixed
(音声通話)
図24は、実施例3の情報処理端末301bの音声通話処理の一例を説明するためのフロー図である。尚、本例は、図23に示した構成に基づいて説明する。また、実際には送信プロセスと受信プロセスは同時に行なわれているが、説明のためそれぞれのプロセスを分けて示している。
(Voice call)
FIG. 24 is a flowchart for explaining an example of the voice call process of the
図24(A)に示す送信プロセスにおいて、まず、情報処理端末301bは、Bさんの会話音声を会話音声入力部411により取り込み(ステップS81)、取り込んだ会話音声を通信部410を介してネットワーク302へ送信する(ステップS82)。一方、図24(B)に示す受信プロセスにおいて、情報処理端末301bは、通信部410を介してネットワーク302から混合音声を受信し(ステップS83)、受信した混合音声を音声出力部412から出音する(ステップS84)。なお、ステップS81〜S82の送信プロセスと、ステップS83〜S84の受信プロセスは同時に実行されているものとする。
In the transmission process shown in FIG. 24A, first, the
(混合音量変更)
図25は、実施例3の情報処理端末301bで出音される音声の混合音量変更処理の一例を説明するためのフロー図である。尚、本例は、図23に示した構成に基づいて説明する。まず、情報処理端末301bは、Bさんが混合音量を変更するために行なった操作により入力された信号を、混合音量変更入力部414を通して混合音量変更信号に変更する(ステップS91)。続いて、混合音量変更送信部418は、取得された混合音量変更信号を通信部410を介してネットワーク302へ送信し、情報処理端末301aへ伝える(ステップS92)。そして、実際の混合音量変更処理は、図22に示したフローに従って情報処理端末301aで実行される。
(Mixed volume change)
FIG. 25 is a flowchart for explaining an example of the mixed sound volume changing process for the sound output from the
なお、情報処理端末301bにおける会話優先送信プロセスは、図8に示した実施例1の場合と同様であるため説明を省略する。
The conversation priority transmission process in the
また、会話優先受信プロセスについて、情報処理端末301bで行なう処理はない。実施例3の情報処理システムでは、情報処理端末301bにおける会話優先受信、混合音量変更のプロセスが、情報処理端末301a上で行なわれる。したがって、結果を情報処理端末301b側で表示するためには新たな制御情報の通知が必要である。このための制御情報通知の機能を情報処理端末に備えるようにしてもよい。
Further, there is no processing performed by the
(プログラム実装)
なお、本発明の情報処理端末は、プログラムとしても実現可能である。このプログラムはコンピュータで読み取り可能な記録媒体に格納されており、各処理は上記プログラムによって実現される。記録媒体の例としては、磁気テープやカセットテープなどのテープ系、フロッピー(登録商標)ディスクやハードディスク等の磁気ディスク系、CD−ROM/MO/MD/DVDなどの光ディスクなどからなるディスク系、ICカードや光カード等のカード系、マスクROM、FPROM、EEPROM、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する媒体などいずれであってもよい。
(Program implementation)
Note that the information processing terminal of the present invention can also be realized as a program. This program is stored in a computer-readable recording medium, and each process is realized by the program. Examples of recording media include tape systems such as magnetic tapes and cassette tapes, magnetic disk systems such as floppy (registered trademark) disks and hard disks, disk systems such as optical disks such as CD-ROM / MO / MD / DVD, and ICs. Any of a card system such as a card or an optical card, a medium carrying a fixed program including a semiconductor memory such as a mask ROM, FPROM, EEPROM, flash ROM or the like may be used.
(筐体レイアウトの例)
図26は、本発明に係る情報処理端末の各ブロック間の接続構成の一例を説明するための接続構成図である。図26に示す情報処理端末101aは、テレビ受像機1011、テレビ電話用のカメラ及びマイク内蔵型のセットトップユニット1012、利用者が操作するリモコンユニット1013、有線又は無線回線を用いたネットワーク102を介して、他の情報処理装置101bとの間で映像、音声の送受信を行なうアダプタユニット1010とを少なくとも備えている。
(Example of housing layout)
FIG. 26 is a connection configuration diagram for explaining an example of a connection configuration between blocks of the information processing terminal according to the present invention. The
セットトップユニット1012は、有線又は無線によりアダプタユニット1010と接続され、ネットワーク102を介して受信すべき情報の選択指示をしたり、内蔵のカメラで撮影した画像データの送信を指示したりする。また、アダプタユニット1010は、有線又は無線により、ネットワーク102と接続されると共に、テレビ受像機1011と接続されていて、ネットワーク102を介して受信した映像、音声などの情報をテレビ受像機1011に伝えると共に、セットトップユニット1012の内蔵カメラが撮影した画像データをネットワーク102を介して指定された他の情報処理装置に送信する。また、リモコンユニット1013は、赤外線又は無線信号により、利用者からの指示を、セットトップユニット1012に、又は、セットトップユニット1012を介してアダプタユニット1010に伝える。テレビ受像機1011は、アダプタユニット1010やセットトップユニット1012からの映像や音声、あるいは、テキスト情報を表示出力する。
The set-
また、図27は、本発明に係る情報処理装置の各ブロック間の接続構成の他の例を説明するための接続構成図であり、図27に示す情報処理装置101aの変形例を示している。即ち、図27に示す情報処理装置101a′は、図26に示した構成とは異なり、情報処理装置101aのアダプタユニット1010を通信部1010′とし、この通信部1010′がテレビ受像機1011′に内蔵されて一体化された一体型情報処理装置の場合を示している。なお、図示していないが、テレビ受像機1011′が更にセットトップユニット1012′と一体となっている構成であっても良い。また、通信部1010′には、外部機器から映像や音声を入力するために、外部入力端子がついている。図27に示す例では、外部入力端子としてRCAピンジャック3個(映像1、音声2)が設けられているが、RCAピン以外の入力形式であっても構わない。
27 is a connection configuration diagram for explaining another example of the connection configuration between blocks of the information processing apparatus according to the present invention, and shows a modification of the
(リモコンレイアウトの例)
図28は、リモコンユニット1013のレイアウトの一例を説明するため図である。本例に示すリモコンユニット1013は、電源ボタン1014、様々な設定項目を表示するメニューボタン1015、会話優先出音モードと通常モードを切り替えるモードボタン1016、メニューボタン1015で表示された項目を選択して決定する上下、決定ボタン1017、第1の音量調整ボタン1018、第2の音量調整ボタン1019とを少なくとも備えている。メニューボタン1015で表示される設定項目の中には、出音レベル設定を音量比率で調整するか音量レベルで調整するかの項目、会話優先出音モードを禁止するかの項目などが含まれる。
(Example of remote control layout)
FIG. 28 is a diagram for explaining an example of the layout of the
音量比率で調整する際には、第1の音量調整ボタン1018で全体の音量レベルを調整し、第2の音量調整ボタン1019で会話音声とコンテンツ音声の音量比率を調整する。一方、音量レベルで調整する際には、第1の音量調整ボタン1018で会話音声の音量レベルを調整し、第2の音量調整ボタン1019でコンテンツ音声の音量レベルを調整する。 When the volume ratio is adjusted, the overall volume level is adjusted with the first volume adjustment button 1018, and the volume ratio between the conversational sound and the content sound is adjusted with the second volume adjustment button 1019. On the other hand, when the volume level is adjusted, the volume level of the conversational sound is adjusted with the first volume adjustment button 1018, and the volume level of the content sound is adjusted with the second volume adjustment button 1019.
(音量調整時の画面表示の例)
図29は、音量調整の際の画面表示例を示す図である。なお、前述した図7とは別の例である。本例における表示画面は、会話音声アイコン1020、コンテンツ音声アイコン1021、会話音声レベルバー1022、コンテンツ音声レベルバー1023から構成される。会話音声アイコン1020は、会話音声レベルバー1022が会話音声の音量レベルを表していることをわかりやすくするための表示であり、コンテンツ音声アイコン1021は、コンテンツ音声レベルバー1023がコンテンツ音声の音量レベルを表していることをわかりやすくするための表示である。
(Example of screen display during volume adjustment)
FIG. 29 is a diagram illustrating a screen display example at the time of volume adjustment. It is an example different from FIG. 7 described above. The display screen in this example includes a
また、会話音声レベルバー1022は、上下に伸びるバーの形をした表示で会話音声の音量レベルを表しており、上に伸びるほど音量レベルが大きいことを表している。コンテンツ音声レベルバー1023は、上下に伸びるバーの形をした表示でコンテンツ音声の音量レベルを表しており、上に伸びるほど音量レベルが大きいことを表している。また、通常モードの場合は、会話音声レベルバー1022とコンテンツ音声レベルバー1023を緑色で表示し、一方、会話優先出音モードの場合は、会話音声レベルバー1022とコンテンツ音声レベルバー1023を赤色で表示するなどして、会話優先出音モードの場合は変更できないことを強調してもよい。
The conversational
11a,11b,21a,21b,31a…Aの会話音声、12a,12b,22a,22b,32a,32b…Bの会話音声、13a,13b,23a,23b,33a…コンテンツ音声、14a,14b,24a,24b,31b,34a…混合音声、101a,101b,201a,201b,301a,301b,501a,501b…情報処理端末(通話装置)、102,102′,202,302,502…ネットワーク、103,103′,503…コンテンツサーバ、110,210,310,410…通信部、111,211,311,411…会話音声入力部、112,212,312,412…音声出力部、113,213,413…会話音声送信部、114,214,313…会話音声受信部、115…コンテンツ音声受信部、116,215,314a,314b…出音音声混合部、117,216,315,414…混合音量変更入力部、118,217,316,415…モード変更入力部、119,218,416…モード変更送信部、120,219,317…モード変更受信部、121,222,321a,321b…出音制御部、121a…混合音量制御部、121b…混合音量情報保持部、121c…モード情報保持部、121d…元設定混合音量情報保持部、121e…会話優先混合音量情報保持部、122…混合音量情報、123…混合音量変更信号、124…モード変更信号、203,303…コンテンツ保持部、220,318…コンテンツ音声抽出部、221…コンテンツ音声送信部、319…混合音声送信部、320…混合音量変更受信部、417…混合音声受信部、418…混合音量変更送信部、1010…アダプタユニット、1011,1011′…テレビ受像機、1012,1012′…セットトップユニット、1013,1013′…リモコンユニット、1010′…通信部、1014…電源ボタン、1015…メニューボタン、1016…モードボタン、1017…上下、決定ボタン、1018…第1の音量調整ボタン、1019…第2の音量調整ボタン、1020…会話音声アイコン、1021…コンテンツ音声アイコン、1022…会話音声レベルバー、1023…コンテンツ音声レベルバー。
11a, 11b, 21a, 21b, 31a ... A conversation voice, 12a, 12b, 22a, 22b, 32a, 32b ... B conversation voice, 13a, 13b, 23a, 23b, 33a ... content voice, 14a, 14b, 24a , 24b, 31b, 34a ... mixed voice, 101a, 101b, 201a, 201b, 301a, 301b, 501a, 501b ... information processing terminal (calling device), 102, 102 ', 202, 302, 502 ... network, 103, 103 ', 503 ... Content server, 110, 210, 310, 410 ... Communication unit, 111, 211, 311, 411 ... Conversation voice input unit, 112, 212, 312, 412 ... Voice output unit, 113, 213, 413 ... Conversation Voice transmitting unit, 114, 214, 313 ... conversation voice receiving unit, 115 ... content
Claims (17)
前記通話装置は、前記他の通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置に送信する手段を備え、
前記通話装置の会話音量レベルが一定量を上回ったときに、前記通話装置から前記他の通話装置に出音レベル設定変更指示情報を送信することを特徴とする通話装置。 A call device capable of making a call including conversation voice with another call device and simultaneously viewing content including the voice,
The call device includes means for transmitting sound level setting change instruction information to the other call device for setting the sound output by giving priority to either conversation voice or content sound in the other call device ,
Wherein when the speech loudness level of the call device exceeds a predetermined amount, the communication device characterized that you send the sound output level setting change instruction information to the other communication device from the communication device.
前記通話装置は、前記他の通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置に送信する手段を備え、
前記他の通話装置の出音設定は、エコーキャンセラの設定を変更することを特徴とする通話装置。 A call device capable of making a call including conversation voice with another call device and simultaneously viewing content including the voice,
The call device includes means for transmitting sound level setting change instruction information to the other call device for setting the sound output by giving priority to either conversation voice or content sound in the other call device,
The call device is characterized in that the sound output setting of the other call device changes the setting of the echo canceller.
前記通話装置は、前記他の通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置に送信する手段を備え、
前記他の通話装置の出音設定は、会話音声の音量を上げて、コンテンツ音声の音量を下げることを特徴とする通話装置。 A call device capable of making a call including conversation voice with another call device and simultaneously viewing content including the voice,
The call device includes means for transmitting sound level setting change instruction information to the other call device for setting the sound output by giving priority to either conversation voice or content sound in the other call device,
The sound output setting of the other call device is characterized in that the volume of the conversation voice is increased and the volume of the content sound is decreased.
前記通話装置は、前記他の通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置に送信する手段を備え、
前記他の通話装置の出音設定は、異なるスピーカで出音させることを特徴とする通話装置。 A call device capable of making a call including conversation voice with another call device and simultaneously viewing content including the voice,
The call device includes means for transmitting sound level setting change instruction information to the other call device for setting the sound output by giving priority to either conversation voice or content sound in the other call device,
The communication device is characterized in that the sound output setting of the other communication device is a sound output from a different speaker.
前記通話装置は、前記他の通話装置の出音設定を変更した後に、所定時間、前記他の通話装置の操作による出音設定の変更を禁止もしくは制限することを特徴とする通話装置。 The communication device according to any one of claims 1 to 4 ,
The call device is characterized in that after changing the sound output setting of the other call device, the change of the sound output setting by operating the other call device is prohibited or restricted for a predetermined time.
前記通話装置は、前記他の通話装置の出音設定を変更した場合に、これに連動して前記通話装置の出音設定を変更することを特徴とする通話装置。 The communication device according to any one of claims 1 to 5 ,
When the sound output setting of the other call device is changed, the call device changes the sound output setting of the call device in conjunction with the change.
前記通話装置は、該通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置から受信する手段を備え、該受信した出音レベル設定変更指示情報に従って、前記通話装置の出音設定として、エコーキャンセラの設定を変更することを特徴とする通話装置。 A call device capable of making a call including conversation voice with another call device and simultaneously viewing content including the voice,
The call device includes means for receiving, from the other call device, sound output level setting change instruction information for setting sound output with priority given to either conversation voice or content sound at the call device. According to the sound output level setting change instruction information , the call canceling device changes the setting of the echo canceller as the sound output setting of the communication device.
前記通話装置は、該通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置から受信する手段を備え、該受信した出音レベル設定変更指示情報に従って、前記通話装置の出音設定として、会話音声の音量を上げて、コンテンツ音声の音量を下げることを特徴とする通話装置。 A call device capable of making a call including conversation voice with another call device and simultaneously viewing content including the voice,
The call device includes means for receiving, from the other call device, sound output level setting change instruction information for setting sound output with priority given to either conversation voice or content sound at the call device. According to the sound output level setting change instruction information, the call device is characterized in that, as the sound output setting of the call device, the volume of the conversation sound is increased and the volume of the content sound is decreased.
前記通話装置は、該通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音設定するための出音レベル設定変更指示情報を前記他の通話装置から受信する手段を備え、該受信した出音レベル設定変更指示情報に従って、前記通話装置の出音設定として、異なるスピーカで出音することを特徴とする通話装置。 A call device capable of making a call including conversation voice with another call device and simultaneously viewing content including the voice,
The call device includes means for receiving, from the other call device, sound output level setting change instruction information for setting sound output with priority given to either conversation voice or content sound at the call device. According to the sound output level setting change instruction information, a sound is output from a different speaker as the sound output setting of the communication device.
前記通話装置は、該通話装置の出音設定を変更した後に、所定時間、前記通話装置の操作による出音設定の変更を禁止もしくは制限することを特徴とする通話装置。 The communication device according to any one of claims 7 to 9 ,
The call device is characterized in that after changing the sound output setting of the call device, the change of the sound output setting by operating the call device is prohibited or restricted for a predetermined time.
前記通話装置は、前記他の通話装置から出音レベル設定変更指示情報を受信した場合に、該出音レベル設定変更指示情報による出音設定の指示を無効化し、前記通話装置の出音設定を変更しないことを特徴とする通話装置。 The communication device according to any one of claims 7 to 9 ,
When the call device receives the sound level setting change instruction information from the other call device, the call device invalidates the sound setting instruction according to the sound level setting change instruction information, and sets the sound setting of the call device. A telephone device characterized by not changing.
前記通話装置は、前記他の通話装置から受信した混合音量比情報に従って会話音声とコンテンツ音声を混合した混合音声を前記他の通話装置に送信する手段と、
前記他の通話装置にて会話音声とコンテンツ音声のいずれかを優先して出音するように、前記他の通話装置に送信する混合音声の混合音量比を変更する手段とを備え、
前記通話装置の会話音量レベルが一定量を上回ったときに、前記他の通話装置に送信する混合音声の混合音量比を変更することを特徴とする通話装置。 A call device capable of making a call including conversation voice with another call device and simultaneously viewing content including the voice,
The communication device is configured to transmit a mixed sound obtained by mixing a conversation sound and a content sound to the other call device according to the mixed volume ratio information received from the other call device;
Means for changing the mixed sound volume ratio of the mixed sound to be transmitted to the other call device so as to give priority to either the conversation voice or the content sound at the other call device ;
When speech loudness level of the communication device exceeds a predetermined amount, the communication device characterized that you change the mixing volume ratio of the mixed sound to be transmitted to the other communication device.
前記通話装置は、前記他の通話装置に送信する混合音声の混合音量比として、会話音声の音量を上げて、コンテンツ音声の音量を下げることを特徴とする通話装置。 The communication device according to claim 12 ,
The call device is characterized in that, as the mixed sound volume ratio of the mixed sound transmitted to the other call device, the volume of the conversation sound is increased and the volume of the content sound is decreased.
前記通話装置は、前記他の通話装置に送信する混合音声の混合音量比を変更した後に、所定時間、前記他の通話装置の操作による混合音量比の変更を禁止もしくは制限することを特徴とする通話装置。 The communication device according to claim 12 or 13 ,
The call device prohibits or restricts the change of the mixed sound volume ratio by the operation of the other call device for a predetermined time after changing the mixed sound volume ratio of the mixed sound transmitted to the other call device. Telephone device.
前記通話装置は、前記他の通話装置に送信する混合音声の混合音量比を変更した場合に、これに連動して前記通話装置にて会話音声とコンテンツ音声のいずれかを優先するよう出音設定を変更することを特徴とする通話装置。 The communication device according to any one of claims 12 to 14 ,
If the mixed volume ratio of the mixed voice to be transmitted to the other call device is changed, the call device sets the sound output to give priority to either the conversation voice or the content sound in the call device in conjunction with this change. A call device characterized by changing the voice.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005113628A JP4425172B2 (en) | 2005-04-11 | 2005-04-11 | Call device, call system, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005113628A JP4425172B2 (en) | 2005-04-11 | 2005-04-11 | Call device, call system, and program |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2006295552A JP2006295552A (en) | 2006-10-26 |
JP2006295552A5 JP2006295552A5 (en) | 2008-05-29 |
JP4425172B2 true JP4425172B2 (en) | 2010-03-03 |
Family
ID=37415641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005113628A Expired - Fee Related JP4425172B2 (en) | 2005-04-11 | 2005-04-11 | Call device, call system, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4425172B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8497866B2 (en) | 2007-09-11 | 2013-07-30 | Qualcomm Incorporated | Wireless graphics card |
JP2012075039A (en) | 2010-09-29 | 2012-04-12 | Sony Corp | Control apparatus and control method |
JP5803132B2 (en) * | 2011-02-18 | 2015-11-04 | 日本電気株式会社 | Voice switching device, program and method |
WO2013038440A1 (en) * | 2011-09-13 | 2013-03-21 | 三菱電機株式会社 | Navigation apparatus |
JP6029626B2 (en) * | 2014-08-13 | 2016-11-24 | サターン ライセンシング エルエルシーSaturn Licensing LLC | Control device and control method |
-
2005
- 2005-04-11 JP JP2005113628A patent/JP4425172B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006295552A (en) | 2006-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11129218B2 (en) | Bluetooth communication method and terminal | |
KR101593257B1 (en) | Communication system and method | |
US20160337501A1 (en) | Duplex audio for mobile communication device and accessory | |
WO2008101407A1 (en) | Audio data flow input/output method and system | |
JP2004056408A (en) | Cellular phone | |
KR20090007694A (en) | Audio headset | |
CN108924361B (en) | Audio playing and acquisition control method, system and computer readable storage medium | |
JP4425172B2 (en) | Call device, call system, and program | |
JP4992591B2 (en) | Communication system and communication terminal | |
WO2001080542A1 (en) | Method of calling called party, communication equipment, calling party information server and calling control device | |
JP2008167373A (en) | Information presentation apparatus | |
CN110662206B (en) | Bluetooth-based high-definition music and voice transmission operation method | |
JP4463098B2 (en) | Audio processing device | |
CN111580781A (en) | Mobile terminal audio output method and mobile terminal | |
JP4562649B2 (en) | Audiovisual conference system | |
US20230239406A1 (en) | Communication system | |
JP2007049358A (en) | Portable terminal and program | |
JP4369400B2 (en) | Mobile communication terminal | |
JP2022016997A (en) | Information processing method, information processing device, and information processing program | |
JP5023396B2 (en) | Content reproduction system, content wireless relay system, and content reproduction method | |
JP5803132B2 (en) | Voice switching device, program and method | |
KR101206956B1 (en) | Methods for sending/receiving digital multimedia broadcasting data among mobile terminals using push-to-talk service | |
KR101436443B1 (en) | Method of providing auto-switching amplified audio signal output based on ear-microphone set, and computer-readable recording medium for the same | |
US20160269532A1 (en) | Telephone apparatus, telephone system, and control method | |
WO2023079682A1 (en) | Display device, display device coordination system, and audio reproduction method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060919 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080410 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080410 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080411 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090703 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090707 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091208 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091208 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121218 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |