JP2009258529A - Telephone call device and telephone call method - Google Patents

Telephone call device and telephone call method Download PDF

Info

Publication number
JP2009258529A
JP2009258529A JP2008109809A JP2008109809A JP2009258529A JP 2009258529 A JP2009258529 A JP 2009258529A JP 2008109809 A JP2008109809 A JP 2008109809A JP 2008109809 A JP2008109809 A JP 2008109809A JP 2009258529 A JP2009258529 A JP 2009258529A
Authority
JP
Japan
Prior art keywords
delay time
speech speed
speed conversion
speech
transmission mute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008109809A
Other languages
Japanese (ja)
Inventor
Ryota Fujii
亮太 藤井
Tadamichi Tokuda
肇道 徳田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2008109809A priority Critical patent/JP2009258529A/en
Publication of JP2009258529A publication Critical patent/JP2009258529A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To obtain a telephone call device and a telephone call method, in which speech speed conversion effect is fully obtained, when a user performs transmission muting. <P>SOLUTION: The telephone call device includes: a speech speed conversion section 104 in which slow reproduction is performed by making a speech speed slow in speech received from a partner terminal under call; and a call muting determination section 103 which determines whether user's call speech is muted on the partner terminal. When the call muting is performed, a limit of delay time in speech speed conversion is made larger than that when muting is not performed. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、会議電話など、複数の拠点を接続して音声通話を行う通話装置および通話方法に関するものである。   The present invention relates to a call device and a call method for making a voice call by connecting a plurality of bases such as a conference phone.

音声の音程を変えずにそのスピードを遅く又は速く変換する話速変換の技術は従来から知られており、IC(Integrated Circuit)レコーダなどの音声再生装置を始め、電話機やテレビ、ラジオなどに広く利用されている。話速変換処理の内容は、例えば(特許文献1)に示されている。   The technology of speech speed conversion that changes the speed of the voice without changing the pitch of the voice is known from the past, and is widely used for voice reproduction devices such as IC (Integrated Circuit) recorders, telephones, televisions, radios, and the like. It's being used. The content of the speech speed conversion process is shown in (Patent Document 1), for example.

音声をゆっくりとした話速に変換する場合の一般的な処理構成について説明する。図10は、従来の話速変換装置の構成図である。図10において、201は音声信号のピッチ(基本周波数)を検出する音声ピッチ検出部、202は音声ピッチの周期単位で音声波形を切り出す挿入波形生成部、203は切り出されたピッチ波形を入力音声信号に定期的に挿入することにより時間軸方向に波形を伸張させる波形接続部である。基本周波数とその倍音で構成される音声の有声信号の波形は、ピッチ単位で周期的に同じ波形が繰り返される傾向があるので、この構成によって音程を変えずにゆっくりとした話速へ変換することが可能である。   A general processing configuration for converting speech into a slow speech speed will be described. FIG. 10 is a block diagram of a conventional speech speed conversion device. In FIG. 10, 201 is an audio pitch detection unit that detects the pitch (fundamental frequency) of an audio signal, 202 is an insertion waveform generation unit that extracts an audio waveform in units of the audio pitch period, and 203 is an input audio signal that represents the extracted pitch waveform It is a waveform connection part that expands the waveform in the direction of the time axis by inserting it periodically. The voiced signal waveform composed of the fundamental frequency and its overtones tends to repeat the same waveform periodically in pitch units, so this configuration should be converted to a slower speech speed without changing the pitch. Is possible.

話速変換処理を通話装置のようにリアルタイム性が求められるような音声送受信を行う装置に適用する場合を考える。例えば、仮に受話音声の話速を一律に遅く変換して再生し続けると、受話音声が実際に発生された時間と話速変換後の再生時間との遅延時間(以降、単に遅延時間と呼ぶ)が時間の経過と共に増大し、会話に著しい不具合を生じてしまう。そこで、このような装置に適用する場合には、従来から特別な工夫がなされている。その概念を、図11を参照しながら説明する。実時間の話速変換処理では、有音区間(受話信号に音声信号が存在する区間)は話速を遅くする変換を行い、無音区間(受話信号に音声信号が存在しない区間)は圧縮することによって、実際の発話時間からの遅延を少なくしている。   Consider a case where speech speed conversion processing is applied to a device that performs voice transmission / reception such as a communication device that requires real-time performance. For example, if the speech speed of the received voice is uniformly reduced and continuously reproduced, the delay time between the time when the received voice is actually generated and the playback time after the speech speed conversion (hereinafter simply referred to as the delay time). Will increase over time, causing serious problems in conversation. Therefore, when applied to such a device, special devices have been conventionally made. The concept will be described with reference to FIG. In real-time speech speed conversion processing, conversion is performed to slow down the speech interval (interval where the speech signal is present in the received signal), and compression is performed during the silent interval (interval where the speech signal is not present in the received signal). Therefore, the delay from the actual speech time is reduced.

前記方法を用いて遅延時間を抑えても、受話信号に有音区間が続けばその分だけ遅延時間は増えていく。リアルタイム性が求められる通話装置では、この遅延時間に限度を設けて必要以上に遅延が生じるのを防ぐ。例えばここでは限度時間を1秒とする。1秒まで遅延時間が溜まればそれ以降は話速変換を行わずに本来の速度のまま再生する(図12参照)。この間も溜まった分の遅延時間は残っており、無音区間の入力などで遅延が解消されたらまた遅延が1秒に達するまで話速変換を行う。こうして話速変換を行いつつ最低限のリアルタイム性を保つ。   Even if the delay time is suppressed by using the above-described method, the delay time increases correspondingly if the voice signal continues with a voiced period. In a telephone device that requires real-time performance, a limit is set on this delay time to prevent an unnecessary delay. For example, here, the limit time is 1 second. If the delay time is accumulated up to 1 second, after that, playback is performed at the original speed without performing the speech speed conversion (see FIG. 12). During this time, the accumulated delay time remains, and when the delay is eliminated by input of a silent interval, the speech speed is converted until the delay reaches 1 second again. In this way, the minimum real-time property is maintained while performing the speech speed conversion.

さらに、(特許文献2)や(特許文献3)のように、現在溜まっている遅延時間と最大遅延時間又は遅延音声を記憶するメモリの最大容量から話速変換率を算出して、最大遅延時間を越えないよう話速変換率を調整する技術もある。   Further, as in (Patent Document 2) and (Patent Document 3), the speech rate conversion rate is calculated from the currently accumulated delay time and the maximum delay time or the maximum capacity of the memory for storing the delayed speech, and the maximum delay time is calculated. There is also a technology to adjust the speech rate conversion rate so as not to exceed.

また、使用者が通話装置を用いて通話をする上では、使用者と通話相手の双方が交互に話す場合が主だが、相手側が一方的に話し使用者はそれを聞き続けるような場面もよく見受けられる。特に遠隔会議の場合、発表や説明の最中などでは発話者以外は送話をミュートして静かに話を聞き続ける。ここで話速変換を用いれば相手の声がゆっくり再生され、容易に聞き取る事ができる。   In addition, when a user makes a call using a communication device, both the user and the other party talk alternately, but there are many situations where the other party speaks unilaterally and the user continues to hear it. It can be seen. Especially in the case of a teleconference, during the presentation or explanation, the non-speaker mutes the transmission and keeps listening quietly. If speech speed conversion is used here, the other party's voice is played back slowly and can be easily heard.

双方が交互に話す場合、図13のように相手が発話してから次の相手の発話まで無音の区間が十分に存在する。そのため話速変換による遅延は発言の度に解消する。
特開平5−257490号公報 特開2001−53835号公報 特開2007−072045号公報
When both parties speak alternately, there is a sufficient silent section from the other party's utterance to the next partner's utterance as shown in FIG. Therefore, the delay due to the speech speed conversion is eliminated each time a speech is made.
JP-A-5-257490 JP 2001-53835 A JP 2007-072045 A

しかしながら、ミュート時は通話相手側が一方的に話すため無音区間が少なく、遅延時間がすぐに限度まで達してしまう。前記話速変換率を調整することで遅延時間がすぐに限度まで達することは防ぐことができるが、結果としてゆっくり再生できなくなる事は変わらない。特に送話ミュート中では、使用者は相手からの話を聞くことに専念するため、話速変換の効果が十分に得られないことが使用者にとって顕著に見られ不快感を生じる。   However, during mute, the other party speaks unilaterally, so there are few silent sections and the delay time reaches the limit immediately. By adjusting the speech rate conversion rate, it is possible to prevent the delay time from reaching the limit immediately, but as a result, it is not possible to reproduce slowly. In particular, during the transmission mute, the user is devoted to listening to the talk from the other party, so that the effect of the speech speed conversion cannot be sufficiently obtained, which is noticeable to the user and causes discomfort.

またミュート時は、双方向通話の時ほどリアルタイム性は求められない。双方向通話の時、図13のように使用者Aはゆっくり再生された相手の音声を聞き終わってから返答をするため、通話相手Bにとって話速変換の遅延時間だけ使用者Aからの返答が無い時間が大きくなり、円滑な通話が困難になる。これに対し図14のように使用者Aが送話ミュートを行う時は、通話相手Bは使用者Aからの返事を待つ必要が無いため、発言する際に遅延時間を気にする必要が無い。   Also, when muted, real-time performance is not required as in two-way calls. In the case of a two-way call, user A responds after listening to the other party's voice that has been played back slowly as shown in FIG. There will be a lot of time, making it difficult to talk smoothly. On the other hand, when the user A performs the transmission mute as shown in FIG. 14, the calling party B does not have to wait for a reply from the user A, so there is no need to worry about the delay time when speaking. .

本発明は、上記に鑑みてなされたものであって、使用者が送話ミュートを行っている時に対して話速変換の効果が十分に得られるような通話装置および通話方法を提供することを目的とする。   The present invention has been made in view of the above, and provides a call device and a call method that can sufficiently obtain a speech speed conversion effect when a user is performing mute transmission. Objective.

上記課題を解決するために本発明は、通話中の相手端末から受信した受話音声の話速を遅くして再生する話速変換を行う話速変換手段と、前記話速変換手段によって前記話速変換が行われる際に、使用者の送話音声を前記相手端末に送らない送話ミュートを行うか否かを判断する送話ミュート判断手段と、前記送話ミュート手段によって前記送話ミュートを行うと判断される場合に前記話速変換における遅延時間の限度を、前記送話ミュート判断手段によって前記送話ミュートを行わないと判断される場合よりも大きく設定する遅延時間設定手段と、を備えたものである。   In order to solve the above problems, the present invention provides speech speed conversion means for performing speech speed conversion for slowing down and reproducing the received speech received from a partner terminal during a call, and said speech speed conversion means by the speech speed conversion means. When conversion is performed, transmission mute determination means for determining whether or not to perform transmission mute without transmitting the user's transmitted voice to the counterpart terminal, and the transmission mute is performed by the transmission mute means. Delay time setting means for setting a delay time limit in the speech speed conversion when determined to be larger than when the transmission mute determination means determines not to perform the transmission mute. Is.

使用者が通話中に送話音声のミュートを行って双方向通話を意図しない間は、遅延時間の限度を大きくして話速変換の効率を上げる事を優先し、利用者が双方向通話を行う時は遅延時間の限度を元に戻してリアルタイム性を優先するという、使用目的に応じた話速変換を行う。   While the user does not intend to make a two-way call by muting the transmitted voice during a call, priority is given to increasing the delay time limit to increase the efficiency of speech speed conversion, and the user can make a two-way call. When performing, speech speed conversion is performed according to the purpose of use, in which the limit of delay time is restored and priority is given to real-time performance.

本発明によれば、受聴者と相手端末とで通話している時は、話速変換における遅延時間の限度はリアルタイム性を保つ範囲に設定され、送話音声がミュートされていると判断した時は、遅延時間の限度が前述の時間よりも長くなるよう設定が変更される。このため、ゆっくり再生しても双方向通話時は一定の遅延時間限度が保たれるので通話にストレスを感じず、また送話ミュート時は通話相手が一方的に話しても遅延時間の限度が大きくなったために意図した話速変換率を長い間維持することができる。   According to the present invention, when talking between the listener and the other party terminal, the limit of the delay time in the speech speed conversion is set to a range that maintains real-time characteristics, and when it is determined that the transmitted voice is muted. The setting is changed so that the limit of the delay time becomes longer than the above-described time. For this reason, even if it is played slowly, a certain delay time limit is maintained during two-way calls, so there is no stress on the call, and when sending mute, there is a limit on the delay time even if the other party speaks unilaterally. It is possible to maintain the intended speech rate conversion rate for a long time because it has become large.

第1の発明は、相手端末から受信した受話音声の話速を遅くして再生する話速変換を行う話速変換手段と、話速変換手段によって話速変換が行われる際に、使用者の送話音声を相手端末に送らない送話ミュートを行うか否かを判断する送話ミュート判断手段と、送話ミュート判断手段によって送話ミュートを行うと判断される場合に話速変換における遅延時間の限度を、送話ミュート判断手段によって送話ミュートを行わないと判断される場合よりも大きく設定する遅延時間設定手段と、を備えたものであり、使用者の送話音声がミュートされている場合とミュートされていない時の2つの状況に応じて、話速変換の性能を適応させることができるという作用を有する。   According to a first aspect of the present invention, there is provided a speech speed converting means for performing a speech speed conversion for reproducing the received voice received from the partner terminal at a lower speed, and when the speech speed conversion is performed by the speech speed converting means, A speech mute determination means for determining whether or not to perform a transmission mute that does not send the transmitted voice to the partner terminal, and a delay time in the speech speed conversion when the transmission mute determination means determines that the transmission mute is to be performed. Delay time setting means for setting the limit of the transmission time to be larger than the case where the transmission mute determination means determines that the transmission mute is not performed, and the user's transmission voice is muted Depending on the situation and when not muted, the speech speed conversion performance can be adapted.

第2の発明は、第1の発明において、遅延時間設定手段は、送話ミュート手段によって送話ミュートを行わないと判断される場合に、話速変換における遅延時間の限度を略1秒と設定することを特徴とするものであり、受話音声の話速を遅く再生しても、話速変換による遅延時間は略1秒以下となり、会話にリアルタイム性を保つ事ができるという作用を有する。   In a second aspect based on the first aspect, the delay time setting means sets the limit of the delay time in speech speed conversion to about 1 second when it is determined that the transmission mute means does not perform the transmission mute. Even if the speech speed of the received voice is reproduced slowly, the delay time due to the speech speed conversion is about 1 second or less, and the real-time property can be maintained in the conversation.

第3の発明は、第1の発明において、遅延時間設定手段は、送話ミュート手段によって送話ミュートを行うと判断される場合に、話速変換における遅延時間の限度を略2秒と設定することを特徴とするものであり、使用者の送話音声がミュートされている場合は、ミュートされていない時と比較して遅延時間が大きくなっても話速変換が良好に機能するという作用を有する。   In a third aspect based on the first aspect, the delay time setting means sets the limit of the delay time in the speech speed conversion to about 2 seconds when it is determined that the transmission mute means performs the transmission mute. When the user's transmitted voice is muted, the speech speed conversion functions well even when the delay time is longer than when the muted voice is not muted. Have.

第4の発明は、第1の発明において、話速変換手段は、再生する話速変換率として第1の話速変換率と、第1の話速変換率より遅く再生する第2の話速変換率の2種類のうち、一方を選択的に設定する事を特徴とするものであり、使用状況に従って大きい話速変換率と小さい話速変換率とを使用者が使い分けることができ、また話速変換率の大小と通話中送話ミュートがされているか否かに従って、話速変換の性能を適応させることができるという作用を有する。   In a fourth aspect based on the first aspect, the speech speed conversion means reproduces the first speech speed conversion rate as the speech speed conversion rate to be reproduced and the second speech speed to be reproduced later than the first speech speed conversion rate. One of the two conversion rates is selectively set, and the user can select a large speech rate conversion rate and a small speech rate conversion rate according to the usage situation. It has an effect that the performance of the speech speed conversion can be adapted according to the speed conversion rate and whether or not the transmission mute is performed during a call.

第5の発明は、第4の発明において、遅延時間設定手段は、送話ミュート判断手段によって送話ミュートを行わないと判断される場合に、第1の話速変換率における遅延時間の限度を略1秒と設定することを特徴とするものであり、受話音声の話速を遅く再生しても、話速変換による遅延時間は略1秒以下となり、会話にリアルタイム性を保つ事ができるという作用を有する。   In a fifth aspect based on the fourth aspect, when the delay time setting means determines that the transmission mute determination means does not perform the transmission mute, the delay time setting means sets the limit of the delay time in the first speech speed conversion rate. The feature is that it is set to approximately 1 second, and even if the speech speed of the received voice is reproduced slowly, the delay time due to the speech speed conversion is approximately 1 second or less, and the real-time property can be maintained in the conversation. Has an effect.

第6の発明は、第4の発明において、遅延時間設定手段は、送話ミュート手段によって送話ミュートを行うと判断される場合に、第1の話速変換における遅延時間の限度を略3秒と設定することを特徴とするものであり、使用者の送話音声がミュートされている場合は、ミュートされていない時と比較して遅延時間が大きくなっても話速変換が良好に機能するという作用を有する。   In a sixth aspect based on the fourth aspect, when the delay time setting means determines that transmission mute is performed by the transmission mute means, the delay time limit in the first speech speed conversion is approximately 3 seconds. When the user's transmitted voice is muted, the speech speed conversion functions well even when the delay time is longer than when it is not muted. It has the action.

第7の発明は、第4の発明において、遅延時間設定手段は、送話ミュート判断手段によって送話ミュートを行わないと判断される場合に、第2の話速変換率における遅延時間の限度を略2秒と設定することを特徴とするものであり、受話音声の話速を話速変換率Bで再生しても、話速変換による遅延時間は略2秒以下となり、遅延時間の限度が1秒の時と比較して話速変換の効果を持続することができ、また会話にある程度のリアルタイム性を保つ事ができるという作用を有する。   According to a seventh aspect, in the fourth aspect, when the delay time setting means determines that the transmission mute determination means does not perform the transmission mute, the delay time setting means sets the limit of the delay time in the second speech speed conversion rate. Even if the speech speed of the received voice is reproduced with the speech speed conversion rate B, the delay time due to the speech speed conversion is approximately 2 seconds or less, and the limit of the delay time is limited. Compared to the time of 1 second, the effect of speaking speed conversion can be maintained, and a certain degree of real time can be maintained in the conversation.

第8の発明は、第4の発明において、遅延時間設定手段は、送話ミュート手段によって送話ミュートを行うと判断される場合に、第2の話速変換における遅延時間の限度を略3秒と設定することを特徴とするものであり、使用者の送話音声がミュートされている場合は、ミュートされていない時と比較して遅延時間が大きくなっても話速変換が良好に機能するという作用を有する。   In an eighth aspect based on the fourth aspect, when the delay time setting means determines that transmission mute is performed by the transmission mute means, the delay time limit in the second speech speed conversion is approximately 3 seconds. When the user's transmitted voice is muted, the speech speed conversion functions well even when the delay time is longer than when it is not muted. It has the action.

以下、本発明の実施の形態について説明する。   Hereinafter, embodiments of the present invention will be described.

(実施の形態1)
本実施の形態1では、電話会議などにおいて、使用者がスロー再生のON/OFF切り替えを行う事ができ、また送話音声のミュート指示を行う事ができ、これに対応して相手端末から受信した受話音声の話速を変換するために記憶する前記受話音声の限度量を動的に変更することで、送話音声がミュートされていない時は遅延時間を短くし、送話音声がミュートされている時は遅延時間を長くまで取ることができる通話装置および通話方法について説明する。
(Embodiment 1)
In the first embodiment, in a conference call or the like, the user can switch ON / OFF of slow playback, and can also instruct to mute the transmitted voice, and receive it from the counterpart terminal in response to this. By dynamically changing the limit amount of the received voice stored to convert the speech speed of the received voice, the delay time is shortened when the transmitted voice is not muted, and the transmitted voice is muted. A call device and a call method capable of taking a long delay time when the call is in progress will be described.

図1は、本発明の実施の形態1における通話装置の外観図であり、図2は、図1の通話装置の上面図である。これらの図1〜図2において、601は通話装置、602a〜602d(以下602)は使用者の音声を集音するマイクロホン、603は受話音声を再生するスピーカ、604は相手側回線と接続する通信ケーブル、605は送話音声のミュートのON/OFFを切り替えるためのミュートボタン、606は話速変換(スロー再生)を開始/終了するためのスローボタン、607 は発信/着信の操作を行う操作ボタン、608は通話の状態などを表示する表示部である。   FIG. 1 is an external view of a communication device according to Embodiment 1 of the present invention, and FIG. 2 is a top view of the communication device of FIG. 1 to 2, reference numeral 601 denotes a communication device, reference numerals 602 a to 602 d (hereinafter 602) denote microphones that collect user's voice, reference numeral 603 denotes a speaker that reproduces received voice, and reference numeral 604 denotes communication connected to the other line. Cable, 605 is a mute button for switching on / off muting of transmitted voice, 606 is a slow button for starting / ending speech speed conversion (slow playback), and 607 is an operation button for performing outgoing / incoming operations 608 is a display unit for displaying the state of the call.

図3は、本発明の実施の形態1における通話装置の使用時の構成の一例を示す図であり、図4は、本発明の実施の形態1における通話装置の使用時の構成の他の例を示す図である。   FIG. 3 is a diagram showing an example of a configuration when using the communication device according to Embodiment 1 of the present invention, and FIG. 4 is another example of a configuration when using the communication device according to Embodiment 1 of the present invention. FIG.

図3において、601aは話者Aが使用する通話装置、601bは話者Bが使用する通話装置、1201a,1201bはゲートウェイ、1202はインターネットである。この図3に示される構成例では、2台の通話装置601a,601bはそれぞれ、ゲートウェイ1201a,1201bを介してインターネット1202に接続されている。また、この図3の場合では、通話装置601aと通話装置601bとの間で送受信される音声の信号は、デジタル信号がパケット化されたデータである。   In FIG. 3, 601a is a communication device used by speaker A, 601b is a communication device used by speaker B, 1201a and 1201b are gateways, and 1202 is the Internet. In the configuration example shown in FIG. 3, the two communication devices 601a and 601b are connected to the Internet 1202 via gateways 1201a and 1201b, respectively. In the case of FIG. 3, the audio signal transmitted / received between the call device 601a and the call device 601b is data obtained by packetizing a digital signal.

図4において、1301a,1301bはそれぞれ通話装置601a,601bに接続される接続線、1302a,1302bはモデム、1303a,1303bは公衆回線網、1304a,1304bはそれぞれ通話装置601a,601bが所属するインターネットサービスプロバイダ(図中、ISPと表記)である。   In FIG. 4, reference numerals 1301a and 1301b denote connection lines connected to the communication devices 601a and 601b, respectively; 1302a and 1302b denote modems; 1303a and 1303b denote public line networks; A provider (indicated as ISP in the figure).

尚、図3や図4の構成は一例であり、図3に示す構成と図4に示す構成とが混在している状態であってもよいし、図4のモデム1302a,1302bとが1つの同じ公衆回線のみを介して接続される構成を有していてもよい。また、ここでは2台を用いて通話を行っているが、3台、4台用いて多地点で通話を行ってもよい。   3 and 4 are examples, and the configuration shown in FIG. 3 and the configuration shown in FIG. 4 may be mixed, or the modems 1302a and 1302b in FIG. You may have the structure connected only through the same public line. In addition, here, two units are used for a call, but three units and four units may be used for a multipoint call.

図5は、本発明の実施の形態1による通話装置の部品構成を模式的に示すブロック図である。この図5において、701は各種演算と周辺装置の制御を行うデジタルシグナルプロセッサ(Digital Signal Processor、以下、DSPという)、702は通信路インターフェース、101はユーザーインターフェース、703はメモリ、705はデジタル/アナログ(以下、D/Aという)コンバータ、704はアナログ/デジタル(以下、A/Dという)コンバータ、603はスピーカ、602はマイクロホン、7011は受話信号入力部、7012は音声信号出力部、7013は送話信号出力部、7014は送話信号入力部、7015は通信路、7016は受話信号路、7017は送話信号路である。   FIG. 5 is a block diagram schematically showing a component configuration of the communication device according to Embodiment 1 of the present invention. In FIG. 5, 701 is a digital signal processor (Digital Signal Processor, hereinafter referred to as DSP) that performs various operations and control of peripheral devices, 702 is a communication path interface, 101 is a user interface, 703 is a memory, 705 is digital / analog. (Hereinafter referred to as D / A) converter, 704 is an analog / digital (hereinafter referred to as A / D) converter, 603 is a speaker, 602 is a microphone, 7011 is a reception signal input unit, 7012 is an audio signal output unit, and 7013 is a transmission unit. A speech signal output unit, 7014 is a transmission signal input unit, 7015 is a communication path, 7016 is a reception signal path, and 7017 is a transmission signal path.

この図5における通話装置での動作の概要について説明する。通話装置601の通信路インターフェース702は通信路7015の一端に接続されており、その通信路7015の他端に接続された図示しない別の通話装置と通話信号(音声信号)の送受信を行う。上記他端に接続された別の通話装置より送信された音声信号は、通信路7015から通信路インターフェース702および受話信号路7016を介して、受話信号入力部7011よりDSP701へ入力される。   An outline of the operation of the call device in FIG. 5 will be described. The communication path interface 702 of the call device 601 is connected to one end of the communication path 7015, and transmits and receives a call signal (voice signal) with another call device (not shown) connected to the other end of the communication path 7015. A voice signal transmitted from another communication device connected to the other end is input from the reception signal input unit 7011 to the DSP 701 from the communication path 7015 via the communication path interface 702 and the reception signal path 7016.

ここで、例えば通信路7015で送受信される信号がIP(Internet Protocol)パケットのようなデジタル化された信号である場合、通信路インターフェース702内で処理される信号は例えばPCM(Pulse−Code Modulation)のようなデジタル信号を用いて全て行われ、受話信号路7016は、通常、シリアルバスやパラレルバスとなる。また、通信路7015が例えばPSTN(Public Switched Telephone Networks)のようなアナログ信号路である場合は、通信路インターフェース702かDSP701の内部にA/Dコンバータが必要となる。通信路インターフェース702にA/Dコンバータが含まれる場合、それ以降の処理は先ほどと同じくデジタル信号を用いて全て行われ、受話信号路7016は通常、シリアルバスやパラレルバスとなる。これに対して、DSP701の内部にA/Dコンバータが内蔵される場合、受話信号路7016はアナログ信号線となる。   Here, for example, when a signal transmitted / received through the communication path 7015 is a digitized signal such as an IP (Internet Protocol) packet, the signal processed in the communication path interface 702 is, for example, a PCM (Pulse-Code Modulation). The received signal path 7016 is usually a serial bus or a parallel bus. When the communication path 7015 is an analog signal path such as PSTN (Public Switched Telephone Networks), an A / D converter is required inside the communication path interface 702 or the DSP 701. When the communication path interface 702 includes an A / D converter, all subsequent processing is performed using digital signals as before, and the reception signal path 7016 is usually a serial bus or a parallel bus. On the other hand, when the A / D converter is built in the DSP 701, the reception signal path 7016 is an analog signal line.

DSP701で話速変換された受話音声は、音声信号出力部7012より出力した後、D/Aコンバータ705によりアナログ信号に変換され、スピーカ603から再生される。同様に使用者の送話音声はマイクロホン602で集音されてA/Dコンバータ704によってデジタル信号に変換されて送話信号入力部7014よりDSP701に渡され、送話信号(音声信号)として送話信号出力部7013より出て送話信号路7017を介し、通信路インターフェース702に送出され、別の通話装置へと送出される。尚、ユーザーインターフェース101とメモリ703については後述する。   The received voice whose speech speed has been converted by the DSP 701 is output from the audio signal output unit 7012, converted to an analog signal by the D / A converter 705, and reproduced from the speaker 603. Similarly, the user's transmitted voice is collected by the microphone 602, converted into a digital signal by the A / D converter 704, passed to the DSP 701 from the transmitted signal input unit 7014, and transmitted as a transmitted signal (audio signal). The signal is output from the signal output unit 7013, sent to the communication path interface 702 via the transmission signal path 7017, and sent to another communication apparatus. The user interface 101 and the memory 703 will be described later.

このように構成された実施の形態1の通話装置における受話音声の再生処理について説明する。図6は、本発明の実施の形態1における話速変換の動作状態を示す状態遷移図である。ここでは、前提として、通話装置は通話相手が存在する他地点と接続して通話中(例えば、電話会議中)であるものとする。   A description will be given of a reception voice reproduction process in the communication device of the first embodiment configured as described above. FIG. 6 is a state transition diagram showing the operating state of speech speed conversion in Embodiment 1 of the present invention. Here, as a premise, it is assumed that the call device is connected to another point where the other party exists and is in a call (for example, during a conference call).

図6において、ここでは通話のリアルタイム性を保つために遅延してもよい最大の時間を1秒とし、音声データを記憶するバッファの容量上遅延できる最大の時間を2秒とする。また話速変換が行われた時の話速の平均遅延率を150%とする。話速変換率の平均は逆数の66.7%となる。ここで平均としているのは、話速変換を行った際の遅延度合いが音声の内容によって変わるからである。   In FIG. 6, here, the maximum time that may be delayed in order to maintain the real-time nature of the call is 1 second, and the maximum time that can be delayed due to the capacity of the buffer that stores the voice data is 2 seconds. Further, the average delay rate of speech speed when speech speed conversion is performed is set to 150%. The average speech rate conversion rate is 66.7% of the reciprocal. The reason for the average is that the degree of delay when the speech speed conversion is performed varies depending on the content of the voice.

まず、通話開始直後は状況に応じてどこから始まっても構わないが、ここでは図6の通り送話ミュート・スロー再生共にOFFの状態6Aを通話開始直後とする。使用者がミュートボタンを押下すると、スロー再生はなく送話ミュートがなされた状態6Bとなる。また状態6Aからスローボタンを押下すると、受話音声のスロー再生が行われる状態6Cとなる。状態6Bからスローボタンを押下すると、スロー再生と送話ミュートが共になされた状態6Dとなる。状態6Cからミュートボタンを押下しても同様に状態6Dとなる。   First, immediately after the start of the call, it may start from anywhere depending on the situation, but here, as shown in FIG. When the user depresses the mute button, there is no slow playback, and the transmission mute is performed 6B. Further, when the slow button is pressed from the state 6A, a state 6C in which the received voice is slowly played back is obtained. When the slow button is pressed from the state 6B, a state 6D in which both slow reproduction and transmission mute are performed is obtained. Even if the mute button is pressed from the state 6C, the state 6D is similarly obtained.

またこれらは非可逆の遷移であり、例えば状態6Dからミュートボタンを押下すると状態6Cとなる。このように、ミュートボタン、スローボタンの押下をトリガとして各状態に遷移する。   These are irreversible transitions. For example, when the mute button is pressed from the state 6D, the state 6C is obtained. In this way, transition to each state is triggered by pressing the mute button or slow button.

状態6Aと状態6Bはスロー再生を行わないので最大遅延時間は設定されず、状態6Cでは最大遅延時間を1秒、状態6Dでは最大遅延時間を2秒とする。つまり、状態6Cからミュートボタンを押して状態6Dになれば最大遅延時間は1秒から2秒に変わり、逆に状態6Dから再度ミュートボタンを押して状態6Cになれば遅延時間は2秒から1秒に変わる。この時、遅延時間が2秒に達していた場合は、1秒分の音声データを破棄するか、又は話速変換によって本来の話速より早く再生する事で遅延時間1秒に追いつくようにする。   Since the state 6A and the state 6B do not perform slow reproduction, the maximum delay time is not set. In the state 6C, the maximum delay time is 1 second, and in the state 6D, the maximum delay time is 2 seconds. That is, if the mute button is pressed from the state 6C to the state 6D, the maximum delay time is changed from 1 second to 2 seconds. Conversely, if the mute button is pressed again from the state 6D to the state 6C, the delay time is changed from 2 seconds to 1 second. change. At this time, if the delay time has reached 2 seconds, the audio data for 1 second is discarded, or by playing back faster than the original speech speed by speech speed conversion, the delay time can be caught up to 1 second. .

図7は、本発明の実施の形態1における通話装置の機能構成を模式的に示すブロック図である。この図7において、101は使用者が送話ミュート指示やスロー再生指示を与えるためのユーザーインターフェース、これは図2のミュートボタン605とスローボタン606にあたる。102はスローボタン606が押されているかどうか判定するスロー再生判定部、103はミュートボタン605が押されているかどうか判断する送話ミュート判定部、104はスロー再生判定部102によってスローボタンが押されていると判定されるとスロー再生を行い、さらに送話ミュート判定部103によってミュートボタン605が押されていないと判定されたらスロー再生の最大遅延時間を1秒、押されていると判定されたら2秒と設定する話速変換部、105は送話ミュート判定部103によってミュートボタン605が押されていると判定されたら通話路に音声を送らない送話ミュート部である。   FIG. 7 is a block diagram schematically showing a functional configuration of the communication device according to Embodiment 1 of the present invention. In FIG. 7, reference numeral 101 denotes a user interface for a user to give a transmission mute instruction and a slow reproduction instruction, which corresponds to the mute button 605 and the slow button 606 in FIG. 102 is a slow playback determination unit that determines whether or not the slow button 606 is pressed, 103 is a transmission mute determination unit that determines whether or not the mute button 605 is pressed, and 104 is a slow button that is pressed by the slow playback determination unit 102. If it is determined that the mute button 605 is not pressed by the transmission mute determination unit 103, the maximum delay time of the slow playback is determined to be 1 second. A speech speed conversion unit 105 that sets 2 seconds is a transmission mute unit that does not send audio to the communication path when the transmission mute determination unit 103 determines that the mute button 605 is pressed.

本実施の形態1において、スロー再生判定部102、送話ミュート判定部103、話速変換部104、および送話ミュート部105は、それぞれ図5のDSP701上で動作するソフトウェアプログラムに対応している。スロー再生判定部102と話速変換部104は、DSP701が通信路インターフェース702より受信した受話音声を、メモリ703に記憶されているプログラムに従って演算して、音声信号出力部7012を介し、D/Aコンバータ705へ出力することによって実現される。またメモリ703は話速変換を行うために音声を溜めるためにも使用される。   In the first embodiment, the slow playback determination unit 102, the transmission mute determination unit 103, the speech speed conversion unit 104, and the transmission mute unit 105 each correspond to a software program that operates on the DSP 701 in FIG. . The slow playback determination unit 102 and the speech speed conversion unit 104 calculate the received voice received by the DSP 701 from the communication path interface 702 according to a program stored in the memory 703, and perform the D / A via the voice signal output unit 7012. This is realized by outputting to the converter 705. The memory 703 is also used for collecting voice for speech speed conversion.

図8は、本実施の形態1における話速変換を行った時の受話音声の概念図である。例えば図8上段のように、「もしもしこんにちは。もしもし」と通話相手が使用者に対して話しかける。この時、「もしもしこんにちは」と喋るのには約3秒掛かっているとする。状態6Aと状態6Bはスロー再生を行わないので、図8上段のように通常の速度で使用者側に再生される。状態6Cのスロー再生では、話速の平均遅延率が150%であれば、「もしもしこんにちは」をゆっくり再生するのに3x1.5=4.5秒かかり、本来の3秒から1.5秒遅延することになる。実際は、最大遅延時間が1秒のため、再生途中で遅延時間が1秒になり、そこからは通常の速度で再生される(図8中段)。話速変換は充分に機能しないが、その分リアルタイム性が保たれ、通話相手が話し終わってから最悪でも1秒以内にはスロー再生の出力も完了する。このため使用者はスロー再生中でも相手が話し終わって1秒後には応答できる。但し、通信路経由や処理にかかる遅延時間はここでは無視している。   FIG. 8 is a conceptual diagram of received voice when speech speed conversion is performed in the first embodiment. For example, as shown in FIG. 8 upper stage, "Hello Hello. Hello," said the other party speaks to the user. In this case, and to speak with "Hello Hello" is hanging about 3 seconds. Since the state 6A and the state 6B do not perform slow reproduction, they are reproduced to the user side at a normal speed as shown in the upper part of FIG. In the slow reproduction of the state 6C, if 150% of the average delay rate of speech speed, takes 3x1.5 = 4.5 seconds to play slowly "Hello Hello", 1.5 seconds delay from the original 3 seconds Will do. Actually, since the maximum delay time is 1 second, the delay time becomes 1 second during the reproduction, and the reproduction is started at a normal speed from there (the middle stage in FIG. 8). Although the speech speed conversion does not function sufficiently, the real-time property is maintained correspondingly, and the output of the slow playback is completed within one second at the worst after the other party finishes speaking. Therefore, the user can respond in 1 second after the other party finishes speaking even during slow playback. However, the delay time for the communication path and processing is ignored here.

状態6Dの送話ミュート中スロー再生では、最大遅延時間が2秒のため、前述の話速変換で通話相手が「もしもしこんにちは」と約3秒掛かって喋り、遅延時間が1.5秒になっても、遅延時間の限度まで余裕があるので、受話音声を最後までゆっくり再生する事ができる(図8下段)。この時、通話相手が話し終わってからスロー再生の出力も完了するのに1.5秒掛かるが、使用者は応答する必要が無く、また通話相手も使用者の応答を待つ必要が無いので、ストレスなく本装置を使用することができる。尚、実施の形態1では話速の平均遅延率を150%としたが、これに限定されない。   In the transmission mute during slow reproduction of the state 6D, since the maximum delay time is 2 seconds, talking it takes about 3 seconds the other party is a "Hello Hello" in the aforementioned speech speed conversion, delay time becomes 1.5 seconds However, since there is a margin up to the limit of the delay time, the received voice can be reproduced slowly until the end (lower part of FIG. 8). At this time, it takes 1.5 seconds for the slow call output to be completed after the call partner finishes speaking, but the user does not need to respond and the call partner does not need to wait for the user's response. The device can be used without stress. In the first embodiment, the average delay rate of speech speed is 150%, but the present invention is not limited to this.

また、スロー再生の最大遅延時間を、送話ミュートせずにスロー再生する時は1秒、送話ミュートしてスロー再生する時には2秒としたが、これに限定されるものではない。例えば、送話ミュートせずにスロー再生する場合の最大遅延時間は0.8秒から1.2秒の間の任意の時間を選択する。   The maximum delay time for slow playback is 1 second for slow playback without transmission mute, and 2 seconds for slow playback with transmission mute, but is not limited to this. For example, an arbitrary time between 0.8 seconds and 1.2 seconds is selected as the maximum delay time when slow reproduction is performed without the transmission mute.

(実施の形態2)
図9は、本発明の実施の形態2における話速変換の動作状態を示す状態遷移図である。
(Embodiment 2)
FIG. 9 is a state transition diagram showing an operation state of speech speed conversion in the second embodiment of the present invention.

動作の流れとしては図6の状態遷移図とほぼ同じだが、実施の形態2ではスロー再生にタイプ1とタイプ2の2つのタイプがある。ここでは、タイプ1の話速平均遅延率を140%とし、タイプ2の話速平均遅延率を180%とする。また音声データを記憶するバッファの容量上、遅延できる最大の時間を3秒とする。   Although the flow of operation is almost the same as the state transition diagram of FIG. 6, in the second embodiment, there are two types of slow playback, type 1 and type 2. Here, the type 1 speech speed average delay rate is 140%, and the type 2 speech speed average delay rate is 180%. In addition, the maximum time that can be delayed is 3 seconds due to the capacity of the buffer for storing the audio data.

まず、通話開始直後は状況に応じてどこから始まっても構わないが、ここでは図9の通り送話ミュート・スロー再生共にOFFの状態9Aを通話開始直後とする。使用者がミュートボタンを押下すると、スロー再生はなく送話ミュートがなされた状態9Bとなる。   First, immediately after the start of the call, it may start from anywhere depending on the situation, but here, as shown in FIG. When the user depresses the mute button, there is no slow playback, and the state 9B in which the transmission mute is performed is obtained.

図9の実施の形態2において、スローボタンを押すことで話速変換のON/OFFを切り替えるだけでなく、OFF/タイプ1/タイプ2と順に切り替えることができる。状態9Aからスローボタンを押下すると、送話ミュートされずにタイプ1のスロー再生が行われる状態9Cとなる。状態9Cでの最大遅延時間は1秒である。状態9Cにある時、使用者がミュートボタンを押す事で送話ミュートされタイプ1のスロー再生を行う状態9Dに遷移し、遅延の限度時間が1秒から3秒に変わる。これは前述の通り、使用者はスロー再生の出力が終わってから応答する必要が無く、また通話相手も使用者の応答を待つ必要が無いため、遅延時間が大きくなってもストレス無く通話を行う事ができる。状態9Cは、双方向がお互いによく発話する時に用いるのが望ましい。   In the second embodiment shown in FIG. 9, not only the speech speed conversion can be switched on / off by pressing the slow button, but also in the order of OFF / type 1 / type 2 can be switched. When the slow button is pressed from the state 9A, the state 9C is entered in which type 1 slow reproduction is performed without muting the transmission. The maximum delay time in state 9C is 1 second. When the user is in state 9C, the user presses the mute button to transition to state 9D in which transmission is muted and type 1 slow playback is performed, and the delay time limit changes from 1 second to 3 seconds. As described above, the user does not need to respond after the output of the slow playback is completed, and the call partner does not need to wait for the user's response, so the call can be made without stress even if the delay time becomes large. I can do things. It is desirable to use the state 9C when the two-way talk well.

状態9Cにある時、使用者がスローボタンを押す事で送話ミュートされずにタイプ2のスロー再生される状態9Eに遷移する。状態9Eでは送話ミュートがされていないが、最大遅延時間を2秒としている。状態9Eの話速平均遅延率が180%であり、「もしもしこんにちは」と喋るのに約3秒、最初の「もしもし」だけで1.5秒掛かっているとすると、1.5x1.8=2.7秒となり、本来の1.5秒経過時点から1.2秒遅延している事になる。つまり「もしもしこんにちは」の「もしもし」を言った時点でスロー再生は聞かなくなる。このように話速がゆっくりであるほど遅延時間がすぐに1秒を超えてしまうので、リアルタイム性よりもスロー再生の持続時間を重視するため最大遅延時間を2秒とする。状態9Eは、使用者があまり話さず、且つ相手端末の音声をゆっくり聞きたい時に用いるのが望ましい。   When in the state 9C, when the user presses the slow button, the state transitions to the state 2E in which the transmission is not muted and the type 2 slow playback is performed. In state 9E, the transmission mute is not performed, but the maximum delay time is 2 seconds. Speech speed average delay rate of the state 9E is 180%, "Hello Hello" and speaks of in about 3 seconds, and the first and only takes 1.5 seconds, "Hello", 1.5x1.8 = 2 7 seconds, which is 1.2 seconds behind the original 1.5 seconds. That slow play is not heard at the time who said "Hello" and "Hello Hello". Thus, the slower the speech speed, the sooner the delay time exceeds 1 second. Therefore, the maximum delay time is set to 2 seconds in order to emphasize the duration of slow playback rather than the real-time performance. It is desirable to use the state 9E when the user does not speak much and wants to listen to the voice of the partner terminal slowly.

状態9Eにある時、使用者がミュートボタンを押す事で送話ミュートされタイプ2のスロー再生される状態9Fに遷移し、遅延の限度時間が2秒から3秒に変わる。これにより状態9Dと同様、遅延時間が大きくなってもストレス無く通話を行う事ができる。   When the user is in the state 9E, when the user presses the mute button, the transmission is muted and the state transitions to the state 2F in which type 2 slow playback is performed, and the delay time limit is changed from 2 seconds to 3 seconds. As a result, as in the state 9D, it is possible to make a call without stress even when the delay time is increased.

このように、話速変換率の度合いとミュートの状態によって最大遅延時間を個別に設定する事で、使用者の用途に応じて話速変換の効果が充分に得られるような体系を作る事が可能となる。   In this way, by setting the maximum delay time individually depending on the degree of the speech rate conversion rate and the mute state, it is possible to create a system that can sufficiently obtain the effect of speech rate conversion according to the user's application. It becomes possible.

尚、実施の形態2では、話速の平均遅延率をタイプ1で140%、タイプ2で180%としたが、これに限定されない。   In the second embodiment, the average speech rate delay rate is 140% for Type 1 and 180% for Type 2, but the present invention is not limited to this.

また、スロー再生の最大遅延時間を、送話ミュートせずにタイプ1のスロー再生する時は1秒、送話ミュートせずにタイプ2のスロー再生する時は2秒、送話ミュートしてタイプ1又はタイプ2のスロー再生する時は3秒としたが、これに限定されるものではない。例えば、送話ミュートせずにタイプ1のスロー再生する時の最大遅延時間は0.8秒から1.2秒の間の任意の時間を選択する。   Also, the maximum delay time for slow playback is 1 second for slow playback of type 1 without muting the transmission, 2 seconds for slow playback of type 2 without muting the transmission, The slow playback of 1 or type 2 is 3 seconds, but is not limited to this. For example, the maximum delay time for the type 1 slow playback without muting the transmission is selected as an arbitrary time between 0.8 seconds and 1.2 seconds.

さらに実施の形態2ではスローボタン606でスロー再生のOFF/タイプ1/タイプ2、と順に切り替えたが、2つのボタンを設け、一方を押すとタイプ1、他方を押すとタイプ2となるようにしてもよい。   Furthermore, in the second embodiment, the slow playback 606 is switched in order of OFF / type 1 / type 2 with the slow button 606, but two buttons are provided so that the type 1 is pressed when one is pressed and the type 2 is pressed when the other is pressed. May be.

本発明にかかる通話装置および通話方法は、使用者が送話ミュートを行っている時に対して話速変換の効果が十分に得られ、送話ミュートを行っていない時はリアルタイム性が確保されるので、電話会議システムなどに好適である。   The call device and the call method according to the present invention are sufficiently effective in converting the speech speed when the user is muting the transmission, and real-time performance is ensured when the muting is not performed. Therefore, it is suitable for a telephone conference system.

実施の形態1における通話装置の外観図External view of communication apparatus in embodiment 1 実施の形態1における通話装置の上面図Top view of communication apparatus according to Embodiment 1 実施の形態1における使用時の構成の一例を示す図FIG. 5 is a diagram illustrating an example of a configuration at the time of use in the first embodiment 実施の形態1における使用時の構成の他の例を示す図The figure which shows the other example of the structure at the time of use in Embodiment 1. 実施の形態1における通話装置の部品構成を示すブルック図Brook diagram showing component configuration of communication device in embodiment 1 実施の形態1の状態遷移図State transition diagram of the first embodiment 実施の形態1における通話装置の機能構成を示すブロック図FIG. 3 is a block diagram showing a functional configuration of the telephone device according to the first embodiment. 実施の形態1におけるリアルタイム話速変換の概念図Conceptual diagram of real-time speech speed conversion in the first embodiment 実施の形態2の状態遷移図State transition diagram of the second embodiment 従来の話速変換回路の構成図Configuration diagram of conventional speech speed conversion circuit リアルタイム話速変換処理の動作概念図Conceptual diagram of real-time speech speed conversion processing リアルタイム話速変換処理の動作概念図Conceptual diagram of real-time speech speed conversion processing リアルタイム話速変換処理の動作概念図Conceptual diagram of real-time speech speed conversion processing リアルタイム話速変換処理の動作概念図Conceptual diagram of real-time speech speed conversion processing

符号の説明Explanation of symbols

101 ユーザーインターフェース
102 スロー再生判定部
103 送話ミュート判定部
104 話速変換部
105 送話ミュート部
601 通話装置
602a〜602d マイクロホン
603 スピーカ
605 ミュートボタン
606 スローボタン
701 DSP
703 メモリ
DESCRIPTION OF SYMBOLS 101 User interface 102 Slow reproduction | regeneration determination part 103 Transmission mute determination part 104 Speech rate conversion part 105 Transmission mute part 601 Calling apparatus 602a-602d Microphone 603 Speaker 605 Mute button 606 Slow button 701 DSP
703 memory

Claims (16)

相手端末から受信した受話音声の話速を遅くして再生する話速変換を行う話速変換手段と、前記話速変換手段によって前記話速変換が行われる際に、使用者の送話音声を前記相手端末に送らない送話ミュートを行うか否かを判断する送話ミュート判断手段と、前記送話ミュート判断手段によって前記送話ミュートを行うと判断される場合に前記話速変換における遅延時間の限度を、前記送話ミュート判断手段によって前記送話ミュートを行わないと判断される場合よりも大きく設定する遅延時間設定手段と、を備えることを特徴とする通話装置。 Speak speed conversion means for performing speech speed conversion for slowing down and reproducing the received voice received from the partner terminal, and when the speech speed conversion is performed by the speech speed conversion means, A transmission mute determination means for determining whether or not to perform a transmission mute that is not sent to the counterpart terminal, and a delay time in the speech speed conversion when the transmission mute determination means determines that the transmission mute is to be performed. And a delay time setting means for setting a limit of the delay time larger than the case where the transmission mute determination means determines that the transmission mute is not performed. 前記遅延時間設定手段は、前記送話ミュート手段によって前記送話ミュートを行わないと判断される場合に、前記話速変換における遅延時間の限度を略1秒と設定することを特徴とする請求項1に記載の通話装置。 The delay time setting means sets a limit of a delay time in the speech speed conversion to approximately 1 second when the transmission mute means determines that the transmission mute is not performed. 1. The communication device according to 1. 前記遅延時間設定手段は、前記送話ミュート手段によって前記送話ミュートを行うと判断される場合に、前記話速変換における遅延時間の限度を略2秒と設定することを特徴とする請求項1に記載の通話装置。 2. The delay time setting means sets a limit of a delay time in the speech speed conversion to about 2 seconds when it is determined that the transmission mute is performed by the transmission mute means. The communication device described in 1. 前記話速変換手段は、再生する話速変換率として第1の話速変換率と、前記第1の話速変換率より遅く再生する第2の話速変換率の2種類のうち、一方を選択的に設定することを特徴とする請求項1に記載の通話装置。 The speech speed conversion means selects one of two types, ie, a first speech speed conversion ratio to be reproduced and a second speech speed conversion ratio to be reproduced later than the first speech speed conversion ratio. The call device according to claim 1, wherein the call device is selectively set. 前記遅延時間設定手段は、前記送話ミュート判断手段によって前記送話ミュートを行わないと判断される場合に、前記第1の話速変換率における遅延時間の限度を略1秒と設定することを特徴とする請求項4に記載の通話装置。 The delay time setting means sets the limit of the delay time in the first speech speed conversion rate to approximately 1 second when the transmission mute determination means determines that the transmission mute is not performed. The call device according to claim 4, wherein: 前記遅延時間設定手段は、前記送話ミュート手段によって前記送話ミュートを行うと判断される場合に、前記第1の話速変換における遅延時間の限度を略3秒と設定することを特徴とする請求項4に記載の通話装置。 The delay time setting means sets a limit of a delay time in the first speech speed conversion to about 3 seconds when the transmission mute means determines that the transmission mute is to be performed. The communication device according to claim 4. 前記遅延時間設定手段は、前記送話ミュート判断手段によって前記送話ミュートを行わないと判断される場合に、前記第2の話速変換率における遅延時間の限度を略2秒と設定することを特徴とする請求項4に記載の通話装置。 The delay time setting means sets the limit of the delay time in the second speech rate conversion rate to approximately 2 seconds when the transmission mute determination means determines that the transmission mute is not performed. The call device according to claim 4, wherein: 前記遅延時間設定手段は、前記送話ミュート手段によって前記送話ミュートを行うと判断される場合に、前記第2の話速変換における遅延時間の限度を略3秒と設定することを特徴とする請求項4に記載の通話装置。 The delay time setting means sets the limit of the delay time in the second speech speed conversion to about 3 seconds when the transmission mute means determines that the transmission mute is to be performed. The communication device according to claim 4. 相手端末から受信した受話音声の話速を遅くして再生する話速変換を行い、前記話速変換が行われる際に、使用者の送話音声を前記相手端末に送らない送話ミュートを行うか否かを判断し、前記送話ミュートを行うと判断される場合に前記話速変換における遅延時間の限度を、前記送話ミュートを行わないと判断される場合よりも大きく設定することを特徴とする通話方法。 Performs speech speed conversion for slowing down the playback speed of the received voice received from the partner terminal, and mutes the transmission of the user's transmitted voice to the partner terminal when the speech speed conversion is performed. When the transmission mute is determined to be performed, the delay time limit in the speech speed conversion is set larger than the case where it is determined not to perform the transmission mute. Call method. 前記送話ミュートを行わないと判断される場合に、前記話速変換における遅延時間の限度を略1秒と設定されることを特徴とする請求項9に記載の通話方法。 The call method according to claim 9, wherein when it is determined that the transmission mute is not performed, a limit of a delay time in the speech speed conversion is set to about 1 second. 前記送話ミュートを行うと判断される場合に、前記話速変換における遅延時間の限度を略2秒と設定されることを特徴とする請求項9に記載の通話方法。 10. The call method according to claim 9, wherein when it is determined that the transmission mute is to be performed, a limit of a delay time in the speech speed conversion is set to approximately 2 seconds. 再生する話速変換率として第1の話速変換率と、前記第1の話速変換率より遅く再生する第2の話速変換率の2種類のうち、一方を選択的に設定されることを特徴とする請求項9に記載の通話方法。 One of the two types, the first speech rate conversion rate and the second speech rate conversion rate that is played back slower than the first speech rate conversion rate, is selectively set as the speech rate conversion rate to be reproduced. The calling method according to claim 9. 前記送話ミュートを行わないと判断される場合に、前記第1の話速変換率における遅延時間の限度を略1秒と設定されることを特徴とする請求項9に記載の通話方法。 10. The call method according to claim 9, wherein when it is determined that the transmission mute is not performed, a limit of a delay time in the first speech rate conversion rate is set to approximately 1 second. 前記送話ミュートを行うと判断される場合に、前記第1の話速変換における遅延時間の限度を略3秒と設定されることを特徴とする請求項9に記載の通話方法。 10. The calling method according to claim 9, wherein when it is determined that the transmission mute is to be performed, a limit of a delay time in the first speech speed conversion is set to about 3 seconds. 前記送話ミュートを行わないと判断される場合に、前記第2の話速変換率における遅延時間の限度を略2秒と設定されることを特徴とする請求項9に記載の通話方法。 10. The call method according to claim 9, wherein when it is determined that the transmission mute is not performed, a limit of a delay time in the second speech speed conversion rate is set to approximately 2 seconds. 前記送話ミュートを行うと判断される場合に、前記第2の話速変換における遅延時間の限度を略3秒と設定されることを特徴とする請求項9に記載の通話方法。 10. The call method according to claim 9, wherein when it is determined that the transmission mute is performed, a limit of a delay time in the second speech speed conversion is set to about 3 seconds.
JP2008109809A 2008-04-21 2008-04-21 Telephone call device and telephone call method Pending JP2009258529A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008109809A JP2009258529A (en) 2008-04-21 2008-04-21 Telephone call device and telephone call method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008109809A JP2009258529A (en) 2008-04-21 2008-04-21 Telephone call device and telephone call method

Publications (1)

Publication Number Publication Date
JP2009258529A true JP2009258529A (en) 2009-11-05

Family

ID=41386024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008109809A Pending JP2009258529A (en) 2008-04-21 2008-04-21 Telephone call device and telephone call method

Country Status (1)

Country Link
JP (1) JP2009258529A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014228691A (en) * 2013-05-22 2014-12-08 日本電気株式会社 Aviation control voice communication device and voice processing method
JP7471752B2 (en) 2020-08-27 2024-04-22 株式会社第一興商 Server device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014228691A (en) * 2013-05-22 2014-12-08 日本電気株式会社 Aviation control voice communication device and voice processing method
JP7471752B2 (en) 2020-08-27 2024-04-22 株式会社第一興商 Server device

Similar Documents

Publication Publication Date Title
US7822050B2 (en) Buffering, pausing and condensing a live phone call
US8744524B2 (en) User interface tone echo cancellation
US20220286538A1 (en) Earphone device and communication method
JP4473260B2 (en) Telephone communication device
CN101488992A (en) Call processing method and mobile terminal
TW201933336A (en) Electronic device and echo cancellation method applied to electronic device
WO2013131367A1 (en) Multi-decoder audio system, system signal procedure, and formed mobile device
JP2009258529A (en) Telephone call device and telephone call method
JP2008292621A (en) Speech speed conversion device, speaking device and speech speed conversion method
CN111225102A (en) Bluetooth audio signal transmission method and device
JP3069547B2 (en) Speech rate hands-free unit and speech system
CN110856068B (en) Communication method of earphone device
JP4999797B2 (en) Interactive hands-free speech rate conversion device
JP6922551B2 (en) Voice processing device, voice processing program, and voice processing method
JP5210788B2 (en) Speech signal communication system, speech synthesizer, speech synthesis processing method, speech synthesis processing program, and recording medium storing the program
TWI278219B (en) System for adjusting speech rate of voice over Internet protocol phone and method thereof
KR100238276B1 (en) Method for receiving a call through a TV
JP4088393B2 (en) Loudspeaker simultaneous call device
WO2004045193A1 (en) Content reproduction device with telephone function
JP2021082976A (en) Telephone set
CN114745464A (en) Noise-canceling method for voice channel switching of intelligent PSTN (public switched telephone network) telephone
JP2006108777A (en) Telephone terminal and telephone system using it, and control method of telephone terminal
KR100581287B1 (en) Auto mode-switching device for hands free
JP2008079154A (en) Ip telephone system, method for switching speech path, and control device for ip telephone system
JP2010178066A (en) Intercom system