JP2013114118A - Speaker speaking rate control device and operation method thereof - Google Patents
Speaker speaking rate control device and operation method thereof Download PDFInfo
- Publication number
- JP2013114118A JP2013114118A JP2011261432A JP2011261432A JP2013114118A JP 2013114118 A JP2013114118 A JP 2013114118A JP 2011261432 A JP2011261432 A JP 2011261432A JP 2011261432 A JP2011261432 A JP 2011261432A JP 2013114118 A JP2013114118 A JP 2013114118A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- speed
- listener
- speaking
- speaking speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は、話者の発話の速度を聴きやすい速度に調整するための話者話速制御装置およびその動作方法に関するものである。 The present invention relates to a speaker speaking speed control apparatus for adjusting the speaking speed of a speaker to a speed at which it can be easily heard, and an operation method thereof.
人の身体機能は加齢によって低下することは広く知られている。例えば,目が見えにくくなる、耳が遠くなるといった現象は良く知られた現象である。また、認知機能も加齢に伴い低下することが知られている。例えば、脳におけるワーキングメモリの減少により、抽象的な認知処理の能力が低下する傾向にある。これらの要素から、高齢者は、会話や音声の聞き取りが若齢者と比較して困難であると考えられる。高齢者などにとって会話を聞き取りやすくするためには、会話の速度(話速)を調整する必要がある。 It is widely known that a person's physical function decreases with age. For example, the phenomenon that the eyes are difficult to see and the ears are far away is a well-known phenomenon. Moreover, it is known that cognitive function also decreases with aging. For example, the ability of abstract cognitive processing tends to decrease due to a decrease in working memory in the brain. From these factors, it is considered that elderly people have difficulty in speaking and listening to voice compared to younger people. It is necessary to adjust the conversation speed (speech speed) to make it easier for elderly people to hear the conversation.
話速に関する従来の技術としては、話速を計測する手法や、音声読み上げの速さを利用者もしくは利用状況またはその両方に応じて最適化する手法がある(特許文献1〜3)。
Conventional techniques relating to speech speed include a technique for measuring the speech speed and a technique for optimizing the speed of speech reading in accordance with the user and / or the use situation (
一般の会話において、会話をする者(話者)が相手(聴者)にとって適切な速度に収まるように自発的に話速に気を付けて発話すれば、聴者にとって聞きやすくなると考えられる。しかし、発話中に自分の話速を意識し、話速を調整することは難しい。このため、話に夢中になって早口になり相手が聞きとれなくなることがしばしば起きる。また、複数人数での会話では、全員が聞き取れるよう、最も聞き取りが困難な会話参加者(最困難者)に合わせて話速を変化させなければならない。しかし、最困難者以外の参加者に対する発話では、話速が速くなりがちであり、そのようなときに、最困難者を考慮して発話を行うのは非常に難しい。 In general conversation, if the person (speaker) having a conversation spontaneously speaks with the speaking speed so as to be within an appropriate speed for the other party (listener), it will be easier for the listener to hear. However, it is difficult to adjust the speaking speed while being aware of the speaking speed while speaking. For this reason, it often happens that people become crazy about the story and become unable to hear the other party. In a conversation with a plurality of people, the speaking speed must be changed in accordance with the conversation participant who is most difficult to hear (the most difficult person) so that everyone can hear it. However, speaking to participants other than the most difficult person tends to increase the speaking speed, and in such a case, it is very difficult to speak considering the most difficult person.
本発明は、上記の課題に鑑みてなされたものであり、その目的とするところは、話者の発話の速度を聴きやすい速度に調整するための話者話速制御装置およびその動作方法を提供することにある。 The present invention has been made in view of the above problems, and an object of the present invention is to provide a speaker speaking speed control device and an operation method thereof for adjusting the speaking speed of a speaker to a speed at which it can be easily heard. There is to do.
上記の課題を解決するために、第1の本発明は、話者の発話を聴く聴者にとって聴きやすい発話の速度である聴者話速が予め記憶される聴者話速記憶部と、前記話者の発話の速度である話者話速が記憶される話者話速データベースと、前記話者話速の調整を要請する旨の話者話速調整要請通知を前記話者に向けて出力する話者話速調整要請通知出力部と、
前記話者の発話による音圧を受けるマイクである話者マイクと、前記話者マイクから前記話者の発話による音圧を示す音圧信号である話者音圧信号を受信する話者音圧信号受信部と、前記話者音圧信号受信部から前記話者音圧信号を基に出力される話者音圧計測信号により前記話者話速を算出し、前記話者話速を前記話者話速データベースに記憶させる話者話速算出部と、前記話者話速データベースから1つの話者話速または2以上の話者話速を読み出し、前記聴者話速記憶部から聴者話速を読み出し、前記1つの話者話速または前記2以上の話者話速に基づいて計算した話者話速と前記読み出した聴者話速とに基づいて、前記話者話速の調整の要否を判定し、前記話者話速の調整が必要なら、前記話者話速調整要請通知が出力されるように前記話者話速調整要請通知出力部を制御する話者話速調整制御部とを備えることを特徴とする話者話速制御装置をもって解決手段とする。
In order to solve the above-mentioned problem, the first aspect of the present invention includes a listener speech speed storage unit in which a listener's speech speed, which is a speech speed that is easy to hear for a listener who listens to a speaker's speech, is stored in advance. A speaker that outputs a speaker speaking speed database storing a speaker speaking speed, which is a speaking speed, and a speaker speaking speed adjustment request notification requesting the speaker speaking speed adjustment to the speaker A speech speed adjustment request notification output unit;
A speaker microphone that is a microphone that receives sound pressure generated by the speaker's speech, and a speaker sound pressure that receives a speaker sound pressure signal that is a sound pressure signal indicating a sound pressure generated by the speaker's speech from the speaker microphone. The speaker speech speed is calculated from a signal receiver and a speaker sound pressure measurement signal output from the speaker sound pressure signal receiver based on the speaker sound pressure signal, and the speaker speech speed is calculated as the speaker speech speed. A speaker speaking speed calculation unit to be stored in the speaker speaking speed database, one speaker speaking speed or two or more speaker speaking speeds are read from the speaker speaking speed database, and the listener speaking speed is stored from the listener speaking speed storage unit. Based on the read speaker speech speed calculated based on the one speaker speech speed or the two or more speaker speech speeds and the read listener speech speed, whether or not the speaker speech speed needs to be adjusted is determined. If it is necessary to adjust the speaker speaking speed, the speaker speaking speed adjustment request notification is output. And solutions with a speaker speech speed control device, characterized in that it comprises a speaker speech speed adjustment control unit for controlling the Kihanashi's speaking rate adjustment request notification output portion.
第2の本発明は、話者の発話を聴く聴者にとって聴きやすい発話の速度である聴者話速が予め記憶される聴者話速記憶部と、前記話者の発話の速度である話者話速が記憶される話者話速データベースと、前記話者話速の調整が不要である旨の話者話速調整不要通知を前記話者に向けて出力する話者話速調整不要通知出力部と、前記話者の発話による音圧を受けるマイクである話者マイクと、前記話者マイクから前記話者の発話による音圧を示す音圧信号である話者音圧信号を受信する話者音圧信号受信部と、前記話者音圧信号受信部から前記話者音圧信号を基に出力される話者音圧計測信号により前記話者話速を算出し、前記話者話速を前記話者話速データベースに記憶させる話者話速算出部と、前記話者話速データベースから1つの話者話速または2以上の話者話速を読み出し、前記聴者話速記憶部から聴者話速を読み出し、前記1つの話者話速または前記2以上の話者話速に基づいて計算した話者話速と前記読み出した聴者話速とに基づいて、前記話者話速の調整の要否を判定し、前記話者話速の調整が不要なら、前記話者話速調整不要通知が出力されるように前記話者話速調整不要通知出力部を制御する話者話速調整制御部とを備えることを特徴とする話者話速制御装置をもって解決手段とする。 According to a second aspect of the present invention, there is provided a listener speech speed storage unit in which a listener's speech speed that is easy to hear for a listener who listens to the speaker's speech is stored in advance, and a speaker speech speed that is the speech speed of the speaker. And a speaker speaking speed adjustment unnecessary notification output unit for outputting a speaker speaking speed adjustment unnecessary notification to the speaker that adjustment of the speaker speaking speed is unnecessary. , A speaker microphone that is a microphone that receives sound pressure generated by the speaker's speech, and a speaker sound that receives a speaker sound pressure signal that is a sound pressure signal indicating the sound pressure generated by the speaker's speech from the speaker microphone. Calculating the speaker speaking speed from a pressure signal receiving unit and a speaker sound pressure measurement signal output based on the speaker sound pressure signal from the speaker sound pressure signal receiving unit, A speaker speaking speed calculation unit stored in the speaker speaking speed database, and one speaker story from the speaker speaking speed database Alternatively, two or more speaker speaking speeds are read, the speaker speaking speed is read from the listener speaking speed storage unit, and the speaker speaking speed calculated based on the one speaker speaking speed or the two or more speaker speaking speeds is obtained. It is determined whether or not the speaker speaking speed needs to be adjusted based on the read speaker speaking speed, and if the speaker speaking speed adjustment is unnecessary, the speaker speaking speed adjustment unnecessary notification is output. The speaker speaking speed control device includes a speaker speaking speed adjustment control unit that controls the speaker speaking speed adjustment unnecessary notification output unit.
例えば、前記話者音圧計測信号は、前記話者音圧信号から予め定められた音圧閾値以下の部分を除いた信号である。 For example, the speaker sound pressure measurement signal is a signal obtained by removing a portion below a predetermined sound pressure threshold from the speaker sound pressure signal.
例えば、前記話者話速制御装置は、前記聴者の発話による音圧を受けるマイクである聴者マイクと、前記聴者マイクから前記聴者の発話による音圧を示す音圧信号である聴者音圧信号を受信する聴者音圧信号受信部と、前記聴者音圧信号受信部から前記聴者音圧信号を基に出力される聴者音圧計測信号により聴者話速を算出する聴者話速算出部とを備え、前記聴者話速記憶部は、前記算出された聴者話速を予め記憶するものである。 For example, the speaker speech speed control device is configured to receive a listener microphone that is a microphone that receives sound pressure due to the utterance of the listener, and a listener sound pressure signal that is a sound pressure signal indicating a sound pressure due to the utterance of the listener from the listener microphone. A listener sound pressure signal receiving unit for receiving, and a listener speech speed calculating unit for calculating a listener speech speed from a listener sound pressure measurement signal output based on the listener sound pressure signal from the listener sound pressure signal receiving unit, The listener speech speed storage unit stores the calculated listener speech speed in advance.
例えば、前記話者話速制御装置は、前記聴者マイク、前記聴者音圧信号受信部および前記聴者話速算出部を、複数の聴者ごとに備え、前記聴者話速記憶部は、前記複数の聴者話速の中で最も小さい聴者話速を予め記憶するものである。 For example, the speaker speaking speed control device includes the listener microphone, the listener sound pressure signal receiving unit, and the listener speaking speed calculating unit for each of a plurality of listeners, and the listener speaking speed storage unit includes the plurality of listeners. The earliest speaker speed among the speaking speeds is stored in advance.
例えば、前記聴者話速記憶部は、前記聴者にとって聴きやすい発話の速度の上限値である第1の聴者話速および下限値である第2の聴者話速を予め記憶するものであり、前記話者話速調整制御部は、前記話者話速が前記第1の聴者話速より大きい、または、前記話者話速が前記第2の聴者話速より小さいなら、前記話者話速調整要請通知が出力され、かつ、前記話者話速が前記第1の聴者話速より大きい場合の話者話速調整要請通知と前記話者話速が前記第2の聴者話速より小さい場合の話者話速調整要請通知とが互いに前記話者にとって区別できるものとなるように、前記話者話速調整要請通知出力部を制御する。 For example, the listener speech speed storage unit stores in advance a first listener speech speed that is an upper limit value of an utterance speed that is easy for the listener to listen and a second listener speech speed that is a lower limit value. The speaker speech speed adjustment control unit is configured to request the speaker speech speed adjustment if the speaker speech speed is greater than the first listener speech speed or if the speaker speech speed is less than the second listener speech speed. A notification when a notification is output and a speaker speaking speed adjustment request notification when the speaker speaking speed is higher than the first listener speaking speed and a talk when the speaker speaking speed is lower than the second listener speaking speed The speaker speech speed adjustment request notification output unit is controlled so that the speaker speech speed adjustment request notification can be distinguished from each other by the speaker.
例えば、前記聴者話速記憶部は、前記聴者にとって聴きやすい発話の速度の上限値である第1の聴者話速および下限値である第2の聴者話速を予め記憶するものであり、前記話者話速調整制御部は、前記話者話速が前記第1の聴者話速より大きいなら、前記話者話速と前記第1の聴者話速の差分が大きいほど前記話者話速調整要請通知での要請の程度が高くなるように前記話者話速調整要請通知出力部を制御し、一方、前記話者話速が前記第2の聴者話速より小さいなら、前記話者話速と前記第2の聴者話速の差分が大きいほど前記話者話速調整要請通知での要請の程度が高くなるように前記話者話速調整要請通知出力部を制御する。 For example, the listener speech speed storage unit stores in advance a first listener speech speed that is an upper limit value of an utterance speed that is easy for the listener to listen and a second listener speech speed that is a lower limit value. If the speaker speaking speed is greater than the first listener speaking speed, the speaker speaking speed adjustment control unit requests the speaker speaking speed adjustment as the difference between the speaker speaking speed and the first listener speaking speed increases. Controlling the speaker speech speed adjustment request notification output unit so as to increase the degree of request in the notification, while if the speaker speech speed is smaller than the second listener speech speed, The speaker speech speed adjustment request notification output unit is controlled such that the greater the difference between the second listener speech speeds, the higher the degree of request in the speaker speech speed adjustment request notification.
第3の本発明は、話者話速の調整を要請する旨の話者話速調整要請通知を話者に向けて出力する話者話速制御装置の動作方法であって、前記話者話速制御装置は、話者の発話を聴く聴者にとって聴きやすい発話の速度である聴者話速が予め記憶される聴者話速記憶部と、前記話者の発話の速度である話者話速が記憶される話者話速データベースと、前記話者話速の調整を要請する旨の話者話速調整要請通知を前記話者に向けて出力する話者話速調整要請通知出力部と、前記話者の発話による音圧を受けるマイクである話者マイクと、前記話者マイクから前記話者の発話による音圧を示す音圧信号である話者音圧信号を受信する話者音圧信号受信部とを備え、前記動作方法は、前記話者話速制御装置の話者話速算出部が、前記話者音圧信号受信部から前記話者音圧信号を基に出力される話者音圧計測信号により前記話者話速を算出し、前記話者話速を前記話者話速データベースに記憶させ、前記話者話速制御装置の話者話速調整制御部が、前記話者話速データベースから1つの話者話速または2以上の話者話速を読み出し、前記聴者話速記憶部から聴者話速を読み出し、前記1つの話者話速または前記2以上の話者話速に基づいて計算した話者話速と前記読み出した聴者話速とに基づいて、前記話者話速の調整の要否を判定し、前記話者話速の調整が必要なら、前記話者話速調整要請通知が出力されるように前記話者話速調整要請通知出力部を制御することを特徴とする話者話速制御装置の動作方法をもって解決手段とする。 According to a third aspect of the present invention, there is provided an operation method of a speaker speaking speed control device for outputting a speaker speaking speed adjustment request notification requesting adjustment of a speaker speaking speed to the speaker, wherein the speaker speaking The speed control device stores a listener speech speed storage unit in which a listener's speech speed that is easy to hear for a listener who listens to the speaker's speech is stored in advance, and a speaker speech speed that is the speaker's speech speed is stored. A speaker speaking speed database, a speaker speaking speed adjustment request notification for outputting the speaker speaking speed adjustment request notification requesting the speaker speaking speed adjustment to the speaker, and the talk A speaker microphone that is a microphone that receives a sound pressure generated by the speaker's speech, and a speaker sound pressure signal that is a speaker pressure signal that is a sound pressure signal indicating a sound pressure generated by the speaker's speech from the speaker microphone. And the operation method is such that the speaker speech speed calculation unit of the speaker speech speed control device receives the speaker sound pressure signal. The speaker speaking speed is calculated from the speaker sound pressure measurement signal output based on the speaker sound pressure signal from the speaker, the speaker speaking speed is stored in the speaker speaking speed database, and the speaker speaking speed is calculated. A speaker speaking speed adjustment control unit of the control device reads one speaker speaking speed or two or more speaker speaking speeds from the speaker speaking speed database, reads a listener speaking speed from the listener speaking speed storage unit, and Determining whether or not the speaker speaking speed needs to be adjusted based on one speaker speaking speed or the speaker speaking speed calculated based on the two or more speaker speaking speeds and the read listener speaking speed; If the speaker speech speed adjustment is necessary, the speaker speech speed adjustment request notification output unit is controlled so that the speaker speech speed adjustment request notification is output. The operating method is used as the solution.
第4の本発明は、話者話速の調整不要である旨の話者話速調整不要通知を話者に向けて出力する話者話速制御装置の動作方法であって、前記話者話速制御装置は、話者の発話を聴く聴者にとって聴きやすい発話の速度である聴者話速が予め記憶される聴者話速記憶部と、前記話者の発話の速度である話者話速が記憶される話者話速データベースと、前記話者話速の調整が不要である旨の話者話速調整不要通知を前記話者に向けて出力する話者話速調整不要通知出力部と、前記話者の発話による音圧を受けるマイクである話者マイクと、前記話者マイクから前記話者の発話による音圧を示す音圧信号である話者音圧信号を受信する話者音圧信号受信部とを備え、前記動作方法は、前記話者話速制御装置の話者話速算出部が、前記話者音圧信号受信部から前記話者音圧信号を基に出力される話者音圧計測信号により前記話者話速を算出し、前記話者話速を前記話者話速データベースに記憶させ、前記話者話速制御装置の話者話速調整制御部が、前記話者話速データベースから1つの話者話速または2以上の話者話速を読み出し、前記聴者話速記憶部から聴者話速を読み出し、前記1つの話者話速または前記2以上の話者話速に基づいて計算した話者話速と前記読み出した聴者話速とに基づいて、前記話者話速の調整の要否を判定し、前記話者話速の調整が不要なら、前記話者話速調整不要通知が出力されるように前記話者話速調整不要通知出力部を制御することを特徴とする話者話速制御装置の動作方法をもって解決手段とする。 A fourth aspect of the present invention is an operation method of a speaker speaking speed control device that outputs a speaker speaking speed adjustment unnecessary notification indicating that the speaker speaking speed adjustment is unnecessary to the speaker. The speed control device stores a listener speech speed storage unit in which a listener's speech speed that is easy to hear for a listener who listens to the speaker's speech is stored in advance, and a speaker speech speed that is the speaker's speech speed is stored. A speaker speaking speed database, a speaker speaking speed adjustment unnecessary notification output unit that outputs a speaker speaking speed adjustment unnecessary notification to the speaker that the speaker speaking speed adjustment is unnecessary, and A speaker microphone that is a microphone that receives a sound pressure generated by a speaker's speech, and a speaker sound pressure signal that receives a speaker sound pressure signal that is a sound pressure signal indicating a sound pressure generated by the speaker's speech from the speaker microphone. And a speaker speaking speed calculation unit of the speaker speaking speed control device receives the speaker sound pressure signal. The speaker speech speed is calculated from a speaker sound pressure measurement signal output from the speaker based on the speaker sound pressure signal, the speaker speech speed is stored in the speaker speech speed database, and the speaker speech A speaker speaking speed adjustment controller of the speed controller reads one speaker speaking speed or two or more speaker speaking speeds from the speaker speaking speed database, and reads a listener speaking speed from the listener speaking speed storage; The necessity of adjusting the speaker speaking speed is determined based on the speaker speaking speed calculated based on the one speaker speaking speed or the two or more speaker speaking speeds and the read listener speaking speed. The speaker speaking speed control device controls the speaker speaking speed adjustment unnecessary notification output unit so that the speaker speaking speed adjustment unnecessary notification is output when the speaker speaking speed adjustment is unnecessary. The operation method is used as a solution means.
本発明に係る話者話速制御装置およびその動作方法によれば、話者の発話の速度を聴きやすい速度に調整することができる。 According to the speaker speaking speed control device and the operation method thereof according to the present invention, the speaking speed of the speaker can be adjusted to a speed at which it can be easily heard.
以下、本発明の実施の形態について図面を参照して説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[第1の実施の形態]
図1は、第1の実施の形態に係る話者話速制御装置1を示す図である。図1(a)は、話者話速制御装置1がユーザ(以下、話者Aという)に使用される様子を示す図である。図1(b)は、話者話速制御装置1の概略構成を示す機能ブロック図である。
[First Embodiment]
FIG. 1 is a diagram showing a speaker speech
話者話速制御装置1は、話者Aが会話やスピーチなどをするときに使用されるものである。
The speaker speaking
話者話速制御装置1は、また、話者Aの発話の速度である話者話速が速すぎるまたは遅すぎる場合に話者話速の調整を要請する旨の話者話速調整要請通知ALを話者Aに向けて出力する装置である。
The speaker speaking
話者話速調整要請通知ALは、例えば、音声、光、振動、温度、香りなどによる通知である。 The speaker speaking speed adjustment request notification AL is, for example, a notification by voice, light, vibration, temperature, fragrance, or the like.
話者話速制御装置1は、話者Aの発話による音圧を受けるマイクロフォンである話者マイク101Aと、話者マイク101Aから話者Aの発話による音圧を示す音圧信号である話者音圧信号101ASを受信する話者音圧信号受信部102Aと、話者音圧信号受信部102Aから話者音圧信号101ASを基に出力される話者音圧計測信号102ASにより話者話速を算出する話者話速算出部103Aと、話者Aの発話を聴く聴者(図示せず)にとって聴きやすい発話の速度である聴者話速や各種のパラメータ(詳しくは後述する)が入力される入力部104と、聴者話速や話者話速やパラメータが記憶される記憶部105と、話者話速での発話がなされる区間の開始時刻および終了時刻の計測に必要な現在時刻を出力する時刻出力部106と、話者話速と聴者話速に基づいて、話者話速の調整の要否を判定し、話者話速の調整が必要なら、話者話速調整要請通知ALが出力されるように制御を行う話者話速調整制御部107と、話者話速調整要請通知ALを出力する話者話速調整要請通知出力部108とを備える。
The speaker speaking
話者マイク101Aとしては、話者Aの方向への指向性をもつものが好ましい。
As the
話者Aは、話者話速調整要請通知ALの出力を停止させたい場合は、話者話速制御装置1に設けられた停止スイッチ(図示せず)を操作する。これにより、入力部104は停止信号を生成し、話者話速調整制御部107に送信するようになっている。
When the speaker A wants to stop the output of the speaker speaking speed adjustment request notification AL, the speaker A operates a stop switch (not shown) provided in the speaker speaking
図2は、記憶部105に含まれる聴者話速記憶部1051の構成の一例を示す図である。
FIG. 2 is a diagram illustrating an example of the configuration of the listener speech speed storage unit 1051 included in the
聴者話速記憶部1051は、聴者話速の上限値である第1の聴者話速(以下、聴者話速上限値Maxという)および下限値である第2の聴者話速(以下、聴者話速下限値Minという)を予め記憶するものである。図2は、例として、1秒間に1.5語という聴者話速上限値Max「1.5[語/秒]」と1秒間に0.8語という聴者話速下限値Min「0.8[語/秒]」を示している。ここでは、聴者話速を単位時間あたりの語数とするが、語数に代えて、モーラ数など、他の基準を用いてもよい。 The listener speech speed storage unit 1051 has a first listener speech speed (hereinafter referred to as the listener speech speed upper limit Max) that is an upper limit value of the listener speech speed and a second listener speech speed (hereinafter referred to as the listener speech speed) that is a lower limit value. The lower limit value Min is stored in advance. FIG. 2 shows, as an example, a listener speech speed upper limit Max “1.5 [words / second]” of 1.5 words per second and a listener speech speed lower limit value Min “0.8 of 0.8 words per second. [Word / second] ”. Here, the listener's speech speed is the number of words per unit time, but other criteria such as the number of mora may be used instead of the number of words.
図3は、記憶部105に含まれる話者話速データベース1052Aの構成の一例を示す図である。
FIG. 3 is a diagram illustrating an example of the configuration of the speaker speech speed database 1052A included in the
話者話速データベース1052Aは、話者音圧計測信号102ASにおける複数の区間のそれぞれで話者話速が計測されるので、その各話者話速を記憶するものである。各話者話速には、固有の話者話速番号、ならびに、話者話速での発話がなされる区間の開始時刻および終了時刻が対応づけて記憶される。 The speaker speaking speed database 1052A stores speaker speaking speeds because the speaker speaking speed is measured in each of a plurality of sections in the speaker sound pressure measurement signal 102AS. Each speaker speaking speed stores a unique speaker speaking speed number and a start time and an end time of a section in which speech is performed at the speaker speaking speed.
例えば、話者話速番号「1」のレコードは、話者音圧計測信号102ASにおける2011年8月30日11時9分00秒から2011年8月30日11時9分20秒までの区間の波形に基づいて計測された話者話速が1.8[語/秒]であることを示している。 For example, the record of the speaker speaking speed number “1” is a section from 11: 9: 00 on August 30, 2011 to 11: 9: 20 on August 30, 2011 in the speaker sound pressure measurement signal 102AS. It shows that the speaker speaking speed measured based on this waveform is 1.8 [words / second].
記憶部105には、聴者話速記憶部1051と話者話速データベース1052Aの他にも、各種のパラメータが予め記憶される。
(話者話速制御装置1の動作方法)
図4は、話者話速制御装置1の動作方法を示すフローチャートである。
In addition to the listener speech speed storage unit 1051 and the speaker speech speed database 1052A, the
(Operation method of speaker speaking speed control device 1)
FIG. 4 is a flowchart showing an operation method of the speaker speaking
まず、入力部104は、外部から聴者話速上限値Maxおよび聴者話速下限値Minが与えられたなら、聴者話速上限値Maxおよび聴者話速下限値Minを聴者話速記憶部1051に記憶させる(S1)。
First, when the listener's speech speed upper limit Max and the listener's speech speed lower limit Min are given from the outside, the
次に、話者Aが発話を開始すると、話者マイク101Aは、発話による音圧を受け、音圧を示す話者音圧信号101ASを出力する。話者音圧信号受信部102Aは、話者音圧信号101ASを受信し、話者音圧信号101ASを基に話者音圧計測信号102ASを出力する。話者音圧計測信号102ASは、話者音圧信号101ASから、記憶部105に予め記憶されたパラメータの1つである音圧閾値TH(例えば、40デシベル)以下の音圧を有する部分を除いた信号である。
Next, when the speaker A starts speaking, the
話者話速算出部103Aは、話者音圧計測信号102ASにより話者話速を算出し、話者話速データベース1052Aに記憶させる(S2)。
The speaker speaking
なお、話者音圧計測信号102ASは、記憶部105に書き込まれ、話者話速算出部103Aは、記憶部105の話者音圧計測信号102ASを参照して、話者話速を算出する。
The speaker sound pressure measurement signal 102AS is written in the
図5は、話者音圧信号101ASと話者音圧計測信号102ASの一例を示す図である。 FIG. 5 is a diagram illustrating an example of the speaker sound pressure signal 101AS and the speaker sound pressure measurement signal 102AS.
前述のとおり、話者音圧計測信号102ASは、話者音圧信号101ASから音圧閾値TH以下の部分を除いた信号である。つまり、話者音圧信号受信部102Aは、話者音圧信号101ASから音圧閾値TH以下の部分をカットし、残りの部分つまり話者音圧計測信号102ASを出力する。
As described above, the speaker sound pressure measurement signal 102AS is a signal obtained by removing a portion below the sound pressure threshold TH from the speaker sound pressure signal 101AS. That is, the speaker sound pressure
話者話速算出部103Aは、話者音圧計測信号102ASにおいて、音圧がある区間を発話区間、音圧の無い区間を非発話区間として認識する。図5において、区間aは発話区間、区間bは非発話区間、区間cは発話区間である。
In the speaker sound pressure measurement signal 102AS, the speaker speech
話者話速算出部103Aは、話者音圧計測信号102ASの各発話区間の波形に基づき、その発話区間での話者話速を計測する。話者話速算出部103Aは、ここでは、例えば、同一の発話区間で、1以上の話者話速を計測する。話者話速算出部103Aは、例えば、発話区間の全体で、1つの話者話速を計測する。または、話者話速算出部103Aは、発話区間を分割し、分割により生じた各区間で話者話速を計測する。話者話速算出部103Aは、例えば、区間c(30秒)を0.1秒ごとにつまり300分割し、300の話者話速を計測する。
The speaker speaking
話者話速算出部103Aは、区間bのような非発話区間、例えば、沈黙の期間を除外して、話者話速を計算する。よって、例えば、沈黙が長くなればなるほど話者話速および後述の加重平均(話者話速Va)が遅くなるという問題が生じない。
The speaker speaking
話者話速算出部103Aは、各話者話速を、固有の話者話速番号、ならびに話者話速での発話がなされる区間(発話区間や分割により生じた区間)の開始時刻および終了時刻に対応づけて、話者話速データベース1052Aに記憶させる。
The speaker speaking
図4に戻り、話者話速調整制御部107は、現在から、記憶部105に予め記憶されたパラメータの1つである時間の長さだけ遡った時点までの区間T(例えば「現在から1分前まで」)に含まれる区間の開始時刻および終了時刻を話者話速データベース1052Aから読み出す。そして、話者話速調整制御部107は、各区間の開始時刻および終了時刻の差分(つまり区間長)の合計を計算し、合計が、記憶部105に予め記憶されたパラメータの1つである時間の長さt(例えば「20秒」)より長いか否かを判定する(S3)。つまり、話者話速調整制御部107は、区間Tでの発話区間の合計が十分長いか否かを判定する。発話区間の合計が短い場合は、通常の発話がなされていない可能性が高いので、この場合は、話者話速(後述の話者話速Va)を計測しないようにするのである。
Returning to FIG. 4, the speaker speech speed
図3において、現在時刻を「2011年8月30日11時10分30秒」、区間Tを「現在から1分前まで」とすると、話者話速番号「1」の区間は、区間Tに含まれず、話者話速番号「2」、「3」の区間は、区間Tに含まれる。話者話速番号「2」、「3」の区間の開始時刻および終了時刻の差分の合計は、「50秒」であり、長さtを「20秒」とすると、長さtより長い。 In FIG. 3, if the current time is “August 30, 2011 11:10:30” and the section T is “1 minute before the present”, the section of the speaker speech speed number “1” is the section T The sections of the speaker speaking speed numbers “2” and “3” are included in the section T. The sum of the differences between the start times and end times of the sections of the speaker speaking speed numbers “2” and “3” is “50 seconds”, and is longer than the length t when the length t is “20 seconds”.
話者話速調整制御部107は、合計が長さtより長いなら(S3:YES)、通常の発話がなされている可能性が高いので、話者話速Vaを計測すべく、まず、区間Tに含まれる区間の話者話速を話者話速データベース1052Aから読み出す。そして、話者話速調整制御部107は、各話者話速の加重平均である話者話速Vaを計算する(S4)。
If the total is longer than the length t (S3: YES), the speaker speaking speed
話者話速は、発する単語の違いなどにも影響を受けて、時々刻々と変化する。そのため、単に話者話速が、例えば低下したからといって、話者話速調整要請通知ALを出力したとしても、話者Aは話者話速を調整することが難しい。そこで、第1の実施の形態では、ある程度長い区間における話者話速の加重平均を用い、加重平均(話者話速Va)に基づいて、話者話速調整要請通知ALを出力するようにしている。 The speaker's speaking speed changes from moment to moment, affected by differences in the words that are emitted. For this reason, it is difficult for the speaker A to adjust the speaker speaking speed even if the speaker speaking speed adjustment request notification AL is output simply because the speaker speaking speed has decreased. Therefore, in the first embodiment, a speaker speech speed adjustment request notification AL is output based on a weighted average (speaker speech speed Va) using a weighted average of speaker speech speed in a relatively long section. ing.
図3において、話者話速番号「2」の区間の長さは「30秒」、話者話速は「2.0[語/秒]」であり、話者話速番号「3」の区間の長さは「20秒」、話者話速は「1.5[語/秒]」であり、区間の長さの合計は「50秒」である。話者話速調整制御部107は、この場合、話者話速Vaを、以下の式(1)により計算する。
In FIG. 3, the length of the section of the speaker speed number “2” is “30 seconds”, the speaker speed is “2.0 [words / second]”, and the speaker speed number “3” is The length of the section is “20 seconds”, the speaker speech speed is “1.5 [word / second]”, and the total length of the sections is “50 seconds”. In this case, the speaker speaking speed
Va=(2.0×30+1.5×20)/50=1.8 (1)
つまり、この場合、話者話速Vaは「1.8[語/秒]」である。
Va = (2.0 × 30 + 1.5 × 20) /50=1.8 (1)
That is, in this case, the speaker speaking speed Va is “1.8 [word / second]”.
例えば、話者話速制御装置1が、画面つきの表示装置を有する場合、話者話速Va、聴者話速上限値Maxおよび聴者話速下限値Minが、表示装置に表示される。
For example, when the speaker speech
図6は、話者話速Va等の表示例を示す図である。 FIG. 6 is a diagram illustrating a display example of the speaker speaking speed Va and the like.
表示装置の画面には、例えば、目盛りが表示され、目盛り上の話者話速Vaの位置に矢印が表示される。また、目盛り上の聴者話速上限値Maxおよび聴者話速下限値Minの間以外に斜線がかけられる。これにより、話者Aは、話者話速Va、聴者話速上限値Maxおよび聴者話速下限値Minを見て知り、話者話速を調整することができる。 For example, a scale is displayed on the screen of the display device, and an arrow is displayed at the position of the speaker speaking speed Va on the scale. In addition, a hatched line is applied except for between the listener's speaking speed upper limit value Max and the listener's speaking speed lower limit value Min on the scale. Thereby, the speaker A can know the speaker speaking speed Va, the listener speaking speed upper limit Max, and the listener speaking speed lower limit Min, and can adjust the speaker speaking speed.
図4に戻り、次に、話者話速調整制御部107は、聴者話速記憶部1051から聴者話速上限値Maxを読み出し、話者話速Vaが聴者話速上限値Maxより大きいか否かを判定する(S5)。話者話速調整制御部107は、話者話速Vaが聴者話速上限値Maxより大きいならば(S5:YES)、話者話速調整要請通知出力部108から、光による話者話速調整要請通知ALの出力が開始されるように話者話速調整要請通知出力部108を制御する(S6)。これにより、話者話速調整要請通知出力部108は、光による話者話速調整要請通知ALの出力を開始する。なお、話者話速調整要請通知ALは、停止されるまでは、出力され続ける。
Returning to FIG. 4, next, the speaker speech speed
図2に示すように、聴者話速上限値Maxが「1.5[語/秒]である場合、話者話速Vaが「1.8[語/秒]なら、ステップS5でYESとなるので、光による話者話速調整要請通知ALの出力が開始される。 As shown in FIG. 2, when the listener's speaking speed upper limit Max is “1.5 [word / second], if the speaker speaking speed Va is“ 1.8 [word / second], “YES” is determined in the step S5. Therefore, the output of the speaker speaking speed adjustment request notification AL by light is started.
一方、話者話速調整制御部107は、話者話速Vaが聴者話速上限値Max以下ならば(S5:NO)、聴者話速記憶部1051から聴者話速下限値Minを読み出し、話者話速Vaが聴者話速下限値Minより小さいか否かを判定する(S7)。話者話速調整制御部107は、話者話速Vaが聴者話速下限値Minより小さいならば(S7:YES)、話者話速調整要請通知出力部108から、音声による話者話速調整要請通知ALの出力が開始されるように話者話速調整要請通知出力部108を制御する(S8)。これにより、話者話速調整要請通知出力部108は、音声による話者話速調整要請通知ALの出力を開始する。
On the other hand, if the speaker speech speed Va is equal to or lower than the listener speech speed upper limit Max (S5: NO), the speaker speech speed
図2に示すように、聴者話速下限値Minが「0.8[語/秒]である場合、話者話速Vaが「0.5[語/秒]なら、ステップS7でYESとなるので、音声による話者話速調整要請通知ALの出力が開始される。 As shown in FIG. 2, when the listener speaking speed lower limit Min is “0.8 [word / second], if the speaker speaking speed Va is“ 0.5 [word / second], “YES” is determined in the step S7. Therefore, the output of the speaker speaking speed adjustment request notification AL by voice is started.
一方、話者話速調整制御部107は、話者話速Vaが聴者話速下限値Min以上ならば(S7:NO)、つまり、話者話速Vaが聴者話速上限値Max以下であり、かつ、話者話速Vaが聴者話速下限値Min以上ならば、例えば、話者話速調整要請通知出力部108に停止信号を送信し、話者話速調整要請通知ALの出力を停止させる(S9)。
On the other hand, if the speaker speaking speed Va is equal to or higher than the listener speaking speed lower limit Min (S7: NO), the speaker speaking speed
図2に示すように、聴者話速上限値Maxが「1.5[語/秒]であり、かつ、聴者話速下限値Minが「0.8[語/秒]である場合、話者話速Vaが「1.0[語/秒]なら、話者話速調整要請通知ALの出力が停止される。 As shown in FIG. 2, when the listener's speaking speed upper limit Max is “1.5 [word / second] and the listener's speaking speed lower limit Min is“ 0.8 [word / second], the speaker If the speech speed Va is “1.0 [word / second], the output of the speaker speech speed adjustment request notification AL is stopped.
図4に戻り、話者話速調整制御部107は、ステップS6、S8、S9の処理を終えたなら、入力部104から停止信号が送信されているか否かを判定する(S10)。話者話速調整制御部107は、入力部104から停止信号が送信されている(S10:YES)なら、処理を終了する。
Returning to FIG. 4, when the processing of steps S6, S8, and S9 is completed, the speaker speaking speed
一方、ステップS3でNOと判定されたなら、話者話速調整制御部107は、話者話速調整要請通知出力部108に停止信号を送信し、話者話速調整要請通知の出力を停止させる(S11)。
On the other hand, if NO is determined in step S3, the speaker speech speed
話者話速調整制御部107は、ステップS10でNOと判定されたなら、または、ステップS11の処理を終えたなら、現在の話者音圧計測信号102ASの音圧が音圧閾値THより大きいか否かを判定する(S12)。
If it is determined NO in step S10 or if the processing in step S11 is completed, the speaker speech speed
話者話速調整制御部107は、現在の話者音圧計測信号102ASの音圧が音圧閾値THより大きい(S12:YES)なら、制御をステップS2に移す。一方、話者話速調整制御部107は、現在の話者音圧計測信号102ASの音圧が音圧閾値TH以下(S12:NO)なら、制御をステップS3に移す。
If the sound pressure of the current speaker sound pressure measurement signal 102AS is larger than the sound pressure threshold TH (S12: YES), the speaker speaking speed
図5に示す話者音圧計測信号102ASが観測された時点から、例えば、10秒後において、図7に示す話者音圧計測信号102AS(実線)が観測されたとする。破線は、図5での話者音圧計測信号102ASである。10秒後の話者音圧計測信号102AS(実線)は、破線を左に10秒間シフトした形になっている。 Assume that the speaker sound pressure measurement signal 102AS (solid line) shown in FIG. 7 is observed, for example, 10 seconds after the speaker sound pressure measurement signal 102AS shown in FIG. 5 is observed. The broken line is the speaker sound pressure measurement signal 102AS in FIG. The speaker sound pressure measurement signal 102AS (solid line) after 10 seconds is formed by shifting the broken line to the left for 10 seconds.
話者話速調整制御部107は、例えば、この10秒間で、話者Aが新たに発話を開始して発話が続いているなら、つまり、現在の話者音圧計測信号102AS(実線)の音圧が音圧閾値THより大きい(S12:YES)なら、制御をステップS2に移す。これにより、話者話速等が話者話速データベース1052Aに記憶される。
For example, if the speaker A starts a new utterance and the utterance continues in this 10 seconds, the speaker speaking speed
話者話速調整制御部107は、図7の例では、話者Aが新たに発話を開始し且つ発話が続いているという状況はない、つまり、現在の話者音圧計測信号102AS(実線)の音圧が音圧閾値TH以下なので、制御をステップS3に移す。
In the example of FIG. 7, the speaker speaking speed
したがって、第1の実施の形態に係る話者話速制御装置1によれば、話者話速調整制御部107は、話者話速データベース1052Aから2以上の話者話速を読み出し、聴者話速記憶部1051から聴者話速(聴者話速上限値Maxおよび聴者話速下限値Min)を読み出し、2以上の話者話速に基づいて計算した話者話速Vaと聴者話速上限値Maxおよび聴者話速下限値Minとに基づいて、話者話速の調整の要否を判定し(S5、S7)、話者話速の調整が必要なら(S5:YES、S7:YES)、話者話速調整要請通知ALが出力されるように話者話速調整要請通知出力部108を制御する(S6、S8)ので、話者Aは、話者話速調整要請通知ALを受け、話者話速の調整が必要なことに気がつき、もって、話者話速を調整することができる。
Therefore, according to the speaker speaking
また、話者話速Vaが聴者話速上限値Maxより大きい場合の話者話速調整要請通知ALは光による通知であり、話者話速Vaが聴者話速下限値Minより小さい場合の話者話速調整要請通知ALは音声による通知である。つまり、両者は話者Aにとって区別できるものとなっている。よって、話者Aは、話者話速を速くすべき場合は速く、遅くすべき場合は遅くなるように調整することができる。 In addition, the speaker speaking speed adjustment request notification AL when the speaker speaking speed Va is larger than the listener speaking speed upper limit Max is a light notification, and the talk when the speaker speaking speed Va is smaller than the listener speaking speed lower limit Min. The speaker speed adjustment request notification AL is a voice notification. That is, both are distinguishable for speaker A. Therefore, the speaker A can be adjusted to be fast when the speaker speaking speed should be increased and to be slower when the speaker speaking speed should be delayed.
また、話者話速調整制御部107は、話者話速Vaが聴者話速上限値Maxより大きいなら、話者話速Vaと聴者話速上限値Maxの差分が大きいほど話者話速調整要請通知ALでの要請の程度が高くなるように話者話速調整要請通知出力部108を制御し、一方、話者話速Vaが聴者話速下限値Minより小さいなら、話者話速Vaと聴者話速下限値Minの差分が大きいほど話者話速調整要請通知ALでの要請の程度が高くなるように話者話速調整要請通知出力部108を制御してもよい。
Further, when the speaker speech speed Va is larger than the listener speech speed upper limit value Max, the speaker speech speed
例えば、話者話速調整制御部107は、光による話者話速調整要請通知ALを出力させ、差分が大きいほど光量を大きくする。
For example, the speaker speaking speed
例えば、話者話速調整制御部107は、点滅する光による話者話速調整要請通知ALを出力させ、差分が大きいほど点滅の間隔を短くする。
For example, the speaker speaking speed
例えば、話者話速調整制御部107は、音声による話者話速調整要請通知ALを出力させ、差分が大きいほど音量を大きくする。
For example, the speaker speaking speed
これにより、話者Aは、差分つまり聴者話速と話者話速との隔たりの大きさを知ることができる。 Thereby, the speaker A can know the difference, that is, the size of the difference between the listener's speaking speed and the speaking speed.
また、第1の実施の形態では、話者話速Vaが聴者話速上限値Maxより大きい場合に限り、話者話速調整要請通知ALを出力するようにしてもよい。 In the first embodiment, the speaker speech speed adjustment request notification AL may be output only when the speaker speech speed Va is larger than the listener speech speed upper limit value Max.
また、第1の実施の形態では、話者話速Vaが聴者話速下限値Minより小さい場合に限り、話者話速調整要請通知ALを出力するようにしてもよい。 In the first embodiment, the speaker speech speed adjustment request notification AL may be output only when the speaker speech speed Va is smaller than the listener speech speed lower limit Min.
また、第1の実施の形態では、話者話速Vaが聴者話速上限値Maxより大きい場合の話者話速調整要請通知ALと話者話速Vaが聴者話速下限値Minより小さい場合の話者話速調整要請通知ALとを互いに等しく、例えば、音による話者話速調整要請通知ALとしてもよい。 In the first embodiment, when the speaker speech speed Va is larger than the listener speech speed upper limit Max, the speaker speech speed adjustment request notification AL and the speaker speech speed Va are smaller than the listener speech speed lower limit Min. The speaker speech speed adjustment request notification AL may be equal to each other, for example, the speaker speech speed adjustment request notification AL by sound may be used.
また、第1の実施の形態では、聴者話速記憶部1051に予め1つの聴者話速(例えば、聴者話速上限値Maxと聴者話速下限値Minの平均値)を記憶させておき、聴者話速を読み出し、聴者話速と話者話速Vaの差分の絶対値が、予め定められた大きさ以上になったなら、話者話速調整要請通知ALを出力するようにしてもよい。差分の符号により、話者話速調整要請通知ALの種類を変えてもよい。 In the first embodiment, the listener speech speed storage unit 1051 stores in advance one listener speech speed (for example, the average value of the listener speech speed upper limit value Max and the listener speech speed lower limit value Min). The speech speed is read, and when the absolute value of the difference between the listener speech speed and the speaker speech speed Va exceeds a predetermined magnitude, a speaker speech speed adjustment request notification AL may be output. The type of the speaker speech speed adjustment request notification AL may be changed depending on the sign of the difference.
また、第1の実施の形態では、話者話速Vaを用いたが、話者話速データベース1052Aから1つの話者話速を読み出し、この話者話速を話者話速Vaに代えて用いてもよい。 In the first embodiment, the speaker speaking speed Va is used. However, one speaker speaking speed is read from the speaker speaking speed database 1052A, and this speaker speaking speed is replaced with the speaker speaking speed Va. It may be used.
また、第1の実施の形態では、光や音声による話者話速調整要請通知ALを行ったが、、振動、温度、香りなどによる話者話速調整要請通知AL、話者話速Vaなどの表示を行った表示装置への表示による話者話速調整要請通知ALを行ってもよい。 In the first embodiment, the speaker speaking speed adjustment request notification AL by light or voice is performed. However, the speaker speaking speed adjustment request notification AL by vibration, temperature, scent, etc., the speaker speaking speed Va, etc. The speaker speech speed adjustment request notification AL may be performed by display on the display device that has displayed.
[第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。第2の実施の形態では、第1の実施の形態に同一または類似の装置および装置構成を用い、同一または類似のものについては第1の実施の形態で使用した符号を使用して重複説明を略し、第1の実施の形態とは異なる事項を中心に説明を行う。また、第1の実施の形態では、詳細な点につき、いくつかの変形例を示したが、変形例は、第2の実施の形態に適用してもよい。
[Second Embodiment]
Next, a second embodiment of the present invention will be described. In the second embodiment, the same or similar apparatus and apparatus configuration as those in the first embodiment are used, and the same or similar elements are redundantly described by using the reference numerals used in the first embodiment. For brevity, the description will focus on matters different from the first embodiment. In the first embodiment, some modified examples have been shown in detail, but the modified examples may be applied to the second embodiment.
図8は、第2の実施の形態に係る話者話速制御装置1Aを示す図である。図8(a)は、話者話速制御装置1Aが話者Aに使用され、話者話速制御装置1Aの聴者マイク101Bが聴者Bに使用されている様子を示す図である。図8(b)は、話者話速制御装置1Aの概略構成を示す機能ブロック図である。
FIG. 8 is a diagram showing a speaker speech
話者話速制御装置1Aは、第1の実施の形態と同様に、話者話速調整要請通知AL(例えば、音声、光、振動、温度、香りなどによる通知)を話者Aに向けて出力する装置である。
The speaker speaking
話者話速制御装置1Aは、話者Aが聴者Bと会話するときに使用されるものである。話者話速制御装置1Aの聴者マイク101Bは、例えば、聴者Bに向けて使用される。聴者マイク101Bは、話者話速制御装置1Aに内蔵してもよい。
The speaker speaking
話者話速制御装置1Aは、話者Aの発話による音圧を受けるマイクロフォンである話者マイク101Aと、聴者Bの発話による音圧を受けるマイクロフォンである聴者マイク101Bと、話者マイク101Aから話者Aの発話による音圧を示す音圧信号である話者音圧信号101ASを受信する話者音圧信号受信部102Aと、聴者マイク101Bから聴者Bの発話による音圧を示す音圧信号である聴者音圧信号101BSを受信する聴者音圧信号受信部102Bと、話者音圧信号受信部102Aから話者音圧信号101ASを基に出力される話者音圧計測信号102ASにより話者話速を算出する話者話速算出部103Aと、聴者音圧信号受信部102Bから聴者音圧信号101BSを基に出力される聴者音圧計測信号102BSにより聴者話速を算出する聴者話速算出部103Bと、各種のパラメータ(詳しくは後述する)が入力される入力部104と、聴者話速や話者話速やパラメータが記憶される記憶部105と、話者話速や聴者話速を計測した区間の開始時刻および終了時刻の計測に必要な現在時刻を出力する時刻出力部106と、話者話速と聴者話速に基づいて、話者話速の調整の要否を判定し、話者話速の調整が必要なら、話者話速調整要請通知ALが出力されるように制御を行う話者話速調整制御部107と、話者話速調整要請通知ALを出力する話者話速調整要請通知出力部108とを備える。
The speaker speaking
記憶部105は、図2と同様な聴者話速記憶部1051を有する。聴者話速記憶部1051には、計算により求められた聴者話速上限値Maxおよび聴者話速下限値Minが記憶される。
The
また、記憶部105は、図3と同様な話者話速データベース1052Aを有する。
Further, the
また、記憶部105は、聴者話速が記憶される聴者話速データベース1052Bを有する。
The
図9は、記憶部105に含まれる聴者話速データベース1052Bの構成の一例を示す図である。
FIG. 9 is a diagram illustrating an example of a configuration of a listener speech speed database 1052B included in the
聴者話速データベース1052Bは、聴者音圧計測信号102BSにおける複数の区間のそれぞれで聴者Bの聴者話速が計測されるので、その各聴者話速を記憶するものである。各聴者話速には、固有の聴者話速番号、ならびに、聴者話速での発話がなされる区間の開始時刻および終了時刻が対応づけて記憶される。 The listener's speech speed database 1052B stores the listener's speech speed since the listener's speech speed of the listener B is measured in each of a plurality of sections in the listener sound pressure measurement signal 102BS. Each listener speech speed is stored in association with a unique listener speech speed number and the start time and end time of a section in which speech is made at the listener speech speed.
また、記憶部105は、複数の聴者話速の加重平均である聴者話速Vbが記憶される聴者話速データベース1053Bを有する。
In addition, the
図10は、記憶部105に含まれる聴者話速データベース1053Bの構成の一例を示す図である。
FIG. 10 is a diagram illustrating an example of a configuration of a listener speech speed database 1053B included in the
聴者話速データベース1053Bは、複数の区間のそれぞれでの聴者話速Vbが計測されるので、その各聴者話速Vbを記憶するものである。各聴者話速Vbには、聴者話速Vbでの発話がなされる区間の開始時刻が対応づけて記憶される。
(話者話速制御装置1Aの動作方法)
話者話速制御装置1Aでは、図4のステップS1において、話者話速調整制御部107は、与えられた聴者話速上限値Maxおよび聴者話速下限値Minを聴者話速記憶部1051に記憶させるのでなく、聴者話速Vbに基づいて、聴者話速上限値Maxおよび聴者話速下限値Minを計算し、聴者話速記憶部1051に記憶させる。その他の動作は、図4のステップS1以外と同じであるから、説明を省略する。
The listener speaking speed database 1053B stores the listener speaking speed Vb since the listener speaking speed Vb in each of the plurality of sections is measured. Each listener speech speed Vb is stored in association with the start time of the section in which the speech is made at the listener speech speed Vb.
(Operation method of speaker speaking
In the speaker speaking
図11は、第2の実施の形態におけるステップS1の動作を示すフローチャートである。 FIG. 11 is a flowchart showing the operation of step S1 in the second embodiment.
まず、聴者Bが発話を開始すると、聴者マイク101Bは、発話による音圧を受け、音圧を示す聴者音圧信号101BSを出力する。聴者音圧信号受信部102Bは、聴者音圧信号101BSを受信し、聴者音圧信号101BSを基に聴者音圧計測信号102BSを出力する。聴者音圧計測信号102BSは、聴者音圧信号101BSから、記憶部105に予め記憶されたパラメータの1つである音圧閾値TH(例えば、40デシベル)以下の音圧を有する部分を除いた信号である。
First, when the listener B starts speaking, the
聴者話速算出部103Bは、聴者音圧計測信号102BSにより聴者Bの聴者話速を算出し、聴者話速データベース1052Bに記憶させる(S101)。
The listener speech
具体的に、聴者話速算出部103Bは、聴者音圧計測信号102BSにおいて、音圧がある区間を発話区間、音圧の無い区間を非発話区間として認識する。図5に示す話者音圧計測信号102ASを仮に聴者音圧計測信号102BSとすると、区間aは発話区間、区間bは非発話区間、区間cは発話区間である。
Specifically, in the listener sound pressure measurement signal 102BS, the listener speech
聴者話速算出部103Bは、聴者音圧計測信号102BSの各発話区間の波形に基づき、その発話区間での聴者話速を計測する。聴者話速算出部103Bは、ここでは、例えば、同一の発話区間で、1以上の聴者話速を計測する。聴者話速算出部103Bは、例えば、発話区間の全体で、1つの聴者話速を計測する。または、聴者話速算出部103Bは、発話区間を分割し、分割により生じた各区間で聴者話速を計測する。聴者話速算出部103Bは、例えば、区間c(30秒)を0.1秒ごとにつまり300分割し、300の聴者話速を計測する。
The listener's speech
聴者話速算出部103Bは、各聴者話速を、固有の聴者話速番号、ならびに聴者話速での発話がなされる区間(発話区間や分割により生じた区間)の開始時刻および終了時刻に対応づけて、聴者話速データベース1052Bに記憶させる(S101)。
The listener speech
図11において、次に、話者話速調整制御部107は、現在から、記憶部105に予め記憶されたパラメータの1つである時間の長さだけ遡った時点までの区間T(例えば「現在から1分前まで」)に含まれる区間の開始時刻および終了時刻を聴者話速データベース1052Bから読み出す。なお、区間Tの長さは、話者話速Vaを求めるときの区間Tの長さと同じであっても、異なっていてもよい。
In FIG. 11, next, the speaker speech speed
話者話速調整制御部107は、各区間の開始時刻および終了時刻の差分(つまり区間長)の合計を計算し、合計が、記憶部105に予め記憶されたパラメータの1つである時間の長さt(例えば「20秒」)より長いか否かを判定する。つまり、話者話速調整制御部107は、区間Tでの発話区間の合計が十分長いか否かを判定する。発話区間の合計が短い場合は、通常の発話がなされていない可能性が高いので、この場合は、聴者話速(後述の聴者話速Vb)を計測しないようにするのである。なお、長さtは、話者話速Vaを求めるときの長さtと同じであっても、異なっていてもよい。
The speaker speech speed
図9において、現在時刻を「2011年8月30日11時8分20秒」、区間Tを「現在から1分前まで」とすると、聴者話速番号「1」の区間は、区間Tに含まれず、聴者話速番号「2」、「3」の区間は、区間Tに含まれる。聴者話速番号「2」、「3」の区間の開始時刻および終了時刻の差分の合計は、「40秒」であり、長さtを「20秒」とすると、長さtより長い。 In FIG. 9, if the current time is “August 30, 2011 11: 8: 20” and the section T is “from the present to one minute before”, the section of the listener speech speed number “1” is the section T. The sections of the listener speech speed numbers “2” and “3” are included in the section T. The sum of the difference between the start time and end time of the sections of the listener speech speed numbers “2” and “3” is “40 seconds”, and is longer than the length t when the length t is “20 seconds”.
話者話速調整制御部107は、合計が長さtより長いなら、通常の発話がなされている可能性が高いので、聴者話速Vbを計測すべく、まず、区間Tに含まれる区間の聴者話速を聴者話速データベース1052Bから読み出す。そして、話者話速調整制御部107は、各聴者話速の加重平均である聴者話速Vbを計算する。
If the total is longer than the length t, the speaker speaking speed
図9において、聴者話速番号「2」の区間の長さは「30秒」、聴者話速は「1.5[語/秒]」であり、聴者話速番号「3」の区間の長さは「10秒」、聴者話速は「1.0[語/秒]」であり、区間の長さの合計は「40秒」である。話者話速調整制御部107は、この場合、聴者話速Vbを、以下の式(2)により計算する。
In FIG. 9, the length of the section of the listener speech speed number “2” is “30 seconds”, the listener speech speed is “1.5 [word / second]”, and the length of the section of the listener speech speed number “3” is The length is “10 seconds”, the listener speaking speed is “1.0 [word / second]”, and the total length of the section is “40 seconds”. In this case, the speaker speaking speed
Vb=(1.5×30+1.0×10)/40=1.375 (2)
つまり、この場合、聴者話速Vbは「1.375[語/秒]」である。
Vb = (1.5 × 30 + 1.0 × 10) /40=1.375 (2)
That is, in this case, the listener speech speed Vb is “1.375 [word / second]”.
話者話速調整制御部107は、聴者Bの各聴者話速Vbを、聴者話速Vbでの発話がなされる区間の開始時刻(上記例では、聴者話速番号「2」の区間の開始時刻)に対応づけて、聴者話速データベース1053Bに記憶させる(S102)。
The speaker speech speed
次に、話者話速調整制御部107は、記憶部105に予め記憶されたパラメータの1つである数以上の聴者話速Vbが聴者話速データベース1053Bにあるか否かを判定する(S103)。
Next, the speaker speaking speed
話者話速調整制御部107は、聴者話速Vbの数が、記憶部105に記憶された数未満なら(S103:NO)、制御をステップS101に戻す。
If the number of listener speaking speeds Vb is less than the number stored in the storage unit 105 (S103: NO), the speaker speaking speed
一方、話者話速調整制御部107は、聴者話速Vbの数が、記憶部105に記憶された数以上なら(S103:YES)、制御をステップS104に進める。
On the other hand, if the number of listener speech speeds Vb is equal to or greater than the number stored in the storage unit 105 (S103: YES), the speaker speech speed
話者話速調整制御部107は、聴者話速データベース1053Bから複数の聴者話速Vb(例えば、全ての聴者話速Vb)を読み出し、最大の聴者話速Vbを聴者話速上限値Maxとして、聴者話速記憶部1051に記憶させる(S104)。また、話者話速調整制御部107は、最小の聴者話速Vbを聴者話速下限値Minとして、聴者話速記憶部1051に記憶させる(S104)。
The speaker speaking speed
話者話速調整制御部107は、ステップS104により処理を終える。
The speaker speaking speed
したがって、第2の実施の形態に係る話者話速制御装置1Aによれば、聴者Bの発話による音圧を受けるマイクである聴者マイク101Bと、聴者マイク101Bから聴者Bの発話による音圧を示す音圧信号である聴者音圧信号101BSを受信する聴者音圧信号受信部102Bと、聴者音圧信号受信部102Bから聴者音圧信号101BSを基に出力される聴者音圧計測信号102BSにより聴者話速を算出する聴者話速算出部103Bとを備え、聴者話速記憶部1051には、算出された聴者話速が予め記憶されるので、実際の聴者Bの聴者話速に話者話速を対応させることができる。聴者Bにとっては自分の話速が最も聴きやすいので、話者話速を聴者Bの聴者話速つまり聴者Bにとって聴きやすい話者話速にすることができる。
Therefore, according to the speaker speaking
[第3の実施の形態]
次に、本発明の第3の実施の形態について説明する。第3の実施の形態では、第1、第2の実施の形態に同一または類似の装置および装置構成を用い、同一または類似のものについては第1、第2の実施の形態で使用した符号を使用して重複説明を略し、第1、第2の実施の形態とは異なる事項を中心に説明を行う。また、第1の実施の形態で示した変形例は、第3の実施の形態に適用してもよい。
[Third Embodiment]
Next, a third embodiment of the present invention will be described. In the third embodiment, the same or similar devices and device configurations are used in the first and second embodiments, and the same or similar reference numerals used in the first and second embodiments are used for the same or similar devices. The overlapping explanation will be omitted, and the explanation will focus on matters different from the first and second embodiments. Further, the modification shown in the first embodiment may be applied to the third embodiment.
図12は、第3の実施の形態に係る話者話速制御装置1Bを示す図である。図12(a)は、話者話速制御装置1Bが話者Aに使用され、話者話速制御装置1Bの聴者マイク101B、101C、101Dがそれぞれ聴者B、C、Dに使用されている様子を示す図である。図12(b)は、話者話速制御装置1Bの概略構成を示す機能ブロック図である。
FIG. 12 is a diagram illustrating a speaker speaking speed control apparatus 1B according to the third embodiment. In FIG. 12A, the speaker speaking speed control device 1B is used for the speaker A, and the
話者話速制御装置1Bは、第1の実施の形態と同様に、話者話速調整要請通知AL(例えば、音声、光、振動、温度、香りなどによる通知)を話者Aに向けて出力する装置である。 The speaker speaking speed control device 1B directs the speaker speaking speed adjustment request notification AL (for example, notification by voice, light, vibration, temperature, fragrance, etc.) to the speaker A, as in the first embodiment. It is a device that outputs.
話者話速制御装置1Bは、話者Aが複数の聴者、つまり、この場合の聴者B、C、Dと会話するときに使用されるものである。聴者マイク101B、101C、101Dは、例えば、聴者B、C、Dに向けて使用される。聴者マイク101B、101C、101Dは、話者話速制御装置1Bに内蔵してもよい。
The speaker speaking speed control device 1B is used when the speaker A has a conversation with a plurality of listeners, that is, the listeners B, C, and D in this case. The
聴者B、C、Dの中で、聴者自身にとって聴きやすい発話の速度が最も遅いのは、例えば、聴者Dである。聴者Dは、例えば、3者の中での最高齢者である。話者話速制御装置1Bは、話者Aの話者話速を、このような聴者Dにとって聴きやすい話者話速にするための構成を有している。 Among the listeners B, C, and D, for example, the listener D has the slowest utterance speed that is easy for the listener to hear. The listener D is, for example, the oldest person among the three. The speaker speaking speed control device 1B has a configuration for setting the speaker speaking speed of the speaker A to a speaker speaking speed that is easy for the listener D to hear.
話者話速制御装置1Bは、話者Aの発話による音圧を受けるマイクロフォンである話者マイク101Aと、聴者Bの発話による音圧を受けるマイクロフォンである聴者マイク101Bと、聴者Cの発話による音圧を受けるマイクロフォンである聴者マイク101Cと、聴者Dの発話による音圧を受けるマイクロフォンである聴者マイク101Dと、話者マイク101Aから話者Aの発話による音圧を示す音圧信号である話者音圧信号101ASを受信する話者音圧信号受信部102Aと、聴者マイク101Bから聴者Bの発話による音圧を示す音圧信号である聴者音圧信号101BSを受信する聴者音圧信号受信部102Bと、聴者マイク101Cから聴者Cの発話による音圧を示す音圧信号である聴者音圧信号101CSを受信する聴者音圧信号受信部102Cと、聴者マイク101Dから聴者Dの発話による音圧を示す音圧信号である聴者音圧信号101DSを受信する聴者音圧信号受信部102Dと、話者音圧信号受信部102Aから話者音圧信号101ASを基に出力される話者音圧計測信号102ASにより話者話速を算出する話者話速算出部103Aと、聴者音圧信号受信部102Bから聴者音圧信号101BSを基に出力される聴者音圧計測信号102BSにより聴者話速を算出する聴者話速算出部103Bと、聴者音圧信号受信部102Cから聴者音圧信号101CSを基に出力される聴者音圧計測信号102CSにより聴者話速を算出する聴者話速算出部103Cと、聴者音圧信号受信部102Dから聴者音圧信号101DSを基に出力される聴者音圧計測信号102DSにより聴者話速を算出する聴者話速算出部103Dと、各種のパラメータ(詳しくは後述する)が入力される入力部104と、聴者話速や話者話速やパラメータが記憶される記憶部105と、話者話速や聴者話速を計測した区間の開始時刻および終了時刻の計測に必要な現在時刻を出力する時刻出力部106と、話者話速と聴者話速に基づいて、話者話速の調整の要否を判定し、話者話速の調整が必要なら、話者話速調整要請通知ALが出力されるように制御を行う話者話速調整制御部107と、話者話速調整要請通知ALを出力する話者話速調整要請通知出力部108とを備える。
The speaker speaking speed control device 1B is based on a
記憶部105は、図2と同様な聴者話速記憶部1051を有する。聴者話速記憶部1051には、計算により求められた聴者話速上限値Maxおよび聴者話速下限値Minが記憶される。
The
また、記憶部105は、図3と同様な話者話速データベース1052Aを有する。
Further, the
また、記憶部105は、図9の聴者話速データベース1052Bの他に、同様な聴者C用の聴者話速データベース1052C、聴者D用の聴者話速データベース1052Dを有する。
In addition to the listener speech speed database 1052B of FIG. 9, the
また、記憶部105は、図10の聴者話速データベース1053Bに代えて、聴者話速データベース1054Bを有する。
Further, the
図13は、記憶部105に含まれる聴者話速データベース1054Bの構成の一例を示す図である。
FIG. 13 is a diagram showing an example of the configuration of the listener speech speed database 1054B included in the
聴者話速データベース1054Bは、各聴者B、C、Dにつき、複数の区間のそれぞれでの聴者話速Vbが計測されるので、その各聴者話速Vbを記憶するものである。各聴者話速Vbには、聴者話速Vbでの発話がなされる区間の開始時刻、聴者話速Vbでの発話の音圧を受けたマイクを示す識別情報が対応づけて記憶される。聴者話速データベース1054Bは、例えば、現在から10分前までの期間に含まれる開始時刻に対応づけられた聴者話速Vbのみを記憶し、それより開始時刻に対応づけられた聴者話速Vbつまり古い聴者話速Vbは自動的に消去されるようになっている。
(話者話速制御装置1Bの動作方法)
話者話速制御装置1Bでは、図4のステップS1において、話者話速調整制御部107が、与えられた聴者話速上限値Maxおよび聴者話速下限値Minを聴者話速記憶部1051に記憶させるのでなく、聴者B、C、Dの聴者話速Vbに基づいて、聴者話速上限値Maxおよび聴者話速下限値Minを計算し、聴者話速記憶部1051に記憶させる。その他の動作は、図4のステップS1以外と同じであるから、説明を省略する。
The listener speech speed database 1054B stores, for each of the listeners B, C, and D, the listener speech speed Vb in each of a plurality of sections, and thus stores each listener speech speed Vb. Each listener's speaking speed Vb is stored in association with identification information indicating the start time of the section in which speech is made at the listener's speaking speed Vb and the microphone that has received the sound pressure of the speech at the listener's speaking speed Vb. The listener speech speed database 1054B stores, for example, only the listener speech speed Vb associated with the start time included in the period from the present to 10 minutes ago, and the listener speech speed Vb associated with the start time from that, that is, The old listener speaking speed Vb is automatically erased.
(Operation method of speaker speaking speed control device 1B)
In the speaker speaking speed control apparatus 1B, in step S1 of FIG. 4, the speaker speaking speed
図14は、第3の実施の形態におけるステップS1の動作を示すフローチャートである。 FIG. 14 is a flowchart showing the operation of step S1 in the third embodiment.
まず、聴者話速算出部103Bは、第2の実施の形態と同様に、聴者音圧計測信号102BSにより聴者話速を算出し、固有の聴者話速番号、ならびに聴者話速での発話がなされる区間の開始時刻および終了時刻に対応づけて、聴者話速データベース1052Bに記憶させる(S101)。
First, similarly to the second embodiment, the listener speech
次に、話者話速調整制御部107は、第2の実施の形態と同様に、聴者Bについての聴者話速Vbを計算し、聴者話速Vbでの発話がなされる区間の開始時刻、聴者話速Vbでの発話の音圧を受けた聴者マイク101Bを示す識別情報に対応づけて、聴者話速データベース1054Bに記憶させる(S102)。なお、聴者話速Vbの計算に用いるパラメータである区間Tの長さおよび長さtは、話者話速Vaや他の聴者についての聴者話速Vbを求めるときのものと同じであっても、異なっていてもよい。聴者C、Dについても同様である。
Next, as in the second embodiment, the speaker speaking speed
次に、聴者話速算出部103Cは、聴者話速算出部103Bの方法と同様に、聴者音圧計測信号102CSにより聴者Cの聴者話速を算出し、固有の聴者話速番号、ならびに聴者話速での発話がなされる区間の開始時刻および終了時刻に対応づけて、聴者話速データベース1052Cに記憶させる(S111)。
Next, similarly to the method of the listener
次に、話者話速調整制御部107は、第2の実施の形態の方法と同様に、聴者Cについての聴者話速Vbを計算し、聴者話速Vbでの発話がなされる区間の開始時刻、聴者話速Vbでの発話の音圧を受けた聴者マイク101Cを示す識別情報に対応づけて、聴者話速データベース1054Bに記憶させる(S112)。
Next, as in the method of the second embodiment, the speaker speaking speed
次に、聴者話速算出部103Dは、聴者話速算出部103B、Cの方法と同様に、聴者音圧計測信号102DSにより聴者Dの聴者話速を算出し、固有の聴者話速番号、ならびに聴者話速での発話がなされる区間の開始時刻および終了時刻に対応づけて、聴者話速データベース1052Dに記憶させる(S113)。
Next, similarly to the methods of the listener
次に、話者話速調整制御部107は、第2の実施の形態の方法と同様に、聴者Dの聴者話速Vbを計算し、聴者話速Vbでの発話がなされる区間の開始時刻、聴者話速Vbでの発話の音圧を受けた聴者マイク101Dを示す識別情報に対応づけて、聴者話速データベース1054Bに記憶させる(S114)。
Next, as in the method of the second embodiment, the speaker speaking speed
次に、話者話速調整制御部107は、各聴者マイク101B、101C、101Dにつき、その識別情報に対応づけられた聴者話速Vbが記憶部105に予め記憶されたパラメータの1つである数(例えば、2個)以上、聴者話速データベース1054Bにあるか否かを判定する(S115)。
Next, the speaker speech speed
話者話速調整制御部107は、いずれかの識別情報に対応づけられた聴者話速Vbの数が、記憶部105に記憶された数未満(例えば、1個しかない)なら(S115:NO)、制御をステップS101に戻す。 If the number of listener speech speeds Vb associated with any identification information is less than the number stored in the storage unit 105 (for example, only one), the speaker speech speed adjustment control unit 107 (S115: NO) ), The control is returned to step S101.
一方、話者話速調整制御部107は、いずれの識別情報に対応づけられた聴者話速Vbについても、その聴者話速Vbの数が、記憶部105に記憶された数以上(例えば、いずれも2個以上ある)なら(S115:YES)、制御をステップS116に進める。
On the other hand, the speaker speech speed
話者話速調整制御部107は、ステップS116では、聴者話速データベース1053Bから複数の聴者話速Vb(例えば、全ての聴者話速Vb)を読み出す。
In step S116, the speaker speaking speed
また、話者話速調整制御部107は、聴者マイク101Bの識別情報に対応づけられた最大の聴者話速Vb(以下、聴者話速Vbbmax)を求める。また、話者話速調整制御部107は、聴者マイク101Bの識別情報に対応づけられた最小の聴者話速Vb(以下、聴者話速Vbbmin)を求める。また、話者話速調整制御部107は、聴者マイク101Bの識別情報に対応づけられた聴者話速Vbの平均(以下、聴者話速Vbbavg)を求める。
Further, the speaker speaking speed
また、話者話速調整制御部107は、聴者マイク101Cの識別情報に対応づけられた最大の聴者話速Vb(以下、聴者話速Vbcmax)を求める。また、話者話速調整制御部107は、聴者マイク101Cの識別情報に対応づけられた最小の聴者話速Vb(以下、聴者話速Vbcmin)を求める。また、話者話速調整制御部107は、聴者マイク101Cの識別情報に対応づけられた聴者話速Vbの平均(以下、聴者話速Vbcavg)を求める。
Further, the speaker speaking speed
また、話者話速調整制御部107は、聴者マイク101Dの識別情報に対応づけられた最大の聴者話速Vb(以下、聴者話速Vbdmax)を求める。また、話者話速調整制御部107は、聴者マイク101Dの識別情報に対応づけられた最小の聴者話速Vb(以下、聴者話速Vbdmin)を求める。また、話者話速調整制御部107は、聴者マイク101Dの識別情報に対応づけられた聴者話速Vbの平均(以下、聴者話速Vbdavg)を求める。
Further, the speaker speaking speed
話者話速調整制御部107は、聴者話速Vbbavg、Vbcavg、Vbdavgの中の最小値を選択する。
The speaker speaking speed
話者話速調整制御部107は、聴者話速Vbbavgを選択した場合は、聴者話速Vbbmaxを聴者話速上限値Maxとして、聴者話速記憶部1051に記憶させる(S116)。また、話者話速調整制御部107は、聴者話速Vbbminを聴者話速下限値Minとして、聴者話速記憶部1051に記憶させる(S116)。
If the speaker speaking speed Vbbvg is selected, the speaker speaking speed
一方、話者話速調整制御部107は、聴者話速Vbcavgを選択した場合は、聴者話速Vbcmaxを聴者話速上限値Maxとして、聴者話速記憶部1051に記憶させる(S116)。また、話者話速調整制御部107は、聴者話速Vbcminを聴者話速下限値Minとして、聴者話速記憶部1051に記憶させる(S116)。
On the other hand, when the listener speech speed Vbcavg is selected, the speaker speech speed
一方、話者話速調整制御部107は、聴者話速Vbdavgを選択した場合は、聴者話速Vbdmaxを聴者話速上限値Maxとして、聴者話速記憶部1051に記憶させる(S116)。また、話者話速調整制御部107は、聴者話速Vbdminを聴者話速下限値Minとして、聴者話速記憶部1051に記憶させる(S116)。
On the other hand, when the speaker speaking speed Vbdavg is selected, the speaker speaking speed
話者話速調整制御部107は、ステップS116により処理を終える。
The speaker speaking speed
図15は、ステップS116の動作を説明するための図である。 FIG. 15 is a diagram for explaining the operation of step S116.
図14によれば、聴者話速Vbbavg、Vbcavg、Vbdavgの中の最小値は、聴者話速Vbdavgであるから、聴者話速Vbdmaxが聴者話速上限値Maxとされ、聴者話速Vbdminが聴者話速下限値Minとされる。 According to FIG. 14, since the minimum value among the listener speaking speeds Vbbavg, Vbcavg, and Vbdavg is the listener speaking speed Vbdavg, the listener speaking speed Vbdmax is set to the listener speaking speed upper limit Max, and the listener speaking speed Vbdmin is set to the listener speaking speed. The speed lower limit value Min is set.
なお、ステップS116では、聴者話速Vbbmax、Vbcmax、Vbdmaxの中の最大値を聴者話速上限値Maxとし、聴者話速Vbbmin、Vbcmin、Vbdminの中の最小値を聴者話速下限値Minとしてもよい。 In step S116, the maximum value among the listener speaking speeds Vbbmax, Vbcmax and Vbdmax is set as the listener speaking speed upper limit value Max, and the minimum value among the listener speaking speeds Vbbmin, Vbcmin and Vbdmin is set as the listener speaking speed lower limit value Min. Good.
図14によれば、聴者話速Vbbmax、Vbcmax、Vbdmaxの中の最大値は聴者話速Vbbmaxであり、聴者話速Vbbmin、Vbcmin、Vbdminの中の最小値は聴者話速Vbdminであるので、聴者話速Vbbmaxが聴者話速上限値Maxとされ、聴者話速Vbdminが聴者話速下限値Minとされる。 According to FIG. 14, the maximum value among the listener speaking speeds Vbbmax, Vbcmax, Vbdmax is the listener speaking speed Vbbmax, and the minimum value among the listener speaking speeds Vbbmin, Vbcmin, Vbbmin is the listener speaking speed Vbbmin. The speaking speed Vbbmax is set as the listener speaking speed upper limit value Max, and the listener speaking speed Vbdmin is set as the listener speaking speed lower limit value Min.
なお、ステップS116では、上記2つの方法以外の方法で聴者話速上限値Maxおよび聴者話速下限値Minを設定してもよい。 In step S116, the listener's speaking speed upper limit value Max and the listener's speaking speed lower limit value Min may be set by a method other than the above two methods.
したがって、第3の実施の形態に係る話者話速制御装置1Bによれば、聴者マイク101B、101C、101D、聴者音圧信号受信部102B、102C、102Dおよび聴者話速算出部103B、103C、103Dを備え、つまり、聴者マイク、聴者音圧信号受信部および聴者話速算出部を、複数の聴者B、C、Dごとに備え、聴者話速記憶部1051は、最も小さい聴者話速(図14では、聴者話速Vbbmaxおよび聴者話速Vbdmin)を予め記憶するものであるので、最も遅い聴者話速で会話する聴者(図14の例では、聴者D)の聴者話速に話者話速を対応させることができる。聴者Dにとっては自分の話速が最も聴きやすく、他の聴者B、Cにとっても、自分の話速より遅い話速なら聴きにくいことはない。つまり、話者話速を聴者Dの聴者話速つまり聴者Dにとって聴きやすい話者話速にすることができ、かつ、話者話速が聴者B、Cにとって聴きにくくなるのを防止することができる。
Therefore, according to the speaker speaking speed control device 1B according to the third embodiment, the
なお、各実施の形態では、話者話速調整要請通知ALを出力する話者話速調整要請通知出力部108を設けたが、話者話速調整要請通知出力部108に代えて、話者話速の調整が不要である旨の話者話速調整不要通知を話者に向けて出力する話者話速調整不要通知出力部(図示せず)を設け、話者話速調整制御部107は、話者話速の調整が不要なら、話者話速調整不要通知が出力されるように、話者話速調整不要通知出力部を制御することとしてもよい。
In each embodiment, the speaker speaking speed adjustment request
話者話速調整不要通知は、話者話速調整要請通知と同様に、音声、光、振動、温度、香りなどによる通知である。 The speaker speaking speed adjustment unnecessary notification is a notification by voice, light, vibration, temperature, fragrance or the like, similarly to the speaker speaking speed adjustment request notification.
話者話速の調整が不要である場合とは、例えば、話者話速が聴者話速上限値Max以下、且つ、聴者話速下限値Min以上である場合である。また、話者話速を、例えば、最も遅い聴者話速で会話する聴者の聴者話速より遅くしたい場合は、そのような場合に、話者話速調整不要通知を出力させればよい。 The case where the speaker speaking speed adjustment is not necessary is, for example, a case where the speaker speaking speed is equal to or lower than the listener speaking speed upper limit Max and equal to or higher than the listener speaking speed lower limit Min. In addition, when it is desired to make the speaker speaking speed slower than the listener speaking speed of the listener who is speaking at the slowest listener speaking speed, for example, a speaker speaking speed adjustment unnecessary notification may be output.
また、各実施の形態に係る話者話速制御装置としてコンピュータを機能させるためのコンピュータプログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に記録でき、また、インターネットなどの通信網を介して伝送させて、広く流通させることができる。 A computer program for causing a computer to function as the speaker speaking speed control device according to each embodiment can be recorded on a computer-readable recording medium such as a semiconductor memory, a magnetic disk, an optical disk, a magneto-optical disk, or a magnetic tape. Further, it can be widely distributed by being transmitted through a communication network such as the Internet.
1、1A、1B 話者話速制御装置
101A 話者マイク
101AS 話者音圧信号
101B、101C、101D 聴者マイク
101BS、101CS、101DS 聴者音圧信号
102A 話者音圧信号受信部
102AS 話者音圧計測信号
102B、102C、102D 聴者音圧信号受信部
102BS、102CS、102DS 聴者音圧計測信号
103A 話者話速算出部
103B、103C、103D 聴者話速算出部
104 入力部
105 記憶部
106 時刻出力部
107 話者話速調整制御部
108 話者話速調整要請通知出力部
1051 聴者話速記憶部
1052A 話者話速データベース
1052B、1052C、1052D、1053B、1054B 聴者話速データベース
Max 聴者話速上限値
Min 聴者話速下限値
TH 音圧閾値
Va 話者話速
Vb 聴者話速
1, 1A, 1B Speaker speaking
Claims (10)
前記話者の発話の速度である話者話速が記憶される話者話速データベースと、
前記話者話速の調整を要請する旨の話者話速調整要請通知を前記話者に向けて出力する話者話速調整要請通知出力部と、
前記話者の発話による音圧を受けるマイクである話者マイクと、
前記話者マイクから前記話者の発話による音圧を示す音圧信号である話者音圧信号を受信する話者音圧信号受信部と、
前記話者音圧信号受信部から前記話者音圧信号を基に出力される話者音圧計測信号により前記話者話速を算出し、前記話者話速を前記話者話速データベースに記憶させる話者話速算出部と、
前記話者話速データベースから1つの話者話速または2以上の話者話速を読み出し、前記聴者話速記憶部から聴者話速を読み出し、前記1つの話者話速または前記2以上の話者話速に基づいて計算した話者話速と前記読み出した聴者話速とに基づいて、前記話者話速の調整の要否を判定し、前記話者話速の調整が必要なら、前記話者話速調整要請通知が出力されるように前記話者話速調整要請通知出力部を制御する話者話速調整制御部と
を備えることを特徴とする話者話速制御装置。 A listener speech speed storage unit in which a listener's speech speed, which is a speech speed that is easy for a listener to listen to the speaker's speech, is stored in advance;
A speaker speaking speed database in which a speaker speaking speed, which is a speaking speed of the speaker, is stored;
A speaker speaking speed adjustment request notification output unit that outputs a speaker speaking speed adjustment request notification requesting the speaker speaking speed adjustment to the speaker;
A speaker microphone that is a microphone that receives sound pressure from the speaker's utterance;
A speaker sound pressure signal receiving unit that receives a speaker sound pressure signal that is a sound pressure signal indicating a sound pressure generated by the speaker's utterance from the speaker microphone;
The speaker speech speed is calculated from a speaker sound pressure measurement signal output based on the speaker sound pressure signal from the speaker sound pressure signal receiving unit, and the speaker speech speed is stored in the speaker speech speed database. A speaker speaking speed calculation unit to be stored;
One speaker speaking speed or two or more speaker speaking speeds are read from the speaker speaking speed database, a listener speaking speed is read from the listener speaking speed storage unit, and the one speaker speaking speed or the two or more speaking speeds are read. Determining whether or not the speaker speaking speed needs to be adjusted based on the speaker speaking speed calculated based on the speaker speaking speed and the read listener speaking speed, and if the speaker speaking speed needs to be adjusted, A speaker speech speed control device comprising: a speaker speech speed adjustment control unit that controls the speaker speech speed adjustment request notification output unit so that a speaker speech speed adjustment request notification is output.
前記話者の発話の速度である話者話速が記憶される話者話速データベースと、
前記話者話速の調整が不要である旨の話者話速調整不要通知を前記話者に向けて出力する話者話速調整不要通知出力部と、
前記話者の発話による音圧を受けるマイクである話者マイクと、
前記話者マイクから前記話者の発話による音圧を示す音圧信号である話者音圧信号を受信する話者音圧信号受信部と、
前記話者音圧信号受信部から前記話者音圧信号を基に出力される話者音圧計測信号により前記話者話速を算出し、前記話者話速を前記話者話速データベースに記憶させる話者話速算出部と、
前記話者話速データベースから1つの話者話速または2以上の話者話速を読み出し、前記聴者話速記憶部から聴者話速を読み出し、前記1つの話者話速または前記2以上の話者話速に基づいて計算した話者話速と前記読み出した聴者話速とに基づいて、前記話者話速の調整の要否を判定し、前記話者話速の調整が不要なら、前記話者話速調整不要通知が出力されるように前記話者話速調整不要通知出力部を制御する話者話速調整制御部と
を備えることを特徴とする話者話速制御装置。 A listener speech speed storage unit in which a listener's speech speed, which is a speech speed that is easy for a listener to listen to the speaker's speech, is stored in advance;
A speaker speaking speed database in which a speaker speaking speed, which is a speaking speed of the speaker, is stored;
A speaker speaking speed adjustment unnecessary notification output unit that outputs a speaker speaking speed adjustment unnecessary notification to the speaker that the speaker speaking speed adjustment is unnecessary;
A speaker microphone that is a microphone that receives sound pressure from the speaker's utterance;
A speaker sound pressure signal receiving unit that receives a speaker sound pressure signal that is a sound pressure signal indicating a sound pressure generated by the speaker's utterance from the speaker microphone;
The speaker speech speed is calculated from a speaker sound pressure measurement signal output based on the speaker sound pressure signal from the speaker sound pressure signal receiving unit, and the speaker speech speed is stored in the speaker speech speed database. A speaker speaking speed calculation unit to be stored;
One speaker speaking speed or two or more speaker speaking speeds are read from the speaker speaking speed database, a listener speaking speed is read from the listener speaking speed storage unit, and the one speaker speaking speed or the two or more speaking speeds are read. Based on the speaker speaking speed calculated based on the speaker speaking speed and the read listener speaking speed, it is determined whether or not the speaker speaking speed needs to be adjusted. A speaker speech speed control apparatus comprising: a speaker speech speed adjustment control unit that controls the speaker speech speed adjustment unnecessary notification output unit so that a speaker speech speed adjustment unnecessary notification is output.
前記聴者マイクから前記聴者の発話による音圧を示す音圧信号である聴者音圧信号を受信する聴者音圧信号受信部と、
前記聴者音圧信号受信部から前記聴者音圧信号を基に出力される聴者音圧計測信号により聴者話速を算出する聴者話速算出部とを備え、
前記聴者話速記憶部は、前記算出された聴者話速を予め記憶するものである
ことを特徴とする請求項1ないし3のいずれかに記載の話者話速制御装置。 A listener microphone that is a microphone that receives sound pressure generated by the listener's speech;
A listener sound pressure signal receiving unit for receiving a listener sound pressure signal which is a sound pressure signal indicating a sound pressure due to the utterance of the listener from the listener microphone;
A listener speech speed calculation unit that calculates a listener speech speed based on a listener sound pressure measurement signal output based on the listener sound pressure signal from the listener sound pressure signal receiver;
The speaker speech speed control device according to any one of claims 1 to 3, wherein the listener speech speed storage unit stores the calculated listener speech speed in advance.
前記聴者話速記憶部は、前記複数の聴者話速の中で最も小さい聴者話速を予め記憶するものである
ことを特徴とする請求項4記載の話者話速制御装置。 The listener microphone, the listener sound pressure signal receiver and the listener speech speed calculator are provided for each of a plurality of listeners,
The speaker speaking speed control device according to claim 4, wherein the listener speaking speed storage unit stores in advance a speaker speaking speed that is the lowest among the plurality of listener speaking speeds.
前記話者話速調整制御部は、
前記話者話速が前記第1の聴者話速より大きい、または、前記話者話速が前記第2の聴者話速より小さいなら、前記話者話速調整要請通知が出力され、かつ、前記話者話速が前記第1の聴者話速より大きい場合の話者話速調整要請通知と前記話者話速が前記第2の聴者話速より小さい場合の話者話速調整要請通知とが互いに前記話者にとって区別できるものとなるように、前記話者話速調整要請通知出力部を制御する
ことを特徴とする請求項1記載の話者話速制御装置。 The listener speech speed storage unit stores in advance a first listener speech speed that is an upper limit value of an utterance speed that is easy for the listener to listen and a second listener speech speed that is a lower limit value,
The speaker speaking speed adjustment control unit
If the speaker speaking speed is greater than the first listener speaking speed, or the speaker speaking speed is less than the second listener speaking speed, the speaker speaking speed adjustment request notification is output, and A speaker speaking speed adjustment request notification when the speaker speaking speed is larger than the first listener speaking speed and a speaker speaking speed adjustment request notification when the speaker speaking speed is smaller than the second listener speaking speed. The speaker speech speed control apparatus according to claim 1, wherein the speaker speech speed adjustment request notification output unit is controlled so that the speakers can be distinguished from each other.
前記話者話速調整制御部は、
前記話者話速が前記第1の聴者話速より大きいなら、前記話者話速と前記第1の聴者話速の差分が大きいほど前記話者話速調整要請通知での要請の程度が高くなるように前記話者話速調整要請通知出力部を制御し、一方、前記話者話速が前記第2の聴者話速より小さいなら、前記話者話速と前記第2の聴者話速の差分が大きいほど前記話者話速調整要請通知での要請の程度が高くなるように前記話者話速調整要請通知出力部を制御する
ことを特徴とする請求項1記載の話者話速制御装置。 The listener speech speed storage unit stores in advance a first listener speech speed that is an upper limit value of an utterance speed that is easy for the listener to listen and a second listener speech speed that is a lower limit value,
The speaker speaking speed adjustment control unit
If the speaker speaking speed is greater than the first listener speaking speed, the greater the difference between the speaker speaking speed and the first listener speaking speed, the higher the degree of request in the speaker speaking speed adjustment request notification. The speaker speaking speed adjustment request notification output unit is controlled so that if the speaker speaking speed is lower than the second listener speaking speed, the speaker speaking speed and the second listener speaking speed The speaker speech speed control according to claim 1, wherein the speaker speech speed adjustment request notification output unit is controlled so that the degree of the request in the speaker speech speed adjustment request notification increases as the difference increases. apparatus.
前記話者話速制御装置は、
話者の発話を聴く聴者にとって聴きやすい発話の速度である聴者話速が予め記憶される聴者話速記憶部と、
前記話者の発話の速度である話者話速が記憶される話者話速データベースと、
前記話者話速の調整を要請する旨の話者話速調整要請通知を前記話者に向けて出力する話者話速調整要請通知出力部と、
前記話者の発話による音圧を受けるマイクである話者マイクと、
前記話者マイクから前記話者の発話による音圧を示す音圧信号である話者音圧信号を受信する話者音圧信号受信部とを備え、
前記動作方法は、
前記話者話速制御装置の話者話速算出部が、前記話者音圧信号受信部から前記話者音圧信号を基に出力される話者音圧計測信号により前記話者話速を算出し、前記話者話速を前記話者話速データベースに記憶させ、
前記話者話速制御装置の話者話速調整制御部が、前記話者話速データベースから1つの話者話速または2以上の話者話速を読み出し、前記聴者話速記憶部から聴者話速を読み出し、前記1つの話者話速または前記2以上の話者話速に基づいて計算した話者話速と前記読み出した聴者話速とに基づいて、前記話者話速の調整の要否を判定し、前記話者話速の調整が必要なら、前記話者話速調整要請通知が出力されるように前記話者話速調整要請通知出力部を制御する
ことを特徴とする話者話速制御装置の動作方法。 An operation method of a speaker speaking speed control device for outputting a speaker speaking speed adjustment request notification for requesting adjustment of speaker speaking speed to a speaker,
The speaker speaking speed control device comprises:
A listener speech speed storage unit in which a listener's speech speed, which is a speech speed that is easy for a listener to listen to the speaker's speech, is stored in advance;
A speaker speaking speed database in which a speaker speaking speed, which is a speaking speed of the speaker, is stored;
A speaker speaking speed adjustment request notification output unit that outputs a speaker speaking speed adjustment request notification requesting the speaker speaking speed adjustment to the speaker;
A speaker microphone that is a microphone that receives sound pressure from the speaker's utterance;
A speaker sound pressure signal receiving unit for receiving a speaker sound pressure signal that is a sound pressure signal indicating a sound pressure due to the speaker's utterance from the speaker microphone;
The operation method is as follows:
The speaker speaking speed calculation unit of the speaker speaking speed control device determines the speaker speaking speed based on a speaker sound pressure measurement signal output from the speaker sound pressure signal receiving unit based on the speaker sound pressure signal. Calculating and storing the speaker speaking speed in the speaker speaking speed database;
The speaker speaking speed adjustment control unit of the speaker speaking speed control device reads one speaker speaking speed or two or more speaker speaking speeds from the speaker speaking speed database, and listens to the speaker's speaking speed from the listener speaking speed storage unit. The speed of the speaker is adjusted based on the speaker speaking speed calculated based on the one speaker speaking speed or the two or more speaker speaking speeds and the read listener speaking speed. If the speaker speaking speed needs to be adjusted, the speaker speaking speed adjustment request notification output unit is controlled so that the speaker speaking speed adjustment request notification is output. Operation method of speech speed control device.
前記話者話速制御装置は、
話者の発話を聴く聴者にとって聴きやすい発話の速度である聴者話速が予め記憶される聴者話速記憶部と、
前記話者の発話の速度である話者話速が記憶される話者話速データベースと、
前記話者話速の調整が不要である旨の話者話速調整不要通知を前記話者に向けて出力する話者話速調整不要通知出力部と、
前記話者の発話による音圧を受けるマイクである話者マイクと、
前記話者マイクから前記話者の発話による音圧を示す音圧信号である話者音圧信号を受信する話者音圧信号受信部とを備え、
前記動作方法は、
前記話者話速制御装置の話者話速算出部が、前記話者音圧信号受信部から前記話者音圧信号を基に出力される話者音圧計測信号により前記話者話速を算出し、前記話者話速を前記話者話速データベースに記憶させ、
前記話者話速制御装置の話者話速調整制御部が、前記話者話速データベースから1つの話者話速または2以上の話者話速を読み出し、前記聴者話速記憶部から聴者話速を読み出し、前記1つの話者話速または前記2以上の話者話速に基づいて計算した話者話速と前記読み出した聴者話速とに基づいて、前記話者話速の調整の要否を判定し、前記話者話速の調整が不要なら、前記話者話速調整不要通知が出力されるように前記話者話速調整不要通知出力部を制御する
ことを特徴とする話者話速制御装置の動作方法。 An operation method of the speaker speaking speed control device for outputting a speaker speaking speed adjustment unnecessary notification to the speaker that the speaker speaking speed adjustment is unnecessary,
The speaker speaking speed control device comprises:
A listener speech speed storage unit in which a listener's speech speed, which is a speech speed that is easy for a listener to listen to the speaker's speech, is stored in advance;
A speaker speaking speed database in which a speaker speaking speed, which is a speaking speed of the speaker, is stored;
A speaker speaking speed adjustment unnecessary notification output unit that outputs a speaker speaking speed adjustment unnecessary notification to the speaker that the speaker speaking speed adjustment is unnecessary;
A speaker microphone that is a microphone that receives sound pressure from the speaker's utterance;
A speaker sound pressure signal receiving unit for receiving a speaker sound pressure signal that is a sound pressure signal indicating a sound pressure due to the speaker's utterance from the speaker microphone;
The operation method is as follows:
The speaker speaking speed calculation unit of the speaker speaking speed control device determines the speaker speaking speed based on a speaker sound pressure measurement signal output from the speaker sound pressure signal receiving unit based on the speaker sound pressure signal. Calculating and storing the speaker speaking speed in the speaker speaking speed database;
The speaker speaking speed adjustment control unit of the speaker speaking speed control device reads one speaker speaking speed or two or more speaker speaking speeds from the speaker speaking speed database, and listens to the speaker's speaking speed from the listener speaking speed storage unit. The speed of the speaker is adjusted based on the speaker speaking speed calculated based on the one speaker speaking speed or the two or more speaker speaking speeds and the read listener speaking speed. If the speaker speech speed adjustment is unnecessary, the speaker speech speed adjustment unnecessary notification output unit is controlled so that the speaker speech speed adjustment unnecessary notification is output. Operation method of speech speed control device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011261432A JP2013114118A (en) | 2011-11-30 | 2011-11-30 | Speaker speaking rate control device and operation method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011261432A JP2013114118A (en) | 2011-11-30 | 2011-11-30 | Speaker speaking rate control device and operation method thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013114118A true JP2013114118A (en) | 2013-06-10 |
Family
ID=48709687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011261432A Pending JP2013114118A (en) | 2011-11-30 | 2011-11-30 | Speaker speaking rate control device and operation method thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013114118A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108630224A (en) * | 2018-03-22 | 2018-10-09 | 北京云知声信息技术有限公司 | Control the method and device of word speed |
JP2020024556A (en) * | 2018-08-07 | 2020-02-13 | 富士ゼロックス株式会社 | Information processing system, terminal device, information processing device and program |
WO2020085323A1 (en) * | 2018-10-22 | 2020-04-30 | ヤマハ株式会社 | Speech processing method, speech processing device, and speech processing program |
-
2011
- 2011-11-30 JP JP2011261432A patent/JP2013114118A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108630224A (en) * | 2018-03-22 | 2018-10-09 | 北京云知声信息技术有限公司 | Control the method and device of word speed |
CN108630224B (en) * | 2018-03-22 | 2020-06-09 | 云知声智能科技股份有限公司 | Method and device for controlling speech rate |
JP2020024556A (en) * | 2018-08-07 | 2020-02-13 | 富士ゼロックス株式会社 | Information processing system, terminal device, information processing device and program |
WO2020085323A1 (en) * | 2018-10-22 | 2020-04-30 | ヤマハ株式会社 | Speech processing method, speech processing device, and speech processing program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6171617B2 (en) | Response target speech determination apparatus, response target speech determination method, and response target speech determination program | |
US20150281853A1 (en) | Systems and methods for enhancing targeted audibility | |
US11948561B2 (en) | Automatic speech recognition imposter rejection on a headphone with an accelerometer | |
JP2014240940A (en) | Dictation support device, method and program | |
JP6731632B2 (en) | Audio processing device, audio processing method, and audio processing program | |
JP5431282B2 (en) | Spoken dialogue apparatus, method and program | |
JP2023542968A (en) | Hearing enhancement and wearable systems with localized feedback | |
JP2017062307A (en) | Voice processing device, voice processing method and voice processing program | |
JP2013114118A (en) | Speaker speaking rate control device and operation method thereof | |
JP6098149B2 (en) | Audio processing apparatus, audio processing method, and audio processing program | |
JP2010283605A (en) | Video processing device and method | |
WO2014077182A1 (en) | Mobile information terminal, shadow speech management method, and computer program | |
JP5593759B2 (en) | Call voice processing apparatus, call voice control apparatus and method | |
JP2018132624A (en) | Voice interaction apparatus | |
WO2019146309A1 (en) | Information processing device, information processing method, and program | |
JP3553828B2 (en) | Voice storage and playback method and voice storage and playback device | |
US20200349933A1 (en) | Speech Dialog System Aware of Ongoing Conversations | |
JP6904255B2 (en) | Information processing system and program | |
JP5626586B2 (en) | Delay measuring apparatus, delay measuring method and computer program | |
WO2011027437A1 (en) | Voice reproduction device and voice reproduction method | |
JP2012217083A (en) | Volume control apparatus and volume control method | |
JP4493557B2 (en) | Audio signal judgment device | |
JP2016118592A (en) | Communication Robot | |
JP4580297B2 (en) | Audio reproduction device, audio recording / reproduction device, and method, recording medium, and integrated circuit | |
JP2015206928A (en) | Voice processor, voice processing program, and voice processing method |