JP2013142795A - Conversation protection system and conversation protection method - Google Patents
Conversation protection system and conversation protection method Download PDFInfo
- Publication number
- JP2013142795A JP2013142795A JP2012003244A JP2012003244A JP2013142795A JP 2013142795 A JP2013142795 A JP 2013142795A JP 2012003244 A JP2012003244 A JP 2012003244A JP 2012003244 A JP2012003244 A JP 2012003244A JP 2013142795 A JP2013142795 A JP 2013142795A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- attention
- sound effect
- effect
- conversation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
この発明は、会話の内容が会話当事者以外の第三者によって聞き取られることを防止するための会話保護システム及び会話保護方法に関する。 The present invention relates to a conversation protection system and a conversation protection method for preventing the contents of a conversation from being heard by a third party other than the conversation party.
従来、銀行や病院等では、会話の音声が漏れて第三者に聞き取られることを防止するために様々なシステムが利用されている。例えば、銀行内で行われる行員と顧客の会話や、病院内で行われる受付担当者、医師及び薬剤師と患者との会話には、第三者には聞かれたくない個人情報が含まれる場合があるため、第三者に向けて別の音を再生することにより、第三者が会話音声を聞き取り難いようにしている。 2. Description of the Related Art Conventionally, various systems are used in banks, hospitals, and the like to prevent a conversational voice from leaking and being heard by a third party. For example, a conversation between a bank employee and a customer in a bank or a conversation between a receptionist, a doctor, a pharmacist, and a patient in a hospital may contain personal information that a third party does not want to hear. For this reason, by playing another sound toward the third party, it is difficult for the third party to hear the conversation voice.
例えば、特許文献1では、駅や空港等の公共の場所で会話する複数のグループの間に、吸音効果を有するスクリーンを仕切りとして設置した上で、BGM(Background Music)を流すことにより会話の内容を保護する技術が開示されている。また、特許文献2では、BGMの再生に関して、隣室で行われる会話音声を集音して、会話音声の音量に応じてBGMの音量を調整する技術が開示されている。
For example, in
しかしながら、人間の耳は、いわゆるカクテルパーティ効果によって、特定の音を選択的に聴取する選択的聴取能力を有している。このため、会話音声の聴取をより困難にするために、会話に無関係なBGMではなく、会話音声に基づいて生成したマスキング音を利用する場合がある。 However, the human ear has a selective listening ability to selectively listen to a specific sound by the so-called cocktail party effect. For this reason, in order to make it more difficult to listen to the conversational sound, a masking sound generated based on the conversational sound may be used instead of the BGM unrelated to the conversation.
例えば、特許文献3では、会話音声の周波数スペクトルと逆位相の音を生成して、これをマスキング音として、会話の間だけ再生する技術が開示されている。また、特許文献4では、マスキング音に関して、会話音声の周波数スペクトルから抽出した包絡線及び微細構造に基づいて生成した防聴音を利用する技術が開示されている。防聴音とは、会話内容を聴かれることを防止するための音で、会話音声に被せるように再生することで会話音声の音韻性を壊すことができるマスキング音の一種である。
For example,
しかしながら、上記従来技術によれば、会話の内容を保護するためのBGMやマスキング音に対して、第三者が不快感や違和感を覚える場合がある。例えば、音楽等をBGMとして再生する場合に、カクテルパーティ効果を考慮して、会話音声を聞き取られることがないようにBGMの音量を大きくすると、大きな音に不快感を覚える場合がある。 However, according to the above prior art, a third party may feel uncomfortable or uncomfortable with respect to BGM or masking sound for protecting the content of conversation. For example, when music or the like is reproduced as BGM, taking into account the cocktail party effect, if the volume of the BGM is increased so that the conversational voice is not heard, the loud sound may be uncomfortable.
また、マスキング音を再生する場合には、人工的に生成された周波数特性を有する音に違和感を覚える場合がある。マスキング音は、会話音声の特徴に合わせて生成された音であるため、BGMのように会話音声と無関係な音を利用する場合に比べて小さい音量で、会話音声を聞き取り難くする効果を得ることができる。ところが、日常生活では経験しない聞き慣れないマスキング音を聞いた第三者は、たとえ音量が大きくない場合でも、この音に違和感を覚える場合がある。また、違和感を覚えながら、聞き慣れないマスキング音を聞くことに集中してしまい、違和感を増大させる場合がある。 In addition, when reproducing the masking sound, there is a case where the sound having the artificially generated frequency characteristic is uncomfortable. Since the masking sound is generated according to the characteristics of the conversational voice, it is possible to obtain an effect that makes it difficult to hear the conversational voice at a lower volume than when using a sound unrelated to the conversational voice such as BGM. Can do. However, a third party who hears an unfamiliar masking sound that is not experienced in daily life may feel uncomfortable even if the volume is not high. In addition, the user may concentrate on listening to an unfamiliar masking sound while feeling uncomfortable, which may increase the uncomfortable feeling.
本発明は、上述した従来技術による問題点を解消するためになされたもので、会話音声が第三者に聞き取られないように会話内容を保護するための音を再生しながら、この音に対して第三者が違和感や不快感を覚えることがない会話保護システム及び会話保護方法を提供することを目的とする。 The present invention has been made to solve the above-described problems caused by the prior art, and while reproducing the sound for protecting the conversation contents so that the conversation voice cannot be heard by a third party, It is an object of the present invention to provide a conversation protection system and a conversation protection method in which a third party does not feel discomfort or discomfort.
上述した課題を解決し、目的を達成するために、本発明は、会話保護システムであって、会話する音声を集音するためのマイクロホンと、数秒の間に音圧レベルが起ち上がった後減衰する時間軸波形を示すアテンション効果音と該アテンション効果音に比べて音圧レベルが緩やかに変化する時間軸波形を示すベース効果音とを保存する記憶部と、前記会話を行う会話当事者を除く第三者に向けて、前記アテンション効果音及び前記ベース効果音のいずれか一つ又は両方を再生するためのスピーカと、少なくとも前記マイクロホンによって集音された会話音声の音圧レベルが第1のしきい値を超えている間は前記スピーカによる前記ベース効果音を再生する制御と、前記会話音声の音圧レベルが第2のしきい値を超える度に前記アテンション効果音を再生する制御とのいずれか一つ又は両方の制御を行う制御部とを備えることを特徴とする。 In order to solve the above-mentioned problems and achieve the object, the present invention is a conversation protection system, which is a microphone for collecting speech to be spoken and attenuating after a sound pressure level rises in a few seconds A storage unit for storing an attention effect sound indicating a time axis waveform to be performed and a base effect sound indicating a time axis waveform in which the sound pressure level gradually changes compared to the attention effect sound, and a conversation party excluding the conversation party performing the conversation A sound pressure level of a conversational sound collected by at least a speaker for reproducing one or both of the attention sound effect and the base sound effect and at least the microphone is set to a first threshold. While the value exceeds the value, control for reproducing the base sound effect by the speaker and the attention effect each time the sound pressure level of the conversational sound exceeds a second threshold value. Characterized in that it comprises a control unit for performing either one or both control of the control to play sound.
また、本発明は、上記発明において、前記制御部は、会話音声の音圧レベルが所定のしきい値を下回った場合に、前記スピーカによる前記ベース効果音及び前記アテンション効果音のいずれか一つ又は両方の再生を停止することを特徴とする。 Also, in the present invention according to the above-mentioned invention, the control unit may select one of the base sound effect and the attention sound effect by the speaker when the sound pressure level of the conversational sound falls below a predetermined threshold value. Alternatively, both reproductions are stopped.
また、本発明は、上記発明において、前記制御部は、前記アテンション効果音を再生する度に、所定時間内に聞こえる音の数、該音が聞こえるタイミング、該音の音色、及び該音の高さのうち少なくとも1つが変化するように前記アテンション効果音の再生を制御することを特徴とする。 Further, according to the present invention, in the above invention, each time the attention sound effect is reproduced, the control unit counts the number of sounds that can be heard within a predetermined time, the timing at which the sound is heard, the tone color of the sound, and the pitch of the sound. The reproduction of the attention sound effect is controlled so that at least one of them changes.
また、本発明は、上記発明において、前記制御部は、サイン波を利用して前記アテンション効果音を生成することを特徴とする。 Further, the present invention is characterized in that, in the above invention, the control unit generates the attention sound effect using a sine wave.
また、本発明は、上記発明において、前記マイクロホンによって集音された音声の周波数特性に基づいて前記音声をマスキングして聞き取り難くするマスキング音を生成するマスキング音生成部をさらに備え、前記制御部は、前記マスキング音生成部によって生成されたマスキング音を再生することを特徴とする。 The present invention further includes a masking sound generation unit that generates a masking sound that masks the sound and makes it difficult to hear based on a frequency characteristic of the sound collected by the microphone. The masking sound generated by the masking sound generator is reproduced.
また、本発明は、上記発明において、前記マスキング音生成部は、前記マイクロホンによって集音された音声からスペクトル包絡及びスペクトル微細構造を抽出して、周波数方向に延びる軸を中心として前記スペクトル包絡を上下に入れ替えるための反転軸を設定し、当該反転軸を中心として前記スペクトル包絡を反転させることにより前記スペクトル包絡に対して変形を施して変形スペクトル包絡を生成して、前記変形スペクトル包絡及び前記スペクトル微細構造を合成した防聴音を生成して前記マスキング音とすることを特徴とする。 Further, the present invention is the above invention, wherein the masking sound generator extracts a spectral envelope and a spectral fine structure from the sound collected by the microphone, and raises and lowers the spectral envelope around an axis extending in a frequency direction. An inversion axis is set to replace the spectrum envelope, and the spectrum envelope is inverted about the inversion axis to deform the spectrum envelope to generate a deformed spectrum envelope, and the deformed spectrum envelope and the spectrum fineness are generated. A hearing loss sound having a synthesized structure is generated and used as the masking sound.
また、本発明は、上記発明において、前記記憶部には、複数の前記アテンション効果音が保存されており、前記制御部は、前記記憶部からランダムに選択した前記アテンション効果音を再生することを特徴とする。 Further, the present invention is the above invention, wherein the storage unit stores a plurality of the attention sound effects, and the control unit reproduces the attention sound effects randomly selected from the storage unit. Features.
また、本発明は、上記発明において、前記記憶部には、各アテンション効果音の音色及び音の高さに基づいて設定された複数のアテンション効果音の組合せが設定テーブルとして保存されており、前記制御部は、前記設定テーブルからランダムに選択した組合せに基づいてアテンション効果音を再生することを特徴とする。 Further, the present invention is the above invention, wherein the storage unit stores a plurality of attention sound effect combinations set based on the tone color and pitch of each attention sound effect as a setting table, The control unit plays the attention sound effect based on a combination randomly selected from the setting table.
また、本発明は、上記発明において、前記制御部は、各アテンション効果音を再生する際の音量をランダムに変更することを特徴とする。 Further, the present invention is characterized in that, in the above-mentioned invention, the control unit randomly changes a volume when reproducing each attention sound effect.
また、本発明は、上記発明において、前記アテンション効果音は、楽器の音であることを特徴とする。 In the present invention, the attention sound effect is a sound of a musical instrument.
また、本発明は、会話保護方法であって、会話する音声を集音する音声集音ステップと、少なくとも前記音声収集ステップで集音された会話音声の音圧レベルが第1のしきい値を超えている間は、音圧レベルが緩やかに変化する時間軸波形を示すベース効果音を再生するベース効果音再生ステップ、及び前記音声集音ステップで集音された会話音声の音圧レベルが第2のしきい値を超えた場合に、数秒の間に音圧レベルが起ち上がった後に減衰する時間軸波形を示すアテンション効果音を再生するアテンション効果音再生ステップのいずれか一つ又は両方のステップを含む効果音再生ステップとを含むことを特徴とする。 The present invention is also a conversation protection method, comprising: a sound collecting step for collecting conversational sound; and a sound pressure level of at least the conversation sound collected in the sound collecting step has a first threshold value. The sound pressure level of the conversational sound collected in the voice sound collection step and the base sound effect reproduction step for reproducing the base sound effect showing the time axis waveform in which the sound pressure level changes slowly, One or both of the attention effect sound reproducing steps for reproducing the attention effect sound indicating the time axis waveform that decays after the sound pressure level rises within a few seconds when the threshold value of 2 is exceeded And a sound effect reproduction step including.
また、本発明は、上記発明において、前記音声集音ステップで集音された会話音声の音圧レベルが所定のしきい値を下回った場合に、前記ベース効果音及び前記アテンション効果音のいずれか一つ又は両方の再生を停止する効果音停止ステップをさらに含むことを特徴とする。 Further, the present invention provides the above-described invention, wherein, when the sound pressure level of the conversational sound collected in the voice sound collecting step falls below a predetermined threshold value, one of the base sound effect and the attention sound effect. It further includes a sound effect stop step for stopping one or both reproductions.
本発明によれば、保護対象となる会話音声の音圧が所定のしきい値を超えている間は少なくともベース効果音を再生し、さらに会話音声の音量に応じてランダムなタイミングでアテンション効果音を再生することにより聞く者にランダムな印象を与えることができる。また、数秒の間に減衰する短音であるアテンション効果音は第三者の注意を引きやすいので、音に慣れた第三者がカクテルパーティ効果による選択的聴取を行って会話音声を聞き取ることを防止して、会話保護の効果を高めることができる。 According to the present invention, at least the base sound effect is reproduced while the sound pressure of the conversation voice to be protected exceeds a predetermined threshold, and the attention sound effect is generated at random timing according to the volume of the conversation voice. It is possible to give a random impression to the listener by playing. In addition, attention sound effects, which are short sounds that decay within a few seconds, are easy to draw the attention of third parties, so that third parties who are used to the sound can listen to conversational voices by selectively listening to the cocktail party effect. Can prevent and enhance the effect of conversation protection.
また、本発明によれば、会話がなされていないときには、ベース効果音及びアテンション効果音を停止することができるので、静かな環境等に合わせた利用にも適している。 Further, according to the present invention, when there is no conversation, the bass sound effect and the attention sound effect can be stopped, which is suitable for use in a quiet environment.
また、本発明によれば、アテンション効果音の1回の再生で所定時間内に聞こえる音の数、該音が聞こえるタイミング、該音の音色、及び該音の高さのうち少なくとも1つを変更するので、第三者にランダムな印象を与えて、音に慣れることを防止することができる。 Further, according to the present invention, at least one of the number of sounds that can be heard within a predetermined time by one reproduction of the attention sound effect, the timing at which the sound is heard, the tone color of the sound, and the pitch of the sound is changed. As a result, a random impression can be given to a third party to prevent them from getting used to the sound.
また、本発明によれば、サイン波を利用してアテンション効果音を生成することができるので、聞く者にランダムな印象を与えるアテンション効果音を自在に生成して利用することができる。 Further, according to the present invention, attention sound effects can be generated using sine waves, so attention sound effects that give a random impression to the listener can be freely generated and used.
また、本発明によれば、会話音声の周波数特性に基づいて生成したマスキング音を再生することで会話を保護することができる。また、マスキング音が日常生活では聞くことがない違和感を覚える音である場合も、第三者の注意をベース効果音及びアテンション効果音に向けることができるので、マスキング音に対する違和感を低減することができる。 Further, according to the present invention, it is possible to protect the conversation by reproducing the masking sound generated based on the frequency characteristic of the conversation voice. In addition, even if the masking sound is an uncomfortable sound that cannot be heard in daily life, the third party's attention can be directed to the base sound effect and the attention sound effect, which can reduce the uncomfortable feeling of the masking sound. it can.
また、本発明によれば、会話音声の音韻性を壊すための防聴音を再生することで、より効果的に会話を保護することができる。また、ベース効果音及びアテンション効果音により防聴音の違和感を低減することができる。 Further, according to the present invention, it is possible to protect the conversation more effectively by reproducing the hearing-aid sound for breaking the phoneme of the conversation voice. In addition, the sense of incongruity of the hearing-proof sound can be reduced by the base effect sound and the attention effect sound.
また、本発明によれば、音色や音の高さ等が異なる様々なアテンション効果音データを記憶部に保存して、この中からランダムに選択した音を再生することで聞く者にランダムな印象を与えて、会話を保護する効果や防聴音等のマスキング音の違和感を低減する効果を維持することができる。 Further, according to the present invention, various attention sound effect data having different timbres, pitches, etc. are stored in the storage unit, and a random impression is given to the listener by playing back a randomly selected sound from among them. Thus, it is possible to maintain the effect of protecting the conversation and reducing the uncomfortable feeling of the masking sound such as the hearing-aid sound.
また、本発明によれば、音色等に基づいて、続けて再生された場合でも違和感を覚えないアテンション効果音の組合せを設定テーブルとして設定して、この設定に基づいてアテンション効果音を再生するので、会話を保護する効果及びマスキング音の違和感を低減する効果に加えて、アテンション効果音に対する違和感をも低減して、心地よい印象を与えることができる。 In addition, according to the present invention, a combination of attention sound effects that does not give a sense of incongruity even when continuously played back is set as a setting table based on the tone color and the attention sound effects are played back based on this setting. In addition to the effect of protecting the conversation and the effect of reducing the uncomfortable feeling of the masking sound, the uncomfortable feeling of the attention sound can also be reduced to give a pleasant impression.
また、本発明によれば、再生するアテンション効果音の音色等を変更することに加えて、アテンション効果音を再生する際の音量を変更することもできるので、よりランダムな印象を与えて、さらに第三者が音に慣れてカクテルパーティ効果の発揮を抑制することができる。 Further, according to the present invention, in addition to changing the tone color of the attention sound effect to be reproduced, the volume at the time of reproducing the attention sound effect can also be changed. Third parties can get used to the sound and suppress the effect of the cocktail party.
以下に添付図面を参照して、この発明に係る会話保護システム及び会話保護方法の好適な実施形態について詳細に説明する。会話保護システムは、例えば、銀行等の金融機関や、病院や薬局等の医療機関で行われる会話内容が第三者によって聞き取られることを防止して、会話に含まれる個人情報やプライバシーを保護するために利用するシステムである。 Exemplary embodiments of a conversation protection system and a conversation protection method according to the present invention will be explained below in detail with reference to the accompanying drawings. The conversation protection system protects personal information and privacy contained in conversations by preventing third parties from listening to conversations conducted at financial institutions such as banks and medical institutions such as hospitals and pharmacies. It is a system used for this purpose.
図1は、会話保護システムの利用例を説明する図である。この例では、ブース内で会話を行う当事者1及び2の音声が、第三者3に聞き取られることを防止する。例えば、ブースを仕切るために設けられたパーティション51の外側で待合席52に座っている人物や、隣のブースに居る人物が第三者3に該当する。
FIG. 1 is a diagram illustrating an example of use of a conversation protection system. In this example, the voices of the
会話保護システムは、音声処理装置10と、マイクロホン(以下「マイク」と記載する)20と、スピーカ30によって構成される。マイク20は、例えば、ブース内で会話当事者1及び2が座るテーブル50に設置され、保護対象となる会話音声を集音するために利用される。音声処理装置10は、マイク20によって集音された音声に基づきマスキング音を生成して、このマスキング音と後述する効果音とをスピーカ30によって再生する機能を有する。スピーカ30は、ブースの外に居る第三者3に向けて音を再生するように設置されている。
The conversation protection system includes an
図2は、上方から見た会話保護システムの設置例を説明する図である。このように、会話保護システムは、音声処理装置10、マイク20及びスピーカ30に加えて、スピーカ30から出力する音を制御するための出力音操作部40を備える場合もある。この出力音操作部40によって、例えば、スピーカ30から出力される音の再生開始及び再生停止の制御や、再生時の音量制御を行うことができる。なお、図2では、説明を簡略化するために、1つのブースの会話を保護するためのシステムのみを示しているが、複数のブースがある場合には、各ブースの会話音声を保護するための音声処理装置10、マイク20、スピーカ30及び出力音操作部40が設置される。
FIG. 2 is a diagram for explaining an installation example of the conversation protection system as viewed from above. As described above, the conversation protection system may include the output
図3は、会話保護システムの機能構成概略を示すブロック図である。図3を参照しながら音声処理装置10について詳細を説明する。音声処理装置10は、マイク20によって集音された会話音声の入力を受ける入力音解析部11と、会話音声に基づいて防聴音を生成する防聴音生成部(マスキング音生成部)12と、防聴音とは別に再生する効果音を制御する効果音制御部13と、効果音として利用する音データや効果音の再生を制御するための設定等が保存されている記憶部14と、防聴音及び効果音を会話音声に応じてスピーカ30で再生する制御を行う出力音制御部15とを有している。なお、入力音解析部11、防聴音生成部12、効果音制御部13及び出力音制御部15は、DSP(Digital Signal Processor)によって構成されている。また、音声処理装置10は、DSPを含む専用のハードウェアによって構成されてもよいし、コンピュータ装置を利用して構成されてもよい。
FIG. 3 is a block diagram showing an outline of a functional configuration of the conversation protection system. Details of the
なお、図3では、会話保護システムの説明に必要な構成要素のみを示しているが、音声処理装置10は、この他に、例えば、マイク20からの入力信号及びスピーカ30への出力信号を処理するためのA/D(D/A)コンバータ及びアンプを有している。また、外部装置との間で有線又は無線で通信を行うための通信インターフェイスを有する場合もある。
In FIG. 3, only the components necessary for explaining the conversation protection system are shown, but the
入力音解析部11は、マイク20から入力され、A/Dコンバータでデジタル化された保護対象となる会話音声の周波数特性や音量を解析する機能を有する。例えば、会話音声が、図4上段に示す振幅波形を示す場合に、この振幅波形をリアルタイムに解析して、同図下段に示す音圧波形を生成する。この音圧波形を形成する音圧レベルは、防聴音生成部12によって防聴音を生成する処理や、効果音制御部13によって生成された効果音の再生タイミングを制御するために利用される。
The input
防聴音生成部12は、会話音声に合わせてスピーカ30から再生することで、会話音声の音韻性を壊すことができる防聴音を生成する機能を有する。防聴音は、会話音声の周波数特性を示すスペクトルから抽出した包絡線及び微細構造に係る特徴に基づいて生成されるマスキング音の一種である。具体的には、会話音声から得られた音声スペクトルからスペクトル包絡及びスペクトル微細構造を抽出して、スペクトル包絡を上下に入れ替えるための周波数方向に延びる反転軸を設定して当該反転軸を中心としてスペクトル包絡を反転させることによりスペクトル包絡に対して変形を施した変形スペクトル包絡を生成し、さらに、この変形スペクトル包絡及びスペクトル微細構造を合成した変形スペクトルを生成して、これを防聴音とする。なお、防聴音は、特許第4761506号公報によって開示された従来技術によって生成することができるので詳細な説明は省略する。
The hearing-proof sound generation unit 12 has a function of generating a hearing-proof sound that can break the phonological property of the conversation voice by playing it from the
効果音制御部13は、効果音データの組合せや再生音量を制御して、会話音声に合わせてスピーカ30から再生される効果音を生成する機能を有する。ここで、本実施形態で言う効果音とは、第三者3が会話音声を聞き取り難くする効果と防聴音に対する違和感を低減する効果とを得るために再生する音である。防聴音が会話音声の特徴に基づく周波数特性を有する音であるのに対し、効果音は会話音声とは無関係な周波数特性を有している。また、防聴音が会話音声に基づいて生成される音であるのに対し、効果音としては予め用意された曲や楽器等の音を利用することができる。防聴音は人工的に操作された周波数特性を有するため聞いたときに違和感を覚える場合があるが、効果音からはそのような違和感を覚えることがなく、音の種類によっては逆に心地よい印象を受ける。
The sound
効果音として、ベース効果音とアテンション効果音の2種類の音を利用する。ベース効果音は会話音声が続く間途切れることなく続けて再生される音であり、アテンション効果音は会話音声の音圧が所定のしきい値を超える度に再生される音である。ベース効果音として利用するベース効果音データ14bと、アテンション効果音として利用するアテンション効果音データ14aは、フラッシュメモリ等の一般的なメモリから構成される記憶部14に保存される。効果音データのデータ形式として、例えば、PCM(Pulse Code Modulation)音源が利用される。また、MP3などの圧縮音源などでもよい。なお、記憶部14は、複数の効果音データを保存することができれば、ハードディスク等の他の記憶装置を利用するものであってもよい。
As sound effects, two types of sounds are used: bass sound effects and attention sound effects. The base sound effect is a sound that is reproduced continuously without interruption during the conversational voice, and the attention sound effect is a sound that is reproduced every time the sound pressure of the conversational voice exceeds a predetermined threshold. The base
ベース効果音としては、静かな印象を受ける曲を利用することが好ましい。具体的には、時間軸方向の音圧レベルの変化が緩やかな音源を利用する。例えば、複数のオルゴール曲が、ベース効果音データ14bとして予め記憶部14に保存される。ベース効果音は、従来装置で利用されるBGMに相当する音である。
As the bass sound effect, it is preferable to use a song that receives a quiet impression. Specifically, a sound source with a gradual change in sound pressure level in the time axis direction is used. For example, a plurality of music boxes are stored in the
ベース効果音は、数秒〜数十秒の長さで、再生した時に第三者3が驚いたり不快感を覚えるような音が含まれず、同じ曲又は別の曲を連続して再生した場合でも曲の終わりと次の曲の初めとが違和感なくつながり、音量を変化させても不快感を覚えないものであれば、その内容は特に限定されない。例えば、打楽器や弦楽器等の楽器による曲であってもよいし、川のせせらぎ、波の音又は小鳥のさえずり等を利用した音であってもよい。
The base sound effect is several seconds to several tens of seconds long and does not include sounds that would make the
利用者は、記憶部14に保存された複数のベース効果音データ14bの中から、再生したい音を選択することができる。再生するベース効果音データ14bが予め選択されている場合には、選択内容が効果音出力条件14cの一部として記憶部14に保存される。効果音制御部13は、効果音出力条件14cに含まれる設定を参照してベース効果音データ14bを選択する。そして、選択されたベース効果音が、出力音制御部15によってスピーカ30から再生される。なお、出力音操作部40がベース効果音データ14bを選択するための操作部を有しており、利用者がこの操作部を操作してベース効果音データ14bを選択してもよい。また、音声処理装置10の備える通信機能により、リモコン等の外部装置から受信した信号に基づいてベース効果音データ14bが選択される態様であっても構わない。
The user can select a sound to be reproduced from a plurality of bass
アテンション効果音としては、聞く人が驚くような音ではなくかつ注意を引きやすい音を利用することが好ましい。例えば、時間軸方向の音圧レベルが、数秒の間に、起ち上がった後に減衰するような短い音を利用する。具体的には、鉄琴、木琴等の打楽器を叩いた音、ギターやハープ等の弦楽器を弾いた音、ベルや鐘等を鳴らした音等をアテンション効果音として利用する。様々な音色の様々な高さの音が、アテンション効果音データ14aとして予め記憶部14に保存される。
As the attention sound, it is preferable to use a sound that is not surprising to the listener and that is easy to draw attention. For example, a short sound is used in which the sound pressure level in the time axis direction rises within a few seconds and then decays. Specifically, a sound of hitting a percussion instrument such as an iron koto or a xylophone, a sound of playing a stringed instrument such as a guitar or a harp, or a sound of a bell or bell is used as an attention effect sound. Sounds of various pitches with various pitches are stored in advance in the
アテンション効果音は、短い音で、再生したときに第三者が驚いたり不快感を覚えるような音ではなく、ベース効果音に重ねて再生したときに違和感を覚えずかつベース効果音に埋もれることなく容易に聞き取れる音であれば、その音色や音の高さ等の条件は特に限定されない。例えば、カリンバのような民族楽器の音であってもよいし、サイン波を利用して生成された音であってもよいし、鳥のさえずりや虫の鳴き声等であっても構わない。また、記憶部14に予め保存されたデータを利用してもよいし、複数のサイン波に窓関数を適用したものを合成して音を生成して利用する態様であっても構わない。
Attention sound effects are short sounds that are not surprised or uncomfortable by a third party when played, but do not feel uncomfortable when played over the base sound effects and are buried in the base sound effects As long as it is a sound that can be easily heard, the conditions such as tone color and pitch are not particularly limited. For example, it may be a sound of an folk instrument such as kalimba, a sound generated using a sine wave, a bird's singing sound, an insect's crying, or the like. Further, data stored in advance in the
アテンション効果音データ14aは、記憶部14に保存されたデータの中から、効果音制御部13によってランダムに選択される。アテンション効果音データ14aは、会話音声の音量が所定のしきい値を超えたタイミングで、ベース効果音データ14bに重ねて再生される。
The attention sound effect data 14 a is randomly selected by the sound
記憶部14には、ベース効果音データ14b及びアテンション効果音データ14aの他に、効果音出力条件14cが保存されている。効果音出力条件14cには、会話保護システムの利用者によって選択されたベース効果音データ14bに係る設定情報、ベース効果音データ14bの再生条件、アテンション効果音データ14aの選択条件及び再生条件等が含まれる。
The
出力音制御部15は、D/Aコンバータ及びアンプを有し、防聴音生成部12で生成された防聴音をスピーカ30から再生する機能を有する。防聴音は、会話の内容を聞き取ることができないように、会話音声に被せて音声の音韻性を壊すように再生される。また、出力音制御部15は、効果音制御部13によって選択された効果音を、効果音制御部13によって設定された音量でスピーカ30から再生する機能を有する。
The output sound control unit 15 includes a D / A converter and an amplifier, and has a function of reproducing the hearing-aid sound generated by the hearing-aid sound generation unit 12 from the
効果音の再生タイミングは、入力音解析部11によって図4に示すように生成された会話音声の音圧レベルに基づいて制御される。再生タイミングの制御に利用されるベース効果音用のしきい値B及びアテンション効果音用のしきい値Aは、記憶部14に保存された効果音出力条件14cに含まれている。
The playback timing of the sound effect is controlled based on the sound pressure level of the conversational voice generated by the input
図5は、効果音の再生タイミングを説明する図である。例えば、図5で、音圧波形の下部に示したように、会話音声の音圧レベルがしきい値Bを超えると、ベース効果音の再生が開始される。そして、音圧レベルがしきい値Bを下回るとベース効果音の再生が停止される。ベース効果音は、効果音出力条件14cに含まれる設定条件等に基づいて選択され、出力音制御部15によって所定の音量レベルでスピーカ30から再生される。
FIG. 5 is a diagram for explaining the reproduction timing of the sound effect. For example, as shown in the lower part of the sound pressure waveform in FIG. 5, when the sound pressure level of the conversational voice exceeds the threshold value B, the reproduction of the base effect sound is started. When the sound pressure level falls below the threshold value B, the reproduction of the bass sound effect is stopped. The base sound effect is selected based on the setting condition included in the sound
ベース効果音は、会話音声の音圧レベルがしきい値Bを超えている間だけ再生され、会話が無いときには停止するように制御される。このため、静かな環境に会話保護システムを設置した場合でも、会話を保護する必要がある場合にのみ予め設定された音量でベース効果音を再生し、会話が無いときには再生を停止して静かな状態を保つことが可能である。 The base sound effect is reproduced only while the sound pressure level of the conversation voice exceeds the threshold B, and is controlled to stop when there is no conversation. For this reason, even if the conversation protection system is installed in a quiet environment, the base sound effect is played at a preset volume only when it is necessary to protect the conversation. It is possible to keep the state.
なお、ベース効果音の再生を制御する方法については、会話音声の音圧レベルがしきい値Bを下回る度にベース効果音の再生を停止する態様に限らず、音圧レベルがしきい値を下回った状態が予め設定された所定時間続いた場合にのみベース効果音の再生を停止するようにしてもよい。すなわち、会話が短時間途切れただけである場合にはベース効果音の再生を続けるように制御してもよい。また、ベース効果音を常に再生してBGMとして利用したい場合には、出力音操作部40による再生停止の操作がされない限り、ベース効果音の再生を続けるように制御してもよい。また、ベース効果音の再生の開始及び停止を制御するのではなく、ベース効果音を常に再生しながら、その再生音量を会話音声の音圧レベルに応じて制御することにより、図5に示す再生状況を実現しても構わない。これらのベース効果音の再生制御は、効果音出力条件14cの設定を変更することにより実現できるようになっている。
The method for controlling the reproduction of the bass sound effect is not limited to the mode in which the reproduction of the base sound effect is stopped every time the sound pressure level of the conversational sound falls below the threshold value B. You may make it stop reproduction | regeneration of a bass sound effect only when the state in which it fell below continued for the preset predetermined time. That is, when the conversation is only interrupted for a short time, it may be controlled to continue playing the base sound effect. When it is desired to always reproduce the bass sound effect and use it as the BGM, control may be performed so that the bass sound effect continues to be played unless the playback
さらに、ベース効果音用のしきい値に関し、第三者3に聞こえるようにベース効果音の再生を制御する際のしきい値と、第三者3に聞こえないようにベース効果音の再生を制御する際のしきい値とが異なる値に設定されても構わない。すなわち、例えばベース効果音の再生開始を判断するしきい値と再生停止を判断するしきい値とが異なる設定値であっても構わない。
Furthermore, regarding the threshold value for the base sound effect, the threshold value for controlling the reproduction of the base sound effect so that it can be heard by the
また、図5で、音圧波形の上部に示したように、会話音声の音圧レベルがしきい値Bを超えてベース効果音の再生が開始された後、さらに音圧レベルがしきい値Aを超えると、アテンション効果音が再生される。アテンション効果音は、記憶部14に保存された複数の音データの中から効果音制御部13によってランダムに選択される。また、再生時の音量レベルについても効果音制御部13によってランダムに設定される。なお、再生時の音量レベルについては、音量レベルの範囲だけが予め設定されており、この範囲内でランダムに設定されるようになっている。
Further, as shown in the upper part of the sound pressure waveform in FIG. 5, after the sound level of the conversational sound exceeds the threshold value B and the reproduction of the base effect sound is started, the sound pressure level is further increased to the threshold value. When A is exceeded, an attention sound effect is played. The attention sound effect is randomly selected by the sound
アテンション効果音は会話音声の音圧がしきい値Aを超える度に再生されるが、会話音声の音圧は不規則に変化するので、アテンション効果音は図5に示すようにランダムなタイミングで再生されることになる。なお、図5ではアテンション効果音を2段で示しているが、このように、会話音声の音圧がしきい値Aを超えるタイミングによっては、先に再生されたアテンション効果音の再生が完了する前に、次のアテンション効果音が再生される場合もある。 Attention sound effects are played each time the sound pressure of the conversation voice exceeds the threshold A, but since the sound pressure of the conversation voice changes irregularly, the attention sound effects are at random timing as shown in FIG. Will be played. In FIG. 5, the attention sound effect is shown in two stages. Thus, depending on the timing at which the sound pressure of the conversational sound exceeds the threshold value A, the reproduction of the previously played attention sound effect is completed. Before the next attention sound effect may be played.
また、図5では、ベース効果音及びアテンション効果音の両方を再生する場合を示しているが、本実施形態がこれに限定されるものではなく、しきい値A及びBを設定することによりベース効果音又はアテンション効果音のいずれか一方のみを再生するように制御することもできる。 FIG. 5 shows a case where both the base sound effect and the attention sound effect are reproduced. However, the present embodiment is not limited to this, and the base value can be set by setting the threshold values A and B. It is also possible to control to reproduce only one of the sound effect and the attention sound effect.
アテンション効果音として、ベル音のように、聞く人の注意を引きやすい短い音が利用される。このため、会話音声の音量が所定のしきい値Aを超えるタイミングでアテンション効果音を再生して、第三者の注意をアテンション効果音に向かせることで、会話音声を聞き取り難くする効果がある。 As an attention sound effect, a short sound such as a bell sound that can easily attract the listener's attention is used. For this reason, an attention sound effect is reproduced at a timing when the volume of the conversation sound exceeds a predetermined threshold A, and the third party's attention is directed to the attention effect sound, thereby making it difficult to hear the conversation sound. .
また、図5には示していないが、防聴音生成部12によって生成された防聴音も、マスキング音として、会話音声に合わせて再生される。防聴音は、例えば、図5に示すベース効果音と同様に、しきい値Bを超える間、会話音声に合わせて再生される。防聴音は、違和感を覚える音となる場合もある。しかし、防聴音が再生される間、会話音声がしきい値Aを超えるランダムなタイミングでアテンション効果音が再生されるので、第三者の注意はアテンション効果音に引きつけられる。この結果、防聴音に対する違和感を低減させる効果を得ることができる。 In addition, although not shown in FIG. 5, the hearing protection sound generated by the hearing protection sound generation unit 12 is also reproduced as a masking sound in accordance with the conversational sound. For example, as in the case of the base sound effect shown in FIG. 5, the hearing-proof sound is reproduced in accordance with the conversation sound while the threshold value B is exceeded. A hearing-proof sound may be a sound that makes you feel uncomfortable. However, since the attention effect sound is reproduced at random timing when the conversational sound exceeds the threshold A while the hearing protection sound is reproduced, the attention of the third party is attracted to the attention effect sound. As a result, it is possible to obtain an effect of reducing a sense of incongruity with the hearing loss sound.
また、アテンション効果音は、音色、音の高さ、再生音量及びタイミングを変えながら再生されるので、同じような音が繰り返して再生される場合のように単調な印象を受けることがない。すなわち、アテンション効果音のランダムな印象により、第三者はアテンション効果音に慣れることがない。このため、第三者の注意を引き続けて、会話音声を保護する効果と防聴音の違和感を低減する効果とを維持し続けることができる。 Further, the attention sound effect is reproduced while changing the tone color, pitch, reproduction volume and timing, so that it does not receive a monotonous impression as in the case where a similar sound is reproduced repeatedly. That is, the random impression of the attention sound effect prevents a third party from getting used to the attention sound effect. For this reason, it is possible to keep the attention of a third party and maintain the effect of protecting the conversational sound and the effect of reducing the uncomfortable feeling of the hearing loss sound.
アテンション効果音は、会話音声の音圧がしきい値Aを超えた場合にのみ再生される短い音であるため、アテンション効果音の再生を終了してから次のアテンション効果音が再生される迄の間に隙間の時間が生ずる場合がある。ベース効果音を再生することなくアテンション効果音のみを再生した場合には、アテンション効果音の隙間で防聴音の印象が強くなり、防聴音に違和感を覚える可能性がある。このため、しきい値Aよりも音圧レベルの低いしきい値Bを設定して、このしきい値Bを超える間はベース効果音を再生し、2つのアテンション効果音の隙間ではベース効果音が聞こえるように再生が制御される。これにより、アテンション効果音の隙間で防聴音の印象が強くなることを回避することができる。 Since the attention sound is a short sound that is played only when the sound pressure of the conversation voice exceeds the threshold A, the attention sound is played until the next attention sound is played after the end of the reproduction of the attention sound. There may be a gap time between the two. When only the attention effect sound is played back without playing the base sound effect, the impression of the hearing aid sound becomes strong in the gap between the attention effect sounds, and there is a possibility that the hearing aid sound may feel uncomfortable. For this reason, a threshold value B having a sound pressure level lower than the threshold value A is set, the base sound effect is reproduced while the threshold value B is exceeded, and the base sound effect is generated in the gap between the two attention sound effects. Playback is controlled so that can be heard. As a result, it is possible to avoid an increase in the impression of the hearing loss sound in the gap between the attention sound effects.
ベース効果音は、音量の揺らぎの少ない音である。アテンション効果音を再生することなくベース効果音のみを再生した場合には、ベース効果音を聞くうちにその音に慣れて防聴音の印象が強くなり、防聴音に違和感を覚える可能性がある。このため、ベース効果音に加えて、聞く者の注意を引くアテンション効果音を再生して、効果音に対してランダムな印象を与えるように制御される。これにより、ベース効果音に慣れて防聴音の印象が強くなることを回避することができる。 The bass sound effect is a sound with less volume fluctuation. When only the bass sound effect is played back without playing the attention sound effect, while hearing the base sound effect, the impression of the hearing loss sound becomes stronger as the sound gets used to the sound, and there is a possibility that the hearing loss sound feels uncomfortable. For this reason, in addition to the base sound effect, an attention sound effect that attracts the listener's attention is reproduced, and control is performed to give a random impression to the sound effect. Thereby, it is possible to avoid an increase in the impression of the hearing-aid sound by getting used to the bass sound effect.
このように、アテンション効果音及びベース効果音の2種類の効果音を利用することよって、防聴音に対する違和感を効果的に低減することができる。また、アテンション効果音及びベース効果音によって、マスキング音としての効果も得られるので、防聴音のみを利用する場合に比べて、より会話の内容を聞き取り難くするという効果を得ることもできる。 In this way, by using two types of sound effects, the attention sound effect and the bass sound effect, it is possible to effectively reduce the uncomfortable feeling with respect to the hearing loss sound. Further, since the effect as a masking sound can be obtained by the attention sound effect and the bass sound effect, it is possible to obtain an effect of making it difficult to hear the content of the conversation as compared with the case where only the hearing-aid sound is used.
次に、アテンション効果音データについて詳細を説明する。アテンション効果音は、会話音声をマスキングすると共に、第三者3の注意を会話音声からそらしてアテンション効果音へ向けるために利用される。第三者3が音に慣れてしまうと、注意を引く効果が低くなってしまうため、音に慣れることがないように、ランダムな印象を与えるようにアテンション効果音の再生が制御される。
Next, details of the attention sound effect data will be described. The attention sound effect is used for masking the conversation sound and for diverting the attention of the
図6に示すように、様々な時間軸波形を有するアテンション効果音が利用される。アテンション効果音は、ベル、木琴、鉄琴等の異なる音色で、例えば2秒の間に音圧レベルが起ち上がった後に減衰する音である。この2秒間に1つの音が再生される場合もあるし2つ以上の複数の音が再生される場合もある。 As shown in FIG. 6, attention sound effects having various time axis waveforms are used. The attention sound effect is a sound that decays after the sound pressure level rises in 2 seconds, for example, with different timbres such as bell, xylophone, and iron koto. There may be a case where one sound is played back during the two seconds, or a case where a plurality of two or more sounds are played back.
鉄琴の音色のアテンション効果音を例に具体的に説明すると、選択されたアテンション効果音によって、2秒の間に、鉄琴の音が1回だけ聞こえる場合もあるし、同じ高さ又は異なる高さの鉄琴の音が複数回聞こえる場合もある。また、例えば音が2回聞こえる場合でも、各音が聞こえるタイミングは、選択されたアテンション効果音によって同じ場合もあるし異なる場合もある。すなわち、同じ2秒間のアテンション効果音であっても、各アテンション効果音を再生したときに聞こえる音色、音の数、各音の高さ、各音が聞こえるタイミングの少なくとも1つが異なるようになっている。 To explain specifically, the attention sound effect of the koto tone, the koto sound may be heard only once in 2 seconds depending on the selected attention sound effect. In some cases, you can hear the sound of the height of the koto. For example, even when sounds are heard twice, the timing at which each sound is heard may be the same or different depending on the selected attention sound effect. That is, at least one of the tone color, the number of sounds, the pitch of each sound, and the timing at which each sound can be heard when each attention effect sound is reproduced, even if the attention effect sound is the same for 2 seconds. Yes.
図7は、記憶部14に保存されるアテンション効果音データ14aの例を示す図である。このように、様々な音色の複数の音が、アテンション効果音データ14aとして記憶部14に保存されている。効果音制御部13は、これらの中から再生するアテンション効果音データ14aをランダムに選択する。
FIG. 7 is a diagram illustrating an example of the attention sound effect data 14 a stored in the
例えば、効果音制御部13が、再生時間が2秒間のアテンション効果音データ14aの中から3つのデータをランダムに選択する。この場合には、3つのアテンション効果音データ14aが6秒かけて再生されることになる。しかし、図6に示したように、1つのアテンション効果音データ14aの中に含まれる音は各々異なっている。このため、2秒間のアテンション効果音データ14aを3つ選択した場合でも、6秒の間に聞こえる音は3つ以上のランダムな数になる。また、選択されたアテンション効果音データ14aによって、音色や、含まれる各音が再生されるタイミングや、各音の高さも異なる。さらに、選択された各アテンション効果音データ14aは、音量レベルをランダムに変更して再生される。
For example, the sound
このように、様々な音からなる複数のアテンション効果音データ14aの中から、再生する音をランダムに選択して、音量レベルを変更しながら再生することにより、ランダムな印象を受ける音を再生することができる。この結果、アテンション効果音を聞く第三者3が音に慣れることがなく、聞く者の注意を引きつける効果を維持し続けることができる。
In this way, a sound that receives a random impression is reproduced by randomly selecting a sound to be reproduced from among a plurality of attention effect sound data 14a consisting of various sounds and changing the volume level. be able to. As a result, the
なお、会話保護システムでは、効果音を聞く者に対して、ランダムな印象を与えるだけではなく、心地よい印象を与えることもできる。アテンション効果音データ14aをランダムに選択して再生した場合に、続けて再生されるアテンション効果音データ14aによっては、違和感を覚える場合がある。例えば、続けて再生される音の高さが急激に変化したり、音の高さが不協和音を構成するような関係にあったり、音色の組合せの相性が悪い場合には、再生された音に違和感を覚える場合がある。このため、会話保護システムでは、記憶部14の効果音出力条件14cの中に、アテンション効果音データ14aの組合せを設定したテーブルが保存されている。例えば、音色の組合せ、音の高さの変化、協和音を構成する音の高さの関係等を考慮して、アテンション効果音データ14aの組合せが設定テーブルに設定される。
In the conversation protection system, not only a random impression but also a pleasant impression can be given to the person who hears the sound effect. When the attention sound effect data 14a is randomly selected and reproduced, depending on the attention sound effect data 14a to be continuously reproduced, a sense of incongruity may be felt. For example, if the pitch of the sound that is played continuously changes rapidly, the pitch is in a dissonant relationship, or the combination of timbres is not compatible, You may feel uncomfortable. For this reason, in the conversation protection system, a table in which the combination of the attention sound effect data 14a is stored in the sound
図8は、アテンション効果音データ14aの設定テーブルの一例である。この設定テーブルでは、続けて再生した場合に心地よい音となるアテンション効果音データ14aの音色の組合せが予め設定されている。 FIG. 8 is an example of a setting table for the attention sound effect data 14a. In this setting table, combinations of timbres of attention sound effect data 14a, which are pleasant sounds when continuously reproduced, are set in advance.
アテンション効果音データ14aの設定テーブル利用する場合には、効果音制御部13が、設定テーブルに設定された組合せをランダムに選択する。そして、選択した組合せに基づいて、各音色のアテンション効果音データ14aをランダムに選択する。このとき、効果音制御部13は、各アテンション効果音データ14aを再生するときの音量レベルの設定も行うが、音量レベルについても、不快に感じることがないように予め設定された所定範囲内で設定されるようになっている。なお、音量レベルの設定条件についても、アテンション効果音データ14aの設定テーブルと同様に、効果音出力条件14cとして記憶部14に保存されている。
When using the setting table of the attention sound effect data 14a, the sound
例えば、選択されたアテンション効果音データ14aの組合せが図8に示す設定テーブルのNo.1であった場合には、設定テーブルに従い、図7に示すアテンション効果音データ14aの中から、ベルの音色の2つのアテンション効果音データ14aと、木琴の音色の1つのアテンション効果音データ14aがランダムに選択される。例えば、ランダムに選択されたアテンション効果音データ14aが、ベルB、ベルA及び木琴Bであった場合には、図9(a)に示すように、これら3つのアテンション効果音データ14aが、順に再生される。また、例えば、音量レベルを所定レベルに対して+20%から−20%の間で変更するように設定されており、ランダムに設定された音量レベルが90%、100%及び110%であった場合には、各音がこの音量で再生される。すなわち、図9(a)に示すように、所定の音量レベルに対して、90%の音量レベルでベルBの音が再生され、100%の音量レベルでベルAの音が再生され、110%の音量レベルで木琴Bの音が再生される。 For example, the combination of the selected attention sound effect data 14a is set to No. in the setting table shown in FIG. If it is 1, two attention sound effect data 14a for the bell tone and one attention sound effect data 14a for the xylophone tone are selected from the attention sound effect data 14a shown in FIG. Randomly selected. For example, when the attention sound effect data 14a selected at random is Bell B, Bell A, and Xylophone B, these three attention sound effect data 14a are sequentially displayed as shown in FIG. Played. In addition, for example, when the volume level is set to be changed between + 20% and −20% with respect to a predetermined level, and the randomly set volume levels are 90%, 100%, and 110% Each sound is played at this volume. That is, as shown in FIG. 9A, the sound of the bell B is reproduced at a volume level of 90% with respect to a predetermined volume level, the sound of the bell A is reproduced at a volume level of 100%, and 110%. The sound of xylophone B is reproduced at the volume level of.
なお、複数のアテンション効果音を連続して再生する方法は、複数の音を図9(a)に示すように連続して再生する態様に限らず、同図(b)のように、各音の一部が重なるように再生してもよい。この場合には、各音の重なり、すなわち各音の再生タイミングを、予め設定された所定範囲内でランダムに設定すればよい。 Note that the method of continuously playing a plurality of attention sound effects is not limited to a mode in which a plurality of sounds are continuously played as shown in FIG. 9A, and each sound is played as shown in FIG. You may reproduce | regenerate so that a part of may overlap. In this case, the overlapping of each sound, that is, the reproduction timing of each sound may be set at random within a predetermined range set in advance.
また、アテンション効果音の選択方法について、利用者の好みを反映して選択されるようにしてもよい。例えば、図8に示す設定テーブルの音色の組合せを利用者の好みに合わせて設定してもよいし、図7に示すデータの中から利用者の好みに合わせてアテンション効果音データ14aを選択し、これらをランダムに組み合わせたものを設定テーブルとしてもよい。また、利用者の好みによらず設定された図8の設定テーブルはそのままに、効果音制御部13がランダムにデータを選択する際に選択可能なアテンション効果音データ14aを、予め利用者の好みに合わせて絞っておくことによって、利用者の好みが反映されるようにしても構わない。
Further, the attention sound effect selection method may be selected reflecting the user's preference. For example, the combination of timbres in the setting table shown in FIG. 8 may be set according to the user's preference, or the attention sound effect data 14a is selected from the data shown in FIG. 7 according to the user's preference. The setting table may be a combination of these at random. Further, the attention sound effect data 14a that can be selected when the sound
次に、ベース効果音データ14b及びアテンション効果音データ14aの再生処理について説明する。図10は、ベース効果音データ14bを再生する際の処理を示すフローチャートである。また、図11は、アテンション効果音データ14aを再生する際の処理を示すフローチャートである。
Next, the reproduction process of the bass
まず、ベース効果音データ14bを再生する際の処理について説明する。マイク20によって集音された会話音声から入力音解析部11によって生成された音圧波形が、出力音制御部15によって監視される(ステップS1及びステップS1;No)。
First, a process for reproducing the bass
そして、会話音声から得られた音圧レベルが、予め設定されたベース効果音用のしきい値Bを超えた場合には(ステップS1;Yes)、効果音出力条件14c内の設定に基づいて選択されたベース効果音データ14bが再生される(ステップS2)。出力音制御部15は、音圧レベルの監視を継続する(ステップS3及びステップS3;No)。
When the sound pressure level obtained from the conversational sound exceeds the preset threshold B for the base sound effect (step S1; Yes), the sound pressure level obtained from the conversation sound is based on the setting in the sound
そして、会話音声から得られた音圧レベルが、しきい値Bを下回った場合には(ステップS3;Yes)、ベース効果音データ14bの再生を停止する(ステップS4)。このとき、第3者が違和感を覚えることがないように、ベース効果音はフェードアウトするように停止される。ベース効果音データ14bの再生を停止した後も、出力音制御部15は、会話音声から得られた音圧レベルの監視を継続して、ベース効果音データ14bの再生及び停止を制御する。すなわち、図5に示したように、会話音声の音圧レベルが所定のしきい値Bを超えている間、ベース効果音データ14bが再生される。
When the sound pressure level obtained from the conversational voice is below the threshold value B (step S3; Yes), the reproduction of the bass
なお、ベース効果音データ14bの再生を停止する際に、アテンション効果音データ14aが再生されている場合には、このアテンション効果音データ14aについてもベース効果音データ14bと同様に再生を停止するように制御してもよい。また、ベース効果音データ14bについては、再生及び停止を制御する態様の他、ベース効果音データ14bを常に再生しながら、再生音量を制御する態様であっても構わない。具体的には、会話音声の音圧レベルがしきい値Bを超えたときにはベース効果音データ14bの再生音量をフェードインして、所定の音量に達した所で音量を維持したまま再生を続け、会話音声の音圧レベルがしきい値Bを下回った場合にはフェードアウトするように音量を絞るようにしてもよい。
If the attention sound effect data 14a is reproduced when the reproduction of the bass
次に、アテンション効果音データ14aを再生する際の処理について説明する。出力音制御部15は、ベース効果音データ14bの場合と同様に、会話音声から得られた音圧波形を監視する(ステップS11及びステップS11;No)。
Next, a process for reproducing the attention sound effect data 14a will be described. The output sound control unit 15 monitors the sound pressure waveform obtained from the conversational voice as in the case of the bass
そして、会話音声から得られた音圧レベルが、予め設定されたアテンション効果音用のしきい値Aを超えた場合には(ステップS11;Yes)、効果音制御部13によって、アテンション効果音データ14aがランダムに選択される(ステップS12)。さらに、効果音制御部13は、アテンション効果音データ14aを再生する際の音量レベルを所定範囲内でランダムに設定する(ステップS13)。
When the sound pressure level obtained from the conversational voice exceeds a preset threshold value A for the attention sound effect (step S11; Yes), the sound
そして、出力音制御部15が、ランダムに選択されたアテンション効果音データ14aを、ランダムに設定された音量でスピーカ30から再生する(ステップS14)。出力音制御部15は、これらの処理が行われる間も音圧レベルの監視を継続して、会話音声から得られた音圧レベルがしきい値Aを超えた場合には、次のアテンション効果音データ14aを再生する。すなわち、図5に示したように、会話音声の音圧レベルが所定のしきい値Aを超える度に、ランダムに選択されたアテンション効果音データ14aが、ランダムに設定された音量レベルで再生される。
And the output sound control part 15 reproduces | regenerates the attention sound effect data 14a selected at random from the
なお、本実施形態では、図8に示すアテンション効果音データ14aの設定テーブルを利用する態様を示したが、設定テーブルは1つである場合に限定されず、複数の設定テーブルを利用する態様であってもよい。 In the present embodiment, an aspect using the setting table of the attention sound effect data 14a shown in FIG. 8 is shown, but the present invention is not limited to a single setting table, and an aspect using a plurality of setting tables. There may be.
例えば、特定の音色のアテンション効果音を多く含むように複数の設定テーブルを用意して、会話音声に合わせて設定テーブルを選択して利用してもよい。具体的には、会話音声の音圧レベルに合わせて、音圧レベルが小さいときには静かな印象を受ける木琴等のアテンション効果音が多く含まれるテーブルを利用して、音圧レベルが大きいときには鉄琴等の強い印象を受ける音色のアテンション効果音が多く含まれるテーブルを利用する。 For example, a plurality of setting tables may be prepared so as to include a lot of attention sound effects of a specific tone color, and the setting tables may be selected and used according to the conversation voice. Specifically, a table containing a lot of attention sound effects such as xylophone, which receives a quiet impression when the sound pressure level is low, matches the sound pressure level of the conversational voice, and when the sound pressure level is high Use a table that contains a lot of attention-sounding timbres that receive a strong impression.
また、入力音解析部11が、会話音声を解析するときに、声質や性別を判定して、この判定結果に基づいて設定テーブルを選択して利用してもよい。例えば、声質や性別に応じて、会話音声をマスキングする効果や防聴音の違和感を低減する効果が高いアテンション効果音データ14aが選択されるように、設定テーブルを予め設定して利用する。具体的には、会話音声の声質に合わせて、例えば女性の高い声に対しては鉄琴等のアテンション効果音が多く含まれる設定テーブルを利用して、男性の低い声に対しては木琴等のアテンション効果音が多く含まれる設定テーブルを利用する。
Moreover, when the input
このように、アテンション効果音データ14aをランダムに選択しながらも、その音色や音の高さが、会話音声の声質等の特徴に合わせて選択されるように設定テーブルを利用すれば、会話音声に対するマスキング効果や、防聴音の違和感の低減効果をより高くすることができる。 As described above, if the setting table is used so that the tone color and the pitch of the attention sound data 14a are selected in accordance with characteristics such as the voice quality of the conversation voice while the attention sound effect data 14a is selected at random, the conversation voice can be used. It is possible to further increase the masking effect on the sound and the effect of reducing the sense of incongruity of the hearing loss.
なお、アテンション効果音データ14aを再生するときの音量レベルについても、会話音声に応じて変化させる態様であってもよい。また、ベース効果音データ14bの選択や再生時の音量レベルについても、会話音声に応じて設定する態様であっても構わない。
Note that the volume level when the attention sound effect data 14a is reproduced may be changed in accordance with the conversational voice. Further, the volume level at the time of selection and reproduction of the base
また、本実施形態では、音色を考慮してアテンション効果音の組合せを設定テーブルに設定する態様を示したが、これに加えて、ベース効果音として利用される音や曲に応じてアテンション効果音の組合せが予め設定される態様であっても構わない。具体的には、鳥のさえずりを利用したアテンション効果音の組合せを設定テーブルとして作成して、この設定テーブルを川のせせらぎの音からなるベース効果音と関連付けて利用する。これにより、ベース効果音データ14bとして川のせせらぎの音が選択された場合には、鳥のさえずりをアテンション効果音データ14aとして再生することができる。このように、ベース効果音に合わせたアテンション効果音を利用するように設定することで、聞く者に心地よい印象を与えることができる。
In this embodiment, the combination of attention sound effects is set in the setting table in consideration of the timbre, but in addition to this, the attention sound effects according to the sound and music used as the base sound effects are shown. It is also possible to adopt a mode in which these combinations are preset. More specifically, a combination of attention sound effects using the chirping of a bird is created as a setting table, and this setting table is used in association with a bass sound effect consisting of the sound of a river. As a result, when a river murmur sound is selected as the base
また、本実施形態では、図6に示すように、再生長さが同じアテンション効果音データ14aの中から3つのデータを選択して再生する態様を示した。しかし、本実施形態はこれに限定されず、選択されるアテンション効果音データ14aの数や各アテンション効果音データ14aの長さが異なる態様であっても構わない。 Further, in the present embodiment, as shown in FIG. 6, a mode is shown in which three data are selected and reproduced from the attention sound effect data 14a having the same reproduction length. However, the present embodiment is not limited to this, and the number of attention effect sound data 14a to be selected and the length of each attention effect sound data 14a may be different.
具体的には、例えば、図12(a)に示す長さtaのアテンション効果音が、同図(b)に示すように、長さが同じt1の2つのアテンション効果音データ14aを組み合わせて生成されてもよいし、同図(c)に示すように、長さが異なる3つのアテンション効果音データ14aを組み合わせて生成される態様であっても構わない。アテンション効果音については、第三者3がこの音に慣れて注意を引きつける効果が薄れないように、ランダムな印象を与えながら注意を引きつけることができれば、音色、音の高さ、音量、再生タイミング及び生成方法等が本実施形態で説明した例に限定されるものではない。
Specifically, for example, an attention sound effect having a length ta shown in FIG. 12A is generated by combining two attention effect sound data 14a having the same length t1 as shown in FIG. 12B. Alternatively, as shown in FIG. 5C, it may be generated by combining three attention sound effect data 14a having different lengths. For attention sound effects, if you can draw attention while giving a random impression so that the effect of attracting attention by
上述してきたように、本実施形態によれば、アテンション効果音データ14a及びベース効果音データ14bの2種類の音を、保護すべき会話音声の音量に応じて再生することにより、第三者3が会話の内容を聞き取り難くすることができる。
As described above, according to the present embodiment, two kinds of sounds, the attention sound effect data 14a and the base
また、アテンション効果音データ14a及びベース効果音データ14bを、会話音声の聞き取りを困難にする防聴音に加えて再生することで、会話を効果的に保護しつつ、防聴音に対する違和感を低減することができる。
Further, by reproducing the attention sound effect data 14a and the base
また、アテンション効果音データ14aを、音色、音の高さ、音量等を変更しながら再生することで聞く者にランダムな印象を与え、再生される音に慣れて防聴音に対する違和感を低減する効果が薄れることを防ぐことができる。 In addition, the attention sound effect data 14a is reproduced while changing the tone color, pitch, volume, etc., thereby giving a random impression to the listener, and getting used to the reproduced sound to reduce the sense of incongruity with the hearing loss sound. Can be prevented from fading.
以上のように、本発明は、会話音声が第三者に聞き取られないように音を再生して会話内容を保護しながら、第三者が再生した音に違和感や不快感を覚えることを防ぐために有用な技術である。 As described above, the present invention protects the content of a conversation by playing the sound so that the conversation voice is not heard by a third party, and prevents the sound played by the third party from feeling uncomfortable or uncomfortable. This is a useful technique.
10 音声処理装置
11 入力音解析部
12 防聴音生成部
13 効果音制御部
14 記憶部
14a アテンション効果音データ
14b ベース効果音データ
14c 効果音出力条件
15 出力音制御部
20 マイク
30 スピーカ
40 出力音操作部
50 テーブル
51 パーティション
52 待合席
DESCRIPTION OF
Claims (12)
数秒の間に音圧レベルが起ち上がった後減衰する時間軸波形を示すアテンション効果音と該アテンション効果音に比べて音圧レベルが緩やかに変化する時間軸波形を示すベース効果音とを保存する記憶部と、
前記会話を行う会話当事者を除く第三者に向けて、前記アテンション効果音及び前記ベース効果音のいずれか一つ又は両方を再生するためのスピーカと、
少なくとも前記マイクロホンによって集音された会話音声の音圧レベルが第1のしきい値を超えている間は前記スピーカによる前記ベース効果音を再生する制御と、前記会話音声の音圧レベルが第2のしきい値を超える度に前記アテンション効果音を再生する制御とのいずれか一つ又は両方の制御を行う制御部と
を備えることを特徴とする会話保護システム。 A microphone to collect the conversational voice,
An attention effect sound that shows a time axis waveform that decays after the sound pressure level rises within a few seconds, and a base effect sound that shows a time axis waveform whose sound pressure level changes more slowly than the attention effect sound are stored. A storage unit;
A speaker for playing one or both of the attention sound effect and the base sound effect toward a third party excluding the conversation party performing the conversation;
Control that reproduces the base sound effect by the speaker at least while the sound pressure level of the conversation voice collected by the microphone exceeds a first threshold value, and the sound pressure level of the conversation voice is a second And a control unit that controls one or both of the control to reproduce the attention sound effect every time the threshold value is exceeded.
前記制御部は、前記マスキング音生成部によって生成されたマスキング音を再生することを特徴とする請求項1〜4のいずれか1項に記載の会話保護システム。 A masking sound generator for generating a masking sound that masks the sound and makes it difficult to hear based on frequency characteristics of the sound collected by the microphone;
The conversation control system according to claim 1, wherein the control unit reproduces the masking sound generated by the masking sound generation unit.
前記制御部は、前記記憶部からランダムに選択した前記アテンション効果音を再生することを特徴とする請求項1〜6のいずれか1項に記載の会話保護システム。 The storage unit stores a plurality of the attention sound effects,
The conversation control system according to claim 1, wherein the control unit reproduces the attention sound effect selected at random from the storage unit.
前記制御部は、前記設定テーブルからランダムに選択した組合せに基づいてアテンション効果音を再生することを特徴とする請求項7に記載の会話保護システム。 In the storage unit, a combination of a plurality of attention sound effects set based on the tone color and pitch of each attention sound effect is stored as a setting table,
8. The conversation protection system according to claim 7, wherein the control unit reproduces an attention sound effect based on a combination randomly selected from the setting table.
少なくとも前記音声収集ステップで集音された会話音声の音圧レベルが第1のしきい値を超えている間は、音圧レベルが緩やかに変化する時間軸波形を示すベース効果音を再生するベース効果音再生ステップ、及び前記音声集音ステップで集音された会話音声の音圧レベルが第2のしきい値を超えた場合に、数秒の間に音圧レベルが起ち上がった後に減衰する時間軸波形を示すアテンション効果音を再生するアテンション効果音再生ステップのいずれか一つ又は両方のステップを含む効果音再生ステップと
を含むことを特徴とする会話保護方法。 A voice collection step that collects the conversational voice;
A base that reproduces a base sound effect that exhibits a time-axis waveform in which the sound pressure level gradually changes while the sound pressure level of the conversational sound collected in the sound collecting step exceeds the first threshold value. Time to decay after the sound pressure level rises for several seconds when the sound pressure level of the conversational sound collected in the sound effect reproducing step and the sound collecting step exceeds the second threshold value And a sound effect reproduction step including any one or both of the attention sound effect reproduction steps for reproducing the attention sound effect indicating the axis waveform.
をさらに含むことを特徴とする請求項11に記載の会話保護方法。 The effect of stopping the reproduction of one or both of the base sound effect and the attention sound effect when the sound pressure level of the conversational sound collected in the sound collecting step falls below a predetermined threshold value. The speech protection method according to claim 11, further comprising a sound stop step.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012003244A JP5925493B2 (en) | 2012-01-11 | 2012-01-11 | Conversation protection system and conversation protection method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012003244A JP5925493B2 (en) | 2012-01-11 | 2012-01-11 | Conversation protection system and conversation protection method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013142795A true JP2013142795A (en) | 2013-07-22 |
JP5925493B2 JP5925493B2 (en) | 2016-05-25 |
Family
ID=49039378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012003244A Expired - Fee Related JP5925493B2 (en) | 2012-01-11 | 2012-01-11 | Conversation protection system and conversation protection method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5925493B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017138506A (en) * | 2016-02-04 | 2017-08-10 | 和彦 外山 | Environmental sound generation device and environmental sound generation system using the same, environmental sound generation program, sound environment forming method and recording medium |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006243178A (en) * | 2005-03-01 | 2006-09-14 | Japan Advanced Institute Of Science & Technology Hokuriku | Method and device for processing voice, program, and voice system |
JP2007256606A (en) * | 2006-03-23 | 2007-10-04 | Aruze Corp | Sound output system |
JP2011154125A (en) * | 2010-01-26 | 2011-08-11 | Yamaha Corp | Apparatus for performing sound masking and program |
-
2012
- 2012-01-11 JP JP2012003244A patent/JP5925493B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006243178A (en) * | 2005-03-01 | 2006-09-14 | Japan Advanced Institute Of Science & Technology Hokuriku | Method and device for processing voice, program, and voice system |
JP2007256606A (en) * | 2006-03-23 | 2007-10-04 | Aruze Corp | Sound output system |
JP2011154125A (en) * | 2010-01-26 | 2011-08-11 | Yamaha Corp | Apparatus for performing sound masking and program |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017138506A (en) * | 2016-02-04 | 2017-08-10 | 和彦 外山 | Environmental sound generation device and environmental sound generation system using the same, environmental sound generation program, sound environment forming method and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP5925493B2 (en) | 2016-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5966326B2 (en) | Masker sound output device, masker sound output system, and program | |
JP4324104B2 (en) | Method and system for masking languages | |
JP5103973B2 (en) | Sound masking system, masking sound generation method and program | |
JP2017538146A (en) | Systems, methods, and devices for intelligent speech recognition and processing | |
BR112017015388B1 (en) | SPEECH REPRODUCTION DEVICE CONFIGURED TO MASK SPEECH REPRODUCED IN A MASKED SPEECH ZONE | |
US20210104222A1 (en) | Wearable electronic device for emitting a masking signal | |
JP2014130251A (en) | Conversation protection system and conversation protection method | |
JP2011123141A (en) | Device and method for changing voice and voice information privacy system | |
US10978040B2 (en) | Spectrum matching in noise masking systems | |
JP5747490B2 (en) | Masker sound generation device, masker sound output device, and masker sound generation program | |
JP5925493B2 (en) | Conversation protection system and conversation protection method | |
JP5682115B2 (en) | Apparatus and program for performing sound masking | |
JP3232321B2 (en) | Auditory training method, auditory training sound processing method, auditory training sound processor, and auditory training recording medium | |
JP6300328B2 (en) | ENVIRONMENTAL SOUND GENERATION DEVICE, ENVIRONMENTAL SOUND GENERATION SYSTEM, ENVIRONMENTAL SOUND GENERATION PROGRAM, SOUND ENVIRONMENT FORMING METHOD, AND RECORDING MEDIUM | |
JP5790021B2 (en) | Audio output system | |
JP2012008393A (en) | Device and method for changing voice, and confidential communication system for voice information | |
JP5054477B2 (en) | Hearing aid | |
JP7195020B2 (en) | Privacy system and privacy improvement method | |
US10835413B2 (en) | Fluency aid | |
JP5114615B2 (en) | Sound playback device | |
JP2832202B2 (en) | Natural sound reproduction device | |
JP5644268B2 (en) | Confidential data generating device, concealed data generating method, concealing device, concealing method and program | |
JP2002182674A (en) | Recording medium for music therapy program | |
JPH05173587A (en) | Speech synthesizer | |
JP2006053504A (en) | Sound eliminating device for vocal exercise |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150901 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151029 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160420 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5925493 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |