JP2016178584A - Audio processing device, intercom device and intercom system - Google Patents
Audio processing device, intercom device and intercom system Download PDFInfo
- Publication number
- JP2016178584A JP2016178584A JP2015059077A JP2015059077A JP2016178584A JP 2016178584 A JP2016178584 A JP 2016178584A JP 2015059077 A JP2015059077 A JP 2015059077A JP 2015059077 A JP2015059077 A JP 2015059077A JP 2016178584 A JP2016178584 A JP 2016178584A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- signal
- microphone
- average value
- reverberation time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Interconnected Communication Systems, Intercoms, And Interphones (AREA)
- Telephone Function (AREA)
Abstract
Description
本発明は、マイクから入力される信号を処理する音声処理装置、インターホン装置、及びインターホンシステムに関する。 The present invention relates to a sound processing device, an intercom device, and an intercom system that process a signal input from a microphone.
マンション等の集合住宅ではロビーにインターホンを設置する場合が多い。来訪者はロビーに設置されたインターホンから住戸内の住人に来訪を伝え、住人が解錠すると来訪者が中に入ることができる。ロビーは空間が広いため残響の影響が大きくなる。 Intercoms are often installed in the lobby of apartment buildings. The visitor can tell the visitor to the residents in the dwelling through the intercom installed in the lobby, and the visitor can enter when the resident unlocks. The lobby has a large space and the effect of reverberation increases.
インターホンでは、送話と受話の音声を比較して大きい方の音声を優先させるボイススイッチ機能が使用されることがある(例えば、特許文献1参照)。 In the intercom, a voice switch function that prioritizes the larger voice by comparing the voices of the transmitted and received voices may be used (for example, see Patent Document 1).
ロビーのように残響の影響が大きい場所では、音声と騒音の判別が難しくなる。従って来訪者が発話している最中に音声を騒音と誤判定する場合が発生し、その場合、送話を優先するモードから中間モードに切り替わってしまうため快適な通話が阻害されることがあった。 In a place such as a lobby where the influence of reverberation is large, it becomes difficult to distinguish between voice and noise. Therefore, when a visitor is speaking, there is a case where the voice is erroneously determined as noise, and in this case, the mode that prioritizes transmission is switched from the intermediate mode to the comfortable mode, which may hinder a comfortable call. It was.
本発明はこうした状況に鑑みなされたものであり、その目的は、設置位置の環境に関わらず、快適な通話を実現する音声処理装置、インターホン装置、及びインターホンシステムを提供することにある。 The present invention has been made in view of such circumstances, and an object of the present invention is to provide a voice processing device, an intercom device, and an intercom system that realize a comfortable call regardless of the environment of the installation position.
上記課題を解決するために、本発明のある態様の音声処理装置は、マイクから入力される信号をスピーカへ出力する信号より優先させる送話モードを選択可能なボイススイッチ部と、前記マイクから入力される信号から音声信号を含む音声区間を検出する音声信号検出部と、を備える。前記ボイススイッチ部は、前記音声信号検出部において前記音声区間が検出されているとき前記送話モードを選択し、前記音声信号検出部は、残響時間に応じて前記音声区間と判定する感度を調整する。 In order to solve the above problems, a speech processing apparatus according to an aspect of the present invention includes a voice switch unit capable of selecting a transmission mode in which a signal input from a microphone is given priority over a signal output to a speaker, and an input from the microphone. A voice signal detection unit that detects a voice section including a voice signal from the received signal. The voice switch unit selects the transmission mode when the voice section is detected by the voice signal detection unit, and the voice signal detection unit adjusts sensitivity for determining the voice section according to reverberation time. To do.
本発明の別の態様は、インターホン装置である。この装置は、上述の音声処理装置と、集音した音を電気信号に変換して前記音声処理装置に入力するマイクと、前記音声処理装置から出力される電気信号を音に変換するスピーカと、を備える。 Another aspect of the present invention is an intercom device. This device includes the above-described sound processing device, a microphone that converts collected sound into an electric signal and inputs the electric signal, a speaker that converts an electric signal output from the sound processing device into sound, Is provided.
本発明のさらに別の態様は、インターホンシステムである。このインターホンシステムは、インターホン室内装置と、前記インターホン室内装置と通信するためのインターホン室外装置であり、上述のインターホン装置が使用されるインターホン室外装置と、を備える。 Yet another embodiment of the present invention is an intercom system. This intercom system includes an interphone indoor device and an interphone outdoor device for communicating with the interphone indoor device, and an interphone outdoor device in which the above-described interphone device is used.
なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システムなどの間で変換したものもまた、本発明の態様として有効である。 It should be noted that any combination of the above-described constituent elements and a representation of the present invention converted between a method, an apparatus, a system, and the like are also effective as an aspect of the present invention.
本発明によれば、設置位置の環境に関わらず、快適な通話を実現できる。 According to the present invention, a comfortable call can be realized regardless of the environment of the installation position.
図1は、本発明の実施の形態に係るインターホンシステム1の構成を示す図である。本実施の形態ではインターホンシステム1をマンションに設置する例を想定する。インターホンシステム1はロビーインターホン装置10、制御装置20、インターホン室内装置30及びドアインターホン装置40を備える。
FIG. 1 is a diagram showing a configuration of an intercom system 1 according to an embodiment of the present invention. In the present embodiment, it is assumed that the intercom system 1 is installed in an apartment. The intercom system 1 includes a
ロビーインターホン装置10はロビーに設置されたインターホン室外装置であり、来訪者は部屋番号を入力して、訪問先の住戸内に設置されたインターホン室内装置30を発呼する。制御装置20は機械室や管理人室などの共用スペースに設置される。制御装置20はロビーインターホン装置10とインターホン室内装置30との間の信号を中継する。ドアインターホン装置40は住戸玄関に設置される。インターホン室内装置30とドアインターホン装置40は親機と子機の関係にある。
The
なお図1では単純化するため1つの住戸しか描いていないが、実際には多数の住戸が存在し、制御装置20は複数のインターホン室内装置30とロビーインターホン装置10との間を中継する。また制御装置20は分電盤や各種のセンサに接続されており、火災などの異常が発生した際、各住戸のインターホン室内装置30にアラート信号を送信する。
Although only one dwelling unit is illustrated in FIG. 1 for simplification, there are actually a large number of dwelling units, and the
図2は、ロビーインターホン装置10の構成を示す図である。ロビーインターホン装置10はマイク11a、マイクアンプ11b、A/D変換器11c、スピーカ12a、スピーカアンプ12b、D/A変換器12c、処理部13、通信部17及び操作部18を備える。処理部13は音声処理部14、残響時間設定部15及び残響時間推定部16を備える。音声処理部14は音声信号検出部141及びボイススイッチ部142を含む。
FIG. 2 is a diagram illustrating a configuration of the
図2の処理部13の機能ブロックには、本実施の形態で注目する処理に関連する機能ブロックのみを描いている。処理部13の機能はハードウェア資源とソフトウェア資源の協働、又はハードウェア資源のみにより実現できる。ハードウェア資源としてプロセッサ、ROM、RAM、その他のLSIを利用できる。ソフトウェア資源としてファームウェア、アプリケーション等のプログラムを利用できる。
In the functional block of the
マイク11aは来訪者の声を集音し、電気信号に変換してマイクアンプ11bに出力する。マイクアンプ11bはマイク11aから入力される信号を増幅してA/D変換器11cに出力する。A/D変換器11cはマイクアンプ11bから入力されるアナログ信号をデジタル信号に変換して音声処理部14に出力する。
The
通信部17は、ロビーインターホン装置10のマイク11aまたはインターホン室内装置30で集音された音を変換して生成される電気信号(以下、音信号という)を制御装置20を介してインターホン室内装置30と双方向通信するための通信インタフェースである。音声処理部14は通信部17を介してインターホン室内装置30から受信した音信号を処理してD/A変換器12cに出力する。なお音信号が圧縮符号化されている場合は伸張復号する。なお伸張復号は音声処理部14の前段の復号部(不図示)で行ってもよい。
The
D/A変換器12cは、音声処理部14から入力されるデジタル信号をアナログ信号に変換してスピーカアンプ12bに出力する。スピーカアンプ12bはD/A変換器12cから入力される信号を増幅してスピーカ12aに出力する。スピーカ12aは、スピーカアンプ12bから入力される電気信号を物理的な振動に変換して出力する。
The D /
操作部18はユーザの操作を受け付けるためのユーザインタフェースである。操作部18は少なくとも、部屋番号を入力するためのテンキーボタン、呼出ボタンを備える。
The
ボイススイッチ部142は、マイク11aから入力される信号をスピーカ12aへ出力する信号より優先させる送話モード、及びスピーカ12aへ出力する信号をマイク11aから入力される信号より優先させる受話モードを選択できる。送話モードでは、通信部17を介して入力される音信号を減衰する。100%減衰してスピーカ12aから音声出力されない設計でもよいし、100%未満の減衰率で減衰してスピーカ12aから出力される音声レベルを下げる設計でもよい。またマイクアンプ11bの増幅率を上げる処理を併用してもよい。
The
一方、受話モードではマイク11aから入力される信号を減衰する。100%減衰して有意な信号をインターホン室内装置30に送出しない設計でもよいし、信号レベルを下げてインターホン室内装置30に送出する設計でもよい。またスピーカアンプ12bの増幅率を上げる処理を併用してもよい。なおボイススイッチ部142は、マイク11aから入力される信号およびスピーカ12aへ出力する信号を同じ減衰量で減衰させる中間モードも選択できる。
On the other hand, in the reception mode, the signal input from the
図2では、信号の減衰処理をデジタル信号処理による数値演算で実現する例を想定しているが、アナログ素子で構成される減衰器を使用してもよい。その場合、A/D変換器11c及びD/A変換器12cは、ボイススイッチ部142と通信部17の間に移動される。
Although FIG. 2 assumes an example in which signal attenuation processing is realized by numerical calculation by digital signal processing, an attenuator constituted by analog elements may be used. In that case, the A /
音声信号検出部141は、マイク11aから入力される信号から音声区間を検出する。以下の説明では音声とは人間により発声された音を指し、音声信号検出部141は人間により発声された音を含む区間を音声区間と判定し、人間により発声された音を含まない環境音のみの区間を非音声区間と判定する。ボイススイッチ部142は、音声信号検出部141において音声区間が検出されているとき送話モードを選択し、非音声区間が検出されているとき受話モードまたは中間モードを選択する。
The audio
音声信号検出部141は具体的には、マイク11aから入力される信号絶対値の長期の移動平均値Nと、短期の移動平均値Sを算出する。音声信号検出部141は短期の移動平均値Sと長期の移動平均値Nとの比率S/Nを算出し、当該比率S/Nが設定比率α以上であれば音声区間と判定し、設定比率α未満であれば非音声区間と判定する。すなわち短期の移動平均値Sが長期の移動平均値Nより設定比率α以上大きくなると音声区間に突入と判定する。反対に短期の移動平均値Sが長期の移動平均値Nの設定比率α未満になると非音声区間に復帰と判定する。
Specifically, the audio
通常、音声信号の振幅の方が騒音信号の振幅より大きくなるため、音声信号を含む区間は振幅が大きくなる。音声および騒音とも振幅が小刻みに変動するため、単純に信号レベルが大きいとき音声区間と判定する方法では、判定結果が音声区間と非音声区間との間で頻繁に切り替わることになる。そこで一定期間の平均値を使用して信号データにヒステリシスを持たせる。音声が存在しない状態から音声が存在する状態に変化したとき、短期の移動平均値Sの方が長期の移動平均値Nより先に立ち上がることになる。長期の移動平均値Nの方が、より過去のデータを多く含んで平均化された値であるため短期の移動平均値Sより変化が緩やかなためである。 Usually, since the amplitude of the audio signal is larger than the amplitude of the noise signal, the amplitude including the audio signal has a larger amplitude. Since the amplitude of both voice and noise fluctuates little by little, in the method of simply determining a voice section when the signal level is high, the determination result is frequently switched between a voice section and a non-voice section. Therefore, hysteresis is given to the signal data using an average value for a certain period. When the state where there is no sound is changed to the state where there is sound, the short-term moving average value S rises before the long-term moving average value N. This is because the long-term moving average value N is a value averaged by including more past data, and therefore changes more slowly than the short-term moving average value S.
音声信号検出部141は、残響時間に応じて音声区間と判定する感度を調整する。具体的には残響時間が長いほど音声区間と判定する感度を高くする。残響とは音源が振動を停止した後も音が響いて聞こえる現象を指す。一般的に残響時間は、音源が振動を停止してから60デシベル減衰するまでの時間と定義される。残響時間は、音が鳴っている空間が広いほど長くなる性質がある。従って広いロビーでは残響時間が長くなる。残響時間が長くなると音声に追加されて集音される残響の影響が大きくなる。
The audio
図3は、マイク11aにより集音される信号波形の一例を示す図である。図3では、同じ音声(こんにちは)を残響の影響が小さい環境下で集音した場合の信号波形と、残響の影響が大きい環境下で集音した場合の信号波形を模式的に描いている。残響の影響が大きい環境下で集音した信号波形の方が振幅の変動が小さくなることが分かる。振幅の変動が小さくなと、短期の移動平均値Sと長期の移動平均値Nとの乖離が小さくなる方向に作用するため、音声を騒音と誤検出しやすくなる。
FIG. 3 is a diagram illustrating an example of a signal waveform collected by the
そこで音声信号検出部141は残響時間が長いとき、音声区間と判定される感度を高くして、通常より音声区間と判定されやすくする。以下、音声検出の判定感度を上げる3つの方法を説明する。第1の方法では音声信号検出部141は、残響時間が長いほど長期の移動平均値Nを算出する対象期間を長くする。
Therefore, when the reverberation time is long, the audio
図4は、マイク11aにより集音される信号の移動平均値波形の一例を示す図である。音声(こんにちは)が存在する区間では、短期の移動平均値波形の方が長期の移動平均値波形より大きくなる。長期の移動平均値は音声が存在するようになる前の期間のデータを多く含むため、短期の移動平均値より相対的に小さくなる。対象期間が相対的に長い「長期の移動平均波形」と、対象期間が相対的に短い「長期の移動平均波形」を比較すると、前者の方がより、音声が存在するようになる前の期間のデータをより多く含むことになる。従って前者の方が後者よりレベルが小さくなる。よって、対象期間が相対的に長い「長期の移動平均値」を使用した方が短期の移動平均値との差分が大きなり、音声区間と判定されやすくなる。残響時間が長くなるほど長期の移動平均値と短期の移動平均値との乖離が小さくなる方向に作用するが、長期の移動平均値の対象期間を延長することにより、その影響を相殺または緩和できる。
FIG. 4 is a diagram illustrating an example of a moving average value waveform of a signal collected by the
音声検出の判定感度を上げる第2の方法では音声信号検出部141は、残響時間が長いほど短期の移動平均値Sを算出する対象期間を短くする。
In the second method of increasing the detection sensitivity of voice detection, the voice
図5は、マイク11aにより集音される信号の移動平均値波形の別の例を示す図である。図5において対象期間が相対的に短い「短期の移動平均波形」と、対象期間が相対的に長い「短期の移動平均波形」を比較すると、前者の方が振幅の変動が大きくなる。従って対象期間が相対的に短い「短期の移動平均値」を使用した方が長期の移動平均値との差分が大きくなりやすく音声区間と判定されやすくなる。残響時間が長くなるほど長期の移動平均値と短期の移動平均値との乖離が小さくなる方向に作用するが、短期の移動平均値の対象期間を縮小することにより、その影響を相殺または緩和できる。
FIG. 5 is a diagram showing another example of the moving average waveform of the signal collected by the
音声検出の判定感度を上げる第3の方法では音声信号検出部141は、残響時間が長いほど設定比率αを小さくする。設定比率αを小さくすれば、短期の移動平均値Sと長期の移動平均値Nとの比率S/Nが設定比率α以上になりやすくなり、音声区間と判定されやすくなる。
In the third method of increasing the detection sensitivity of the sound detection, the sound
以上の説明において、短期の移動平均値Sの対象期間(すなわちデータサンプル数)、長期の移動平均値Nの対象期間、設定比率αのそれぞれ値には、実験やシミュレーションをもとに導出した値を用いることができる。また残響時間の変化値と、長期の移動平均値Nの対象期間の変化値との関係も実験やシミュレーションをもとに導出した関係を用いることができる。当該関係は関数で規定してもよいし、当該関係を記述したテーブルを用いてもよい。長期の移動平均値Nの対象期間、又は設定比率αを変化させる場合も同様である。 In the above description, each of the target period of the short-term moving average value S (that is, the number of data samples), the target period of the long-term moving average value N, and the setting ratio α are values derived from experiments and simulations. Can be used. Moreover, the relationship derived | led-out based on experiment and simulation can also be used for the relationship between the change value of reverberation time, and the change value of the target period of the long-term moving average value N. FIG. The relationship may be defined by a function, or a table describing the relationship may be used. The same applies when the target period of the long-term moving average value N or the set ratio α is changed.
また残響時間と、長期の移動平均値Nの対象期間との関係はモードで規定してもよい。例えば残響時間に「短」、「普通」、「長」の3モードを用意し、長期の移動平均値Nの対象期間にも「短」、「普通」、「長」の3モードを用意する。残響時間のモードが「長」に設定されている場合、音声信号検出部141は対象期間が「長」の場合のサンプル数で長期の移動平均値Nを算出する。
Further, the relationship between the reverberation time and the target period of the long-term moving average value N may be defined by the mode. For example, three modes of “short”, “normal”, and “long” are prepared for the reverberation time, and three modes of “short”, “normal”, and “long” are prepared for the target period of the long-term moving average value N. . When the reverberation time mode is set to “long”, the audio
図2に戻る。残響時間設定部15は残響時間を音声信号検出部141に設定する。残響時間設定部15は、操作部18からユーザにより入力された残響時間の値を、音声信号検出部141に設定する。例えばロビーインターホン装置10の施工時、施工業者が騒音計を用いてロビーの残響時間を測定し、測定した値を操作部18から入力してもよい。
Returning to FIG. The reverberation
このように残響時間にはユーザにより入力された値を使用できるが、推定値を使用することもできる。また推定値を使用したほうが、壁の材質変更、温度、湿度などの環境条件の変化を直ぐに残響時間に反映できる。残響時間推定部16は、マイク11aから入力される信号を解析して残響時間を推定する。例えば残響時間推定部16は、マイク11aから入力される信号の音声区間の終了からの傾きを検出することにより残響時間を推定できる。
Thus, although the value input by the user can be used for the reverberation time, an estimated value can also be used. In addition, using estimated values can immediately reflect changes in environmental conditions such as wall material changes, temperature, and humidity in the reverberation time. The reverberation
図6(a)−(c)は、発話音声信号のレベル推移、残響の影響が小さい場合のマイク入力信号のレベル推移、及び残響の影響が大きい場合のマイク入力信号のレベル推移を模式的に描いた図である。図6(b)と図6(c)を比較すると、図6(c)に示す残響の影響が大きい場合のマイク入力信号の方が発話音声の文末からの傾きが緩くなる。残響時間推定部16は例えば、音声区間から非音声期間に切り替わってから、マイク入力信号のレベルが非音声期間の平均レベルに到達するまでの時間を測定することにより残響時間を推定する。このような来訪者の発話音声を利用する方法では、後述するようなスピーカ12aから音を出力する必要がなく、テスト用の音源データを用意する必要もない。
6A to 6C schematically show the transition of the level of the speech signal, the transition of the level of the microphone input signal when the influence of reverberation is small, and the transition of the level of the microphone input signal when the influence of reverberation is large. It is the figure drawn. Comparing FIG. 6 (b) and FIG. 6 (c), the microphone input signal when the influence of reverberation shown in FIG. For example, the reverberation
残響時間の推定に使用するマイク入力信号は発話音声を含む信号に限るものではない。例えば残響時間推定部16はスピーカ12aから音を出力させ、その音をマイク11aから集音して残響時間を推定してもよい。この場合、スピーカ12aからの出力音の終了タイミングを厳密に特定できるため、より高精度に残響時間を推定することができる。
The microphone input signal used for estimating the reverberation time is not limited to the signal including the speech sound. For example, the reverberation
図7(a)−(c)は、スピーカ出力信号のレベル推移、残響の影響が小さい場合のマイク入力信号のレベル推移、及び残響の影響が大きい場合のマイク入力信号のレベル推移を模式的に描いた図である。図7(b)と図7(c)を比較すると、図7(c)に示す残響の影響が大きい場合のマイク入力信号の方がスピーカ出力の終了時点からの傾きが緩くなる。スピーカ出力信号を使用する場合、残響時間推定部16はスピーカ出力の終了時から、マイク入力信号のレベルが非音声期間の平均レベルに到達するまでの時間を測定することにより残響時間を推定する。
7A to 7C schematically show the level transition of the speaker output signal, the level transition of the microphone input signal when the influence of reverberation is small, and the level transition of the microphone input signal when the influence of reverberation is large. It is the figure drawn. Comparing FIG. 7B and FIG. 7C, the inclination of the microphone input signal when the influence of the reverberation shown in FIG. When the speaker output signal is used, the reverberation
残響時間推定部16は、スピーカ12aから出力させる残響推定用テスト信号の音源データを保持するテスト音源データ保持部16aを備えていてもよい。残響時間推定部16は音声処理部14の起動シーケンスにおいて、テスト音源データ保持部16aから音源データを読み出してスピーカ12aからテスト音を出力させる。残響時間推定部16は当該テスト音をマイク11aで集音し、残響時間を推定する。残響時間は温度や湿度の影響も受けるため音声処理部14の起動の度に残響時間を推定することは、その時点の環境に合致した残響時間を使用する観点から望ましい制御といえる。
The reverberation
なお残響推定用テスト信号の音源データとして、来訪者が住人を呼び出す際に鳴動させるバックトーンの音源データを流用してもよい。この場合、残響推定用テスト信号の音源データを別途に用意する必要がなくなる。残響時間推定部16は呼出しボタンが押下される度に、マイク11aから呼出音を集音して残響時間を推定してもよい。
It should be noted that as the sound source data of the reverberation estimation test signal, back tone sound source data that rings when a visitor calls a resident may be used. In this case, it is not necessary to separately prepare sound source data for the reverberation estimation test signal. The reverberation
残響時間推定部16は、スピーカ12aから出力される通話中の受話音声を、マイク11aから集音して残響時間を推定してもよい。この推定処理は、ボイススイッチ部142が受話モードを選択してるときに実行することが好ましい。この場合も、残響推定用テスト信号の音源データを別途に用意する必要がなくなる。
The reverberation
以上説明したように本実施の形態によれば、残響時間に応じて音声信号検出部141において音声区間と判定する感度を調整することにより、送話モードと受話モードのスイッチング精度が高くなり快適な通話を実現できる。特にロビーなどの残響の影響が大きい場所に設置されるインターホン装置に有効である。また残響時間推定部16を設けることにより、設置場所の環境変化をリアルタイムにボイススイッチ機能に反映させることができる。
As described above, according to the present embodiment, the switching accuracy between the transmission mode and the reception mode is increased and comfortable by adjusting the sensitivity of the audio
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。 The present invention has been described based on the embodiments. The embodiments are exemplifications, and it will be understood by those skilled in the art that various modifications can be made to combinations of the respective constituent elements and processing processes, and such modifications are within the scope of the present invention. .
上記の実施の形態では、短期の移動平均値Sと長期の移動平均値Nとの比率S/Nが設定比率α以上のとき音声区間と判定する方法を説明したが、短期の移動平均値Sと長期の移動平均値Nとの差分(S−N)が設定値β以上のとき音声区間と判定してもよい。 In the above embodiment, the method of determining a voice section when the ratio S / N between the short-term moving average value S and the long-term moving average value N is greater than or equal to the set ratio α has been described. If the difference (S−N) between the long-term moving average value N and the long-term moving average value N is equal to or larger than the set value β, it may be determined that the voice section.
上記の実施の形態では、ボイススイッチ部142を含む音声処理部14をロビーインターホン装置10に搭載する例を説明した。この点、音声処理部14をドアインターホン装置40またはインターホン室内装置30に搭載してもよい。なおドアインターホン装置40のマイクで集音される残響の影響を低減するための音声処理部14を、親機としてのインターホン室内装置30に搭載してもよい。ドアインターホン装置40が設置される廊下も比較的残響が大きい場所であるため、音声処理部14を搭載する意義が大きい。
In the above embodiment, the example in which the
また住戸内の天井が高いなど、住戸内の空間が広い場合はインターホン室内装置30のマイクで集音される残響の影響を低減するための音声処理部14をインターホン室内装置30に搭載してもよい。
Further, when the space in the dwelling unit is wide, such as when the ceiling in the dwelling unit is high, the
また音声処理部14を制御装置20に搭載してもよい。制御装置20がロビーインターホン装置10とインターホン室内装置30間の音信号を中継する際、ボイススイッチを適用してもよい。その場合、残響時間推定部16は制御装置20に搭載されてもロビーインターホン装置10に搭載されてもよい。後者の場合、残響時間推定部16が推定した残響時間は幹線を介して制御装置20に伝達されることになる。
Further, the
上記の実施の形態ではマンションに設置されるインターホンシステム1を説明したが、戸建てに設置されるインターホンシステム1にも同様に適用できる。戸建てに設置されるインターホンシステム1では、ロビーインターホン装置10及び制御装置20が設けられない。上述のボイススイッチ機能は、インターホン室内装置30とドアインターホン装置40間の音信号に適用される。
In the above embodiment, the intercom system 1 installed in a condominium has been described. However, the present invention can be similarly applied to an intercom system 1 installed in a detached house. In the intercom system 1 installed in a detached house, the
なお、実施の形態は、以下の項目によって特定されてもよい。 The embodiment may be specified by the following items.
[項目1]
マイク11aから入力される信号をスピーカ12aへ出力する信号より優先させる送話モードを選択可能なボイススイッチ部142と、
前記マイク11aから入力される信号から音声信号を含む音声区間を検出する音声信号検出部141と、を備え、
前記ボイススイッチ部142は、前記音声信号検出部141において前記音声区間が検出されているとき前記送話モードを選択し、
前記音声信号検出部141は、残響時間に応じて前記音声区間と判定する感度を調整することを特徴とする音声処理装置(音声処理部14)。
これにより、残響により音声区間と判定する精度が低下することを抑制できる。
[項目2]
前記音声信号検出部141は、設定される残響時間が長いほど音声区間と判定する感度を高くすることを特徴とする項目1に記載の音声処理装置(音声処理部14)。
これにより、残響の影響により音声区間を非音声区間と誤判定する確率を低減できる。
[項目3]
前記音声信号検出部141は、前記マイク11aから入力される信号の短期の移動平均値が、長期の移動平均値より閾値以上大きいとき音声区間と判定し、設定される残響時間が長いほど前記長期の移動平均値を算出する対象期間を長くすることを特徴とする項目1または2に記載の音声処理装置(音声処理部14)。
これにより、長期の移動平均値を下側にシフトさせることができ、音声区間と判定する感度を高めることができる。
[項目4]
前記音声信号検出部141は、前記マイク11aから入力される信号の短期の移動平均値が、長期の移動平均値より閾値以上大きいとき音声区間と判定し、設定される残響時間が長いほど前記短期の移動平均値を算出する対象期間を短くすることを特徴とする項目1または2に記載の音声処理装置(音声処理部14)。
これにより、短期の移動平均値の変化を大きくさせることができ、音声区間と判定する感度を高めることができる。
[項目5]
前記音声信号検出部141は、前記マイク11aから入力される信号の短期の移動平均値が、長期の移動平均値より閾値以上大きいとき音声区間と判定し、設定される残響時間が長いほど前記閾値を小さくすることを特徴とする項目1または2に記載の音声処理装置(音声処理部14)。
これにより、短期の移動平均値と長期の移動平均値との比率または差分が、設定比率または設定値以上となる確率を上げることができ、音声区間と判定する感度を高めることができる。
[項目6]
前記残響時間は、ユーザ入力により設定されることを特徴とする項目1から5のいずれかに記載の音声処理装置(音声処理部14)。
これにより、残響時間を設置環境に応じた値に設定できる。
[項目7]
前記残響時間は、前記マイク11aから入力される信号を解析して前記残響時間を推定する残響時間推定部から設定されることを特徴とする項目1から5のいずれかに記載の音声処理装置(音声処理部14)。
これにより、残響時間を設置環境をリアルタイムに反映した値に設定できる。
[項目8]
項目1から7のいずれかに記載の音声処理装置(音声処理部14)と、
集音した音を電気信号に変換して前記音声処理装置(音声処理部14)に入力するマイク11aと、
前記音声処理装置(音声処理部14)から出力される電気信号を音に変換するスピーカ12aと、
を備えることを特徴とするインターホン装置(ロビーインターホン装置10)。
これにより、残響により音声区間と判定する精度が低下することを抑制でき、快適な通話が可能なインターホン装置を実現できる。
[項目9]
インターホン室内装置(インターホン室内装置30)と、
前記インターホン室内装置(インターホン室内装置30)と通信するためのインターホン室外装置(ロビーインターホン装置10)であり、項目8に記載のインターホン装置が使用されるインターホン室外装置(ロビーインターホン装置10)と、
を備えることを特徴とするインターホンシステム1。
これにより、残響により音声区間と判定する精度が低下することを抑制でき、快適な通話が可能なインターホンシステムを実現できる。
[Item 1]
A
An
The
The audio
Thereby, it can suppress that the precision which determines with a speech area by reverberation falls.
[Item 2]
The sound processing device (sound processing unit 14) according to item 1, wherein the sound
Thereby, it is possible to reduce the probability of erroneously determining a speech segment as a non-speech segment due to reverberation.
[Item 3]
The voice
Thereby, a long-term moving average value can be shifted to the lower side, and the sensitivity for determining a voice segment can be increased.
[Item 4]
The voice
Thereby, the change of a short-term moving average value can be enlarged, and the sensitivity which determines with a speech area can be improved.
[Item 5]
The voice
Thereby, it is possible to increase the probability that the ratio or difference between the short-term moving average value and the long-term moving average value is equal to or higher than the set ratio or the set value, and to increase the sensitivity for determining the voice section.
[Item 6]
6. The voice processing device (voice processing unit 14) according to any one of items 1 to 5, wherein the reverberation time is set by user input.
Thereby, the reverberation time can be set to a value according to the installation environment.
[Item 7]
The speech processing apparatus according to any one of Items 1 to 5, wherein the reverberation time is set by a reverberation time estimation unit that analyzes a signal input from the
Thereby, the reverberation time can be set to a value reflecting the installation environment in real time.
[Item 8]
The voice processing device (voice processing unit 14) according to any one of items 1 to 7,
A
A
An intercom device (lobby intercom device 10).
Thereby, it can suppress that the precision which determines with an audio | voice area falls by reverberation, and can implement | achieve the intercom apparatus in which a comfortable telephone call is possible.
[Item 9]
An intercom indoor device (interphone indoor device 30);
An intercom outdoor device (lobby interphone device 10) for communicating with the intercom indoor device (interphone indoor device 30), an interphone outdoor device (lobby interphone device 10) in which the interphone device according to item 8 is used,
An intercom system 1 comprising:
Thereby, it can suppress that the precision which determines with an audio | voice area falls by reverberation, and can implement | achieve the intercom system in which a comfortable telephone call is possible.
1 インターホンシステム、 10 ロビーインターホン装置、 11a マイク、 11b マイクアンプ、 11c A/D変換器、 12a スピーカ、 12b スピーカアンプ、 12c D/A変換器、 13 処理部、 14 音声処理部、 141 音声信号検出部、 142 ボイススイッチ部、 15 残響時間設定部、 16 残響時間推定部、 16a テスト音源データ保持部、 17 通信部、 18 操作部、 20 制御装置、 30 インターホン室内装置、 40 ドアインターホン装置。 DESCRIPTION OF SYMBOLS 1 Intercom system, 10 Lobby intercom apparatus, 11a microphone, 11b Microphone amplifier, 11c A / D converter, 12a Speaker, 12b Speaker amplifier, 12c D / A converter, 13 Processing part, 14 Sound processing part, 141 Sound signal detection Unit, 142 voice switch unit, 15 reverberation time setting unit, 16 reverberation time estimation unit, 16a test sound source data holding unit, 17 communication unit, 18 operation unit, 20 control device, 30 intercom indoor device, 40 door intercom device.
Claims (9)
前記マイクから入力される信号から音声信号を含む音声区間を検出する音声信号検出部と、を備え、
前記ボイススイッチ部は、前記音声信号検出部において前記音声区間が検出されているとき前記送話モードを選択し、
前記音声信号検出部は、残響時間に応じて前記音声区間と判定する感度を調整することを特徴とする音声処理装置。 A voice switch unit capable of selecting a transmission mode in which a signal input from a microphone is given priority over a signal output to a speaker;
A voice signal detection unit that detects a voice section including a voice signal from a signal input from the microphone;
The voice switch unit selects the transmission mode when the voice section is detected in the voice signal detection unit,
The voice processing apparatus, wherein the voice signal detection unit adjusts sensitivity for determining the voice section according to reverberation time.
集音した音を電気信号に変換して前記音声処理装置に入力するマイクと、
前記音声処理装置から出力される電気信号を音に変換するスピーカと、
を備えることを特徴とするインターホン装置。 A voice processing device;
A microphone that converts the collected sound into an electrical signal and inputs it to the sound processing device;
A speaker that converts an electrical signal output from the audio processing device into sound;
An intercom apparatus comprising:
前記インターホン室内装置と通信するためのインターホン室外装置であり、請求項8に記載のインターホン装置が使用されるインターホン室外装置と、
を備えることを特徴とするインターホンシステム。 Intercom indoor unit,
An intercom outdoor device for communicating with the intercom indoor device, wherein the intercom outdoor device in which the interphone device according to claim 8 is used;
An intercom system comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015059077A JP6485739B2 (en) | 2015-03-23 | 2015-03-23 | Audio processing device, intercom device, and intercom system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015059077A JP6485739B2 (en) | 2015-03-23 | 2015-03-23 | Audio processing device, intercom device, and intercom system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016178584A true JP2016178584A (en) | 2016-10-06 |
JP6485739B2 JP6485739B2 (en) | 2019-03-20 |
Family
ID=57070364
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015059077A Expired - Fee Related JP6485739B2 (en) | 2015-03-23 | 2015-03-23 | Audio processing device, intercom device, and intercom system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6485739B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107819964A (en) * | 2017-11-10 | 2018-03-20 | 广东欧珀移动通信有限公司 | Improve method, apparatus, terminal and the computer-readable recording medium of speech quality |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59196659A (en) * | 1983-04-22 | 1984-11-08 | Nec Corp | Conference telephone set |
JPH02260857A (en) * | 1988-12-28 | 1990-10-23 | American Teleph & Telegr Co <Att> | Sound exchanging device and audio signal processing method |
JPH04287548A (en) * | 1990-11-30 | 1992-10-13 | American Teleph & Telegr Co <Att> | Voice exchange device and judging method of sound responce |
JPH0678046A (en) * | 1992-08-25 | 1994-03-18 | Fujitsu Ltd | Voice switch for hand-free system |
JP2003092623A (en) * | 2001-09-17 | 2003-03-28 | Toshiba Corp | Voice communication device and its voice signal processing module |
JP2005347875A (en) * | 2004-05-31 | 2005-12-15 | Matsushita Electric Works Ltd | Loudspeaking speech apparatus |
JP2007110527A (en) * | 2005-10-14 | 2007-04-26 | Matsushita Electric Works Ltd | Laudspeaker call device |
JP2012099884A (en) * | 2010-10-29 | 2012-05-24 | Aiphone Co Ltd | Intercom device |
JP2014230017A (en) * | 2013-05-21 | 2014-12-08 | シャープ株式会社 | Echo suppressor and echo suppression method |
-
2015
- 2015-03-23 JP JP2015059077A patent/JP6485739B2/en not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59196659A (en) * | 1983-04-22 | 1984-11-08 | Nec Corp | Conference telephone set |
JPH02260857A (en) * | 1988-12-28 | 1990-10-23 | American Teleph & Telegr Co <Att> | Sound exchanging device and audio signal processing method |
JPH04287548A (en) * | 1990-11-30 | 1992-10-13 | American Teleph & Telegr Co <Att> | Voice exchange device and judging method of sound responce |
JPH0678046A (en) * | 1992-08-25 | 1994-03-18 | Fujitsu Ltd | Voice switch for hand-free system |
JP2003092623A (en) * | 2001-09-17 | 2003-03-28 | Toshiba Corp | Voice communication device and its voice signal processing module |
JP2005347875A (en) * | 2004-05-31 | 2005-12-15 | Matsushita Electric Works Ltd | Loudspeaking speech apparatus |
JP2007110527A (en) * | 2005-10-14 | 2007-04-26 | Matsushita Electric Works Ltd | Laudspeaker call device |
JP2012099884A (en) * | 2010-10-29 | 2012-05-24 | Aiphone Co Ltd | Intercom device |
JP2014230017A (en) * | 2013-05-21 | 2014-12-08 | シャープ株式会社 | Echo suppressor and echo suppression method |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107819964A (en) * | 2017-11-10 | 2018-03-20 | 广东欧珀移动通信有限公司 | Improve method, apparatus, terminal and the computer-readable recording medium of speech quality |
Also Published As
Publication number | Publication date |
---|---|
JP6485739B2 (en) | 2019-03-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6426000B2 (en) | Determination of distance and / or sound quality between mobile device and base unit | |
US8842851B2 (en) | Audio source localization system and method | |
CN101911730B (en) | Signaling microphone covering to the user | |
EP2439708B1 (en) | Sound monitoring using digital telephones | |
US8731940B2 (en) | Method of controlling a system and signal processing system | |
JP2011511571A (en) | Improve sound quality by intelligently selecting between signals from multiple microphones | |
KR102409536B1 (en) | Event detection for playback management on audio devices | |
JP2017203967A (en) | Voice output control device, electronic apparatus, and method for controlling voice output control device | |
KR20140145108A (en) | A method and system for improving voice communication experience in mobile communication devices | |
KR20080104667A (en) | System and method of estimating microphone performance for recognizing remote voice in robot | |
CN106961509B (en) | Call parameter processing method and device and electronic equipment | |
JP6485739B2 (en) | Audio processing device, intercom device, and intercom system | |
US7171004B2 (en) | Room acoustics echo meter for voice terminals | |
JP2010258687A (en) | Wireless communication apparatus | |
JP5167706B2 (en) | Sound emission and collection device | |
JP6168451B2 (en) | Volume adjustment device, volume adjustment method, and volume adjustment system | |
JP2012099884A (en) | Intercom device | |
CN110741563A (en) | Speech signal processing device, speech signal processing method, and speech signal processing program | |
Agaiby et al. | A robust word boundary detection algorithm with application to speech recognition | |
US10827076B1 (en) | Echo path change monitoring in an acoustic echo canceler | |
JP6778632B2 (en) | Intercom device | |
JP6876957B2 (en) | Intercom system | |
US20100054456A1 (en) | Method and apparatus for controlling the transmit volume level of a speakerphone | |
JP4380688B2 (en) | Telephone device | |
ITTS20000017A1 (en) | METHOD OF CONTROL OF SOUND CLEARERS FOR TERMINALS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6485739 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |