JP4914319B2 - COMMUNICATION VOICE PROCESSING METHOD, DEVICE THEREOF, AND PROGRAM THEREOF - Google Patents
COMMUNICATION VOICE PROCESSING METHOD, DEVICE THEREOF, AND PROGRAM THEREOF Download PDFInfo
- Publication number
- JP4914319B2 JP4914319B2 JP2007241378A JP2007241378A JP4914319B2 JP 4914319 B2 JP4914319 B2 JP 4914319B2 JP 2007241378 A JP2007241378 A JP 2007241378A JP 2007241378 A JP2007241378 A JP 2007241378A JP 4914319 B2 JP4914319 B2 JP 4914319B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- frequency
- unit
- band
- clarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephone Function (AREA)
Description
この発明は、遠隔地間を通信で結ぶ映像コミュニケーションと音声コミュニケーションにおける音声処理方法と、その装置と、そのプログラムに関する。 The present invention relates to an audio processing method, an apparatus thereof, and a program thereof in video communication and audio communication that connect remote locations by communication.
近年、通信網の発達により、遠隔地間を常時接続の回線で結ぶ通信環境が整備されつつある。これら常時接続環境は、家庭では見守りサービスとして、或いは遠隔地間の家族のコミュニケーションに用いられる。職場においては、遠隔地を結んだ共同作業、または在宅勤務でテレワークを行う際に用いられる。しかし、常時接続環境下では、通信する双方の状況が常にマイクロホンで収音され、また各種センサで情報が収集されるので、送り手と聞き手の双方でプライバシーを侵害してしまう問題が生ずる。 In recent years, with the development of communication networks, a communication environment for connecting remote locations with always-connected lines is being developed. These always-on environments are used as watching services at home or for family communication between remote locations. In the workplace, it is used when performing telework by working together from remote locations or working from home. However, in a constantly connected environment, both communication situations are always picked up by a microphone, and information is collected by various sensors. This causes a problem that both the sender and the listener infringe on privacy.
従来、常時接続環境下において、この問題を回避しながら常時接続のコミュニケーションを行う方法として、特許文献1に開示された映像コミュニケーション装置が知られている。図20を参照して従来の映像コミュニケーション装置を簡単に説明する。映像コミュニケーション装置100は、通信端末であり、入力手段10と、出力手段20と、通信制御手段30と、端末状況情報処理手段40と、入出力制御処理手段50と、音声処理手段60と、映像処理手段70とで構成される。入力手段10は、撮像手段11と、音声入力手段12と、近接検出手段13と、操作手段14とを有する。近接手段13は、赤外線や超音波等を利用した距離センサであり、映像コミュニケーション装置100とユーザとの距離を測るものである。近接手段13で検出した近接情報は、端末状況情報処理手段40に入力される。端末状況情報処理手段40は、近接情報を元に、入出力制御処理手段50を介して映像処理手段70と音声処理手段60の動作を制御する。映像処理手段70は、入出力制御処理手段50からの制御信号によって、映像の鮮明度を低下させる処理を行なう。音声処理手段60は、同様に音声の鮮明度を低下させる処理、または、音量を小さくする処理を行なう。ユーザと映像コミュニケーション装置100との距離が近く、ユーザが通信相手とコミュニケーションを積極的に取りたい場合には、映像と音声の鮮明度を高くする。逆に、ユーザと映像コミュニケーション装置100との距離が遠く、コミュニケーションを取ることについて消極的な場合には、映像と音声の鮮明度を低下させ、或いは音量を小さくするものである。
従来のコミュニケーション装置の音声の鮮明度を低下させる具体的な処理については、特許文献1にその記載は無い。一般的に音声の鮮明度を低下させると聞き難くなり、聞き手は不快に感じることが多く、コミュニケーション装置として使い勝手が悪かった。また、音声を小さくする方法の場合には、聞き手が聞き耳を立てれば会話の内容が分かってしまう。このように、従来のコミュニケーション装置は、プライバシー保護と使い勝手の両面から見て不十分なものであった。
There is no description in
この発明は、このような点に鑑みてなされたものである。特に音声処理装置に着目し、プライバシーの侵害を回避しつつ、相手の状況が把握でき、且つ、聞き手も不快にならないコミュニケーション音声処理装置とその方法、及びそのプログラムを提供することを目的とする。 The present invention has been made in view of these points. In particular, an object is to provide a communication speech processing apparatus, a method thereof, and a program thereof that can focus on the speech processing apparatus and can grasp the other party's situation while avoiding privacy infringement and that do not make the listener uncomfortable.
この発明によるコミュニケーション音声処理装置は、周波数変換部と、明瞭度設定部と、帯域分割部と、特徴量計算部と、フィルタ部と、周波数逆変換部とを具備する。周波数変換部は、入力音声信号を周波数領域の信号に変換する。明瞭度設定部は明瞭度を設定する。帯域分割部は、入力音声信号の周波数分析を行ない所定の周波数帯域に分割された帯域分割信号を生成する。特徴量計算部は、帯域分割信号毎の特徴量を計算する。フィルタ部は、複数の周波数帯域毎に、帯域分割信号の特徴量と入力音声信号以外の所定の音響周波数信号を乗算する。周波数逆変換部は、フィルタ部の出力信号を時間領域信号に変換する。 The communication speech processing apparatus according to the present invention includes a frequency conversion unit, a clarity setting unit, a band division unit, a feature amount calculation unit, a filter unit, and a frequency inverse conversion unit. The frequency converter converts the input audio signal into a frequency domain signal. The articulation setting unit sets articulation. The band dividing unit performs frequency analysis of the input audio signal and generates a band divided signal divided into predetermined frequency bands. The feature amount calculation unit calculates a feature amount for each band division signal. The filter unit multiplies a predetermined acoustic frequency signal other than the feature amount of the band division signal and the input audio signal for each of a plurality of frequency bands . The frequency inverse transform unit transforms the output signal of the filter unit into a time domain signal.
この発明のコミュニケーション音声処理装置は、マイクロホン部で収音した入力音声信号の特徴量によってフィルタリングされた雑音、環境音、楽音等の音響信号を、出力信号として出力する。したがって、音響信号を聞き心地の良い音にすることにより、聞き手を不快にすることなく送り手(自己)のプライバシーを保護することが出来る。また、入力音声信号の特徴量によりフィルタリングされた音響信号によって、相手側の音声の詳細は隠蔽されるが、プライバシーを保護しながら会話を含めた状況の雰囲気を伝達することが可能である。さらに、この発明のコミュニケーション音声処理装置は、マイクロホンの入力信号のみを用いて処理を行なうので、通信装置やシステムへの組み込みが容易である。 The communication voice processing apparatus according to the present invention outputs as an output signal an acoustic signal such as noise, environmental sound, and musical sound filtered by the feature amount of the input voice signal collected by the microphone unit. Therefore, by making the sound signal a comfortable sound, the privacy of the sender (self) can be protected without making the listener uncomfortable. Further, although the details of the other party's voice are concealed by the acoustic signal filtered by the feature quantity of the input voice signal, it is possible to convey the atmosphere of the situation including the conversation while protecting the privacy. Furthermore, since the communication sound processing apparatus of the present invention performs processing using only the input signal of the microphone, it can be easily incorporated into a communication apparatus or system.
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。 Embodiments of the present invention will be described below with reference to the drawings. The same reference numerals are given to the same components in a plurality of drawings, and the description will not be repeated.
図1にこの発明のコミュニケーション音声処理装置の実施例1の機能構成例を示す。その動作フローを図2に示す。コミュニケーション音声処理装置210は、マイクロホン部1と、帯域分割部2と、特徴量計算部3と、フィルタ部4と、明瞭度設定部5と、出力部6とを具備する。常時接続を可能にする通信制御手段と、図示しないネットワークを介して伝達される聞き手側(他方のコミュニケーション音声処理装置)からの音声を入力して再生する手段については、この発明の要部では無いので省略している。マイクロホン部1は、周囲の音を収音し、入力音声信号x(n)を帯域分割部2と出力部6に出力する(図2のステップS1)。ここで、(n)は、ある所定のサンプリング間隔で離散化された離散時間を示す。図1において音声信号を離散値化するA/Dコンバータについては省略している。帯域分割部2は、入力音声信号x(n)を入力とし、例えばフィルタバンク分析によって周波数分析を行い、所定の周波数帯域に分割した帯域分割信号xm(n)を生成する(ステップS2)。mは分割した帯域の番号を表わす。例えば、m=16であり、16等分された帯域分割信号xm(n)を生成する。等分割でなくても、対数スケールでの分割や、聴覚特性に応じた分割を行っても良い。
mの値が大きいほど、後述するフィルタ部4の出力する出力信号xc(n)の音声的特徴が、入力音声信号x(n)に近づく。帯域分割部2は、帯域分割信号xm(n)を特徴量計算部3に入力する。
FIG. 1 shows an example of a functional configuration of the communication voice processing apparatus according to the first embodiment of the present invention. The operation flow is shown in FIG. The communication sound processing device 210 includes a
The greater the value of m, the closer the sound characteristics of the output signal x c (n) output from the
特徴量計算部3は、帯域分割信号xm(n)毎の例えば平均パワーを計算し、各帯域の特徴量Pmを出力する(ステップS3)。平均パワーの計算は、時間方向に平滑化処理を行なっても良い。平滑化することにより、時間軸での平均パワーの急激な変化を防止することが出来る。例えば、現処理フレームをkとし、現フレームでの帯域平均パワーをPtmp(k,m)とし、1フレーム前の帯域平均パワーをP(k-1,m)とする。帯域平均パワーP(k,m)を式(1)によって求めても良い。
The feature
P(k,m)=(1−α)・Ptmp(k,m)+α・P(k-1,m) (1)
ここでαは平滑化のための時定数である。各帯域毎の特徴量Pmは、フィルタ部4の一方の入力信号として入力される。フィルタ部4の他方の入力として、雑音、環境音、楽音等の音響信号z(n)が外部から入力される。フィルタ部4のフィルタ係数生成部4aは、特徴量Pmに応じたフィルタ係数Dmを生成する。フィルタ部4は、フィルタ係数Dm毎にDm*zm(n)を計算してxc(n)を得る(ステップS4)。*は畳み込み演算を意味する。ここで、音響信号z(n)を、長時間聞いても不快に感じないような例えばバブル音にすると、xc(n)は、帯域分割信号xm(n)の平均パワー変動を持つ出力信号になる。出力部6は、入力音声信号x(n)と、フィルタ部4の出力信号xc(n)と、制御信号c(n)を入力として出力信号y(n)を出力する(ステップS6)。制御
信号c(n)を、0〜1までの値とすると、出力信号y(n)は、例えば式(2)で計算される。
P (k, m) = (1−α) · P tmp (k, m) + α · P (k−1, m) (1)
Here, α is a time constant for smoothing. The feature amount P m for each band is input as one input signal of the
y(n)=(1−c(n))・x(n)+c(n)・xc(n) (2)
制御信号c(n)は、段階的に設定される値でも良いし、固定値でも良い。出力信号y(n)は、図示しない通信制御手段を介して、ネットワークの先に接続された聞き手側のコミュニケーション音声処理装置に送信される。
y (n) = (1-c (n)). x (n) + c (n) .xc (n) (2)
The control signal c (n) may be a value set stepwise or a fixed value. The output signal y (n) is transmitted to a communication audio processing device on the listener side connected to the end of the network via a communication control means (not shown).
実施例1のコミュニケーション音声処理装置210で処理をした入力音声信号x(n)
と出力信号y(n)の信号波形を図3(a)と図3(b)に示す。図3(a),(b)の横軸は、時間(秒)であり、縦軸は振幅である。図3(a)は、16kHzでサンプリングされた音声データベースの女性の声の音声波形である。また、図示していない音響信号z(n)にはバブル音を用いた。図3(b)は、制御信号c(n)=1とした場合の出力信号y(n)の信号波形である。mの値は16である。入力音声信号x(n)の4,8,12秒付近の無音区間では、出力信号y(n)も無音区間である。また、各音声波形の時間崩落曲線の形に注目すると、出力信号y(n)と入力音声信号x(n)の波形が類似していることが分かる。この例では、制御信号c(n)=1なので、出力信号y(n)はフィルタ部4の出力信号xc(n)となる(式(2))。その出力信号は、入力音声信号x(n)の周波数帯域毎の平均パワー変動を持った音声信号となるので、言葉の意味は不明であるが、言葉の雰囲気は伝達することが出来る。したがって、会話の内容を隠蔽しつつ、話をしている様子を伝えることが出来る。更に出力信号y(n)は、バブル音を入力音声信号の特徴量でフィルタリングしたものなので長時間聞いても不快に感じない。
Input voice signal x (n) processed by the communication voice processing apparatus 210 of the first embodiment.
3A and 3B show signal waveforms of the output signal y (n). 3A and 3B, the horizontal axis represents time (seconds), and the vertical axis represents amplitude. FIG. 3A shows a voice waveform of a female voice in a voice database sampled at 16 kHz. Moreover, bubble sound was used for the acoustic signal z (n) not shown. FIG. 3B is a signal waveform of the output signal y (n) when the control signal c (n) = 1. The value of m is 16. In the silent section around 4, 8, 12 seconds of the input audio signal x (n), the output signal y (n) is also a silent section. When attention is paid to the shape of the time decay curve of each speech waveform, it can be seen that the waveforms of the output signal y (n) and the input speech signal x (n) are similar. In this example, since the control signal c (n) = 1, the output signal y (n) becomes the output signal x c (n) of the filter unit 4 (formula (2)). Since the output signal is an audio signal having an average power fluctuation for each frequency band of the input audio signal x (n), the meaning of the word is unknown, but the atmosphere of the word can be transmitted. Therefore, it is possible to convey the state of talking while hiding the content of the conversation. Furthermore, since the output signal y (n) is obtained by filtering the bubble sound with the feature amount of the input sound signal, it does not feel uncomfortable even if it is heard for a long time.
なお、帯域分割部2の周波数分析手段として、フィルタバンク分析を用いた例で説明を行ったが、短時間フーリエ変換やウェーブレット変換を用いても良い。また、音響信号z(n)は、外部から供給される例で説明を行ったが、図1中に破線で示す様に、コミュニケーション音声処理装置210内に信号保存部7を設け、音響信号z(n)を保存しておいても良い。
In addition, although the example which used the filter bank analysis was demonstrated as a frequency analysis means of the
実施例1は、明瞭度設定部5に設定された明瞭度に応じてフィルタ部の出力信号と入力音声信号との配分を変えて出力信号y(n)を生成する。以降、この機能を説明の便宜上プライバシー機能と称する。実施例1では、このプライバシー機能の動作は常時行なわれ、選択の余地が無い。例えば、プライバシーの保護の必要の無い幼児の見守り等にこの発明のコミュニケーション音声処理装置を用いる場合に、実施例1の構成では使い難い場合もある。そこで、このプライバシー機能を選択的にON/OFF出来るようにした実施例2を次に説明する。
In the first embodiment, the output signal y (n) is generated by changing the distribution of the output signal of the filter unit and the input audio signal according to the clarity set in the
この発明の実施例2のコミュニケーション音声処理装置220の機能構成例を図4に示す。その動作フローを図5に示す。コミュニケーション音声処理装置220は、プライバシー機能を周波数領域の信号で処理するようにしたものである。実施例1に対して、実施例2は、スイッチ部41と、処理制御部42と、周波数変換部43と、周波数逆変換部47とが加えられ、帯域分割部44と出力部45の動作が変る。よって、ここでは、新たに追加された構成と、実施例1と動作が異なる部分について説明する。
FIG. 4 shows a functional configuration example of the communication
スイッチ部41は、各種ボタン、タッチセンサ、ダイヤル等の一般的なユーザーインターフェースを持つ入力装置であり、スイッチ信号p(n)を処理制御部42と出力部45に出力する。スイッチ信号p(n)は、p(n)=“1”(“1,0”は論理レベルを意味する。)の時にプライバシー機能をONとし、p(n)=“0”の時にプライバシー機能をOFFとする信号である。
The
処理制御部42は、マイクロホン部1の出力する離散化された入力音声信号x(n)と、スイッチ信号p(n)を入力として出力を決定する。処理制御部42は、スイッチ信号p(n)=“1”の時に入力音声信号x(n)を周波数変換部43に入力する(図5のステップS42のYes)。周波数変換部43は、入力音声信号x(n)を例えば短時間フーリエ変換を用いて周波数領域信号X(ω)に変換する。短時間フーリエ変換は、一定の大きさの窓関数を用いて入力音声信号x(n)を切り出し、その信号を高速フーリエ変換(FFT)して周波数領域信号X(ω)を計算する。FFTサイズは、例えば16kHzサンプリング、サンプル数256、シフト長1/2といった値である。帯域分割部44は、周波数領域信号X(ω)を、例えば16等分して帯域分割信号Xm(ω)を生成する(ステップS44)。特徴量計算部3は、実施例1と同じであり、各帯域の特徴量Pmをフィルタ部46の一方の入力信号として出力する。フィルタ部46も他方の入力には、帯域分割信号Xm(ω)の分割前の周波数信号と同一周波数帯の、雑音、環境音、楽音等の音響周波数信号Z(ω)が外部から入力される。フィルタ部46は、特徴量Pmの分割数に対応させて、音響周波数信号Z(ω)を分割したZm(ω)を生成する。そしてZm(ω)を特徴量Pmでフィルタリングする(ステップS46)。つまり、帯域毎にPm・Zm(ω)を計算してXcm(ω)を得、全帯域のXcm(ω)を足し合わせたXc(ω)を周波数逆変換部47に出力する。なお、音響周波数信号Z(ω)の周波数帯域は、入力音声信号の周波数帯域と、必ずしも一致する必要は無い。所望の帯域に合わせて分割数を調整すれば良い。
The
周波数逆変換部47は、例えば短時間フーリエ逆変換を用いて、フィルタ部46の出力するXc(ω)を時間領域の信号xc(n)に変換する(ステップS47)。
The frequency
出力部45は、制御信号c(n)と、スイッチ信号p(n)と、入力音声信号x(n)と、周波数逆変換部47の出力信号xc(n)を入力として出力信号y(n)を合成して出力する(ステップS45)。出力部45はスイッチ信号p(n)=“1”の時、制御信号c(n)の値に応じて入力音声信号x(n)と、周波数逆変換部47の出力信号xc(n)の配分を変えて足し合わせて出力信号y(n)を合成する(ステップS451)。スイッチ信号p(n)=“0”の時は、入力音声信号x(n)をそのまま出力信号y(n)(y(n)=x(n))として出力する(ステップS452、収音信号出力処理)。つまり、プライバシー機能はOFFになる。
The
このようにスイッチ部41の出力するスイッチ信号p(n)によって、プライバシー機能をON/OFFすることが出来、この発明のコミュニケーション音声処理装置の使い勝手を向上させることが出来る。なお、音響周波数信号Z(ω)をそのまま保存するのではなく、時間領域の音声データを記録しておき、フィルタ部46でフィルタリングする都度、音声データを周波数分析して音響周波数信号Z(ω)を生成しても良い。また、フィルタ部46で特徴量Pmの分割数に対応させて音響周波数信号Z(ω)を分割したZm(ω)を計算する例で説明を行ったが、予めZm(ω)を記録しておいても良い。また、フィルタ部46のフィルタ動作を、帯域毎にPm・Zm(ω)を計算する例で説明を行ったが、音響周波数信号Zm(ω)に単純に特徴量Pmを乗算すると、Xc(ω)が歪んでしまうことがある。その場合は、全帯域の平均パワーと、Xc(ω)の平均パワーが等しくなるように正規化する係数Wを導入して、帯域毎にW・Pm・Zm(ω)を計算するようにしても良い。
Thus, the privacy function can be turned ON / OFF by the switch signal p (n) output from the
なお、プライバシー機能をON/OFFさせる目的は、実施例1の構成にスイッチ部41を設け、出力部6を出力部45に変更することでも実現出来る。
The purpose of turning on / off the privacy function can also be realized by providing the
図6にこの発明の実施例3のコミュニケーション音声処理装置230の機能構成例を示す。その動作フローを図7に示す。実施例3は、実施例2の明瞭度設定部5の代わりにセンサ部61が設けられたものである。他の構成は、実施例2と同じである。ここでは、センサ部61と出力部62の動作を説明する。
FIG. 6 shows a functional configuration example of the communication
センサ部61は、周囲環境情報を検出して、コミュニケーション音声処理装置230と話者との距離を表わすセンサデータs(n)を出力部62に出力する(ステップS61)。センサ部61を構成する検出デバイスとしては、マイクロホン、CCD撮像素子、温度センサ、超音波センサ、赤外線センサ等が利用出来る。これらのどの検出デバイスを用いても一般的な回路構成で、コミュニケーション音声処理装置230と話者との距離を検出することが可能である。距離を検出する方法は、従来技術で簡単に実現できるので、具体的な構成を示した説明は省略する。検出されたセンサデータs(n)は、例えばセンサ部61内に設けられたβ(n)変換部61aで0〜1までの値に変換されて、出力部62に入力される。
The
出力部62は、β(n)と、入力音声信号x(n)と、スイッチ信号p(n)と、周波数逆変換部47の出力信号xc(n)を入力として出力信号y(n)を合成して出力する(ステップS62)。出力部62は、出力信号y(n)を式(3)で計算される値に合成する(ステップS621)。
The
y(n)=(1−β(n))・x(n)+β(n)・xc(n) (3)
出力部62のスイッチ信号p(n)に対する動作は、実施例2と同じである。センサ部61を明瞭度設定部5の代わりに設けたことで、コミュニケーション音声処理装置230と話者との距離によって、出力信号y(n)の明瞭度を自動的に変えることが可能になる。話者の位置が、コミュニケーション音声処理装置230に近い場合はβ(n)の値が小さいので、出力信号y(n)に占める入力音声信号x(n)の割合が大きくなる。したがって、出力信号y(n)は明瞭になる。逆に話者の位置が、コミュニケーション音声処理装置230から遠い場合は、フィルタリングされた周波数逆変換部47の出力信号xc(n)の割合が大きくなるので、出力信号y(n)は不明瞭になる。スイッチ信号p(n)=“0”の時は、入力音声信号x(n)がそのまま出力信号y(n)として出力される(ステップS622)。
y (n) = (1−β (n)) · x (n) + β (n) · x c (n) (3)
The operation of the
このように、センサ部61を設けることで自動的に出力信号y(n)の明瞭度を可変することが可能になる。なお、β(n)変換部61aは、出力部62内に設けても良い。
Thus, by providing the
実施例2の変形例のコミュニケーション音声処理装置240を、実施例4として図8に示す。動作フローを図9に示す。実施例4は、実施例2(図4)に対して明瞭度設定部5に設定される制御信号c(n)が帯域分割部81に入力される点と、出力部82の動作が異なっている。他の部分は実施例2と同じである。
A communication
帯域分割部81は、周波数変換部43からの周波数領域信号X(ω)と、明瞭度設定部5からの制御信号c(n)とを入力として帯域分割信号Xm(ω)を特徴量計算部3に出力する(図9のステップS61)。実施例2では、例えばm=16として説明したmの値が、制御信号c(n)によって決定される。例えば、制御信号c(n)が0〜1までの値をとるとき、c(n)が小さい程、mの値を32に近づけ、c(n)が大きい程、mを16に近づける。つまり、mの値が大きく帯域分割数が多いと周波数逆変換部47の出力信号xc(n)のバブル音は、入力音声信号x(n)により近い特徴を持つ音声信号になる。逆にmの値が小さいと、周波数逆変換部47の出力信号xc(n)は、バブル音により近くなる。出力部82は、スイッチ信号p(n)=“1”の時、周波数逆変換部47の出力信号xc(n)を出力する。スイッチ信号p(n)=“0”の時は、入力音声信号x(n)を出力する。
The
したがって、スイッチ信号p(n)=“1”で、且つ、制御信号c(n)の値が小さい時は、出力信号y(n)に重畳する周波数逆変換部47の出力信号xc(n)はよりバブル音に近いので、出力信号y(n)の明瞭度は低下する。c(n)の値が大きい時、周波数逆変換部47の出力信号xc(n)は、入力音声信号x(n)に近い特性を持つので、出力信号y(n)の明瞭度が向上する。このように実施例4の構成でも、明瞭度設定部5に設定した制御信号c(n)の値によって、出力信号y(n)の明瞭さを制御することが可能である。
Therefore, when the switch signal p (n) = “1” and the value of the control signal c (n) is small, the output signal x c (n) of the frequency
実施例3の変形例のコミュニケーション音声処理装置250を、実施例5として図10に示す。動作フローを図11に示す。実施例5は、実施例3(図6)に対してセンサ部61の出力するセンサデータs(n)が帯域分割部101に入力される点と、出力部が出力部82である点で異なっている。他の部分は実施例3と同じである。
A communication
帯域分割部101は、周波数変換部43からの周波数領域信号X(ω)と、センサ部61からのセンサデータs(n)とを入力として帯域分割信号Xm(ω)を特徴量計算部3に出力する(図11のステップS101)。この実施例では、帯域分割信号Xm(ω)のmの値は、センサデータs(n)によって決定される。帯域分割部101は、コミュニケーション音声処理装置250と話者との距離が近い程、例えばs(n)の値が小さくなるとmの値を32に近づけ、s(n)の値が大きくなればmを16に近い値にする。出力部82は、実施例4(図8)で説明した出力部82であり、入力音声信号x(n)と、周波数逆変換部47の出力信号xc(n)とを合成して出力信号y(n)を出力する。mの値が大きいと、周波数逆変換部47の出力信号xc(n)の音を入力音声信号x(n)に近づけることが出来る。mの値が小さいと、周波数逆変換部47の出力信号xc(n)はバブル音に近くなる。したがって、後は実施例4と同様の動作によって、出力信号y(n)の明瞭さを制御することが可能である。
The
実施例4の変形例のコミュニケーション音声処理装置260を、実施例6として図12に示す。その動作フローを図13に示す。実施例6は、実施例4(図8)に対して明瞭度設定部5が出力する制御信号c(n)が、周波数逆変換部121に入力される点と、周波数変換部43の出力する周波数領域信号X(ω)と音響周波数信号Z(ω)とが周波数逆変換部121に入力されている点が異なっている。他の構成は実施例4と同じである。
A communication
通常、短時間フーリエ逆変換で周波数領域の信号を、時間領域の信号に変換する場合は、その周波数領域の信号の振幅特性と位相特性を用いる。しかし、この実施例の周波数逆変換部121は、フィルタ部46の出力信号Xc(ω)の位相特性Sc(ω)を、制御信号c(n)によって可変する。周波数逆変換部121は、その可変された位相特性Sc(ω)に基づいて、短時間フーリエ逆変換を行いフィルタ部46の出力信号Xc(ω)を時間領域の信号xc(ω)に変換する(図13のステップS121)。その位相特性の可変は、周波数変換部43の出力する周波数領域信号X(ω)の位相特性SX(ω)と、音響周波数信号Z(ω)の位相特性SZ(ω)の配分を式(4)に示すように変えて行う。
Usually, when a frequency domain signal is converted into a time domain signal by short-time inverse Fourier transform, the amplitude characteristics and phase characteristics of the frequency domain signal are used. However, the frequency
Sc(ω)=(1−c(n))・SX(ω)+c(n)・SZ(ω) (4)
時間領域の信号xc(ω)の位相特性Sc(ω)は、制御信号c(n)の値が小さければ、入力音声信号の周波数領域信号X(ω)の位相特性SX(ω)に近づく。逆にc(n)の値が大きければ、xc(ω)は、音響周波数信号Zm(ω)の例えばバブル音の位相特性SZ(ω)に近づくことになる。このように周波数逆変換部121において、時間領域信号に周波数領域信号を逆変換する際の位相特性を、制御信号c(n)で可変することでも、出力信号の明瞭度を制御することが出来る。
S c (ω) = (1−c (n)) · S X (ω) + c (n) · S Z (ω) (4)
Phase characteristic S c of the signal x c in the time domain (ω) (ω), the smaller the value of the control signal c (n), the phase characteristic S X of the input audio signal in the frequency domain signals X (ω) (ω) Get closer to. Conversely, if the value of c (n) is large, x c (ω) approaches the phase characteristic S Z (ω) of, for example, bubble sound of the acoustic frequency signal Z m (ω). As described above, the frequency
実施例4の変形例のコミュニケーション音声処理装置270を、実施例7として図14に示す。その動作フローを図15に示す。実施例7は、実施例4(図8)に対してフィルタ部46に入力される音響周波数信号Z(ω)が、重み付き加算部131で生成された音響周波数信号Za(ω)である点で異なっている。
A communication
重み付き加算部131は、周波数変換部43の出力する周波数領域信号X(ω)と、明瞭度設定部5に設定された制御信号c(n)と、音響周波数信号Z(ω)を入力として音響周波数信号Za(ω)を生成する(図15のステップS131)。音響周波数信号Za(ω)は、例えば、制御信号c(n)が0〜1までの値をとるとき、式(5)で計算される。
The
Za(ω)=(1−c(n))・X(ω)+c(n)・Z(ω) (5)
このように重み付き加算部131は、周波数領域信号X(ω)と音響周波数信号Z(ω)を、重み付け加算して音響周波数信号Za(ω)を生成する。したがって、制御信号c(n)の値が小さい時の音響周波数信号Z(ω)は、入力音声信号x(n)に近い信号になる。逆にc(n)の値が大きい時は、音響周波数信号Z(ω)を例えばバブル音とすれば、バブル音に近い信号になる。このように重み付き加算部131を設けた構成でも出力信号y(n)の明瞭度を制御することが出来る。
Za (ω) = (1−c (n)) · X (ω) + c (n) · Z (ω) (5)
As described above, the
実施例3の変形例のコミュニケーション音声処理装置280を、実施例8として図16に示す。その動作フローを図17に示す。実施例8は、実施例3(図6)のセンサ部61がパワー計算部151に置き換えられている点と、出力部152とが異なる。
A communication
パワー計算部151は、周波数変換部43の出力する周波数領域信号X(ω)を入力として、式(6)に示すパワーデータPs(n)を計算する(図17のステップS151)。
The
Ps(n)=Σ(X(ω)2) (6)
Ps(n)は、周波数変換部43が例えば短時間フーリエ変換をおこなう1フレーム内のパワーの総和である。したがって、Ps(n)は、マイクロホン部1で収音した入力音声信号x(n)の振幅が大きい程、大きくなる値である。Ps(n)の値が大きければ、コミュニケーション音声処理装置280と話者との距離が一般的には近く、逆にPs(n)の値が小さければその距離が遠いといえる。このPs(n)は、定性的に実施例3のセンサデータと同じように扱うことが可能である。
Ps (n) = Σ (X (ω) 2 ) (6)
Ps (n) is the total power in one frame for which the
このPs(n)の値は、出力部152に入力され、出力部152内の正規化部152aで0〜1の値に変換される。例えば正規化部152aは、Ps(n)の最小値と最大値の幅を1として正規化する。Ps(n)を正規化した後の動作は実施例2の出力部45と同じである。また、出力部62のスイッチ信号p(n)に対する動作も、実施例3と同じである。
The value of Ps (n) is input to the
よって、センサ部61の代わりにパワー計算部151を設けた構成でも、コミュニケーション音声処理装置280と話者との距離によって、出力信号の明瞭度を自動的に変えることが可能になる。
Therefore, even in the configuration in which the
図18にこの発明の実施例9のコミュニケーション音声処理装置290の機能構成例を示す。その動作フローを図19に示す。実施例9は、実施例1(図1)に音声区間検出部171と処理制御部42の構成を追加し、出力部を出力部45にしたものである。
FIG. 18 shows a functional configuration example of the communication
音声区間検出部171は、マイクロホン部で収音した入力音声信号x(n)を入力として、音声区間であるか否かを判別し、判別結果d(n)を処理制御部42と出力部45に出力する(図19のステップS171)。判別結果d(n)は、例えば、入力音声信号x(n)の短時間パワーが、閾値を一定時間以上越えた場合に音声区間と判定しd(n)=“1”となる信号である。非音声区間は、d(n)=“0”となる。
The voice
この音声区間検出部171の出力信号d(n)を、スイッチ信号p(n)の代わりに用いて処理制御部42と出力部45は、実施例2と同じように動作する。このように音声区間検出部171をスイッチ部41の代わりに設けることで、自動的にプライバシー機能を動作させることが出来る。なお、実施例1(図1)に音声区間検出部171を設ける例で実施例9を説明した。他の実施例のスイッチ部41を音声区間検出部171に置き換えることも出来る。その場合、音声区間のみでプライバシー機能を自動的に動作させることが可能になる。
The
以上、説明した実施例は、通信を行う送り手側と受け手側のコミュニケーション音声処理装置に適用される。また、この発明である装置及び方法は上述の実施形態に限定されるものではなく、この発明の趣旨を逸脱しない範囲で適宜変更が可能である。例えば、回線の途中に配置されるネットワークサーバーにこの発明の考えを適用しても良い。また、受け手側だけで行っても良い。また、上記して説明した実施例の構成以外にも、フィルタバンクを用いたチャネルボコーダ、ホルマントボコーダ、パターンマッチングボコーダ、相関ボコーダ、位相ボコーダ、最尤ボコーダ、ホモモルフィックボコーダ、ACORボコーダ、線形予測ボコーダ、LSPボコーダを用いた構成も考えられる。例えば、フィルタバンクを用いたチャネルボコーダではチャネル数を制御することにより、明瞭さを制御する。また、線形予測ボコーダでは線形予測次数を制御することにより、明瞭さを制御する。また、上記装置及び方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。 The embodiment described above is applied to communication voice processing apparatuses on the sender side and the receiver side that perform communication. Moreover, the apparatus and method which are this invention are not limited to the above-mentioned embodiment, It can change suitably in the range which does not deviate from the meaning of this invention. For example, the idea of the present invention may be applied to a network server arranged in the middle of a line. Alternatively, it may be performed only on the receiver side. In addition to the configuration of the embodiment described above, channel vocoder, formant vocoder, pattern matching vocoder, correlation vocoder, phase vocoder, maximum likelihood vocoder, homomorphic vocoder, ACOR vocoder, linear prediction using filter banks A configuration using a vocoder or LSP vocoder is also conceivable. For example, in a channel vocoder using a filter bank, the clarity is controlled by controlling the number of channels. Also, the linear prediction vocoder controls the clarity by controlling the linear prediction order. Further, the processes described in the above apparatus and method are not only executed in time series according to the order of description, but also may be executed in parallel or individually as required by the processing capability of the apparatus that executes the process. Good.
また、上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。 Further, when the processing means in the above apparatus is realized by a computer, the processing contents of functions that each apparatus should have are described by a program. Then, by executing this program on the computer, the processing means in each apparatus is realized on the computer.
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記憶媒体に記憶しておくことができる。コンピュータで読み取り可能な記憶媒体としては、例えば、磁気記憶装置、光ディスク、光磁気記憶媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記憶装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記憶媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。 The program describing the processing contents can be stored in a computer-readable storage medium. The computer-readable storage medium may be any medium such as a magnetic storage device, an optical disk, a magneto-optical storage medium, and a semiconductor memory. Specifically, for example, as a magnetic storage device, a hard disk device, a flexible disk, a magnetic tape, etc., and as an optical disk, a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only) Memory), CD-R (Recordable) / RW (ReWritable), etc., magneto-optical storage media, MO (Magneto Optical disc), etc., semiconductor memory, EEP-ROM (Electronically Erasable and Programmable-Read Only Memory), etc. Can be used.
また、このプログラムの流通は、例えば、そのプログラムを記憶したDVD、CD−ROM等の可搬型記憶媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。 The program is distributed by selling, transferring, or lending a portable storage medium such as a DVD or CD-ROM storing the program, for example. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。 Each means may be configured by executing a predetermined program on a computer, or at least a part of these processing contents may be realized by hardware.
Claims (7)
明瞭度を設定する明瞭度設定部と、
上記周波数領域の信号を、上記明瞭度が小さいほど分割数が大きくなり、上記明瞭度が大きいほど分割数が小さくなるように複数の周波数帯域に分割して帯域分割信号を出力する帯域分割部と、
上記帯域分割信号毎の特徴量を計算する特徴量計算部と、
上記複数の周波数帯域毎に、上記帯域分割信号の特徴量と入力音声信号以外の所定の音響周波数信号を乗算するフィルタ部と、
上記フィルタ部の出力信号を時間領域信号に変換する周波数逆変換部と、
を具備することを特徴とするコミュニケーション音声処理装置。 A frequency conversion unit for converting the input audio signal into a frequency domain signal,
And clarity setting unit for setting a bright Akirado,
The signal of the frequency domain, the intelligibility as the division number becomes large small band dividing unit for outputting a band division signals divided into a plurality of frequency bands as the number of divisions as the clarity is greater decreases When,
A feature amount calculation unit for calculating a feature amount for each of the band division signals;
For each of the plurality of frequency bands, a filter unit that multiplies a predetermined acoustic frequency signal other than the feature amount of the band- divided signal and the input audio signal ;
And frequency inverse converter for converting No. LSE out of the filter unit into a time domain signal,
Communications voice processing apparatus characterized by comprising a.
上記周波数領域の信号を所定の周波数帯域に分割して帯域分割信号を出力する帯域分割部と、
上記帯域分割信号毎の特徴量を計算する特徴量計算部と、
上記複数の周波数帯域毎に、上記帯域分割信号の特徴量と入力音声信号以外の所定の音響周波数信号を乗算するフィルタ部と、
明瞭度を設定する明瞭度設定部と、
上記フィルタ部の出力信号の位相特性を、上記明瞭度が大きいほど上記入力音声信号の位相特性に近く、上記明瞭度が小さいほど上記入力音声信号以外の所定の音響周波数信号の位相特性に近くなるように変化させ、時間領域の信号に変換する周波数逆変換部と、
を具備することを特徴とするコミュニケーション音声処理装置。 A frequency conversion unit for converting the input audio signal into a frequency domain signal,
A band dividing section for outputting a band division signal by dividing the signal of the frequency domain in a predetermined frequency band,
A feature amount calculation unit for calculating a feature amount for each of the band division signals;
For each of the plurality of frequency bands, a filter unit that multiplies a predetermined acoustic frequency signal other than the feature amount of the band- divided signal and the input audio signal ;
And clarity setting unit for setting a bright Akirado,
The phase characteristic of the output signal of the filter unit is closer to the phase characteristic of the input audio signal as the clarity is higher, and closer to the phase characteristic of a predetermined acoustic frequency signal other than the input voice signal as the clarity is lower. varied as a frequency inverse conversion unit for converting the signal in the time domain,
Communications voice processing apparatus characterized by comprising a.
上記周波数領域の信号を所定の周波数帯域に分割して帯域分割信号を出力する帯域分割部と、
上記帯域分割信号毎の特徴量を計算する特徴量計算部と、
明瞭度を設定する明瞭度設定部と、
上記周波数変換部の出力信号と、入力音声信号以外の所定の音響周波数信号とを、上記明瞭度が大きいほど上記周波数変換部の出力信号の重みが大きくなり、上記明瞭度が小さいほど上記周波数変換部の出力信号の重みが小さくなるように重み付けして足し合わせる重み付き加算部と、
上記複数の周波数帯域毎に、上記帯域分割信号の特徴量と上記重み付き加算部の出力信号とを乗算するフィルタ部と、
上記フィルタ部の出力信号を時間領域信号に変換する周波数逆変換部と、
を具備することを特徴とするコミュニケーション音声処理装置。 A frequency conversion unit for converting the input audio signal into a frequency domain signal,
A band dividing section for outputting a band division signal by dividing the signal of the frequency domain in a predetermined frequency band,
A feature amount calculation unit for calculating a feature amount for each of the band division signals;
And clarity setting unit for setting a bright Akirado,
And No. LSE out of the frequency converter, and a predetermined acoustic frequency signals other than the input speech signal, the weights of the upper KiAkira Akirado becomes larger as the output signal of the frequency converter increases, the clarity is less A weighted adder that weights and adds so that the weight of the output signal of the frequency converter becomes smaller ,
For each of the plurality of frequency bands, a filter section for multiplying the output signal of the features and the weighted addition of the band division signals,
And frequency inverse converter for converting No. LSE out of the filter unit into a time domain signal,
Communications voice processing apparatus characterized by comprising a.
明瞭度設定部が明瞭度を設定する明瞭度設定過程と、
帯域分割部が、上記周波数領域の信号を上記明瞭度が小さいほど分割数が大きくなり、上記明瞭度が大きいほど分割数が小さくなるように複数の周波数帯域に分割して帯域分割信号を出力する帯域分割過程と、
特徴量計算部が、上記帯域分割信号毎の特徴量を計算する特徴量計算過程と、
フィルタ部が、上記複数の周波数帯域毎に、上記帯域分割信号の特徴量と入力音声信号以外の所定の音響周波数信号を乗算するフィルタ過程と、
周波数逆変換部が、上記フィルタ部の出力信号を時間領域信号に変換する周波数逆変換過程と、
を含むことを特徴とするコミュニケーション音声処理方法。 Frequency conversion unit, a frequency conversion process of converting the input audio signal into a frequency domain signal,
Clarity setting process in which the clarity setting unit sets the clarity,
Band dividing unit, the signal of the upper Symbol frequency domain becomes large number of divided as the clarity is low, the band division signals divided into a plurality of frequency bands as the number of divisions as the clarity is greater decreases Output band splitting process,
A feature amount calculation unit calculates a feature amount for each of the band division signals, and a feature amount calculation process,
A filter process in which the filter unit multiplies the characteristic amount of the band- divided signal by a predetermined acoustic frequency signal other than the input audio signal for each of the plurality of frequency bands ;
Frequency inverse conversion unit, and the frequency inverse conversion process of converting the time domain signal No. LSE out of the filter unit,
Communications voice processing method, which comprises a.
帯域分割部が、上記周波数領域の信号を所定の周波数帯域に分割して帯域分割信号を出力する帯域分割過程と、
特徴量計算部が、上記帯域分割信号毎の特徴量を計算する特徴量計算過程と、
フィルタ部が、上記複数の周波数帯域毎に、上記帯域分割信号の特徴量と入力音声信号以外の所定の音響周波数信号を乗算するフィルタ過程と、
明瞭度設定部が明瞭度を設定する明瞭度設定過程と、
周波数逆変換部が、上記フィルタ部の出力信号の位相特性を、上記明瞭度が大きいほど上記入力音声信号の位相特性に近く、上記明瞭度が小さいほど上記入力音声信号以外の所定の音響周波数信号の位相特性に近くなるように変化させ、時間領域の信号に変換する周波数逆変換過程と、
を含むことを特徴とするコミュニケーション音声処理方法。 Frequency conversion unit, a frequency conversion process of converting the input audio signal into a frequency domain signal,
Band division section includes a band division step of outputting a band division signal by dividing the signal of the frequency domain in a predetermined frequency band,
A feature amount calculation unit calculates a feature amount for each of the band division signals, and a feature amount calculation process,
A filter process in which the filter unit multiplies the characteristic amount of the band- divided signal by a predetermined acoustic frequency signal other than the input audio signal for each of the plurality of frequency bands ;
Clarity setting process in which the clarity setting unit sets the clarity,
Frequency inverse conversion portion, the phase characteristic of the output signal of the filter unit, the larger the upper Symbol intelligibility close to the phase characteristic of the input speech signal, predetermined acoustic frequencies other than the input speech signal as the intelligibility is small Inverse frequency transformation process that changes to be close to the phase characteristics of the signal and converts it to a signal in the time domain,
Communications voice processing method, which comprises a.
帯域分割部が、上記周波数領域の信号を所定の周波数帯域に分割して帯域分割信号を出力する帯域分割過程と、
特徴量計算部が、上記帯域分割信号毎の特徴量を計算する特徴量計算過程と、
明瞭度設定部が明瞭度を設定する明瞭度設定過程と、
重み付き加算部が、上記周波数変換部の出力信号と、入力音声信号以外の所定の音響周波数信号とを、上記明瞭度が大きいほど上記周波数変換過程の出力信号の重みが大きくなり、上記明瞭度が小さいほど上記周波数変換部の出力信号の重みが小さくなるように重み付けして足し合わせる重み付き加算過程と、
フィルタ部が、上記帯域毎の特徴量に応じて上記重み付き加算部の出力信号をフィルタリングするフィルタ過程と、
周波数逆変換部が、上記フィルタ部の出力信号を時間領域信号に変換する周波数逆変換過程と、
を含むことを特徴とするコミュニケーション音声処理方法。 Frequency conversion unit, a frequency conversion process of converting the input audio signal into a frequency domain signal,
Band division section includes a band division step of outputting a band division signal by dividing the signal of the frequency domain in a predetermined frequency band,
A feature amount calculation unit calculates a feature amount for each of the band division signals, and a feature amount calculation process,
Clarity setting process in which the clarity setting unit sets the clarity,
Weighted addition unit, and the No. LSE out of the frequency converter, and a predetermined acoustic frequency signals other than the input speech signal, the weights of the output signals above SL clarity the larger the frequency conversion process is increased, A weighted addition process in which weighting is performed so that the weight of the output signal of the frequency converter becomes smaller as the intelligibility is smaller , and
A filtering process in which the filter unit filters the output signal of the weighted addition unit according to the feature amount for each band;
Frequency inverse conversion unit, and the frequency inverse conversion process of converting the time domain signal No. LSE out of the filter unit,
Communications voice processing method, which comprises a.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007241378A JP4914319B2 (en) | 2007-09-18 | 2007-09-18 | COMMUNICATION VOICE PROCESSING METHOD, DEVICE THEREOF, AND PROGRAM THEREOF |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007241378A JP4914319B2 (en) | 2007-09-18 | 2007-09-18 | COMMUNICATION VOICE PROCESSING METHOD, DEVICE THEREOF, AND PROGRAM THEREOF |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009075160A JP2009075160A (en) | 2009-04-09 |
JP4914319B2 true JP4914319B2 (en) | 2012-04-11 |
Family
ID=40610212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007241378A Expired - Fee Related JP4914319B2 (en) | 2007-09-18 | 2007-09-18 | COMMUNICATION VOICE PROCESSING METHOD, DEVICE THEREOF, AND PROGRAM THEREOF |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4914319B2 (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5149872B2 (en) * | 2009-06-19 | 2013-02-20 | 日本電信電話株式会社 | Acoustic signal transmitting apparatus, acoustic signal receiving apparatus, acoustic signal transmitting method, acoustic signal receiving method, and program thereof |
JP5449230B2 (en) * | 2011-02-18 | 2014-03-19 | 日本電信電話株式会社 | Remote communication device, remote communication method, program |
US8700406B2 (en) * | 2011-05-23 | 2014-04-15 | Qualcomm Incorporated | Preserving audio data collection privacy in mobile devices |
CN104412616B (en) * | 2012-04-27 | 2018-01-16 | 索尼移动通讯有限公司 | The noise suppressed of correlation based on the sound in microphone array |
JP6551919B2 (en) * | 2014-08-20 | 2019-07-31 | 株式会社ファインウェル | Watch system, watch detection device and watch notification device |
WO2017211614A1 (en) * | 2016-06-07 | 2017-12-14 | Koninklijke Philips N.V. | Sensor privacy setting control |
US10726855B2 (en) * | 2017-03-15 | 2020-07-28 | Guardian Glass, Llc. | Speech privacy system and/or associated method |
JP7260411B2 (en) * | 2019-06-20 | 2023-04-18 | 株式会社日立製作所 | Acoustic monitoring device |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1041539A4 (en) * | 1997-12-08 | 2001-09-19 | Mitsubishi Electric Corp | Sound signal processing method and sound signal processing device |
AR024353A1 (en) * | 1999-06-15 | 2002-10-02 | He Chunhong | AUDIO AND INTERACTIVE AUXILIARY EQUIPMENT WITH RELATED VOICE TO AUDIO |
JP4734627B2 (en) * | 2005-03-22 | 2011-07-27 | 国立大学法人山口大学 | Speech privacy protection device |
-
2007
- 2007-09-18 JP JP2007241378A patent/JP4914319B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009075160A (en) | 2009-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4914319B2 (en) | COMMUNICATION VOICE PROCESSING METHOD, DEVICE THEREOF, AND PROGRAM THEREOF | |
JP5519689B2 (en) | Sound processing apparatus, sound processing method, and hearing aid | |
CN106664473B (en) | Information processing apparatus, information processing method, and program | |
US9998081B2 (en) | Method and apparatus for processing an audio signal based on an estimated loudness | |
CN108235181B (en) | Method for noise reduction in an audio processing apparatus | |
KR101068227B1 (en) | Clarity Improvement Device and Voice Output Device Using the Same | |
TW201214954A (en) | Audio driver system and method | |
US20110054889A1 (en) | Enhancing Receiver Intelligibility in Voice Communication Devices | |
JP4769673B2 (en) | Audio signal interpolation method and audio signal interpolation apparatus | |
JP3505085B2 (en) | Audio equipment | |
JP2002078100A (en) | Method and system for processing stereophonic signal, and recording medium with recorded stereophonic signal processing program | |
CN105491495B (en) | Deterministic sequence based feedback estimation | |
RU2411595C2 (en) | Improved intelligibility of speech in mobile communication device by control of vibrator operation depending on background noise | |
CN110447069A (en) | The method and apparatus of the Speech processing of environment adaptive noise | |
CN105393560A (en) | Automatic timbre, loudness and equalization control | |
JP6182895B2 (en) | Processing apparatus, processing method, program, and processing system | |
Park et al. | Irrelevant speech effect under stationary and adaptive masking conditions | |
WO2022247494A1 (en) | Audio signal compensation method and apparatus, earphones, and storage medium | |
JP2020503822A (en) | Speech signal modeling based on recorded target speech | |
WO2009093416A1 (en) | Sound signal processing device and method | |
JP2014030140A (en) | Ambient noise estimation device, sound volume adjusting device, ambient noise estimation method, and ambient noise estimation program | |
JP2000276200A (en) | Voice quality converting system | |
JP4495704B2 (en) | Sound image localization emphasizing reproduction method, apparatus thereof, program thereof, and storage medium thereof | |
KR20190107902A (en) | System, method and computer program for controlling volume of guidance voice based on environment | |
JP2012027101A (en) | Sound playback apparatus, sound playback method, program, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090729 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110616 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110809 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120110 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120120 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4914319 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150127 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |