JP2017034519A - 音声処理装置、音声処理システム及び音声処理方法 - Google Patents

音声処理装置、音声処理システム及び音声処理方法 Download PDF

Info

Publication number
JP2017034519A
JP2017034519A JP2015153718A JP2015153718A JP2017034519A JP 2017034519 A JP2017034519 A JP 2017034519A JP 2015153718 A JP2015153718 A JP 2015153718A JP 2015153718 A JP2015153718 A JP 2015153718A JP 2017034519 A JP2017034519 A JP 2017034519A
Authority
JP
Japan
Prior art keywords
voice
audio
sound
signal
input unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015153718A
Other languages
English (en)
Inventor
石橋 孝昭
Takaaki Ishibashi
孝昭 石橋
清輝 葉山
Kiyoteru Hayama
清輝 葉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of National Colleges of Technologies Japan
Original Assignee
Institute of National Colleges of Technologies Japan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of National Colleges of Technologies Japan filed Critical Institute of National Colleges of Technologies Japan
Priority to JP2015153718A priority Critical patent/JP2017034519A/ja
Publication of JP2017034519A publication Critical patent/JP2017034519A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】音声が入来する方向に関する感度である指向性とは異なり、空間上の一定の範囲内で発生する音声を選択的に強調又は当該一定範囲外で発生する音声を選択的に抑制することにより、当該一定範囲内で発生する音声を選択的に収録可能にする。【解決手段】音声を電気信号に変換する2以上の音声入力部と、2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間の特定エリア内の音声を強調又は抑制した音声信号を生成する音声合成部と、を備えることを特徴とする音声処理装置。【選択図】図1

Description

本発明は、音声処理装置、音声処理システム及び音声処理方法に関する。
従来、マイクロホンの指向性制御については種々の工夫が為されており、その一例として下記の特許文献1〜3がある。
特許文献1には、少なくとも3つの単一指向性のマイクロホン素子を指向性の主軸と直交する方向に略等間隔で配し、加算器を用いて各マイクロホン素子からの出力信号を加算している。各マイクロホン素子は、集音面が同一方向を向いている。このように、マイクロホン素子を配置して構成したマイクロホン装置では、音声認識装置の入力手段に要求される中音域で鋭い指向性が実現され、正面からの音声入力に対して高感度であり且つ側面から入力されるノイズ成分が極めて少ない集音を実現できる。
特許文献2には、基準マイクロホンと、当該基準マイクロホンを中心に配置される第1の1対のマイクロホンと、基準マイクロホンを中心に前記第1の1対のマイクロホンに直交して配置される第2の1対のマイクロホンと、前記基準マイクロホンを中心に前記第1の1対のマイクロホンおよび前記第2の1対のマイクロホンに対して45度傾けて配置される第3の1対のマイクロホンとを同一平面上に備え、前記基準マイクロホン、第1、第2および第3の1対の各マイクロホンに基づく指向特性の主軸および/または指向性の鋭度を可変に制御するマイクロホン装置が開示されている。これにより、マイクロホンを中心とする左右の音源を分離してリアルタイムに音声収録又は音声認識をすることが可能になる。
特許文献3には、それぞれが実質的に同じ傾斜次数と周波数応答を有する3個以下のマイクロホンであって、各マイクロホンが各マイクロホンにおける音圧に応答する電気信号を生成する3個のマイクロホン、および、各マイクロホンから電気信号を受信するように結合され、各マイクロホンの傾斜次数よりも少なくとも2傾斜次数だけ高い傾斜次数を有する傾斜指向性マイクロホン・システムのための出力信号を生成するように動作するプロセッサによって構成される傾斜指向性マイクロホン・システムについて開示されている。この傾斜指向性マイクロホン・システムによれば、システムサイズと複雑性とを、従来に比較して実質的に軽減することができる。
特再公表平08ー25018号公報 特開2002−271885号公報 特表平08−505514号公報
ところで、ターゲット音声を録音するための従来のマイクロホン技術では、遅延和アレーによって超指向性マイクロホンを形成したり、適応型マイクロホンアレーで死角を形成したりすることで、雑音の少ないターゲット音声を録音している。しかしながら、指向性を鋭くするためには多数のマイクロホンが必要であり、高価になるという問題がある。
また、従来のマイクの指向性は、向きに対してのみ議論されており、マイクロホンと音源との距離についての議論は見当たらない。すなわち、指向性を様々に調整したとしても、マイク近傍の目的音の背後にある指向性の方向から入来する雑音も収録されてしまうという問題がある。
本発明は、音声が入来する方向に関する感度である指向性とは異なり、空間上の一定の範囲内で発生する音声を選択的に強調したり当該一定範囲外で発生する音声を選択的に抑制したりすることにより、当該一定範囲内で発生する音声を選択的に収録可能な音声処理装置、音声処理システム及び音声処理方法を実現することを目的とする。
本発明の態様の1つは、音声を電気信号に変換する2以上の音声入力部と、2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間に閉空間として形成される特定エリア内の音源から入来する音声を強調した音声信号を生成する音声合成部と、を備えることを特徴とする音声処理装置である。
このように構成された音声処理装置においては、2以上の音声入力部に入来した音声を変換して生成する電気信号を重みづけ合成するだけで、指向性とは異なる特定エリアという空間上の一定の範囲内の音源から入来する音声を選択的に強調した音声信号を生成することができる。これにより、当該特定エリア内で発生する音声が聞き取りやすく当該特定エリア外で発生する音声が聞き取りにくい音声をとすることが可能となる。
本発明の態様の1つは、音声を電気信号に変換する2以上の音声入力部と、2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間に閉空間として形成される特定エリア外の音源から入来する音声を抑制した音声信号を生成する音声合成部と、を備えることを特徴とする音声処理装置である。
このように構成された音声処理装置においては、2以上の音声入力部に入来した音声を変換して生成する電気信号を重みづけ合成するだけで、指向性とは異なる特定エリアという空間上の一定の範囲外の音源から入来する音声を選択的に抑制した音声信号を生成することができる。これにより、当該特定エリア外で発生する音声が聞き取りにくく当該特定エリア内で発生する音声が聞き取りやすい音声とすることが可能となる。
本発明の選択的な態様の1つは、前記音声合成部は、2以上の前記マイクロホン入力を所定のサンプリング周波数でアナログ/デジタル変換したデジタル音声信号をデジタル処理することにより前記重み付け合成を行うものであり、2以上の前記マイクロホンの間の間隔は、前記サンプリング周波数の半波長以下である、ことを特徴とする音声処理装置である。
このように構成された音声処理装置においては、2以上の前記マイクロホン入力を所定のサンプリング周波数でアナログ/デジタル変換したデジタル音声信号をデジタル処理するにあたり、同じ音源から入来する音声が各マイクロホンへ到達するまでの時間差が入力音声の波長に比べて十分に短く、両マイクロホンの入力音声の位相をほぼ同位相とみなせるため、入力音声の位相差の影響が無視できるようになる。
本発明の選択的な態様の1つは、位置情報を入力する位置情報入力手段を更に備え、前記音声合成部は、前記特定エリアが前記位置情報に対応する位置を含むように2以上の前記音声入力部が出力する電気信号を重み付け合成することを特徴とする音声処理装置である。
このように構成された音声処理装置においては、位置情報入力手段から入力された位置情報を含むように特定エリアを構成するため、その位置の音源から入来する音声を聞き取りやすくしたり、逆に、その位置の音源から入来する音声を聞き取りにくくしたりすることができる。位置情報入力手段が入力する位置情報としては、例えば、話者等のように録音したい音源の位置を示す情報や、ノイズ源等のように録音したくない音源の位置を示す情報等が例示される。
本発明の他の態様の1つは、音声を電気信号に変換する2以上の音声入力部と、2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間の特定エリア内の音源から入来する音声を強調した音声信号を生成する音声合成部と、を備えることを特徴とする音声処理システムである。
本発明の他の態様の1つは、音声を電気信号に変換する2以上の音声入力部と、2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間の特定エリア外の音源から入来する音声を抑制した音声信号を生成する音声合成部と、を備えることを特徴とする音声処理システムである。
本発明の他の態様の1つは、音声を電気信号に変換する2以上の音声入力部を用いて行う音声処理方法であって、2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間の特定エリア内の音源から入来する音声を強調した音声信号を生成することを特徴とする音声処理方法である。
本発明の他の態様の1つは、音声を電気信号に変換する2以上の音声入力部を用いて行う音声処理方法であって、2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間の特定エリア外の音源から入来する音声を抑制した音声信号を生成することを特徴とする音声処理方法である。
なお、上述した音声処理装置や音声処理システムは、他の機器に組み込まれた状態で実施されたり他の方法とともに実施されたりする等の各種の態様を含む。また、上述した音声処理方法は、他の方法の一環として実施されたりする等の各種の態様を含む。また、上述した音声処理方法の構成に対応した機能をコンピュータに実現させるプログラム、該プログラムを記録したコンピュータ読み取り可能な記録媒体、等としても実現可能である。
請求項1,5,7に係る発明によれば、2以上の音声入力部に入来した音声を変換して生成する電気信号を重みづけ合成するだけで、指向性とは異なる特定エリアという空間上の一定の範囲内の音源から入来する音声を選択的に強調した音声信号を生成することができる。これにより、当該特定エリア内で発生する音声が聞き取りやすく当該特定エリア外で発生する音声が聞き取りにくい音声とすることが可能となる。
請求項2,6,8に係る発明によれば、2以上の音声入力部に入来した音声を変換して生成する電気信号を重みづけ合成するだけで、特定エリアという空間上の一定の範囲外の音源から入来する音声を選択的に抑制した音声信号を生成することができる。これにより、当該特定エリア外で発生する音声が聞き取りにくく当該特定エリア内で発生する音声が聞き取りやすい音声とすることが可能となる。
請求項3に係る発明によれば、2以上の前記マイクロホン入力を所定のサンプリング周波数でアナログ/デジタル変換したデジタル音声信号をデジタル処理するにあたり、入力音声の位相差の影響が無視できるようになる。
請求項4に係る発明によれば、位置情報入力手段から入力された位置情報を含むように特定エリアを構成するため、その位置の音源から入来する音声を聞き取りやすくしたり、逆に、その位置の音源から入来する音声を聞き取りにくくしたりすることができる。
第1の実施形態の音声処理装置の概略構成を示すブロック図である。 音声入力部の指向性を示す図である。 2つの音声信号を単純加算した合成音声信号の特定エリアを示す図である。 2つの音声信号を重み付け加算した合成音声信号の特定エリアを示す図である。 2つの音声信号を単純減算した合成音声信号の特定エリアを示す図である。 2つの音声信号を重み付け減算した合成音声信号の特定エリアを示す図である。 第2の実施形態の音声処理装置の概略構成を示すブロック図である。 左2つの音声信号を重み付け加算した合成音声信号の特定エリアを示す図である。 右2つの音声信号を重み付け加算した合成音声信号の特定エリアを示す図である。 3つの音声信号を加算した合成音声信号の特定エリアを示す図である。 第3の実施形態の音声処理装置の構成を示す図である。
以下、下記の順序に従って本技術を説明する。
(1)第1の実施形態:
(2)第2の実施形態:
(3)第3の実施形態:
(1)第1の実施形態:
図1は、本実施形態の音声処理装置100の概略構成を示すブロック図である。
音声処理装置100は、音声を電気信号に変換する2以上の音声入力部としての音声入力部11,12、音声入力部11,12が出力する音声信号を重み付けし合成して合成音声信号Smixを生成する音声合成部20、音声合成部20が出力する合成音声信号Smixを音声に変換する音声出力部30、及び、音声処理装置100を操作するための操作部40を備える。
音声処理装置100は、液晶表示パネル等の表示部を更に備えてもよく、表示部は、音声入力部11,12への音声入力状況、音声合成部20における音声処理状況、音声出力部30における音声出力状況、操作部40の操作メニュー、等の表示を行う。
音声入力部11,12は、入来する音声を電気信号に変換するものである。音声入力部11は入来する音声に応じた音声信号S11を出力し、音声入力部12は入来する音声に応じた音声信号S12を出力する。本実施形態においては各音声入力部をマイクロホンで構成した場合を例にとり説明する。
なお、音声入力部11,12は、単一のマイクロホンで構成してもよいし、複数のマイクロホンで構成してもよい。複数のマイクロホンで1つの音声入力部を構成する場合は、音声入力部は、当該1つの音声入力部を構成する複数のマイクロホン出力を合成した電気信号を音声信号として出力する。
また、本実施形態では、音声入力部11,12が同じ感度であるものとして説明を行うが、音声入力部の感度は異なってもよく、その場合、後述する重み付けと同様の重み付けが予め音声信号に為されているのと同じこととなる。
図2は、音声入力部11,12の指向性を示す図である。同図及び後述する図3〜図5においては、音声入力部11,12の指向性を2点鎖線で示してある。
図2には、音声入力部11,12としてECM(エレクトレットコンデンサマイクロホン)の記号を示し、音声入力部11,12は、単一指向性に似た指向性を図示してある。ただし、音声入力部11,12を構成するマイクロホンの種類はこれに限るものではなく、各音声入力部の指向性の種類にも特に制限等は無く、様々な指向性を採用可能である(全指向性(無指向性)、双指向性、単一指向性、狭指向性、鋭指向性、超指向性、等)。また、後述する音声合成による特定エリアの形成範囲の制御が複雑になるものの、各音声入力部の指向性は同一である必要はない。
音声合成部20は、マイクロコンピュータ等の演算処理能力を有する演算部21、音声入力部の数に応じた複数の信号入力ポート22,23、音声出力部の数に応じた数の音声出力ポート24、及び、制御部の数に応じた数の制御信号入力ポート25を有する。
信号入力ポート22,23には、音声入力部11,12からそれぞれ音声信号S11,S12が入力される。信号出力ポート24からは合成音声信号Smixが出力される。制御信号入力ポート25には操作部40から音声合成部20内で実行する演算処理を制御する制御信号Scが入力される。
なお、後述する特定エリアを操作部40の操作に応じて変更したり後述する音源位置に基づいて変更したりせずに固定とする場合は、操作部40を設けなくともよい。この場合、音声合成部20の制御信号入力ポート25についても設けなくともよい。
音声出力部30は、入力される合成音声信号Smixを音声に変換して出力する。音声出力部30は、いわゆるスピーカにより構成することができる。なお、音声出力部30は、音声処理装置100の必須構成ではなく、イヤホンジャックやラインアウト端子等の出力ポートを設けて音声出力部としてのヘッドホンやスピーカ等を外部接続可能に構成してもよい。
以下、音声合成部20が実行する音声合成の一例について説明する。以下で説明する音声合成では、音声信号をアナログ/デジタル変換して生成したデジタル音声信号を用いたデジタル演算処理を利用した音声合成について説明する。
むろん、音声合成は、デジタル演算処理に限るものではなく、各音声入力部から入力される音声信号をアナログのままアナログ回路を用いて加算、減算等の合成を行うことで同様の合成音声信号を得ることもできる。
本実施形態に係る演算処理では、音声入力部11,12が出力する音声信号S11,S12を重み付けしつつ合成するデジタル演算処理を行うことにより、音声入力部11,12が設置された空間の特定エリア内の音源から入来する音声を強調した合成音声信号Smix、又は、当該特定エリア内の音源から入来する音声を抑制した合成音声信号Smixを生成する。
デジタル演算処理を行う場合、複数の音声入力部を構成する音声入力部11,12の距離は、サンプリング周波数の波長以下とする。これにより、同じ音源から入来する音声が各マイクロホンへ到達するまでの時間差が入力音声の波長に比べて十分に短くなり、両マイクロホンの入力音声の位相をほぼ同位相とみなせることとなり、入力音声の位相差の影響が無視できるようになる。
サンプリング周波数(実際には、そのサンプリング周波数で検出可能な最大周波数)は、ターゲット音声の周波数に応じて決定される。例えば、ターゲット音声を人声とする場合、人声の周波数(3kHz〜4kHz)の約2倍の周波数をサンプリング周波数(8kHz等)とし、音声入力部11,12の音声入力中心11c,12cの距離をサンプリング周波数の波長(約5cm)以下に設定する。
このように構成した音声処理装置100においては、音声入力部11,12の音声信号S11,S12を加算、減算することにより、特定エリア内の音源から入来する音声を強調したり、特定エリア外の音源から入来する音声を抑制したりすることができる。
すなわち、音声信号S11,S12を加算すると、音声入力部11,12近傍の音源の音声については強調され、音声入力部11,12から離間した音源から入来する音声ほど音声の強調度合いが減少するため相対的に音声が抑制される。なお、音声入力部11,12近傍とは、半径がターゲット音声の周波数の1波長程度の範囲であり、この範囲の重心は音声入力部11,12の指向性に応じて変動する。
また、音声信号S11,S12を減算すると、音声入力部11,12近傍の音声入力部11,12の中間距離の音源の音声は音量が拮抗するため互いに打ち消し合って抑制される一方、この中間距離を除く音声入力部11,12それぞれの近傍の音源の音声については音声信号S11,S12の間で有意な音量差が生じるため抑制されずに音声が残る。他方、音声入力部11,12遠方の音源の音声については音声信号S11,S12の間の音量差が徐々に減少して均一化していくため、音声信号S11,S12を減算することで互いに打ち消し合って抑制される。
以下では、音声が強調される特定エリア又は音声が抑制されない特定エリアを有感エリアRpとし、有感エリアRp以外のエリアを不感エリアRnとして説明する。なお、図3〜図5においては、音声入力部11,12の指向性を2点鎖線で示し、特定エリアの境界については1点鎖線で示してある。
図3〜図5は、デジタル演算処理により合成音声信号Smixを生成する場合の特定エリアを説明する図をそれぞれ示してある。
図3には、音声信号S11と音声信号S12を単純加算した合成音声信号Smixの有感エリアRpと不感エリアRnを示してある。同図において、有感エリアRpは、音声入力部11と音声入力部12の略中間を通る線上のいずれかの点を重心(本実施形態では音声入力部11,12が指向性を有しているため重心は音声入力部11,12の前方に位置する)とする閉空間内に形成され、当該閉空間外に不感エリアRnが形成される。
図4には、重みづけをして音声信号S11と音声信号S12を加算した合成音声信号Smixの有感エリアRpと不感エリアRnを示してある。同図に示す例では、音声信号S11の重みづけを音声信号S12よりも大きくしてある。この場合、単純加算した場合に比べて、有感エリアRpの閉空間の重心が音声入力部11寄りに位置し、この有感エリアRpの閉空間外が不感エリアRnとなる。すなわち、音声信号を加算した場合、有感エリアRpの閉空間の重心は、重み付けの大きい音声入力部寄りに位置することになる。
図5には、音声信号S11から音声信号S12を単純減算した合成音声信号Smixの有感エリアRpと不感エリアRnを示してある。同図では、有感エリアRpとして、音声入力部11寄りの有感エリアRpと音声入力部12寄りの有感エリアRpとが形成される。一方の有感エリアRpは、音声入力部11の外方を通る線上のいずれかの点を重心とする閉空間内に形成され、他方の有感エリアRpは、音声入力部12の外方を通る線上のいずれかの点を重心とする閉空間内に形成され、不感エリアRnは、これら閉空間外に形成される。
図6には、重みづけをして音声信号S11から音声信号S12を減算した合成音声信号Smixの有感エリアRpと不感エリアRnを示してある。同図に示す例では、音声信号S11の重みづけを音声信号S12よりも大きくしてある。
この場合も、有感エリアRpとして、音声入力部11寄りの有感エリアRp1と音声入力部12寄りの有感エリアRp2とが形成されるが、音声入力部11寄りの有感エリアRp1は音声入力部12寄りの有感エリアRp2よりも大きく形成され、有感エリアRp1の閉空間の重心の音声入力部11からの離間度は、有感エリアRp2の閉空間の重心の音声入力部12からの離間度よりも大きくなる。
すなわち、音声信号S11,S12を減算した場合、重み付けの大きい音声信号の音声入力部寄りの有感エリアRpは、重み付けの小さい音声信号の音声入力部寄りの有感エリアRpに比べて広く形成される。また、重み付けの大きい音声信号の音声入力部寄りに形成される有感エリアRpの重心の当該音声入力部からの離間度は、重み付けの小さい音声信号の音声入力部寄りに形成される有感エリアRpの重心の当該音声入力部からの離間度よりも大きくなる。
このように、2つの音声入力部を有する音声処理装置100では、一定の範囲内に形成される閉空間としての有感エリアRp内の音源から入来する音声を強調したり、有感エリアRp外の不感エリアRnの音源から入来する音声を抑制した合成音声信号Smixを生成したりすることができる。また、音声信号S11と音声信号S12の重みづけを調整することにより、有感エリアRp及び不感エリアRnの範囲を増減調整したり、有感エリアRpと不感エリアRnの形成位置を調整したりすることができる。
(2)第2の実施形態:
図7は、本実施形態の音声処理装置200の概略構成を示すブロック図である。同図に示す音声処理装置200は、音声入力部の数が3つである点を除くと音声処理装置100と同様の構成であるため、音声処理装置100と共通する構成については第1の実施形態と同じ符号を付して詳細な説明を省略する。なお、音声入力部13の構成は他の音声入力部11,12と同様であり、音声入力部13は音声信号S13を音声合成部20の信号入力ポート26へ入力する。
音声入力部11〜13は、3つの音声入力部が直線上に並ばないように、それぞれが互いに異なる三角形の頂点を構成する位置関係で配置される。デジタル演算処理を行う場合、複数の音声入力部を構成する音声入力部11,12,13のそれぞれの間の距離は、サンプリング周波数の波長以下とする。
このように構成した音声処理装置200によれば、音声入力部11,12,13の音声信号S11,S12,S13を加算・減算することにより、様々な位置と形状で特定エリアを形成し、特定エリア内の音源から入来する音声を強調したり、特定エリア外の音源から入来する音声を抑制したりすることができる。
図8〜図10には、3入力構成の音声処理装置200を用いたデジタル演算処理により合成音声信号Smixを生成する場合の特定エリアを説明する図をそれぞれ示してある。
図8には、重みづけをして音声信号S13から音声信号S11を減算した合成音声信号Smixの有感エリアRpと不感エリアRnを示してある。同図に示す例では、音声信号S13の重みづけを音声信号S11よりも大きくしてある。この場合、図6に示す有感エリアRpと不感エリアRnと同様に、有感エリアRpとして、音声入力部13寄りの有感エリアRpと音声入力部11寄りの有感エリアRpとが形成されるが、音声入力部13寄りの有感エリアRpは音声入力部11寄りの有感エリアRpよりも大きく形成され、大きく形成される有感エリアRpの閉空間の重心の音声入力部13からの離間度は、小さく形成される有感エリアRpの閉空間の重心の音声入力部11からの離間度よりも大きくなる。
図9には、重みづけをして音声信号S13から音声信号S12を減算した合成音声信号Smixの有感エリアRpと不感エリアRnを示してある。同図に示す例では、音声信号S13の重みづけを音声信号S12よりも大きくしてある。この場合も、図6に示す有感エリアRpと不感エリアRnと同様に、有感エリアRpとして、音声入力部13寄りの有感エリアRpと音声入力部12寄りの有感エリアRpとが形成されるが、音声入力部13寄りの有感エリアRpは音声入力部12寄りの有感エリアRpよりも大きく形成され、大きく形成される有感エリアRpの閉空間の重心の音声入力部13からの離間度は、小さく形成される有感エリアRpの閉空間の重心の音声入力部12からの離間度よりも大きくなる。
図10には、図8に示す重み付け減算の結果と図9に示す重みづけ減算の結果とを単純加算した合成音声信号Smixの有感エリアRpと不感エリアRnを示してある。同図に示す例では、図8と図9とでそれぞれ音声入力部13付近に形成された有感エリアRpが加算され、これら有感エリアRpの双方を含みつつ音声入力部13の指向性の方向に広い有感エリアRpが形成される。
このように、音声入力部を3つそれぞれが三角形の頂点位置となる位置関係で配置することにより、音声入力部が2つの場合に比べて、有感エリアRpの形成される位置や大きさを、3つの音声入力部が配置される平面の延びる方向において、高い自由度で調整可能になる。
更に言えば、音声入力部を4つそれぞれが三角錐の頂点位置となる位置関係で配置することにより、有感エリアRpの形成される位置や大きさを、4つの音声入力部が配置される3次元空間において様々に調整可能になる。
また、録音したい所望の音源の方向と距離が判明すれば、当該音源のあるエリアに感度を持つ有感エリアRpが形成される演算処理を行い、当該音源の発する音声が選択的に録音された合成音声信号Smixを生成することも可能である。また、逆に、録音したくない所望の音源の方向と距離が判明すれば、当該音源のあるエリアに感度を持たない有感エリアRpが形成される演算処理を行い、当該音源の発する音声が選択的に録音されない合成音声信号Smixを生成することも可能である。むろん、録音したい所望の音源の音声を録音しつつ録音したくない所望の音源を録音しない合成音声信号Smixを生成することも可能である。なお、所望の音源の方向と距離は、利用者が操作部の操作により指定して演算部に入力してもよいし、公知の又は今後開発される様々な手法で所望の音源(例えば、話者)の位置を自動的に特定して演算部に入力してもよい。
(3)第3の実施形態:
図11は、音声処理装置を具体的に実現した回路の一例を示す図である。
同図に示す音声処理装置300においては、それぞれ10kΩの抵抗R1,R1,R1と直列接続したコンデンサマイク311,312,313で、定電圧源Vcc(3.3V等)とグランドGndの間をそれぞれ接続してある。抵抗Rとコンデンサマイク311,312,313の接続点J1,J2,J3は、マイクロコンピュータ320の入力ポート321,322,323にそれぞれ接続されている。コンデンサマイク311,312,313と入力ポート321,322,323の間は、位相関係を可能な限り忠実に伝送することが望ましく、図11では伝送信号に位相変動を発生させる素子であるキャパシタを介さず直結してある。
入力ポート321,322,323へ入力される電圧はマイクロコンピュータ320内のアナログ/デジタル変換部によりデジタル信号に変換され、このデジタル信号を用いてマイクロコンピュータ320内の演算部324が合成音声信号Smixを生成する。デジタルの合成音声信号Smixは、マイクロコンピュータ320内のデジタル/アナログ変換部によりアナログ信号に変換され、マイクロコンピュータ320の出力ポート325にアナログ出力される。
図11に示す音声処理装置300においては、コンデンサマイク311,312,313がそれぞれ音声入力部を構成し、マイクロコンピュータ320が音声合成部を構成する。
出力ポート325は、抵抗R2を介してオペアンプOpの非反転入力端子に接続されており、オペアンプOpの反転入力端子には、オペアンプOpの出力端子電圧を一定割合に抵抗分割した電圧がフィードバック入力されている。オペアンプOpは、非反転増幅回路として機能する。オペアンプOpの出力端子には、コンデンサCを介してスピーカ等が接続される出力端子330が設けられており、出力端子330へは直流分がカットされた合成音声信号Smixが入力される。
以上のように構成した音声処理装置300は、マイクロコンピュータ320内のプログラムによって次のように動作する。
マイクロコンピュータ320内では、装置が起動すると、まず各種変数の初期化等の起動処理を行った後、各コンデンサマイクからの入力のゼロレベルのセットを行う。このゼロレベルのセットは、例えば、無音状態で各コンデンサマイクの出力を所定回数積算し、当該所定回数で割ることで直流分を検出することにより行う。
次に、ターゲット音声の周波数以上に設定されたサンプリング周波数(ターゲット音声が人声の場合、人声の周波数(3kHz〜4kHz)の約2倍の8kHz等)で繰り返しコンデンサマイク311,312,313からの音声入力をA/D変換(アナログ/デジタル変換)して取得し、上述した特定エリアの音声を強調又は抑制する演算を行い、その結果として生成される合成音声信号Smixを出力ポート325にアナログ出力する。
なお、本発明は上述した実施形態に限られず、上述した実施形態の中で開示した各構成を相互に置換したり組み合わせを変更したりした構成、公知技術並びに上述した実施形態の中で開示した各構成を相互に置換したり組み合わせを変更したりした構成、等も含まれる。また,本発明の技術的範囲は上述した実施形態に限定されず,特許請求の範囲に記載された事項とその均等物まで及ぶものである。
11…音声入力部、12…音声入力部、13…音声入力部、20…音声合成部、21…演算部、22…信号入力ポート、23…信号入力ポート、24…音声出力ポート、25…制御信号入力ポート、30…音声出力部、40…操作部、100…音声処理装置、200…音声処理装置、300…音声処理装置、311…コンデンサマイク、312…コンデンサマイク、320…マイクロコンピュータ、321…入力ポート、322…入力ポート、323…演算部、324…アナログ変換部、325…アナログ変換部、326…出力ポート、330…出力端子、Rn…不感エリア、Rp…有感エリア

Claims (8)

  1. 音声を電気信号に変換する2以上の音声入力部と、
    2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間に閉空間として形成される特定エリア内の音源から入来する音声を強調した音声信号を生成する音声合成部と、
    を備えることを特徴とする音声処理装置。
  2. 音声を電気信号に変換する2以上の音声入力部と、
    2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間に閉空間として形成される特定エリア外の音源から入来する音声を抑制した音声信号を生成する音声合成部と、
    を備えることを特徴とする音声処理装置。
  3. 前記音声合成部は、2以上の前記マイクロホン入力を所定のサンプリング周波数でアナログ/デジタル変換したデジタル音声信号をデジタル処理することにより前記重み付け合成を行うものであり、
    2以上の前記マイクロホンの間の間隔は、前記サンプリング周波数の半波長以下である、ことを特徴とする請求項1又は請求項2に記載の音声処理装置。
  4. 位置情報を入力する位置情報入力手段を更に備え、
    前記音声合成部は、前記特定エリアが前記位置情報に対応する位置を含むように2以上の前記音声入力部が出力する電気信号を重み付け合成する、ことを特徴とする請求項1〜請求項3の何れか1項に記載の音声処理装置。
  5. 音声を電気信号に変換する2以上の音声入力部と、
    2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間の特定エリア内の音源から入来する音声を強調した音声信号を生成する音声合成部と、
    を備えることを特徴とする音声処理システム。
  6. 音声を電気信号に変換する2以上の音声入力部と、
    2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間の特定エリア外の音源から入来する音声を抑制した音声信号を生成する音声合成部と、
    を備えることを特徴とする音声処理システム。
  7. 音声を電気信号に変換する2以上の音声入力部を用いて行う音声処理方法であって、
    2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間の特定エリア内の音源から入来する音声を強調した音声信号を生成することを特徴とする音声処理方法。
  8. 音声を電気信号に変換する2以上の音声入力部を用いて行う音声処理方法であって、
    2以上の前記音声入力部が出力する電気信号を重み付け合成することにより、前記音声入力部が設置された空間の特定エリア外の音源から入来する音声を抑制した音声信号を生成することを特徴とする音声処理方法。
JP2015153718A 2015-08-03 2015-08-03 音声処理装置、音声処理システム及び音声処理方法 Pending JP2017034519A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015153718A JP2017034519A (ja) 2015-08-03 2015-08-03 音声処理装置、音声処理システム及び音声処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015153718A JP2017034519A (ja) 2015-08-03 2015-08-03 音声処理装置、音声処理システム及び音声処理方法

Publications (1)

Publication Number Publication Date
JP2017034519A true JP2017034519A (ja) 2017-02-09

Family

ID=57989009

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015153718A Pending JP2017034519A (ja) 2015-08-03 2015-08-03 音声処理装置、音声処理システム及び音声処理方法

Country Status (1)

Country Link
JP (1) JP2017034519A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111883167A (zh) * 2020-08-12 2020-11-03 上海明略人工智能(集团)有限公司 声音的分离方法及装置、录音设备、可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111883167A (zh) * 2020-08-12 2020-11-03 上海明略人工智能(集团)有限公司 声音的分离方法及装置、录音设备、可读存储介质

Similar Documents

Publication Publication Date Title
JP4965707B2 (ja) 音識別方法および装置
US8249273B2 (en) Sound input device
US20120128175A1 (en) Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control
EP2665292A2 (en) Hearing assistance apparatus
WO1993013590A1 (en) Reducing background noise in communication systems and enhancing binaural hearing systems for the hearing impaired
KR20170067682A (ko) 음향 신호 수집을 위한 코드 실행가능 방법, 회로, 장치, 시스템 및 관련 컴퓨터
JP2019511888A (ja) 個々のサウンド領域を提供するための装置および方法
JP4400474B2 (ja) スピーカアレイ装置
CN109310525B (zh) 媒体补偿通过和模式切换
JP2009535655A (ja) 周辺雑音低減装置
WO2017169888A1 (ja) 音響再生装置および方法、並びにプログラム
JP2016015722A5 (ja)
JP2013510502A (ja) サラウンドサウンド生成のためのマルチチャンネルオーディオ信号を処理するための方法およびオーディオシステム
US11871193B2 (en) Microphone system
KR101791843B1 (ko) 차량 내 음향 공간 보정 시스템
JP2009130619A (ja) マイクロフォンシステム、音声入力装置及びこれらの製造方法
WO2020162271A1 (ja) スピーカユニットおよび音響システム
JP2017034519A (ja) 音声処理装置、音声処理システム及び音声処理方法
JP2019080246A (ja) 指向性制御装置および指向性制御方法
JP4293884B2 (ja) ステレオマイクロホン装置
TWI835246B (zh) 麥克風系統及波束成形方法
US11877133B2 (en) Audio output using multiple different transducers
TW202335513A (zh) 麥克風系統及波束成形方法
WO2022250854A1 (en) Wearable hearing assist device with sound pressure level shifting
KR20230156967A (ko) 오디오 줌