JP6657978B2 - 音声処理装置、音声処理方法及び音声処理プログラム - Google Patents

音声処理装置、音声処理方法及び音声処理プログラム Download PDF

Info

Publication number
JP6657978B2
JP6657978B2 JP2016005628A JP2016005628A JP6657978B2 JP 6657978 B2 JP6657978 B2 JP 6657978B2 JP 2016005628 A JP2016005628 A JP 2016005628A JP 2016005628 A JP2016005628 A JP 2016005628A JP 6657978 B2 JP6657978 B2 JP 6657978B2
Authority
JP
Japan
Prior art keywords
voice
control target
distance
voice control
measuring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2016005628A
Other languages
English (en)
Other versions
JP2017126906A (ja
Inventor
亮人 相場
亮人 相場
吉田 実
実 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2016005628A priority Critical patent/JP6657978B2/ja
Publication of JP2017126906A publication Critical patent/JP2017126906A/ja
Application granted granted Critical
Publication of JP6657978B2 publication Critical patent/JP6657978B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Closed-Circuit Television Systems (AREA)

Description

本発明は、音声処理装置、音声処理方法及び音声処理プログラムに関する。
店舗や街頭などに設置されたカメラの映像によって、その場の監視、記録を行うシステムが一般に広く普及している。また、マイクを併設することで映像のみならず音声による監視、記録も行うシステムも既に知られている。
しかし、従来の音声による監視、記録システムでは、セキュリティーやプライバシーの観点から、他人に聞かせたくない音声も監視、記録されてしまうという問題がある。その対策として、測位センサなどを用いて対象の位置を検知し、マイクアレイの死角制御などで、その対象のいる方向から到来する音声を抑圧する方法がある。しかし、この方法では、対象が遠くにいる場合などにおいては、マイク近くの他の録るべき音も抑圧されてしまう問題がある。
特許文献1(特開2015−029241号公報)には、特定の音声を監視、記録しない目的で、音声位置がプライバシー領域にあるかを判定し、プライバシー領域内の場合に、音声出力を制御する指向性制御システム及び音声出力制御方法が開示されている。
この指向性制御システムでは、外部信号を受信した際に、その信号の発生位置に対して抑圧するようパラメータを変更させ、特定の音声を監視、記録しないようにしている。しかし、この指向性制御システムでも、対象が遠くにいる場合などにおいて、近くの他の録るべき音も抑圧されてしまうという問題は解消できていない。
本発明は、上述の従来の問題に鑑みてなされたものであって、その目的は、音声による監視、記録を行っている場所において、特定対象の音声を抑圧する際に、不必要に他の音声を抑圧することを回避することである。
本発明は、音声制御対象の音声を取得する音声取得手段と、前記音声制御対象の方向を測定する方向測定手段と、前記音声制御対象までの距離を測定する距離測定手段と、前記音声制御対象から到来する音声を取得又は取得抑制して出力する音声処理手段と、を有し、前記音声処理手段は、前記音声制御対象の方向において、前記音声制御対象までの距離が所定の距離未満であるとき、前記音声制御対象から到来する音声の取得抑制を行い、前記音声制御対象までの距離が前記所定の距離以上であるとき、前記取得抑制を行わないことを特徴とする音声処理装置である。
本発明によれば、音声による監視、記録を行っている場所において、特定対象の音声を抑圧する際に、不必要に他の音声を抑圧することを回避することができる。
本発明の実施形態に係る音声処理装置の動作の概要を示した図であり、図1Aは音声制御対象が近く(所定の距離r以下)に存在する場合を、また図1Bは距離rを超える場合を示す図である。 本音声処理装置を概略的に示す機能ブロック図である。 本音声処理装置における音声処理手順を示すフロー図である。 本音声処理装置を実現するコンピュータシステムのハードウェア構成を示すブロック図である。
以下、本発明の実施の形態を説明するが、その前に、本発明を概略的に説明すれば、本発明は、音(音声を含む;ここでは総称して音声という)による任意の場所の監視、記録システムにおける指向特性制御処理に際して、以下の特徴を有している。
即ち、本発明は、音声による監視、記録を行っている場所において、例えば音声による監視や記録を避けたい人物がICタグなどの発信装置を持ち、システムはその発信位置を検出して、その位置からの音声を抑圧処理することが特徴である。
次に、本発明の実施形態について図面を参照して説明する。
図1は本発明の実施形態に係る音声処理装置10の動作の概要を示した図であり、図1Aは音声制御対象が近く(所定の距離r以下)に存在する場合を、また図1Bは距離rを超える場合を示す図である。
即ち、音声による監視や記録を行う場所において、ある音声制御対象の音声を録りたくない場合、音声制御対象が存在する方向θ(図1AのマイクアレイMの表面に対する垂直線からの角度)を調べ(具体的には算出する)、図1AのようにマイクアレイMを用いてθ方向から到来する音声を抑圧するような指向特性を形成することで対処する。
しかし、音声制御対象までの距離rが所定の距離よりも大きい場合は、そのまま抑圧処理を行うと、音声制御対象の音声がもともと所定レベルよりも小さい場合には、音声制御対象とマイク間の音は拾えない。
そこで、本実施形態では、図1Bに示すように距離rが所定の距離よりも大きい場合は、マイクを無指向特性とし、音声制御対象以外の音を取得できるようにする。
図2は、本音声処理装置10を概略的に示す機能ブロック図である。
音声制御対象20は、特定の人物のほか、動物、ロボット、何らかのオブジェクトでもよい。
音声制御対象20は、位置情報送信手段201を有し、自らの位置情報を音声処理装置10へ送信する。ここで、位置情報はGPS(Global Positioning System)やWi-Fi(Wireless Fidelity)、Bluetooth(登録商標)などの通信を利用した測位技術を用いて測定してもよいし、距離センサなどのセンシング技術を用いて測定してもよい。
位置情報受信手段101は、音声制御対象20からの位置情報を受信する。
方向測定手段102は、位置情報から、音声処理装置10に対する音声制御対象20の方向を測定(計算)する。例えば、xy平面上で音声制御対象20の座標(位置座標)が(x,y)であるという位置情報を受信し、音声処理装置10の座標(x,y)が既知である場合、音声制御対象20の方向は、y軸方向をθ = 0、右回りを正としたとき、
θ=Tan−1(x−x/y−y)・・・・・式1
で計算できる。
距離測定手段103は、位置情報に基づき音声処理装置10から音声制御対象20までの距離を測定(計算)する。例えば、同じくxy平面上で音声制御対象20の座標が(x,y)であるという位置情報を受信し、音声処理装置10の座標が(x,y)で既知である場合、音声制御対象20までの距離rは、
r=((x−x+(y−y1/2・・・・・式2
で計算できる。
音声取得手段104(1〜M)は、マイクロホンなどであって、それぞれ音声信号を取得する。
音声処理手段105は、方向情報(角度情報)と距離情報に応じて各音声信号を抑圧する処理を行う。即ち、例えば、音声制御対象20の方向に対しては音声を抑圧する処理を行い、それを距離に応じて(即ち所定の閾値と対比してそれ以上か否かにより)オン(作動)又はオフ(不作動)とする。
即ち、距離rがある値(所定の閾値)以上でなければ、音声処理手段105をオンしてこの処理を行い、そうでなければ、音声処理手段105をオフして入力音声信号1をそのまま出力する。
このような制御を行うことで、所定の距離r以上で音声制御対象20が遠くにあるときは、そもそも集音(又は収音)する音声が小さいため抑圧を行わずに、その方向にあるその他の音声を取得することを優先できる。また、音声制御対象20が所定の距離rよりも近くにあるときは音声制御対象の発する音声を抑圧することができる。
なお、音声処理手段105では、マイクアレイMを用いて特定の方向に指向特性の死角を形成する公知の方法を採用することができる。また、音声処理手段105は、音声制御対象の方向から到来する音声を、特定の方向において、音声制御対象までの距離に応じて予め定めた抑圧量になるよう指向特性を形成することで音声抑圧を行う。このようにすることで、距離に対して連続的に抑圧量を変化することができる。
図3は、以上で説明した本発明の実施形態に係る音声処理装置10における音声処理手順を示すフロー図である。
本音声処理装置10の音声処理について、図3に示すフロー図を参照して説明する。
本音声処理は、まず、音声制御対象20からマイクアレイで集音した所定の個数(M個)の音声信号を取得する(S101)。次に、音声制御対象20からの位置情報を受信する(S102)。
次に、ステップS102で受信した位置情報から、音声制御対象20までの距離rを測定(計算)する(S103)。
次に、ステップS103で測定(式2で算出)した距離rが、ある閾値より小さいか判定する(S104)。ここで、距離rが閾値よりも小さければ(S104、Yes)、受信した位置情報から、式1により対象の方向θを測定(算出)する(S105)。次に、測定(算出)した方向θからの音声を抑圧するよう、ステップS101で取得した任意の個数(M個)の音声信号を、例えば指向特性の死角を形成することで処理(抑圧処理)し、処理結果を出力し(S106)、この処理を終了する。
ステップS104で距離rが閾値よりも小さくなければ(S104、No)、音声の抑圧処理を行わずにステップS101で取得した1個目の音声信号をそのまま出力して(S107)、処理を終了する。
以上で説明した音声処理装置10は、図4に示すような汎用のコンピュータシステム30により実現することができる。このコンピュータシステム30は、CPU(Central Processing Unit)301、ROM(Read Only Memory)302、RAM(Random Access Memory)303、HDD(Hard Disk Drive)304、およびI/F(インタフェース)305がバス40を介して接続された構成を有し、I/F305にはLCD(Liquid Crystal Display)などの表示部306および操作部307が接続されている。
CPU301は演算手段であり、コンピュータシステム30全体の動作を制御する。ROM302は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムが格納されている。RAM303は、情報の高速な読み書きが可能な揮発性の記憶媒体であり、CPU301が情報を処理する際の作業領域として用いられる。HDD304は、情報の読み書きが可能な不揮発性の記憶媒体であり、OS(Operating System)や各種の制御プログラム、アプリケーションプログラム等が格納されている。I/F305は、バス40と各種のハードウェアやネットワーク等を接続し制御する。表示部306は、ユーザがコンピュータシステムの状態を確認するための視覚的ユーザインタフェースである。操作部307は、キーボードやマウス等、ユーザがコンピュータシステムに情報を入力するためのユーザインタフェースである。
以上、本発明の実施形態について説明したが、音声制御対象までの距離が所定の距離以上であり遠い場合には、対象の音声が収録されることを防ぐと共に、所定の距離未満にある他の音源の音の収録を行うことができる。
また、音声制御対象が位置情報送信手段を有することにより、音声制御対象が送信した位置情報から、その方向と距離を容易に割り出すことができるため、音声制御対象から到来する音声に対する抑圧処理を容易に行うことができる。
10・・・音声処理装置、101・・・位置情報受信手段、102・・・方向測定手段、103・・・距離測定手段、104・・・音声取得手段、105・・・音声処理手段、20・・・音声制御対象、201・・・位置情報送信手段、30・・・コンピュータシステム、301・・・CPU、302・・・ROM、303・・・RAM、304・・・HDD、305・・・I/F、306・・・表示部、307・・・操作部。
特開2015−029241号公報

Claims (6)

  1. 音声制御対象の音声を取得する音声取得手段と、
    前記音声制御対象の方向を測定する方向測定手段と、
    前記音声制御対象までの距離を測定する距離測定手段と、
    前記音声制御対象から到来する音声を取得又は取得抑制して出力する音声処理手段と、
    を有し、
    前記音声処理手段は、前記音声制御対象の方向において、前記音声制御対象までの距離が所定の距離未満であるとき、前記音声制御対象から到来する音声の取得抑制を行い、前記音声制御対象までの距離が前記所定の距離以上であるとき、前記取得抑制を行わないことを特徴とする音声処理装置。
  2. 請求項に記載された音声処理装置において、
    前記音声処理手段は、前記音声制御対象までの距離が前記所定の距離未満の場合に、前記音声制御対象の方向から到来する音声を抑圧する指向特性を形成し、前記音声制御対象までの距離が前記所定の距離以上の場合に無指向特性を形成することを特徴とする音声処理装置。
  3. 請求項に記載された音声処理装置において、
    前記音声処理手段は、前記音声制御対象の方向から到来する音声を、前記音声制御対象までの距離に応じて定めた量だけ抑圧する指向特性を形成することを特徴とする音声処理装置。
  4. 音声制御対象の音声を取得する音声取得手段と、
    前記音声制御対象の位置情報を受信する位置情報受信手段と、
    前記位置情報に基づき前記音声制御対象の方向を測定する方向測定手段と、
    前記位置情報に基づき前記音声制御対象までの距離を測定する距離測定手段と、
    前記音声制御対象から到来する音声を取得又は取得抑制して出力する音声処理手段と、
    を有し、
    前記音声処理手段は、前記音声制御対象の方向において、前記音声制御対象までの所定の距離に基づき前記音声制御対象の音声の取得又は取得抑制を行うことを特徴とする音声処理装置。
  5. 音声制御対象の音声を取得する音声取得工程と、
    前記音声制御対象の方向を測定する方向測定工程と、
    前記音声制御対象までの距離を測定する距離測定工程と、
    前記音声制御対象から到来する音声を取得又は取得抑制して出力する音声処理工程と、
    を有し、
    前記音声処理工程では、前記音声制御対象の方向において、前記音声制御対象までの距離が所定の距離未満であるとき、前記音声制御対象から到来する音声の取得抑制を行い、前記音声制御対象までの距離が前記所定の距離以上であるとき、前記取得抑制を行わないことを特徴とする音声処理方法。
  6. 音声取得手段で取得した音声制御対象の音声をコンピュータにより処理する音声処理プログラムであって、
    前記コンピュータを、前記音声制御対象の方向を測定する方向測定手段と、前記音声制御対象までの距離を測定する距離測定手段と、前記音声制御対象から到来する音声を取得又は取得抑制して出力する音声処理手段として機能させ、かつ、前記音声処理手段で、前記音声制御対象の方向において、前記音声制御対象までの距離が所定の距離未満であるとき、前記音声制御対象から到来する音声の取得抑制を行い、前記音声制御対象までの距離が前記所定の距離以上であるとき、前記取得抑制を行わないことを特徴とする音声処理プログラム。
JP2016005628A 2016-01-14 2016-01-14 音声処理装置、音声処理方法及び音声処理プログラム Expired - Fee Related JP6657978B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016005628A JP6657978B2 (ja) 2016-01-14 2016-01-14 音声処理装置、音声処理方法及び音声処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016005628A JP6657978B2 (ja) 2016-01-14 2016-01-14 音声処理装置、音声処理方法及び音声処理プログラム

Publications (2)

Publication Number Publication Date
JP2017126906A JP2017126906A (ja) 2017-07-20
JP6657978B2 true JP6657978B2 (ja) 2020-03-04

Family

ID=59365308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016005628A Expired - Fee Related JP6657978B2 (ja) 2016-01-14 2016-01-14 音声処理装置、音声処理方法及び音声処理プログラム

Country Status (1)

Country Link
JP (1) JP6657978B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6489895A (en) * 1987-09-30 1989-04-05 Sony Corp Microphone device
JP2010154260A (ja) * 2008-12-25 2010-07-08 Victor Co Of Japan Ltd 音声識別装置
JP2010200253A (ja) * 2009-02-27 2010-09-09 Nikon Corp 撮像装置
JP5564873B2 (ja) * 2009-09-25 2014-08-06 富士通株式会社 収音処理装置、収音処理方法、及びプログラム
JP6125457B2 (ja) * 2014-04-03 2017-05-10 日本電信電話株式会社 収音システム及び放音システム

Also Published As

Publication number Publication date
JP2017126906A (ja) 2017-07-20

Similar Documents

Publication Publication Date Title
US10785565B2 (en) Distributed audio capture and mixing controlling
JP6157598B2 (ja) 移動ロボット、及び、音源位置推定システム
JP2017527223A5 (ja)
US20180338106A1 (en) Flexible Spatial Audio Capture Apparatus
CN109565629B (zh) 用于控制音频信号的处理的方法和装置
KR20180023702A (ko) 음성 인식을 위한 전자 장치 및 그 제어 방법
US20210158828A1 (en) Audio processing device, image processing device, microphone array system, and audio processing method
US20110054890A1 (en) Apparatus and method for audio mapping
JP2017067666A5 (ja)
KR102475989B1 (ko) 오디오 신호의 주파수의 변화에 따른 위상 변화율에 기반하여 노이즈가 감쇠된 오디오 신호를 생성하는 장치 및 방법
WO2016061076A1 (en) User experience oriented audio signal processing
US20180188104A1 (en) Signal detection device, signal detection method, and recording medium
TW201741623A (zh) 辨別車輛當前位於高架道路或平面道路的方法
CN107450882B (zh) 一种调节声音响度的方法、装置及存储介质
JP6657978B2 (ja) 音声処理装置、音声処理方法及び音声処理プログラム
US20200275205A1 (en) Smart Speaker System with Microphone Room Calibration
JP4944219B2 (ja) 音出力装置
US10212529B1 (en) Holographic visualization of microphone polar pattern and range
US10055192B1 (en) Mobile phones with warnings of approaching vehicles
WO2019093297A1 (ja) 情報処理装置、制御方法、及びプログラム
WO2017004881A1 (zh) 一种参数调整方法、装置及计算机存储介质
JP2016009950A (ja) 音声処理装置
CN113196797B (zh) 用于可听设备的控制的声学手势检测
JP7505429B2 (ja) 音量制御システム、音量制御方法及び音量制御プログラム
KR101525349B1 (ko) 무선통신 서비스를 수행하는 네트워크 기반 초지향성 스피커 제공 시스템 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200120

R151 Written notification of patent or utility model registration

Ref document number: 6657978

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees