JP7023131B2 - 音声出力制御装置、及び音声出力制御プログラム - Google Patents
音声出力制御装置、及び音声出力制御プログラム Download PDFInfo
- Publication number
- JP7023131B2 JP7023131B2 JP2018021071A JP2018021071A JP7023131B2 JP 7023131 B2 JP7023131 B2 JP 7023131B2 JP 2018021071 A JP2018021071 A JP 2018021071A JP 2018021071 A JP2018021071 A JP 2018021071A JP 7023131 B2 JP7023131 B2 JP 7023131B2
- Authority
- JP
- Japan
- Prior art keywords
- conversation
- occupant
- output control
- unit
- estimation unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 23
- 230000005540 biological transmission Effects 0.000 description 13
- 230000003321 amplification Effects 0.000 description 10
- 238000003199 nucleic acid amplification method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 5
- 238000010191 image analysis Methods 0.000 description 3
- 238000009434 installation Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Circuit For Audible Band Transducer (AREA)
- Image Analysis (AREA)
Description
例えば、特許文献1には、音響装置が出力する音声信号と車内用マイクロフォンから受けた音声信号を逐次モニタリングし、両者の比較に基づいて乗員の発話の有無を判定し、発話されていると判定されると、車載カメラの撮影画像を用いて発話の行われている発話位置を特定し、音声出力部の各増幅率を制御することで、スピーカのうち発話位置に近いスピーカのみの音量を低下させる技術が開示されている。
実施の形態1.
音響システム3は、撮像装置31,32,33,34、複数の音声発生装置36,37,38,39、音声出力制御装置1、及び音響装置2を備える。
撮像装置31,32,33,34は、車載用カメラであり、車両に乗車している乗員を撮影するものである。撮像装置31,32,33,34は、少なくとも各乗員の顔部を撮影できるものであればよい。
音声発生装置36,37,38,39は、音声を出力するスピーカである。
音源取得部21は、音楽データ、放送データ、音声データ等の音源データ、又は映像データに含まれる音源データを取得する。
音源再生部22は、音源取得部21で取得した音源データを再生し、音声信号を生成する、いわゆる音声デコーダである。
音量制御部23は、音源再生部22で生成された音声信号に対して、音声発生装置36,37,38,39それぞれに出力する音声信号の増幅幅の制御を行うことができる、いわゆるコントロールアンプである。増幅幅は、操作部25又は音声出力制御装置1からの入力により決定される。操作部25及び音声出力制御装置1については後述する。
音声出力部24は、音量制御部23で増幅された音声信号を音声発生装置36,37,38,39にそれぞれ出力する。
操作部25は、再生する音源データの選択、音源データの再生方法の選択、音声を出力する音量の変更等、車両の乗員であるユーザが所望の操作をするための操作入力手段である。
画像取得部11は、撮像装置31,32,33,34それぞれから画像を取得する。
会話開始推定部12は、画像取得部11で取得した画像を基に、周知の画像解析技術を用いて、それぞれの乗員の口の開き具合を判定し、判定した口の開き具合から、乗員により会話が開始されるか否か推定する。例えば、会話開始推定部12は、乗員の口の大きさに対して開いた口の大きさの割合が予め設定した値より大きくなった等の条件を満たした際に、乗員により会話が開始されると推定する。
対象位置推定部13は、画像取得部11で取得した画像を基に、周知の画像解析技術を用いて、会話の開始が推定された乗員(以下、「話者」という)の顔の方向又は視線の方向を判定し、判定した話者の顔の方向又は視線の方向から会話対象の位置を推定する。会話対象の位置は、例えば、話者の顔の方向又は視線の方向にある座席である。
出力制御部14は、会話開始推定部12が乗員による会話の開始を推定した際、対象位置推定部13が推定した会話対象の位置に最も近い音声発生装置から出力される音声の音量を小さくするよう、音響装置2が出力する音声信号の増幅幅の制御を行うための制御情報を生成する。
制御情報送信部15は、出力制御部14が生成した制御情報を音響装置2に送信する。
実施の形態1において、画像取得部11、会話開始推定部12、対象位置推定部13、出力制御部14、及び制御情報送信部15の各機能は、処理回路201により実現される。すなわち、音声出力制御装置1は、画像取得部11で取得した画像に基づいて生成された制御情報を、制御情報送信部15で送信するための処理回路201を備える。
処理回路201は、図2Aに示すように専用のハードウェアであっても、図2Bに示すようにメモリ205に格納されるプログラムを実行するCPU(Central Processing Unit)206であってもよい。
また、音声出力制御装置1は、撮像装置31,32,33,34、及び音響装置2との通信を行うための、入力インタフェース装置203及び出力インタフェース装置204を有する。
なお、以上の説明では、音声出力制御装置1のハードウェア構成について、図2Bに示すように、HDD202を使用するものとして説明したが、HDD202に代えて、SSD(SolidStateDrive)を使用するものであってもよい。
図3に示すように、撮像装置31,32,33,34は、乗員301,302,303,304がそれぞれ座る座席311,312,313,314に対応して設置されている。撮像装置31,32,33,34は、乗員301,302,303,304、特に乗員301,302,303,304の顔部をそれぞれ撮影している。
音声発生装置36,37,38,39は、座席311,312,313,314にそれぞれ対応して設置されている。
図4は、実施の形態1に係る音声出力制御装置1の動作を説明するフローチャートである。以下、実施の形態1に係る音声出力制御装置1の動作を、当該フローチャートを用いて説明すると共に、図3に示すように、話者が乗員304であり、会話対象の位置が座席311である場合を例にとって説明する。
音声出力制御装置1がこのフローチャートに示した処理を繰り返し実行することで、音声出力制御装置1の動作中、音響装置2は、音声出力制御装置1から受信した制御情報に基づいて音声発生装置36,37,38,39に出力する音声信号の増幅幅の制御を行う。
会話開始推定部12は、画像取得部11で取得した画像を基に、乗員により会話が開始されるか否か推定する(ステップST2)。
ステップST2において、会話開始推定部12が乗員により会話が開始されると推定した場合(ステップST2“YES”)、対象位置推定部13は、画像取得部11で取得した画像を基に、話者の顔の方向又は視線の方向から会話対象の位置を推定する(ステップST3)。画像取得部11が取得した撮像装置34で撮影された画像を基に、会話開始推定部12が乗員304により会話が開始されると推定した場合、対象位置推定部13は、画像取得部11が取得した撮像装置34で撮影された画像を基に、乗員304の顔の方向又は視線の方向から会話対象の位置が前方右側の座席311であると推定する。
出力制御部14は、対象位置推定部13が推定した会話対象の位置に基づき、当該会話対象の位置に最も近い音声発生装置から出力される音声の音量を小さくするよう、音響装置2が出力する音声信号の増幅幅の制御を行うための制御情報を生成する(ステップST4)。出力制御部14は、対象位置推定部13が推定した会話対象の位置である座席311に最も近い音声発生装置36の音量を小さくするよう、音響装置2が出力する音声信号の増幅幅の制御を行うための制御情報を生成する。
制御情報送信部15は、出力制御部14が生成した制御情報を音響装置2に送信し(ステップST5)、音声出力制御装置1は、動作を終了する。
ステップST2において、会話開始推定部12が乗員により会話が開始されないと推定した場合(ステップST2“NO”)、音声出力制御装置1は、動作を終了する。
Claims (4)
- 車両に乗車している乗員の顔を撮影する撮像装置で撮影された画像を取得する画像取得部と、
前記画像取得部で取得した前記画像に基づいて、前記乗員の口の大きさに対して開いた口の大きさの割合が予め設定した値より大きくなったとき、前記乗員により会話が開始されたと推定する会話開始推定部と、
前記画像取得部で取得した前記画像に基づいて、会話の開始が推定された前記乗員の顔の方向又は視線の方向から会話対象の位置を推定する対象位置推定部と、
前記会話開始推定部が前記乗員による会話の開始を推定した際、前記対象位置推定部が推定した前記会話対象の位置に最も近い音声発生装置から出力される音声の音量を制御する制御情報を生成する出力制御部とを備えた
ことを特徴とする音声出力制御装置。 - 前記対象位置推定部は、会話の開始が推定された前席の前記乗員の顔の方向又は視線の方向がルームミラーの方向であった場合、前記会話対象の位置を後席と推定すること
を特徴とする請求項1記載の音声出力制御装置。 - 前記会話開始推定部は、前記乗員による会話の開始を推定した後、前記画像取得部で取得した前記画像に基づいて、会話の開始を推定した前記乗員の口の開き具合から前記乗員による会話の終了を推定し、
前記会話開始推定部が前記乗員による会話の終了を推定した際、前記出力制御部は、前記対象位置推定部が推定した前記会話対象の位置に最も近い前記音声発生装置から出力される音声の音量を元に戻すように制御する前記制御情報を生成すること
を特徴とする請求項1記載の音声出力制御装置。 - コンピュータに、
車両に乗車している乗員の顔を撮影する撮像装置で撮影された画像を取得する画像取得手順と、
前記画像取得手順において取得した前記画像に基づいて、前記乗員の口の大きさに対して開いた口の大きさの割合が予め設定した値より大きくなったとき、前記乗員により会話が開始されたと推定する会話開始推定手順と、
前記画像取得手順において取得した前記画像に基づいて、会話の開始が推定された前記乗員の顔の方向又は視線の方向から会話対象の位置を推定する対象位置推定手順と、
前記会話開始推定手順において前記乗員による会話の開始を推定した際、前記対象位置推定手順において推定した前記会話対象の位置に最も近い音声発生装置から出力される音声の音量を制御する制御情報を生成する出力制御手順と
を実行させるための音声出力制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018021071A JP7023131B2 (ja) | 2018-02-08 | 2018-02-08 | 音声出力制御装置、及び音声出力制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018021071A JP7023131B2 (ja) | 2018-02-08 | 2018-02-08 | 音声出力制御装置、及び音声出力制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019137167A JP2019137167A (ja) | 2019-08-22 |
JP7023131B2 true JP7023131B2 (ja) | 2022-02-21 |
Family
ID=67694901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018021071A Active JP7023131B2 (ja) | 2018-02-08 | 2018-02-08 | 音声出力制御装置、及び音声出力制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7023131B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR3111005B1 (fr) | 2020-06-02 | 2022-12-09 | Renault | Procede de controle du volume sonore |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007079624A (ja) | 2005-09-09 | 2007-03-29 | Toyota Central Res & Dev Lab Inc | 発話検出装置、方法及びプログラム |
JP2012025270A (ja) | 2010-07-23 | 2012-02-09 | Denso Corp | 車両用の音量制御装置および音量制御装置用のプログラム |
JP2015071320A (ja) | 2013-10-01 | 2015-04-16 | アルパイン株式会社 | 会話支援装置、会話支援方法及び会話支援プログラム |
US20160029111A1 (en) | 2014-07-24 | 2016-01-28 | Magna Electronics Inc. | Vehicle in cabin sound processing system |
JP2016066114A (ja) | 2014-09-22 | 2016-04-28 | 株式会社東芝 | 特徴点検出装置、方法及びプログラム |
JP2017090611A (ja) | 2015-11-09 | 2017-05-25 | 三菱自動車工業株式会社 | 音声認識制御システム |
-
2018
- 2018-02-08 JP JP2018021071A patent/JP7023131B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007079624A (ja) | 2005-09-09 | 2007-03-29 | Toyota Central Res & Dev Lab Inc | 発話検出装置、方法及びプログラム |
JP2012025270A (ja) | 2010-07-23 | 2012-02-09 | Denso Corp | 車両用の音量制御装置および音量制御装置用のプログラム |
JP2015071320A (ja) | 2013-10-01 | 2015-04-16 | アルパイン株式会社 | 会話支援装置、会話支援方法及び会話支援プログラム |
US20160029111A1 (en) | 2014-07-24 | 2016-01-28 | Magna Electronics Inc. | Vehicle in cabin sound processing system |
JP2016066114A (ja) | 2014-09-22 | 2016-04-28 | 株式会社東芝 | 特徴点検出装置、方法及びプログラム |
JP2017090611A (ja) | 2015-11-09 | 2017-05-25 | 三菱自動車工業株式会社 | 音声認識制御システム |
Also Published As
Publication number | Publication date |
---|---|
JP2019137167A (ja) | 2019-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10848889B2 (en) | Intelligent audio rendering for video recording | |
CN111373471B (zh) | 声响信号控制装置及方法、以及记录介质 | |
JP2007290691A (ja) | 車両通信システム | |
JP7049803B2 (ja) | 車載装置および音声出力方法 | |
US9769568B2 (en) | System and method for speech reinforcement | |
JP2008236397A (ja) | 音響調整システム | |
JP4816334B2 (ja) | ノイズ低減装置、撮像装置、ノイズ低減方法およびプログラム | |
JP2018516497A (ja) | 動的音響環境におけるマルチチャネル音のための音響エコー消去の較正 | |
JP2021524940A (ja) | リモートマイクロフォン技術のための近接補償システム | |
JP7023131B2 (ja) | 音声出力制御装置、及び音声出力制御プログラム | |
JP2011002723A (ja) | 音声信号処理装置 | |
US11012774B2 (en) | Spatially biased sound pickup for binaural video recording | |
JP7065964B2 (ja) | 音場制御装置および音場制御方法 | |
JP6995254B2 (ja) | 音場制御装置及び音場制御方法 | |
WO2021156946A1 (ja) | 音声分離装置及び音声分離方法 | |
JP6568344B2 (ja) | 電子機器及び制御方法 | |
US11290812B2 (en) | Audio data arrangement | |
JP6144945B2 (ja) | 信号処理装置及び方法 | |
JP2021173881A (ja) | 音声処理装置および音声処理方法 | |
JP2012165219A (ja) | 撮像装置 | |
US11758287B2 (en) | Method for filtering noise of lens operation and video recording system | |
WO2018173112A1 (ja) | 音出力制御装置、音出力制御システムおよび音出力制御方法 | |
CN112544088B (zh) | 拾音扩音装置、其方法以及记录介质 | |
WO2021156945A1 (ja) | 音声分離装置及び音声分離方法 | |
JP2015097318A (ja) | 音声信号処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200428 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20200428 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210507 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20211012 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211216 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20211216 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20211223 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220201 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220208 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7023131 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |