JP7410754B2 - 音声入出力装置、音声入出力方法、および音声入出力プログラム - Google Patents
音声入出力装置、音声入出力方法、および音声入出力プログラム Download PDFInfo
- Publication number
- JP7410754B2 JP7410754B2 JP2020037079A JP2020037079A JP7410754B2 JP 7410754 B2 JP7410754 B2 JP 7410754B2 JP 2020037079 A JP2020037079 A JP 2020037079A JP 2020037079 A JP2020037079 A JP 2020037079A JP 7410754 B2 JP7410754 B2 JP 7410754B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- voice
- output
- input
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 86
- 230000008569 process Effects 0.000 claims description 71
- 230000005236 sound signal Effects 0.000 claims description 37
- 238000001514 detection method Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 6
- 238000003384 imaging method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Telephone Function (AREA)
Description
以下、本発明の一側面に係る実施の形態(以下、「本実施形態」とも表記する)を、図面に基づいて説明する。図1は実施形態1に係る音声入出力装置(例えば、テレビジョン装置)10および音声入出力装置10に接続される外部スピーカシステム20からなる音声入出力システム100の要部構成を示すブロック図である。実施形態1に係る音声入出力システム100は、音声認識によって操作することができるシステムである。
上記実施形態1では、音声認識部16が、ユーザ音声取得部(マイクロフォン)14から入力されるトリガーワードを認識することをトリガーとして音声認識処理を開始する音声入出力装置10の実施形態について説明した。本実施形態では、上記実施形態1の構成に替えて、撮影部(たとえば、カメラ)18がユーザによって行われた所定のジェスチャを検出する、または、リモートコントローラ30に特定の操作がなされたことをトリガーとして、音声認識処理を開始する音声入出力装置10について説明する。
〔態様1〕
上記の課題を解決するために、本発明の一態様に係る音声入出力装置は、入力信号に含まれる入力信号音声に対して音声調整処理を行う第1音声処理部と、前記第1音声処理部による音声調整処理が施された入力信号音声を出力する第1音声出力部と、ユーザからの音声を示す音声信号を取得するユーザ音声取得部と、前記ユーザ音声取得部が取得した音声信号が示す音声から、前記第1音声処理部による音声調整処理が施された音声成分を取り除く処理を行う音声除去部と、を備え、前記入力信号音声は、前記ユーザ音声取得部が前記ユーザからの音声入力を取得しない場合に、前記第1音声出力部とは異なる第2音声出力部から出力され、前記ユーザ音声取得部が前記ユーザからの音声入力を取得した場合に、前記第1音声処理部による音声調整処理が施された上で前記第1音声出力部から出力される。
入力信号に含まれる入力信号音声に対して音声調整処理を行う第1音声処理部と、前記第1音声処理部による音声調整処理が施された入力信号音声を出力する第1音声出力部と、ユーザからの音声を示す音声信号を取得するユーザ音声取得部と、前記ユーザ音声取得部が取得した音声信号が示す音声から、前記第1音声処理部による音声調整処理が施された音声成分を取り除く処理を行う音声除去部と、前記音声除去部での処理を施した後の音声に基づいて、音声認識処理を行う音声認識部と、を備え、前記入力信号音声は、前記音声認識部が音声認識処理を開始するトリガーとなるトリガーワードを取得しない場合に、前記第1音声出力部とは異なる第2音声出力部から出力され、前記音声認識部が前記トリガーワードを取得した場合に、前記第1音声処理部による音声調整処理が施された上で前記第1音声出力部から出力される。
上記一態様に係る音声入出力装置において、前記第2音声処理部は、当該音声入出力装置とは異なる装置が備えていてもよい。
上記一態様に係る音声入出力装置において、当該音声入出力装置とは異なる前記装置は、前記入力信号に含まれる入力信号音声に対して前記第1音声処理部とは異なる音声調整処理を行う第2音声処理部を更に備え、前記第2音声出力部は、前記第2音声処理部による音声調整処理が施された前記入力信号音声を出力してもよい。
上記一態様に係る音声入出力装置において、前記第1音声出力部からの出力と前記第2音声出力部からの出力とが切り替わる場合において、音量に関する設定変更を行わなくてよい。
上記一態様に係る音声入出力装置は、当該音声入出力装置の周囲を撮影する撮影部を更に備え、前記ユーザ音声取得部は、前記撮影部が撮影した動画像内において、前記ユーザによって行われた所定のジェスチャが検出されたことに応答して、前記ユーザからの音声を示す音声信号を取得する処理を開始してもよい。
上記一態様に係る音声入出力装置において、前記ユーザ音声取得部は、当該音声入出力装置の操作を行うためのリモートコントローラにおいて、所定の操作が行われたことに応答して、前記ユーザからの音声を示す音声信号を取得する処理を開始してもよい。
上記の課題を解決するために、本発明の一態様に係る音声入出力方法は、入力信号に含まれる入力信号音声に対して第1の音声調整処理を行う第1音声処理ステップと、前記第1音声処理が施された入力信号音声を出力する第1音声出力ステップと、ユーザからの音声を示す音声信号を取得するユーザ音声取得ステップと、前記ユーザ音声取得ステップにおいて取得した音声信号が示す音声から、前記第1音声処理が施された音声成分を取り除く処理を行う音声除去ステップと、を含む音声入出力方法であって、前記入力信号音声は、前記ユーザ音声取得ステップにおいて前記ユーザからの音声入力を取得しない場合に、前記第1音声出力ステップとは異なる第2音声出力ステップにおいて出力され、前記ユーザ音声取得ステップにおいて前記ユーザからの音声入力を取得した場合に、前記第1音声処理が施された上で前記第1音声出力ステップにおいて出力される。
上記の課題を解決するために、本発明の一態様に係る音声入出力プログラムは、前記音声入出力装置としてコンピュータを機能させるための音声入出力プログラムであって、前記第1音声処理部および前記音声除去部としてコンピュータを機能させるための音声入出力プログラムである。
音声入出力装置10の制御部17(デコード部11、第1音声処理部12、音声除去部15、および音声認識部16)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
本発明は上述した実施形態および変形例に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態のそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
11 デコード部
12 第1音声処理部
13 第1音声出力部
14 ユーザ音声取得部
15 音声除去部
16 音声認識部
17 制御部
18 撮影部
20 外部スピーカシステム
21 第2音声処理部
22 第2音声出力部
30 リモートコントローラ
100 音声入出力システム
Claims (10)
- 入力信号に含まれる入力信号音声に対して音声調整処理を行う第1音声処理部と、
前記第1音声処理部による音声調整処理が施された入力信号音声を出力する第1音声出力部と、
ユーザからの音声を示す音声信号を取得するユーザ音声取得部と、
前記ユーザ音声取得部が取得した音声信号が示す音声から、前記第1音声処理部による音声調整処理が施された音声成分を取り除く処理を行う音声除去部と、を備える音声入出力装置であって、
前記入力信号音声は、
前記ユーザ音声取得部が前記ユーザからの音声入力を取得しない場合に、前記音声入出力装置とは異なる装置が備えている第2音声出力部から出力され、
前記ユーザ音声取得部が前記ユーザからの音声入力を取得した場合に、前記第1音声処理部による音声調整処理が施された上で前記第1音声出力部から出力される
ことを特徴とする音声入出力装置。 - 入力信号に含まれる入力信号音声に対して音声調整処理を行う第1音声処理部と、
前記第1音声処理部による音声調整処理が施された入力信号音声を出力する第1音声出力部と、
ユーザからの音声を示す音声信号を取得するユーザ音声取得部と、
前記ユーザ音声取得部が取得した音声信号が示す音声から、前記第1音声処理部による音声調整処理が施された音声成分を取り除く処理を行う音声除去部と、
前記音声除去部での処理を施した後の音声に基づいて、音声認識処理を行う音声認識部と、を備える音声入出力装置であって、
前記入力信号音声は、
前記音声認識部が音声認識処理を開始するトリガーとなるトリガーワードを取得しない場合に、前記音声入出力装置とは異なる装置が備えている第2音声出力部から出力され、
前記音声認識部が前記トリガーワードを取得した場合に、前記第1音声処理部による音声調整処理が施された上で前記第1音声出力部から出力される
ことを特徴とする音声入出力装置。 - 当該音声入出力装置とは異なる前記装置は、
前記入力信号に含まれる入力信号音声に対して前記第1音声処理部とは異なる音声調整処理を行う第2音声処理部を更に備え、
前記第2音声出力部は、
前記第2音声処理部による音声調整処理が施された前記入力信号音声を出力する
ことを特徴とする請求項1または2に記載の音声入出力装置。 - 前記第1音声出力部からの出力と前記第2音声出力部からの出力とが切り替わる場合において、音量に関する設定変更を行わない
ことを特徴とする請求項1から3までの何れか1項に記載の音声入出力装置。 - 当該音声入出力装置の周囲を撮影する撮影部を更に備え、
前記ユーザ音声取得部は、
前記撮影部が撮影した動画像内において、前記ユーザによって行われた所定のジェスチャが検出されたことに応答して、前記ユーザからの音声を示す音声信号を取得する処理を開始する
ことを特徴とする請求項1から4までの何れか1項に記載の音声入出力装置。 - 前記ユーザ音声取得部は、
当該音声入出力装置の操作を行うためのリモートコントローラにおいて、所定の操作が行われたことに応答して、前記ユーザからの音声を示す音声信号を取得する処理を開始する
ことを特徴とする請求項1から5までの何れか1項に記載の音声入出力装置。 - 外部装置に接続された音声入出力装置による、音声入出力方法であって、
入力信号に含まれる入力信号音声に対して音声調整処理を行う第1音声処理ステップと、
前記第1音声処理ステップにおける音声調整処理が施された入力信号音声を前記音声入出力装置が備える第1音声出力部から出力する第1音声出力ステップと、
ユーザからの音声を示す音声信号を取得するユーザ音声取得ステップと、
前記ユーザ音声取得ステップにおいて取得した音声信号が示す音声から、前記第1音声処理ステップにおける音声調整処理が施された音声成分を取り除く処理を行う音声除去ステップと、を含む音声入出力方法であって、
前記第1音声出力ステップは、前記入力信号音声を、
前記ユーザ音声取得ステップにおいて前記ユーザからの音声入力を取得しない場合に、前記外部装置が備えている第2音声出力部から出力し、
前記ユーザ音声取得ステップにおいて前記ユーザからの音声入力を取得した場合に、前記音声調整処理が施された上で前記第1音声出力部から出力するステップである、ことを特徴とする音声入出力方法。 - 請求項7に記載の音声入出力方法をコンピュータに実施させるための音声入出力プログラムであって、前記第1音声処理ステップ、前記第1音声出力ステップ、前記ユーザ音声取得ステップ、および前記音声除去ステップをコンピュータに実行させる音声入出力プログラム。
- 外部装置に接続された音声入出力装置による、音声入出力方法であって、
入力信号に含まれる入力信号音声に対して音声調整処理を行う第1音声処理ステップと、
前記第1音声処理ステップにおける音声調整処理が施された入力信号音声を前記音声入出力装置が備える第1音声出力部から出力する第1音声出力ステップと、
ユーザからの音声を示す音声信号を取得するユーザ音声取得ステップと、
前記ユーザ音声取得ステップにおいて取得した音声信号が示す音声から、前記第1音声処理ステップにおける音声調整処理が施された音声成分を取り除く処理を行う音声除去ステップと、
前記音声除去ステップでの処理を施した後の音声に基づいて、音声認識処理を行う音声認識ステップと、を含む音声入出力方法であって、
前記第1音声出力ステップは、前記入力信号音声を、
前記音声認識ステップにおいて音声認識処理を開始するトリガーとなるトリガーワードを取得しない場合に、前記外部装置が備えている第2音声出力部から出力し、
前記音声認識ステップにおいて前記トリガーワードを取得した場合に、前記第1音声処理ステップにおける音声調整処理が施された上で前記第1音声出力部から出力するステップである、ことを特徴とする音声入出力方法。 - 請求項9に記載の音声入出力方法をコンピュータに実施させるための音声入出力プログラムであって、前記第1音声処理ステップ、前記第1音声出力ステップ、前記ユーザ音声取得ステップ、前記音声除去ステップ、および前記音声認識ステップをコンピュータに実行させる音声入出力プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020037079A JP7410754B2 (ja) | 2020-03-04 | 2020-03-04 | 音声入出力装置、音声入出力方法、および音声入出力プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020037079A JP7410754B2 (ja) | 2020-03-04 | 2020-03-04 | 音声入出力装置、音声入出力方法、および音声入出力プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021140010A JP2021140010A (ja) | 2021-09-16 |
JP7410754B2 true JP7410754B2 (ja) | 2024-01-10 |
Family
ID=77668486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020037079A Active JP7410754B2 (ja) | 2020-03-04 | 2020-03-04 | 音声入出力装置、音声入出力方法、および音声入出力プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7410754B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001275176A (ja) | 2000-03-24 | 2001-10-05 | Matsushita Electric Ind Co Ltd | リモートコントロール装置 |
WO2007037208A1 (ja) | 2005-09-29 | 2007-04-05 | Matsushita Electric Industrial Co., Ltd. | 映像音出力装置、及び外部スピーカ制御装置 |
JP2012181374A (ja) | 2011-03-01 | 2012-09-20 | Toshiba Corp | テレビジョン装置及び遠隔操作装置 |
JP2019220145A (ja) | 2018-06-13 | 2019-12-26 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 操作端末、音声入力方法、及びプログラム |
-
2020
- 2020-03-04 JP JP2020037079A patent/JP7410754B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001275176A (ja) | 2000-03-24 | 2001-10-05 | Matsushita Electric Ind Co Ltd | リモートコントロール装置 |
WO2007037208A1 (ja) | 2005-09-29 | 2007-04-05 | Matsushita Electric Industrial Co., Ltd. | 映像音出力装置、及び外部スピーカ制御装置 |
JP2012181374A (ja) | 2011-03-01 | 2012-09-20 | Toshiba Corp | テレビジョン装置及び遠隔操作装置 |
JP2019220145A (ja) | 2018-06-13 | 2019-12-26 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 操作端末、音声入力方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021140010A (ja) | 2021-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12033635B2 (en) | Image display apparatus and method of controlling the same | |
US11120813B2 (en) | Image processing device, operation method of image processing device, and computer-readable recording medium | |
US10083710B2 (en) | Voice control system, voice control method, and computer readable medium | |
JP2023540908A (ja) | オーディオ処理方法および電子デバイス | |
JP6531776B2 (ja) | 音声対話システムおよび音声対話方法 | |
US9491401B2 (en) | Video call method and electronic device supporting the method | |
US11398220B2 (en) | Speech processing device, teleconferencing device, speech processing system, and speech processing method | |
CN105072335B (zh) | 一种拍照方法及用户终端 | |
JP2019215449A (ja) | 会話補助装置、会話補助方法及びプログラム | |
JP7410754B2 (ja) | 音声入出力装置、音声入出力方法、および音声入出力プログラム | |
TWM550619U (zh) | 可依據臉部影像辨識結果取得聽力數據之電子裝置 | |
WO2023231787A9 (zh) | 音频处理方法和装置 | |
JP2002034092A (ja) | 収音装置 | |
CN116055869B (zh) | 一种视频处理方法和终端 | |
WO2023016032A1 (zh) | 一种视频处理方法及电子设备 | |
JP7141226B2 (ja) | 音声入力装置、及び遠隔対話システム | |
CN111182256A (zh) | 一种信息处理方法及服务器 | |
CN108769525A (zh) | 一种图像调整方法、装置、设备及存储介质 | |
JP2020178150A (ja) | 音声処理装置及び音声処理方法 | |
CN110225364B (zh) | 一种视频处理方法、装置、终端、服务器及存储介质 | |
WO2021029294A1 (ja) | データ作成方法及びデータ作成プログラム | |
WO2020177483A1 (zh) | 音视频处理方法、装置、电子设备及存储介质 | |
JP2018140477A (ja) | 発話制御装置、電子機器、発話制御装置の制御方法、および制御プログラム | |
JP6427884B2 (ja) | 情報処理装置、プログラム、および情報処理システム | |
CN116055858A (zh) | 一种控制方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220921 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231222 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7410754 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |