JP2021140010A - 音声入出力装置、音声入出力方法、および音声入出力プログラム - Google Patents
音声入出力装置、音声入出力方法、および音声入出力プログラム Download PDFInfo
- Publication number
- JP2021140010A JP2021140010A JP2020037079A JP2020037079A JP2021140010A JP 2021140010 A JP2021140010 A JP 2021140010A JP 2020037079 A JP2020037079 A JP 2020037079A JP 2020037079 A JP2020037079 A JP 2020037079A JP 2021140010 A JP2021140010 A JP 2021140010A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- unit
- audio
- output
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 83
- 230000008569 process Effects 0.000 claims description 72
- 230000005236 sound signal Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 5
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Telephone Function (AREA)
Abstract
Description
以下、本発明の一側面に係る実施の形態(以下、「本実施形態」とも表記する)を、図面に基づいて説明する。図1は実施形態1に係る音声入出力装置(例えば、テレビジョン装置)10および音声入出力装置10に接続される外部スピーカシステム20からなる音声入出力システム100の要部構成を示すブロック図である。実施形態1に係る音声入出力システム100は、音声認識によって操作することができるシステムである。
上記実施形態1では、音声認識部16が、ユーザ音声取得部(マイクロフォン)14から入力されるトリガーワードを認識することをトリガーとして音声認識処理を開始する音声入出力装置10の実施形態について説明した。本実施形態では、上記実施形態1の構成に替えて、撮影部(たとえば、カメラ)18がユーザによって行われた所定のジェスチャを検出する、または、リモートコントローラ30に特定の操作がなされたことをトリガーとして、音声認識処理を開始する音声入出力装置10について説明する。
〔態様1〕
上記の課題を解決するために、本発明の一態様に係る音声入出力装置は、入力信号に含まれる入力信号音声に対して音声調整処理を行う第1音声処理部と、前記第1音声処理部による音声調整処理が施された入力信号音声を出力する第1音声出力部と、ユーザからの音声を示す音声信号を取得するユーザ音声取得部と、前記ユーザ音声取得部が取得した音声信号が示す音声から、前記第1音声処理部による音声調整処理が施された音声成分を取り除く処理を行う音声除去部と、を備え、前記入力信号音声は、前記ユーザ音声取得部が前記ユーザからの音声入力を取得しない場合に、前記第1音声出力部とは異なる第2音声出力部から出力され、前記ユーザ音声取得部が前記ユーザからの音声入力を取得した場合に、前記第1音声処理部による音声調整処理が施された上で前記第1音声出力部から出力される。
入力信号に含まれる入力信号音声に対して音声調整処理を行う第1音声処理部と、前記第1音声処理部による音声調整処理が施された入力信号音声を出力する第1音声出力部と、ユーザからの音声を示す音声信号を取得するユーザ音声取得部と、前記ユーザ音声取得部が取得した音声信号が示す音声から、前記第1音声処理部による音声調整処理が施された音声成分を取り除く処理を行う音声除去部と、前記音声除去部での処理を施した後の音声に基づいて、音声認識処理を行う音声認識部と、を備え、前記入力信号音声は、前記音声認識部が音声認識処理を開始するトリガーとなるトリガーワードを取得しない場合に、前記第1音声出力部とは異なる第2音声出力部から出力され、前記音声認識部が前記トリガーワードを取得した場合に、前記第1音声処理部による音声調整処理が施された上で前記第1音声出力部から出力される。
上記一態様に係る音声入出力装置において、前記第2音声処理部は、当該音声入出力装置とは異なる装置が備えていてもよい。
上記一態様に係る音声入出力装置において、当該音声入出力装置とは異なる前記装置は、前記入力信号に含まれる入力信号音声に対して前記第1音声処理部とは異なる音声調整処理を行う第2音声処理部を更に備え、前記第2音声出力部は、前記第2音声処理部による音声調整処理が施された前記入力信号音声を出力してもよい。
上記一態様に係る音声入出力装置において、前記第1音声出力部からの出力と前記第2音声出力部からの出力とが切り替わる場合において、音量に関する設定変更を行わなくてよい。
上記一態様に係る音声入出力装置は、当該音声入出力装置の周囲を撮影する撮影部を更に備え、前記ユーザ音声取得部は、前記撮影部が撮影した動画像内において、前記ユーザによって行われた所定のジェスチャが検出されたことに応答して、前記ユーザからの音声を示す音声信号を取得する処理を開始してもよい。
上記一態様に係る音声入出力装置において、前記ユーザ音声取得部は、当該音声入出力装置の操作を行うためのリモートコントローラにおいて、所定の操作が行われたことに応答して、前記ユーザからの音声を示す音声信号を取得する処理を開始してもよい。
上記の課題を解決するために、本発明の一態様に係る音声入出力方法は、入力信号に含まれる入力信号音声に対して第1の音声調整処理を行う第1音声処理ステップと、前記第1音声処理が施された入力信号音声を出力する第1音声出力ステップと、ユーザからの音声を示す音声信号を取得するユーザ音声取得ステップと、前記ユーザ音声取得ステップにおいて取得した音声信号が示す音声から、前記第1音声処理が施された音声成分を取り除く処理を行う音声除去ステップと、を含む音声入出力方法であって、前記入力信号音声は、前記ユーザ音声取得ステップにおいて前記ユーザからの音声入力を取得しない場合に、前記第1音声出力ステップとは異なる第2音声出力ステップにおいて出力され、前記ユーザ音声取得ステップにおいて前記ユーザからの音声入力を取得した場合に、前記第1音声処理が施された上で前記第1音声出力ステップにおいて出力される。
上記の課題を解決するために、本発明の一態様に係る音声入出力プログラムは、前記音声入出力装置としてコンピュータを機能させるための音声入出力プログラムであって、前記第1音声処理部および前記音声除去部としてコンピュータを機能させるための音声入出力プログラムである。
音声入出力装置10の制御部17(デコード部11、第1音声処理部12、音声除去部15、および音声認識部16)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
本発明は上述した実施形態および変形例に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態のそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
11 デコード部
12 第1音声処理部
13 第1音声出力部
14 ユーザ音声取得部
15 音声除去部
16 音声認識部
17 制御部
18 撮影部
20 外部スピーカシステム
21 第2音声処理部
22 第2音声出力部
30 リモートコントローラ
100 音声入出力システム
Claims (9)
- 入力信号に含まれる入力信号音声に対して音声調整処理を行う第1音声処理部と、
前記第1音声処理部による音声調整処理が施された入力信号音声を出力する第1音声出力部と、
ユーザからの音声を示す音声信号を取得するユーザ音声取得部と、
前記ユーザ音声取得部が取得した音声信号が示す音声から、前記第1音声処理部による音声調整処理が施された音声成分を取り除く処理を行う音声除去部と、を備え、
前記入力信号音声は、
前記ユーザ音声取得部が前記ユーザからの音声入力を取得しない場合に、前記第1音声出力部とは異なる第2音声出力部から出力され、
前記ユーザ音声取得部が前記ユーザからの音声入力を取得した場合に、前記第1音声処理部による音声調整処理が施された上で前記第1音声出力部から出力される
ことを特徴とする音声入出力装置。 - 入力信号に含まれる入力信号音声に対して音声調整処理を行う第1音声処理部と、
前記第1音声処理部による音声調整処理が施された入力信号音声を出力する第1音声出力部と、
ユーザからの音声を示す音声信号を取得するユーザ音声取得部と、
前記ユーザ音声取得部が取得した音声信号が示す音声から、前記第1音声処理部による音声調整処理が施された音声成分を取り除く処理を行う音声除去部と、
前記音声除去部での処理を施した後の音声に基づいて、音声認識処理を行う音声認識部と、を備え、
前記入力信号音声は、
前記音声認識部が音声認識処理を開始するトリガーとなるトリガーワードを取得しない場合に、前記第1音声出力部とは異なる第2音声出力部から出力され、
前記音声認識部が前記トリガーワードを取得した場合に、前記第1音声処理部による音声調整処理が施された上で前記第1音声出力部から出力されることを特徴とする音声入出力装置。 - 前記第2音声出力部は、
当該音声入出力装置とは異なる装置が備えている
ことを特徴とする請求項1または2に記載の音声入出力装置。 - 当該音声入出力装置とは異なる前記装置は、
前記入力信号に含まれる入力信号音声に対して前記第1音声処理部とは異なる音声調整処理を行う第2音声処理部を更に備え、
前記第2音声出力部は、
前記第2音声処理部による音声調整処理が施された前記入力信号音声を出力する
ことを特徴とする請求項3に記載の音声入出力装置。 - 前記第1音声出力部からの出力と前記第2音声出力部からの出力とが切り替わる場合において、音量に関する設定変更を行わない
ことを特徴とする請求項1から4までの何れか1項に記載の音声入出力装置。 - 当該音声入出力装置の周囲を撮影する撮影部を更に備え、
前記ユーザ音声取得部は、
前記撮影部が撮影した動画像内において、前記ユーザによって行われた所定のジェスチャが検出されたことに応答して、前記ユーザからの音声を示す音声信号を取得する処理を開始する
ことを特徴とする請求項1から5までの何れか1項に記載の音声入出力装置。 - 前記ユーザ音声取得部は、
当該音声入出力装置の操作を行うためのリモートコントローラにおいて、所定の操作が行われたことに応答して、前記ユーザからの音声を示す音声信号を取得する処理を開始する
ことを特徴とする請求項1から6までの何れか1項に記載の音声入出力装置。 - 入力信号に含まれる入力信号音声に対して音声調整処理を行う第1音声処理ステップと、
前記第1音声処理ステップにおける音声調整処理が施された入力信号音声を出力する第1音声出力ステップと、
ユーザからの音声を示す音声信号を取得するユーザ音声取得ステップと、
前記ユーザ音声取得ステップにおいて取得した音声信号が示す音声から、前記第1音声処理ステップにおける音声調整処理が施された音声成分を取り除く処理を行う音声除去ステップと、を含む音声入出力方法であって、
前記入力信号音声は、
前記ユーザ音声取得ステップにおいて前記ユーザからの音声入力を取得しない場合に、前記第1音声出力ステップとは異なる第2音声出力ステップにおいて出力され、
前記ユーザ音声取得ステップにおいて前記ユーザからの音声入力を取得した場合に、前記音声調整処理が施された上で前記第1音声出力ステップにおいて出力されることを特徴とする音声入出力方法。 - 請求項1から7の何れか1項に記載の音声入出力装置としてコンピュータを機能させるための音声入出力プログラムであって、前記第1音声処理部および前記音声除去部としてコンピュータを機能させるための音声入出力プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020037079A JP7410754B2 (ja) | 2020-03-04 | 2020-03-04 | 音声入出力装置、音声入出力方法、および音声入出力プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020037079A JP7410754B2 (ja) | 2020-03-04 | 2020-03-04 | 音声入出力装置、音声入出力方法、および音声入出力プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021140010A true JP2021140010A (ja) | 2021-09-16 |
JP7410754B2 JP7410754B2 (ja) | 2024-01-10 |
Family
ID=77668486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020037079A Active JP7410754B2 (ja) | 2020-03-04 | 2020-03-04 | 音声入出力装置、音声入出力方法、および音声入出力プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7410754B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001275176A (ja) * | 2000-03-24 | 2001-10-05 | Matsushita Electric Ind Co Ltd | リモートコントロール装置 |
WO2007037208A1 (ja) * | 2005-09-29 | 2007-04-05 | Matsushita Electric Industrial Co., Ltd. | 映像音出力装置、及び外部スピーカ制御装置 |
JP2012181374A (ja) * | 2011-03-01 | 2012-09-20 | Toshiba Corp | テレビジョン装置及び遠隔操作装置 |
JP2019220145A (ja) * | 2018-06-13 | 2019-12-26 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 操作端末、音声入力方法、及びプログラム |
-
2020
- 2020-03-04 JP JP2020037079A patent/JP7410754B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001275176A (ja) * | 2000-03-24 | 2001-10-05 | Matsushita Electric Ind Co Ltd | リモートコントロール装置 |
WO2007037208A1 (ja) * | 2005-09-29 | 2007-04-05 | Matsushita Electric Industrial Co., Ltd. | 映像音出力装置、及び外部スピーカ制御装置 |
JP2012181374A (ja) * | 2011-03-01 | 2012-09-20 | Toshiba Corp | テレビジョン装置及び遠隔操作装置 |
JP2019220145A (ja) * | 2018-06-13 | 2019-12-26 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 操作端末、音声入力方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7410754B2 (ja) | 2024-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11763812B2 (en) | Image display apparatus and method of controlling the same | |
US11120813B2 (en) | Image processing device, operation method of image processing device, and computer-readable recording medium | |
US9280539B2 (en) | System and method for translating speech, and non-transitory computer readable medium thereof | |
CN108735207B (zh) | 声音对话系统、声音对话方法及计算机可读存储介质 | |
US10142578B2 (en) | Method and system for communication | |
JP2023540908A (ja) | オーディオ処理方法および電子デバイス | |
TWI678696B (zh) | 語音資訊的接收方法、系統及裝置 | |
EP2797077A1 (en) | Voice processing apparatus and voice processing method | |
JP2014240856A (ja) | 音声入力システム及びコンピュータプログラム | |
US11842745B2 (en) | Method, system, and computer-readable medium for purifying voice using depth information | |
JP2019215449A (ja) | 会話補助装置、会話補助方法及びプログラム | |
WO2023231787A9 (zh) | 音频处理方法和装置 | |
JP7410754B2 (ja) | 音声入出力装置、音声入出力方法、および音声入出力プログラム | |
JP2002034092A (ja) | 収音装置 | |
TWM550619U (zh) | 可依據臉部影像辨識結果取得聽力數據之電子裝置 | |
JP7095356B2 (ja) | 通信端末及び会議システム | |
CN116055869A (zh) | 一种视频处理方法和终端 | |
CN109920437B (zh) | 干扰去除的方法及装置 | |
JP7141226B2 (ja) | 音声入力装置、及び遠隔対話システム | |
CN111182256A (zh) | 一种信息处理方法及服务器 | |
CN110225364B (zh) | 一种视频处理方法、装置、终端、服务器及存储介质 | |
JP2020178150A (ja) | 音声処理装置及び音声処理方法 | |
JP7365793B2 (ja) | 撮像装置およびその制御方法、プログラム | |
CN115474080B (zh) | 一种有线投屏控制方法及装置 | |
WO2021029294A1 (ja) | データ作成方法及びデータ作成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220921 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230926 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231222 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7410754 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |