JP6586617B2 - 音声認識装置、方法、及びコンピュータプログラム - Google Patents
音声認識装置、方法、及びコンピュータプログラム Download PDFInfo
- Publication number
- JP6586617B2 JP6586617B2 JP2013198100A JP2013198100A JP6586617B2 JP 6586617 B2 JP6586617 B2 JP 6586617B2 JP 2013198100 A JP2013198100 A JP 2013198100A JP 2013198100 A JP2013198100 A JP 2013198100A JP 6586617 B2 JP6586617 B2 JP 6586617B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- person
- predetermined direction
- uttered
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
しかしながら、音声認識においては、マイクが周囲の複数の音源の音を同時に拾ってしまうことにより、ターゲットとなる人物の声に雑音が入ってしまい、認識率が落ちるという問題があった。
図1に示されるように、本実施形態に係る音声認識装置1は、自装置の周囲で発せられた音声のうち、人の発した音声を認識して、当該音声のみを選択的に抽出する装置である。
図1の例では、自装置の周囲360度を8つの方向に分割し、分割した方向ごとに、一組のマイク11とセンサ12が割り当てられている。
これにより例えば、音声情報に基づいて家電等を遠隔操作する場合には、音声認識装置1の周りにあるテレビやラジオの音声といった人以外が発する音声をノイズとして除去して、人が発する音声をクリアに取得し、より的確な遠隔操作を実現することができる。
音声認識装置1は、マイク11及びセンサ12を備えると共に、CPU(Central Processing Unit)などの演算装置、RAM(Random Access Memory)、ROM(Read Only Memory)などの記憶装置により、判別処理部13及び通信処理部14からなる機能ブロックを構成する。
センサ12は、予め割り当てられた方向において、人の存在を検知するデバイスであって、本例では、赤外線によって人の存在を検知するモーションセンサによって実現されているが、そのほか、超音波や可視光などを用いた人感センサによって構成することもできる。
音声認識装置1とリモートコントロール装置2との接続は、有線あるいは無線等を問わず、データの送受信を可能とすることができれば、各種の方法によることができる。
音声認識装置1はこの通信処理部14により、リモートコントロール装置2に対して、音声によって構成された操作指示情報を送信することができる。
このリモートコントロール装置2は、CPU(Central Processing Unit)などの演算装置、RAM(Random Access Memory)、ROM(Read Only Memory)などの記憶装置により、信号情報記憶部21、変換処理部22、通信処理部23、及び発信処理部24からなる機能ブロックを構成する。
なお、指示信号は例えば、赤外線の発光パターンや、Bluetooth(登録商標)などの狭域通信信号等によって構成されており、信号情報記憶部21を参照することによって、操作指示情報に対応した指示信号が把握される。
この処理は、信号情報記憶部21において、所定の操作指示情報と関連付けられている指示信号を抽出することによって実現される。
リモートコントロール装置2はこの通信処理部23により、音声認識装置1から音声によって構成された操作指示情報を受信することができる。
なお、指示信号は例えば、赤外線の発光パターンのほか、Bluetooth(登録商標)などの狭域通信信号等によって構成され、発信処理部24は、赤外線を発光あるいは狭域通信信号を発信するなど、操作対象機器3との間で指示信号を送信するのに必要なデバイスとして実現される。
まず、図3に示されるように、音声認識装置1は常時、マイク11によって周囲から音声入力を受け付ける(S101)。
マイク11によって周囲から音声入力を受け付ける処理が行われる一方で、音声認識装置1は、人の存在を検知するセンサ12により、当該マイク11が割り当てられている方向と同じ方向について、人が当該方向に存在するか否かを検知可能な状態で待機する(S102)。
これにより、指示信号を受信した操作対象機器3が指示された操作を実行する(S107)。
図4に示されるように、本実施形態に係る音声認識装置4は、上述したリモートコントロール装置2の構成を含んでおり、音声認識装置4単独で操作対象機器3に対する操作を実行することができる。
この音声認識装置4は、マイク41及びセンサ42を備えると共に、CPU(Central Processing Unit)などの演算装置、RAM(Random Access Memory)、ROM(Read Only Memory)などの記憶装置により、判別処理部43、信号情報記憶部44、変換処理部45、及び発信処理部46からなる機能ブロックを構成する。
音声認識装置4は常時、マイク41によって周囲から音声入力を受け付ける(S201)。
マイク41によって周囲から音声入力を受け付ける処理が行われる一方で、音声認識装置4は、人の存在を検知するセンサ42により、当該マイク41が割り当てられている方向と同じ方向について、人が当該方向に存在するか否かを検知可能な状態で待機する(S202)。
その結果、有効な操作指示情報であった場合には、当該操作指示情報と関連付けられた指示信号を抽出することにより、操作指示情報が指示信号に変換される(S204)。
これにより、指示信号を受信した操作対象機器3では、指示された操作が実行される。
図6に示されるように、本実施形態に係る音声認識装置5は、所定の方向ごとに、上述した第一の実施形態に係る音声認識装置1が備えたセンサ12に代えてカメラ52を備えている。このカメラ52は、顔が自装置に向いている人の存在を検知した際に、当該顔が自装置に向いている人の存在を検知した方向において発せられている音声を入力するマイク51によって入力された音声のみを、有効な音声として判別する。
また、音声認識装置5は、第一の実施形態と同様、操作対象機器3を操作するリモートコントロール装置2と接続している。
まず、図7に示されるように、音声認識装置1は常時、マイク51によって周囲から音声入力を受け付ける(S301)。
マイク51によって周囲から音声入力を受け付ける処理が行われる一方で、音声認識装置5は、人の存在を検知するカメラ52により、当該マイク51が割り当てられている方向と同じ方向について映像データを取得し、当該映像データの中から、人の顔が検出されるか否かを判別する(S302)。
なお、リモートコントロール装置2に対して音声のデータが送信された後の処理については、第一の実施形態において述べたのと同様である。
11 マイク
12 センサ
13 判別処理部
14 通信処理部
2 リモートコントロール装置
21 信号情報記憶部
22 変換処理部
23 通信処理部
24 発信処理部
3 操作対象機器
4 音声認識装置
41 マイク
42 センサ
43 判別処理部
44 信号情報記憶部
45 変換処理部
46 発信処理部
5 音声認識装置
51 マイク
52 カメラ
53 判別処理部
54 通信処理部
Claims (6)
- 自装置の周囲で発せられた音声のうち、人の発した音声を認識して、当該音声のみを選択的に抽出する装置であって、
所定の方向において発せられている音声を入力する音声入力手段と、
モーションセンサ又は人感センサからなり、上記所定の方向に存する人の存在を検知する検知手段とを、自装置を中心とする周囲の所定の方向ごとに複数備えると共に、
人から発せられた音声による操作指示情報を、所定の操作対象機器を操作するための指示信号に変換すると共に、当該変換した指示信号を当該操作対象機器に送信するリモートコントロール装置と、接続され、
上記検知手段によって、所定の方向において人の存在を検知した際に、当該人の存在を検知した方向において発せられている音声を入力する音声入力手段によって入力された音声のみを、有効な音声として判別する判別処理手段と、
上記有効な音声として判別され、上記操作指示情報を構成する音声に係るデータを、上記リモートコントロール装置に送信する音声データ送信手段、を有する、
ことを特徴とする音声認識装置。 - 自装置の周囲で発せられた音声のうち、人の発した音声を認識して、当該音声のみを選択的に抽出する装置であって、
所定の方向において発せられている音声を入力する音声入力手段と、
モーションセンサ又は人感センサからなり、上記所定の方向に存する人の存在を検知する検知手段とを、自装置を中心とする周囲の所定の方向ごとに複数備え、
人から発せられた音声による操作指示情報と、当該操作指示情報に基づいて所定の操作対象機器を操作するための指示信号とを関連付けて記憶する信号情報記憶手段と、
上記検知手段によって、所定の方向において人の存在を検知した際に、当該人の存在を検知した方向において発せられている音声を入力する音声入力手段によって入力された音声のみを、有効な音声として判別する判別処理手段と、
上記信号情報記憶手段を参照して、上記有効な音声として判別され、上記操作指示情報を構成する音声に係るデータを、上記操作対象機器を操作するための指示信号に変換する変換処理手段と、
上記変換した指示信号を上記操作対象機器に発信する発信処理手段と、を有する、
ことを特徴とする音声認識装置。 - 所定の方向において発せられている音声を入力する音声入力手段と、
モーションセンサ又は人感センサからなり、上記所定の方向に存する人の存在を検知する検知手段とを、自装置を中心とする周囲の所定の方向ごとに複数備えると共に、
人から発せられた音声による操作指示情報を、所定の操作対象機器を操作するための指示信号に変換すると共に、当該変換した指示信号を当該操作対象機器に送信するリモートコントロール装置と、接続された音声認識装置により、
自装置の周囲で発せられた音声のうち、人の発した音声を認識して、当該音声のみを選択的に抽出する方法であって、
上記検知手段によって、所定の方向において人の存在を検知した際に、当該人の存在を検知した方向において発せられている音声を入力する音声入力手段によって入力された音声のみを、有効な音声として判別する処理と、
上記有効な音声として判別され、上記操作指示情報を構成する音声に係るデータを、上記リモートコントロール装置に送信する処理と、を実行する、
ことを特徴とする音声認識方法。 - 所定の方向において発せられている音声を入力する音声入力手段と、
モーションセンサ又は人感センサからなり、上記所定の方向に存する人の存在を検知する検知手段とを、自装置を中心とする周囲の所定の方向ごとに複数備えると共に、
人から発せられた音声による操作指示情報を、所定の操作対象機器を操作するための指示信号に変換すると共に、当該変換した指示信号を当該操作対象機器に送信するリモートコントロール装置と、接続された装置を、
自装置の周囲で発せられた音声のうち、人の発した音声を認識して、当該音声のみを選択的に抽出する音声認識装置として機能させるためのプログラムであって、
上記装置に対し、
上記検知手段によって、所定の方向において人の存在を検知した際に、当該人の存在を検知した方向において発せられている音声を入力する音声入力手段によって入力された音声のみを、有効な音声として判別する処理と、
上記有効な音声として判別され、上記操作指示情報を構成する音声に係るデータを、上記リモートコントロール装置に送信する処理と、を実行させる、
コンピュータプログラム。 - 所定の方向において発せられている音声を入力する音声入力手段と、
モーションセンサ又は人感センサからなり、上記所定の方向に存する人の存在を検知する検知手段とを、自装置を中心とする周囲の所定の方向ごとに複数備えると共に、
人から発せられた音声による操作指示情報と、当該操作指示情報に基づいて所定の操作対象機器を操作するための指示信号とを関連付けて記憶する信号情報記憶手段、を有する音声認識装置により、
自装置の周囲で発せられた音声のうち、人の発した音声を認識して、当該音声のみを選択的に抽出する方法であって、
上記検知手段によって、所定の方向において人の存在を検知した際に、当該人の存在を検知した方向において発せられている音声を入力する音声入力手段によって入力された音声のみを、有効な音声として判別する処理と、
上記信号情報記憶手段を参照して、上記有効な音声として判別され、上記操作指示情報を構成する音声に係るデータを、上記操作対象機器を操作するための指示信号に変換する処理と、
上記変換した指示信号を上記操作対象機器に発信する処理と、を実行する、
ことを特徴とする音声認識方法。 - 所定の方向において発せられている音声を入力する音声入力手段と、
モーションセンサ又は人感センサからなり、上記所定の方向に存する人の存在を検知する検知手段とを、自装置を中心とする周囲の所定の方向ごとに複数備えると共に、
人から発せられた音声による操作指示情報と、当該操作指示情報に基づいて所定の操作対象機器を操作するための指示信号とを関連付けて記憶する信号情報記憶手段、を有する装置を、
自装置の周囲で発せられた音声のうち、人の発した音声を認識して、当該音声のみを選択的に抽出する音声認識装置として機能させるためのプログラムであって、
上記装置に対し、
上記検知手段によって、所定の方向において人の存在を検知した際に、当該人の存在を検知した方向において発せられている音声を入力する音声入力手段によって入力された音声のみを、有効な音声として判別する処理と、
上記信号情報記憶手段を参照して、上記有効な音声として判別され、上記操作指示情報を構成する音声に係るデータを、上記操作対象機器を操作するための指示信号に変換する処理と、
上記変換した指示信号を上記操作対象機器に発信する処理と、を実行させる、
コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013198100A JP6586617B2 (ja) | 2013-09-25 | 2013-09-25 | 音声認識装置、方法、及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013198100A JP6586617B2 (ja) | 2013-09-25 | 2013-09-25 | 音声認識装置、方法、及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015064473A JP2015064473A (ja) | 2015-04-09 |
JP6586617B2 true JP6586617B2 (ja) | 2019-10-09 |
Family
ID=52832398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013198100A Active JP6586617B2 (ja) | 2013-09-25 | 2013-09-25 | 音声認識装置、方法、及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6586617B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6678315B2 (ja) * | 2015-04-24 | 2020-04-08 | パナソニックIpマネジメント株式会社 | 音声再生方法、音声対話装置及び音声対話プログラム |
KR102537543B1 (ko) | 2016-03-24 | 2023-05-26 | 삼성전자주식회사 | 지능형 전자 장치 및 그 동작 방법 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6024599A (ja) * | 1983-07-20 | 1985-02-07 | 松下電器産業株式会社 | 加熱装置 |
JPH0756596B2 (ja) * | 1990-09-11 | 1995-06-14 | 富士通テン株式会社 | 音声認識装置 |
JP3292488B2 (ja) * | 1991-11-28 | 2002-06-17 | 富士通株式会社 | 個人追従型音響生成装置 |
JP2001195088A (ja) * | 2000-01-12 | 2001-07-19 | Tokai Phs Hanbai Kk | 音声認識遠隔制御装置 |
JP3945356B2 (ja) * | 2002-09-17 | 2007-07-18 | 株式会社デンソー | 音声対話装置及びプログラム |
JP2006245725A (ja) * | 2005-03-01 | 2006-09-14 | Yamaha Corp | マイクロフォンシステム |
JP4565162B2 (ja) * | 2006-03-03 | 2010-10-20 | 独立行政法人産業技術総合研究所 | 発話イベント分離方法、発話イベント分離システム、及び、発話イベント分離プログラム |
JP5014662B2 (ja) * | 2006-04-13 | 2012-08-29 | アルパイン株式会社 | 車載用音声認識装置及び音声認識方法 |
US8054991B2 (en) * | 2008-04-17 | 2011-11-08 | Panasonic Corporation | Sound pickup apparatus and conference telephone |
-
2013
- 2013-09-25 JP JP2013198100A patent/JP6586617B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015064473A (ja) | 2015-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10957323B2 (en) | Image display apparatus and method of controlling the same | |
US20190019513A1 (en) | Information processing device, information processing method, and program | |
JP2017117371A (ja) | 制御方法、制御装置およびプログラム | |
JP6468712B2 (ja) | 通信ユニット | |
KR20150112337A (ko) | 디스플레이 장치 및 그 사용자 인터랙션 방법 | |
CN111432303B (zh) | 单耳耳机、智能电子设备、方法和计算机可读介质 | |
JP2000347692A (ja) | 人物検出方法、人物検出装置及びそれを用いた制御システム | |
JP2007160473A (ja) | ロボットにおける対話相手識別方法およびロボット | |
JP5844418B2 (ja) | エレベータ制御装置およびエレベータ制御方法 | |
JP2009166184A (ja) | ガイドロボット | |
JP6586617B2 (ja) | 音声認識装置、方法、及びコンピュータプログラム | |
JP2010218039A (ja) | 顔認証システム及び顔認証方法 | |
JP2018121134A (ja) | 画像形成装置 | |
JP6719434B2 (ja) | 機器制御装置、機器制御方法及び機器制御システム | |
JP2006263873A (ja) | コミュニケーションロボットシステムおよびコミュニケーションロボット | |
CN107422856A (zh) | 用于机器处理用户命令的方法、装置和存储介质 | |
US10225670B2 (en) | Method for operating a hearing system as well as a hearing system | |
KR20130054131A (ko) | 디스플레이장치 및 그 제어방법 | |
WO2020087336A1 (zh) | 一种移动平台的控制方法及控制设备 | |
KR102613040B1 (ko) | 영상 통화 방법 및 이를 구현하는 로봇 | |
TWI756966B (zh) | 視訊裝置與其操作方法 | |
WO2021112391A1 (ko) | 전자장치 및 그 제어방법 | |
US20230058043A1 (en) | Mobile terminal and operating method thereof | |
KR20220071591A (ko) | 전자장치 및 그 제어방법 | |
KR20220164222A (ko) | 전자장치 및 그 제어방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170502 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170606 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171002 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20171207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190802 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6586617 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |