JPH11272293A - 遠隔制御装置 - Google Patents

遠隔制御装置

Info

Publication number
JPH11272293A
JPH11272293A JP10076178A JP7617898A JPH11272293A JP H11272293 A JPH11272293 A JP H11272293A JP 10076178 A JP10076178 A JP 10076178A JP 7617898 A JP7617898 A JP 7617898A JP H11272293 A JPH11272293 A JP H11272293A
Authority
JP
Japan
Prior art keywords
recognition
voice
remote control
control device
outputs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10076178A
Other languages
English (en)
Inventor
Tadao Ohashi
直生 大橋
Nobutoshi Oki
信利 沖
Seiichiro Takahashi
誠一郎 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP10076178A priority Critical patent/JPH11272293A/ja
Publication of JPH11272293A publication Critical patent/JPH11272293A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【構成】 遠隔制御装置10は、入力音声を認識する音
声認識処理装置12、身振り等の入力動作を認識する動
作認識処理装置14およびこれら認識処理装置12およ
び14からの出力を演算する演算処理装置16を含み、
この演算制御装置16から制御信号を被制御機器へ出力
する。 【効果】 音声認識処理装置12と身振り等の動作認識
処理装置14とを組み合わすことにより、認識率が格段
に向上し、被制御機器を正確に制御する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、遠隔制御装置に関
し、特にたとえばビデオテープレコーダ(VTR)等を
遠隔制御する、遠隔制御装置に関する。
【0002】
【従来の技術】従来、この種の遠隔制御装置としては、
音声認識技術を利用してカーステレオ等を遠隔制御する
ものが実用化されている。
【0003】
【発明が解決しようとする課題】従来の音声認識技術に
よる遠隔制御では、騒音下や被制御機器等から発せられ
る音声による誤認識のために、正確な遠隔制御ができな
いという問題があった。それゆえに、この発明の主たる
目的は、音声認識技術を用いてより確実に被制御機器を
遠隔制御ができる、遠隔制御装置を提供することであ
る。
【0004】
【課題を解決するための手段】この発明は、入力音声を
認識する音声認識手段、入力動作を認識する動作認識手
段、および音声認識手段および動作認識手段の出力に基
づいて制御信号を出力する制御手段を備える、遠隔制御
装置である。
【0005】
【作用】たとえば、音声認識手段によって認識した音声
による制御内容と、動作認識手段によって認識した動作
による制御内容が一致したとき、制御手段が制御信号を
出力して被制御機器を遠隔制御する。
【0006】
【発明の効果】この発明によれば、音声認識手段と動作
認識手段を組み合わせたことにより、音声認識のみによ
るものに比較して認識率を向上させることができる。そ
のため、被制御機器を正確に制御することができる。こ
の発明の上述の目的,その他の目的,特徴および利点
は、図面を参照して行う以下の実施例の詳細な説明から
一層明らかとなろう。
【0007】
【実施例】図1に示すこの実施例の遠隔制御装置10
は、入力音声を認識する音声認識処理装置12,身振り
等の入力動作(ジェスチャ)を認識する動作認識処理装
置14およびこれら認識処理装置12および14の出力
に基づいて被制御機器(図示せず)を遠隔制御する演算
結果(制御信号)を出力する演算制御装置16を含む。
音声認識処理装置12は、音声を入力するマイク18,
アンプ20,A/D変換22,予め複数の認識対象語を
登録した音声データベース24およびその音声データベ
ース24を参照してマイク18からの入力音声を認識す
る音声認識処理26を含む。
【0008】また、動作認識処理装置14は、身振り等
の動作を入力するレンズ28を有するCCDカメラ3
0,予め複数の認識対象動作を登録した動作データベー
ス32およびその動作データベース32を参照してCC
Dカメラ30で撮影した動作(ジェスチャ)を認識する
動作認識処理34とで構成している。さらに、演算制御
装置16は、音声認識処理装置12および動作認識処理
装置14の双方からの出力を演算して、その演算結果を
制御信号として出力する演算部36を含む。
【0009】図1に示す演算結果は、別のCPUやマイ
コンに入力されることもあるが、被制御機器、たとえば
VTRにこのような遠隔制御装置10が一体に組み込ま
れている場合、図1の各認識処理26および34ならび
に演算部36がその被制御機器のCPUやマイコンで構
成される。この場合、演算結果出力が、制御信号、たと
えば、テープの巻き戻し、早送り、プレイなどになる。
【0010】図2を参照して、図1実施例の遠隔制御装
置10において、まず、ステップS1で音声入力の有無
を判断し、同時にステップS2で動作入力の有無を判断
する。その結果、“NO”であればステップS1および
ステップS2にそれぞれ戻り、“YES”の場合、ステ
ップS3とステップS4とにおいて、それぞれ、入力音
声と音声データベースに予め登録した音声とを比較し、
入力動作と動作データベースに予め登録した動作とを比
較する。つぎに、ステップS5およびステップS6でそ
れぞれの比較結果(A、B)を出力し、ステップS7で
これらの出力(A、B)を演算し、ステップS9で演算
結果を出力する。そして一連の動作を終了する。
【0011】ここで、入力動作および入力音声が各認識
処理34および26でどのように認識されかつ演算部3
6がどのような演算結果を出力するかを説明する。たと
えば、指をぐるぐる回す入力動作は、その方向のいかん
に拘わらず、動作認識処理34では、予め登録された動
作データベースを参照して「巻戻しまたは早送り」と認
識する。他方、巻戻しまたは早送りの入力音声は音声認
識処理26では、予め登録された音声データベースを参
照してそれぞれ「巻戻し」または「早送り」と認識され
る。この動作認識結果および音声認識結果を演算部36
が演算し、制御信号として「巻戻し」または「早送り」
を出力する。
【0012】また、指を立てただけの入力動作は、動作
認識処理34では「プレイ」または「録画」と認識さ
れ、入力音声が「プレイ」であれば、音声認識処理26
は「プレイ」と認識し、演算部36で演算されて演算結
果として「プレイ」を出力する。もし、入力音声が「録
画」であれば、音声認識処理26は「録画」と認識し、
演算部36で演算されて演算結果として「録画」を出力
する。
【0013】このように、動作認識処理34で認識され
る認識対象動作の数は、音声認識処理26で認識される
認識対象語の数よりも少ないので、1つの認識対象動作
に対して複数の認識対象語を共通にする。また、音声認
識処理26および動作認識処理34からの認識出力をア
ナログ値として、たとえば、百分率(%)を出力する。
【0014】この場合、たとえば、音声認識処理26は
40%の確率で「早送り」を出力、動作認識処理34は
60%の確率で「指を回す」を出力したとする。演算部
36では、双方の確率が50%以上の場合に正常な演算
結果を出力するものとすれば、この場合演算部36は演
算結果を出力しない。また、演算部36が双方の確率を
合計し、その合計値が100%を超えた場合に正常な演
算結果を出力するものとすると、どちらか一方の認識率
さえ高ければこの場合認識できる。たとえば、2つの同
音異義語の場合、最高に明瞭に認識できても音声認識出
力の確率は50%となり、この場合、動作認識がどちら
か50%を超えていたら100%となる。
【0015】しかし、希には3つの同音異義語を認識す
る場合は音声認識処理26では一つの音声に対して3
3.3%の確率が最高となる。他方、動作認識処理34
の認識結果が66.7%を超えていれば何れか一つを認
識できることになる。なお、この実施例に示す遠隔制御
装置10は、被制御機器と分離して別体のリモコン装置
としてもよいが、被制御機器に一体に組み込んでもよ
い。
【0016】また、被制御機器としては、VTR以外に
DVD(デジタルビデオディスク),テレビ,ゲーム機
器等に適用できるが、特に限定されるものではない。
【図面の簡単な説明】
【図1】この発明の一実施例を示す電気ブロック図であ
る。
【図2】図1実施例における動作を示すフローチャート
である。
【符号の説明】
10 …遠隔制御装置 12 …音声認識処理装置 14 …動作認識処理装置 16 …演算制御装置

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】入力音声を認識する音声認識手段、 入力動作を認識する動作認識手段、および前記音声認識
    手段および前記動作認識手段の出力に基づいて制御信号
    を出力する制御手段を備える、遠隔制御装置。
  2. 【請求項2】前記制御手段は前記音声認識手段の出力お
    よび前記動作認識手段の出力を演算する演算手段を含
    む、請求項1記載の遠隔制御装置。
  3. 【請求項3】前記音声認識手段は予め登録された複数の
    認識対象語との比較で入力音声が認識される確率を出力
    し、 前記動作認識手段は予め登録された複数の認識対象動作
    との比較で入力動作が認識される確率を出力し、 前記演算手段は前記2つの確率を演算して演算結果を出
    力する、請求項2記載の遠隔制御装置。
  4. 【請求項4】前記演算手段は前記2つの確率を合計し、
    その合計確率が所定値を超えたとき前記制御手段は前記
    制御信号を出力する、請求項3記載の遠隔制御装置。
  5. 【請求項5】前記演算手段は前記2つの確率を重み付け
    して合計確率を演算する、請求項4記載の遠隔制御装
    置。
  6. 【請求項6】前記音声認識手段に予め登録された認識対
    象語の数が、前記動作認識手段に予め登録された認識対
    象動作の数より多くかつ1つの認識動作対象は複数の認
    識対象語に共通する、請求項3ないし5のいずれかに記
    載の遠隔制御装置。
JP10076178A 1998-03-24 1998-03-24 遠隔制御装置 Pending JPH11272293A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10076178A JPH11272293A (ja) 1998-03-24 1998-03-24 遠隔制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10076178A JPH11272293A (ja) 1998-03-24 1998-03-24 遠隔制御装置

Publications (1)

Publication Number Publication Date
JPH11272293A true JPH11272293A (ja) 1999-10-08

Family

ID=13597865

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10076178A Pending JPH11272293A (ja) 1998-03-24 1998-03-24 遠隔制御装置

Country Status (1)

Country Link
JP (1) JPH11272293A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148183A (ja) * 1998-11-06 2000-05-26 Sanyo Electric Co Ltd 音声認識装置
EP1104922A2 (de) * 1999-11-26 2001-06-06 Robert Bosch Gmbh Vorrichtung und Verfahren zur Fernbedienung eines Autoradios
KR100527512B1 (ko) * 2002-12-13 2005-11-09 현대자동차주식회사 차량 전자장비의 제어 방법 및 시스템
JP2011128766A (ja) * 2009-12-16 2011-06-30 Canon Inc 入力装置及び方法
JP2013539565A (ja) * 2010-06-22 2013-10-24 マイクロソフト コーポレーション ユーザー追跡フィードバック

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6120887B2 (ja) * 1979-12-04 1986-05-24 Dainippon Printing Co Ltd
JPH01259414A (ja) * 1988-04-06 1989-10-17 Res Triangle Inst 視聴覚発話認識装置
JPH0782353B2 (ja) * 1991-03-28 1995-09-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声及び手書き動作の統合型情報を用いたメッセージ認識システム及び方法
JPH08234789A (ja) * 1995-02-27 1996-09-13 Sharp Corp 統合認識対話装置
JPH0934863A (ja) * 1995-07-14 1997-02-07 Hitachi Ltd ニューラルネットワークによる情報統合処理方法
JPH09325793A (ja) * 1996-06-05 1997-12-16 Oki Electric Ind Co Ltd 音声認識方法及び装置
JPH1031551A (ja) * 1996-07-15 1998-02-03 Mitsubishi Electric Corp ヒューマンインターフェースシステムおよびこれを使用した高速移動物体位置検出装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6120887B2 (ja) * 1979-12-04 1986-05-24 Dainippon Printing Co Ltd
JPH01259414A (ja) * 1988-04-06 1989-10-17 Res Triangle Inst 視聴覚発話認識装置
JPH0782353B2 (ja) * 1991-03-28 1995-09-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声及び手書き動作の統合型情報を用いたメッセージ認識システム及び方法
JPH08234789A (ja) * 1995-02-27 1996-09-13 Sharp Corp 統合認識対話装置
JPH0934863A (ja) * 1995-07-14 1997-02-07 Hitachi Ltd ニューラルネットワークによる情報統合処理方法
JPH09325793A (ja) * 1996-06-05 1997-12-16 Oki Electric Ind Co Ltd 音声認識方法及び装置
JPH1031551A (ja) * 1996-07-15 1998-02-03 Mitsubishi Electric Corp ヒューマンインターフェースシステムおよびこれを使用した高速移動物体位置検出装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148183A (ja) * 1998-11-06 2000-05-26 Sanyo Electric Co Ltd 音声認識装置
EP1104922A2 (de) * 1999-11-26 2001-06-06 Robert Bosch Gmbh Vorrichtung und Verfahren zur Fernbedienung eines Autoradios
EP1104922A3 (de) * 1999-11-26 2005-06-22 Robert Bosch Gmbh Vorrichtung und Verfahren zur Fernbedienung eines Autoradios
KR100527512B1 (ko) * 2002-12-13 2005-11-09 현대자동차주식회사 차량 전자장비의 제어 방법 및 시스템
US9898675B2 (en) 2009-05-01 2018-02-20 Microsoft Technology Licensing, Llc User movement tracking feedback to improve tracking
JP2011128766A (ja) * 2009-12-16 2011-06-30 Canon Inc 入力装置及び方法
JP2013539565A (ja) * 2010-06-22 2013-10-24 マイクロソフト コーポレーション ユーザー追跡フィードバック

Similar Documents

Publication Publication Date Title
JP6844608B2 (ja) 音声処理装置および音声処理方法
US20200227039A1 (en) Electronic device and voice command identification method thereof
CN101902559A (zh) 图像音响处理装置及摄像装置
EP1085500B1 (en) Voice recognition for controlling a device
WO2019184517A1 (zh) 一种音频指纹提取方法及装置
US8868419B2 (en) Generalizing text content summary from speech content
US20240205512A1 (en) Selective playback of audio at normal speed during trick play operations
EP3792918B1 (en) Digital automatic gain control method and apparatus
US20210018882A1 (en) Information processing device and information processing method
KR20160133305A (ko) 제스쳐 인식 방법, 컴퓨팅 장치 및 제어 장치
JPH11272293A (ja) 遠隔制御装置
US20190361664A1 (en) Robot and speech interaction recognition rate improvement circuit and method thereof
CN114911449A (zh) 音量控制方法、装置、存储介质和电子设备
JP2010016660A (ja) シーンチェンジ検出装置、シーンチェンジ検出方法およびプログラム
CN112243182B (zh) 拾音电路、方法及装置
KR102556815B1 (ko) 전자 장치 및 이의 제어 방법
JP2002344852A (ja) 情報信号処理装置および情報信号処理方法
US12051412B2 (en) Control device, system, and control method
JP2002344872A (ja) 情報信号処理装置、情報信号処理方法および情報信号記録媒体
EP4018686B1 (en) Steering of binauralization of audio
CN112689193B (zh) 根据影像资讯判断是否播放音乐的方法及其系统
US20030101057A1 (en) Method for serving user requests with respect to a network of devices
KR20200129315A (ko) 음성인식 발화어의 인식을 위한 리모컨 및 셋톱박스의 동작 방법
CN112711392B (zh) 多通道交互系统通道的置信度计算方法
JP2000155595A (ja) 撮像装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030708