CN102377622A - 远程控制接口及其远程控制方法 - Google Patents

远程控制接口及其远程控制方法 Download PDF

Info

Publication number
CN102377622A
CN102377622A CN2010102555444A CN201010255544A CN102377622A CN 102377622 A CN102377622 A CN 102377622A CN 2010102555444 A CN2010102555444 A CN 2010102555444A CN 201010255544 A CN201010255544 A CN 201010255544A CN 102377622 A CN102377622 A CN 102377622A
Authority
CN
China
Prior art keywords
speech recognition
control command
user instruction
user
sends
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102555444A
Other languages
English (en)
Inventor
许恩玮
简家弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN2010102555444A priority Critical patent/CN102377622A/zh
Priority to US13/113,741 priority patent/US20120046952A1/en
Publication of CN102377622A publication Critical patent/CN102377622A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Selective Calling Equipment (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种远程控制接口,该远程控制接口包括:用户指令接收与识别模块,用于接收和识别用户发出的指令,并将用户指令以一统一的形式来描述和记录;控制指令生成模块,用于将所述用户指令接收与识别模块发送的用户指令转换为数字设备能够识别的控制指令;及控制接口模块,用于将所述控制指令生成模块生成的控制指令通过数字设备支持的通信方式发送给数字设备。本发明还揭示了一种远程控制方法。根据本发明的技术方案,用户可以使用一个统一的远程控制接口,简单而方便的控制多个数字设备。

Description

远程控制接口及其远程控制方法
技术领域
本发明涉及一种接口,特别是涉及一种远程控制接口及其远程控制方法。
背景技术
随着数字家电的快速发展,越来越多的家电具备了网络连线功能,比如Wifi、蓝牙、红外线以及3G连线等等,使用者可以非常便捷的使用这些连线功能来远程控制数字家电。但是,目前的技术方案是每一个数字家电都有着各自的控制台和控制指令,使用者要远程控制多个数字家电,就必须使用各个家电对应的控制台通过其支持的连线方式来下达控制指令,而这些控制台、控制指令、连线方式在不同的数字家电之间都不尽相同,对使用者而言,这无疑增加了操作的复杂度。
发明内容
鉴于以上内容,有必要提供一种简单易用的统一的远程控制接口及其远程控制方法。
根据本发明的一方面,提供一种远程控制接口,所述远程控制接口包括:
一用户指令接收与识别模块,用于接收和识别用户发出的指令,并将用户指令以一统一的形式来描述和记录;
一控制指令生成模块,用于将所述用户指令接收与识别模块发送的用户指令转换为数字设备能够识别的控制指令;及
一控制接口模块,用于将所述控制指令生成模块生成的控制指令通过数字设备支持的通信方式发送给数字设备。
根据本发明的另一方面,提供一种远程控制方法,该方法包括以下步骤:
一用户指令接收与识别模块接收和识别用户发出的指令,将该用户指令以一统一的形式来描述和记录,并发送给一控制指令生成模块;
所述控制指令生成模块将所述用户指令接收与识别模块发送的用户指令转换为数字设备能够识别的控制指令,并将该控制指令发送给一控制接口模块;及
所述控制接口模块将所述控制指令生成模块发送的控制指令通过数字设备支持的通信方式发送给数字设备。
与现有技术相比,上述系统和方法,由于所述远程控制接口可接收多种类型的用户指令,并将用户指令转换为数字设备能够识别和执行的控制指令,为用户提供了一个远程控制数字设备的统一接口,使得用户可以用一站式的集中方式远程管理多个数字设备,简单而方便。
附图说明
图1为本发明一种实施方式中的远程控制接口的功能模块图。
图2为本发明一种实施方式中的远程控制方法的流程图。
图3为本发明一种实施方式中的用户指令接收与识别模块处理语音指令的方法的流程图。
图4为本发明一种实施方式中的语音识别子模块识别语音信号的语义的方法的流程图。
主要元件符号说明
  远程控制接口   10
  用户指令接收与识别模块   102
  语音接收子模块   1022
  语音识别子模块   1024
  控制指令生成模块   104
  控制接口模块   106
  数字设备   20
  语音识别服务器   30
具体实施方式
请参阅图1,示意性的示出了根据本发明一种实施方式的远程控制接口的功能模块图。所述远程控制接口10连接一数字设备20,所述远程控制接口10接收用户指令,转换为所述数字设备20能够识别的控制指令,并发送给所述数字设备20。
所述数字设备20,为用户要远程操作的对象,可以是个人电脑、数码相框、数码影碟机、数字电视、冰箱、空调等数字设备,所述数字设备20具有网络连线功能,网络连线方式包括Wifi、蓝牙、红外线以及3G连线等等。
所述远程控制接口10包括一用户指令接收与识别模块102、一控制指令生成模块104及一控制接口模块106。所述用户指令接收与识别模块102连接所述控制指令生成模块104,所述控制指令生成模块104连接所述控制接口模块106,所述用户指令接收与识别模块102还连接一语音识别服务器30,所述控制接口模块106连接所述数字设备20。
所述用户指令接收与识别模块102,用于接收和识别用户发出的指令,并将用户指令以一统一的形式来描述和记录。所述用户指令接收与识别模块102可接收多种类型的用户指令,比如语音指令、按键指令、触控指令等等。用户指令包括“行为”和“对象”,“行为”是用户要执行的操作,“对象”是用户的操作目标。在本实施方式中,所述统一的形式为使用可扩展标记语言(XML)来分别描述和记录用户指令包括的“行为”和“对象”。
本实施方式以接收语音指令为例来阐述本发明的技术方案。
所述用户指令接收与识别模块102包括一语音接收子模块1022及一语音识别子模块1024。所述语音接收子模块1022连接所述语音识别子模块1024,所述语音识别子模块1024连接到所述控制指令生成模块104。
所述语音接收子模块1022,用于接收用户发出的语音信号,并将该语音信号发送给所述语音识别子模块1024。所述语音接收子模块1022,可以是任何具有声音录入功能的设备,比如麦克风、有录音功能的手机等等。
所述语音识别子模块1024,用于以所述统一的形式来描述和记录该语音信号的语义所代表的用户指令,并将该用户指令发送给所述控制指令生成模块104。在本实施方式中,使用可扩展标记语言(XML)来描述语义,所述语音识别子模块1024进一步将该语音信号的语义拆解为“行为”和“对象”,分别用可扩展标记语言来描述。比如语音信号“打开电视机”,所述语音识别子模块1024将其语义拆解为“打开”和“电视机”。
在一实施方式中,所述语音识别子模块1024连接到一语音识别服务器30,连接方式包括多种,比如以太网、Wifi、3G网络等等,所述语音识别子模块1024将接收到的语音信号发送给所述语音识别服务器30。所述语音识别服务器30,用于接收所述语音识别子模块1024发送的语音信号,识别该语音信号的语义,再将该语音信号的语义发送给所述语音识别子模块1024。所述语音识别服务器30可以是位于局域网内的提供语音识别服务的服务器,也可以位于互联网上的提供语音识别服务的服务器。在一实施方式中,所述语音识别服务器30由网络可访存多模式接口(WAMI:Web-AccessibleMultimodal Interface)提供。网络可访存多模式接口是由美国麻省理工学院计算机科学与人工智能实验室(CSAIL)开发和维护的一个位于互联网上的开放的语音处理接口,提供语音识别和语音合成服务。所述语音识别子模块1024通过WAMI提供的网络服务(Web Service)与WAMI服务器建立连接,然后向WAMI发送语音识别请求,该语音识别请求包括语音信号和语义语法,该语音信号为所述语音识别子模块1024接收自语音接收子模块1022的语音信号,该语义语法为所述语音识别子模块1024要求WAMI返回的语义需要遵守的语法,比如要求WAMI识别并返回的语音语义拆解为“行为”和“对象”,并以可扩展标记语言来描述。
所述控制指令生成模块104,用于将所述用户指令接收与识别模块102接收到的用户指令转换为所述数字设备20能够识别的控制指令,并发送给所述控制接口模块106。所述控制指令包括信道和信令,信道为发送信息的物理性通道,为通信媒介,比如蓝牙、红外线、Wifi等等,信令为通信实体间传输为建立和控制连续的信息,比如“打开电视”、“增大音量”等等。所述控制指令生成模块104根据所述数字设备20的信道方式和信令规格,将用户指令转换为控制指令。
所述控制接口模块106,用于将所述控制指令生成模块104生成的控制指令发送给所述数字设备20。所述控制接口模块106按照所述数字设备所支持的通信方式将控制指令的信令发送给所述数字设备20,所述数字设备20在接收到控制指令之后,执行相应的“行为”。
请参阅图2,示意性的示出了根据本发明一种实施方式中远程控制方法的流程图,包括以下步骤:
在步骤S10中,一用户指令接收与识别模块接收和识别用户发出的指令,将该用户指令以一统一的形式来描述和记录,并发送给一控制指令生成模块。所述统一的形式为使用可扩展标记语言(XML)来分别描述和记录用户指令包括的“行为”和“对象”。
在步骤S12中,所述控制指令生成模块将所述用户指令接收与识别模块发送的用户指令转换为对应数字设备能够识别的控制指令,并将该控制指令发送给一控制接口模块。
在步骤S14中,所述控制接口模块将所述控制指令生成模块发送的控制指令通过所述数字设备支持的通信方式发送给所述数字设备。
请参阅图3,示意性的示出了根据本发明一种实施方式中用户指令接收与识别模块处理语音指令的方法的流程图,包括以下步骤:
在步骤S102中,所述用户指令接收与识别模块的一语音接收子模块接收用户发出的语音信号,并将该语音信号发送给所述用户指令接收与识别模块的一语音识别子模块。
在步骤S104中,所述语音识别子模块以所述统一的形式来描述和记录该语音信号的语义所代表的用户指令。
在步骤S106中,所述语音识别子模块将该用户指令发送给所述控制指令生成模块。
请参阅图4,示意性的示出了根据本发明一种实施方式中语音识别子模块识别语音信号的语义的方法的流程图,包括以下步骤:
在步骤S1042中,所述语音识别子模块将该语音信号发送给一语音识别服务器。在一实施方式中,所述语音识别服务器由网络可访存多模式接口提供。
在步骤S1044中,所述语音识别服务器识别该语音信号的语义,并将该语义发送给所述语音识别子模块。
对本领域的技术人员来说,可以根据本发明的发明方案和发明构思结合生产的实际需要做出其他相应的改变或调整,而这些改变和调整都应属于本发明权利要求的保护范围。

Claims (10)

1.一种远程控制接口,其特征在于:所述远程控制接口包括:
一用户指令接收与识别模块,用于接收和识别用户发出的指令,并将用户指令以一统一的形式来描述和记录;
一控制指令生成模块,用于将所述用户指令接收与识别模块发送的用户指令转换为数字设备能够识别的控制指令;及
一控制接口模块,用于将所述控制指令生成模块生成的控制指令通过数字设备支持的通信方式发送给数字设备。
2.如权利要求1所述的远程控制接口,其特征在于:所述用户指令接收与识别模块包括:
一语音接收子模块,用于接收用户发出的语音信号;及
一语音识别子模块,用于以所述统一的形式来描述和记录该语音信号的语义所代表的用户指令,并将该用户指令发送给所述控制指令生成模块。
3.如权利要求2所述的远程控制接口,其特征在于:所述语音识别子模块连接到一语音识别服务器,所述语音识别子模块将所述语音接收子模块接收到的语音信号发送给所述语音识别服务器,所述语音识别服务器识别该语音信号的语义,并将该语义发送给所述语音识别子模块。
4.如权利要求3所述的远程控制接口,其特征在于:所述语音识别服务器由网络可访存多模式接口提供。
5.如权利要求1所述的远程控制接口,其特征在于:所述统一的形式为使用可扩展标记语言来分别描述和记录用户指令包括的“行为”和“对象”。
6.一种远程控制方法,其特征在于:所述方法包括以下步骤:
一用户指令接收与识别模块接收和识别用户发出的指令,将该用户指令以一统一的形式来描述和记录,并发送给一控制指令生成模块;
所述控制指令生成模块将所述用户指令接收与识别模块发送的用户指令转换为数字设备能够识别的控制指令,并将该控制指令发送给一控制接口模块;及
所述控制接口模块将所述控制指令生成模块发送的控制指令通过数字设备支持的通信方式发送给数字设备。
7.如权利要求6所述的远程控制方法,其特征在于:所述用户指令接收与识别模块处理语音指令的方法包括以下步骤:
所述用户指令接收与识别模块的一语音接收子模块接收用户发出的语音信号,并将该语音信号发送给所述用户指令接收与识别模块的一语音识别子模块;
所述语音识别子模块以所述统一的形式来描述和记录该语音信号的语义所代表的用户指令;及
所述语音识别子模块将该用户指令发送给所述控制指令生成模块。
8.如权利要求7所述的远程控制方法,其特征在于:所述语音识别子模块识别该语音信号的语义的方法包括以下步骤:
所述语音识别子模块将该语音信号发送给一语音识别服务器;及
所述语音识别服务器识别该语音信号的语义,并将该语义发送给所述语音识别子模块。
9.如权利要求8所述的远程控制方法,其特征在于:所述语音识别服务器由网络可访存多模式接口提供。
10.如权利要求6所述的远程控制方法,其特征在于:所述统一的形式为使用可扩展标记语言来分别描述和记录用户指令包括的“行为”和“对象”。
CN2010102555444A 2010-08-17 2010-08-17 远程控制接口及其远程控制方法 Pending CN102377622A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2010102555444A CN102377622A (zh) 2010-08-17 2010-08-17 远程控制接口及其远程控制方法
US13/113,741 US20120046952A1 (en) 2010-08-17 2011-05-23 Remote control system and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102555444A CN102377622A (zh) 2010-08-17 2010-08-17 远程控制接口及其远程控制方法

Publications (1)

Publication Number Publication Date
CN102377622A true CN102377622A (zh) 2012-03-14

Family

ID=45594770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102555444A Pending CN102377622A (zh) 2010-08-17 2010-08-17 远程控制接口及其远程控制方法

Country Status (2)

Country Link
US (1) US20120046952A1 (zh)
CN (1) CN102377622A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488384A (zh) * 2013-09-30 2014-01-01 乐视致新电子科技(天津)有限公司 一种语音助手应用界面显示方法和装置
CN103489444A (zh) * 2013-09-30 2014-01-01 乐视致新电子科技(天津)有限公司 一种语音识别方法和装置
CN103488401A (zh) * 2013-09-30 2014-01-01 乐视致新电子科技(天津)有限公司 一种语音助手激活方法和装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105404617B (zh) * 2014-09-15 2018-12-14 华为技术有限公司 一种远程桌面的控制方法、受控端及控制系统
US10650819B2 (en) 2018-10-15 2020-05-12 Midea Group Co., Ltd. System and method for providing portable natural language processing interface across multiple appliances
US10978046B2 (en) * 2018-10-15 2021-04-13 Midea Group Co., Ltd. System and method for customizing portable natural language processing interface for appliances

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040019489A1 (en) * 2002-07-24 2004-01-29 Karsten Funk Voice control of home automation systems via telephone
US20050035855A1 (en) * 2003-08-11 2005-02-17 Visteon Global Technologies, Inc. Voice command system for remote control and monitoring of home networked devices
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6606280B1 (en) * 1999-02-22 2003-08-12 Hewlett-Packard Development Company Voice-operated remote control
DE10002321C2 (de) * 2000-01-20 2002-11-14 Micronas Munich Gmbh Sprachgesteuerte Vorrichtung und System mit einer derartigen sprachgesteuerten Vorrichtung
US7194412B2 (en) * 2001-07-19 2007-03-20 Overhead Door Corporation Speech activated door operator system
US7260538B2 (en) * 2002-01-08 2007-08-21 Promptu Systems Corporation Method and apparatus for voice control of a television control device
US7529677B1 (en) * 2005-01-21 2009-05-05 Itt Manufacturing Enterprises, Inc. Methods and apparatus for remotely processing locally generated commands to control a local device
US9311394B2 (en) * 2006-10-31 2016-04-12 Sony Corporation Speech recognition for internet video search and navigation
US8260618B2 (en) * 2006-12-21 2012-09-04 Nuance Communications, Inc. Method and apparatus for remote control of devices through a wireless headset using voice activation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040019489A1 (en) * 2002-07-24 2004-01-29 Karsten Funk Voice control of home automation systems via telephone
US20050035855A1 (en) * 2003-08-11 2005-02-17 Visteon Global Technologies, Inc. Voice command system for remote control and monitoring of home networked devices
CN101599270A (zh) * 2008-06-02 2009-12-09 海尔集团公司 语音服务器及语音控制的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ALEXANDER GRUENSTEIN: "The WAMI Toolkit for Developing, Deploying, and Evaluating Web-Accessible Multimodal Interfaces", 《10TH IEEE INTERNATIONAL CONFERENCE ON MULTIMODAL INTERFACE》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488384A (zh) * 2013-09-30 2014-01-01 乐视致新电子科技(天津)有限公司 一种语音助手应用界面显示方法和装置
CN103489444A (zh) * 2013-09-30 2014-01-01 乐视致新电子科技(天津)有限公司 一种语音识别方法和装置
CN103488401A (zh) * 2013-09-30 2014-01-01 乐视致新电子科技(天津)有限公司 一种语音助手激活方法和装置

Also Published As

Publication number Publication date
US20120046952A1 (en) 2012-02-23

Similar Documents

Publication Publication Date Title
CN102377622A (zh) 远程控制接口及其远程控制方法
KR101970731B1 (ko) 인공지능 스피커 및 이의 제어 방법
CN101232609A (zh) 一种手机视频实时监控的实现方法
CN104301399A (zh) 一种语音远程控制音箱的系统及方法
CN102883214A (zh) 一种多终端互传互控的方法及智能电视终端
CN101360200A (zh) 使用遥控器采集音视频并将其传输给电视机的装置和方法
CN104065679A (zh) 一种远程桌面操作的方法及客户端
KR20180052876A (ko) 음성인식을 이용한 홈네트워크 시스템 및 그 제어방법
US11281269B2 (en) Power adapter with networking
CN101473638A (zh) 通过使用嵌入呼叫方姓名和呼叫方标识的媒体终端适配器(mta)初始化过程显示
KR100626653B1 (ko) 사용자의 선호도에 따른 오디오 신호 적응 변환 장치 및그 방법
CN104717536A (zh) 一种语音控制的方法和系统
CN112243182B (zh) 拾音电路、方法及装置
CN101853560B (zh) 一种带耳机的rf遥控器及其控制方法
CN203434995U (zh) 一种多输出通道的电子调音台
CN105682188A (zh) 接入WiFi网络的方法、装置及WiFi接入设备
US20180152739A1 (en) Device-Based Audio-Format Selection
CN201213284Y (zh) 通过无线方式接收、发送语音信号的机顶盒
CN101924922A (zh) 一种监控方法和监控系统
CN101984622A (zh) 基于实时传输协议的双向音频映射系统及方法
KR100838800B1 (ko) 개인 방송 서비스 시스템 및 방법
CN207184689U (zh) 一种HDBaseT传输器
KR100451642B1 (ko) 리모콘 신호 정보 데이터베이스를 이용한 홈 오토메이션제어 방법
CN105306759A (zh) 一种可实现voip电话业务的家庭式综合无线路由器及其方法
KR102431301B1 (ko) 방송 채널명 스캔 데이터를 활용한 음성 인식 채널 변경이 가능한 인공지능 비서 서비스 제공 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120314