CN104301500A - 一种终端控制方法、装置和终端 - Google Patents

一种终端控制方法、装置和终端 Download PDF

Info

Publication number
CN104301500A
CN104301500A CN201310297933.7A CN201310297933A CN104301500A CN 104301500 A CN104301500 A CN 104301500A CN 201310297933 A CN201310297933 A CN 201310297933A CN 104301500 A CN104301500 A CN 104301500A
Authority
CN
China
Prior art keywords
terminal
lattice
terminal control
result
standard syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310297933.7A
Other languages
English (en)
Inventor
林俊萱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201310297933.7A priority Critical patent/CN104301500A/zh
Priority to PCT/CN2013/086358 priority patent/WO2014161301A1/zh
Publication of CN104301500A publication Critical patent/CN104301500A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种终端控制方法、装置和终端,所述方法包括:获取用户发送的控制终端执行操作的语音信息;对所述语音信息进行语义分析;将分析结果按照预设的标准语法格式进行转换和解析处理,获得处理结果;控制所述终端执行与所述处理结果对应的操作。本发明通过指定标准语法格式,将用户发送的语音信息转换为标准语法格式匹配的结果,实现终端对用户语音信息中的操作意图的理解,并最终执行用户指示的操作。

Description

一种终端控制方法、装置和终端
技术领域
本发明涉及移动通信领域,尤其涉及一种终端控制方法、装置和终端。
背景技术
自然语言语义理解(Nature Language Understanding,NLU)俗称人机对话,是人工智能的分支学科,主要研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,以代替人的部分脑力劳动。
语言是以词为基本单位,词汇又受到语法的支配才可构成有意义的、可理解的句子,句子按照一定的形式再构成篇章。机器对语言的理解一般是一个层次化的过程,许多语言学家把这一过程分为4个层次,依次为:
语音分析-语法分析-语义分析-语用分析。
其中语音分析是根据音位规则,从语音中区分出一个个独立的音素,再根据音位规则找出一个个音节及其对应的词素或词;语法分析又分为词法分析和句法分析,词法分析主要是找出词汇的各个词素,句法分析是对句子或短语的结构进行分析,它的方法有很多,例如短语结构语法、格文法、扩充转移网络和功能语法等;语义分析是通过分析找出词义、结构意义及其结合意义,从而确定语言所表达的真正含义或概念;语用分析则是研究一个语言符号在特定的语境中所具有的交际价值。
下面再介绍一下句法分析中的格文法。格文法的特点是以动词为中心来构造分析结果,尽管文法规则只描述句法,但分析结果产生的结构却与语义关系相对应,而非严格的句法关系,举例说明如下。
<实施例1>
英语句子“Mary hit Bill”,按照格文法分析后的结果可表示为:
Hit(Agent Mary)(Dative Bill)
上述这种表示结构称为格表示。在格表示中,一个语句包含的名词词组和介词词组均以它们与句子中动词的关系来表示,称为格。上例中动词中心是hit,名词Mary和Bill均以与动词hit的关系进行表示,则Agent和Dative均是格,而像"(Agent Mary)"这样的基本表示就是格结构。
发明内容
本发明的目的是提供一种终端控制方法、装置和终端,通过指定标准语法格式,将用户发送的语音信息转换为标准语法格式匹配的结果,实现终端对用户语音信息中的操作意图的理解,并最终执行用户指示的操作。
为了实现上述目的,本发明实施例提供了一种终端控制方法,所述方法包括:
获取用户发送的控制终端执行操作的语音信息;
对所述语音信息进行语义分析;
将分析结果按照预设的标准语法格式进行转换和解析处理,获得处理结果;
控制所述终端执行与所述处理结果对应的操作。
上述的终端控制方法,其中,所述操作至少包括拨打电话、发送短信、启动应用、设置功能、设置应用和搜索信息中的一项。
上述的终端控制方法,其中,所述标准语法格式中至少包括用于与操作对应的命令格和用于标识所述操作的对象的对象格。
上述的终端控制方法,其中,所述对象格用于标识所述对象的对象主体。
上述的终端控制方法,其中,所述对象格还用于标识所述对象的对象状态。
上述的终端控制方法,其中,所述标准语法格式中还包括用于描述所述对象执行所述操作的操作信息的扩充格。
上述的终端控制方法,其中,所述控制所述终端执行与所述处理结果对应的操作具体为:
控制所述终端对所述对象格对应的对象按照所述扩充格对应的操作信息执行所述命令格对应的操作。
为了实现上述目的,本发明实施例还提供了一种终端控制装置,所述装置包括:
获取模块,用于获取用户发送的控制终端执行操作的语音信息;
分析模块,用于对所述语音信息进行语义分析;
处理模块,用于将分析结果按照预设的标准语法格式进行转换和解析处理,获得处理结果;
控制模块,用于控制所述终端执行与所述处理结果对应的操作。
上述的终端控制装置,其中,所述操作至少包括拨打电话、发送短信、启动应用、设置功能、设置应用和搜索信息中的一项。
上述的终端控制装置,其中,所述标准语法格式中至少包括用于与操作对应的命令格和用于标识所述操作的对象的对象格。
上述的终端控制装置,其中,所述对象格用于标识所述对象的对象主体。
上述的终端控制装置,其中,所述对象格还用于标识所述对象的对象状态。
上述的终端控制装置,其中,所述标准语法格式中还包括用于描述所述对象执行所述操作的操作信息的扩充格。
上述的终端控制装置,其中,所述控制模块具体为:
控制所述终端对所述对象格对应的对象按照所述扩充格对应的操作信息执行所述命令格对应的操作。
为了实现上述目的,本发明实施例还提供了一种终端,所述终端上述任一项所述的终端控制装置。
本发明实施例通过对用户发送的控制终端执行操作的语音信息进行语义分析,并将分析结果按照预设的标准语法格式进行转换和解析处理,获得具体的处理结果来实现终端对用户语音信息中的操作意图的理解,在理解了用户的操作意图后,根据处理结果执行与所述处理结果对应的操作,即执行用户指示的操作。
附图说明
图1为本发明实施例提供的终端控制方法的流程示意图;
图2为本发明实施例提供的一种终端控制装置的结构示意图;
图3为本发明实施例提供的另一种终端控制装置的结构示意图。
具体实施方式
为使本发明实施例要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明实施例提供了一种终端控制方法,如图1所示,包括:
步骤11,获取用户发送的控制终端执行操作的语音信息;
步骤12,对所述语音信息进行语义分析;
步骤13,将分析结果按照预设的标准语法格式进行转换和解析处理,获得处理结果;
步骤14,控制所述终端执行与所述处理结果对应的操作。
本发明实施例通过对用户发送的控制终端执行操作的语音信息进行语义分析,并将分析结果按照预设的标准语法格式进行转换和解析处理,根据具体的处理结果来实现终端对用户语音信息中的操作意图的理解,在理解了用户的操作意图后,根据处理结果执行与所述处理结果对应的操作,即执行用户指示的操作。
下面分步骤介绍一下本发明实施例提供的方法。
首先执行步骤11,获取用户发送的控制终端执行操作的语音信息,优选地实现方式是通过语音识别软件来获取所述语音信息,为了方便在下一步中对语音信息进行语义分析,在获取了所述语音信息后需要进行语音识别,并转换为文本格式的识别结果,文本格式的识别结果可以是中文或英文等语言的,具体采用何种语言取决于用户发送语音信息时采用的语言。在本发明实施例中,用户控制终端执行的操作至少包括拨打电话、发送短信、启动应用、设置功能、设置应用和搜索信息中的一项。
对获取所述语音信息并转换为识别结果的过程举例说明如下。
<实施例2>
用户需要通过语音控制终端拨打电话时,可以通过语音识别软件获取用户发送的控制终端执行拨打电话的具体操作的语音信息,在进行语音识别后转换为文本格式识别结果“please help me call John”,当然,也可以是中文的“请帮我打电话给John”。
在获取了用户发送的所述语音信息并将所述语音信息转换为文本格式后,执行步骤12,对所述语音信息进行语义分析。
这里的语义分析过程与自然语言语义理解NLU过程相同,首先对文本格式的语音信息进行语音分析,根据音位规则找出一个个音节及其对应的词素或词;然后进行语法分析,找出词汇的各个词素,在本发明实施例中,优选地使用格文法对其进行句法分析;再进行语义分析,通过分析找出词义、结构意义及其结合意义;最后进行语用分析,通过提取中心词,确定命令想要完成的功能,按照格文法的格结构获取各语义格的功能详情。
对其中使用格文法进行句法分析,举例说明如下。
<实施例3>
对文本格式的语音信息“please help me call John”使用格文法对其进行句法分析,得到如下的结果:
Call(Agent me)(Dative John),
动词中心是call,Agent和Dative均是格。
应当注意地是,通过格文法进行句法分析产生的结构已经对应于语义关系,不再是严格的句法关系了,如上例中完成格文法的句法分析后,已经能够确定该句所要表达的真正含义,即已经确定了语义关系。
在对语音信息进行分析得到分析结果后,执行步骤13,将分析结果按照预设的标准语法格式进行转换和解析处理,获得处理结果。
这里先介绍一下标准语法格式。
为了理解用户语音信息中的操作意图,并执行用户指示的操作,本发明实施例定义了标准语法格式,作为用户使用语音信息控制终端的入口,所述标准语法格式中至少包括用于与操作对应的命令格和用于标识所述操作的对象的对象格,如下:
Command(<Object1>),
其中,Command为命令格,与具体的操作对应,小括号()中为对象格,用于标识操作的对象。
拨打电话、发送短信、启动应用、设置功能、设置应用和搜索信息分别对应的标准语法格式为:
Call(<contact>)、Sms(<Contact>)、Start(<Application>)、Set(<Function>)、Set(<Application>)和Search(<Content>)。
对标准语法格式举例说明如下。
<实施例4>
拨打电话的标准语法格式为:
Call(<contact>),
其中,call与拨打电话的操作对应,contact为拨打电话操作对应的对象,也就是联系人。
那么实施例3中的语音信息经过语音分析后,转换为标准语法格式如下:
Call(John)。
上述的标准语法中的对象格主要是用于标识所述对象的对象主体,属于某一集合(例如:联系人),应当注意地是某些时候光标识对象主体并不能完全体现用户的操作意图,举例说明如下。
<实施例5>
用户发送的控制终端执行操作的语音信息转换为文本格式是“please turnthe music down”,要求将终端播放音乐的应用程序声音调小,经过语义分析,发现该语音信息要执行的操作属于设置应用,采用的标准语法格式是Set(<Application>),具体为Set(music),很明显通过该标准语法格式不能体现用户的操作意图。
为了解决这一问题,在本发明实施例中,优选地,所述对象格还用于标识所述对象的对象状态,用于描述操作对象的具体状态的改变,也就是说用户发送控制终端执行操作的语音信息的意图是要改变对象的状态,相应地,标准语法格式进一步具体为:
Command(<Object1>[Object2]),
其中,Command为命令格,与具体的操作对应,小括号()中为对象格,用于标识操作的对象,<>中的Object1为对象主体,[]中的Object2为对象状态。
对应地,实施例5中的标准语法格式就为:
Set(<music>[turn down])。
当然,对象状态并不局限于音量大小的调整,还有很多其他的情况,在此不一一列举。
一般情况下,用户通过语音信息控制终端的意图不仅在于要执行操作,还希望能够进一步控制终端执行操作的具体操作信息,例如用户可以通过语音信息控制终端给某一联系人发送短信,进一步地,用户也希望能直接通过语音信息控制终端给该联系人发送短信的具体内容,因此,在本发明实施例中,优选地,所述标准语法格式中还包括用于描述所述对象执行所述操作的操作信息的扩充格,相应地,标准语法格式进一步具体为:
Command(<Object1>[Object2])[Object3],
其中,Command为命令格,与具体的操作对应,小括号()中为对象格,用于标识操作的对象,<>中的Object1为对象主体,[]中的Object2为对象状态,[]中的Object3为扩充格,描述所述对象执行所述操作的操作信息。
举例说明如下。
<实施例6>
用户发送的控制终端执行操作的语音信息转换为文本格式是“please sendmessage to Tom,How are you?”,要求发送短信给联系人Tom,且短信的具体内容是“How are you?”,转换为标准语法格式如下:
Sms(Tom)[How are you?]。
Sms是命令格,与发送短信的操作对应,小括号()中为对象格,Object1为Tom,是对象主体,How are you?为扩充格,这里不涉及对象状态的改变,Object2为空。
在将用户发送的语音信息进行语义分析获得分析结果后,将所述分析结果按照标准语法格式进行转换和解析处理,具体地,可以将所述分析结果首先进行转换,也就是将所述分析结果按照上述的标准语法格式Command(<Object1>[Object2])[Object3]进行匹配,如果至少成功匹配了命令格和对象格的内容,则进一步对匹配后的标准语法格式进行解析,确定具体的操作和与操作对应的对象(还可以包括对象状态和/或具体的操作信息),以便下一步骤14根据转换和解析处理的结果控制终端执行对应的操作。在实际应用中,也可以将转换结果封装为标准的语义包,解析语义包来确定具体的操作和与操作对应的对象。
在获得了处理结果后,执行步骤14,控制所述终端执行与所述处理结果对应的操作。
优选地,步骤14可以具体为:
控制所述终端对所述对象格对应的对象按照所述扩充格对应的操作信息执行所述命令格对应的操作。
当然,当扩充格为空时,只控制所述终端对所述对象格对应的对象执行所述命令格对应的操作,举例说明如下。
下面针对上述不同操作结合实施例说明按照标准语法格式Command(<Object1>[Object2])[Object3]进行转换和解析处理后,执行对应的操作,如下。
<操作一>拨打电话
标准语法格式:Call(<Contact>)[<Type>]。
<实施例7>
标准语法格式为:Call(Tom)[Mobile],对应的操作为:打电话给Tom的手机,其中Tom为名片夹中联系人,Mobile为联系人号码的类型,若扩充格不存在,即[Mobile]不存在时,可以默认为拨打联系人手机。
<操作二>发送短信
标准语法格式:Sms(<Contact>)[Text]。
<实施例8>
标准语法格式为:Sms(Tom)[How are you?],对应的操作为:发短信给Tom,其中Tom为名片夹中联系人,“How are you?”为短信内容,若扩充格不存在,即[How are you?]不存在,则打开短信编辑界面,并填充Tom至联系人输入栏。
<操作三>启动应用
标准语法格式:Start(<Application>)。
<实施例9>
标准语法格式为:Start(Calculator),对应的操作为:启动计算器。对象格包含手机已安装的所有应用。
<操作四>设置功能
标准语法格式:Set(<Function>)[<Status>]。
设置功能时可能会涉及对功能状态的设置,此时可以将其作为对象状态设置在对象格中,用Object2来描述,也可以直接设置在扩充格中,用Object3来描述。
<实施例10>
标准语法格式为:Set(GPS)[On],对应的操作为:打开GPS。其中的对象格包含Bluetooth、Data等,扩充格包含On和Off两个状态。
<操作五>设置应用
标准语法格式:Set(<Application>)[<Details>]。
<实施例11>
标准语法格式为:Set(Alarm)[127:1420],对应的操作为设置星期一至星期日,14:20的闹铃。其中的127表示星期一至星期日,1为星期一,2为星期二,4为星期三,8为星期四……1+4=5表示星期一和星期三,以此类推。
<操作六>搜索
标准语法格式:Search(Content)[<Engine>]。
<实施例12>
标准语法格式为:Search(Weather)[Baidu],对应的操作为:使用百度搜索天气,其中对象格可以是任意内容,扩充格表示搜索引擎,如Baidu,Google等等。
通过上述4个步骤实现了本发明的目的,即设置了一种标准语法格式,获取用户发送的控制终端执行操作的语音信息后,进行语义分析,将分析结果按照所述的标准语法格式进行转换和解析处理,来实现终端对用户语音信息中的操作意图的理解,在理解了用户的操作意图后,根据处理结果执行与所述处理结果对应的操作,即执行用户指示的操作。
下面详细介绍一下本发明实施例提供的终端控制方法的整体流程,包括:
步骤1,获取用户发送的控制终端执行操作的语音信息,可以通过语音识别软件来获取所述语音信息,并转换为文本格式的识别结果;
步骤2,对文本格式的语音信息进行语义分析,具体包括:
步骤21,首先进行语音分析,根据音位规则找出一个个音节及其对应的词素或词;
步骤22,其次进行语法分析,找出词汇的各个词素,使用格文法对其进行句法分析;
步骤23,再次进行语义分析,通过分析找出词义、结构意义及其结合意义;
步骤24,最后进行语用分析,通过提取中心词,确定命令想要完成的功能,再根据各语义格获取功能详情;
步骤3,将分析结果按照标准语法格式进行转换和解析处理,即与标准语法格式进行匹配,如果至少成功匹配了命令格和对象格的内容,则进一步对匹配后的标准语法格式进行解析,确定具体的操作和与操作对应的对象(还可以包括对象状态和/或具体的操作信息);
步骤4,控制所述终端对所述对象格对应的对象按照所述扩充格对应的操作信息执行所述命令格对应的操作。
对上述的流程举例说明如下:
<实施例13>
用户通过语音信息发送短信的过程包括:
步骤1,获取用户发送的语音信息,并转换为文本格式“Send message toTom,How are you?”;
步骤2,利用格文法对文本格式的识别结果进行语义分析;
步骤3,转换为标准语法格式:Sms(Tom)[How are you?],对应的操作是:Sms,对象为Tom,操作信息是How are you?,并将此结果封装成标准的语义包;
步骤4,解析此语义包,解析到的执行操作是“sms”,要发送的人名是:Tom,内容是:How are you?,此时调用终端相应的平台API发送短信“Howare you”给联系人Tom。
<实施例14>
用户通过语音信息拨打电话的过程包括:
步骤1,获取用户发送的语音信息,并转换为文本格式“Please help me toCall John Water at Home”;
步骤2,利用格文法对文本格式的识别结果进行语义分析;
步骤3,转换为标准语法格式:Call(John Water)[Home],对应的操作是:Call,对象为John Water,操作信息是Home,并将此结果封装成标准的语义包。
步骤4,解析此语义包,解析到的执行操作是“Call”,要打电话的对象是:John Water,号码类型是:Home,调用终端相应的平台API打电话给JohnWater的Home号码。
<实施例15>
用户通过语音信息设置闹钟应用的过程包括:
步骤1,获取用户发送的语音信息,并转换为文本格式“Please wake me upat9’clock tomorrow morning”;
步骤2,利用格文法对文本格式的识别结果进行语义分析;
步骤3,转换为标准语法格式:Set(Alarm)[9:00am],对应的操作是:Set,对象为Alarm,操作信息是时间9:00am,并将此结果封装成标准的语义包。
步骤4,解析此语义包,解析到的执行操作是“Set”,对象是:Alarm,时间是:9:00am,调用终端相应的平台API设置明天9:00am的闹钟。
本发明实施例还提供了一种终端控制装置,所述装置如图2所示,包括:
获取模块,用于获取用户发送的控制终端执行操作的语音信息;
分析模块,用于对所述语音信息进行语义分析;
处理模块,用于将分析结果按照预设的标准语法格式进行转换和解析处理,获得处理结果;
控制模块,用于控制所述终端执行与所述处理结果对应的操作。
其中分析模块具体可以包括:
语音分析子模块,用于对转换为文本格式的语音信息进行语音分析,根据音位规则找出一个个音节及其对应的词素或词;
语法分析子模块,用于对语音信息进行语法分析,找出词汇的各个词素,使用格文法对其进行句法分析;
语义分析子模块,用于对语音信息进行语义分析,通过分析找出词义、结构意义及其结合意义;
语用分析子模块,用于对语音信息进行语用分析,通过提取中心词,确定命令想要完成的功能,再根据各语义格获取功能详情。
对应地,本发明实施例还提供了另一种终端控制装置,如图3所示。
上述的终端控制装置,其中,所述操作至少包括拨打电话、发送短信、启动应用、设置功能、设置应用和搜索信息中的一项。
上述的终端控制装置,其中,所述标准语法格式中至少包括用于与操作对应的命令格和用于标识所述操作的对象的对象格。
上述的终端控制装置,其中,所述对象格用于标识所述对象的对象主体。
上述的终端控制装置,其中,所述对象格还用于标识所述对象的对象状态。
上述的终端控制装置,其中,所述标准语法格式中还包括用于描述所述对象执行所述操作的操作信息的扩充格。
上述的终端控制装置,其中,所述控制模块具体为:
控制所述终端对所述对象格对应的对象按照所述扩充格对应的操作信息执行所述命令格对应的操作。
本发明实施例还提供了一种终端,所述终端上述任一项所述的终端控制装置。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (15)

1.一种终端控制方法,其特征在于,所述方法包括:
获取用户发送的控制终端执行操作的语音信息;
对所述语音信息进行语义分析;
将分析结果按照预设的标准语法格式进行转换和解析处理,获得处理结果;
控制所述终端执行与所述处理结果对应的操作。
2.如权利要求1所述的终端控制方法,其特征在于,所述操作至少包括拨打电话、发送短信、启动应用、设置功能、设置应用和搜索信息中的一项。
3.如权利要求1所述的终端控制方法,其特征在于,所述标准语法格式中至少包括用于与操作对应的命令格和用于标识所述操作的对象的对象格。
4.如权利要求3所述的终端控制方法,其特征在于,所述对象格用于标识所述对象的对象主体。
5.如权利要求4所述的终端控制方法,其特征在于,所述对象格还用于标识所述对象的对象状态。
6.如权利要求3-5任一项所述的终端控制方法,其特征在于,所述标准语法格式中还包括用于描述所述对象执行所述操作的操作信息的扩充格。
7.如权利要求6所述的终端控制方法,其特征在于,所述控制所述终端执行与所述处理结果对应的操作具体为:
控制所述终端对所述对象格对应的对象按照所述扩充格对应的操作信息执行所述命令格对应的操作。
8.一种终端控制装置,其特征在于,所述装置包括:
获取模块,用于获取用户发送的控制终端执行操作的语音信息;
分析模块,用于对所述语音信息进行语义分析;
处理模块,用于将分析结果按照预设的标准语法格式进行转换和解析处理,获得处理结果;
控制模块,用于控制所述终端执行与所述处理结果对应的操作。
9.如权利要求8所述的终端控制装置,其特征在于,所述操作至少包括拨打电话、发送短信、启动应用、设置功能、设置应用和搜索信息中的一项。
10.如权利要求8所述的终端控制装置,其特征在于,所述标准语法格式中至少包括用于与操作对应的命令格和用于标识所述操作的对象的对象格。
11.如权利要求10所述的终端控制装置,其特征在于,所述对象格用于标识所述对象的对象主体。
12.如权利要求11所述的终端控制装置,其特征在于,所述对象格还用于标识所述对象的对象状态。
13.如权利要求10-12任一项所述的终端控制装置,其特征在于,所述标准语法格式中还包括用于描述所述对象执行所述操作的操作信息的扩充格。
14.如权利要求13所述的终端控制装置,其特征在于,所述控制模块具体为:
控制所述终端对所述对象格对应的对象按照所述扩充格对应的操作信息执行所述命令格对应的操作。
15.一种终端,其特征在于,所述终端包括权利要求8-14任一项所述的终端控制装置。
CN201310297933.7A 2013-07-16 2013-07-16 一种终端控制方法、装置和终端 Pending CN104301500A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310297933.7A CN104301500A (zh) 2013-07-16 2013-07-16 一种终端控制方法、装置和终端
PCT/CN2013/086358 WO2014161301A1 (zh) 2013-07-16 2013-10-31 一种终端控制方法、装置和终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310297933.7A CN104301500A (zh) 2013-07-16 2013-07-16 一种终端控制方法、装置和终端

Publications (1)

Publication Number Publication Date
CN104301500A true CN104301500A (zh) 2015-01-21

Family

ID=51657491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310297933.7A Pending CN104301500A (zh) 2013-07-16 2013-07-16 一种终端控制方法、装置和终端

Country Status (2)

Country Link
CN (1) CN104301500A (zh)
WO (1) WO2014161301A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426357A (zh) * 2015-11-06 2016-03-23 武汉卡比特信息有限公司 语音快速选择方法
CN107591195A (zh) * 2017-09-07 2018-01-16 北京鑫丰南格科技股份有限公司 一种基于护理呼叫系统的医护辅助方法及装置
CN107765970A (zh) * 2017-03-27 2018-03-06 三角兽(北京)科技有限公司 信息处理装置及信息处理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1313972A (zh) * 1998-08-24 2001-09-19 Bcl计算机有限公司 自适应的自然语言接口
CN102360187A (zh) * 2011-05-25 2012-02-22 吉林大学 语谱图互相关的驾驶员汉语语音控制系统及方法
CN102543082A (zh) * 2012-01-19 2012-07-04 北京赛德斯汽车信息技术有限公司 使用自然语言的车载信息服务系统语音操作方法及系统
CN102830915A (zh) * 2012-08-02 2012-12-19 聚熵信息技术(上海)有限公司 语义输入控制系统及其方法
CN103077714A (zh) * 2013-01-29 2013-05-01 华为终端有限公司 信息的识别方法和装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4686905B2 (ja) * 2000-07-21 2011-05-25 パナソニック株式会社 対話制御方法及びその装置
CN102883041A (zh) * 2012-08-02 2013-01-16 聚熵信息技术(上海)有限公司 移动终端的语音控制装置及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1313972A (zh) * 1998-08-24 2001-09-19 Bcl计算机有限公司 自适应的自然语言接口
CN102360187A (zh) * 2011-05-25 2012-02-22 吉林大学 语谱图互相关的驾驶员汉语语音控制系统及方法
CN102543082A (zh) * 2012-01-19 2012-07-04 北京赛德斯汽车信息技术有限公司 使用自然语言的车载信息服务系统语音操作方法及系统
CN102830915A (zh) * 2012-08-02 2012-12-19 聚熵信息技术(上海)有限公司 语义输入控制系统及其方法
CN103077714A (zh) * 2013-01-29 2013-05-01 华为终端有限公司 信息的识别方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426357A (zh) * 2015-11-06 2016-03-23 武汉卡比特信息有限公司 语音快速选择方法
CN107765970A (zh) * 2017-03-27 2018-03-06 三角兽(北京)科技有限公司 信息处理装置及信息处理方法
CN107591195A (zh) * 2017-09-07 2018-01-16 北京鑫丰南格科技股份有限公司 一种基于护理呼叫系统的医护辅助方法及装置

Also Published As

Publication number Publication date
WO2014161301A1 (zh) 2014-10-09

Similar Documents

Publication Publication Date Title
KR101042119B1 (ko) 음성 이해 시스템, 및 컴퓨터 판독가능 기록 매체
US7818166B2 (en) Method and apparatus for intention based communications for mobile communication devices
CN101923858B (zh) 一种实时同步互译语音终端
KR101066741B1 (ko) 컴퓨터 시스템과 동적으로 상호작용하기 위한 컴퓨터 구현 방법, 시스템, 및 컴퓨터 판독가능 기록 매체
CN111261144B (zh) 一种语音识别的方法、装置、终端以及存储介质
CN103945044A (zh) 一种信息处理方法和移动终端
JP2006146881A (ja) 会話用合理的エージェント、このエージェントを用いるインテリジェント会話システム、インテリジェント会話を制御する方法、及びそれを用いるプログラム
KR20170033722A (ko) 사용자의 발화 처리 장치 및 방법과, 음성 대화 관리 장치
KR102056330B1 (ko) 통역장치 및 그 방법
KR20190061706A (ko) 복수의도를 포함하는 명령어를 분석하는 음성 인식 시스템 및 방법
JP2002125050A5 (zh)
KR20090085376A (ko) 문자 메시지의 음성 합성을 이용한 서비스 방법 및 장치
WO2010124512A1 (zh) 人机交互系统及其相关系统、设备和方法
JP2014106523A (ja) 音声入力対応装置及び音声入力対応プログラム
WO2019169722A1 (zh) 快捷键识别方法、装置、设备以及计算机可读存储介质
CN104301500A (zh) 一种终端控制方法、装置和终端
KR101959439B1 (ko) 통역방법
CN201054644Y (zh) 具有语音识别及翻译功能的移动终端
KR102056329B1 (ko) 통역방법
KR20190083438A (ko) 한국어 대화 장치
KR20010008073A (ko) 음성 인식 및 번역 전용 에이직을 이용한 휴대용 다국어번역 단말장치
CN109830239A (zh) 语音处理装置、语音识别输入系统及语音识别输入方法
CN113515952B (zh) 一种用于蒙古语对话模型联合建模方法、系统及设备
Vijayakumar et al. ISAY: SMS Service Using ARM
WO2021218750A1 (en) System and method for translating sign language

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150121