CN106205615B - 一种基于语音交互的控制方法及系统 - Google Patents

一种基于语音交互的控制方法及系统 Download PDF

Info

Publication number
CN106205615B
CN106205615B CN201610736268.0A CN201610736268A CN106205615B CN 106205615 B CN106205615 B CN 106205615B CN 201610736268 A CN201610736268 A CN 201610736268A CN 106205615 B CN106205615 B CN 106205615B
Authority
CN
China
Prior art keywords
voice
information
voice information
module
text information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610736268.0A
Other languages
English (en)
Other versions
CN106205615A (zh
Inventor
王峥嵘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610736268.0A priority Critical patent/CN106205615B/zh
Priority to CN202310748193.8A priority patent/CN116844543A/zh
Publication of CN106205615A publication Critical patent/CN106205615A/zh
Application granted granted Critical
Publication of CN106205615B publication Critical patent/CN106205615B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开一种基于语音交互的控制方法及系统。该方法通过唤醒信号启动语音交互系统,语音交互系统实时侦听语音信息,将侦听的语音信息转换成文字信息,对转换的文字信息进行分析,通过与系统预先存储的功能参数判断语音信息对应的文字信息的功能参数是否完整,若完整,则执行相应的操作;若不完整,根据缺少的功能参数提示用户回复要执行的操作,从而实现实时通过语音调用系统操作。采用本发明的控制方法及系统,可随时通过语音调用应用程序,可随时选择不同功能操作,或者选择同一功能的不同执行参数,满足用户的不同需求,并且在调用过程中不需要用眼用手,还可实时对系统进行更新,大大的增加了语音交互控制系统的使用便捷性。

Description

一种基于语音交互的控制方法及系统
技术领域
本发明涉及智能控制领域,特别是涉及一种基于语音交互的控制方法及系统。
背景技术
语音交互控制是指通过语音交互来实现应用程序的调用。
现有的语音交互控制方法主要是根据用户的指令自动开启移动设备上的应用程序,但在使用过程中需要用户盯紧移动设备屏幕,用手去点击。当通过语音交互控制方法打开某一个应用程序时,需要用户手动关闭该应用程序,而且在执行该应用程序过程中需要调用其他应用程序时,必须重新启动语音交互控制方法进行调用。例如,当用语音交互控制方法打开地图程序之后,需要用户自己操作地图进行导航或者路线查询等操作,而且无法继续用语音交互控制方法调用短信等其他应用程序。这使得现有的语音交互控制方法使用便捷性不高。
发明内容
本发明的目的是提供一种基于语音交互的控制方法及系统,通过全语音交互的形式,实现对应用程序的调用,而且可实现多个程序同时调用与实时控制,以解决现有技术中语音交互控制方法及系统使用便捷性不高的问题。
为实现上述目的,本发明提供了如下方案:
一种基于语音交互的控制方法,所述方法包括:
获取唤醒信号,所述唤醒信号用于启动语音交互系统进入语音交互过程;
根据所述唤醒信号,启动所述语音交互系统;
获取语音信息;
判断所述语音信息是否能够被转换成文字信息,得到第一判断结果;
当所述第一判断结果为否时,返回所述获取语音信息步骤;
当所述第一判断结果为是时,对所述语音信息对应的文字信息进行分析,并存储分析结果,根据所述分析结果判断所述文字信息的功能参数是否完整,得到第二判断结果;
当所述第二判断结果为是时,则执行所述文字信息功能参数对应的操作,生成确认消息,并根据所述确认消息进行语音信息合成,并播放合成的语音信息;
当所述第二判断结果为否时,根据缺少的功能参数生成提示消息,并根据所述提示消息进行语音信息合成,并播放合成的语音信息,返回所述获取语音信息步骤。
可选的,所述根据所述唤醒信号,启动所述语音交互系统具体包括:
将所述唤醒信号与系统预存的唤醒词进行比对;
比对成功后,启动所述语音交互系统。
可选的,所述对所述语音信息对应的文字信息进行分析,并存储分析结果之后,还包括:
返回所述获取唤醒信号的步骤。
可选的,所述执行所述文字信息功能参数对应的操作之前,还包括:
当所述文字信息的功能参数完整且所述文字信息功能参数对应的操作选项多于一个时,生成选择提示问题,并根据所述选择提示问题进行语音信息合成,并播放合成的语音信息,所述选择提示问题用于提示用户选择需要执行的操作选项。
可选的,所述生成选择提示问题具体包括:生成提示用户回复选项编号的消息,每个所述选项编号对应不同的所述操作选项的内容。
可选的,所述根据缺少的功能参数生成提示消息之后还包括:
当所述语音信息中包括完整的功能参数而所述分析结果为不完整时,
提示用户补充语义数据库;所述语义数据库中存储有功能参数以及与所述功能参数相对应的操作;
获取所述用户输入的操作信息;
将所述语音信息中包括完整的功能参数以及所述用户输入的操作信息对应增加至所述语义数据库。
一种基于语音交互的系统,所述系统包括:
语音唤醒模块,用于获取唤醒信号,所述唤醒信号用于启动系统进入语音交互过程;
语音交互系统启动模块,用于根据所述唤醒信号,启动所述语音交互系统;
语音信息获取模块,用于获取语音信息;
语音信息判断模块,用于判断所述语音信息是否能够被转换成文字信息,得到第一判断结果;
语音分析模块,用于当所述第一判断结果为是时,对所述语音信息对应的文字信息进行分析;
存储模块,用于存储所述语音分析模块对所述语音信息对应的文字信息进行分析的分析结果;
功能参数判断模块,用于根据所述分析结果判断所述文字信息的功能参数是否完整,得到第二判断结果;
执行模块,用于当所述第二判断结果为是时,执行所述文字信息功能参数对应的操作;
确认消息生成模块,用于生成确认消息;
语音合成模块,用于进行语音信息合成;
语音播放模块,用于播放合成的语音信息;
提示消息生成模块,用于当所述第二判断结果为否时,根据缺少的功能参数生成提示消息。
可选的,所述语音交互系统启动模块具体包括:
语音交互系统比对模块,用于将所述唤醒信号与系统预存的唤醒词进行比对;
语音交互系统启动子模块,比对成功后,启动所述语音交互系统。。
可选的,所述系统还包括选择提示问题生成模块,用于当所述执行模块执行所述文字信息功能参数对应的操作之前,所述文字信息的功能参数完整且所述文字信息功能参数对应的操作选项多于一个时,生成选择提示问题。
可选的,所述系统还包括语义补充模块,所述语义补充模块具体包括:
补充提示生成模块,用于当提示消息生成模块根据缺少的功能参数生成提示消息之后,所述语音信息中包括完整的功能参数而所述分析结果为不完整时,提示用户补充语义数据库;所述语义数据库中存储有功能参数以及与所述功能参数相对应的操作;
输入模块,用于获取所述用户输入的操作信息;
语义数据库补充模块,用于将所述语音信息中包括完整的功能参数以及所述用户输入的操作信息对应增加至所述语义数据库。
根据本发明提供的具体实施例,本发明的有益效果为:
通过以下几个方面提高了语音交互控制方法及系统的使用便捷性:
(1)全语音操作,所有操作都通过语音方式实现,不需要用手用眼;
(2)随时语音开启操作,通过语音可随时开始新功能的操作,可随时选择不同功能操作,或者选择同一功能的不同执行参数,满足用户的不同需求;
(3)自定义配置语义知识库,可灵活扩展调整语义分析,增加处理执行的功能种类。
(4)操作简单,应用方便。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于语音交互的控制方法实施例1流程图;
图2为本发明基于语音交互的系统结构图;
图3为本发明基于语音交互的控制方法实施例2流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明基于语音交互的控制方法实施例1流程图。如图1所示,实施例1包括:
步骤101:获取唤醒信号,所述唤醒信号用于启动语音交互系统进入语音交互过程,用户可以随时通过语音唤醒控制来启动新的语音交互过程,进行唤醒时,将获取的声音数据流与某一个或多个预存的唤醒词的发声进行比对。例如,唤醒信号可以为“开启语音交互系统”,可以为“启动黑马”,一旦比对成功,则唤醒成功,启动语音交互系统,进入语音交互过程。
步骤102:获取语音信息,启动语音交互系统后,系统持续侦听语音信息;
步骤103:判断侦听到的语音信息是否可以转换成文字信息,生成第一判断结果;当第一判断结果为是时,执行步骤104;当第一判断结果为否时,返回步骤102;
步骤104:对语音信息对应的文字信息进行分析,提取文字信息中相应要操作的功能项以及功能项对应的参数项,每次一分析后,会将分析结果进行存储,并更新当前分析的结果,下一次分析时会依据上次存储的状态,对新的语音输入进行分析。功能参数提取方法可以是提取关键字,也可以是提取正则式;例如,文字信息“我要去天安门”将被提取出功能项为“导航”,参数项为“天安门”。
步骤105:根据提取的功能参数项判断功能参数是否完整,得到第二判断结果,当第二判断结果为否时,执行步骤106;当第二判断结果为是时,执行步骤107;
步骤106:根据缺少的功能参数生成提示问题,并返回步骤102继续获取语音信息。例如分析的语音信息为“我要去”,分析结果为缺少导航的目的地这一参数,生成提示问题可以为“请问您要去哪?”,也可以为“请输入您要去的目的地”。
步骤107:根据分析的功能参数执行相应的操作。例如,“我要去天安门”的分析结果功能项为“导航”,参数项为“天安门”,则开启地图实施导航功能,并指定目的地为天安门。若此时导航路线搜索结果为多种,则会根据导航路线生成选择提示问题向用户提示回复需要进行的操作,例如,去天安门的路线为3条,则生成的选择提示问题可以为“请回复您要选择的路线的选项编号:A、直行500米然后右转行驶1000米到达目的地;B、直行300米然后右转行驶1000米再左转200米到达目的地;C、右转行驶1000米然后左转行驶500米到达目的地”。
步骤108:生成确认消息,所述确认消息用于和用户确认已经执行相应的操作。例如执行操作导航去天安门,生成的确认消息可以为“已为您开启导航至天安门”。
图2为本发明基于语音交互的系统结构图。如图2所示,所述系统包括:语音唤醒模块201、语音交互系统启动模块202、语音信息获取模块203、语音信息判断模块204、语音分析模块205、存储模块206、功能参数判断模块207、提示消息生成模块208、执行模块209、确认消息生成模块2010、语音合成模块2011和语音播放模块2012。
语音唤醒模块201接收唤醒信号,将接收的唤醒信号与系统预存的一个或多个唤醒次进行比对,例如,唤醒信号可以为“开启语音交互系统”,可以为“启动黑马”,比对成功时,则唤醒信号触发语音交互系统启动模块202启动语音交互系统。语音交互系统启动后,语音信息获取模块203持续侦听语音信息,并将侦听到的语音信息传输至语音信息判断模块204,语音信息判断模块204判断传输的语音信息是否能够被转换成文字信息,如果能,则语义信息对应的文字信息传输至语音分析模块205对文字信息进行分析,语音分析模块205根据文字信息提取相应要操作的功能项以及功能项对应的参数项,每次一分析后,会将分析结果存储至存储模块206中,并更新当前分析的结果,下一次分析时会依据上次存储的状态,对新的语音输入进行分析。功能参数提取方法可以是提取关键字,也可以是提取正则式;例如,文字信息“我要去天安门”将被提取出功能项为“导航”,参数项为“天安门”。
功能参数判断模块207根据分析结果判断所述文字信息的功能参数是否完整,如果完整则通过执行模块209执行相应的操作,例如,“我要去天安门”的分析结果功能项为“导航”,参数项为“天安门”,则执行模块209开启地图实施导航功能,并指定目的地为天安门,然后通过确认消息生成模块2010生成确认消息,例如执行操作导航去天安门,生成的确认消息可以为“已为您开启导航至天安门”然后通过语音合成模块2011进行语音合成,通过语音播放模块2012进行语音播放。若此时导航路线搜索结果为多种,则会根据导航路线生成选择提示问题向用户提示回复需要进行的操作,例如,去天安门的路线为3条,则生成的选择提示问题可以为“请回复您要选择的路线的选项编号:A、直行500米然后右转行驶1000米到达目的地;B、直行300米然后右转行驶1000米再左转200米到达目的地;C、右转行驶1000米然后左转行驶500米到达目的地”通过语音合成模块2011进行语音合成,通过语音播放模块2012进行语音播放;如果判断所述文字信息的功能参数是不完整的,则通过提示消息生成模块208根据缺少的功能参数生成提示消息,例如,分析的语音信息为“我要去”,分析结果为缺少导航的目的地这一参数,生成提示问题可以为“请问您要去哪?”,也可以为“请回复您要去的目的地”,然后通过语音合成模块2011进行语音合成,通过语音播放模块2012进行语音播放。
图3为本发明基于语音交互的控制方法实施例2流程图。如图3所示,实施例2包括:
步骤301:唤醒系统,通过唤醒信号唤醒语音交互系统进入语音交互过程,此处设置唤醒信号为“启动语音”,当系统接收到“启动语音”信号时进入语音交互过程;
步骤302:获取语音信息,持续侦听语音信息;
步骤303:判断侦听的语音信息是否可以转换成文字信息,如果能转换成文字信息,执行步骤304;对于不能识别转换为文字信息的语音做丢弃处理,重新侦听语音信息。例如,侦听到鸟叫声,或者风声,都无法转换成相应的文字信息。
步骤304:对于可与转换成文字信息的语音信息,对其对应的文字信息进行分析,提取出相应的操作功能项与参数项;
步骤305:,与系统数据库中预先存储的功能项与参数项进行比对与调用,判断语音信息对应的文字信息中的功能参数是否完整,如果完整,执行步骤306,如果不完整,执行步骤307;
步骤306:根据分析的功能项与参数项调用相应模块,执行相应的操作。对于有歧义的操作,会进一步生成选择问题供用户选择。例如,地名有重复时,“我要去浦江”,由于浙江省金华市有浦江县,四川省成都市有蒲江县,两者名字相近,系统会提示“请您回复目的地的选项编号:A:浙江省金华市有浦江县,B:四川省成都市有蒲江县”。例如,当同时获取两个人语音信息时,“我要去天安门”和“打电话给小明”,系统会生成选择问题“请回复要进行的操作的选项编号:A:导航至天安门,B:打电话给小明”。
步骤307:对不完整的功能参数进行补充,此处包括两种类型,一是语音交互的形式,系统根据缺少的功能参数进行提问,用户语音回复需要进行的操作;二是当语音信息中包括完整的功能参数而分析结果为不完整时,系统提示用户补充语义数据库,语义数据库中存储有功能参数以及与该功能参数相对应的操作,用户可以通过手动输入将该语音信息中完整的功能参数对应增加至系统数据库中。除此之外,本发明的系统可以进行自动更新,实时更新数据库。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种基于语音交互的控制方法,其特征在于,所述方法包括:
在导航场景下,获取唤醒信号,所述唤醒信号用于启动语音交互系统进入语音交互过程;
根据所述唤醒信号,启动所述语音交互系统;
获取语音信息;其中,所述语音交互系统持续侦听语音信息,以实现全语音操作;
判断所述语音信息是否能够被转换成文字信息,得到第一判断结果;
如果所述语音信息不能够被转换成文字信息,则丢弃,重新侦听语音信息;
当所述第一判断结果为是时,对所述语音信息对应的文字信息进行分析,以提取文字信息中相应要操作的功能项以及功能项对应的参数项,并存储分析结果,并更新当前分析的结果,下一次分析时会依据上次存储的状态对新的语音输入进行分析,根据所述分析结果判断所述文字信息的功能参数是否完整,得到第二判断结果;
当所述第二判断结果为是时,则执行所述文字信息功能参数对应的操作,生成确认消息,并根据所述确认消息进行语音信息合成,并播放合成的语音信息;其中,在所述执行所述文字信息功能参数对应的操作之前,还包括:当所述文字信息的功能参数完整且所述文字信息功能参数对应的操作选项多于一个时,生成选择提示问题,并根据所述选择提示问题进行语音信息合成,并播放合成的语音信息,所述选择提示问题用于提示用户选择需要执行的操作选项;所述生成选择提示问题,包括:生成提示用户回复选项编号的消息,每个所述选项编号对应不同的所述操作选项的内容;
当所述第二判断结果为否时,根据缺少的功能参数生成提示消息,并根据所述提示消息进行语音信息合成,并播放合成的语音信息,返回所述获取语音信息步骤;在所述根据缺少的功能参数生成提示消息之后,还包括:当所述语音信息中包括完整的功能参数而所述分析结果为不完整时,提示用户补充语义数据库,以用于将补充的内容增加至所述语义数据库;所述语义数据库中存储有功能参数以及与所述功能参数相对应的操作。
2.根据权利要求1所述的方法,其特征在于,所述根据所述唤醒信号,启动所述语音交互系统具体包括:
将所述唤醒信号与系统预存的唤醒词进行比对;
比对成功后,启动所述语音交互系统。
3.一种基于语音交互的系统,其特征在于,所述系统包括:
语音唤醒模块,用于在导航场景下,获取唤醒信号,所述唤醒信号用于启动系统进入语音交互过程;
语音交互系统启动模块,用于根据所述唤醒信号,启动所述语音交互系统;
语音信息获取模块,用于获取语音信息;其中,所述语音交互系统持续侦听语音信息,以实现全语音操作;
语音信息判断模块,用于判断所述语音信息是否能够被转换成文字信息,得到第一判断结果;如果所述语音信息不能够被转换成文字信息,则丢弃,重新侦听语音信息;
语音分析模块,用于当所述第一判断结果为是时,对所述语音信息对应的文字信息进行分析,以提取文字信息中相应要操作的功能项以及功能项对应的参数项;
存储模块,用于对所述语音信息对应的文字信息进行分析,以提取文字信息中相应要操作的功能项以及功能项对应的参数项,并存储分析结果,并更新当前分析的结果,下一次分析时会依据上次存储的状态对新的语音输入进行分析;
功能参数判断模块,用于根据所述分析结果判断所述文字信息的功能参数是否完整,得到第二判断结果;
执行模块,用于当所述第二判断结果为是时,执行所述文字信息功能参数对应的操作;其中,在所述执行所述文字信息功能参数对应的操作之前,还包括:当所述文字信息的功能参数完整且所述文字信息功能参数对应的操作选项多于一个时,生成选择提示问题,并根据所述选择提示问题进行语音信息合成,并播放合成的语音信息,所述选择提示问题用于提示用户选择需要执行的操作选项;所述生成选择提示问题,包括:生成提示用户回复选项编号的消息,每个所述选项编号对应不同的所述操作选项的内容;
确认消息生成模块,用于生成确认消息;
语音合成模块,用于进行语音信息合成;
语音播放模块,用于播放合成的语音信息;
提示消息生成模块,用于当所述第二判断结果为否时,根据缺少的功能参数生成提示消息,并根据所述提示消息进行语音信息合成,并播放合成的语音信息,返回所述获取语音信息步骤;在所述根据缺少的功能参数生成提示消息之后,还包括:当所述语音信息中包括完整的功能参数而所述分析结果为不完整时,提示用户补充语义数据库,以用于将补充的内容增加至所述语义数据库;所述语义数据库中存储有功能参数以及与所述功能参数相对应的操作。
4.根据权利要求3所述的系统,其特征在于,所述语音交互系统启动模块具体包括:
语音交互系统比对模块,用于将所述唤醒信号与系统预存的唤醒词进行比对;
语音交互系统启动子模块,比对成功后,启动所述语音交互系统。
CN201610736268.0A 2016-08-26 2016-08-26 一种基于语音交互的控制方法及系统 Active CN106205615B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610736268.0A CN106205615B (zh) 2016-08-26 2016-08-26 一种基于语音交互的控制方法及系统
CN202310748193.8A CN116844543A (zh) 2016-08-26 2016-08-26 一种基于语音交互的控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610736268.0A CN106205615B (zh) 2016-08-26 2016-08-26 一种基于语音交互的控制方法及系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202310748193.8A Division CN116844543A (zh) 2016-08-26 2016-08-26 一种基于语音交互的控制方法及系统

Publications (2)

Publication Number Publication Date
CN106205615A CN106205615A (zh) 2016-12-07
CN106205615B true CN106205615B (zh) 2023-06-02

Family

ID=57526871

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310748193.8A Pending CN116844543A (zh) 2016-08-26 2016-08-26 一种基于语音交互的控制方法及系统
CN201610736268.0A Active CN106205615B (zh) 2016-08-26 2016-08-26 一种基于语音交互的控制方法及系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310748193.8A Pending CN116844543A (zh) 2016-08-26 2016-08-26 一种基于语音交互的控制方法及系统

Country Status (1)

Country Link
CN (2) CN116844543A (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106782561A (zh) * 2016-12-09 2017-05-31 深圳Tcl数字技术有限公司 语音识别方法和系统
CN106486122A (zh) * 2016-12-26 2017-03-08 旗瀚科技有限公司 一种智能语音交互机器人
CN106782541A (zh) * 2017-02-24 2017-05-31 太仓市同维电子有限公司 一种带有语音识别功能的家庭网关设计方法
CN109215642A (zh) * 2017-07-04 2019-01-15 阿里巴巴集团控股有限公司 人机会话的处理方法、装置及电子设备
CN107220022A (zh) * 2017-07-07 2017-09-29 上海思依暄机器人科技股份有限公司 一种控制开启导航功能的方法和装置
CN107919130B (zh) * 2017-11-06 2021-12-17 百度在线网络技术(北京)有限公司 基于云端的语音处理方法和装置
CN107910005B (zh) * 2017-11-16 2021-06-01 海信集团有限公司 交互文本的目标业务定位方法及装置
CN108132805B (zh) * 2017-12-20 2022-01-04 深圳Tcl新技术有限公司 语音交互方法、装置及计算机可读存储介质
CN108520748B (zh) 2018-02-01 2020-03-03 百度在线网络技术(北京)有限公司 一种智能设备功能引导方法及系统
CN108320747A (zh) * 2018-02-08 2018-07-24 广东美的厨房电器制造有限公司 家电设备控制方法、设备、终端及计算机可读存储介质
CN108965604A (zh) * 2018-07-25 2018-12-07 安徽新华学院 一种手机用辅助操控系统
CN109697981B (zh) * 2019-01-02 2021-03-09 百度在线网络技术(北京)有限公司 一种语音交互方法、装置、设备及存储介质
CN110033764A (zh) * 2019-03-08 2019-07-19 中国科学院深圳先进技术研究院 无人机的语音控制方法、装置、系统及可读存储介质
CN114485031B (zh) * 2019-03-13 2023-11-14 青岛海尔电冰箱有限公司 用于冰箱的数据交互方法及交互系统
CN111128168A (zh) * 2019-12-30 2020-05-08 斑马网络技术有限公司 语音控制方法、装置及存储介质
CN111866883A (zh) * 2020-06-09 2020-10-30 惠州高盛达科技有限公司 基于语音模块的路由器wifi设置方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1097281A (ja) * 1996-09-19 1998-04-14 Sony Corp 音声認識装置及びナビゲーション装置
US6434524B1 (en) * 1998-09-09 2002-08-13 One Voice Technologies, Inc. Object interactive user interface using speech recognition and natural language processing
US7676026B1 (en) * 2005-03-08 2010-03-09 Baxtech Asia Pte Ltd Desktop telephony system

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19615693C1 (de) * 1996-04-19 1997-12-11 Siemens Ag Vorrichtung und Verfahren zur Aktionsermittlung
US6964023B2 (en) * 2001-02-05 2005-11-08 International Business Machines Corporation System and method for multi-modal focus detection, referential ambiguity resolution and mood classification using multi-modal input
US20050065779A1 (en) * 2001-03-29 2005-03-24 Gilad Odinak Comprehensive multiple feature telematics system
CN102469363A (zh) * 2010-11-11 2012-05-23 Tcl集团股份有限公司 带有语音评论功能的电视系统及语音评论方法
WO2014144949A2 (en) * 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
CN103281223B (zh) * 2013-05-15 2016-05-25 五邑大学 一种现代化的智能家居安防系统
CN204390737U (zh) * 2014-07-29 2015-06-10 科大讯飞股份有限公司 一种家庭语音处理系统
CN105739977A (zh) * 2016-01-26 2016-07-06 北京云知声信息技术有限公司 一种语音交互设备的唤醒方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1097281A (ja) * 1996-09-19 1998-04-14 Sony Corp 音声認識装置及びナビゲーション装置
US6434524B1 (en) * 1998-09-09 2002-08-13 One Voice Technologies, Inc. Object interactive user interface using speech recognition and natural language processing
US7676026B1 (en) * 2005-03-08 2010-03-09 Baxtech Asia Pte Ltd Desktop telephony system

Also Published As

Publication number Publication date
CN106205615A (zh) 2016-12-07
CN116844543A (zh) 2023-10-03

Similar Documents

Publication Publication Date Title
CN106205615B (zh) 一种基于语音交互的控制方法及系统
CN109326289B (zh) 免唤醒语音交互方法、装置、设备及存储介质
CN107370649B (zh) 家电控制方法、系统、控制终端、及存储介质
CN106297789B (zh) 智能机器人的个性化交互方法及交互系统
CN111835986B (zh) 视频编辑处理方法、装置及电子设备
KR102112814B1 (ko) 다이얼로그 시스템들에서의 파라미터 수집 및 자동 다이얼로그 생성
JP2020064616A (ja) 仮想ロボットのインタラクション方法、装置、記憶媒体及び電子機器
KR20200012933A (ko) 어시스턴트 애플리케이션을 위한 음성 사용자 인터페이스 단축
CN106406806A (zh) 一种用于智能设备的控制方法及装置
CN107340865A (zh) 多模态虚拟机器人交互方法和系统
CN106463110A (zh) 信息处理设备、信息处理方法和程序
CN107004410A (zh) 语音和连接平台
CN105391730A (zh) 一种信息反馈方法、装置及系统
CN111949240A (zh) 交互方法、存储介质、服务程序和设备
CN109996026B (zh) 基于穿戴式设备的视频特效互动方法、装置、设备及介质
CN110851221B (zh) 一种智慧家居场景配置的方法及装置
CN110808038A (zh) 普通话评测方法、装置、设备及存储介质
CN115327932A (zh) 场景创建方法、装置、电子设备及存储介质
CN110992937A (zh) 语言离线识别方法、终端及可读存储介质
CN110097884A (zh) 一种语音交互方法和装置
CN113593595A (zh) 基于人工智能的语音降噪方法、装置及电子设备
CN111933135A (zh) 终端控制方法、装置、智能终端及计算机可读存储介质
CN105529025B (zh) 一种语音操作输入方法及电子设备
CN110310648A (zh) 移动终端的控制方法、装置、移动终端及可读存储介质
CN105376416A (zh) 一种通话终端的控制方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant