CN104575501A - 一种收音机语音操控指令解析方法及系统 - Google Patents

一种收音机语音操控指令解析方法及系统 Download PDF

Info

Publication number
CN104575501A
CN104575501A CN201510026115.2A CN201510026115A CN104575501A CN 104575501 A CN104575501 A CN 104575501A CN 201510026115 A CN201510026115 A CN 201510026115A CN 104575501 A CN104575501 A CN 104575501A
Authority
CN
China
Prior art keywords
data
text data
radio
user
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510026115.2A
Other languages
English (en)
Other versions
CN104575501B (zh
Inventor
赵奇猛
刘升平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Beijing Yunzhisheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunzhisheng Information Technology Co Ltd filed Critical Beijing Yunzhisheng Information Technology Co Ltd
Priority to CN201510026115.2A priority Critical patent/CN104575501B/zh
Publication of CN104575501A publication Critical patent/CN104575501A/zh
Application granted granted Critical
Publication of CN104575501B publication Critical patent/CN104575501B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

本发明涉及语音操控技术领域,尤其涉及收音机语音操控指令解析方法及系统。收音机语音操控指令解析方法,包括:将用户发送的用于操控收音机动作的语音数据转换为文本数据;对文本数据进行实体识别;对实体识别后的文本数据进行语义解析,得到结构化字段;根据结构化字段及用户数据,从数据库中获取相应的动作数据进行收音机动作响应。本发明的收音机语音操控指令解析方法及系统,基于语音方式实现对收音机的操控,从而进一步满足用户对收音机的实际操控使用需求。

Description

一种收音机语音操控指令解析方法及系统
技术领域
本发明涉及语音操控技术领域,具体而言,涉及一种收音机语音操控指令解析方法及系统。
背景技术
随着科学技术的发展,收音机的使用深入到人们生活的各个方面,例如在车载终端及移动终端中一般均设置有收音机。
当前,操控收音机的方式均为手动方式,在设置有收音机的终端设备上至少包括开启/关闭收音机的开关、搜索电台/频道的部件,其中所述开关及部件可以选择以旋钮、按键或触摸等方式实现。用户在使用收音机时,手动开启开关,并手动搜索电台。
上述手动操控收音机的方式,搜索频道效率比较低,且在车载环境中还会造成一定的安全隐患,由此看出相关技术中手动操控收音机的方式不满足用户的实际使用需求。
发明内容
本发明的目的在于提供收音机语音操控指令解析方法及系统,以基于语音方式实现对收音机的操控,从而进一步满足用户对收音机的实际操控使用需求。
本发明实施例提供了一种收音机语音操控指令解析方法,包括:将用户发送的用于操控收音机动作的语音数据转换为文本数据;对所述文本数据进行实体识别;对所述实体识别后的文本数据进行语义解析,得到结构化字段;根据所述结构化字段及用户数据,从数据库中获取相应的动作数据进行收音机动作响应。
优选地,所述将用户发送的用于操控收音机动作的语音数据转换为文本数据,包括:调用语音云开放平台,利用所述语音云开放平台将所述语音数据转换为文本数据。
优选地,所述对所述文本数据进行实体识别,包括:利用预先训练好的条件随机场模型对所述文本数据进行分词及标注。
优选地,该方法中对所述训练得到所述条件随机场模型,包括:对待训练的文本数据按照电台、频道和/或频率进行分词及标注,得到标注语料;利用条件随机场对所述标注语料进行训练,得到所述条件随机场模型。
优选地,所述对所述实体识别后的文本数据进行语义解析,得到结构化字段,包括:将所述实体识别后的文本数据与预设的规则模板进行匹配,得到所述结构化字段;其中所述规则模板包括:完全字面模板、包含变量模板及包含通配符模板;所述结构化字段包括:电台、频道、频道类别、单位和/或频率。
优选地,所述将所述实体识别后的文本数据与预设的规则模板进行匹配之前,还包括:对所述文本数据进行标准化和冗余消除,其中包括对所述文本数据中的局部文字进行置信度高的局部替换以及去除所述文本数据中的噪音字符。
优选地,所述根据所述结构化字段及用户数据,从数据库中获取相应的动作数据进行收音机动作响应,包括:
当所述文本数据中包含频率字段时,通过索引从数据库中获取所有满足所述频率字段的第一候选数据;根据用户的位置信息对所述第一候选数据进行排序;依据所述排序的结果选取相应的广播数据进行播放;
当所述文本数据中仅包含电台和/或频道字段时,通过索引从数据库中获取所有满足所述电台或频道字段的第二候选数据;根据用户的位置信息对所述第二候选数据进行排序,依据所述排序的结果选取相应的广播数据进行播放。
优选地,当所述用户数据中仅包含所述位置信息时,所述数据库为通用数据库;当所述用户数据包含所述位置信息及电台数据时,所述数据库为包含所述电台数据的用户数据库。
本发明实施例还提供了一种收音机语音操控指令解析系统,包括:语音识别模块,用于将用户发送的用于操控收音机动作的语音数据转换为文本数据;实体识别模块,用于对所述文本数据进行实体识别;语义解析模块,用于对所述实体识别后的文本数据进行语义解析,得到结构化字段;数据获取模块,用于根据所述结构化字段,从数据库中获取相应的动作数据进行收音机动作响应。
优选地,该系统还包括:冗余消除模块,用于将所述实体识别后的文本数据与预设的规则模板进行匹配之前,对所述文本数据进行标准化和冗余消除,其中包括对所述文本数据中的局部文字进行置信度高的局部替换以及去除所述文本数据中的噪音字符。
基于本发明实施例的收音机语音操控指令解析方法及系统能够实现对收音机的语音操控,相对于手动操控,此种操控方式更加便携,更能满足用户对收音机的实际操控使用需求。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例中收音机语音操控指令解析方法的流程图;
图2示出了本发明实施例中收音机语音操控指令解析系统的一种结构示意图;
图3示出了本发明实施例中收音机语音操控指令解析系统的另一种结构示意图;
图4示出了本发明实施例中语义解析过程的一种流程图;
图5示出了本发明实施例中语义解析过程的另一种流程图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
鉴于相关技术中,以手动方式对收音机进行操控会带来诸多不便,如搜索电台频道时,搜索效率比较低;又例如,在车载环境中手动操控收音机可能会带来一定的安全隐患。
为了使收音机的操控简单便捷,本发明中提出了一种基于语音操控收音机的方式,并具体提供了收音机语音操控指令解析方法,如图1所示,该方法的主要处理步骤包括:
步骤S11:将用户发送的用于操控收音机动作的语音数据转换为文本数据;
步骤S12:对文本数据进行实体识别;
步骤S13:对实体识别后的文本数据进行语义解析,得到结构化字段;
步骤S14:根据结构化字段,从数据库中获取相应的动作数据进行收音机动作响应。
利用该方法能够实现对收音机的语音操控,在搜索频道时用户说出电台/频道名称,或者频道类型,即能返回相应的广播数据,提高了电台/频道搜索的效率,且在车载环境中,用户通过语音操控收音机,存在的安全隐患大大降低。
本发明实施例的收音机语音操控指令解析方法中,将用户发送的用于操控收音机动作的语音数据转换为文本数据,包括:调用语音云开放平台,利用语音云开放平台将语音数据转换为文本数据。在利用语音云开发平台将语音数据转换为文本数据的过程中,可以借助深度神经网络、自适应训练以及大规模网络动态解码等技术和大规模语料支持,将用户发出的语音数据准确转换为文本数据,通过选择合适的语音云开发平台能够使中文连续语音识别的准确率达到96%以上,实时率达到0.15倍实时。
该方法中在对文本数据进行实体识别时,优选可以采用预先训练好的条件随机场模型对文本数据进行分词及标注。
其中,实体是命名实体的简称,命名实体识别的任务被定义为识别出文本数据中出现的专有名称和有意义的数量短语并对其进行归类。
得到上述条件随机场模型的方法为:对待训练的文本数据按照电台、频道和/或频率进行分词及标注,得到标注语料;利用条件随机场对标注语料进行训练,得到条件随机场模型,需要强调的是标注语料中包含噪音和asr识别错误的句子,如“收听普通广播频道”,正确的是“浦东广播频道”,因为噪音或者说话者不标准导致的语音识别错误。也即,该模型抗噪、兼容语音识别错误。
例如,待训练的文本数据为“我想听中央人民广播电台”,首先对该文本数据进行分词及标注为“我想听中央人民广播电台/org”,利用条件随机场对该标注语料进行训练,得到条件随机场模型。当接收到与用户操控对应的文本数据后,如“我想听中央人民广播电台第三套节目音乐之声”,利用条件随机场模型对新接收到的文本进行分词标注为“我想听中央人民广播电台/station第三套节目音乐之声/channel。
在语音解析过程中,对实体进行识别有利于规则的抽象,缩小了匹配的规则空间,提高了匹配的效率。
对文本数据进行实体识别后,对文本数据进行语义解析,得到结构化字段,其中需要解析出来的结构化字段包括:station(电台)、channel(频道)、frequency(频率)、type(AM或FM)及unit(单位,如兆赫兹、赫兹)。
对文本数据进行语义解析的方法包括:将实体识别后的文本数据与预设的规则模板进行匹配,得到结构化字段;其中规则模板包括:完全字面模板、包含变量模板及包含通配符模板。
如:“收听中华之声”,解析结果为:
{"rc":0,"service":"cn.yunzhisheng.broadcast","semantic":{"intent":{"station":"中央人民广播电台","channelList":[{"channel":"中央人民广播电台第五套节目中华之声","frequencyList":[{"frequency":"765","type":"AM","unit":"KHz"},{"frequency":"837","type":"AM","unit":"KHz"}]}]}}}。
本方法中语义解析的结果是通过匹配规则来获取。依据实体识别来索引候选待匹配的规则,规则分三类:完全字面模版(如,“^【打开】【收音机】$”)、包含变量模版(如,“^【打开】?【一下】?%station%【电台】?$”)、包含通配符模版(如,“【打开】(.*?)【数字】【FM】”),不同类型的模版匹配优先级是:字面模版>变量模版>通配符模版;每个模版都有对应的语义解析结构。如果规则精确匹配不上,触发规则相似度计算进行匹配。最终解析出如station(电台)、channel(频道)、category(频道类别)等字段。其中带有标记的【打开】是同义词、近义词变量。
在将实体识别后的文本数据与预设的规则模板进行匹配之前,需要对文本数据进行标准化和冗余消除,其中包括对文本数据中的局部文字进行置信度高的局部替换以及去除文本数据中的噪音字符。
本方法中,根据结构化字段及用户数据,从数据库中获取相应的动作数据进行收音机动作响应,包括:当文本数据中包含频率字段时,通过索引从数据库中获取所有满足频率字段的第一候选数据;根据用户的位置信息对第一候选数据进行排序;依据排序的结果选取相应的广播数据进行播放;
当文本数据中仅包含电台和/或频道字段时,通过索引从数据库中获取所有满足电台或频道字段的第二候选数据;根据用户的位置信息对第二候选数据进行排序,依据排序的结果选取相应的广播数据进行播放。
其中上述的用户的位置信息为包含于用户数据中的信息,当所述用户数据中仅包含所述位置信息时,所述数据库为通用数据库;当所述用户数据包含所述位置信息及电台数据时,所述数据库为包含所述电台数据的用户数据库。
本发明实施例还提供了一种收音机语音操控指令解析系统,如图2所示,包括:
语音识别模块21,用于将用户发送的用于操控收音机动作的语音数据转换为文本数据;
实体识别模块22,用于对文本数据进行实体识别;
语义解析模块23,用于对实体识别后的文本数据进行语义解析,得到结构化字段;
数据获取模块24,用于根据结构化字段,从数据库中获取相应的动作数据进行收音机动作响应。
该系统还包括:冗余消除模块,用于将实体识别后的文本数据与预设的规则模板进行匹配之前,对文本数据进行标准化和冗余消除,其中包括对文本数据中的局部文字进行置信度高的局部替换以及去除文本数据中的噪音字符。
本发明还提供了一种收音机语音操控指令解析方法及系统的优选实施方式,以下将结合图3-图5进行详细说明。
如图3所示,收音机语音操控指令解析系统中包括语音识别模块21、实体识别模块22、语义解析模块23及数据获取模块24,语音识别模块21将用户发送的用于操控收音机动作的语音数据转换为文本数据;实体识别模块22从模型库中调取条件随机场模型对文本数据进行实体识别;语义解析模块23从规则库中调取预先设定的规则模板对实体识别后的文本数据进行语义解析,得到结构化字段;数据获取模块24根据结构化字段及用户数据从数据库中获取输出相应的广播数据。
其中在用户数据可以仅包含用户的位置信息,也可以同时包含用户的位置信息及电台数据,以下将对该两种情况进行分别说明。
1、用户数据仅有位置信息(用户GPS数据)的情况,如图4所示:
a)解析出来的结构化字段中包含频率字段:频率字段如果没有单位和类型,根据其所属范围来确定它的单位和类型。接着通过索引从设备可接收频道数据中获取所有满足频率的候选数据,依据用户GPS和可能包含的电台或频道字段对候选数据进行排序。具体排序原则是,如果有电台或频道字段,则用其对候选数据进行过滤,在过滤结果中城市距离较近的优先选取。其中首都、直辖市、省会、重要城市与其他城市计算距离是相应减去一段距离。如果最后结果获取的城市与用户GPS数据不一致,则提示用户选取的是其他城市的频道。
b)解析出来的结构化字段中没有频率字段,但包含电台或频道字段;首先根据编辑距离判断该字段是属于电台还是频道,编辑距离不仅是字面的,还包括拼音的,该步骤是针对实体可能识别错误和语音识别错误情况进行的处理,当电台station或频道channel能够完全匹配时,则无需进一步区分电台station或频道channel。
确定了字段,用相应字段索引选出候选数据,通过类型字段过滤不符合条件的。再根据用户GPS数据定位所在城市,依据距离对候选结果进行排序,如果是属于电台,则只能用第一个电台名对之后的数据进行过滤。如果包含类别,则按照类别的编辑距离进行排序,获取广播数据。
2、用户数据包含电台数据的情况,如图5所示:
a)解析出来的结构化字段中包含频率字段:如果没有单位和类型,根据其所属范围来确定它的单位和类型。以用户数据库作为基础索引库,索引到所有满足频率的候选数据,依据用户GPS数据和可能包含的电台或频道字段对候选数据进行排序。具体排序原则是,如果有电台或频道字段,则用其对候选进行过滤,在过滤结果中城市距离较近的优先选取。其中首都、直辖市、省会、重要城市与其他城市计算距离是相应减去一段距离。如果最后结果获取的城市与用户GPS数据不一致,则提示用户选取的是其他城市的频道。
b)解析出来的结构化字段中没有频率字段,但包含电台或频道字段;首先根据编辑距离在通用数据库中判断该字段是属于电台还是频道,编辑距离不仅是字面的,还包括拼音的,该步骤是针对实体可能识别错误和语音识别错误情况进行的处理,当电台station或频道channel能够完全匹配时,则无需进一步区分电台station或频道channel。
确定了字段,以用户数据库作为基础索引库,用相应字段索引选出候选数据,通过类型字段过滤不符合条件的。再根据用户GPS数据定位所在城市,依据距离对候选结果进行排序,如果是属于电台,则只能用第一个电台名对之后的数据进行过滤。如果包含类别,则按照类别的编辑距离进行排序,获取广播数据。
本发明中,电台和频道是一对多的关系,如,“中央人民广播电台”下面有“音乐之声频道、都市之声频道、神州之声频道等”,每一个频道又有多个频率。频率又分AM和FM以及cable fm(有线调频)。
用第一个电台名对之后的数据进行过滤包括:电台排序之后有多个电台,取第一个电台,按照约束条件对所有该电台下的频道、频率进行过滤,如“北京电台FM”就会过滤掉不是FM的频率。
基于本发明的所述方法能够实现对收音机的语音操控,提高电台/频道搜索的效率,且在车载环境中,用户通过语音操控收音机,存在的安全隐患大大降低。
进一步,本发明在语义解析前进行了噪音和冗余的处理,有效地减少了规则编写的工作量;对规则进一步抽象,抽象出命名实体,匹配之前先进行命名实体识别。结合广播数据,考虑了距离因素,使返回结果更符合用户的期望,一定程度上支持用户随意请求,精确的或模糊的请求。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.收音机语音操控指令解析方法,其特征在于,包括:
将用户发送的用于操控收音机动作的语音数据转换为文本数据;
对所述文本数据进行实体识别;
对所述实体识别后的文本数据进行语义解析,得到结构化字段;
根据所述结构化字段及用户数据,从数据库中获取相应的动作数据进行收音机动作响应。
2.根据权利要求1所述的方法,其特征在于,所述将用户发送的用于操控收音机动作的语音数据转换为文本数据,包括:
调用语音云开放平台,利用所述语音云开放平台将所述语音数据转换为文本数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述文本数据进行实体识别,包括:
利用预先训练好的条件随机场模型对所述文本数据进行分词及标注。
4.根据权利要求3所述的方法,其特征在于,该方法中对所述训练得到所述条件随机场模型,包括:
对待训练的文本数据按照电台、频道和/或频率进行分词及标注,得到标注语料;
利用条件随机场对所述标注语料进行训练,得到所述条件随机场模型。
5.根据权利要求1所述的方法,其特征在于,所述对所述实体识别后的文本数据进行语义解析,得到结构化字段,包括:
将所述实体识别后的文本数据与预设的规则模板进行匹配,得到所述结构化字段;
其中所述规则模板包括:完全字面模板、包含变量模板及包含通配符模板;
所述结构化字段包括:电台、频道、频道类别、单位和/或频率。
6.根据权利要求5所述的方法,其特征在于,所述将所述实体识别后的文本数据与预设的规则模板进行匹配之前,还包括:
对所述文本数据进行标准化和冗余消除,其中包括对所述文本数据中的局部文字进行置信度高的局部替换以及去除所述文本数据中的噪音字符。
7.根据权利要求1所述的方法,其特征在于,所述根据所述结构化字段及用户数据,从数据库中获取相应的动作数据进行收音机动作响应,包括:
当所述文本数据中包含频率字段时,通过索引从数据库中获取所有满足所述频率字段的第一候选数据;根据用户的位置信息对所述第一候选数据进行排序;依据所述排序的结果选取相应的广播数据进行播放;
当所述文本数据中仅包含电台和/或频道字段时,通过索引从数据库中获取所有满足所述电台或频道字段的第二候选数据;根据用户的位置信息对所述第二候选数据进行排序,依据所述排序的结果选取相应的广播数据进行播放。
8.根据权利要求7所述的方法,其特征在于,当所述用户数据中仅包含所述位置信息时,所述数据库为通用数据库;
当所述用户数据包含所述位置信息及电台数据时,所述数据库为包含所述电台数据的用户数据库。
9.收音机语音操控指令解析系统,其特征在于,包括:
语音识别模块,用于将用户发送的用于操控收音机动作的语音数据转换为文本数据;
实体识别模块,用于对所述文本数据进行实体识别;
语义解析模块,用于对所述实体识别后的文本数据进行语义解析,得到结构化字段;
数据获取模块,用于根据所述结构化字段及用户数据,从数据库中获取相应的动作数据进行收音机动作响应。
10.根据权利要求9所述的系统,其特征在于,该系统还包括:冗余消除模块,用于将所述实体识别后的文本数据与预设的规则模板进行匹配之前,对所述文本数据进行标准化和冗余消除,其中包括对所述文本数据中的局部文字进行置信度高的局部替换以及去除所述文本数据中的噪音字符。
CN201510026115.2A 2015-01-19 2015-01-19 一种收音机语音操控指令解析方法及系统 Active CN104575501B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510026115.2A CN104575501B (zh) 2015-01-19 2015-01-19 一种收音机语音操控指令解析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510026115.2A CN104575501B (zh) 2015-01-19 2015-01-19 一种收音机语音操控指令解析方法及系统

Publications (2)

Publication Number Publication Date
CN104575501A true CN104575501A (zh) 2015-04-29
CN104575501B CN104575501B (zh) 2017-11-03

Family

ID=53091401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510026115.2A Active CN104575501B (zh) 2015-01-19 2015-01-19 一种收音机语音操控指令解析方法及系统

Country Status (1)

Country Link
CN (1) CN104575501B (zh)

Cited By (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105245800A (zh) * 2015-10-30 2016-01-13 宁波萨瑞通讯有限公司 一种无线数据广播系统的播放方法、系统及无线电播放器
CN106126080A (zh) * 2016-06-22 2016-11-16 北京云知声信息技术有限公司 语音管理方法及装置
CN106341204A (zh) * 2016-09-29 2017-01-18 北京小米移动软件有限公司 音频处理方法及装置
CN107391487A (zh) * 2017-07-26 2017-11-24 北京小米移动软件有限公司 基于批量事件的设备控制方法及装置、电子设备
CN108417205A (zh) * 2018-01-19 2018-08-17 苏州思必驰信息科技有限公司 语义理解训练方法和系统
CN108650622A (zh) * 2018-05-09 2018-10-12 爱驰汽车有限公司 行车状态下与广播的交互方法、系统、设备及存储介质
CN108701459A (zh) * 2015-12-01 2018-10-23 纽昂斯通讯公司 将来自各种语音服务的结果表示为统一概念知识库
CN109192201A (zh) * 2018-09-14 2019-01-11 苏州亭云智能科技有限公司 基于双模型识别的语音领域命令理解方法
CN109313719A (zh) * 2016-03-18 2019-02-05 谷歌有限责任公司 使用神经网络生成文本段的依存性解析
CN109523996A (zh) * 2017-09-18 2019-03-26 通用汽车环球科技运作有限责任公司 通过无线电广播的持续性训练和发音改进
CN110047489A (zh) * 2019-04-04 2019-07-23 科讯嘉联信息技术有限公司 一种家电报装场景智能录入报装时间的方法及系统
US10453244B2 (en) 2016-10-07 2019-10-22 Sony Corporation Multi-layer UV map based texture rendering for free-running FVV applications
CN110459224A (zh) * 2019-07-31 2019-11-15 北京百度网讯科技有限公司 语音识别结果处理方法、装置、计算机设备及存储介质
CN110622241A (zh) * 2017-05-15 2019-12-27 苹果公司 用于数字助理的分级信度状态
CN110688859A (zh) * 2019-09-18 2020-01-14 平安科技(深圳)有限公司 基于机器学习的语义解析方法、装置、介质及电子设备
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US10984798B2 (en) 2018-06-01 2021-04-20 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US11321116B2 (en) 2012-05-15 2022-05-03 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11670289B2 (en) 2014-05-30 2023-06-06 Apple Inc. Multi-command single utterance input method
US11675829B2 (en) 2017-05-16 2023-06-13 Apple Inc. Intelligent automated assistant for media exploration
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11853647B2 (en) 2015-12-23 2023-12-26 Apple Inc. Proactive assistance based on dialog communication between devices
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1416112A (zh) * 2001-11-02 2003-05-07 松下电器产业株式会社 利用语音识别的选台装置及其控制方法
CN101465993A (zh) * 2007-12-20 2009-06-24 艾科星科技公司 用于呈现关于可用节目编制的信息的接收装置和方法
JP2009280048A (ja) * 2008-05-21 2009-12-03 Denso Corp 音声操作認識装置
CN201577086U (zh) * 2009-12-16 2010-09-08 深圳市凯隆电子有限公司 无按键语音识别控制的无线载波信号接收处理装置
CN202221994U (zh) * 2011-08-25 2012-05-16 深圳市索菱实业股份有限公司 一种语音控制的车载收音机
CN103188026A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音式广播控制装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1416112A (zh) * 2001-11-02 2003-05-07 松下电器产业株式会社 利用语音识别的选台装置及其控制方法
CN101465993A (zh) * 2007-12-20 2009-06-24 艾科星科技公司 用于呈现关于可用节目编制的信息的接收装置和方法
JP2009280048A (ja) * 2008-05-21 2009-12-03 Denso Corp 音声操作認識装置
CN201577086U (zh) * 2009-12-16 2010-09-08 深圳市凯隆电子有限公司 无按键语音识别控制的无线载波信号接收处理装置
CN202221994U (zh) * 2011-08-25 2012-05-16 深圳市索菱实业股份有限公司 一种语音控制的车载收音机
CN103188026A (zh) * 2011-12-28 2013-07-03 上海博泰悦臻电子设备制造有限公司 语音式广播控制装置

Cited By (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11979836B2 (en) 2007-04-03 2024-05-07 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11321116B2 (en) 2012-05-15 2022-05-03 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11636869B2 (en) 2013-02-07 2023-04-25 Apple Inc. Voice trigger for a digital assistant
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US11670289B2 (en) 2014-05-30 2023-06-06 Apple Inc. Multi-command single utterance input method
US11699448B2 (en) 2014-05-30 2023-07-11 Apple Inc. Intelligent assistant for home automation
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
CN105245800A (zh) * 2015-10-30 2016-01-13 宁波萨瑞通讯有限公司 一种无线数据广播系统的播放方法、系统及无线电播放器
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
CN108701459A (zh) * 2015-12-01 2018-10-23 纽昂斯通讯公司 将来自各种语音服务的结果表示为统一概念知识库
US11853647B2 (en) 2015-12-23 2023-12-26 Apple Inc. Proactive assistance based on dialog communication between devices
CN109313719A (zh) * 2016-03-18 2019-02-05 谷歌有限责任公司 使用神经网络生成文本段的依存性解析
CN109313719B (zh) * 2016-03-18 2022-03-22 谷歌有限责任公司 使用神经网络生成文本段的依存性解析
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11657820B2 (en) 2016-06-10 2023-05-23 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
CN106126080A (zh) * 2016-06-22 2016-11-16 北京云知声信息技术有限公司 语音管理方法及装置
CN106126080B (zh) * 2016-06-22 2019-08-16 北京云知声信息技术有限公司 语音管理方法及装置
CN106341204A (zh) * 2016-09-29 2017-01-18 北京小米移动软件有限公司 音频处理方法及装置
CN106341204B (zh) * 2016-09-29 2019-02-22 北京小米移动软件有限公司 音频处理方法及装置
US10453244B2 (en) 2016-10-07 2019-10-22 Sony Corporation Multi-layer UV map based texture rendering for free-running FVV applications
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US11862151B2 (en) 2017-05-12 2024-01-02 Apple Inc. Low-latency intelligent automated assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
CN110622241A (zh) * 2017-05-15 2019-12-27 苹果公司 用于数字助理的分级信度状态
CN110622241B (zh) * 2017-05-15 2021-04-02 苹果公司 用于数字助理的分级信度状态
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US11675829B2 (en) 2017-05-16 2023-06-13 Apple Inc. Intelligent automated assistant for media exploration
CN107391487A (zh) * 2017-07-26 2017-11-24 北京小米移动软件有限公司 基于批量事件的设备控制方法及装置、电子设备
CN109523996A (zh) * 2017-09-18 2019-03-26 通用汽车环球科技运作有限责任公司 通过无线电广播的持续性训练和发音改进
CN108417205A (zh) * 2018-01-19 2018-08-17 苏州思必驰信息科技有限公司 语义理解训练方法和系统
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
CN108650622A (zh) * 2018-05-09 2018-10-12 爱驰汽车有限公司 行车状态下与广播的交互方法、系统、设备及存储介质
US11630525B2 (en) 2018-06-01 2023-04-18 Apple Inc. Attention aware virtual assistant dismissal
US10984798B2 (en) 2018-06-01 2021-04-20 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11360577B2 (en) 2018-06-01 2022-06-14 Apple Inc. Attention aware virtual assistant dismissal
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
CN109192201A (zh) * 2018-09-14 2019-01-11 苏州亭云智能科技有限公司 基于双模型识别的语音领域命令理解方法
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
CN110047489A (zh) * 2019-04-04 2019-07-23 科讯嘉联信息技术有限公司 一种家电报装场景智能录入报装时间的方法及系统
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
CN110459224A (zh) * 2019-07-31 2019-11-15 北京百度网讯科技有限公司 语音识别结果处理方法、装置、计算机设备及存储介质
CN110459224B (zh) * 2019-07-31 2022-02-25 北京百度网讯科技有限公司 语音识别结果处理方法、装置、计算机设备及存储介质
CN110688859A (zh) * 2019-09-18 2020-01-14 平安科技(深圳)有限公司 基于机器学习的语义解析方法、装置、介质及电子设备
WO2021051565A1 (zh) * 2019-09-18 2021-03-25 平安科技(深圳)有限公司 基于机器学习的语义解析方法、装置、电子设备及计算机非易失性可读存储介质
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11924254B2 (en) 2020-05-11 2024-03-05 Apple Inc. Digital assistant hardware abstraction
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11750962B2 (en) 2020-07-21 2023-09-05 Apple Inc. User identification using headphones
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones

Also Published As

Publication number Publication date
CN104575501B (zh) 2017-11-03

Similar Documents

Publication Publication Date Title
CN104575501A (zh) 一种收音机语音操控指令解析方法及系统
CN107665710B (zh) 移动终端语音数据处理方法及装置
CN101272416B (zh) 使用拒绝参考的语音拨号
CN105374356B (zh) 语音识别方法、语音评分方法、语音识别系统及语音评分系统
DE102018128006A1 (de) Natürlichsprachliche generierung basierend auf dem benutzersprachstil
CN103903611B (zh) 一种语音信息的识别方法和设备
CN105895103A (zh) 一种语音识别方法及装置
CN108388638B (zh) 语义解析方法、装置、设备及存储介质
CN106816149A (zh) 车辆自动语音识别系统的优先化内容加载
CN103810998B (zh) 基于移动终端设备的离线语音识别方法以及实现方法
CN102802114A (zh) 利用语音进行座席筛选的方法及系统
CN108766428A (zh) 一种语音播报控制方法及系统
CN109801628B (zh) 一种语料收集方法、装置及系统
CN105427858A (zh) 实现语音自动分类的方法及系统
CN108074576A (zh) 审讯场景下的说话人角色分离方法及系统
CN105096942A (zh) 语义分析方法和装置
CN103456301A (zh) 一种基于环境声音的场景识别方法及装置及移动终端
CN104485107B (zh) 名称的语音识别方法、语音识别系统和语音识别设备
CN110866100B (zh) 一种话术泛化方法、装置及电子设备
CN111916088B (zh) 一种语音语料的生成方法、设备及计算机可读存储介质
CN103219007A (zh) 语音识别方法及装置
CN102236639A (zh) 更新语言模型的系统和方法
CN109360565A (zh) 一种通过建立资源库提高语音识别精度的方法
CN111178081A (zh) 语义识别的方法、服务器、电子设备及计算机存储介质
CN106356054A (zh) 一种基于语音识别的农产品信息采集方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100000 Beijing, Huayuan Road, Haidian District No. 2 peony technology building, five floor, A503

Patentee after: Yunzhisheng Intelligent Technology Co., Ltd.

Address before: 100000 Beijing, Huayuan Road, Haidian District No. 2 peony technology building, five floor, A503

Patentee before: Beijing Yunzhisheng Information Technology Co., Ltd.