CN110795532A - 一种语音信息的处理方法、装置、智能终端以及存储介质 - Google Patents

一种语音信息的处理方法、装置、智能终端以及存储介质 Download PDF

Info

Publication number
CN110795532A
CN110795532A CN201910994726.4A CN201910994726A CN110795532A CN 110795532 A CN110795532 A CN 110795532A CN 201910994726 A CN201910994726 A CN 201910994726A CN 110795532 A CN110795532 A CN 110795532A
Authority
CN
China
Prior art keywords
recognition information
information
knowledge
voice recognition
structured query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910994726.4A
Other languages
English (en)
Inventor
胡广绪
宋德超
贾巨涛
吴伟
赵鹏辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Zhuhai Lianyun Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai, Zhuhai Lianyun Technology Co Ltd filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201910994726.4A priority Critical patent/CN110795532A/zh
Publication of CN110795532A publication Critical patent/CN110795532A/zh
Priority to PCT/CN2020/112928 priority patent/WO2021073298A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation

Abstract

本申请公开了一种语音信息的处理方法、装置、智能终端以及存储介质,涉及机器学习技术领域,该方法包括:将接收到的非结构化语音识别信息转化为结构化的查询语句,其中,所述非结构化语音识别信息是通过语音识别得到的;通过构建的知识图谱模型提取所述语音识别信息的相关知识事实,并将所述相关知识事实进行存储;根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图。通过该方法可以解决相关技术中存在的当用户获取数据时,往往会出现多个返回结果,出现“一词多义”、“一义多词”现象,从而不能真正理解用户所提出的问题,无法做到精确识别理解用户意图的问题。

Description

一种语音信息的处理方法、装置、智能终端以及存储介质
技术领域
本申请涉及机器学习领域,尤其涉及一种语音信息的处理方法、装置、智能终端以及存储介质。
背景技术
当前随着物联网的快速发展,语音交互机制由于简单、快捷、交互性好等优点,越来越多的设备采用语音交互,并且逐渐成为人们的首选方式。但是发明人发现,目前存在一个问题就是当用户获取数据时,往往会出现多个返回结果,出现“一词多义”、“一义多词”现象,从而不能真正理解用户所提出的问题,无法做到精确识别理解用户意图。
发明内容
本申请实施例提供一种语音信息的处理方法、装置、智能终端以及存储介质,用以解决相关技术中当用户获取数据时,往往会出现多个返回结果,出现“一词多义”、“一义多词”现象,从而不能真正理解用户所提出的问题,无法做到精确识别理解用户意图的问题。
第一方面,本申请实施例提供一种语音信息的处理方法,所述方法包括:
将接收到的非结构化语音识别信息转化为结构化的查询语句,其中,所述非结构化语音识别信息是通过语音识别得到的;
通过构建的知识图谱模型提取所述语音识别信息的相关知识事实,并将所述相关知识事实进行存储;
根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图。
可选的,所述根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图,包括:
确定所述结构化的查询语句对应的场景,其中,所述场景下包含多个不同意图;所述对应的场景是通过语音识别信息的上下文信息以及应用设备信息确定的;
根据所述不同意图的权重,确定按照权重排序后得到的相关性最高的实体属性,其中,所述实体属性包含在所述存储的相关知识事实中;
返回所述实体属性确定为所述语音识别信息的目的意图。
可选的,结构化的查询语句在对应场景下不同意图的权重是通过大数据挖掘分析后对各关键词在不同场景下不同意图的权重进行标记得到的;或
结构化的查询语句在对应场景下不同意图的权重是通过深度学习方法训练得到的。
可选的,所述根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图,包括:
基于深度学习的实体属性排序方法,确定根据所述排序方法得到的相关性最高的实体属性;
返回所述实体属性确定为所述语音识别信息的目的意图。
可选的,所述通过构建的知识图谱模型提取所述语音识别信息的相关知识事实,包括:
将多个语音非结构化语音识别信息的结构化的查询语句、并结合其他的用于构建知识图谱的信息素材,并结合数据库中的具体数据信息进行知识融合,其中所述数据库包括所述语音识别信息使用的数据库;
提取语音识别信息中的关键词;
确定所述关键词在知识图谱模型中对应的实体属性的集合,并将所述实体属性的集合作为所述语音识别信息的相关知识事实的表示。
可选的,所述相关知识事实包括经过所述知识图谱模型提炼过的知识和所述语音识别信息的具体数据信息。
可选的,所述将所述相关知识事实进行存储,包括:
将所述经过知识图谱模型提炼过的知识存储到模式层;
将所述语音识别信息的具体数据信息存储到数据层。
第二方面,本发明实施例还提供一种语音信息的处理装置,所述装置包括:
转化模块,用于执行将接收到的非结构化语音识别信息转化为结构化的查询语句,其中,所述非结构化语音识别信息是通过语音识别得到的;
提取模块,用于执行通过构建的知识图谱模型提取所述语音识别信息的相关知识事实,并将所述相关知识事实进行存储;
确定模块,用于执行根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图。
可选的,所述确定模块,用于执行:
确定所述结构化的查询语句对应的场景,其中,所述场景下包含多个不同意图;所述对应的场景是通过语音识别信息的上下文信息以及应用设备信息确定的;
根据所述不同意图的权重,确定按照权重排序后得到的相关性最高的实体属性,其中,所述实体属性包含在所述存储的相关知识事实中;
返回所述实体属性确定为所述语音识别信息的目的意图。
可选的,结构化的查询语句在对应场景下不同意图的权重是通过大数据挖掘分析后对各关键词在不同场景下不同意图的权重进行标记得到的;或
结构化的查询语句在对应场景下不同意图的权重是通过深度学习装置训练得到的。
可选的,所述确定模块,用于执行:
基于深度学习的实体属性排序装置,确定根据所述排序装置得到的相关性最高的实体属性;
返回所述实体属性确定为所述语音识别信息的目的意图。
可选的,所述提取模块,用于执行:
将多个语音非结构化语音识别信息的结构化的查询语句、并结合其他的用于构建知识图谱的信息素材,并结合数据库中的具体数据信息进行知识融合,其中所述数据库包括所述语音识别信息使用的数据库;
提取语音识别信息中的关键词;
确定所述关键词在知识图谱模型中对应的实体属性的集合,并将所述实体属性的集合作为所述语音识别信息的相关知识事实的表示。
可选的,所述相关知识事实包括经过所述知识图谱模型提炼过的知识和所述语音识别信息的具体数据信息。
可选的,所述提取模块,用于执行:
将所述经过知识图谱模型提炼过的知识存储到模式层;
将所述语音识别信息的具体数据信息存储到数据层。
第三方面,本发明实施例还提供一种智能终端,包括:
存储器以及处理器;
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序第一方面任一项所述的语音信息的处理方法。
第四方面,本发明实施例还提供一种计算机存储介质,其中,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行本申请实施例中的任一项所述的语音信息的处理方法。
本申请实施例提供的一种语音信息的处理方法、装置、智能终端以及存储介质,首先将接收到的非结构化语音识别信息转化为结构化的查询语句,其中,所述非结构化语音识别信息是通过语音识别得到的;进一步的,通过构建的知识图谱模型提取所述语音识别信息的相关知识事实,并将所述相关知识事实进行存储;最后,根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图。通过该方式解决不同场景下语义不同意图有歧义的问题,从而可以实现真正理解用户所提出的问题,并做到精确识别理解用户的意图。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所介绍的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种语音信息的处理方法的流程图;
图2为本申请实施例提供的一种语音信息的处理方法的具体实施流程图;
图3为本申请实施例提供的一种语音信息的处理装置的结构示意图;
图4为本申请实施例提供的一种智能终端的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
相关技术中,随着物联网的快速发展,语音交互机制由于简单、快捷、交互性好等优点,越来越多的设备采用语音交互,并且逐渐成为人们的首选方式。但是发明人发现,目前存在一个问题就是当用户获取数据时,往往会出现多个返回结果,出现“一词多义”、“一义多词”现象,从而不能真正理解用户所提出的问题,无法做到精确识别理解用户意图。
有鉴于此,本申请提供一种语音信息的处理方法,该方法基于知识图谱和机器学习等技术,解决了不同场景下存在的语义意图歧义问题,可实现精确识别理解用户意图,提高了用户参与体验,解决语音输入时出现“一词多义”、“一义多词”现象。参阅图1,为本申请实施例提供的一种语音信息的处理方法的流程图,包括:
步骤101:将接收到的非结构化语音识别信息转化为结构化的查询语句,其中,所述非结构化语音识别信息是通过语音识别得到的。
其中,用户对语音设备例如智能空调,进行语音交互发出语音控制命令时可得到用户语音信息。当语音设备接收到用户语音信息后,将用户的上传到云服务平台,云服务平台进一步对用户语音信息进行解析识别处理得到的语音识别信息。该语音识别信息是非结构化的文本语句,从该文本语句中可得到用户的意图,但语音设备不能根据该非结构化的语音识别信息理解用户的意图,故此需要将该语音识别信息发送给知识图谱服务器进行下一步地处理。
为了使语音设备可以准确的理解用户的目的意图,知识图谱服务器在接收到云服务平台发送的语音识别信息之后会将该非结构化语音识别信息转化为结构化的查询语句。通过用户语音信息对应的结构化的查询语句,可以使语音设备根据结构化的查询语句并结合不同的场景和知识图谱分析出用户的真正的意图。
步骤102:通过构建的知识图谱模型提取所述语音识别信息的相关知识事实,并将所述相关知识事实进行存储。
其中,知识图谱服务器中构建有知识图谱的体系架构模型,知识图谱模型从最原始的数据(包括结构化的查询语句信息和非结构化的语音识别信息)出发,采用一系列自动或者半自动的技术手段,从原始数据库和第三方数据库中提取相关知识事实。需要说明的是,原始数据库为存储结构化的查询语句信息、半结构化的语音识别信息、非结构化的语音识别信息的数据库,这里引入的第三方数据库是指存储的某一专业领域知识的数据库,其作用是为了扩充语音识别信息对应的不同场景及不同意图,从而保证目的意图理解的准确性。
上述方法中,相关知识事实包括经过知识图谱模型提炼过的知识和语音识别信息的具体数据信息。并且将经过知识图谱模型提炼过的知识存储到知识图谱模型的核心即模式层中;将语音识别信息的具体数据信息存储到数据层中。
在一个实施例中,将多个语音非结构化语音识别信息的结构化的查询语句、并结合其他的用于构建知识图谱的信息素材,并结合数据库中的具体数据信息进行知识融合。此外,知识图谱服务器为理解用户的意图,需要提取语音识别信息中的关键词;并确定所述关键词在知识图谱模型中对应的实体属性的集合,并将所述实体属性的集合作为所述语音识别信息的相关知识事实的表示。例如,用户发出的语音控制命令为“我想买苹果”,则提取出该用户语音信息中的关键词为“苹果”,并确定该关键词“苹果”在知识图谱模型中对应的实体属性的集合有“苹果(蔷薇科苹果属果实)、苹果(苹果公司)、苹果(苹果公司产品)、苹果(人名)”,并且将得到的该实体属性的集合作为用户此次语音控制命令的相关知识事实的表示。需要说明的是,在这个实施例中,可得到这时候当用户获取意图时就出现了多个返回结果,出现“一词多义”、“一义多词”现象,若要确定用户的准确意图,则进一步执行步骤103。
步骤103:根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图。
在一个实施例中,首先通过语音识别信息的上下文信息以及应用设备信息确定结构化的查询语句对应的场景,其中,结构化的查询语句对应的场景下可能包含多个不同意图;若想在不同的意图中确定用户的目的意图,可根据不同意图的权重进行目的意图的判断。其中,获取结构化的查询语句在对应场景下意图的权重的实施方式,可选的,通过大数据挖掘分析后对结构化的查询语句在对应场景下不同意图的权重进行标记得到;或者,可选的,通过深度学习方法训练得到。
进一步的,根据获取到的不同意图的权重,确定按照权重排序后得到的相关性最高的实体属性,其中,所述实体属性包含在所述存储的相关知识事实中。例如,参阅表1,为当用户发出的语音控制命令为“我想买苹果”,其中,该语音控制命令有不同意图的权重排序,如:
表1
场景 实体属性 权重值
苹果 蔷薇科苹果属果实 A1
苹果 苹果公司 A2
苹果 苹果公司产品 A3
苹果 人名 A4
其中,如表1所示,在一个实施例中,A1的权重值大于A2、A3及A4的值,则可得到本次排序后得到的相关性最高的实体属性为“蔷薇科苹果属果实”,即表明用户的目的意图是想购买吃的“苹果”。
在另一个实施例中,基于深度学习的实体属性排序方法,确定根据所述排序方法得到的相关性最高的实体属性;返回所述实体属性确定为所述语音识别信息的目的意图。例如,可选的,采用根据一种基于CNN(Convolutional Neural Network,一种深度学习算法)的实体属性排序方法,该CNN通过深度学习方法训练神经网络的确定场景后的不同意图的权重以及问题序列与实体属性序列的词向量来进行排序。从而根据排序的记过得到相关性最高的实体属性,并将该实体属性作为语音识别信息的目的意图。
通过本申请提供的语音信息的处理方法,通过知识图谱服务器与机器学习等技术的结合,解决了在不同场景下不同意图存在的关于语义意图歧义的问题,可实现精确识别理解用户得意图,从而提高了用户参与体验,解决了语音输入时出现“一词多义”、“一义多词”现象。
参阅图2,为本申请实施例提供的一种语音信息的处理方法的具体实施流程图,对本申请的具体实施方式进一步说明,包括:
步骤201:语音识别模块接收用户发出的语音控制命令。
步骤202:将根据语音控制命令接收的用户语音信息上传到云服务平台。
其中,云服务平台在接收到用户语音信息后会进行初步的解析识别处理得到的语音识别信息。
步骤203:云服务系统将语音识别信息发送给知识图谱服务器进行用户目的意图的识别。
在一个实施例中,知识图谱服务器接收到语音识别信息后,为使该语音识别信息在知识图谱服务器中进行目的意图的确定,首先会将该非结构化语音识别信息转化为结构化的查询语句,并进一步执行以下处理,包括:
步骤B1:对半结构化语音识别信息数据和非结构化语音识别信息数据进行知识提取。
其中,通过知识提取可得到用户识别信息中的关键词。例如,通过用户发出的语音控制命令为“我想买苹果”,则提取出该用户语音信息中的关键词为“苹果”。
步骤B2:将结构化语音识别信息数据和第三方数据库数据进行数据整合。
其中,将多个语音非结构化语音识别信息的结构化的查询语句、并结合其他的用于构建知识图谱的信息素材,并结合数据库中的具体数据信息进行知识融合。通过知识融合后,可得到不同关键词在不同场景下不同意图的实体属性。
需要说明的是,步骤B1和步骤B2不限定执行顺序。
步骤B3:将知识提取得到的关键词和数据整合后的信息结合后得到相关知识事实的表示。
其中,知识提取后可确定关键词,数据整合信息中包含关键词对应的实体属性,因此,两者结合便可得到对应该关键词的相关知识事实的标识。相关知识事实包含关键词的所有实体属性。
步骤B4:通过得到的相关知识事实进行目的意图推理。
其中,进行目的意图推理可选的,首先确定所述结构化的查询语句对应的场景,其中,所述场景下包含多个不同意图;所述对应的场景是通过语音识别信息的上下文信息以及应用设备信息确定的。在一个实施例中,根据所述不同意图的权重,确定按照权重排序后得到的相关性最高的实体属性,并返回所述实体属性确定为所述语音识别信息的目的意图。在另一个实施例中,基于深度学习的实体属性排序方法,确定根据所述排序方法得到的相关性最高的实体属性;并返回所述实体属性确定为所述语音识别信息的目的意图。
步骤B5:通过质量校验平台对获取的相关知识事实进行校验评估过滤。
在一个实施例中,通过该质量校验平台的引入,可将得到的相关知识事实进行校验评估,将不符合规范、要求的先关知识事实进行过滤。从而可提高最终得到的目的意图的准确性。
步骤B6:对得到的相关知识事实进行及时的知识更新。
在一个实施例中,为保障得到的用户目的意图的准确性,对于得到的相关知识事实的表示进行及时的更新,同样有助于提高最终得到的目的意图的准确性。
其中,在一个实施例中步骤B5和步骤B6是可选的,仅用于提高最终得到的目的意图的准确性,并不作为对具体实施时进行限定。
基于相同的构思,参阅图3为本申请实施例提供的一种语音信息的处理装置,该装置包括:转化模块301、提取模块302和确定模块303。
转化模块301,用于执行将接收到的非结构化语音识别信息转化为结构化的查询语句,其中,所述非结构化语音识别信息是通过语音识别得到的;
提取模块302,用于执行通过构建的知识图谱模型提取所述语音识别信息的相关知识事实,并将所述相关知识事实进行存储;
确定模块303,用于执行根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图。
可选的,所述确定模块303,用于执行:
确定所述结构化的查询语句对应的场景,其中,所述场景下包含多个不同意图;所述对应的场景是通过语音识别信息的上下文信息以及应用设备信息确定的;
根据所述不同意图的权重,确定按照权重排序后得到的相关性最高的实体属性,其中,所述实体属性包含在所述存储的相关知识事实中;
返回所述实体属性确定为所述语音识别信息的目的意图。
可选的,结构化的查询语句在对应场景下不同意图的权重是通过大数据挖掘分析后对各关键词在不同场景下不同意图的权重进行标记得到的;或
结构化的查询语句在对应场景下不同意图的权重是通过深度学习装置训练得到的。
可选的,所述确定模块303,用于执行:
基于深度学习的实体属性排序装置,确定根据所述排序装置得到的相关性最高的实体属性;
返回所述实体属性确定为所述语音识别信息的目的意图。
可选的,所述提取模块302,用于执行:
将多个语音非结构化语音识别信息的结构化的查询语句、并结合其他的用于构建知识图谱的信息素材,并结合数据库中的具体数据信息进行知识融合,其中所述数据库包括所述语音识别信息使用的数据库;
提取语音识别信息中的关键词;
确定所述关键词在知识图谱模型中对应的实体属性的集合,并将所述实体属性的集合作为所述语音识别信息的相关知识事实的表示。
可选的,所述相关知识事实包括经过所述知识图谱模型提炼过的知识和所述语音识别信息的具体数据信息。
可选的,所述提取模块302,用于执行:
将所述经过知识图谱模型提炼过的知识存储到模式层;
将所述语音识别信息的具体数据信息存储到数据层。
在介绍了本申请示例性实施方式中的语音信息的处理方法和装置之后,接下来,介绍本申请的另一示例性实施方式的智能终端。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本申请的智能终端可以至少包括至少一个处理器、以及至少一个存储器。其中,存储器存储有计算机程序,当计算机程序被处理器执行时,使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的语音信息的处理方法中的步骤。例如,处理器可以执行如图1中所示的步骤101-步骤103。
下面参照图4来描述根据本申请的这种实施方式的智能终端40。图4显示的智能终端40仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,智能终端40以通用智能终端的形式表现。智能终端40的组件可以包括但不限于:上述至少一个处理器41、上述至少一个存储器42、连接不同系统组件(包括存储器42和处理器41)的总线43。
总线43表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器42可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)421和/或高速缓存存储器422,还可以进一步包括只读存储器(ROM)423。
存储器42还可以包括具有一组(至少一个)程序模块424的程序/实用工具425,这样的程序模块424包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
智能终端40也可以与一个或多个外部设备44(例如键盘、指向设备等)通信,和/或与使得该智能终端40能与一个或多个其它智能终端进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口45进行。并且,智能终端40还可以通过网络适配器46与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器46通过总线43与用于智能终端40的其它模块通信。应当理解,尽管图中未示出,可以结合智能终端40使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本申请提供的智能终端的控制方法的各个方面还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在计算机设备上运行时,计算机程序用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的语音信息的处理方法中的步骤,例如,计算机设备可以执行如图1中所示的步骤101-步骤103。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的用于解决场景语义意图歧义的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括计算机程序,并可以在智能终端上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读计算机程序。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的计算机程序可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的计算机程序,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。计算机程序可以完全地在目标对象智能终端上执行、部分地在目标对象设备上执行、作为一个独立的软件包执行、部分在目标对象智能终端上部分在远程智能终端上执行、或者完全在远程智能终端或服务器上执行。在涉及远程智能终端的情形中,远程智能终端可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到目标对象智能终端,或者,可以连接到外部智能终端(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用计算机程序的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (16)

1.一种语音信息的处理方法,其特征在于,所述方法包括:
将接收到的非结构化语音识别信息转化为结构化的查询语句,其中,所述非结构化语音识别信息是通过语音识别得到的;
通过构建的知识图谱模型提取所述语音识别信息的相关知识事实,并将所述相关知识事实进行存储;
根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图。
2.根据权利要求1所述的方法,其特征在于,所述根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图,包括:
确定所述结构化的查询语句对应的场景,其中,所述场景下包含多个不同意图;所述对应的场景是通过语音识别信息的上下文信息以及应用设备信息确定的;
根据所述不同意图的权重,确定按照权重排序后得到的相关性最高的实体属性,其中,所述实体属性包含在所述存储的相关知识事实中;
返回所述实体属性确定为所述语音识别信息的目的意图。
3.根据权利要求2所述的方法,其特征在于,结构化的查询语句在对应场景下不同意图的权重是通过大数据挖掘分析后对各关键词在不同场景下不同意图的权重进行标记得到的;或
结构化的查询语句在对应场景下不同意图的权重是通过深度学习方法训练得到的。
4.根据权利要求1所述的方法,其特征在于,所述根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图,包括:
基于深度学习的实体属性排序方法,确定根据所述排序方法得到的相关性最高的实体属性;
返回所述实体属性确定为所述语音识别信息的目的意图。
5.根据权利要求1所述的方法,其特征在于,所述通过构建的知识图谱模型提取所述语音识别信息的相关知识事实,包括:
将多个语音非结构化语音识别信息的结构化的查询语句、并结合其他的用于构建知识图谱的信息素材,并结合数据库中的具体数据信息进行知识融合,其中所述数据库包括所述语音识别信息使用的数据库;
提取语音识别信息中的关键词;
确定所述关键词在知识图谱模型中对应的实体属性的集合,并将所述实体属性的集合作为所述语音识别信息的相关知识事实的表示。
6.根据权利要求1所述的方法,其特征在于,所述相关知识事实包括经过所述知识图谱模型提炼过的知识和所述语音识别信息的具体数据信息。
7.根据权利要求6所述的方法,其特征在于,所述将所述相关知识事实进行存储,包括:
将所述经过知识图谱模型提炼过的知识存储到模式层;
将所述语音识别信息的具体数据信息存储到数据层。
8.一种语音信息的处理装置,其特征在于,所述装置包括:
转化模块,用于执行将接收到的非结构化语音识别信息转化为结构化的查询语句,其中,所述非结构化语音识别信息是通过语音识别得到的;
提取模块,用于执行通过构建的知识图谱模型提取所述语音识别信息的相关知识事实,并将所述相关知识事实进行存储;
确定模块,用于执行根据存储的相关知识事实并结合所述结构化的查询语句确定所述语音识别信息的目的意图。
9.根据权利要求8所述的装置,其特征在于,所述确定模块,用于执行:
确定所述结构化的查询语句对应的场景,其中,所述场景下包含多个不同意图;所述对应的场景是通过语音识别信息的上下文信息以及应用设备信息确定的;
根据所述不同意图的权重,确定按照权重排序后得到的相关性最高的实体属性,其中,所述实体属性包含在所述存储的相关知识事实中;
返回所述实体属性确定为所述语音识别信息的目的意图。
10.根据权利要求9所述的装置,其特征在于,结构化的查询语句在对应场景下不同意图的权重是通过大数据挖掘分析后对各关键词在不同场景下不同意图的权重进行标记得到的;或
结构化的查询语句在对应场景下不同意图的权重是通过深度学习装置训练得到的。
11.根据权利要求8所述的装置,其特征在于,所述确定模块,用于执行:
基于深度学习的实体属性排序装置,确定根据所述排序装置得到的相关性最高的实体属性;
返回所述实体属性确定为所述语音识别信息的目的意图。
12.根据权利要求8所述的装置,其特征在于,所述提取模块,用于执行:
将多个语音非结构化语音识别信息的结构化的查询语句、并结合其他的用于构建知识图谱的信息素材,并结合数据库中的具体数据信息进行知识融合,其中所述数据库包括所述语音识别信息使用的数据库;
提取语音识别信息中的关键词;
确定所述关键词在知识图谱模型中对应的实体属性的集合,并将所述实体属性的集合作为所述语音识别信息的相关知识事实的表示。
13.根据权利要求8所述的装置,其特征在于,所述相关知识事实包括经过所述知识图谱模型提炼过的知识和所述语音识别信息的具体数据信息。
14.根据权利要求13所述的装置,其特征在于,所述提取模块,用于执行:
将所述经过知识图谱模型提炼过的知识存储到模式层;
将所述语音识别信息的具体数据信息存储到数据层。
15.一种智能终端,其特征在于,包括:存储器以及处理器;
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1-7任一项所述的方法。
16.一种计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令用于执行如权利要求1-7中任一权利要求所述的方法。
CN201910994726.4A 2019-10-18 2019-10-18 一种语音信息的处理方法、装置、智能终端以及存储介质 Pending CN110795532A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910994726.4A CN110795532A (zh) 2019-10-18 2019-10-18 一种语音信息的处理方法、装置、智能终端以及存储介质
PCT/CN2020/112928 WO2021073298A1 (zh) 2019-10-18 2020-09-02 一种语音信息的处理方法、装置、智能终端以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910994726.4A CN110795532A (zh) 2019-10-18 2019-10-18 一种语音信息的处理方法、装置、智能终端以及存储介质

Publications (1)

Publication Number Publication Date
CN110795532A true CN110795532A (zh) 2020-02-14

Family

ID=69439350

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910994726.4A Pending CN110795532A (zh) 2019-10-18 2019-10-18 一种语音信息的处理方法、装置、智能终端以及存储介质

Country Status (2)

Country Link
CN (1) CN110795532A (zh)
WO (1) WO2021073298A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112086155A (zh) * 2020-09-11 2020-12-15 北京欧应信息技术有限公司 一种基于语音录入的诊疗信息结构化收集方法
WO2021073298A1 (zh) * 2019-10-18 2021-04-22 珠海格力电器股份有限公司 一种语音信息的处理方法、装置、智能终端以及存储介质
CN113420124A (zh) * 2021-06-25 2021-09-21 上海适享文化传播有限公司 解决语音检索多条件下的冲突方法
CN113761927A (zh) * 2021-08-31 2021-12-07 国网冀北电力有限公司 电网故障处置实时辅助决策方法、系统、设备及存储介质
CN111858966B (zh) * 2020-08-05 2021-12-31 龙马智芯(珠海横琴)科技有限公司 知识图谱的更新方法、装置、终端设备及可读存储介质
CN114328955A (zh) * 2021-12-17 2022-04-12 南京沃科电子科技有限公司 一种汽车电子知识图谱控制系统
CN115242569A (zh) * 2021-04-23 2022-10-25 海信集团控股股份有限公司 智能家居中的人机交互方法和服务器
CN115356939A (zh) * 2022-08-18 2022-11-18 青岛海尔科技有限公司 控制指令的发送方法、控制装置、存储介质及电子装置
CN115453897A (zh) * 2022-08-18 2022-12-09 青岛海尔科技有限公司 意图指令的确定方法及装置、存储介质及电子装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114138930B (zh) * 2021-10-23 2024-02-02 西安电子科技大学 一种基于知识图谱的意图表征系统及方法
CN114898751B (zh) * 2022-06-15 2024-04-23 中国电信股份有限公司 自动化配置方法及系统、存储介质和电子设备
CN115827848B (zh) * 2023-02-10 2023-06-23 天翼云科技有限公司 一种知识图谱事件抽取方法、装置、设备和存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9009046B1 (en) * 2005-09-27 2015-04-14 At&T Intellectual Property Ii, L.P. System and method for disambiguating multiple intents in a natural language dialog system
CN104769584A (zh) * 2012-07-31 2015-07-08 韦韦欧股份有限公司 在对话交互中消除用户意图歧义
CN105070288A (zh) * 2015-07-02 2015-11-18 百度在线网络技术(北京)有限公司 车载语音指令识别方法和装置
WO2018006472A1 (zh) * 2016-07-07 2018-01-11 深圳狗尾草智能科技有限公司 基于知识图谱的人机交互方法及系统
CN108428447A (zh) * 2018-06-19 2018-08-21 科大讯飞股份有限公司 一种语音意图识别方法及装置
WO2019011356A1 (de) * 2017-07-14 2019-01-17 Cognigy Gmbh Verfahren zur dialogführung zwischen mensch und computer
CN109492126A (zh) * 2018-11-02 2019-03-19 廊坊市森淼春食用菌有限公司 一种智能交互方法及装置
CN109635117A (zh) * 2018-12-26 2019-04-16 零犀(北京)科技有限公司 一种基于知识图谱识别用户意图方法及装置
CN109785833A (zh) * 2019-01-02 2019-05-21 苏宁易购集团股份有限公司 用于智能设备的人机交互语音识别方法及系统
CN109918673A (zh) * 2019-03-14 2019-06-21 湖北亿咖通科技有限公司 语义仲裁方法、装置、电子设备和计算机可读存储介质
CN110334201A (zh) * 2019-07-18 2019-10-15 中国工商银行股份有限公司 一种意图识别方法、装置及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8423362B2 (en) * 2007-12-21 2013-04-16 General Motors Llc In-vehicle circumstantial speech recognition
CN102880649B (zh) * 2012-08-27 2016-03-02 北京搜狗信息服务有限公司 一种个性化信息处理方法和系统
CN103106287B (zh) * 2013-03-06 2017-10-17 深圳市宜搜科技发展有限公司 一种用户检索语句的处理方法及系统
CN103268348B (zh) * 2013-05-28 2016-08-10 中国科学院计算技术研究所 一种用户查询意图识别方法
CN109657229A (zh) * 2018-10-31 2019-04-19 北京奇艺世纪科技有限公司 一种意图识别模型生成方法、意图识别方法及装置
CN110263160B (zh) * 2019-05-29 2021-04-02 中国电子科技集团公司第二十八研究所 一种计算机问答系统中的问句分类方法
CN110795532A (zh) * 2019-10-18 2020-02-14 珠海格力电器股份有限公司 一种语音信息的处理方法、装置、智能终端以及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9009046B1 (en) * 2005-09-27 2015-04-14 At&T Intellectual Property Ii, L.P. System and method for disambiguating multiple intents in a natural language dialog system
CN104769584A (zh) * 2012-07-31 2015-07-08 韦韦欧股份有限公司 在对话交互中消除用户意图歧义
CN105070288A (zh) * 2015-07-02 2015-11-18 百度在线网络技术(北京)有限公司 车载语音指令识别方法和装置
WO2018006472A1 (zh) * 2016-07-07 2018-01-11 深圳狗尾草智能科技有限公司 基于知识图谱的人机交互方法及系统
WO2019011356A1 (de) * 2017-07-14 2019-01-17 Cognigy Gmbh Verfahren zur dialogführung zwischen mensch und computer
CN108428447A (zh) * 2018-06-19 2018-08-21 科大讯飞股份有限公司 一种语音意图识别方法及装置
CN109492126A (zh) * 2018-11-02 2019-03-19 廊坊市森淼春食用菌有限公司 一种智能交互方法及装置
CN109635117A (zh) * 2018-12-26 2019-04-16 零犀(北京)科技有限公司 一种基于知识图谱识别用户意图方法及装置
CN109785833A (zh) * 2019-01-02 2019-05-21 苏宁易购集团股份有限公司 用于智能设备的人机交互语音识别方法及系统
CN109918673A (zh) * 2019-03-14 2019-06-21 湖北亿咖通科技有限公司 语义仲裁方法、装置、电子设备和计算机可读存储介质
CN110334201A (zh) * 2019-07-18 2019-10-15 中国工商银行股份有限公司 一种意图识别方法、装置及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨峰宇: "基于知识图谱的用户意图理解研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021073298A1 (zh) * 2019-10-18 2021-04-22 珠海格力电器股份有限公司 一种语音信息的处理方法、装置、智能终端以及存储介质
CN111858966B (zh) * 2020-08-05 2021-12-31 龙马智芯(珠海横琴)科技有限公司 知识图谱的更新方法、装置、终端设备及可读存储介质
CN112086155A (zh) * 2020-09-11 2020-12-15 北京欧应信息技术有限公司 一种基于语音录入的诊疗信息结构化收集方法
CN115242569A (zh) * 2021-04-23 2022-10-25 海信集团控股股份有限公司 智能家居中的人机交互方法和服务器
CN115242569B (zh) * 2021-04-23 2023-12-05 海信集团控股股份有限公司 智能家居中的人机交互方法和服务器
CN113420124A (zh) * 2021-06-25 2021-09-21 上海适享文化传播有限公司 解决语音检索多条件下的冲突方法
CN113420124B (zh) * 2021-06-25 2024-03-22 上海适享文化传播有限公司 解决语音检索多条件下的冲突方法
CN113761927A (zh) * 2021-08-31 2021-12-07 国网冀北电力有限公司 电网故障处置实时辅助决策方法、系统、设备及存储介质
CN113761927B (zh) * 2021-08-31 2024-02-06 国网冀北电力有限公司 电网故障处置实时辅助决策方法、系统、设备及存储介质
CN114328955A (zh) * 2021-12-17 2022-04-12 南京沃科电子科技有限公司 一种汽车电子知识图谱控制系统
CN115356939A (zh) * 2022-08-18 2022-11-18 青岛海尔科技有限公司 控制指令的发送方法、控制装置、存储介质及电子装置
CN115453897A (zh) * 2022-08-18 2022-12-09 青岛海尔科技有限公司 意图指令的确定方法及装置、存储介质及电子装置

Also Published As

Publication number Publication date
WO2021073298A1 (zh) 2021-04-22

Similar Documents

Publication Publication Date Title
CN110795532A (zh) 一种语音信息的处理方法、装置、智能终端以及存储介质
CN110377911B (zh) 对话框架下的意图识别方法和装置
US10402433B2 (en) Method and apparatus for recommending answer to question based on artificial intelligence
CN107679039B (zh) 用于确定语句意图的方法和装置
US20200380211A1 (en) Method, apparatus, computer device and readable medium for knowledge hierarchical extraction of a text
CN111090727B (zh) 语言转换处理方法、装置及方言语音交互系统
CN110415679B (zh) 语音纠错方法、装置、设备和存储介质
US11551437B2 (en) Collaborative information extraction
US10083004B2 (en) Using voice-based web navigation to conserve cellular data
CN113590850A (zh) 多媒体数据的搜索方法、装置、设备及存储介质
CN110597966A (zh) 自动问答方法及装置
CN111177186A (zh) 基于问题检索的单句意图识别方法、装置和系统
CN113761868B (zh) 文本处理方法、装置、电子设备及可读存储介质
JP2022120024A (ja) オーディオ信号処理方法、モデルトレーニング方法、並びにそれらの装置、電子機器、記憶媒体及びコンピュータプログラム
CN113705191A (zh) 样本语句的生成方法、装置、设备及存储介质
CN113326702A (zh) 语义识别方法、装置、电子设备及存储介质
CN116467417A (zh) 问题答案的生成方法、装置、设备及存储介质
CN111428011B (zh) 词语的推荐方法、装置、设备及存储介质
CN114817478A (zh) 基于文本的问答方法、装置、计算机设备及存储介质
CN113849623A (zh) 文本视觉问答方法和装置
CN113128431A (zh) 视频片段检索方法、装置、介质与电子设备
CN110717316B (zh) 字幕对话流的主题分割方法及装置
CN112599211A (zh) 一种医疗实体关系抽取方法及装置
US20230274161A1 (en) Entity linking method, electronic device, and storage medium
CN112925889B (zh) 自然语言处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200214