CN113641797A - 数据处理方法、装置、设备、存储介质及计算机程序产品 - Google Patents
数据处理方法、装置、设备、存储介质及计算机程序产品 Download PDFInfo
- Publication number
- CN113641797A CN113641797A CN202111010441.6A CN202111010441A CN113641797A CN 113641797 A CN113641797 A CN 113641797A CN 202111010441 A CN202111010441 A CN 202111010441A CN 113641797 A CN113641797 A CN 113641797A
- Authority
- CN
- China
- Prior art keywords
- query
- query object
- entity
- features
- knowledge graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 33
- 238000004590 computer program Methods 0.000 title claims abstract description 22
- 230000004927 fusion Effects 0.000 claims abstract description 127
- 238000012545 processing Methods 0.000 claims abstract description 50
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000012549 training Methods 0.000 claims description 120
- 238000000605 extraction Methods 0.000 claims description 42
- 230000015654 memory Effects 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 11
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 24
- 238000013473 artificial intelligence Methods 0.000 abstract description 9
- 235000002595 Solanum tuberosum Nutrition 0.000 description 33
- 244000061456 Solanum tuberosum Species 0.000 description 33
- 238000013528 artificial neural network Methods 0.000 description 15
- 241000208292 Solanaceae Species 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 8
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 238000007635 classification algorithm Methods 0.000 description 4
- 238000013145 classification model Methods 0.000 description 4
- 238000010411 cooking Methods 0.000 description 4
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 3
- 229930003268 Vitamin C Natural products 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 235000019154 vitamin C Nutrition 0.000 description 3
- 239000011718 vitamin C Substances 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000007499 fusion processing Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101100400452 Caenorhabditis elegans map-2 gene Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 101150064138 MAP1 gene Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提出了一种数据处理方法、装置、设备、存储介质及计算机程序产品,可以应用于云技术、人工智能、区块链、智慧交通、车载等各种领域或场景,该方法包括:获取查询对象,以及获取与所述查询对象相关联的目标知识图谱;对所述查询对象进行特征提取,得到查询对象特征,以及对所述目标知识图谱进行特征提取,得到知识图谱特征;将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征;对所述融合特征进行处理,得到所述查询对象的意图识别结果。通过本申请实施例,可以有效提高意图识别的准确性。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置、设备、存储介质及计算机程序产品。
背景技术
意图识别主要是对用户的潜在目标进行识别。例如,与“土豆”相关的有科普介绍、料理方法介绍、视频和图片等等,通过意图识别可以在用户查询“土豆”时,识别用户是想要了解“土豆”的料理方法,可以把料理方法的相关资讯作为结果返回给用户。
目前,通常是利用查询对象的分布式表达来实现意图识别,例如,分布式表达为利用卷积神经网络提取到的文本特征,但由于用户输入的查询对象往往是很短的,导致分布式表达过于稀疏,无法提供有效地语义信息,使得意图识别的准确性不高。
发明内容
本申请实施例提供了一种数据处理方法、装置、设备、存储介质及计算机程序产品,可以有效提高意图识别的准确性。
一方面,本申请实施例提供了一种数据处理方法,所述方法包括:
获取查询对象,以及获取与所述查询对象相关联的目标知识图谱;
对所述查询对象进行特征提取,得到查询对象特征,以及对所述目标知识图谱进行特征提取,得到知识图谱特征;
将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征;
对所述融合特征进行处理,得到所述查询对象的意图识别结果。
另一方面,本申请实施例提供了一种数据处理装置,所述装置包括:
获取模块,用于获取查询对象,以及获取与所述查询对象相关联的目标知识图谱;
处理模块,用于对所述查询对象进行特征提取,得到查询对象特征,以及对所述目标知识图谱进行特征提取,得到知识图谱特征;
所述处理模块,还用于将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征;
所述处理模块,还用于对所述融合特征进行处理,得到所述查询对象的意图识别结果。
相应地,本申请实施例提供了一种计算机设备,计算机设备包括处理器、通信接口和存储器,处理器、通信接口和存储器相互连接,其中,存储器存储有计算机程序,处理器用于调用计算机程序,执行上述任一可能实现方式的数据处理方法。
相应地,本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,处理器执行上述任一可能实现方式的数据处理方法所涉及的计算机程序。
相应地,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一可能实现方式的数据处理方法。
本申请实施例中,可以对查询对象进行特征提取,得到查询对象特征,以及对与查询对象相关联的目标知识图谱进行特征提取,得到知识图谱特征,将查询对象特征和知识图谱特征进行融合得到融合特征,并对融合特征进行处理,得到查询对象的意图识别结果;通过上述数据处理方法,可以结合知识图谱提供的上下文信息,使得用于进行意图识别的融合特征能够提供更有效的语义信息,从而有效提高意图识别的准确性。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种数据处理方法的应用场景示意图;
图2为本申请实施例提供的一种搜索任务的处理流程示意图;
图3为本申请实施例提供的一种数据处理方法的流程示意图;
图4为本申请实施例提供的一种目标知识图谱的图谱示意图;
图5为本申请实施例提供的另一种数据处理方法的流程示意图;
图6为本申请实施例提供的一种原始模型的模型结构示意图;
图7为本申请实施例提供的另一种数据处理方法的流程示意图;
图8为本申请实施例提供的一种数据处理装置的结构示意图;
图9为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例中所涉及到的“第一”、“第二”等描述仅用于描述目的,而不能理解为指示或者暗示其相对重要性或者隐含指明所指示的技术特征的数量。因此,限定有“第一”、“第二”等的技术特征可以明示或者隐含的包括至少一个该特征。
为了可以有效提高意图识别的准确性,本申请实施例提出了一种针对数据处理方法。
本申请实施例提出的一种数据处理方法可以基于人工智能技术实现,人工智能(Artificial Intelligence,AI)技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片云计算、云存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
随着人工智能技术的研究和进步,人工智能技术在多个领域展开研究和应用,本申请实施例在实现数据处理方法时可以具体涉及人工智能技术中的自然语言处理技术等技术。
在可行的实施例中,本申请实施例提供的数据处理方法还可以基于云技术(Cloudtechnology)和/或区块链技术实现。区块链:(blockchain或block chain)是借由密码学串接并保护内容的串连文字记录(又称区块)。每一个区块包含了前一个区块的加密散列、相应时间戳记以及交易数据(通常用默克尔树(Merkle tree)算法计算的散列值表示),这样的设计使得区块内容具有难以篡改的特性。用区块链技术所串接的分布式账本能让两方有效纪录交易,且可永久查验此交易。本申请实施例提供的数据处理方法具体可以涉及云技术中的云存储(Cloud storage)、云数据库(Cloud Database)、大数据(Big data)、用户画像中的一种或者多种。例如,从云数据库中获取执行该数据处理方法所需要的数据(例如文本数据、图像数据、知识图谱等)。又例如,执行该数据处理方法所需要的数据可以是以区块的形式存储在区块链上;可以将执行该数据处理方法所产生的数据(例如查询对象特征、知识图谱特征、融合特征)以区块的形式存储到区块链上;另外,执行该数据处理方法的计算机设备可以是区块链网络中的节点设备。
在搜索任务中,可以通过对用户的意图进行识别,从而实现有效搜索,在意图识别时,上下文常常是很重要的语料环境,但用户在搜索时,输入的查询对象往往都是很短的,例如用户只输入“土豆”,此时,由于面临着上下文的缺少,无法知道用户是想要观看“土豆”的视频、图片,还是想要了解“土豆”的料理方法,如果只单单针对“土豆”进行处理,搜索系统无法获取到充分地语料环境,可能会导致意图识别的准确率不高。知识图谱是组织知识信息的一种重要方式,所有的知识都以三元组<实体1-关系-实体2>或<实体-属性-属性值>的形式进行组织管理,例如,<土豆,科目,茄科>是一个<实体1-关系-实体2>的三元组,<土豆,营养成分,维生素C>是一个<实体-属性-属性值>的三元组,因此知识图谱可以描述真实世界中存在的各种实体和概念,以及描述它们之前的关系,基于此,本申请可以利用知识图谱从语义层面理解用户意图,可以了解查询对象与其他实体之间的复杂的关联信息,从而结合知识图谱提供的上下文信息,可以有效提高意图识别的准确性。为便于后续说明,将实体和属性值统称为实体,将关系和属性统称为关系。
请参见图1,图1是本申请实施例提供的一种数据处理方法的应用场景示意图。该应用场景中可以包括终端设备101和服务器102,终端设备101与服务器102之间通过网络连接,比如,通过无线网络连接等。
终端设备101也称为终端(Terminal)、用户设备(user equipment,UE)、接入终端、用户单元、移动设备、用户终端、无线通信设备、用户代理或用户装置。终端设备可以是智能电视、具有无线通信功能的手持设备(例如智能手机、平板电脑)、计算设备(例如个人电脑(personal computer,PC)、智能语音交互设备、智能家电、车载终端、可穿戴设备或者其他智能装置等,但并不局限于此。
服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在本实施例的应用场景中,服务器102可以用于执行搜索任务,可选地,服务器102中可以存储有包括一个或多个索引对象的索引库104,以及意图识别模型103,意图识别模型103可以用于获取查询对象的意图识别结果,服务器102可以利用该意图识别结果从索引库104中搜索出与查询对象匹配的索引对象,作为搜索任务的结果。
在一实施例中,用户可以在终端设备101上输入查询对象,并将输入的查询对象发送至服务器102,服务器102获取到查询对象后,可以获取与查询对象相关联的目标知识图谱,并利用意图识别模型103获取查询对象的查询对象特征,获取目标知识图谱的知识图谱特征,以及将查询对象特征和知识图谱特征进行融合,得到融合特征,并对融合特征进行处理,得到查询对象的意图识别结果,服务器102可以根据意图识别结果从索引库104中搜索出与查询对象匹配的索引对象,通过本实施例可以结合知识图谱提供的上下文信息,使得用于进行意图识别的融合特征能够提供更有效的语义信息,有效提高意图识别的准确性,从而提高搜索任务的准确性。
如图2所示,索引库中包括的各个索引对象可以有其对应的意图标签,例如索引对象的意图标签可以为“电视剧”、“菜谱大全”,等等,服务器在根据意图识别结果从索引库中搜索出与查询对象匹配的索引对象时,可以将查询对象的意图识别结果与索引库中包括的各个索引对象的意图标签进行匹配,例如,查询对象为“土豆”,服务器获取到“土豆”的意图识别结果为“菜谱大全”时,可以从索引库中召回“土豆”相关的索引对象,并将相关的索引对象中意图标签为“菜谱大全”的索引对象作为匹配索引对象,实现搜索任务的粗排召回,进一步地,可以利用意图识别模型获取各个匹配索引对象的融合特征,计算各个匹配索引对象的融合特征与查询对象的融合特征的相似度,按照相似度从大到小对匹配索引对象进行排序,实现搜索任务的精排排序,并将最终精排排序的结果返回给终端设备,以完成搜索任务,通过利用意图识别结果实现搜索任务的粗排,再到利用融合特征实现搜索任务的精排的方式,可以提高搜索任务的准确性,使得意图识别更加准确,提高满意度。
可以理解的是,本申请实施例描述的应用场景示意图是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
请参见图3,图3提供了一种数据处理方法的流程示意图,以该方法应用于图1中的服务器102为例进行说明,该方法可以包括以下步骤:
S301、获取查询对象,以及获取与所述查询对象相关联的目标知识图谱。
查询对象为意图识别所需要识别的对象,可以作为搜索任务的线索,查询对象的具体形式可以为文本、图像,等等,例如服务器获取到的查询对象可以是文本“土豆”,也可以是包含“土豆”的图像。与查询对象相关联的目标知识图谱描述了查询对象与其相关联的实体之间的关系,该相关联的实体可以是与查询对象具有直接连接关系的实体,也可以是具有间接连接关系的实体。通过目标知识图谱描述的各个实体之间的关系(直接连接关系或间接连接关系)可以提供有效地上下文信息。
在一实施例中,当查询对象为文本时,服务器在获取到查询对象后,可以提取查询对象中包括的实体,该实体是原子信息元素,可以是人名、地名、机构名、专有名词等。例如,查询对象为“土豆是什么”,服务器可以利用实体识别工具得到“土豆是什么”中包括的实体“土豆”,该实体识别工具是基于实体识别技术得到的,可以是TexSmart(一种文本理解工具与服务),也可以是其他实体识别工具,本申请对此不作限定。
在一实施例中,当查询对象为图像时,服务器可以在获取到查询对象后,对查询对象进行图像分类识别,识别查询对象中包括的物体,例如识别出图像中包括的动物是猫,植物是向日葵,等等,并将识别得到的结果作为实体。
服务器在获取到查询对象中包括的实体后,可以获取预先建立的知识图谱,该预先建立的知识图谱中包括查询对象中的实体,服务器可以利用实体链接技术将查询对象中包括的实体链接到预先建立的知识图谱中的对应实体,需说明的是,预先建立的知识图谱中的对应实体与查询对象中的实体并不要求完全一致,例如“土豆”和“马铃薯”可以说的是同一个实体,服务器可以获取在预先建立的知识图谱中该对应实体周围的实体和关系,从而得到与查询对象相关联的目标知识图谱,例如查询对象中包括的实体为“土豆”,服务器可以获取到如图4所示的目标知识图谱,该目标知识图谱包括:三元组<土豆,科目,茄科>、三元组<土豆,营养成分,维生素C>、三元组<茄科,分类界,植物界>,因此利用目标知识图谱可以解决查询对象的上下文缺失的问题。
S302、对所述查询对象进行特征提取,得到查询对象特征,以及对所述目标知识图谱进行特征提取,得到知识图谱特征。
查询对象特征为查询对象的高维特征,服务器可以利用神经网络,例如卷积神经网络、残差神经网络,等等,对查询对象进行特征提取,得到查询对象特征。例如,当查询对象为文本时,查询对象特征可以是查询对象中包括的各个字的词编码,也可以是查询对象的文本编码(句编码);当查询对象为图像时,查询对象特征可以是查询对象的图像编码。
知识图谱特征为目标知识图谱的高维特征,服务器可以针对目标知识图谱进行特征提取得到知识图谱特征。
在一实施例中,考虑到目标知识图谱中包括的图为节点和边组成的结构(节点是指实体,边是指关系),而图网络(Graph Network,GN)具有对图节点之间的依赖关系进行建模的强大功能,因此可以利用图网络针对目标知识图谱进行特征提取得到知识图谱特征,使得知识图谱特征可以保存结构化输入数据之间的拓扑关系。
图网络的框架定义了一类用于图形结构表示的关系推理的函数,图网络可以是图神经网络(Graph Neural Network,GNN)、消息传递神经网络(Neural Message Passingfor Quantum Chemistry,MPNN)、以及非局部神经网络(non-local neural network,NLNN),等等。
S303、将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征。
服务器在获取到查询对象特征和知识图谱特征后,可以采取多种方式将查询对象特征和知识图谱特征进行融合,例如可以将查询对象特征和知识图谱特征进行拼接,实现特征层面的融合,也可以是将查询对象特征和知识图谱特征输入神经网络模型,利用神经网络模型在语义层级融合查询对象特征和知识图谱特征,本申请对融合的形式并不加以限定。
S304、对所述融合特征进行处理,得到所述查询对象的意图识别结果。
服务器可以利用融合特征进行分类处理,得到查询对象的意图识别结果,该查询对象的意图识别结果包括查询对象与各个意图标签之间的概率值,例如,意图识别结果为[0.2,0.5,0.3],可以表示查询对象属于意图标签“电视剧”的概率值为0.2,属于意图标签“游戏”的概率值为0.5,属于意图标签“电影”的概率为0.3,服务器可以将概率值大于概率阈值(可以人为设定,为正数)的意图标签作为查询对象的意图识别结果,或者,将最大概率值的意图标签作为查询对象的意图识别结果。
分类处理,是指利用多分类算法判断融合特征属于各个意图标签的概率值。例如,多分类算法可以是softmax分类层。softmax分类层包括全连接层,即可以是将融合特征输入到全连接层,通过全连接层进行多分类处理;多分类算法也可以通过神经网络,例如卷积神经网络或者长短记忆网络,构建分类模型,通过分类模型对融合特征进行多分类处理,另外,多分类算法也可以是机器学习模型,例如用于多分类任务的支持向量机。
在本申请实施例中,可以对查询对象进行特征提取,得到查询对象特征,以及对与查询对象相关联的目标知识图谱进行特征提取,得到知识图谱特征,将查询对象特征和知识图谱特征进行融合得到融合特征,对融合特征进行处理,得到查询对象的意图识别结果;通过上述数据处理方法,可以结合知识图谱提供的上下文信息,使得用于进行意图识别的融合特征能够提供更有效的语义信息,从而有效提高意图识别的准确性。
请参见图5,图5提供了一种数据处理方法的流程示意图,利用该方法可以通过对原始模型进行训练,得到意图识别模型,从而服务器可以通过调用意图识别模型完成意图识别任务。以该方法应用于图1中的服务器102为例进行说明,可以包括以下步骤:
S501、获取训练样本集,所述训练样本集包括多个训练查询对象,与每个训练查询对象相关联的知识图谱,以及所述每个训练查询对象的真实意图标签。
训练样本集包括多个训练查询对象,与多个训练查询对象中每个训练查询对象相关联的知识图谱,以及每个训练查询对象的真实意图标签。
训练样本集中的多个训练查询对象可以包括文本、或包括图像、或包括文本和图像,本申请对此不作限定。与每个训练查询对象相关联的知识图谱描述了训练查询对象与其相关联的实体之间的关系,该相关联的实体可以是与训练查询对象具有直接连接关系的实体,也可以是具有间接连接关系的实体。真实意图标签可以用于表明训练查询对象的真实意图,例如真实意图标签可以为[0,0,1],可以表示训练查询对象属于意图标签“电视剧”的概率值为0,属于意图标签“游戏”的概率值为0,属于意图标签“电影”的概率为1。
在一实施例中,服务器可以对训练查询对象进行意图标签的标注,从而获取训练查询对象的真实意图标签,例如,针对训练查询对象“土豆”,可以标注其意图标签为“蔬菜”,得到训练样本{“训练查询对象”:土豆,“意图标签”:蔬菜},服务器可以获取训练样本中训练查询对象包括的实体,并利用实体链接技术将训练查询对象中包括的实体链接到预先建立的知识图谱中的对应实体,获取预先建立的知识图谱中该对应实体周围的实体和关系,从而获取与每个训练查询对象相关联的知识图谱,该对应实体周围的实体可以与训练查询对象中包括的实体间隔多个中间实体。
S502、调用原始模型对所述训练样本集包括的每个训练查询对象和所述与每个训练查询对象相关联的知识图谱进行处理,得到所述每个训练查询对象的预测意图识别结果;其中,所述原始模型包括对象特征提取单元、图谱特征提取单元,融合单元以及分类单元。
请参见图6,图6为原始模型的模型结构示意图,其包括对象特征提取单元、图谱特征提取单元,融合单元以及分类单元。
在一实施例中,服务器可以调用原始模型包括的对象特征提取单元对训练样本集包括的每个训练查询对象进行特征提取,即将训练样本集包括的每个训练查询对象输入原始模型包括的对象特征提取单元,得到训练对象特征。该对象特征提取单元可以是卷积神经网络、长短期记忆(Long Short-Term Memory,LSTM)网络,等等。当训练样本集中包括的训练查询对象为文本时,优选地,可以采用卷积神经网络、word2vec、LSTM网络,等等,从而更好地提取属于文本的特征。
在一实施例中,服务器可以调用原始模型包括的图谱特征提取单元对训练样本集中与每个训练查询对象相关联的知识图谱进行特征提取,即将训练样本集中与每个训练查询对象相关联的知识图谱输入原始模型包括的图谱特征提取单元,得到训练图谱特征。由于知识图谱中包括的图为节点和边组成的结构(节点是指实体,边是指关系),而图网络(Graph Network,GNN)具有对图节点之间的依赖关系进行建模的强大功能,因此图谱特征提取单元可以是图网络,可以使得到的训练图谱特征可以保存结构化输入数据之间的拓扑关系。
可选地,本申请以图谱特征提取单元为图网络中的图神经网络进行说明。假设与每个训练查询对象相关联的知识图谱G中包括N个节点,该节点可以理解为一个实体,可以获取每个节点的特征,其维度大小为1×D,服务器可以将这些节点的特征组成一个N×D维的矩阵X,可以获取各个节点之间的关系的特征,其维度大小为1×N,再把各个节点之间的关系组成一个N×N维的矩阵A,可以将矩阵X和矩阵A作为输入,得到图神经网络在层与层之间的传播公式为:
其中,I是单位矩阵,A包含了知识图谱G中每个节点与相邻节点(具有直接连接关系的实体)的连接信息,加上I之后,运算操作既包含节点自身的信息还包含相邻节点的信息,是节点的度矩阵,对角线上元素值为每个节点的度,对角线以外元素的值为0,W是可以训练的权重矩阵,H是每一层的特征,即训练图谱特征,对输入层而言,H就是X,σ是非线性激活函数。
在一实施例中,服务器可以调用原始模型包括的融合单元对训练对象特征和训练图谱特征进行融合得到训练融合特征,该融合单元可以是将训练对象特征和训练图谱特征进行拼接,也可以是神经网络,利用神经网络提取融合了查询对象特征和知识图谱特征的高维特征,将高维特征作为训练融合特征,例如将查询对象特征和知识图谱特征输入神经网络(例如自注意力网络)从而获取高维特征作为训练融合特征。
在一实施例中,为了使训练融合特征具有更加精准和丰富的语义信息,本申请在融合单元中引入更加强有力的张量融合机制来对训练对象特征和训练图谱特征进行融合。
可选地,为了执行张量融合机制,服务器可以获取初始张量参数,该初始张量参数为M维张量参数,M为大于或等于2的正整数,例如,初始张量参数可以为维度大小为m×n×k的三维张量,初始张量参数中的参数是通过随机初始化得到的,因此最开始的初始张量参数还没有进行张量融合机制的学习,无法提取到有效地训练融合特征。
需说明的是,当M为2时,初始张量参数实际为一个矩阵,优选地,可以选择M为大于2的正整数,此时初始张量参数为一个多维张量,采用多维张量的融合单元可以有效的强化训练对象特征和训练图谱特征的融合过程,可以获取到更有深度的融合特征。
在一实施例中,服务器可以利用初始张量参数将训练对象特征和训练图谱特征进行融合,得到训练融合特征。如将训练对象特征、初始张量参数以及训练图谱特征进行相乘处理,其融合方式如下述公式(2)所示。
VlOgit=V1W【1:k】V2 (2)
其中,V1为训练对象特征,其维度大小为n×1,n为正整数,V2为训练图谱特征,其维度大小为m×1,m为正整数,W【1:k】为初始张量参数,该初始张量参数可以为维度大小为m×n×k的三维张量,【1:k】表示融合单元输出的维度大小为1×k,则Vlogit的维度大小为1×k。
通过张量融合机制可以充分实现训练对象特征和训练图谱特征之间的信息融合,解决了缺失上下文信息的问题,使得到的训练融合特征具有更强的特征表达能力。
在一实施例中,服务器可以调用原始模型包括的分类单元对训练融合特征进行处理,得到预测意图识别结果。分类单元可以是softmax分类层。softmax分类层包括全连接层,即可以是将训练融合特征输入到全连接层,通过全连接层进行多分类处理得到预测意图识别结果;多分类算法也可以通过神经网络,例如卷积神经网络或者长短记忆网络,构建分类模型,通过分类模型对训练融合特征进行多分类处理,得到预测意图识别结果。其输出的预测意图识别结果如下述公式(3)所示。
Probcls=classifier(Vlogit) (3)
其中,Probcls为预测意图识别结果,是一个z×1维的概率分布向量,描述了训练查询对象属于各个意图标签的概率,z为意图标签的标签数量,classifier表示分类单元,可以为用于多分类的神经网络,也可以是用于多分类的机器学习模型,等等。
S503、根据所述预测意图识别结果和所述每个训练查询对象的真实意图标签确定预测损失参数。
服务器可以根据每个训练查询对象的预测意图识别结果和每个训练查询对象的真实意图标签确定预测损失参数,该预测损失参数可以衡量预测意图识别结果和真实意图标签之间的差异性。
在一实施例中,为了获取预测损失参数,服务器可以获取原始模型的损失函数,并将每个训练查询对象的预测意图识别结果和每个训练查询对象的真实意图标签输入原始模型的损失函数得到预测损失参数。可选地,原始模型的损失函数可以为负对数损失函数,负对数损失函数如下述公式(4)所示。
其中,Losscls为预测损失参数,yi为训练查询对象的真实意图标签,yi为0表示属于第i个意图标签,yi为1表示不属于第i个意图标签,ai为预测意图识别结果。
S504、根据所述预测损失参数对原始模型进行调整,并根据调整后的原始模型确定意图识别模型。
服务器可以根据预测损失参数对原始模型的模型参数进行调整,当原始模型的模型参数的调整次数达到预设次数(可以人为设定),或损失函数收敛时,或预测损失参数为0时,即通过反向传播将预测意图识别结果和真实意图标签之间的差异性逐渐变小,当它们之间的差异性小到满足要求时,停止对原始模型的模型参数的调整,并将调整后的原始模型作为意图识别模型,此时意图识别模型可以准确地识别出查询对象的意图。
需说明的是,当原始模型的融合单元采取张量融合机制时,对原始模型的模型参数进行调整时,包括了对初始张量参数的调整,通过不断的调整初始张量参数的参数,可以使初始张量参数可以更好地融合训练对象特征和训练图谱特征,获取更好的训练融合特征,从而使得损失函数可以变得越来越小,直至收敛,可以将调整好的初始张量参数作为融合张量参数,利用融合张量参数对上述获取到的查询对象对应的查询对象特征和上述获取到的与查询对象相关联的目标知识图谱对应的知识图谱特征进行融合,可以得到具有更强表达能力的上述融合特征。
通过本实施例,服务器可以利用训练样本集对原始模型进行训练,使训练得到的意图识别模型可以用于意图识别任务,同时,由于训练得到的意图识别模型可以利用融合单元学习知识图谱提供的上下文信息,使得意图识别模型可以利用更多的互补信息,提高意图识别的准确性。
请参见图7,图7提供了一种数据处理方法的流程示意图,以该方法应用于图1中的服务器102为例进行说明,可以包括以下步骤:
S701、获取查询对象,以及获取与所述查询对象相关联的目标知识图谱。
服务器可以在获取到查询对象后,利用查询对象获取与查询对象相关联的目标知识图谱。
在一实施例中,服务器获取与查询对象相关联的目标知识图谱,可以包括以下步骤:
(1)从查询对象中获取查询实体。
(2)从融合知识图谱中确定与查询实体具有关联关系的目标关联实体,以及确定查询实体和目标关联实体中任意两个实体之间的连接关系。
(3)根据查询实体、目标关联实体和连接关系,确定与查询对象相关联的目标知识图谱。
在一实施例中,当查询对象为文本时,服务器在获取到查询对象后,可以利用实体识别工具提取查询对象中包括的实体,该实体可以是人名、地名、机构名、专有名词等,将查询对象中包括的实体作为查询实体。
实体识别工具是基于实体识别技术实现的,实体识别技术第一步可以识别出实体词边界,也就是实体的开始位置和结束位置;第二步识别出实体的类型,如人名、地名、机构名等等具体的实体类型。
在一实施例中,当查询对象为图像时,服务器可以在获取到查询对象后,对查询对象进行图像分类识别,识别查询对象中包括的物体,例如识别出图像中包括的动物、植物、人物,等等,并将物体的识别结果作为实体。
在一实施例中,查询对象中可能包括多个实体,服务器可以将查询对象中包括的多个实体都作为查询实体,例如查询对象“丙网游中丁游戏角色的玩法是什么”中包括查询实体:“丙网游”、“丁游戏角色”,也可以获取查询对象中各个实体的置信度,即评估各个实体在查询对象中的重要性,将置信度最高的实体作为查询实体。
在一实施例中,服务器可以从融合知识图谱中确定与查询实体具有关联关系的目标关联实体,以及确定查询实体和目标关联实体中任意两个实体之间的连接关系,根据查询实体、目标关联实体和连接关系,确定与查询对象相关联的目标知识图谱,即可以利用查询实体与目标关联实体中任意两个实体之间的连接关系构成一个新的知识图谱,作为与查询对象相关联的目标知识图谱。
在一实施例中,服务器为了获取与查询对象相关联的目标知识图谱,可以从融合知识图谱中获取与查询实体具有连接关系,且连接路径上的中间实体的数量小于第一数量的实体作为目标关联实体,再确定查询实体和目标关联实体中任意两个实体之间的连接关系,利用查询实体、目标关联实体和连接关系,获取与查询对象相关联的目标知识图谱。
融合知识图谱为预先建立的知识图谱,融合知识图谱中包括查询实体,需要说明的是,融合知识图谱中包括的查询实体与查询对象中的查询实体并不要求完全一致,例如,“土豆”和“马铃薯”可以指的是同一个查询实体,服务器可以利用查询对象中的查询实体链接到融合知识图谱中的查询实体,并获取融合知识图谱中与查询实体具有连接关系,且连接路径上的中间实体的数量小于第一数量的实体作为查询实体,该连接关系包括直接连接关系和非直接连接关系,当实体与查询实体是直接连接关系时,连接路径上的中间实体的数量为0,例如图4所示的实体“土豆”与“茄科”为直接连接关系;是非直接连接关系时,连接路径上的中间实体的数量需要小于第一数量,第一数量可以为人为设定,为正整数,例如第一数量可以为1,当第一数量为1时,表明实体与查询实体之间可以包括一个中间实体,以图4为例,当查询实体为“土豆”时,与实体“植物界”之间包括一个中间实体为“茄科”。通过利用与查询实体相关联的实体和关系,可以使目标知识图谱包含上下文信息。
在一实施例中,当查询对象中包括多个查询实体时,服务器可以获取与每个查询实体相关联的实体和关系来构建每个查询实体对应的目标知识图谱,即从融合知识图谱中获取与每个查询实体具有连接关系,且连接路径上的中间实体的数量小于第一数量的实体作为目标关联实体,确定每个查询实体和目标关联实体中任意两个实体之间的连接关系,利用每个查询实体、目标关联实体和连接关系,获取每个查询实体对应的目标知识图谱,则与查询对象相关联的目标知识图谱实际上包括了多个查询实体中每个查询实体分别对应的目标知识图谱。
在一实施例中,服务器获取到各个查询实体分别对应的目标知识图谱后,可以将各个查询实体对应的目标知识图谱进行组合,得到与查询对象相关联的目标知识图谱。例如,查询实体“土豆”的目标知识图谱1包括:三元组<土豆,科目,茄科>、三元组<土豆,营养成分,维生素C>,查询实体“茄科”的目标知识图谱2包括:三元组<茄科,分类界,植物界>,则三元组<土豆,科目,茄科>和三元组<茄科,分类界,植物界>是存在相同的实体“茄科”,则可以将目标知识图谱1和目标知识图谱2组合成图4所示的目标知识图谱,作为与查询对象相关联的目标知识图谱。
在一实施例中,当查询对象中还包括查询实体的关系对象(可以理解为直接连接关系)时,获取到的目标关联实体包括第一类关联实体和第二类关联实体,第一类关联实体为融合知识图谱中与查询实体具有直接连接关系,且直接连接关系与关系对象相匹配的实体,例如,查询对象为“土豆的科目是什么”,其中“科目”为关系对象,从图4中可知存在与关系对象“科目”相匹配的直接连接关系“科目”,则与查询实体具有直接连接关系(“科目”)的实体为“茄科”,则“茄科”为第一类关联实体;由于已经知道查询对象中包括的关系对象,再考虑关系对象之外的其他直接连接反而会导致目标知识图谱提供的上下文信息混乱、有效率低,因此第二类关联实体为融合知识图谱中与第一类关联实体具有连接关系,且连接路径上的中间实体的数量小于第二数量的实体,第一类关联实体与第二类关联实体之间的中间实体的数量需要小于第二数量,第二数量可以为人为设定,例如第二数量可以为1,因此第二类关联实体实际上是基于关系对象这条路径延伸开来的实体,第二类关联实体与查询实体之间的连接为非直接连接,服务器可以利用得到的第一关联实体、第二关联实体、以及各个实体之间的连接关系构建与查询对象相关联的目标知识图谱。
在一个实施例中,当查询对象中包括多个关系对象时,服务器可以依据上述实施例,针对每个关系对象,获取与查询实体具有直接连接关系,且直接连接关系与每个关系对象相匹配的实体(即获取每个查询对象的第一关联实体),以及获取与第一类关联实体具有连接关系,且连接路径上的中间实体的数量小于第二数量的实体(即获取每个查询对象的第二关联实体),从而基于第一关联实体、第二关联实体、以及各个实体之间的连接关系构建每个关系对象对应的目标知识图谱,可以通过将各个关系对象对应的目标知识图谱进行组合,得到与查询对象相关联的目标知识图谱。
S702、对所述查询对象进行特征提取,得到查询对象特征,以及对所述目标知识图谱进行特征提取,得到知识图谱特征。
在一实施例中,服务器可以将查询对象输入意图识别网络的对象特征提取单元中进行处理,得到查询对象特征,以及将目标知识图谱输入意图识别网络的图谱特征提取单元中进行处理,得到知识图谱特征。
可选地,意图识别模型可以是上述利用训练样本集针对包括对象特征提取单元、图谱特征提取单元、融合单元以及分类单元的原始模型进行分类训练得到的。优选地,该融合单元可以采用张量融合机制,则意图识别模型中的融合单元包括通过对初始张量参数的参数进行调整后得到的融合张量参数。
在一实施例中,当与查询对象相关联的目标知识图谱包括多个查询实体,且目标知识图谱包括多个查询实体中每一个查询实体分别对应的子知识图谱时,即上述与查询对象相关联的目标知识图谱包括了多个查询实体中每个查询实体分别对应的目标知识图谱时,服务器可以对每一个查询实体分别对应的子知识图谱进行特征提取,得到每一个查询实体分别对应的子图谱特征,将每一个查询实体分别对应的子图谱特征进行聚合处理,得到知识图谱特征。
在一实施例中,当包括多个查询实体时,针对每个查询实体,服务器可以从融合知识图谱中获取与每个查询实体具有关联关系的目标关联实体,以及确定每个查询实体和目标关联实体中任意两个实体之间的连接关系,根据每个查询实体、目标关联实体和连接关系,得到每一个查询实体对应的子知识图谱。
进一步地,可以利用意图识别网络的图谱特征提取单元对每一个查询实体对应的子知识图谱进行特征提取,得到每一个查询实体分别对应的子图谱特征,服务器可以将得到的各个查询实体分别对应的子图谱特征进行平均、或拼接等聚合处理,从而得到知识图谱特征。
S703、将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征。
在一实施例中,服务器可以利用意图识别网络的融合单元对查询对象特征和知识图谱特征进行融合,得到融合特征。意图识别网络的融合单元可以是将查询对象特征和知识图谱特征进行拼接,也可以是将查询对象特征和知识图谱特征输入神经网络,利用神经网络提取融合了查询对象特征和知识图谱特征的高维特征,等等。
优选地,当意图识别网络中的融合单元采取采用张量融合机制时,服务器可以获取融合张量参数,该融合张量参数为M维张量参数,M为大于或等于2的正整数。
在一实施例中,为了获取融合张量参数,服务器可以利用初始张量参数将训练对象特征和训练图谱特征进行融合,得到训练融合特征,对训练融合特征进行处理,得到预测意图识别结果,根据预测意图识别结果和训练查询对象的真实意图标签确定预测损失参数,根据预测损失参数对初始张量参数的参数进行调整,并根据调整后的初始张量参数确定融合张量参数。其中,训练对象特征为训练查询对象的特征,训练图谱特征为与训练查询对象相关联的知识图谱的特征。获取融合张量参数的详细实现过程,可以参见步骤S501-S504,本实施例不再赘述。
在一实施例中,服务器可以利用融合张量参数将查询对象特征和知识图谱特征进行融合,得到融合特征。如将查询对象特征、融合张量参数、知识图谱特征进行相乘处理,其融合方式如下述公式(5)所示。
V′logit=V′1W′【1:k】V′2 (5)
其中,V′1为查询对象特征,其维度为n×1,n为正整数,V′2为知识图谱特征,其维度为m×1,m为正整数,W′【1:k】为融合张量参数,该融合张量参数可以为维度大小为m×n×k的三维张量,【1:k】表示融合单元输出的维度为1×k,V′logit的维度为1×k。
当M为2时,融合张量参数实际为一个矩阵,优选地,可以选择M为大于2的正整数,此时融合张量参数为一个多维张量,采用多维度的融合张量参数可以有效的强化查询对象特征和知识图谱特征的融合过程,可以获取到更有深度的融合特征。
S704、对所述融合特征进行处理,得到所述查询对象的意图识别结果。
服务器可以利用意图识别模型中的分类单元对融合特征进行处理,从而得到查询对象的意图识别结果,该查询对象的意图识别结果包括查询对象与各个意图标签之间的概率值,可以将概率值大于概率阈值的意图标签作为查询对象的意图识别结果,或者,将最大概率值的意图标签作为查询对象的意图识别结果。
通过本实施例,服务器可以利用意图识别模型对查询对象,以及与查询对象相关联的目标知识图谱进行处理,从而得到查询对象特征和知识图谱特征,可以采用张量融合机制强化查询对象特征和知识图谱特征的融合,弥补了缺少上下文信息的问题,使得到的融合特征具有更丰富的语义信息,可以有效提高意图识别的准确性。
上述详细阐述了本申请实施例的方法,为了便于更好地实施本申请实施例的上述方案,相应地,下面提供了本申请实施例的装置。请参见图8,图8是本申请一个实施例提供的一种数据处理装置的结构示意图,该装置80可以包括:
获取模块801,用于获取查询对象,以及获取与所述查询对象相关联的目标知识图谱;
处理模块802,用于对所述查询对象进行特征提取,得到查询对象特征,以及对所述目标知识图谱进行特征提取,得到知识图谱特征;
所述处理模块802,还用于将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征;
所述处理模块802,还用于对所述融合特征进行处理,得到所述查询对象的意图识别结果。
在一实施例中,所述获取模块801,具体用于:
从所述查询对象中获取查询实体;
所述处理模块802,具体用于:
从融合知识图谱中确定与所述查询实体具有关联关系的目标关联实体,以及确定所述查询实体和所述目标关联实体中任意两个实体之间的连接关系;
根据所述查询实体、所述目标关联实体和所述连接关系,确定与所述查询对象相关联的目标知识图谱。
所述目标关联实体为所述融合知识图谱中与所述查询实体具有连接关系,且连接路径上的中间实体的数量小于第一数量的实体;或者,
在一实施例中,当所述查询对象中还包括查询实体的关系对象时,所述目标关联实体包括第一类关联实体和第二类关联实体,所述第一类关联实体为所述融合知识图谱中与所述查询实体具有直接连接关系,且所述直接连接关系与所述关系对象相匹配的实体;所述第二类关联实体为所述融合知识图谱中与所述第一类关联实体具有连接关系,且连接路径上的中间实体的数量小于第二数量的实体。
在一实施例中,所述获取模块801,具体用于:
获取融合张量参数,其中,所述融合张量参数为M维张量参数,M为大于或等于2的正整数;
所述处理模块802,具体用于:
利用所述融合张量参数将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征。
在一实施例中,所述处理模块802,具体用于:
利用初始张量参数将训练对象特征和训练图谱特征进行融合,得到训练融合特征,所述训练对象特征为训练查询对象的特征,所述训练图谱特征为与所述训练查询对象相关联的知识图谱的特征;
对所述训练融合特征进行处理,得到预测意图识别结果;
根据所述预测意图识别结果和所述训练查询对象的真实意图标签确定预测损失参数;
根据所述预测损失参数对所述初始张量参数的参数进行调整,并根据调整后的初始张量参数确定所述融合张量参数。
在一实施例中,当所述查询对象中包括多个查询实体时,所述目标知识图谱包括所述多个查询实体中每一个查询实体分别对应的子知识图谱;所述处理模块802,具体用于:
对所述每一个查询实体分别对应的子知识图谱进行特征提取,得到所述每一个查询实体分别对应的子图谱特征;
将所述每一个查询实体分别对应的子图谱特征进行聚合处理,得到知识图谱特征。
在一实施例中,所述处理模块802,具体用于:
将所述查询对象输入意图识别网络的对象特征提取单元中进行处理,得到查询对象特征;
将所述目标知识图谱输入所述意图识别网络的图谱特征提取单元中进行处理,得到知识图谱特征。
本申请实施例中,可以对查询对象进行特征提取,得到查询对象特征,以及对与查询对象相关联的目标知识图谱进行特征提取,得到知识图谱特征,将查询对象特征和知识图谱特征进行融合得到融合特征,对融合特征进行处理,得到查询对象的意图识别结果,可以结合知识图谱提供的上下文信息,使得用于进行意图识别的融合特征能够提供更有效的语义信息,从而有效提高意图识别的准确性。
如图9所示,图9是本申请一个实施例提供的一种计算机设备的结构示意图,该计算机设备90内部结构如图9所示,包括:一个或多个处理器901、存储器902、通信接口903。上述处理器901、存储器902和通信接口903可通过总线904或其他方式连接,本申请实施例以通过总线904连接为例。
其中,处理器901(或称CPU(Central Processing Unit,中央处理器))是计算机设备90的计算核心以及控制核心,其可以解析计算机设备90内的各类指令以及处理计算机设备90的各类数据,例如:CPU可以用于解析用户向计算机设备90所发送的开关机指令,并控制计算机设备90进行开关机操作;再如:CPU可以在计算机设备90内部结构之间传输各类交互数据,等等。通信接口903可选的可以包括标准的有线接口、无线接口(如Wi-Fi、移动通信接口等),受处理器901的控制用于收发数据。存储器902(Memory)是计算机设备90中的记忆设备,用于存放程序和数据。可以理解的是,此处的存储器902既可以包括计算机设备90的内置存储器,当然也可以包括计算机设备90所支持的扩展存储器。存储器902提供存储空间,该存储空间存储了计算机设备90的操作系统,可包括但不限于:Windows系统、Linux系统等等,本申请对此并不作限定。
在一实施例中,所述处理器901,具体用于:
获取查询对象,以及获取与所述查询对象相关联的目标知识图谱;
对所述查询对象进行特征提取,得到查询对象特征,以及对所述目标知识图谱进行特征提取,得到知识图谱特征;
将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征;
对所述融合特征进行处理,得到所述查询对象的意图识别结果。
在一实施例中,所述处理器901,具体用于:
从所述查询对象中获取查询实体;
从融合知识图谱中确定与所述查询实体具有关联关系的目标关联实体,以及确定所述查询实体和所述目标关联实体中任意两个实体之间的连接关系;
根据所述查询实体、所述目标关联实体和所述连接关系,确定与所述查询对象相关联的目标知识图谱。
在一实施例中,所述目标关联实体为所述融合知识图谱中与所述查询实体具有连接关系,且连接路径上的中间实体的数量小于第一数量的实体;或者,
当所述查询对象中还包括查询实体的关系对象时,所述目标关联实体包括第一类关联实体和第二类关联实体,所述第一类关联实体为所述融合知识图谱中与所述查询实体具有直接连接关系,且所述直接连接关系与所述关系对象相匹配的实体;所述第二类关联实体为所述融合知识图谱中与所述第一类关联实体具有连接关系,且连接路径上的中间实体的数量小于第二数量的实体。
在一实施例中,所述处理器901,具体用于:
获取融合张量参数,其中,所述融合张量参数为M维张量参数,M为大于或等于2的正整数;
利用所述融合张量参数将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征。
在一实施例中,所述处理器901,具体用于:
利用初始张量参数将训练对象特征和训练图谱特征进行融合,得到训练融合特征,所述训练对象特征为训练查询对象的特征,所述训练图谱特征为与所述训练查询对象相关联的知识图谱的特征;
对所述训练融合特征进行处理,得到预测意图识别结果;
根据所述预测意图识别结果和所述训练查询对象的真实意图标签确定预测损失参数;
根据所述预测损失参数对所述初始张量参数的参数进行调整,并根据调整后的初始张量参数确定所述融合张量参数。
在一实施例中,当所述查询对象中包括多个查询实体时,所述目标知识图谱包括所述多个查询实体中每一个查询实体分别对应的子知识图谱;所述处理器901,具体用于:
对所述每一个查询实体分别对应的子知识图谱进行特征提取,得到所述每一个查询实体分别对应的子图谱特征;
将所述每一个查询实体分别对应的子图谱特征进行聚合处理,得到知识图谱特征。
在一实施例中,所述处理器901,具体用于:
将所述查询对象输入意图识别网络的对象特征提取单元中进行处理,得到查询对象特征;
将所述目标知识图谱输入所述意图识别网络的图谱特征提取单元中进行处理,得到知识图谱特征。
本申请实施例中,可以对查询对象进行特征提取,得到查询对象特征,以及对与查询对象相关联的目标知识图谱进行特征提取,得到知识图谱特征,将查询对象特征和知识图谱特征进行融合得到融合特征,对融合特征进行处理,得到查询对象的意图识别结果,可以结合知识图谱提供的上下文信息,使得用于进行意图识别的融合特征能够提供更有效的语义信息,从而有效提高意图识别的准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读取存储介质中,该计算机程序在执行时,可包括如上述数据处理方法的实施例的流程。其中,可读的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
本申请一个或多个实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法的实施例中所执行的步骤。
本申请一个或多个实施例还提供了另一种计算机程序产品,该计算机程序产品包括计算机程序或计算机指令,该计算机程序或计算机指令被处理器执行时实现本申请实施例提供的数据处理方法的步骤。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (11)
1.一种数据处理方法,其特征在于,所述方法包括:
获取查询对象,以及获取与所述查询对象相关联的目标知识图谱;
对所述查询对象进行特征提取,得到查询对象特征,以及对所述目标知识图谱进行特征提取,得到知识图谱特征;
将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征;
对所述融合特征进行处理,得到所述查询对象的意图识别结果。
2.根据权利要求1所述的方法,其特征在于,所述获取与所述查询对象相关联的目标知识图谱,包括:
从所述查询对象中获取查询实体;
从融合知识图谱中确定与所述查询实体具有关联关系的目标关联实体,以及确定所述查询实体和所述目标关联实体中任意两个实体之间的连接关系;
根据所述查询实体、所述目标关联实体和所述连接关系,确定与所述查询对象相关联的目标知识图谱。
3.根据权利要求2所述的方法,其特征在于,所述目标关联实体为所述融合知识图谱中与所述查询实体具有连接关系,且连接路径上的中间实体的数量小于第一数量的实体;或者,
当所述查询对象中还包括查询实体的关系对象时,所述目标关联实体包括第一类关联实体和第二类关联实体,所述第一类关联实体为所述融合知识图谱中与所述查询实体具有直接连接关系,且所述直接连接关系与所述关系对象相匹配的实体;所述第二类关联实体为所述融合知识图谱中与所述第一类关联实体具有连接关系,且连接路径上的中间实体的数量小于第二数量的实体。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征,包括:
获取融合张量参数,其中,所述融合张量参数为M维张量参数,M为大于或等于2的正整数;
利用所述融合张量参数将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
利用初始张量参数将训练对象特征和训练图谱特征进行融合,得到训练融合特征,所述训练对象特征为训练查询对象的特征,所述训练图谱特征为与所述训练查询对象相关联的知识图谱的特征;
对所述训练融合特征进行处理,得到预测意图识别结果;
根据所述预测意图识别结果和所述训练查询对象的真实意图标签确定预测损失参数;
根据所述预测损失参数对所述初始张量参数的参数进行调整,并根据调整后的初始张量参数确定所述融合张量参数。
6.根据权利要求1-3中任一项所述的方法,其特征在于,当所述查询对象中包括多个查询实体时,所述目标知识图谱包括所述多个查询实体中每一个查询实体分别对应的子知识图谱;
所述对所述目标知识图谱进行特征提取,得到知识图谱特征,包括:
对所述每一个查询实体分别对应的子知识图谱进行特征提取,得到所述每一个查询实体分别对应的子图谱特征;
将所述每一个查询实体分别对应的子图谱特征进行聚合处理,得到知识图谱特征。
7.根据权利要求1所述的方法,其特征在于,所述对所述查询对象进行特征提取,得到查询对象特征,以及对所述目标知识图谱进行特征提取,得到知识图谱特征,包括:
将所述查询对象输入意图识别网络的对象特征提取单元中进行处理,得到查询对象特征;
将所述目标知识图谱输入所述意图识别网络的图谱特征提取单元中进行处理,得到知识图谱特征。
8.一种数据处理装置,其特征在于,所述装置包括:
获取模块,用于获取查询对象,以及获取与所述查询对象相关联的目标知识图谱;
处理模块,用于对所述查询对象进行特征提取,得到查询对象特征,以及对所述目标知识图谱进行特征提取,得到知识图谱特征;
所述处理模块,还用于将所述查询对象特征和所述知识图谱特征进行融合,得到融合特征;
所述处理模块,还用于对所述融合特征进行处理,得到所述查询对象的意图识别结果。
9.一种计算机设备,其特征在于,包括存储器、通信接口以及处理器,其中,所述存储器、所述通信接口和所述处理器相互连接,所述存储器存储有计算机程序,所述处理器调用所述存储器中存储的计算机程序,用于执行权利要求1-7中任一项所述的数据处理方法。
10.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的数据处理方法。
11.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序或计算机指令,所述计算机程序或计算机指令被处理器执行时实现如权利要求1-7中任一项所述的数据处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111010441.6A CN113641797A (zh) | 2021-08-30 | 2021-08-30 | 数据处理方法、装置、设备、存储介质及计算机程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111010441.6A CN113641797A (zh) | 2021-08-30 | 2021-08-30 | 数据处理方法、装置、设备、存储介质及计算机程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113641797A true CN113641797A (zh) | 2021-11-12 |
Family
ID=78424544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111010441.6A Pending CN113641797A (zh) | 2021-08-30 | 2021-08-30 | 数据处理方法、装置、设备、存储介质及计算机程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113641797A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114915514A (zh) * | 2022-03-28 | 2022-08-16 | 青岛海尔科技有限公司 | 意图的处理方法和装置、存储介质及电子装置 |
CN116386148A (zh) * | 2023-05-30 | 2023-07-04 | 国网江西省电力有限公司超高压分公司 | 基于知识图谱引导的小样本动作识别方法及系统 |
CN116702784A (zh) * | 2023-08-03 | 2023-09-05 | 腾讯科技(深圳)有限公司 | 实体链接方法、装置、计算机设备和存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110795532A (zh) * | 2019-10-18 | 2020-02-14 | 珠海格力电器股份有限公司 | 一种语音信息的处理方法、装置、智能终端以及存储介质 |
CN112417855A (zh) * | 2020-11-20 | 2021-02-26 | 平安科技(深圳)有限公司 | 文本意图识别方法、装置以及相关设备 |
-
2021
- 2021-08-30 CN CN202111010441.6A patent/CN113641797A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110795532A (zh) * | 2019-10-18 | 2020-02-14 | 珠海格力电器股份有限公司 | 一种语音信息的处理方法、装置、智能终端以及存储介质 |
CN112417855A (zh) * | 2020-11-20 | 2021-02-26 | 平安科技(深圳)有限公司 | 文本意图识别方法、装置以及相关设备 |
Non-Patent Citations (1)
Title |
---|
YANG HE ET AL: "Knowledge Graph Representation Fusion Framework for Fine-Grained Object Recognition in Smart Cities", HINDAWI COMPLEXITY, vol. 2021, 14 July 2021 (2021-07-14), pages 1 - 9 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114915514A (zh) * | 2022-03-28 | 2022-08-16 | 青岛海尔科技有限公司 | 意图的处理方法和装置、存储介质及电子装置 |
CN114915514B (zh) * | 2022-03-28 | 2024-03-22 | 青岛海尔科技有限公司 | 意图的处理方法和装置、存储介质及电子装置 |
CN116386148A (zh) * | 2023-05-30 | 2023-07-04 | 国网江西省电力有限公司超高压分公司 | 基于知识图谱引导的小样本动作识别方法及系统 |
CN116386148B (zh) * | 2023-05-30 | 2023-08-11 | 国网江西省电力有限公司超高压分公司 | 基于知识图谱引导的小样本动作识别方法及系统 |
CN116702784A (zh) * | 2023-08-03 | 2023-09-05 | 腾讯科技(深圳)有限公司 | 实体链接方法、装置、计算机设备和存储介质 |
CN116702784B (zh) * | 2023-08-03 | 2023-11-28 | 腾讯科技(深圳)有限公司 | 实体链接方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020228376A1 (zh) | 文本处理方法、模型训练方法和装置 | |
CN110866140B (zh) | 图像特征提取模型训练方法、图像搜索方法及计算机设备 | |
CN113627447B (zh) | 标签识别方法、装置、计算机设备、存储介质及程序产品 | |
CN113641797A (zh) | 数据处理方法、装置、设备、存储介质及计算机程序产品 | |
CN113761153B (zh) | 基于图片的问答处理方法、装置、可读介质及电子设备 | |
CN113298197B (zh) | 数据聚类方法、装置、设备及可读存储介质 | |
CN113590854B (zh) | 一种数据处理方法、设备以及计算机可读存储介质 | |
CN114329029B (zh) | 对象检索方法、装置、设备及计算机存储介质 | |
CN114330966A (zh) | 一种风险预测方法、装置、设备以及可读存储介质 | |
CN116580257A (zh) | 特征融合模型训练及样本检索方法、装置和计算机设备 | |
CN116601626A (zh) | 个人知识图谱构建方法、装置及相关设备 | |
WO2023213157A1 (zh) | 数据处理方法、装置、程序产品、计算机设备和介质 | |
CN114298122A (zh) | 数据分类方法、装置、设备、存储介质及计算机程序产品 | |
CN111324773A (zh) | 一种背景音乐构建方法、装置、电子设备和存储介质 | |
CN115689672A (zh) | 聊天式商品导购方法及其装置、设备、介质 | |
CN115062709A (zh) | 模型优化方法、装置、设备、存储介质及程序产品 | |
CN113128526B (zh) | 图像识别方法、装置、电子设备和计算机可读存储介质 | |
CN114329004A (zh) | 数字指纹生成、数据推送方法、装置和存储介质 | |
CN116205700A (zh) | 目标产品的推荐方法、装置、计算机设备和存储介质 | |
CN114358109A (zh) | 特征提取模型训练、样本检索方法、装置和计算机设备 | |
CN116541592A (zh) | 向量生成方法、信息推荐方法、装置、设备及介质 | |
CN115129908A (zh) | 一种模型优化方法、装置、设备、存储介质及程序产品 | |
CN116955707A (zh) | 内容标签的确定方法、装置、设备、介质及程序产品 | |
CN115168609A (zh) | 一种文本匹配方法、装置、计算机设备和存储介质 | |
CN113821676A (zh) | 视频检索方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |