CN114330353B - 虚拟场景的实体识别方法、装置、设备、介质及程序产品 - Google Patents
虚拟场景的实体识别方法、装置、设备、介质及程序产品 Download PDFInfo
- Publication number
- CN114330353B CN114330353B CN202210009904.5A CN202210009904A CN114330353B CN 114330353 B CN114330353 B CN 114330353B CN 202210009904 A CN202210009904 A CN 202210009904A CN 114330353 B CN114330353 B CN 114330353B
- Authority
- CN
- China
- Prior art keywords
- entity
- identified
- content
- entities
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种虚拟场景的实体识别方法、装置、设备、存储介质及计算机程序产品;方法包括:针对虚拟场景对应的多个待识别实体,获取各所述待识别实体的实体名称、以及所述实体名称的字符长度;基于各所述待识别实体对应的所述字符长度,从所述多个待识别实体中筛选出所述虚拟场景对应的至少一个内容实体;基于各所述待识别实体的实体名称,分别以各所述内容实体为聚类中心,对所述多个待识别实体进行聚类处理,得到至少一个实体簇;将各所述实体簇中除所述内容实体以外的待识别实体,作为用于对相应实体簇中所述内容实体进行内容扩展的可下载内容实体;通过本申请,能够提高虚拟场景的实体的识别效率。
Description
技术领域
本申请涉及信息处理技术领域,尤其涉及一种虚拟场景的实体识别方法、装置、设备、存储介质及计算机程序产品。
背景技术
人工智能(AI,Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术也逐渐应用于实体识别领域。
相关技术中,针对虚拟场景的实体识别,通常采用人工识别的方式实现,首先通过人工获取实体的实体信息,然后基于实体信息对实体进行人工识别。但是人工实体识别的方式消耗大量的人力和时间,导致实体的识别效率低下。
发明内容
本申请实施例提供一种虚拟场景的实体识别方法、装置、设备、存储介质及计算机程序产品,能够提高虚拟场景的实体的识别效率。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种虚拟场景的实体识别方法,包括:
针对虚拟场景对应的多个待识别实体,获取各所述待识别实体的实体名称、以及所述实体名称的字符长度;
基于各所述待识别实体对应的所述字符长度,从所述多个待识别实体中筛选出所述虚拟场景对应的至少一个内容实体;
基于各所述待识别实体的实体名称,分别以各所述内容实体为聚类中心,对所述多个待识别实体进行聚类处理,得到至少一个实体簇;
将各所述实体簇中除所述内容实体以外的待识别实体,作为用于对相应实体簇中所述内容实体进行内容扩展的可下载内容实体。
本申请实施例还提供一种虚拟场景的实体识别装置,包括:
获取模块,用于针对虚拟场景对应的多个待识别实体,获取各所述待识别实体的实体名称、以及所述实体名称的字符长度;
筛选模块,用于基于各所述待识别实体对应的所述字符长度,从所述多个待识别实体中筛选出所述虚拟场景对应的至少一个内容实体;
聚类模块,用于基于各所述待识别实体的实体名称,分别以各所述内容实体为聚类中心,对所述多个待识别实体进行聚类处理,得到至少一个实体簇;
确定模块,用于将各所述实体簇中除所述内容实体以外的待识别实体,作为用于对相应实体簇中所述内容实体进行内容扩展的可下载内容实体。
上述方案中,所述筛选模块,还用于基于各所述待识别实体对应的所述字符长度,从所述多个待识别实体中筛选出所述字符长度最小的待识别实体,并将所述字符长度最小的待识别实体,确定为所述虚拟场景对应的内容实体。
上述方案中,所述聚类模块,还用于当存在不属于所述实体簇的至少两个目标待识别实体时,基于各所述目标待识别实体对应的所述字符长度,从所述至少两个目标待识别实体中筛选出目标内容实体;以各所述目标内容实体为聚类中心,对所述至少两个目标待识别实体进行聚类处理,得到至少一个目标实体簇;循环执行上述操作,直至各所述待识别实体加入对应的实体簇。
上述方案中,所述内容实体的实体名称的字符长度为目标长度;所述聚类模块,还用于针对各所述内容实体分别执行如下处理,以得到至少一个实体簇:针对各所述待识别实体的实体名称,从所述实体名称的第一个字符开始,截取字符长度为所述目标长度的字符串;将所述内容实体的实体名称分别与各所述待识别实体对应的所述字符串进行比对,得到比对结果;当所述比对结果表征存在与所述内容实体的实体名称相同的目标字符串时,将所述目标字符串对应的目标待识别实体,加入以所述内容实体为聚类中心的实体簇。
上述方案中,所述内容实体的实体名称的字符长度为目标长度;所述聚类模块,还用于针对各所述待识别实体的实体名称,从所述实体名称的第一个字符开始,截取字符长度为所述目标长度的字符串;构建包括各所述待识别实体所对应键值对的实体表;其中,所述键值对中的键为所述待识别实体对应的所述字符串,所述键值对中的值为所述待识别实体的实体名称;所述聚类模块,还用于针对各所述内容实体分别执行如下处理,以得到至少一个实体簇:基于所述实体表,将所述内容实体的实体名称分别与各所述键值对中的所述键进行匹配,得到匹配结果;当所述匹配结果表征所述实体表中,存在与所述内容实体的实体名称相同的目标键时,将所述目标键对应的值所指示的待识别实体,加入以所述内容实体为聚类中心的实体簇。
上述方案中,所述聚类模块,还用于针对各所述内容实体分别执行如下处理,以得到至少一个实体簇:分别确定各所述待识别实体的实体名称与所述内容实体的实体名称间的名称相似度;将所述名称相似度高于相似度阈值的待识别实体,加入以所述内容实体为聚类中心的实体簇。
上述方案中,所述聚类模块,还用于针对各所述内容实体分别执行如下处理,以得到至少一个实体簇:获取各所述待识别实体的实体名称的第一名称向量、以及所述内容实体的实体名称的第二名称向量;分别确定各所述第一名称向量与所述第二名称向量间的向量距离;将所述向量距离低于距离阈值的第一名称向量所对应的待识别实体,加入以所述内容实体为聚类中心的实体簇。
上述方案中,所述确定模块,还用于针对各所述实体簇,分别执行如下处理:将所述实体簇中除所述内容实体以外的待识别实体,作为候选可下载内容实体,并获取所述候选可下载内容实体的描述文本;针对各所述候选可下载内容实体,分别执行如下处理:通过神经网络模型,基于所述描述文本对所述候选可下载内容实体的实体类别进行预测,得到预测结果;当所述预测结果表征所述候选可下载内容实体的实体类别为可下载内容实体类别时,将所述候选可下载内容实体确定为用于对相应实体簇中所述内容实体进行内容扩展的可下载内容实体。
上述方案中,所述确定模块,还用于当所述预测结果表征所述候选可下载内容实体的实体类别为内容实体类别时,将所述候选可下载内容实体作为所述实体簇中的候选内容实体;确定所述内容实体的实体名称与所述待识别实体的实体名称间的第一字符匹配度,并确定所述候选内容实体的实体名称与所述待识别实体的实体名称间的第二字符匹配度;当所述第一字符匹配度小于所述第二字符匹配度时,更新所述实体簇中的内容实体为所述候选内容实体。
上述方案中,所述确定模块,还用于获取所述描述文本包含的分词,并通过所述神经网络模型的向量映射层,对所述分词进行向量映射,得到所述描述文本对应的描述向量;获取所述分词在所述描述文本中的位置信息,并通过所述神经网络模型的位置编码层,对所述位置信息进行编码,得到所述描述文本对应的位置编码;通过所述神经网络模型的类别预测层,结合所述描述向量和所述位置编码,对所述候选可下载内容实体的实体类别进行预测,得到预测结果。
上述方案中,当所述分词的数量为至少两个时,所述确定模块,还用于通过所述神经网络模型的向量映射层,对各所述分词进行向量映射,得到各所述分词对应的分词向量;基于各所述分词向量,将以下向量中之一作为所述描述向量:各所述分词对应的分词向量进行拼接所得到的向量、各所述分词对应的分词向量进行平均所得到的向量。
上述方案中,所述确定模块,还用于建立各所述内容实体与所述可下载内容实体之间的关联关系;基于各所述内容实体与可下载内容实体之间的关联关系,构建所述虚拟场景对应的知识图谱,其中,所述知识图谱,用于展示各所述内容实体与所述可下载内容实体之间的关联关系。
本申请实施例还提供一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的虚拟场景的实体识别方法。
本申请实施例还提供一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时,实现本申请实施例提供的虚拟场景的实体识别方法。
本申请实施例还提供一种计算机程序产品,包括计算机程序或指令,所述计算机程序或指令被处理器执行时,实现本申请实施例提供的虚拟场景的实体识别方法。
本申请实施例具有以下有益效果:
针对虚拟场景对应的多个待识别实体,首先获取各待识别实体的实体名称、以及实体名称的字符长度,然后基于各待识别实体对应的字符长度,从多个待识别实体中筛选出虚拟场景对应的至少一个内容实体,再基于各待识别实体的实体名称,分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,得到至少一个实体簇,从而将实体簇中除内容实体以外的待识别实体,作为用于对相应实体簇中内容实体进行内容扩展的可下载内容实体。如此,实现了虚拟场景的内容实体与可下载内容实体的自动识别,提高了虚拟场景的实体的识别效率。
附图说明
图1A是本申请实施例提供的虚拟场景的实体识别系统100的架构示意图;
图1B是本申请实施例提供的虚拟场景的实体识别方法的应用场景示意图;
图2是本申请实施例提供的实施虚拟场景的实体识别方法的电子设备500的结构示意图;
图3是本申请实施例提供的虚拟场景的实体识别方法的流程示意图;
图4是本申请实施例提供的虚拟场景的实体识别方法的流程示意图;
图5是本申请实施例提供的神经网络模型的架构示意图;
图6是本申请实施例提供的虚拟场景对应的知识图谱的示意图;
图7是本申请实施例提供的虚拟场景的实体识别方法的流程示意图;
图8是本申请实施例提供的游戏实体和可下载内容实体的显示示意图;
图9是本申请实施例提供的虚拟场景的实体识别方法的流程示意图;
图10是本申请实施例提供的虚拟场景的实体识别方法的流程示意图;
图11是本申请实施例提供的游戏实体和可下载内容实体的示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)响应于,用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
2)主机游戏,即Console游戏,又名电视游戏,包含掌机游戏和家用机游戏两部分。是一种用来娱乐的交互式多媒体。通常是指使用电视屏幕为显示器,在电视上执行家用主机的游戏。
3)知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。
4)可下载内容(Downloadable Content,DLC),亦可称“追加内容下载包”,或“可下载资料包”,是一些游戏在发布之后增加的后续可下载内容,容量比较大的也可以说是资料片、扩展包相关等。一般指在游戏发售后,厂商又推出的下载包,对游戏内容进行扩展,如增加新地图,新游戏模式,新的地图、人物、剧情扩展等。DLC一般以补丁的形式更新到玩家的游戏中。
5)实体对齐:用于判断两个或者多个不同信息来源的实体是否为指向Z真实世界中同一个对象。如果多个实体表征同一个对象,则在这些实体之间构建对齐关系,同时对实体包含的信息进行融合和聚集。
6)虚拟场景,利用设备输出的区别于现实世界的场景,通过裸眼或设备的辅助能够形成对虚拟场景的视觉感知,例如通过显示屏幕输出的二维影像,通过立体投影、虚拟现实和增强现实技术等立体显示技术来输出的三维影像;此外,还可以通过各种可能的硬件形成听觉感知、触觉感知、嗅觉感知和运动感知等各种模拟现实世界的感知。
本申请实施例提供一种虚拟场景的实体识别方法、装置、设备、存储介质及计算机程序产品,能够实现虚拟场景的实体的自动识别,提高虚拟场景的实体的识别效率。
下面说明本申请实施例提供的虚拟场景的实体识别方法的实施场景。参见图1A,图1A是本申请实施例提供的虚拟场景的实体识别系统100的架构示意图,为实现支撑一个示例性应用,终端400通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合,使用无线或有线链路实现数据传输。
终端400,用于响应于针对虚拟场景的实体识别指令,发送针对虚拟场景的实体识别请求至服务器200;
服务器200,用于接收并响应于针对虚拟场景的实体识别请求,针对虚拟场景对应的多个待识别实体,获取各待识别实体的实体名称、以及实体名称的字符长度;基于各待识别实体对应的字符长度,从多个待识别实体中筛选出虚拟场景对应的至少一个内容实体;基于各待识别实体的实体名称,分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,得到至少一个实体簇;将各实体簇中除内容实体以外的待识别实体,作为用于对相应实体簇中内容实体进行内容扩展的可下载内容实体;建立各内容实体与可下载内容实体之间的关联关系,并将内容实体与可下载内容实体之间的关联关系返回至终端400;
终端400,用于接收到内容实体与可下载内容实体之间的关联关系,并基于该关联关系,显示内容实体与可下载内容实体。
在一些示例中,参见图1B,图1B是本申请实施例提供的虚拟场景的实体识别方法的应用场景示意图。这里,以虚拟场景为主机游戏场景为例,主机游戏场景包括游戏主机设备600、游戏辅助设备700以及电视端800。其中,电视端800用于显示与自身通信连接的游戏主机设备600输出的主机游戏的游戏画面;游戏辅助设备700(如游戏手柄)用于响应于用户操作,触发针对主机游戏的游戏控制指令。如此,用户可通过游戏辅助设备700触发针对主机游戏的游戏控制指令,并通过电视端800查看游戏画面,以实现主机游戏的体验。
在实际应用中,上述内容实体可以是主机游戏的安装包实体,可下载内容实体可以是主机游戏的补丁包实体。电视端800可以显示主机游戏的安装包实体,并当存在与该安装包实体关联的补丁包实体时,显示该补丁包实体。在一些示例中,电视端800还可显示补丁包实体对应的下载功能项“下载”,游戏辅助设备700响应于用户操作,发送针对下载功能项的触发指令至游戏主机设备600;游戏主机设备600接收到针对下载功能项的触发指令,执行针对补丁包实体的下载操作;同时,电视端800还可显示补丁包实体的下载过程。如此,基于本申请实施例提供的实体识别方法,可实现主机游戏的补丁包实体的获取。
在一些实施例中,本申请实施例提供的虚拟场景的实体识别方法可以由各种电子设备实施,例如,可以由终端单独实施,也可以由服务器单独实施,也可以由终端和服务器协同实施。例如终端独自执行本申请实施例提供的虚拟场景的实体识别方法,或者,终端向服务器发送实体识别请求,服务器根据接收的实体识别请求执行本申请实施例提供的虚拟场景的实体识别方法。
在一些实施例中,本申请实施例提供的实施虚拟场景的实体识别的电子设备可以是各种类型的终端设备或服务器,其中,服务器(如服务器200)可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统。终端(如终端400)可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能语音交互设备(如智能音箱)、智能家电(如智能电视)、智能手表、车载终端等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例对此不做限制。本申请实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。
在一些实施例中,本申请实施例提供的虚拟场景的实体识别方法可借助于云技术(Cloud Technology)实现,云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、以及应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源。作为示例,服务器(如服务器200)还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一些实施例中,终端或服务器可以通过运行计算机程序来实现本申请实施例提供的虚拟场景的实体识别方法,举例来说,计算机程序可以是操作系统中的原生程序或软件模块;可以是本地(Native)应用程序(APP,Application),即需要在操作系统中安装才能运行的程序;也可以是小程序,即只需要下载到浏览器环境中就可以运行的程序;还可以是能够嵌入至任意APP中的小程序。总而言之,上述计算机程序可以是任意形式的应用程序、模块或插件。
在一些实施例中,多个服务器可组成为一区块链,而服务器为区块链上的节点,区块链中的每个节点之间可以存在信息连接,节点之间可以通过上述信息连接进行信息传输。其中,本申请实施例提供的虚拟场景的实体识别方法所相关的数据(例如基于内容实体和可下载内容实体的关联关系所构建的虚拟场景对应的知识图谱)可保存于区块链上。
下面说明本申请实施例提供的实施虚拟场景的实体识别方法的电子设备。参见图2,图2是本申请实施例提供的实施虚拟场景的实体识别方法的电子设备500的结构示意图。以电子设备500为图1所示的服务器为例,本申请实施例提供的实施虚拟场景的实体识别方法的电子设备500包括:至少一个处理器510、存储器550、至少一个网络接口520和用户接口530。电子设备500中的各个组件通过总线系统540耦合在一起。可理解,总线系统540用于实现这些组件之间的连接通信。总线系统540除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统540。
处理器510可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口530包括使得能够呈现媒体内容的一个或多个输出装置531,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口530还包括一个或多个输入装置532,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器550可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器550可选地包括在物理位置上远离处理器510的一个或多个存储设备。
存储器550包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器550旨在包括任意适合类型的存储器。
在一些实施例中,存储器550能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统551,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块552,用于经由一个或多个(有线或无线)网络接口520到达其他计算设备,示例性的网络接口520包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块553,用于经由一个或多个与用户接口530相关联的输出装置531(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块554,用于对一个或多个来自一个或多个输入装置532之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的虚拟场景的实体识别装置可以采用软件方式实现,图2示出了存储在存储器550中的虚拟场景的实体识别装置555,其可以是程序和插件等形式的软件,包括以下软件模块:获取模块5551、筛选模块5552、聚类模块5553和确定模块5554,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分,将在下文中说明各个模块的功能。
在另一些实施例中,本申请实施例提供的虚拟场景的实体识别装置可以采用软硬件结合的方式实现,作为示例,本申请实施例提供的虚拟场景的实体识别装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的虚拟场景的实体识别方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
下面说明本申请实施例提供的虚拟场景的实体识别方法。在一些实施例中,本申请实施例提供的虚拟场景的实体识别方法可由各种电子设备实施,例如,可由终端单独实施,也可由服务器单独实施,也可由终端和服务器协同实施。以服务器实施为例,参见图3,图3是本申请实施例提供的虚拟场景的实体识别方法的流程示意图,本申请实施例提供的虚拟场景的实体识别方法包括:
步骤101:服务器针对虚拟场景对应的多个待识别实体,获取各待识别实体的实体名称、以及实体名称的字符长度。
在一些实施例中,该虚拟场景可以是游戏场景,该待识别实体可以是游戏场景对应的实体,比如游戏实体、以及用于对游戏实体进行内容扩展的可下载内容实体。在实际应用中,可以获取虚拟场景对应的多个待识别实体,比如可以通过爬虫的方式,从虚拟场景相关的网站等信息源爬取得到多个待识别实体。
服务器在获取到虚拟场景对应的多个待识别实体后,当接收到针对虚拟场景对应的多个待识别实体的实体识别请求时,则响应于该实体识别请求,执行本申请实施例提供的虚拟场景的实体识别方法,对虚拟场景对应的多个待识别实体进行实体识别。在实际应用中,该实体识别请求可以是用户在服务器对应的终端触发的,比如用户在终端触发针对虚拟场景对应的多个待识别实体的实体识别指令,终端响应于该实体识别指令,发送实体识别请求至服务器。
服务器接收并响应于该实体识别请求,针对虚拟场景对应的多个待识别实体,获取各待识别实体的实体名称、以及实体名称的字符长度。在实际应用中,可以通过字符级的统计方式,确定各实体名称对应的字符串所包含字符的字符数量,然后将该字符数量确定相应实体名称的字符长度。
步骤102:基于各待识别实体对应的字符长度,从多个待识别实体中筛选出虚拟场景对应的至少一个内容实体。
这里,服务器在获取各待识别实体的实体名称、以及实体名称的字符长度后,基于各待识别实体对应的字符长度,从多个待识别实体中筛选出虚拟场景对应的至少一个内容实体。在一些实施例中,该内容实体可以为虚拟场景对应的安装包实体,比如游戏安装包,相应的可下载内容实体可以为该虚拟场景对应补丁包实体,比如游戏发布后增加的后续可下载内容(例如对游戏内容进行扩展的新地图、新游戏模式、新虚拟人物等)。需要说明的是,这里的虚拟场景不特指某个虚拟场景,比如以虚拟场景为游戏为例,该至少一个内容实体中可以包括对应游戏A的内容实体,还可以包括对应游戏B的内容实体。
步骤103:基于各待识别实体的实体名称,分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,得到至少一个实体簇。
其中,实体簇由至少一个实体构成。在本申请实施例中,针对每个实体簇,该实体簇包括内容实体、以及以该内容实体为聚类中心进行聚类处理所得到的待识别实体。
这里,服务器在从多个待识别实体中筛选出虚拟场景对应的至少一个内容实体后,基于各待识别实体的实体名称,分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,从而得到至少一个实体簇。需要说明的是,实施聚类处理的多个待识别实体,为除内容实体之外的待识别实体。在实际实施时,可以基于各待识别实体的实体名称,通过K均值聚类算法、基于密度的聚类算法(Density-Based Spatial Clustering ofApplications with Noise,DBSCAN)等聚类方式来实现聚类处理。
在一些实施例中,服务器可通过如下方式从多个待识别实体中筛选出虚拟场景对应的至少一个内容实体:基于各待识别实体对应的字符长度,从多个待识别实体中筛选出字符长度最小的待识别实体,并将字符长度最小的待识别实体,确定为虚拟场景对应的内容实体。
在实际应用中,服务器可以基于各待识别实体对应的字符长度,从多个待识别实体中筛选出字符长度最小的待识别实体,将字符长度最小的待识别实体,确定为虚拟场景对应的内容实体。在实际应用中,内容实体的实体名称,往往该内容实体对应的可下载内容实体的实体名称要短,比如内容实体的实体名称为“ab”,相应的可下载内容实体的实体名称则为“abcd”,因此,在本申请实施例中,可以基于各待识别实体对应的字符长度,从多个待识别实体中筛选出字符长度最小的待识别实体,作为虚拟场景对应的内容实体。
在实际应用中,将字符长度最小的待识别实体作为虚拟场景对应的内容实体,并以该内容实体为聚类中心对多个待识别实体进行聚类处理,所得到的实体簇中可能并不能包含所有的待识别实体,即并不是每个待识别实体都加入了相应的实体簇。因此,还需要对剩余的、未加入实体簇的待识别实体进行处理,以将各待识别实体加入对应的实体簇。
在一些实施例中,在分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,得到至少一个实体簇之后,服务器确定不属于实体簇的目标待识别实体的数量;当服务器确定存在不属于实体簇的至少两个目标待识别实体时,基于各目标待识别实体对应的字符长度,从至少两个目标待识别实体中筛选出目标内容实体;以各目标内容实体为聚类中心,对至少两个目标待识别实体进行聚类处理,得到至少一个目标实体簇;循环执行上述操作,直至各待识别实体加入对应的实体簇。
这里,当服务器确定存在不属于实体簇的至少两个目标待识别实体时,则确定多个待识别实体中并不每个待识别实体都加入了相应的实体簇。
此时,1)服务器可以基于各目标待识别实体对应的字符长度,从至少两个目标待识别实体中筛选出目标内容实体。具体地,服务器基于各目标待识别实体对应的字符长度,从至少两个目标待识别实体中筛选出最小字符长度的目标待识别实体,将最小字符长度的目标待识别实体确定为目标内容实体。2)服务器以各目标内容实体为聚类中心,对至少两个目标待识别实体进行聚类处理,得到至少一个目标实体簇。循环执行上述操作,直至各待识别实体加入对应的实体簇。
作为示例,参见图4,图4是本申请实施例提供的虚拟场景的实体识别方法的流程示意图,本申请实施例提供的虚拟场景的实体识别方法包括:
步骤201:服务器针对虚拟场景对应的多个待识别实体,获取各待识别实体的实体名称、以及实体名称的字符长度;步骤202:基于各待识别实体对应的字符长度,从多个待识别实体中筛选出字符长度最小的待识别实体;步骤203:将字符长度最小的待识别实体,确定为虚拟场景对应的内容实体;步骤204:基于各待识别实体的实体名称,分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,得到至少一个实体簇;步骤205:确定是否存在不属于实体簇的目标待识别实体,若是,返回步骤202,若否,执行步骤206;步骤206:将各实体簇中除内容实体以外的待识别实体,作为用于对相应实体簇中内容实体进行内容扩展的可下载内容实体。
在一些实施例中,内容实体的实体名称的字符长度为目标长度;基于各待识别实体的实体名称,服务器可通过如下方式分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,得到至少一个实体簇:针对各内容实体分别执行如下处理,以得到至少一个实体簇:针对各待识别实体的实体名称,从实体名称的第一个字符开始,截取字符长度为目标长度的字符串;将内容实体的实体名称分别与各待识别实体对应的字符串进行比对,得到比对结果;当比对结果表征存在与内容实体的实体名称相同的目标字符串时,将目标字符串对应的目标待识别实体,加入以内容实体为聚类中心的实体簇。
这里,内容实体的实体名称的字符长度为目标长度。服务器可针对各内容实体分别执行如下处理,以对多个待识别实体进行聚类处理,得到至少一个实体簇:针对各待识别实体的实体名称,从实体名称的第一个字符开始,截取字符长度为目标长度的字符串;将内容实体的实体名称分别与各待识别实体对应的字符串进行比对,得到比对结果;当比对结果表征存在与内容实体的实体名称相同的目标字符串时,将目标字符串对应的目标待识别实体,加入以内容实体为聚类中心的实体簇;当比对结果表征不存在与内容实体的实体名称相同的目标字符串时,则单独将内容实体作为一个实体簇存在。
需要说明的是,这里进行聚类处理的待识别实体,为多个待识别实体中除内容实体之外的待识别实体。
在一些实施例中,内容实体的实体名称的字符长度为目标长度;服务器可针对各待识别实体的实体名称,从实体名称的第一个字符开始,截取字符长度为目标长度的字符串;构建包括各待识别实体所对应键值对的实体表;其中,该键值对中的键为待识别实体对应的字符串,该键值对中的值为待识别实体的实体名称;
相应的,基于各待识别实体的实体名称,服务器可通过如下方式分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,得到至少一个实体簇:针对各内容实体分别执行如下处理,以得到至少一个实体簇:基于实体表,将内容实体的实体名称分别与各键值对中的键进行匹配,得到匹配结果;当匹配结果表征实体表中,存在与内容实体的实体名称相同的目标键时,将目标键对应的值所指示的待识别实体,加入以内容实体为聚类中心的实体簇。
这里,内容实体的实体名称的字符长度为目标长度。服务器可针对各待识别实体的实体名称,从实体名称的第一个字符开始,截取字符长度为目标长度的字符串,然后构建包括各待识别实体所对应键值对的实体表,该键值对中的键(即为key)为待识别实体对应的字符串,该键值对中的值(即为value)为待识别实体的实体名称。
基于此,服务器可针对各内容实体分别执行如下处理,以对多个待识别实体进行聚类处理,得到至少一个实体簇:基于实体表,将内容实体的实体名称分别与各键值对中的键进行匹配,得到匹配结果;当匹配结果表征实体表中,存在与内容实体的实体名称相同的目标键时,将目标键对应的值所指示的待识别实体,加入以内容实体为聚类中心的实体簇。当匹配结果表征实体表中,不存在与内容实体的实体名称相同的目标键时,则单独将内容实体作为一个实体簇存在。
需要说明的是,这里进行聚类处理的待识别实体,为多个待识别实体中除内容实体之外的待识别实体。
应用上述实施例,可以通过键值对的查表方式,快速对待识别实体进行聚类处理,提高实体识别的识别效率。
在一些实施例中,基于各待识别实体的实体名称,服务器可通过如下方式分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,得到至少一个实体簇:针对各内容实体分别执行如下处理,以得到至少一个实体簇:分别确定各待识别实体的实体名称与内容实体的实体名称间的名称相似度;将名称相似度高于相似度阈值的待识别实体,加入以内容实体为聚类中心的实体簇。
这里,可通过待识别实体的实体名称和内容实体的实体名称的名称相似度进行聚类处理。在实际应用中,服务器可针对各内容实体分别执行如下处理,以对多个待识别实体进行聚类处理,得到至少一个实体簇:首先分别确定各待识别实体的实体名称与内容实体的实体名称间的名称相似度,然后确定名称相似度高于相似度阈值的待识别实体,再将名称相似度高于相似度阈值的待识别实体,加入以内容实体为聚类中心的实体簇,以得到相应的实体簇;而当不存在名称相似度高于相似度阈值的待识别实体时,则单独将内容实体作为一个实体簇存在。
需要说明的是,这里进行聚类处理的待识别实体,为多个待识别实体中除内容实体之外的待识别实体。
在一些实施例中,基于各待识别实体的实体名称,服务器可通过如下方式分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,得到至少一个实体簇:针对各内容实体分别执行如下处理,以得到至少一个实体簇:获取各待识别实体的实体名称的第一名称向量、以及内容实体的实体名称的第二名称向量;分别确定各第一名称向量与第二名称向量间的向量距离;将向量距离低于距离阈值的第一名称向量所对应的待识别实体,加入以内容实体为聚类中心的实体簇。
这里,还可通过待识别实体的实体名称和内容实体的实体名称的名称向量之间的距离进行聚类处理。在实际应用中,服务器可针对各内容实体分别执行如下处理,以对多个待识别实体进行聚类处理,得到至少一个实体簇:首先获取各待识别实体的实体名称的第一名称向量、以及内容实体的实体名称的第二名称向量;然后分别确定各第一名称向量与第二名称向量间的向量距离,比如欧式距离、切比雪夫距离、或者余弦距离等;再确定向量距离低于距离阈值的第一名称向量所对应的待识别实体,从而将向量距离低于距离阈值的第一名称向量所对应的待识别实体,加入以内容实体为聚类中心的实体簇,以得到相应的实体簇;而当不存在向量距离低于距离阈值的第一名称向量所对应的待识别实体时,则单独将内容实体作为一个实体簇存在。
需要说明的是,这里进行聚类处理的待识别实体,为多个待识别实体中除内容实体之外的待识别实体。
步骤104:将各实体簇中除内容实体以外的待识别实体,作为用于对相应实体簇中内容实体进行内容扩展的可下载内容实体。
这里,服务器在分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,得到至少一个实体簇后,针对各实体簇分别执行如下处理:将实体簇中除内容实体以外的待识别实体,作为用于对相应实体簇中内容实体进行内容扩展的可下载内容实体。在一些实施例中,以虚拟场景为游戏场景为例,该内容实体可以为游戏场景的安装包实体,比如游戏安装包;该内容实体对应的可下载内容实体则可以为该虚拟场景的安装包实体所对应的补丁包实体,用于对安装包实体进行内容扩展,比如游戏场景在后续更新过程中所增加的可下载内容(例如对游戏内容进行扩展的新地图、新游戏模式、新虚拟人物、新虚拟道具等),以补丁包的形式存在。
在一些实施例中,服务器可通过如下方式将各实体簇中除内容实体以外的待识别实体,作为用于对相应实体簇中内容实体进行内容扩展的可下载内容实体:针对各实体簇分别执行如下处理:将实体簇中除内容实体以外的待识别实体,作为候选可下载内容实体,并获取候选可下载内容实体的描述文本;通过神经网络模型,基于描述文本对候选可下载内容实体的实体类别进行预测,得到预测结果;当预测结果表征候选可下载内容实体的实体类别为可下载内容实体类别时,将候选可下载内容实体确定为用于对相应实体簇中内容实体进行内容扩展的可下载内容实体。
这里,当对待识别实体进行聚类处理完成后,针对聚类得到的各实体簇可分别执行如下处理:可以将实体簇中除内容实体以外的待识别实体,作为候选可下载内容实体,然后通过预训练的神经网络模型,对候选可下载内容实体的实体类别进行进一步精确的预测。该预训练的神经网络模型可以是以内容实体的描述文本和可下载内容实体的描述文本构建训练样本,然后基于训练样本、以及样本对应的标签(即内容实体和可下载内容实体)进行训练得到的,该神经网络模型可以是分类模型,也可以是回归模型。
在通过预训练的神经网络模型对候选可下载内容实体的实体类别进行预测时,首先获取候选可下载内容实体的描述文本,然后将候选可下载内容实体的描述文本输入至预训练的神经网络模型中,通过神经网络模型,基于描述文本对候选可下载内容实体的实体类别进行预测,得到预测结果。
当该预测结果表征候选可下载内容实体的实体类别为可下载内容实体类别时,则将候选可下载内容实体确定为用于对相应实体簇中内容实体进行内容扩展的可下载内容实体。如此,可以提高可下载内容实体的识别准确率。
在一些实施例中,当预测结果表征候选可下载内容实体的实体类别为内容实体类别时,服务器可将候选可下载内容实体作为实体簇中的候选内容实体;确定内容实体的实体名称与待识别实体的实体名称间的第一字符匹配度,并确定候选内容实体的实体名称与待识别实体的实体名称间的第二字符匹配度;当第一字符匹配度小于第二字符匹配度时,更新实体簇中的内容实体为候选内容实体。
在实际应用中,上述聚类处理得到的候选可下载内容实体还可能是内容实体。当预测结果表征候选可下载内容实体的实体类别为内容实体类别时,则表示在该候选可下载内容实体所在的实体簇中,存在多个内容实体,因此,可以将该候选可下载内容实体作为实体簇中的候选内容实体,然后将该候选内容实体和当前作为实体簇的聚类中心的内容实体,分别和实体簇中其他待识别实体进行匹配度比较,以确定候选内容实体、和当前作为实体簇的聚类中心的内容实体中,和实体簇中其他待识别实体更为匹配的内容实体。
在实际应用中,可以确定内容实体的实体名称与待识别实体的实体名称间的第一字符匹配度,并确定候选内容实体的实体名称与待识别实体的实体名称间的第二字符匹配度。具体地,从内容实体的实体名称的首个字符开始,将该首个字符和待识别实体的实体名称的首个字符比较,若相同则获取首字符的下一字符进行比较,如此类推,确定相同字符的数量,将相同字符的数量作为第一字符匹配度。第二字符匹配度也通过上述方法得到。
当第一字符匹配度小于第二字符匹配度时,则更新实体簇中的内容实体为候选内容实体。此时,更新前作为实体簇的聚类中心的内容实体则可以舍弃,可以认为更新前作为实体簇的聚类中心的内容实体仅为候选内容实体的一部分。当第一字符匹配度大于第二字符匹配度时,则不更新实体簇中的内容实体。
在一些实施例中,通过神经网络模型,服务器可通过如下方式基于描述文本对候选可下载内容实体的实体类别进行预测,得到预测结果:获取描述文本包含的分词,并通过神经网络模型的向量映射层,对分词进行向量映射,得到描述文本对应的描述向量;获取分词在描述文本中的位置信息,并通过神经网络模型的位置编码层,对位置信息进行编码,得到描述文本对应的位置编码;通过神经网络模型的类别预测层,结合描述向量和位置编码,对候选可下载内容实体的实体类别进行预测,得到预测结果。
这里,神经网络模型可以包括向量映射层、位置编码层以及类别预测层。在实际实施时,可以首先获取描述文本包含的分词,即对描述文本进行分词处理,得到描述文本包含的分词,然后通过神经网络模型的向量映射层,对分词进行向量映射,得到描述文本对应的描述向量。在一些实施例中,当分词的数量为至少两个时,通过神经网络模型的向量映射层,服务器可通过如下方式对分词进行向量映射,得到描述文本对应的描述向量:通过神经网络模型的向量映射层,对各分词进行向量映射,得到各分词对应的分词向量;基于各分词向量,将以下向量中之一作为描述向量:各分词对应的分词向量进行拼接所得到的向量、各分词对应的分词向量进行平均所得到的向量。
在实际实施时,上述描述向量可以是各分词对应的分词向量进行拼接所得到的向量,也可以是各分词对应的分词向量进行平均所得到的向量。
然后获取分词在描述文本中的位置信息,并通过神经网络模型的位置编码层,对位置信息进行编码,得到描述文本对应的位置编码。从而通过神经网络模型的类别预测层,结合描述向量和位置编码,对候选可下载内容实体的实体类别进行预测,得到预测结果。
作为示例,参见图5,图5是本申请实施例提供的神经网络模型的架构示意图。这里,该神经网络模型基于Transformer Ecoder网络构建,包括向量映射层、位置编码层以及类别预测层。其中,类别预测层由多头注意力机制(即Multi-head Attention)网络、残差连接和标准化网络(即Add&Layer Normaliz ation)、以及前馈神经网络(即Feed Forward)构成。
在一些实施例中,服务器可通过如下方式构建虚拟场景对应的知识图谱:建立各内容实体与可下载内容实体之间的关联关系;基于各内容实体与可下载内容实体之间的关联关系,构建虚拟场景对应的知识图谱。
这里,服务器在识别出虚拟场景的各内容实体、以及对应该内容实体的可下载内容实体后,建立各内容实体与可下载内容实体之间的关联关系,从而基于各内容实体与可下载内容实体之间的关联关系,构建虚拟场景对应的知识图谱。如此,服务器则可以将知识图谱返回至终端,由终端显示该知识图谱,以显示具有关联关系的内容实体与可下载内容实体。如此,在提高虚拟场景的内容实体与可下载内容实体的识别效率和准确率的基础上,还能够提高知识图谱的构建效率和质量。
作为示例,参见图6,图6是本申请实施例提供的虚拟场景对应的知识图谱的示意图。这里,该知识图谱表示:虚拟场景对应的内容实体包括内容实体A、内容实体B和内容实体C,与内容实体A具备关联关系的可下载内容实体包括A1和A2,与内容实体B具备关联关系的可下载内容实体包括B1、B2和B3,与内容实体C具备关联关系的可下载内容实体包括C1。
应用本申请上述实施例,针对虚拟场景对应的多个待识别实体,首先获取各待识别实体的实体名称、以及实体名称的字符长度,然后基于各待识别实体对应的字符长度,从多个待识别实体中筛选出虚拟场景对应的至少一个内容实体,再基于各待识别实体的实体名称,分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,得到至少一个实体簇,从而将实体簇中除内容实体以外的待识别实体,作为用于对相应实体簇中内容实体进行内容扩展的可下载内容实体。如此,实现了虚拟场景的内容实体与可下载内容实体的自动识别,提高了虚拟场景的实体的识别效率。
下面将说明本申请实施例在一个实际的应用场景中的示例性应用。以虚拟场景为游戏场景为例,本申请实施例提供的虚拟场景的实体识别方法,能够识别游戏场景下的游戏实体和相应的可下载内容(Downloadable Content)实体,提高了实体识别的效率和准确率。
在游戏知识图谱的构建过程中,需要获取大量的游戏实体和DLC实体(比如针对电脑(Personal Computer,PC)游戏和Console游戏,从相关网站爬虫抓取大量实体),然后基于游戏实体进行实体对齐,以将来自于不同信息源的DLC实体进行准确地融合,实体对齐作为构建知识图谱的关键步骤之一,直接决定了构建的知识图谱的质量。而通过爬虫爬取到的大量实体,不仅包括游戏实体,还包括DLC实体,DLC不属于游戏实体,需要从爬到的大量实体中进行识别,否则直接以游戏实体的身份进入到实体对齐过程中将严重影响实体对齐的效果。
相关技术中,DLC实体识别的方案包括:
1)人工实体识别。针对待识别实体,人工获取相应的实体信息,基于实体信息判断出实体是否为DLC实体,但是人工实体识别的方式消耗大量的人力和时间,导致实体的识别效率低下,从而会降低新的游戏实体和DLC实体融合到知识图谱的响应速度。
2)基于实体对齐的识别。部分信息源可以给出实体是否为DLC实体,如此,针对无法给出是DLC实体的源,可以向能给出DLC实体的源进行对齐,即如果某个实体已经给出是DLC实体,那么在其他信息源上出现的该实体也是DLC实体。但是大部分信息源无法给出实体是否是DLC实体,降低了DLC实体识别的召回率,而不同的信息源对齐的难度较大,如果无法准确对齐实体,将会出现误识别的情况,导致实体识别准确率降低。
基于此,本申请实施例提供一种虚拟场景的实体识别方法,能够识别游戏场景下的游戏实体和相应的DLC实体,提高了实体识别的效率和准确率。在本申请实施例中,通过召回单元和神经网络识别单元来实现DLC实体的识别,首先通过召回单元进行海量实体的快速召回,得到游戏实体对应的候选DLC实体,然后通过神经网络识别单元对候选DLC实体进行实体类别预测,准确筛选出属于游戏实体的DLC实体。
参见图7,图7是本申请实施例提供的虚拟场景的实体识别方法的流程示意图,包括:步骤301,爬虫爬取到待识别实体;步骤302,将待识别实体输入召回单元,通过召回单元输出游戏实体和对应的候选DLC实体;步骤303,将候选DLC实体输入神经网络识别单元,通过神经网络模型对候选DLC实体进行识别,确定游戏实体对应的DLC实体。
这里,第一个部分是:使用召回单元,将爬虫爬到的所有待识别实体进行简单的聚类,得到以游戏实体为聚类中心的实体簇,该实体簇中除游戏实体之外的待识别实体为候选DLC实体。第二个部分是:基于召回单元输出的候选DLC实体,将候选DLC实体的描述文本输入预训练的神经网络模型,通过神经网络模型对候选DLC实体进行准确的识别,确定候选DLC实体是DLC实体还是游戏实体,以保证实体识别的识别精度。
在一些实施例中,本申请实施例提供的虚拟场景的实体识别方法的应用场景可以为:通过外部信息源爬取到海量实体,然后采用本申请实施例提供的虚拟场景的实体识别方法快速而准确地识别出爬取的海量实体中的游戏实体以及相应的DLC实体,然后建立游戏实体和DLC实体之间的关联关系,从而基于该关联关系显示游戏实体和DLC实体。作为示例,参见图8,图8是本申请实施例提供的游戏实体和可下载内容实体的显示示意图。这里,显示有游戏实体“Risk of XXX2”,以及该游戏实体“Risk of XXX2”对应的DLC实体“Riskof XXX2 Soundtrack”。
接下来首先对本申请实施例提供的召回单元进行说明。参见图9,图9是本申请实施例提供的虚拟场景的实体识别方法的流程示意图,包括:
步骤401:从信息源(比如游戏相关网站)通过爬虫方式爬取到多个待识别实体。
步骤402:基于字符级统计多个待识别实体的实体名称的字符长度,得到实体名称的最大字符长度max_len和最小字符长度min_len。
步骤403:遍历字符长度i从最小字符长度min_len到最大字符长度max_len。
步骤404:针对除实体名称的字符长度为i的目标实体之外的待识别实体,构建哈希表。
这里,哈希表中的key是待识别实体的实体名称中前i个字符构成的字符串,哈希表中的value是待识别实体的实体名称。
步骤405:针对目标实体(即实体名称的字符长度为i的实体)的实体名称,判断哈希表中是否存在与目标实体的实体名称一致的目标key。若是,执行步骤406,若否,执行步骤408。
步骤406:将目标实体作为游戏实体,将目标key对应的value所指示的待识别实体作为候选DLC实体,并加入以目标实体为聚类中心的实体簇。
步骤407:将哈希表中除目标key以外的key对应的value所指示的待识别实体作为待分配实体。
这里,基于哈希表的构建策略,如果两个实体名称的前i个字符是一样的,该两个实体名称对应的实体会被聚合在一起,如此可以对待识别实体进行快速聚合,得到多个实体簇。
当哈希表中存在与目标实体名称一致的key时,加入该实体簇的实体将不会进入下一轮迭代,直到所有待识别实体基于实体名称均分配至相应的实体簇才会迭代结束,生成游戏实体对应的候选DLC实体。
步骤408:将目标实体作为游戏实体,将哈希表中value所指示的待识别实体作为待分配实体。
步骤409:判断是否存在待分配实体,若是,返回步骤403,若否,执行步骤410。
步骤410:生成游戏实体对应的候选DLC实体。
接下来继续对本申请实施例提供的神经网络识别单元进行说明。参见图10,图10是本申请实施例提供的虚拟场景的实体识别方法的流程示意图,包括:
步骤501:获取游戏实体对应的候选DLC实体。
步骤502:通过神经网络模型对候选DLC实体的实体类别进行预测,得到预测结果。
这里,该神经网络模型的输入为候选DLC实体的描述文本,通过神经网络模型的向量映射层对描述文本包含的每个分词进行向量化表达,得到对应的分词向量,将所有分词向量进行平均得到描述文本的描述向量,如下公式所示:
其中,DocVector为描述文本的描述向量,xj为描述文本的第j个分词向量,n为分词向量的数量。
然后获取描述文本包含的分词对应的位置编码,从而基于描述文本的描述向量、以及描述文本包含的分词对应的位置编码,通过神经网络模型对候选DLC实体的实体类别进行预测,得到预测结果,以基于预测结果确定候选DLC实体是否为DLC实体。
步骤503:基于预测结果确定候选DLC实体是否为DLC实体,若是,执行步骤504,若否,执行步骤505。
步骤504:将候选DLC实体确定为DLC实体。
步骤505:将候选DLC实体确定为新的游戏实体。
这里,由于在候选DLC实体中,基于神经网络模型可能会预测到某个候选DLC实体是游戏实体而非DLC实体。但可以确定的是,目标实体(即上述确定为游戏实体的待识别实体)的实体名称一定是哈希表中value对应的待识别实体的实体名称的一部分,因此对于value对应多个游戏实体的情况,基于最长字符串匹配原则将DLC实体分配到对应的游戏实体中。
步骤506:建立游戏实体和DLC实体的关联关系。
作为示例,参见图11,图11是本申请实施例提供的游戏实体和可下载内容实体的示意图。这里,第一列是经过算法识别之后被认为是游戏实体的实体,第二列是经过算法识别之后被认为是对应游戏实体的DLC实体。
本申请实施例可应用于游戏数据分析平台,该平台可通过采买、爬取、挖掘等方式获取海量游戏数据,构建游戏行业情报数据地图以及基于游戏的知识图谱,帮助全面地、及时地了解行业变化,沉淀个性化分析报告。
应用本申请上述实施例,1)在召回单元进行了算法时间复杂度的优化,将时间复杂度从O(N*N)降低到O(N*L),其中N代表待识别实体的数量,量级一般在百万级,L一般为个位数,提高了实体识别的效率;2)通过神经网络模型实现对候选DLC实体的进一步精确识别,得到游戏实体对应的DLC实体,提高了实体识别的准确率。如此,当基于识别的游戏实体和DLC实体进行实体对齐时,可以提升实体对齐的准确率,进而构建更加高质量的游戏知识图谱。
可以理解的是,在本申请实施例中,涉及到用户信息等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
下面继续说明本申请实施例提供的虚拟场景的实体识别装置555的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器550的虚拟场景的实体识别装置555中的软件模块可以包括:
获取模块5551,用于针对虚拟场景对应的多个待识别实体,获取各所述待识别实体的实体名称、以及所述实体名称的字符长度;
筛选模块5552,用于基于各所述待识别实体对应的所述字符长度,从所述多个待识别实体中筛选出所述虚拟场景对应的至少一个内容实体;
聚类模块5553,用于基于各所述待识别实体的实体名称,分别以各所述内容实体为聚类中心,对所述多个待识别实体进行聚类处理,得到至少一个实体簇;
确定模块5554,用于将各所述实体簇中除所述内容实体以外的待识别实体,作为用于对相应实体簇中所述内容实体进行内容扩展的可下载内容实体。
在一些实施例中,所述筛选模块5552,还用于基于各所述待识别实体对应的所述字符长度,从所述多个待识别实体中筛选出所述字符长度最小的待识别实体,并将所述字符长度最小的待识别实体,确定为所述虚拟场景对应的内容实体。
在一些实施例中,所述聚类模块5553,还用于当存在不属于所述实体簇的至少两个目标待识别实体时,基于各所述目标待识别实体对应的所述字符长度,从所述至少两个目标待识别实体中筛选出目标内容实体;以各所述目标内容实体为聚类中心,对所述至少两个目标待识别实体进行聚类处理,得到至少一个目标实体簇;循环执行上述操作,直至各所述待识别实体加入对应的实体簇。
在一些实施例中,所述内容实体的实体名称的字符长度为目标长度;所述聚类模块5553,还用于针对各所述内容实体分别执行如下处理,以得到至少一个实体簇:针对各所述待识别实体的实体名称,从所述实体名称的第一个字符开始,截取字符长度为所述目标长度的字符串;将所述内容实体的实体名称分别与各所述待识别实体对应的所述字符串进行比对,得到比对结果;当所述比对结果表征存在与所述内容实体的实体名称相同的目标字符串时,将所述目标字符串对应的目标待识别实体,加入以所述内容实体为聚类中心的实体簇。
在一些实施例中,所述内容实体的实体名称的字符长度为目标长度;所述聚类模块5553,还用于针对各所述待识别实体的实体名称,从所述实体名称的第一个字符开始,截取字符长度为所述目标长度的字符串;构建包括各所述待识别实体所对应键值对的实体表;其中,所述键值对中的键为所述待识别实体对应的所述字符串,所述键值对中的值为所述待识别实体的实体名称;所述聚类模块5553,还用于针对各所述内容实体分别执行如下处理,以得到至少一个实体簇:基于所述实体表,将所述内容实体的实体名称分别与各所述键值对中的所述键进行匹配,得到匹配结果;当所述匹配结果表征所述实体表中,存在与所述内容实体的实体名称相同的目标键时,将所述目标键对应的值所指示的待识别实体,加入以所述内容实体为聚类中心的实体簇。
在一些实施例中,所述聚类模块5553,还用于针对各所述内容实体分别执行如下处理,以得到至少一个实体簇:分别确定各所述待识别实体的实体名称与所述内容实体的实体名称间的名称相似度;将所述名称相似度高于相似度阈值的待识别实体,加入以所述内容实体为聚类中心的实体簇。
在一些实施例中,所述聚类模块5553,还用于针对各所述内容实体分别执行如下处理,以得到至少一个实体簇:获取各所述待识别实体的实体名称的第一名称向量、以及所述内容实体的实体名称的第二名称向量;分别确定各所述第一名称向量与所述第二名称向量间的向量距离;将所述向量距离低于距离阈值的第一名称向量所对应的待识别实体,加入以所述内容实体为聚类中心的实体簇。
在一些实施例中,所述确定模块5554,还用于针对各所述实体簇,分别执行如下处理:将所述实体簇中除所述内容实体以外的待识别实体,作为候选可下载内容实体,并获取所述候选可下载内容实体的描述文本;针对各所述候选可下载内容实体,分别执行如下处理:通过神经网络模型,基于所述描述文本对所述候选可下载内容实体的实体类别进行预测,得到预测结果;当所述预测结果表征所述候选可下载内容实体的实体类别为可下载内容实体类别时,将所述候选可下载内容实体确定为用于对相应实体簇中所述内容实体进行内容扩展的可下载内容实体。
在一些实施例中,所述确定模块5554,还用于当所述预测结果表征所述候选可下载内容实体的实体类别为内容实体类别时,将所述候选可下载内容实体作为所述实体簇中的候选内容实体;确定所述内容实体的实体名称与所述待识别实体的实体名称间的第一字符匹配度,并确定所述候选内容实体的实体名称与所述待识别实体的实体名称间的第二字符匹配度;当所述第一字符匹配度小于所述第二字符匹配度时,更新所述实体簇中的内容实体为所述候选内容实体。
在一些实施例中,所述确定模块5554,还用于获取所述描述文本包含的分词,并通过所述神经网络模型的向量映射层,对所述分词进行向量映射,得到所述描述文本对应的描述向量;获取所述分词在所述描述文本中的位置信息,并通过所述神经网络模型的位置编码层,对所述位置信息进行编码,得到所述描述文本对应的位置编码;通过所述神经网络模型的类别预测层,结合所述描述向量和所述位置编码,对所述候选可下载内容实体的实体类别进行预测,得到预测结果。
在一些实施例中,当所述分词的数量为至少两个时,所述确定模块5554,还用于通过所述神经网络模型的向量映射层,对各所述分词进行向量映射,得到各所述分词对应的分词向量;基于各所述分词向量,将以下向量中之一作为所述描述向量:各所述分词对应的分词向量进行拼接所得到的向量、各所述分词对应的分词向量进行平均所得到的向量。
在一些实施例中,所述确定模块5554,还用于建立各所述内容实体与所述可下载内容实体之间的关联关系;基于各所述内容实体与可下载内容实体之间的关联关系,构建所述虚拟场景对应的知识图谱,其中,所述知识图谱,用于展示各所述内容实体与所述可下载内容实体之间的关联关系。
应用本申请上述实施例,针对虚拟场景对应的多个待识别实体,首先获取各待识别实体的实体名称、以及实体名称的字符长度,然后基于各待识别实体对应的字符长度,从多个待识别实体中筛选出虚拟场景对应的至少一个内容实体,再基于各待识别实体的实体名称,分别以各内容实体为聚类中心,对多个待识别实体进行聚类处理,得到至少一个实体簇,从而将实体簇中除内容实体以外的待识别实体,作为用于对相应实体簇中内容实体进行内容扩展的可下载内容实体。如此,实现了虚拟场景的内容实体与可下载内容实体的自动识别,提高了虚拟场景的实体的识别效率。
本申请实施例还提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例提供的虚拟场景的实体识别方法。
本申请实施例还提供一种计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的虚拟场景的实体识别方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (13)
1.一种虚拟场景的实体识别方法,其特征在于,所述方法包括:
针对虚拟场景对应的多个待识别实体,获取各所述待识别实体的实体名称、以及所述实体名称的字符长度;
基于各所述待识别实体对应的所述字符长度,从所述多个待识别实体中筛选出所述字符长度最小的至少一个待识别实体,并将所述字符长度最小的至少一个待识别实体,作为所述虚拟场景对应的至少一个内容实体;
基于各所述待识别实体的实体名称,分别以各所述内容实体为聚类中心,对所述多个待识别实体进行聚类处理,得到至少一个实体簇;
针对各所述实体簇,分别执行如下处理:
将所述实体簇中除所述内容实体以外的待识别实体,作为候选可下载内容实体,并获取所述候选可下载内容实体的描述文本;
通过神经网络模型,基于所述描述文本对所述候选可下载内容实体的实体类别进行预测,得到预测结果;
当所述预测结果表征所述候选可下载内容实体的实体类别为可下载内容实体类别时,将所述候选可下载内容实体作为用于对所述实体簇中所述内容实体进行内容扩展的可下载内容实体。
2.如权利要求1所述的方法,其特征在于,所述分别以各所述内容实体为聚类中心,对所述多个待识别实体进行聚类处理,得到至少一个实体簇之后,所述方法还包括:
当存在不属于所述实体簇的至少两个目标待识别实体时,基于各所述目标待识别实体对应的所述字符长度,从所述至少两个目标待识别实体中筛选出目标内容实体;
以各所述目标内容实体为聚类中心,对所述至少两个目标待识别实体进行聚类处理,得到至少一个目标实体簇;
循环执行上述操作,直至各所述待识别实体加入对应的实体簇。
3.如权利要求1所述的方法,其特征在于,所述内容实体的实体名称的字符长度为目标长度;所述基于各所述待识别实体的实体名称,分别以各所述内容实体为聚类中心,对所述多个待识别实体进行聚类处理,得到至少一个实体簇,包括:
针对各所述内容实体分别执行如下处理,以得到至少一个实体簇:
针对各所述待识别实体的实体名称,从所述实体名称的第一个字符开始,截取字符长度为所述目标长度的字符串;
将所述内容实体的实体名称分别与各所述待识别实体对应的所述字符串进行比对,得到比对结果;
当所述比对结果表征存在与所述内容实体的实体名称相同的目标字符串时,将所述目标字符串对应的目标待识别实体,加入以所述内容实体为聚类中心的实体簇。
4.如权利要求1所述的方法,其特征在于,所述内容实体的实体名称的字符长度为目标长度;所述方法还包括:
针对各所述待识别实体的实体名称,从所述实体名称的第一个字符开始,截取字符长度为所述目标长度的字符串;
构建包括各所述待识别实体所对应键值对的实体表;其中,所述键值对中的键为所述待识别实体对应的所述字符串,所述键值对中的值为所述待识别实体的实体名称;
所述基于各所述待识别实体的实体名称,分别以各所述内容实体为聚类中心,对所述多个待识别实体进行聚类处理,得到至少一个实体簇,包括:
针对各所述内容实体分别执行如下处理,以得到至少一个实体簇:
基于所述实体表,将所述内容实体的实体名称分别与各所述键值对中的所述键进行匹配,得到匹配结果;
当所述匹配结果表征所述实体表中,存在与所述内容实体的实体名称相同的目标键时,将所述目标键对应的值所指示的待识别实体,加入以所述内容实体为聚类中心的实体簇。
5.如权利要求1所述的方法,其特征在于,所述基于各所述待识别实体的实体名称,分别以各所述内容实体为聚类中心,对所述多个待识别实体进行聚类处理,得到至少一个实体簇,包括:
针对各所述内容实体分别执行如下处理,以得到至少一个实体簇:
分别确定各所述待识别实体的实体名称与所述内容实体的实体名称间的名称相似度;
将所述名称相似度高于相似度阈值的待识别实体,加入以所述内容实体为聚类中心的实体簇。
6.如权利要求1所述的方法,其特征在于,所述基于各所述待识别实体的实体名称,分别以各所述内容实体为聚类中心,对所述多个待识别实体进行聚类处理,得到至少一个实体簇,包括:
针对各所述内容实体分别执行如下处理,以得到至少一个实体簇:
获取各所述待识别实体的实体名称的第一名称向量、以及所述内容实体的实体名称的第二名称向量;
分别确定各所述第一名称向量与所述第二名称向量间的向量距离;
将所述向量距离低于距离阈值的第一名称向量所对应的待识别实体,加入以所述内容实体为聚类中心的实体簇。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
当所述预测结果表征所述候选可下载内容实体的实体类别为内容实体类别时,将所述候选可下载内容实体作为所述实体簇中的候选内容实体;
确定所述内容实体的实体名称与所述待识别实体的实体名称间的第一字符匹配度,并确定所述候选内容实体的实体名称与所述待识别实体的实体名称间的第二字符匹配度;
当所述第一字符匹配度小于所述第二字符匹配度时,更新所述实体簇中的内容实体为所述候选内容实体。
8.如权利要求1所述的方法,其特征在于,所述通过神经网络模型,基于所述描述文本对所述候选可下载内容实体的实体类别进行预测,得到预测结果,包括:
获取所述描述文本包含的分词,并通过所述神经网络模型的向量映射层,对所述分词进行向量映射,得到所述描述文本对应的描述向量;
获取所述分词在所述描述文本中的位置信息,并通过所述神经网络模型的位置编码层,对所述位置信息进行编码,得到所述描述文本对应的位置编码;
通过所述神经网络模型的类别预测层,结合所述描述向量和所述位置编码,对所述候选可下载内容实体的实体类别进行预测,得到预测结果。
9.如权利要求8所述的方法,其特征在于,当所述分词的数量为至少两个时,所述通过所述神经网络模型的向量映射层,对所述分词进行向量映射,得到所述描述文本对应的描述向量,包括:
通过所述神经网络模型的向量映射层,对各所述分词进行向量映射,得到各所述分词对应的分词向量;
基于各所述分词向量,将以下向量中之一作为所述描述向量:
各所述分词对应的分词向量进行拼接所得到的向量、各所述分词对应的分词向量进行平均所得到的向量。
10.如权利要求1所述的方法,其特征在于,所述方法还包括:
建立所述内容实体与所述可下载内容实体之间的关联关系;
基于各所述内容实体与所述可下载内容实体之间的关联关系,构建所述虚拟场景对应的知识图谱;
其中,所述知识图谱,用于展示各所述内容实体与所述可下载内容实体之间的关联关系。
11.一种虚拟场景的实体识别装置,其特征在于,所述装置包括:
获取模块,用于针对虚拟场景对应的多个待识别实体,获取各所述待识别实体的实体名称、以及所述实体名称的字符长度;
筛选模块,用于基于各所述待识别实体对应的所述字符长度,从所述多个待识别实体中筛选出所述字符长度最小的至少一个待识别实体,并将所述字符长度最小的至少一个待识别实体,作为所述虚拟场景对应的至少一个内容实体;
聚类模块,用于基于各所述待识别实体的实体名称,分别以各所述内容实体为聚类中心,对所述多个待识别实体进行聚类处理,得到至少一个实体簇;
确定模块,用于针对各所述实体簇,分别执行如下处理:将所述实体簇中除所述内容实体以外的待识别实体,作为候选可下载内容实体,并获取所述候选可下载内容实体的描述文本;通过神经网络模型,基于所述描述文本对所述候选可下载内容实体的实体类别进行预测,得到预测结果;当所述预测结果表征所述候选可下载内容实体的实体类别为可下载内容实体类别时,将所述候选可下载内容实体作为用于对所述实体簇中所述内容实体进行内容扩展的可下载内容实体。
12.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至10任一项所述的虚拟场景的实体识别方法。
13.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时,实现权利要求1至10任一项所述的虚拟场景的实体识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210009904.5A CN114330353B (zh) | 2022-01-06 | 2022-01-06 | 虚拟场景的实体识别方法、装置、设备、介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210009904.5A CN114330353B (zh) | 2022-01-06 | 2022-01-06 | 虚拟场景的实体识别方法、装置、设备、介质及程序产品 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114330353A CN114330353A (zh) | 2022-04-12 |
CN114330353B true CN114330353B (zh) | 2023-06-13 |
Family
ID=81024144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210009904.5A Active CN114330353B (zh) | 2022-01-06 | 2022-01-06 | 虚拟场景的实体识别方法、装置、设备、介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114330353B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115146627B (zh) * | 2022-07-26 | 2023-05-02 | 平安科技(深圳)有限公司 | 实体识别方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104811975A (zh) * | 2015-03-24 | 2015-07-29 | 联想(北京)有限公司 | 控制方法、装置及电子设备 |
US9998339B1 (en) * | 2017-02-06 | 2018-06-12 | Comtrade Software Inc. | Application awareness for virtual infrastructure environments |
CN111640193A (zh) * | 2020-06-05 | 2020-09-08 | 浙江商汤科技开发有限公司 | 文字处理方法、装置、计算机设备及存储介质 |
WO2021212682A1 (zh) * | 2020-04-21 | 2021-10-28 | 平安国际智慧城市科技股份有限公司 | 知识抽取方法、装置、电子设备及存储介质 |
CN113656561A (zh) * | 2021-10-20 | 2021-11-16 | 腾讯科技(深圳)有限公司 | 实体词识别方法、装置、设备、存储介质及程序产品 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10783713B2 (en) * | 2018-09-05 | 2020-09-22 | International Business Machines Corporation | Transmutation of virtual entity sketch using extracted features and relationships of real and virtual objects in mixed reality scene |
-
2022
- 2022-01-06 CN CN202210009904.5A patent/CN114330353B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104811975A (zh) * | 2015-03-24 | 2015-07-29 | 联想(北京)有限公司 | 控制方法、装置及电子设备 |
US9998339B1 (en) * | 2017-02-06 | 2018-06-12 | Comtrade Software Inc. | Application awareness for virtual infrastructure environments |
WO2021212682A1 (zh) * | 2020-04-21 | 2021-10-28 | 平安国际智慧城市科技股份有限公司 | 知识抽取方法、装置、电子设备及存储介质 |
CN111640193A (zh) * | 2020-06-05 | 2020-09-08 | 浙江商汤科技开发有限公司 | 文字处理方法、装置、计算机设备及存储介质 |
CN113656561A (zh) * | 2021-10-20 | 2021-11-16 | 腾讯科技(深圳)有限公司 | 实体词识别方法、装置、设备、存储介质及程序产品 |
Non-Patent Citations (2)
Title |
---|
基于AR技术的景区引导系统研究与应用;杨珊;;长沙航空职业技术学院学报(02);全文 * |
基于词向量和条件随机场的中文命名实体分类;马孟铖;杨晴雯;艾斯卡尔・艾木都拉;吐尔地・托合提;;计算机工程与设计(09);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114330353A (zh) | 2022-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116664719B (zh) | 一种图像重绘模型训练方法、图像重绘方法及装置 | |
CN110234018A (zh) | 多媒体内容描述生成方法、训练方法、装置、设备及介质 | |
CN116700839B (zh) | 一种任务处理方法、装置、设备、存储介质及程序产品 | |
CN116601626A (zh) | 个人知识图谱构建方法、装置及相关设备 | |
CN114035827A (zh) | 应用程序更新方法、装置、设备及存储介质 | |
CN113064583A (zh) | 多级页面路由跳转方法、装置、计算机设备及存储介质 | |
CN114330353B (zh) | 虚拟场景的实体识别方法、装置、设备、介质及程序产品 | |
WO2021258968A1 (zh) | 小程序分类方法、装置、设备及计算机可读存储介质 | |
CN106886435A (zh) | 微件的加载方法及装置 | |
WO2024152686A1 (zh) | 确定资源信息的推荐指标的方法、装置、设备、存储介质及计算机程序产品 | |
WO2020205419A1 (en) | Parameter modification of virtual entities for client applications | |
CN116956996A (zh) | 数据处理方法、装置、介质及设备 | |
WO2023051678A1 (zh) | 一种推荐方法及相关装置 | |
CN117216537A (zh) | 集成模型的训练方法、装置、设备、存储介质及程序产品 | |
JP2024507029A (ja) | ウェブページ識別方法、装置、電子機器、媒体およびコンピュータプログラム | |
CN115858556A (zh) | 一种数据处理方法、装置、存储介质及电子设备 | |
CN117033760A (zh) | 一种对象推荐方法、装置、设备、存储介质及程序产品 | |
JP2017220236A (ja) | クライアント改ざん判断システムおよび方法 | |
CN112182179B (zh) | 实体问答处理方法、装置、电子设备和存储介质 | |
JP2024505316A (ja) | アプリケーションのテスト方法、装置、電子機器及び記憶媒体 | |
CN117809062B (zh) | 地标识别方法、装置、设备、存储介质及计算机程序产品 | |
CN118051782B (zh) | 一种模型训练的方法、业务处理的方法以及相关装置 | |
CN116781965B (zh) | 虚拟物品合成方法、装置、电子设备和计算机可读介质 | |
US20240202466A1 (en) | Adapting prompts selected from prompt task collections | |
CN116401400A (zh) | 模型训练方法以及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |