CN116128055A - 图谱构建方法、装置、电子设备和计算机可读介质 - Google Patents

图谱构建方法、装置、电子设备和计算机可读介质 Download PDF

Info

Publication number
CN116128055A
CN116128055A CN202310362837.XA CN202310362837A CN116128055A CN 116128055 A CN116128055 A CN 116128055A CN 202310362837 A CN202310362837 A CN 202310362837A CN 116128055 A CN116128055 A CN 116128055A
Authority
CN
China
Prior art keywords
entity
information
course
entity information
fused
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310362837.XA
Other languages
English (en)
Inventor
徐起
王晓萍
韩艺嘉
肖尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongguancun Smart City Co Ltd
Original Assignee
Zhongguancun Smart City Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongguancun Smart City Co Ltd filed Critical Zhongguancun Smart City Co Ltd
Priority to CN202310362837.XA priority Critical patent/CN116128055A/zh
Publication of CN116128055A publication Critical patent/CN116128055A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Operation Control Of Excavators (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Navigation (AREA)

Abstract

本公开的实施例公开了图谱构建方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取课程信息集合;对课程信息集合中的每个课程信息包括的课程描述信息进行实体抽取,以生成实体信息组,得到实体信息组集合;对实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合;根据融合后实体信息集合,生成融合后实体信息对集合;对于融合后实体信息对集合中的每对融合后实体信息对,对融合后实体信息对进行实体关系抽取,以生成实体关系信息;根据融合后实体信息对集合和得到的实体关系信息集合,构建课程知识图谱。该实施方式实现了对课程之间的关联关系的有效提取。

Description

图谱构建方法、装置、电子设备和计算机可读介质
技术领域
本公开的实施例涉及计算机技术领域,具体涉及图谱构建方法、装置、电子设备和计算机可读介质。
背景技术
课程知识图谱构建是指通过知识图谱的形式存储与课程相关的描述信息的一种方式。目前,常见的课程信息存储方式:如采用数据库记录的形式逐条存储课程信息。
然而,发明人发现,当采用上述方式时,经常会存在如下技术问题:
第一,由于相近领域的学科对应的课程往往具有相近性,数据库记录的形式无法有效存储课程与课程之间的关联关系,易造成后续的课程推荐的准确性较差;
第二,课程相关的课程信息的数据形式往往较为灵活,单一的提取方式难以对信息进行有效提取。
该背景技术部分中所公开的以上信息仅用于增强对本发明构思的背景的理解,并因此,其可包含并不形成本国的本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了图谱构建方法、装置、电子设备和计算机可读介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种图谱构建方法,该方法包括:获取课程信息集合,其中,上述课程信息集合中的课程信息包括:课程描述信息;对上述课程信息集合中的每个课程信息包括的课程描述信息进行实体抽取,以生成实体信息组,得到实体信息组集合;对上述实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合;根据上述融合后实体信息集合,生成融合后实体信息对集合;对于上述融合后实体信息对集合中的每对融合后实体信息对,对上述融合后实体信息对进行实体关系抽取,以生成实体关系信息;根据上述融合后实体信息对集合和得到的实体关系信息集合,构建课程知识图谱,其中,上述课程知识图谱为无向图,上述课程知识图谱包括的图节点对应融合后实体信息,课程知识图谱包括的图边对应实体关系信息。
第二方面,本公开的一些实施例提供了一种图谱构建装置,装置包括:获取单元,被配置成获取课程信息集合,其中,上述课程信息集合中的课程信息包括:课程描述信息;实体抽取单元,被配置成对上述课程信息集合中的每个课程信息包括的课程描述信息进行实体抽取,以生成实体信息组,得到实体信息组集合;近义实体融合单元,被配置成对上述实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合;生成单元,被配置成根据上述融合后实体信息集合,生成融合后实体信息对集合;实体关系抽取单元,被配置成对于上述融合后实体信息对集合中的每对融合后实体信息对,对上述融合后实体信息对进行实体关系抽取,以生成实体关系信息;构建单元,被配置成根据上述融合后实体信息对集合和得到的实体关系信息集合,构建课程知识图谱,其中,上述课程知识图谱为无向图,上述课程知识图谱包括的图节点对应融合后实体信息,课程知识图谱包括的图边对应实体关系信息。
第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的图谱构建方法,实现了对课程之间的关联关系的有效提取,侧面提高了后续的课程推荐准确度。具体来说,造成课程推荐的准确性较差的原因在于:由于相近领域的学科对应的课程往往具有相近性,数据库记录的形式无法有效存储课程与课程之间的关联关系,易造成后续的课程推荐的准确性较差。基于此,本公开的一些实施例的图谱构建方法,首先,获取课程信息集合,其中,上述课程信息集合中的课程信息包括:课程描述信息。其次,对上述课程信息集合中的每个课程信息包括的课程描述信息进行实体抽取,以生成实体信息组,得到实体信息组集合。从而抽取出课程相关的实体。接着,对上述实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合。由于实体之间可能存在近义表达,会增加后续生成课程知识图谱的结构复杂度,因此需要对实体进行近义实体融合。进一步,根据上述融合后实体信息集合,生成融合后实体信息对集合。由此将可能存在关联关系的实体组成信息对。此外,对于上述融合后实体信息对集合中的每对融合后实体信息对,对上述融合后实体信息对进行实体关系抽取,以生成实体关系信息。从而确定实体对对应的实体关系。最后,根据上述融合后实体信息对集合和得到的实体关系信息集合,构建课程知识图谱,其中,上述课程知识图谱为无向图,上述课程知识图谱包括的图节点对应融合后实体信息,课程知识图谱包括的图边对应实体关系信息。通过此种方式实现了对课程之间的关联关系的有效提取,侧面提高了后续的课程推荐准确度。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是根据本公开的图谱构建方法的一些实施例的流程图;
图2是根据本公开的图谱构建装置的一些实施例的结构示意图;
图3是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面将参考附图并结合实施例来详细说明本公开。
参考图1,示出了根据本公开的图谱构建方法的一些实施例的流程100。该图谱构建方法,包括以下步骤:
步骤101,获取课程信息集合。
在一些实施例中,图谱构建方法的执行主体(例如,计算设备)可以通过有线连接,或无线连接的方式获取上述课程信息集合。其中,所说是课程信息集合中的课程信息包括:课程描述信息。课程描述信息可以是用于对课程信息对应的课程进行描述的概要性信息。具体的,上述执行主体可以从课程信息库中读取上述课程信息集合。上述课程信息库是用于存储课程信息的数据库。
需要指出的是,上述无线连接方式可以包括但不限于3G/4G/5G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
需要说明的是,上述计算设备可以是硬件,也可以是软件。当计算设备为硬件时,可以实现成多个服务器或终端设备组成的分布式集群,也可以实现成单个服务器或单个终端设备。当计算设备体现为软件时,可以安装在上述所列举的硬件设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。应该理解,计算设备的数目根据实现需要,可以具有任意数目的计算设备。
步骤102,对课程信息集合中的每个课程信息包括的课程描述信息进行实体抽取,以生成实体信息组,得到实体信息组集合。
在一些实施例中,上述执行主体可以对课程信息集合中的每个课程信息包括的课程描述信息进行实体抽取,以生成实体信息组,得到实体信息组集合。其中,实体信息组中的实体信息表征课程信息内包含的实体。实践中,首先,上述执行主体可以对上述课程描述信息进行分词处理,得到词集合。然后,对于词集合中的每个词,上述执行主体可以通过带有分类器的CNN(Convolutional Neural Networks,卷积神经网络)模型,对词进行词分类,以实现实体抽取的目的,得到实体信息。
可选地,课程描述信息包括:文本型课程描述信息、图像型课程描述信息和音频型课程描述信息。其中,文本型课程描述信息可以是文本形式的、对课程信息对应的课程进行描述的概要信息。图像型课程描述信息可以是图像形式的、对课程信息对应的课程进行描述的概要信息。音频型课程描述信息可以是音频形式的、对课程信息对应的课程进行描述的概要信息。
在一些实施例的一些可选的实现方式中,上述执行主体对上述课程信息集合中的每个课程信息包括的课程描述信息进行实体抽取,以生成实体信息组,可以包括以下步骤:
第一步,通过预先训练的实体信息提取模型包括的文本编码模型,对上述文本型课程描述信息进行文本编码,以生成第一文本特征。
其中,文本编码模型可以是句粒度的文本进行编码的模型。实践中,上述文本编码模型可以是InferSent模型。
第二步,通过上述实体信息提取模型包括的图像特征提取模型,对上述图像型课程描述信息进行图像特征提取,以生成图像特征。
其中,上述图像特征提取模型可以是用于对图像类型的课程描述信息进行图特征提取的模型。实践中,图像特征提取模型可以是具有对称结构的卷积神经网络模型。
第三步,通过上述实体信息提取模型包括的音频特征提取模型,对上述音频型课程描述信息进行音频特征提取,以生成音频特征。
其中,音频特征提取模型可以是用于将音频信号转换至二维频谱图像的模型。实践中,音频特征提取模型可以是基于梅尔频率倒谱系数的音频转换模型。具体的,音频特征可以是通过二维频谱图像表征的特征。
第四步,将上述图像特征输入上述实体信息提取模型包括的第一文本识别模型,以生成图像识别后文本。
其中,第一文本识别模型可以是用于提取图像型课程描述信息所对应的内容的模型。例如,上述第一文本识别模型可以包括:Bi-LSTM(Bi-directional Long Short-TermMemory,双向长短时记忆)模型和全连接层。由于,本公开已通过图像特征提取模型对图像型课程描述信息进行图像特征提取,为了精简模型结构以及降低模型参数数量,第一文本识别模型可以通过Bi-LSTM模型对图像特征进行上文特征的提取。并通过全连接层进行文字预测。
第五步,将上述音频特征输入上述实体信息提取模型包括的第二文本识别模型,以生成音频识别后文本。
其中,第二文本识别模型可以是用于提取音频型课程描述信息所对应的内容的模型。例如,上述第二文本识别模型可以包括识别模型和解码模型。其中,识别模型可以是采用VGG(Visual Geometry Group)模型架构的卷积神经网络模型。上述解码模型可以是CTC(Connectionist Temporal Classification,连续时序分类)解码模型。
第六步,通过上述文本编码模型,分别对上述图像识别后文本和上述音频识别后文本进行文本编码,得到第二文本特征和第三文本特征。
第七步,通过上述实体信息提取模型包括的实体识别模型,分别对上述第一文本特征、上述第二文本特征和上述第三文本特征进行实体识别,以生成第一候选实体信息组、第二候选实体信息组和第三候选实体信息组。
实践中,实体识别模型可以是BERT模型。
第八步,对上述第一候选实体信息组、上述第二候选实体信息组和上述第三候选实体信息组进行实体信息去重,得到上述课程信息对应的实体信息组。
实践中,首先,上述执行主体可以将上述第一候选实体信息组、上述第二候选实体信息组和上述第三候选实体信息组合并,得到合并实体信息组。然后,对上述合并实体信息组进行相同实体信息合并,得到上述课程信息对应的实体信息组。
作为示例,第一候选实体信息组可以是[实体信息A,实体信息B,实体信息C,实体信息D]。第二候选实体信息组可以是[实体信息A,实体信息B]。第三候选实体信息组可以是[实体信息C]。则上述课程信息对应的实体信息组可以是[实体信息A,实体信息B,实体信息C,实体信息D]。
上述第一步至第八步作为本公开的一个发明点,解决了背景技术提及的技术问题二,即“课程相关的课程信息的数据形式往往较为灵活,单一的提取方式难以对信息进行有效提取”。实践中,为了提高针对课程概述的描述灵活性,往往采用多种方式进行课程的描述。如采用文本型课程描述信息、图像型课程描述信息和音频型课程描述信息。多种类型的课程描述信息对于课程的描述各有侧重,也存在相同的描述。由此,如何能够从多种形式的课程描述信息中全面且有效地提取实体,变得尤为重要。基于此,本公开构建了实体信息提取模型,首先,本公开首先通过实体信息提取模型包括文本编码模型对文本型课程描述信息进行文本编码,得到相应的文本特征表征(第一文本特征)。同时考虑到图像型和音频型课程描述信息的数据复杂性,因此,设计了图像特征提取模型和音频特征提取模型对图像型和音频型课程描述信息进行特征提取,得到图像特征和音频特征,以此实现图像和音频的特征化表示。接着,通过第一文本识别模型和第二文本识别模型,对图像特征和音频特征进行识别,得到图像识别后文本和音频识别后文本。同时考虑到模型复杂度对于实体识别速度的影响,因此,本公开通过复用文本编码模型,对图像识别后文本和音频识别后文本进行文本编码。最后通过实体识别模型进行实体识别。最后,考虑到不同形式的课程描述信息存在信息重复,即可能造成实体冗余,因此,对得到的第一候选实体信息组、上述第二候选实体信息组和上述第三候选实体信息组进行实体信息去重。通过此种方式,实现了对课程相关信息,尤其是实体信息的有效提取。
步骤103,对实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合。
在一些实施例中,上述执行主体可以对实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合。实践中,上述执行主体可以通过预先构建的近义实体表,对实体信息组集合中为近义实体的实体信息进行合并,得到上述融合后实体信息集合。其中,近义实体表包括:标准实体和与标准实体近义的近义实体。上述执行主体可以通过标准实体对与标准实体近义的近义实体进行更新。
作为示例,实体信息组集合可以是[实体信息A,实体信息B,实体信息C]。其中,实体信息A对应的实体和实体信息C对应的实体为近义实体。因此,得到的融合后实体信息集合可以是[实体信息A,实体信息B]。
在一些实施例的一些可选的实现方式中,上述执行主体对上述实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合,可以包括以下步骤:
第一步,生成实体信息数组和影子实体信息数组。
其中,上述实体信息数组和影子实体信息数组相同。上述实体信息数组包括上述实体信息组集合中的上述实体信息。
第二步,对于上述实体信息数组中的每个实体信息,执行以下近义实体融合步骤:
第一子步骤,确定上述实体信息与上述影子实体信息数组中的每个影子实体信息的实体相近度,以生成实体相近度数值,得到实体相近度数值序列。
实践中,首先,上述执行主体可以word2vec模型,对实体信息和影子实体信息进行词向量编码。得到实体信息词向量和影子实体信息词向量。然后,上述执行主体可以通过计算实体信息词向量和影子实体信息词向量的余弦相似度数值,作为实体相近度数值。
第二子步骤,响应于确定上述实体相近度数值序列中存在目标实体相近度数值,根据上述目标实体相近度数值对应的影子实体信息,对上述实体信息进行近义实体更新。
其中,目标实体相近度数值为上述实体相近度数值序列中大于等于预设相近度数值的实体相近度数值。
实践中,预设相近度数值可以是0.98。具体的,当上述实体信息对应的实体为近义实体表包括标准实体,不对上述实体信息进行更新。当上述实体信息对应的实体为标准实体近义的近义实体,或可以理解为目标实体相近度数值对应的影子实体信息对应的实体为标准实体时,通过目标实体相近度数值对应的影子实体信息,对上述实体信息进行近义实体更新。
第三步,将得到的更新后的实体信息数组,确定为上述融合后实体信息集合。
步骤104,根据融合后实体信息集合,生成融合后实体信息对集合。
在一些实施例中,上述执行主体可以根据融合后实体信息集合,生成融合后实体信息对集合。其中,上述执行主体可以将融合后实体信息中存在实体关联关系的融合后实体信息,组合成融合后实体信息对,得到融合后实体信息对集合。
在一些实施例的一些可选的实现方式中,上述执行主体根据融合后实体信息集合,生成融合后实体信息对集合,可以包括以下步骤:
第一步,根据融合后实体信息集合,执行以下融合后实体信息对生成步骤:
第一子步骤,从融合后实体信息集合中随机选取融合后实体信息,作为目标实体信息。
第二子步骤,将去除目标实体信息的、融合后实体信息集合确定为候选实体信息集合。
第三子步骤,确定目标实体信息与候选实体信息集合中的每个候选实体信息的实体隶属度,以生成实体隶属度数值。
实践中,上述执行主体可以通过二分类模型,确定目标实体信息和候选实体信息是否属于隶属关系。其中,二分类模型的分类结果包括:属于隶属关系和不属于隶属关系。具体的,属于隶属关系可以用“1”表征。不属于隶属关系可以用“0”表征。上述执行主体可以将分类结果和对应的概率值的乘积值作为实体隶属度数值。当分类结果为不属于隶属关系时,对应的实体隶属度数值永为0。
第四子步骤,将候选实体信息集合中对应的实体隶属度数值满足第二筛选条件的候选实体信息与目标实体信息构成融合后实体信息对。
其中,第二筛选条件为:候选实体信息对应的实体隶属度数值与候选实体信息集合中对应的最大实体隶属度数值相同。
第五子步骤,从候选实体信息集合中剔除对应的实体隶属度数值满足上述第二筛选条件的候选实体信息,得到剔除后候选实体信息集合。
第六子步骤,响应于确定剔除后候选实体信息集合中的剔除后候选实体信息的数量小于等于目标数量,结束上述融合后实体信息对生成步骤。
其中,目标数量为1。
第二步,响应于确定剔除后候选实体信息集合中的剔除后候选实体信息的数量大于上述目标数量,将上述剔除后候选实体信息集合作为融合后实体信息集合,再次执行上述融合后实体信息对生成步骤。
步骤105,对于融合后实体信息对集合中的每对融合后实体信息对,对融合后实体信息对进行实体关系抽取,以生成实体关系信息。
在一些实施例中,对于融合后实体信息对集合中的每对融合后实体信息对,上述执行主体可以对融合后实体信息对进行实体关系抽取,以生成实体关系信息。实践中,上述执行主体可以通过LSTM(Long Short-Term Memory,长短时记忆)模型,对融合后实体信息对进行实体关系抽取,以生成实体关系信息。
步骤106,根据融合后实体信息对集合和得到的实体关系信息集合,构建课程知识图谱。
在一些实施例中,上述执行主体可以根据融合后实体信息对集合和得到的实体关系信息集合,构建课程知识图谱。其中,上述课程知识图谱为无向图。上述课程知识图谱包括的图节点对应融合后实体信息,课程知识图谱包括的图边对应实体关系信息。
作为示例,上述执行主体根据融合后实体信息对集合和得到的实体关系信息集合,构建课程知识图谱可以包括以下步骤:
第一步,对于上述融合后实体信息对集合中的每个融合后实体信息对,将上述融合后实体信息对包括的两个融合后实体信息作为图节点、将上述融合后实体信息对在上述实体关系信息集合中对应的实体关系信息作为图边,添加至初始课程知识图谱中。
可选地,课程信息集合中的课程信息还包括:课程链接信息。其中课程链接信息表征课程信息对应的课程资源的唯一定位链接。实践中,课程链接信息可以通过URL(UniformResource Locator,统一资源定位符)表征。
可选地,上述方法还包括:
对于上述课程知识图谱中的每个图节点,执行以下处理步骤:
第一步,确定上述图节点对应的融合后实体信息与上述课程信息集合中的每个课程信息包括的课程链接信息的关联度,以生成关联度数值。
实践中,上述执行主体可以将图节点对应的融合后实体信息和上述课程信息对应的课程的关联度,作为关联度数值。例如。图节点对应的融合后实体信息可以是“分子生物学”。课程信息包括的课程链接信息对应的课程可以是“生物学”。因此,可以理解为对应的关联度数值较高。
第二步,从上述课程信息集合对应的课程链接信息集合中筛选出对应的关联度数值满足第一筛选条件的课程链接信息,作为目标课程链接信息,得到目标课程链接信息集合。
其中,第一筛选条件为:课程链接信息对应的关联度数值与课程链接信息集合对应的最大的关联度数值相同。
第三步,根据上述目标课程链接信息集合,生成链接跳转目录。
其中,上述执行主体可以构建链接数组用于存储链接跳转目录。
第四步,将上述链接跳转目录链接至上述图节点。
其中,上述执行主体可以将图节点对应的目录指针,指向用于存储链接跳转目录的链接数组的首地址。
可选地,上述方法还包括:
第一步,获取目标用户的课程记录信息。
其中,课程记录信息包括:子课程记录信息集合。其中,子课程记录信息包括:课程标识、整体课程内容完播比例和核心课程内容完播比例。课程标识可以是子课程记录信息对应的课程的唯一标识。整体课程内容完播比例表征子课程记录信息对应的课程的完整播放比例。核心课程内容完播比例表征子课程记录信息对应的课程中的核心内容的完整播放比例。
第二步,根据子课程记录信息包括的课程标识,对上述子课程记录信息集合中的子课程记录信息进行课程记录合并,以生成子课程记录信息链集合。
其中,子课程记录信息链包括课程标识相同的、子课程记录信息组。
第三步,对于上述子课程记录信息链集合中的每个子课程记录信息链,根据上述子课程记录信息链包括的子课程记录信息包括的整体课程内容完播比例和核心课程内容完播比例,确定上述子课程记录信息链对应的课程感兴趣度。
实践中,首先,上述执行主体可以确定子课程记录信息链包括的子课程记录信息组中的整体课程内容完播比例的均值,得到第一均值。然后,上述执行主体可以确定子课程记录信息链包括的子课程记录信息组中的核心课程内容完播比例的均值,得到第二均值。其次,上述执行主体可以对第一均值和第二均值进行加权求和,得到课程感兴趣度。
第四步,对于上述子课程记录信息链集合中的每个子课程记录信息链,根据上述子课程记录信息链对应的课程感兴趣度,确定推荐权重。
实践中,上述执行主体可以将子课程记录信息链对应的课程感兴趣度与得到的课程感兴趣度集合中的各个课程感兴趣度的和的比值,确定为推荐权重。
第五步,对于上述子课程记录信息链集合中的每个子课程记录信息链,执行以下推荐节点选取步骤:
第一子步骤,确定上述子课程记录信息链在上述课程知识图谱中匹配的图节点,作为候选图节点,得到候选图节点组。
实践中,上述执行主体可以将图节点对应的、包含于子课程记录信息链对应课程的课程描述信息中的实体对应的图节点,确定为候选图节点。
第二子步骤,根据上述子课程记录信息链对应的推荐权重,对上述子课程记录信息链对应的候选图节点组进行图节点随机选取,得到选取后的图节点组。
其中,上述执行主体可以根据推荐权重,确定随机选取的图节点的数量。
第三子步骤,将得到的选取后的图节点组集合在目标终端进行可视化展示。
其中,上述目标终端为上述目标用户对应的终端。实践中,目标终端可以是目标用户用于课程学习的终端。
第四子步骤,响应于确定上述目标终端展示的目标图节点被点击,在上述目标终端展示上述目标图节点对应的链接跳转目录。
其中,上述目标图节点是上述目标用户通过上述目标终端点击的选取后的图节点。
本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的图谱构建方法,实现了对课程之间的关联关系的有效提取,侧面提高了后续的课程推荐准确度。具体来说,造成课程推荐的准确性较差的原因在于:由于相近领域的学科对应的课程往往具有相近性,数据库记录的形式无法有效存储课程与课程之间的关联关系,易造成后续的课程推荐的准确性较差。基于此,本公开的一些实施例的图谱构建方法,首先,获取课程信息集合,其中,上述课程信息集合中的课程信息包括:课程描述信息。其次,对上述课程信息集合中的每个课程信息包括的课程描述信息进行实体抽取,以生成实体信息组,得到实体信息组集合。从而抽取出课程相关的实体。接着,对上述实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合。由于实体之间可能存在近义表达,会增加后续生成课程知识图谱的结构复杂度,因此需要对实体进行近义实体融合。进一步,根据上述融合后实体信息集合,生成融合后实体信息对集合。由此将可能存在关联关系的实体组成信息对。此外,对于上述融合后实体信息对集合中的每对融合后实体信息对,对上述融合后实体信息对进行实体关系抽取,以生成实体关系信息。从而确定实体对对应的实体关系。最后,根据上述融合后实体信息对集合和得到的实体关系信息集合,构建课程知识图谱,其中,上述课程知识图谱为无向图,上述课程知识图谱包括的图节点对应融合后实体信息,课程知识图谱包括的图边对应实体关系信息。通过此种方式实现了对课程之间的关联关系的有效提取,侧面提高了后续的课程推荐准确度。
进一步参考图2,作为对上述各图所示方法的实现,本公开提供了一种图谱构建装置的一些实施例,这些装置实施例与图1所示的那些方法实施例相对应,该图谱构建装置具体可以应用于各种电子设备中。
如图2所示,一些实施例的图谱构建装置200包括:获取单元201、实体抽取单元202、近义实体融合单元203、生成单元204、实体关系抽取单元205和构建单元206。其中,获取单元201,被配置成获取课程信息集合,其中,上述课程信息集合中的课程信息包括:课程描述信息;实体抽取单元202,被配置成对上述课程信息集合中的每个课程信息包括的课程描述信息进行实体抽取,以生成实体信息组,得到实体信息组集合;近义实体融合单元203,被配置成对上述实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合;生成单元204,被配置成根据上述融合后实体信息集合,生成融合后实体信息对集合;实体关系抽取单元205,被配置成对于上述融合后实体信息对集合中的每对融合后实体信息对,对上述融合后实体信息对进行实体关系抽取,以生成实体关系信息;构建单元206,被配置成根据上述融合后实体信息对集合和得到的实体关系信息集合,构建课程知识图谱,其中,上述课程知识图谱为无向图,上述课程知识图谱包括的图节点对应融合后实体信息,课程知识图谱包括的图边对应实体关系信息。
可以理解的是,该图谱构建装置200中记载的诸单元与参考图1描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于图谱构建装置200及其中包含的单元,在此不再赘述。
下面参考图3,其示出了适于用来实现本公开的一些实施例的电子设备(例如,计算设备)300的结构示意图。图3示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图3所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器302中的程序或者从存储装置308加载到随机访问存储器303中的程序而执行各种适当的动作和处理。在随机访问存储器303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、只读存储器302以及随机访问存储器303通过总线304彼此相连。输入/输出接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图3中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从只读存储器302被安装。在该计算机程序被处理装置301执行时,执行本公开的一些实施例的方法中限定的上述功能。
需要说明的是,本公开的一些实施例中记载的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(Hyper Text TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取课程信息集合,其中,上述课程信息集合中的课程信息包括:课程描述信息;对上述课程信息集合中的每个课程信息包括的课程描述信息进行实体抽取,以生成实体信息组,得到实体信息组集合;对上述实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合;根据上述融合后实体信息集合,生成融合后实体信息对集合;对于上述融合后实体信息对集合中的每对融合后实体信息对,对上述融合后实体信息对进行实体关系抽取,以生成实体关系信息;根据上述融合后实体信息对集合和得到的实体关系信息集合,构建课程知识图谱,其中,上述课程知识图谱为无向图,上述课程知识图谱包括的图节点对应融合后实体信息,课程知识图谱包括的图边对应实体关系信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、实体抽取单元、近义实体融合单元、生成单元、实体关系抽取单元和构建单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,实体关系抽取单元还可以被描述为“对于上述融合后实体信息对集合中的每对融合后实体信息对,对上述融合后实体信息对进行实体关系抽取,以生成实体关系信息的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (9)

1.一种图谱构建方法,包括:
获取课程信息集合,其中,所述课程信息集合中的课程信息包括:课程描述信息;
对所述课程信息集合中的每个课程信息包括的课程描述信息进行实体抽取,以生成实体信息组,得到实体信息组集合;
对所述实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合;
根据所述融合后实体信息集合,生成融合后实体信息对集合;
对于所述融合后实体信息对集合中的每对融合后实体信息对,对所述融合后实体信息对进行实体关系抽取,以生成实体关系信息;
根据所述融合后实体信息对集合和得到的实体关系信息集合,构建课程知识图谱,其中,所述课程知识图谱为无向图,所述课程知识图谱包括的图节点对应融合后实体信息,课程知识图谱包括的图边对应实体关系信息。
2.根据权利要求1所述的方法,其中,所述课程信息集合中的课程信息还包括:课程链接信息;以及
所述方法还包括:
对于所述课程知识图谱中的每个图节点,执行以下处理步骤:
确定所述图节点对应的融合后实体信息与所述课程信息集合中的每个课程信息包括的课程链接信息的关联度,以生成关联度数值;
从所述课程信息集合对应的课程链接信息集合中筛选出对应的关联度数值满足第一筛选条件的课程链接信息,作为目标课程链接信息,得到目标课程链接信息集合;
根据所述目标课程链接信息集合,生成链接跳转目录;
将所述链接跳转目录链接至所述图节点。
3.根据权利要求2所述的方法,其中,所述方法还包括:
获取目标用户的课程记录信息,其中,所述课程记录信息包括:子课程记录信息集合,子课程记录信息包括:课程标识、整体课程内容完播比例和核心课程内容完播比例;
根据子课程记录信息包括的课程标识,对所述子课程记录信息集合中的子课程记录信息进行课程记录合并,以生成子课程记录信息链集合,其中,子课程记录信息链包括课程标识相同的、子课程记录信息组;
对于所述子课程记录信息链集合中的每个子课程记录信息链,根据所述子课程记录信息链包括的子课程记录信息包括的整体课程内容完播比例和核心课程内容完播比例,确定所述子课程记录信息链对应的课程感兴趣度;
对于所述子课程记录信息链集合中的每个子课程记录信息链,根据所述子课程记录信息链对应的课程感兴趣度,确定推荐权重;
对于所述子课程记录信息链集合中的每个子课程记录信息链,执行以下推荐节点选取步骤:
确定所述子课程记录信息链在所述课程知识图谱中匹配的图节点,作为候选图节点,得到候选图节点组;
根据所述子课程记录信息链对应的推荐权重,对所述子课程记录信息链对应的候选图节点组进行图节点随机选取,得到选取后的图节点组;
将得到的选取后的图节点组集合在目标终端进行可视化展示,其中,所述目标终端为所述目标用户对应的终端;
响应于确定所述目标终端展示的目标图节点被点击,在所述目标终端展示所述目标图节点对应的链接跳转目录,其中,所述目标图节点是所述目标用户通过所述目标终端点击的选取后的图节点。
4.根据权利要求3所述的方法,其中,所述对所述实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合,包括:
生成实体信息数组和影子实体信息数组,其中,所述实体信息数组和影子实体信息数组相同,所述实体信息数组包括所述实体信息组集合中的所述实体信息;
对于所述实体信息数组中的每个实体信息,执行以下近义实体融合步骤:
确定所述实体信息与所述影子实体信息数组中的每个影子实体信息的实体相近度,以生成实体相近度数值,得到实体相近度数值序列;
响应于确定所述实体相近度数值序列中存在目标实体相近度数值,根据所述目标实体相近度数值对应的影子实体信息,对所述实体信息进行近义实体更新,其中,目标实体相近度数值为所述实体相近度数值序列中大于等于预设相近度数值的实体相近度数值;
将得到的更新后的实体信息数组,确定为所述融合后实体信息集合。
5.根据权利要求4所述的方法,其中,所述根据所述融合后实体信息集合,生成融合后实体信息对集合,包括:
根据融合后实体信息集合,执行以下融合后实体信息对生成步骤:
从融合后实体信息集合中随机选取融合后实体信息,作为目标实体信息;
将去除目标实体信息的、融合后实体信息集合确定为候选实体信息集合;
确定目标实体信息与候选实体信息集合中的每个候选实体信息的实体隶属度,以生成实体隶属度数值;
将候选实体信息集合中对应的实体隶属度数值满足第二筛选条件的候选实体信息与目标实体信息构成融合后实体信息对;
从候选实体信息集合中剔除对应的实体隶属度数值满足所述第二筛选条件的候选实体信息,得到剔除后候选实体信息集合;
响应于确定剔除后候选实体信息集合中的剔除后候选实体信息的数量小于等于目标数量,结束所述融合后实体信息对生成步骤;
响应于确定剔除后候选实体信息集合中的剔除后候选实体信息的数量大于所述目标数量,将所述剔除后候选实体信息集合作为融合后实体信息集合,再次执行所述融合后实体信息对生成步骤。
6.一种图谱构建装置,包括:
获取单元,被配置成获取课程信息集合,其中,所述课程信息集合中的课程信息包括:课程描述信息;
实体抽取单元,被配置成对所述课程信息集合中的每个课程信息包括的课程描述信息进行实体抽取,以生成实体信息组,得到实体信息组集合;
近义实体融合单元,被配置成对所述实体信息组集合中的实体信息进行近义实体融合,得到融合后实体信息集合;
生成单元,被配置成根据所述融合后实体信息集合,生成融合后实体信息对集合;
实体关系抽取单元,被配置成对于所述融合后实体信息对集合中的每对融合后实体信息对,对所述融合后实体信息对进行实体关系抽取,以生成实体关系信息;
构建单元,被配置成根据所述融合后实体信息对集合和得到的实体关系信息集合,构建课程知识图谱,其中,所述课程知识图谱为无向图,所述课程知识图谱包括的图节点对应融合后实体信息,课程知识图谱包括的图边对应实体关系信息。
7.根据权利要求6所述的图谱构建装置,其中,所述近义实体融合单元被进一步配置成:
生成实体信息数组和影子实体信息数组,其中,所述实体信息数组和影子实体信息数组相同,所述实体信息数组包括所述实体信息组集合中的所述实体信息;
对于所述实体信息数组中的每个实体信息,执行以下近义实体融合步骤:
确定所述实体信息与所述影子实体信息数组中的每个影子实体信息的实体相近度,以生成实体相近度数值,得到实体相近度数值序列;
响应于确定所述实体相近度数值序列中存在目标实体相近度数值,根据所述目标实体相近度数值对应的影子实体信息,对所述实体信息进行近义实体更新,其中,目标实体相近度数值为所述实体相近度数值序列中大于等于预设相近度数值的实体相近度数值;
将得到的更新后的实体信息数组,确定为所述融合后实体信息集合。
8.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至5中任一所述的方法。
9.一种计算机可读介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至5中任一所述的方法。
CN202310362837.XA 2023-04-07 2023-04-07 图谱构建方法、装置、电子设备和计算机可读介质 Pending CN116128055A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310362837.XA CN116128055A (zh) 2023-04-07 2023-04-07 图谱构建方法、装置、电子设备和计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310362837.XA CN116128055A (zh) 2023-04-07 2023-04-07 图谱构建方法、装置、电子设备和计算机可读介质

Publications (1)

Publication Number Publication Date
CN116128055A true CN116128055A (zh) 2023-05-16

Family

ID=86312058

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310362837.XA Pending CN116128055A (zh) 2023-04-07 2023-04-07 图谱构建方法、装置、电子设备和计算机可读介质

Country Status (1)

Country Link
CN (1) CN116128055A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116484027A (zh) * 2023-06-20 2023-07-25 北京中科智易科技股份有限公司 基于知识图谱技术建立的军用设备图谱系统
CN117135046A (zh) * 2023-10-26 2023-11-28 北京中企慧云科技有限公司 基于节点关联度的目标资源配置方法、装置、设备和介质
CN118153680A (zh) * 2024-03-27 2024-06-07 北京科技大学 一种适用多门课程的学科知识图谱构建方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160275636A1 (en) * 2014-03-17 2016-09-22 Michael Olenick Method and system for curriculum management services
CN110263179A (zh) * 2019-06-12 2019-09-20 湖南酷得网络科技有限公司 学习路径推送方法、装置、计算机设备和存储介质
CN111797222A (zh) * 2020-06-29 2020-10-20 平安国际智慧城市科技股份有限公司 课程知识图谱构建方法、装置、终端及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160275636A1 (en) * 2014-03-17 2016-09-22 Michael Olenick Method and system for curriculum management services
CN110263179A (zh) * 2019-06-12 2019-09-20 湖南酷得网络科技有限公司 学习路径推送方法、装置、计算机设备和存储介质
CN111797222A (zh) * 2020-06-29 2020-10-20 平安国际智慧城市科技股份有限公司 课程知识图谱构建方法、装置、终端及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116484027A (zh) * 2023-06-20 2023-07-25 北京中科智易科技股份有限公司 基于知识图谱技术建立的军用设备图谱系统
CN116484027B (zh) * 2023-06-20 2023-08-22 北京中科智易科技股份有限公司 基于知识图谱技术建立的军用设备图谱系统
CN117135046A (zh) * 2023-10-26 2023-11-28 北京中企慧云科技有限公司 基于节点关联度的目标资源配置方法、装置、设备和介质
CN117135046B (zh) * 2023-10-26 2024-01-12 北京中企慧云科技有限公司 基于节点关联度的目标资源配置方法、装置、设备和介质
CN118153680A (zh) * 2024-03-27 2024-06-07 北京科技大学 一种适用多门课程的学科知识图谱构建方法和系统

Similar Documents

Publication Publication Date Title
CN111090987B (zh) 用于输出信息的方法和装置
CN110288049B (zh) 用于生成图像识别模型的方法和装置
CN116128055A (zh) 图谱构建方法、装置、电子设备和计算机可读介质
CN111738010B (zh) 用于生成语义匹配模型的方法和装置
CN113449070A (zh) 多模态数据检索方法、装置、介质及电子设备
CN113327599B (zh) 语音识别方法、装置、介质及电子设备
CN111898338B (zh) 文本生成方法、装置和电子设备
CN112182255A (zh) 用于存储媒体文件和用于检索媒体文件的方法和装置
US20220391425A1 (en) Method and apparatus for processing information
CN117290477A (zh) 一种基于二次检索增强的生成式建筑知识问答方法
CN113610034B (zh) 识别视频中人物实体的方法、装置、存储介质及电子设备
CN113255327B (zh) 文本处理方法、装置、电子设备及计算机可读存储介质
CN113033707B (zh) 视频分类方法、装置、可读介质及电子设备
CN111797263A (zh) 图像标签生成方法、装置、设备和计算机可读介质
CN115129877B (zh) 标点符号预测模型的生成方法、装置和电子设备
CN114625876B (zh) 作者特征模型的生成方法、作者信息处理方法和装置
CN112651231B (zh) 口语信息处理方法、装置和电子设备
CN111626044B (zh) 文本生成方法、装置、电子设备及计算机可读存储介质
CN111460214B (zh) 分类模型训练方法、音频分类方法、装置、介质及设备
CN117743555B (zh) 答复决策信息发送方法、装置、设备和计算机可读介质
CN111898658A (zh) 图像分类方法、装置和电子设备
CN111860518B (zh) 用于分割图像的方法、装置、设备和计算机可读介质
CN117636100B (zh) 预训练任务模型调整处理方法、装置、电子设备和介质
CN118092671B (zh) 目标视听数据生成方法、装置、电子设备和可读介质
CN113283115B (zh) 图像模型生成方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20230516

RJ01 Rejection of invention patent application after publication