CN113127627B - 基于lda主题模型结合诗词知识图谱的诗词推荐方法 - Google Patents

基于lda主题模型结合诗词知识图谱的诗词推荐方法 Download PDF

Info

Publication number
CN113127627B
CN113127627B CN202110441956.5A CN202110441956A CN113127627B CN 113127627 B CN113127627 B CN 113127627B CN 202110441956 A CN202110441956 A CN 202110441956A CN 113127627 B CN113127627 B CN 113127627B
Authority
CN
China
Prior art keywords
poetry
topics
node
poems
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110441956.5A
Other languages
English (en)
Other versions
CN113127627A (zh
Inventor
包致成
彭嵘榕
祁晨草
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN202110441956.5A priority Critical patent/CN113127627B/zh
Publication of CN113127627A publication Critical patent/CN113127627A/zh
Application granted granted Critical
Publication of CN113127627B publication Critical patent/CN113127627B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于LDA主题模型结合诗词知识图谱的诗词推荐方法,该方法包括以下步骤:对诗词数据进行清洗及预处理,并生成Topics与LDA主题模型,同时将诗词逐个输入到LDA主题模型中,得到每首诗词与Topics的相关性;将诗词或Topics作为图节点,以诗的固有属性作为图中诗词节点与诗词节点的边,以诗词与Topics的相关性作为诗词节点与Topics节点的边融合入已生成的诗词知识图谱中;诗词推荐器根据输入的诗词从诗词知识图谱中按照诗词与Topics的相关性及其他诗词属性的共同特征查找最相关的诗词;向用户输出推荐诗词。有益效果:提高了推荐算法在诗词本文的分析能力及诗词推荐的准确率。

Description

基于LDA主题模型结合诗词知识图谱的诗词推荐方法
技术领域
本发明涉及主题模型、推荐方法、诗词学习、自然语言处理,具体来说,涉及基于LDA主题模型结合诗词知识图谱的诗词推荐方法。
背景技术
目前对于古诗词的个性化智能推荐系统比较匮乏,绝大多数的诗词网站也只是对于诗词内容的简单展示,而非推荐,所以进行古诗词推荐方面的研究对于促进中华优秀传统文化的传播具有重要意义。
近年来最接近本发明的技术有Word2vec模型:Word2vec是一款用于训练词向量的软件工具,提供了CBOW和Skip-gram两种模型。结合hierarchy softmax和negativesampling优化技术,Word2vec可以快速高效地将词语表达成向量。Word2vec本身的特点使其效率变得很高。但是,Word2vec是一种静态的方式,虽然通用性强,但是无法针对特定任务做动态优化。
为了弥补传统推荐方法在相关度的上的欠缺,以及由于过大的推荐模型难以在轻量级计算平台上运行的难题,该方法充分利用知识图谱与主题模型的优势,实现了对传统推荐方法在相关度的进一步提升。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出基于LDA主题模型结合诗词知识图谱的诗词推荐方法,以克服现有相关技术所存在的上述技术问题。
为此,本发明采用的具体技术方案如下:
基于LDA主题模型结合诗词知识图谱的诗词推荐方法,该方法包括以下步骤:
S1、通过数据预处理模块对诗词数据进行清洗及预处理,且通过LDA主题模型对诗词数据进行训练,生成Topics与LDA主题模型,同时将诗词逐个输入到LDA主题模型中,得到每首诗词与Topics的相关性;
S2、将诗词或Topics作为图节点,以诗的固有属性作为图中诗词节点与诗词节点的边,以诗词与Topics的相关性作为诗词节点与Topics节点的边融合入已生成的诗词知识图谱中;
S3、将需要推荐的诗词输入诗词推荐器,诗词推荐器根据输入的诗词从诗词知识图谱中按照诗词与Topics的相关性及其他诗词属性的共同特征查找最相关的诗词,并向用户输出推荐诗词。
进一步的,所述S1中预处理包括诗词分词、剔除空数据、无效数据、剔除无情感意义的文字和重复数据;
其中,在数据预处理模块,使用Jieba分词将诗词进行分词处理,并根据词语含义将每句诗词分成多个中文短语,同时将诗词中含义较弱的单字与词语使用TF-IDF算法进行剔除。
进一步的,所述S1中通过LDA主题模型对诗词数据进行训练,生成Topics包括以下步骤:
使用Jieba分词将诗词进行分词处理并使用TF-IDF算法剔除诗词集合中含义弱的词语,并输入到LDA主题模型中,且LDA主题模型将诗词进行分类并生成一定数量的Topics;
将诗词集合依次输入已经由所有诗词训练好的LDA主题模型,并逐个生成所有诗词与各Topics的相关性。
进一步的,所述S1中LDA主题模型将诗词进行分类并生成一定数量的Topics,其Topics数量的确定方法包括以下步骤:
将诗词集合输入LDA主题模型中并进行训练,其Topics生成数量以10起步,并以10为步长分别训练多个LDA主题模型,其Topics取值范围为[10,Num(poetry)/10],其中Num(poetry)为参与训练的诗词总数;
分别计算每个LDA主题模型的困惑度;
以困惑度作为选取LDA主题模型的标准,并从所有已经训练好的LDA主题模型中选取困惑度最低的模型作为最终的模型,该模型所使用的Topics数量为最终模型训练所用的Topics数量。
进一步的,所述S2中将诗词或Topics作为图节点,以诗的固有属性作为图中诗词节点与诗词节点的边,以诗词与Topics的相关性作为诗词节点与Topics节点的边融合入已生成的诗词知识图谱中还包括以下步骤:
预先将Topics作为图的节点加入到已生成的诗词知识图谱中,推荐诗词时根据诗词知识图谱的Topics进行搜索。
进一步的,所述诗词数据的数据载体为图数据库Neo4j,将图数据库Neo4j作为数据载体,存储诗词数据的具体方式如下:
以诗词或Topics作为图节点,并以诗词的固有属性作为图的边,将诗词节点与诗词节点的连接,以诗词与Topics的相关性作为图的边,将诗词节点与Topics节点进行连接。
进一步的,所述S3中将需要推荐的诗词输入诗词推荐器,诗词推荐器根据输入的诗词从诗词知识图谱中按照诗词与Topics的相关性及其他诗词属性的共同特征查找最相关的诗词,并向用户输出推荐诗词包括以下步骤:
S31、根据输入的诗词ID或诗词名称在知识图谱中查找该诗词节点;
S32、根据与诗词相关度最高的Topics边寻找到该Topics所在节点;
S33、在该Topics所在节点所连接的边中寻找到与该Topics的相关性前十的诗词;
S34、将寻找到的十首诗词与需推荐诗词的固有属性进行对比,且根据诗词的固有属性的重合数量从高到低将寻找到的十首诗词依次排序;
S35、根据用户所需的推荐诗词数量,依据固有属性的重合数量依次向用户进行推荐。
进一步的,所述S3中,当根据Topics查找到的诗词为需推荐诗词本身时,则将诗词与Topics的相关性从高到低的顺序向后查找排序第十一首的诗词,并将该诗词替换到需推荐诗词本身所在的位置,组合成新的十首诗词,再进行固有属性对比排序,并向用户进行推荐。
本发明的有益效果为:
(1)本发明提出的基于LDA主题模型结合诗词知识图谱的诗词推荐方法,引入LDA主题模型与知识图谱提高了推荐算法在诗词本文的分析能力,并结合诗词属性进行联合推荐,提高了诗词推荐的准确率;使用LDA主题模型算法,从诗词文本上分析诗词内容,针对性强,改变只根据诗词的诗人、朝代、风格属性关联的推荐方式,使推荐更加准确,符合用户口味。
(2)使用知识图谱的方式存储诗词与Topics的联系,在推荐诗词时保证了在海量数据中查找诗词的效率,同时也避免了只使用Topics进行推荐的弊端,能够结合诗词原本属性进行联合诗词推荐,推荐的诗词更准确、更广泛。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明利用LDA主题算法生成Topics与诗词相关性并融合知识图谱的流程图;
图2为本发明基于知识图谱根据Topics与诗词属性进行诗词推荐的流程图。
具体实施方式
为进一步说明各实施例,本发明提供有附图,这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理,配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点,图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
根据本发明的实施例,提供了基于LDA主题模型结合诗词知识图谱的诗词推荐方法,首先通过运用LDA主题模型根据诗词文本内容将诗词的文本采样出不同的Topics,再将Topics作为图的节点加入到已生成的诗词知识图谱中,并连接与该Topics相关诗词,最后输入需推荐的诗词,并根据Topics与诗词之间的联系从知识图谱中推荐相关诗词。即将数据预处理清理异常值剔除无意字,LAD主题模型训练,生成Topics与诗词相关性,与诗词知识图谱融合,根据诗词知识图谱进行诗词推荐。
现结合附图和具体实施方式对本发明进一步说明,如图1-2所示,根据本发明实施例的基于LDA主题模型结合诗词知识图谱的诗词推荐方法,该方法包括以下步骤:
步骤S1:将诗词数据通过数据预处理模块进行清洗与预处理,进行诗词分词、剔除空数据、无效数据和重复数据;使用jieba分词将诗词进行分词处理,jieba自带了一个叫做dict.txt的词典,里面有2万多条词,包含了词条出现的次数和词性,jieba分词主要通过词典来进行分词及词性标注,将每句诗词根据词语含义分成多个中文短语。对于诗词中含义较弱的单字与词语,使用TF-IDF算法进行剔除,不输入到LDA主题模型中。
使用LDA主题模型对诗词进行分类并生成Topics,其具体步骤如下:
第一步,将Jieba分词后并使用TF-IDF算法剔除含义弱词语的诗词集合输入到LDA主题模型中,LDA主题模型将诗词进行分类生成一定数量的Topics;
第二步,根据已经由所有诗词训练好的LDA主题模型将诗词集合依次输入模型,逐个诗词生成该诗词与各Topics的相关性。
预处理完毕,将诗词数据作为输入数据输入到LDA主题算法进行训练,生成Topics与LDA主题模型;我们Topics的生成方法及数量由以下步骤确定:
[1]将诗词集合输入LDA主题模型中进行LDA主题模型的训练,其Topics生成数量以10起步,以10为步长分别训练多个LDA主题模型,其Topics取值范围为[10,Num(poetry)/10],其中Num(poetry)为参与训练的诗词总数;
[2]分别计算每个模型的困惑度;
[3]以困惑度为选取模型的标准,从所有已经训练好的模型中选取困惑度最低的模型为最终的模型,该模型所使用的Topics数量为最终模型训练用的Topics数量。
将诗词逐个输入到训练得到的LDA主题模型中,得到每首诗词与Topics的相关性,此处得到的相关性为与哪个Topics相关和与该Topics相关的百分比。
步骤S2:将诗词或Topics作为图节点,以诗的固有属性作为图中诗词节点与诗词节点的边,以诗词与Topics的相关性作为诗词节点与Topics节点的边融合入已生成的诗词知识图谱中,为了减少知识图谱的大小,一般只保留与诗词相关性最大的十个Topics。
步骤S3:向诗词推荐器输入需要推荐的诗词,推荐器根据诗词从知识图谱中按照Topics相关性与其他诗词属性的共同特征查找最相关的诗词;其具体步骤如下:
[1]根据该诗词ID或诗词名称在知识图谱中查找该诗词节点;
[2]根据诗词与Topics的相关性最高的边寻找到该Topics所在节点;
[3]根据该Topics所在节点所连接的边中寻找到与该Topics相关性前十的诗词;
[4]根据寻找到的十首诗词对比该诗词与需推荐诗词的固有属性,根据诗词的固有属性的重合数量再从高到低依次排序。
[5]根据用户所需的推荐诗词数量,依次根据固有属性的重合数量向用户进行推荐。当根据Topics查找到的诗词为需推荐诗词本身时,则不向用户推荐该诗词,并向后查找诗词与该Topics相关性从高到底排序的第十一首诗词,并将该诗词替换到需推荐诗词本身所在的位置,组合成新的十首诗词,再进行固有属性对比排序,并向用户进行推荐。
对于存储的诗词数据,所使用的数据载体为图数据库Neo4j,存储诗词数据的具体方式如下:以诗词的固有属性作为图的边,将诗词节点与诗词节点的连接,以诗词与Topics的相关性作为图的边,将诗词节点与Topics节点进行连接。
在向用户进行诗词推荐前,预先将Topics作为图的节点加入到已生成的诗词知识图谱中,在每次推荐诗词时根据知识图谱的Topics进行搜索,避免多次重复运行推荐算法造成计算资源的浪费。
综上所述,本发明提出的基于LDA主题模型结合诗词知识图谱的诗词推荐方法,引入LDA主题模型与知识图谱提高了推荐算法在诗词本文的分析能力,并结合诗词属性进行联合推荐,提高了诗词推荐的准确率;使用LDA主题模型算法,从诗词文本上分析诗词内容,针对性强,改变只根据诗词的诗人、朝代、风格属性关联的推荐方式,使推荐更加准确,符合用户口味。使用知识图谱的方式存储诗词与Topics的联系,在推荐诗词时保证了在海量数据中查找诗词的效率,同时也避免了只使用Topics进行推荐的弊端,能够结合诗词原本属性进行联合诗词推荐,推荐的诗词更准确、更广泛。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.基于LDA主题模型结合诗词知识图谱的诗词推荐方法,其特征在于,该方法包括以下步骤:
S1、通过数据预处理模块对诗词数据进行清洗及预处理,且通过LDA主题模型对诗词数据进行训练,生成Topics与LDA主题模型,同时将诗词逐个输入到LDA主题模型中,得到每首诗词与Topics的相关性;
S2、将诗词或Topics作为图节点,以诗的固有属性作为图中诗词节点与诗词节点的边,以诗词与Topics的相关性作为诗词节点与Topics节点的边融合入已生成的诗词知识图谱中;
S3、将需要推荐的诗词输入诗词推荐器,诗词推荐器根据输入的诗词从诗词知识图谱中按照诗词与Topics的相关性及其他诗词属性的共同特征查找最相关的诗词,并向用户输出推荐诗词。
2.根据权利要求1所述的基于LDA主题模型结合诗词知识图谱的诗词推荐方法,其特征在于,所述S1中预处理包括诗词分词、剔除空数据、无效数据、剔除无情感意义的文字和重复数据;
其中,在数据预处理模块,使用Jieba分词将诗词进行分词处理,并根据词语含义将每句诗词分成多个中文短语,同时将诗词中含义较弱的单字与词语使用TF-IDF算法进行剔除。
3.根据权利要求1所述的基于LDA主题模型结合诗词知识图谱的诗词推荐方法,其特征在于,所述S1中通过LDA主题模型对诗词数据进行训练,生成Topics包括以下步骤:
使用Jieba分词将诗词进行分词处理并使用TF-IDF算法剔除诗词集合中含义弱的词语,并输入到LDA主题模型中,且LDA主题模型将诗词进行分类并生成一定数量的Topics;
将诗词集合依次输入已经由所有诗词训练好的LDA主题模型,并逐个生成所有诗词与各Topics的相关性。
4.根据权利要求3所述的基于LDA主题模型结合诗词知识图谱的诗词推荐方法,其特征在于,所述S1中LDA主题模型将诗词进行分类并生成一定数量的Topics,其Topics数量的确定方法包括以下步骤:
将诗词集合输入LDA主题模型中并进行训练,其Topics生成数量以10起步,并以10为步长分别训练多个LDA主题模型,其Topics取值范围为[10,Num(poetry)/10],其中Num(poetry)为参与训练的诗词总数;
分别计算每个LDA主题模型的困惑度;
以困惑度作为选取LDA主题模型的标准,并从所有已经训练好的LDA主题模型中选取困惑度最低的模型作为最终的模型,该模型所使用的Topics数量为最终模型训练所用的Topics数量。
5.根据权利要求1所述的基于LDA主题模型结合诗词知识图谱的诗词推荐方法,其特征在于,所述S2中将诗词或Topics作为图节点,以诗的固有属性作为图中诗词节点与诗词节点的边,以诗词与Topics的相关性作为诗词节点与Topics节点的边融合入已生成的诗词知识图谱中还包括以下步骤:
预先将Topics作为图的节点加入到已生成的诗词知识图谱中,推荐诗词时根据诗词知识图谱的Topics进行搜索。
6.根据权利要求5所述的基于LDA主题模型结合诗词知识图谱的诗词推荐方法,其特征在于,所述诗词数据的数据载体为图数据库Neo4j,将图数据库Neo4j作为数据载体,存储诗词数据的具体方式如下:
以诗词或Topics作为图节点,并以诗词的固有属性作为图的边,将诗词节点与诗词节点的连接,以诗词与Topics的相关性作为图的边,将诗词节点与Topics节点进行连接。
7.根据权利要求1所述的基于LDA主题模型结合诗词知识图谱的诗词推荐方法,其特征在于,所述S3中将需要推荐的诗词输入诗词推荐器,诗词推荐器根据输入的诗词从诗词知识图谱中按照诗词与Topics的相关性及其他诗词属性的共同特征查找最相关的诗词,并向用户输出推荐诗词包括以下步骤:
S31、根据输入的诗词ID或诗词名称在知识图谱中查找该诗词节点;
S32、根据与诗词相关性最高的Topics边寻找到该Topics所在节点;
S33、在该Topics所在节点所连接的边中寻找到与该Topics的相关性前十的诗词;
S34、将寻找到的十首诗词与需推荐诗词的固有属性进行对比,且根据诗词的固有属性的重合数量从高到低将寻找到的十首诗词依次排序;
S35、根据用户所需的推荐诗词数量,依据固有属性的重合数量依次向用户进行推荐。
8.根据权利要求7所述的基于LDA主题模型结合诗词知识图谱的诗词推荐方法,其特征在于,所述S3中,当根据Topics查找到的诗词为需推荐诗词本身时,则将诗词与Topics的相关性从高到低的顺序向后查找排序第十一首的诗词,并将该诗词替换到需推荐诗词本身所在的位置,组合成新的十首诗词,再进行固有属性对比排序,并向用户进行推荐。
CN202110441956.5A 2021-04-23 2021-04-23 基于lda主题模型结合诗词知识图谱的诗词推荐方法 Active CN113127627B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110441956.5A CN113127627B (zh) 2021-04-23 2021-04-23 基于lda主题模型结合诗词知识图谱的诗词推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110441956.5A CN113127627B (zh) 2021-04-23 2021-04-23 基于lda主题模型结合诗词知识图谱的诗词推荐方法

Publications (2)

Publication Number Publication Date
CN113127627A CN113127627A (zh) 2021-07-16
CN113127627B true CN113127627B (zh) 2023-01-17

Family

ID=76779505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110441956.5A Active CN113127627B (zh) 2021-04-23 2021-04-23 基于lda主题模型结合诗词知识图谱的诗词推荐方法

Country Status (1)

Country Link
CN (1) CN113127627B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113590965B (zh) * 2021-08-05 2023-06-13 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种融合知识图谱与情感分析的视频推荐方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902302A (zh) * 2019-03-01 2019-06-18 郑敏杰 一种适用于文本分析或数据挖掘的主题图谱生成方法、装置、设备以及计算机存储介质
CN110543574A (zh) * 2019-08-30 2019-12-06 北京百度网讯科技有限公司 一种知识图谱的构建方法、装置、设备及介质
CN111291156A (zh) * 2020-01-21 2020-06-16 同方知网(北京)技术有限公司 一种基于知识图谱的问答意图识别方法
CN112100405A (zh) * 2020-09-23 2020-12-18 中国农业大学 一种基于加权lda的兽药残留知识图谱构建方法
CN112287218A (zh) * 2020-10-26 2021-01-29 安徽工业大学 一种基于知识图谱的非煤矿山文献关联推荐方法
CN112632386A (zh) * 2020-12-29 2021-04-09 广州视源电子科技股份有限公司 诗词推荐方法、装置、设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150286709A1 (en) * 2014-04-02 2015-10-08 Samsung Electronics Co., Ltd. Method and system for retrieving information from knowledge-based assistive network to assist users intent
CN106156090A (zh) * 2015-04-01 2016-11-23 上海宽文是风软件有限公司 一种基于知识图谱(Man-tree)的制造设计知识个性化推送方法
CN106960025B (zh) * 2017-03-19 2019-09-27 北京工业大学 一种基于领域知识图谱的个性化文献推荐方法
KR20200042739A (ko) * 2018-10-16 2020-04-24 삼성전자주식회사 지식 그래프에 기초하여 콘텐트를 제공하는 시스템 및 방법
CN109902187A (zh) * 2019-03-21 2019-06-18 广东小天才科技有限公司 一种特征知识图谱的构建方法及装置、终端设备
CN110929045B (zh) * 2019-12-06 2022-07-12 思必驰科技股份有限公司 诗歌-语义知识图谱的构建方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902302A (zh) * 2019-03-01 2019-06-18 郑敏杰 一种适用于文本分析或数据挖掘的主题图谱生成方法、装置、设备以及计算机存储介质
CN110543574A (zh) * 2019-08-30 2019-12-06 北京百度网讯科技有限公司 一种知识图谱的构建方法、装置、设备及介质
CN111291156A (zh) * 2020-01-21 2020-06-16 同方知网(北京)技术有限公司 一种基于知识图谱的问答意图识别方法
CN112100405A (zh) * 2020-09-23 2020-12-18 中国农业大学 一种基于加权lda的兽药残留知识图谱构建方法
CN112287218A (zh) * 2020-10-26 2021-01-29 安徽工业大学 一种基于知识图谱的非煤矿山文献关联推荐方法
CN112632386A (zh) * 2020-12-29 2021-04-09 广州视源电子科技股份有限公司 诗词推荐方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于交互式可视化的领域知识图谱构建研究;岳丽欣等;《情报科学》;20200601(第06期);全文 *

Also Published As

Publication number Publication date
CN113127627A (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
CN110543574B (zh) 一种知识图谱的构建方法、装置、设备及介质
CN109408642B (zh) 一种基于距离监督的领域实体属性关系抽取方法
CN110298033B (zh) 关键词语料标注训练提取系统
CN106649742B (zh) 数据库维护方法和装置
CN107180045B (zh) 一种互联网文本蕴含地理实体关系的抽取方法
CN104636466B (zh) 一种面向开放网页的实体属性抽取方法和系统
CN102298576B (zh) 文档关键词生成方法和装置
CN106503192A (zh) 基于人工智能的命名实体识别方法及装置
CN103544246A (zh) 互联网多种情感词典构建方法及系统
CN111523304A (zh) 一种基于预训练模型的产品描述文本的自动生成方法
CN113282701B (zh) 作文素材生成方法、装置、电子设备及可读存储介质
US20210311953A1 (en) Method and apparatus for pushing information
CN109522396B (zh) 一种面向国防科技领域的知识处理方法及系统
CN107688630A (zh) 一种基于语义的弱监督微博多情感词典扩充方法
CN110781300B (zh) 基于百度百科知识图谱的旅游资源文化特色评分算法
CN110060132A (zh) 基于细粒度数据的可解释商品推荐方法
CN116821377A (zh) 基于知识图谱和大模型的小学语文自动评测系统
CN113127627B (zh) 基于lda主题模型结合诗词知识图谱的诗词推荐方法
CN111666374A (zh) 一种在深度语言模型中融入额外知识信息的方法
CN114722176A (zh) 一种智能答疑的方法、装置、介质及电子设备
US10650195B2 (en) Translated-clause generating method, translated-clause generating apparatus, and recording medium
CN114443846A (zh) 一种基于多层级文本异构图的分类方法、装置及电子设备
CN111782789A (zh) 智能问答方法与系统
CN116362331A (zh) 一种基于人机协同构建知识图谱的知识点填充方法
CN115618092A (zh) 一种信息推荐方法和信息推荐系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant