CN110059179A - 一种基于深度学习的歌曲文本命名实体识别方法 - Google Patents

一种基于深度学习的歌曲文本命名实体识别方法 Download PDF

Info

Publication number
CN110059179A
CN110059179A CN201910168707.6A CN201910168707A CN110059179A CN 110059179 A CN110059179 A CN 110059179A CN 201910168707 A CN201910168707 A CN 201910168707A CN 110059179 A CN110059179 A CN 110059179A
Authority
CN
China
Prior art keywords
singer
information
dictionary
txt
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910168707.6A
Other languages
English (en)
Inventor
孟海宁
石月开
朱磊
王一川
黑新宏
姬文江
陈毅
姚燕妮
方潇颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN201910168707.6A priority Critical patent/CN110059179A/zh
Publication of CN110059179A publication Critical patent/CN110059179A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/325Hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于深度学习的歌曲文本命名实体识别方法,利用Bi‑LSTM‑CRF算法训练模型对输入的语料进行歌者信息的提取、生成歌者词典,同时实现主动学习并对歌者词典进行自动更新,最后依据更新的词库反复训练模型提高其识别的准确率,将深度学习的方法应用到音乐领域,当输入一段文本时能够对文本中的歌者信息进行提取,同时采用了机器学习中自学习模式对提取的信息在词典中进行查找,实现动态地对词典进行更新,提出了一种训练准确率更高的模型。

Description

一种基于深度学习的歌曲文本命名实体识别方法
技术领域
本发明属于计算机自然语言处理技术领域,具体涉及一种基于歌曲歌者文本命名实体识别方法。
背景技术
从计算机来到这个世界,语言已经不仅仅是人与人之间的工具,同时也是人与机器之间对话的基础。自然语言理解就是如何让计算机能够正确处理人类语言,并据此作出人们期待的各种正确响应。命名实体识别作为自然语言处理的一部分,它是正确理解文本的基础,其进行识别的主要任务就是识别出待处理文本中的人名、地名、机构名等专有名词。这就意味着有效的命名实体识别方法对于在海量数据中快速地理解文本中信息,高效、精确地获取并分析信息知识显得越来越重要。将命名实体识别应用到音乐领域就是对音乐领域中非结构化文本进行结构化处理的重要基础,通过其抽取的信息可以自动化分析歌者、歌曲等信息,从而构建音乐领域相关的搜索引擎和智能问答系统。目前关于对文本中的实体抽取方法目前主要存在三类分别是:基于规则和词典的方法、基于统计的方法、混合方法。面对着信息时代信息的不断扩充,命名实体识别技术将迎来自己的黄金期。
发明内容
本发明的目的是提供一种基于深度学习的歌曲文本命名实体识别方法,利用Bi-LSTM-CRF算法训练模型对输入的语料进行歌者信息的提取、生成歌者词典,同时实现主动学习并对歌者词典进行自动更新,最后依据更新的词库反复训练模型提高其识别的准确率。
本发明所采用的技术方案是,一种深度学习的歌曲文本命名实体识别方法,具体操作步骤如下:
步骤1,使用爬虫框架Scrapy对音乐领域中的歌者信息进行提取,生成歌者词典并用MySQL进行存储;
步骤2,获取歌者信息的相关语料,并将其分为歌者训练集及歌者测试集,其中歌者训练集是用来训练生成歌者信息识别模型,歌者测试集用来更新歌者词典;
步骤3,对步骤2中歌者训练集中的歌者信息依据现有的歌者词典进行基于匹配的词性标注;
步骤4,使用Bi-LSTM-CRF算法对步骤3中带标注的歌者训练集进行训练,生成歌者信息识别模型,该模型可以实现对音乐领域中的歌者信息进行提取;
步骤5,对步骤4中生成的歌者信息识别模型输入关于测试集或音乐领域中的语料信息,识别模型将实现对语料中的歌者信息进行提取;
步骤6,对步骤5中识别模型提取的歌手、歌曲、专辑等信息按序分类整合,实现对数据的融合,得到歌者信息识别的初步结果;
步骤7,对步骤6中得到的歌者信息识别的初步结果信息保存到文件1.txt中;
步骤8,获取步骤7中的文件1.txt,将文件中的歌者信息与歌者词典中的歌者信息进行比较,检测判断是否出现歌者词典中未记载的歌者信息,如果出现未记载的信息,则保存成为3.txt;若识别出的信息在歌者词典中存在,则保存成为2.txt;
步骤9,对步骤8中3.txt文件中的未记载信息进行自动化检验判断,获取正确的歌者信息并将其存储到4.txt文件中;
步骤10,对步骤8中识别出的且歌者词典中存在的信息2.txt与步骤9中歌者词典中不存在但是正确的歌者信息4.txt进行数据的融合,形成在步骤5输入语料中含有歌者相关信息的文本文件5.txt,并将其作为输出结果显示出来;
步骤11,对步骤9中4.txt文件中的歌者信息使用DICDIFF算法对歌者词典进行更新;
步骤12,定期重复步骤3、4,重新训练模型,提高歌者信息识别准确率。
本发明的特点还在于,
步骤1中构建歌者词典采用树形结构对歌者信息进行保存,并采用hash编码对保存的树形节点进行映射形成信息索引,最后将带有索引的树形的歌者词典保存到数据库中。
步骤3中采用基于深度学习的方法建立歌者信息识别模型,具体步骤如下:
步骤3.1,对步骤2中歌者训练集中的语料以句号进行划分;
步骤3.2,从歌者词典中查找歌者信息,对步骤3.1的每一句语料中的歌手姓名、歌曲、专辑等歌者信息进行提取;
步骤3.3,对步骤3.2中提取的歌者信息进行特征化标注,其余非歌者信息标注为“O”;
步骤3.4,将训练集中对文本标注的信息进行存储并形成一个新的文本1.txt;
步骤3.5,使用深度学习中的Bi-LSTM-CRF算法,导入步骤3.4中标注好的文本1.txt进行模型训练;
步骤3.6,生成能够在音乐领域中对歌者信息进行识别的模型。
步骤8中能够对歌者信息是否存在于歌者词典中进行主动分类,具体步骤如下:
步骤8.1,将步骤7中的文本1.txt中的每一项信息歌者信息通过hash映射在本地歌者词典库中进行查找;
步骤8.2,根据步骤8.1中信息的查找结果进行分类,若在歌者词典中存在相关信息则将其保存到文本2.txt中;若在词典中不存在则将其保存到文本3.txt中。
步骤9中对未记载的歌者信息进行自动化检验判断的具体步骤如下:
步骤9.1:编写爬虫文件,对爬虫文件进行相关配置,使其定向到百度百科界面;
步骤9.2:将含有未记载歌者信息的文件3.txt中的内容依据识别模型识别后产生的识别符号为间隔依次输入到爬虫文件中;
步骤9.3:启动爬虫文件,抓取每一项未记载信息产生的新的网页;
步骤9.4:对步骤9.3中抓取的网页进行内容识别,若内容中出现音乐领域的相关的触发词,我们便认为这一项未记载信息是正确的歌者信息,否则便将其视为无关信息进行丢弃;
步骤9.5:将步骤9.4中通过内容识别后属于歌者信息的未记载信息存储到文件4.txt中。
步骤11中使用DICDIFF算法对歌者词典进行动态更新具体步骤如下:
步骤11.1,执行hash算法对歌者信息文本4.txt中的每一个歌者的姓名建立索引,执行DICDIFF算法对每一个歌者的相关信息建立增量包;
步骤11.2,将步骤10.1中形成索引和与之对应的增量包添加到歌者词典中实现歌者词典的动态更新。
本发明的有益效果是:本发明的一种深度学习的歌曲文本命名实体识别方法,根据网络中歌者信息构建歌者词典,通过词典对语料中歌者信息的标注,使用深度学习Bi-LSTM-CRF算法建立对歌者信息提取模型。当新语料输入,该方法将识别出语料中的歌者信息,同时对词典库中不存在的歌者进行更新,最后依据更新后的歌者词典重新训练准确率更高的模型。
附图说明
图1为本发明一种基于深度学习的歌曲文本命名实体识别方法的总流程图;
图2为本发明深度学习算法Bi-LSTM-CRF建立歌者信息识别的模型流程图;
图3为本发明步骤8系统信息自动分类的流程图;
图4为本发明词库自动更新的流程图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明的目的是提供一种基于深度学习的歌曲文本命名实体识别方法,具体流程如图1所示,利用Bi-LSTM-CRF算法训练模型对输入的语料进行歌者信息的提取,同时实现主动学习对歌者词典进行自动更新,包括以下步骤:
步骤1,使用爬虫框架Scrapy对音乐领域中的歌者信息进行提取,生成歌者词典并用MySQL进行存储;
步骤2,获取歌者信息的相关语料,并将其分为歌者训练集及歌者测试集,其中歌者训练集是用来训练生成歌者信息识别模型(如图2所示),歌者测试集可以用来更新歌者词典;
步骤3,对步骤2中歌者训练集中的歌者信息依据现有的歌者词典进行基于匹配的词性标注;
例如有这样一句语料:“我喜欢听周杰伦的菊花台。”,进行基于匹配的词性标注为:
我O喜O欢O听O周B-SINGER杰I-SINGER伦I-SINGER的O菊B-SONG花I-SONG台I-SONG。O
其中标注信息为“O”,“B-SINGER”,“I-SINGER”,“B-SONG”,“I-SONGER”。“O”代表非歌者相关信息,“B-SINGER”为歌手姓名中第一个字,“I-SINGER”代表歌手姓名中除开始字之外的其他字,“B-SONG”代表歌名的首字,“I-SONG”代表歌名除第一个字之外的其他字,为了区分不同的歌者信息我们采用不同的符号进行标注。
步骤4,使用Bi-LSTM-CRF算法对步骤3中带标注的歌者训练集进行训练,生成歌者信息识别模型,该模型可以实现对音乐领域中的歌者信息进行提取;
步骤5,在实际应用中是对步骤4中生成的歌者信息识别模型输入关于测试集或音乐领域中的语料信息,模型将实现对语料中的歌者信息进行提取。
步骤6,对步骤5中识别模型提取的歌手、歌曲、专辑等信息进行按序分类整合,实现对数据的融合,得到歌者信息识别的初步结果;
步骤7,对步骤6中得到的歌者信息识别的初步结果信息保存到文件1.txt中;
步骤8,如图3所示,获取步骤7中的文件1.txt,将文件中的歌者信息与歌者词典中的歌者信息进行比较,检测判断是否出现歌者词典中未记载的歌者信息,如果出现未记载的信息,则保存成为3.txt,若识别出的信息在歌者词典中存在,则保存成为2.txt;
步骤9,对步骤8中3.txt文件中的未记载信息进行自动化检验判断,获取正确的歌者信息并将其存储到4.txt文件中。
步骤10,对步骤8中识别出的且歌者词典中存在的信息2.txt与步骤9中歌者词典中不存在但是正确的歌者信息4.txt进行数据的融合,形成在步骤5输入语料中含有歌者相关信息的文本文件5.txt,并将其作为输出结果显示出来。
步骤11,对步骤9中4.txt文件中的歌者信息使用DICDIFF算法对歌者词典进行更新(如图4所示);
步骤12,定期重复步骤3、4,重新训练模型,提高歌者信息识别准确率。
步骤1中构建歌者词典采用树形结构对歌者信息进行保存,并采用hash编码对保存的树形节点进行映射形成信息索引,最后将带有索引的树形的歌者词典保存到数据库中。
步骤3中采用基于深度学习的方法建立歌者信息进行识别模型,具体步骤如下:
步骤3.1,对步骤2中歌者训练集中的语料以句号进行划分;
步骤3.2,从歌者词典中查找歌者信息,对步骤3.1的每一句语料中的歌手姓名、歌曲、专辑等歌者信息进行提取;
步骤3.3,对步骤3.2中提取的歌者信息进行特征化标注,其余非歌者信息标注为“O”。
步骤3.4,将训练集中对文本标注的信息进行存储并形成一个新的文本1.txt。
步骤3.5,使用深度学习中的Bi-LSTM-CRF算法,导入步骤3.4中标注好的文本1.txt进行模型训练。
步骤3.6,生成能够在音乐领域中对歌者信息进行识别的模型。
步骤3伪代码如下:
步骤8中能够对歌者信息是否存在于歌者词典中进行主动分类,具体步骤如下:
步骤8.1,将步骤7中的文本1.txt中的每一项信息歌者信息通过hash映射在本地歌者词典库中进行查找。
步骤8.2,根据步骤8中信息的查找结果进行分类,若在歌者词典中存在相关信息则将其保存到文本2.txt中;若在词典中不存在则将其保存到文本3.txt中;
步骤8.2伪代码如下:
步骤11中使用DICDIFF算法对歌者词典进行动态更新具体步骤如下:
步骤11.1,执行hash算法对歌者信息文本4.txt中的每一个歌者的姓名建立索引,执行DICDIFF算法对每一个歌者的相关信息建立增量包;
步骤11.2,将步骤10.1中形成索引和与之对应的增量包添加到歌者词典中实现歌者词典的动态更新;
步骤11.1伪代码如下:

Claims (6)

1.一种基于深度学习的歌曲文本命名实体识别方法,其特征在于,具体操作步骤如下:
步骤1,使用爬虫框架Scrapy对音乐领域中的歌者信息进行提取,生成歌者词典并用MySQL进行存储;
步骤2,获取歌者信息的相关语料,并将其分为歌者训练集及歌者测试集,其中歌者训练集是用来训练生成歌者信息识别模型,歌者测试集用来更新歌者词典;
步骤3,对步骤2中歌者训练集中的歌者信息依据现有的歌者词典进行基于匹配的词性标注;
步骤4,使用Bi-LSTM-CRF算法对步骤3中带标注的歌者训练集进行训练,生成歌者信息识别模型,该模型可以实现对音乐领域中的歌者信息进行提取;
步骤5,对步骤4中生成的歌者信息识别模型输入关于测试集或音乐领域中的语料信息,识别模型将实现对语料中的歌者信息进行提取;
步骤6,对步骤5中识别模型提取的歌手、歌曲、专辑等信息按序分类整合,实现对数据的融合,得到歌者信息识别的初步结果;
步骤7,对步骤6中得到的歌者信息识别的初步结果信息保存到文件1.txt中;
步骤8,获取步骤7中的文件1.txt,将文件中的歌者信息与歌者词典中的歌者信息进行比较,检测判断是否出现歌者词典中未记载的歌者信息,如果出现未记载的信息,则保存成为3.txt;若识别出的信息在歌者词典中存在,则保存成为2.txt;
步骤9,对步骤8中3.txt文件中的未记载信息进行自动化检验判断,获取正确的歌者信息并将其存储到4.txt文件中;
步骤10,对步骤8中识别出的且歌者词典中存在的信息2.txt与步骤9中歌者词典中不存在但是正确的歌者信息4.txt进行数据的融合,形成在步骤5输入语料中含有歌者相关信息的文本文件5.txt,并将其作为输出结果显示出来;
步骤11,对步骤9中4.txt文件中的歌者信息使用DICDIFF算法对歌者词典进行更新;
步骤12,定期重复步骤3、4,重新训练模型,提高歌者信息识别准确率。
2.根据权利要求1所述的基于一种深度学习的歌曲文本命名实体识别方法,其特征在于,步骤1中构建歌者词典采用树形结构对歌者信息进行保存,并采用hash编码对保存的树形节点进行映射形成信息索引,最后将带有索引的树形的歌者词典保存到数据库中。
3.根据权利要求1所述的基于一种深度学习的歌曲文本命名实体识别方法,其特征在于,步骤3中采用基于深度学习的方法建立歌者信息进行识别模型,具体步骤如下:
步骤3.1,对步骤2中歌者训练集中的语料以句号进行划分;
步骤3.2,从歌者词典中查找歌者信息,对步骤3.1的每一句语料中的歌手姓名、歌曲、专辑等歌者信息进行提取;
步骤3.3,对步骤3.2中提取的歌者信息进行特征化标注,其余非歌者信息标注为“O”;
步骤3.4,将训练集中对文本标注的信息进行存储并形成一个新的文本1.txt;
步骤3.5,使用深度学习中的Bi-LSTM-CRF算法,导入步骤3.4中标注好的文本1.txt进行模型训练;
步骤3.6,生成能够在音乐领域中对歌者信息进行识别的模型。
4.根据权利要求1所述的基于一种深度学习的歌曲文本命名实体识别方法,其特征在于,步骤8中能够对歌者信息是否存在于歌者词典中进行主动分类,具体步骤如下:
步骤8.1,将步骤7中的文本1.txt中的每一项信息歌者信息通过hash映射在本地歌者词典库中进行查找;
步骤8.2,根据步骤8.1中信息的查找结果进行分类,若在歌者词典中存在相关信息则将其保存到文本2.txt中;若在词典中不存在则将其保存到文本3.txt中。
5.根据权利要求1所述的一种基于深度学习的歌曲文本命名实体识别方法,其特征在于,步骤9中对未记载的歌者信息进行自动化检验判断的具体步骤如下:
步骤9.1:编写爬虫文件,对爬虫文件进行相关配置,使其定向到百度百科界面;
步骤9.2:将含有未记载歌者信息的文件3.txt中的内容依据识别模型识别后产生的识别符号为间隔依次输入到爬虫文件中;
步骤9.3:启动爬虫文件,抓取每一项未记载信息产生的新的网页;
步骤9.4:对步骤9.3中抓取的网页进行内容识别,若内容中出现音乐领域的相关的触发词,我们便认为这一项未记载信息是正确的歌者信息,否则便将其视为无关信息进行丢弃;
步骤9.5:将步骤9.4中通过内容识别后属于歌者信息的未记载信息存储到文件4.txt中。
6.根据权利要求1所述的一种基于深度学习的歌曲文本命名实体识别方法,其特征在于,步骤11中使用DICDIFF算法对歌者词典进行动态更新具体步骤如下:
步骤11.1,执行hash算法对歌者信息文本4.txt中的每一个歌者的姓名建立索引,执行DICDIFF算法对每一个歌者的相关信息建立增量包;
步骤11.2,将步骤10.1中形成索引和与之对应的增量包添加到歌者词典中实现歌者词典的动态更新。
CN201910168707.6A 2019-03-06 2019-03-06 一种基于深度学习的歌曲文本命名实体识别方法 Pending CN110059179A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910168707.6A CN110059179A (zh) 2019-03-06 2019-03-06 一种基于深度学习的歌曲文本命名实体识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910168707.6A CN110059179A (zh) 2019-03-06 2019-03-06 一种基于深度学习的歌曲文本命名实体识别方法

Publications (1)

Publication Number Publication Date
CN110059179A true CN110059179A (zh) 2019-07-26

Family

ID=67316698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910168707.6A Pending CN110059179A (zh) 2019-03-06 2019-03-06 一种基于深度学习的歌曲文本命名实体识别方法

Country Status (1)

Country Link
CN (1) CN110059179A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765418A (zh) * 2019-10-09 2020-02-07 清华大学 一种流域水沙研究模型的智能集合评估方法和系统
CN111062216A (zh) * 2019-12-18 2020-04-24 腾讯科技(深圳)有限公司 命名实体识别方法、装置、终端及可读介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447206A (zh) * 2016-01-05 2016-03-30 深圳市中易科技有限责任公司 基于word2vec算法的新评论对象识别方法及系统
KR101725354B1 (ko) * 2015-11-05 2017-04-10 광운대학교 산학협력단 개체명 사전 관리 방법 및 그 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101725354B1 (ko) * 2015-11-05 2017-04-10 광운대학교 산학협력단 개체명 사전 관리 방법 및 그 장치
CN105447206A (zh) * 2016-01-05 2016-03-30 深圳市中易科技有限责任公司 基于word2vec算法的新评论对象识别方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
天生SMILE: "(四)序列标注——实体识别LSTM-CRF(上)", 《简书》 *
陈志龙: "基于动态字典的增量更新算法", 《解放军理工大学学报(自然科学版)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765418A (zh) * 2019-10-09 2020-02-07 清华大学 一种流域水沙研究模型的智能集合评估方法和系统
CN111062216A (zh) * 2019-12-18 2020-04-24 腾讯科技(深圳)有限公司 命名实体识别方法、装置、终端及可读介质
CN111062216B (zh) * 2019-12-18 2021-11-23 腾讯科技(深圳)有限公司 命名实体识别方法、装置、终端及可读介质

Similar Documents

Publication Publication Date Title
US11704501B2 (en) Providing a response in a session
CN108664599B (zh) 智能问答方法、装置、智能问答服务器及存储介质
CN108984530A (zh) 一种网络敏感内容的检测方法及检测系统
CN106485984B (zh) 一种钢琴的智能教学方法和装置
CN109658271A (zh) 一种基于保险专业场景的智能客服系统及方法
CN106055675B (zh) 一种基于卷积神经网络和距离监督的关系抽取方法
CN106855853A (zh) 基于深度神经网络的实体关系抽取系统
CN106156365A (zh) 一种知识图谱的生成方法及装置
CN106649275A (zh) 基于词性信息和卷积神经网络的关系抽取方法
CN106383816A (zh) 基于深度学习的中文少数民族地区地名的识别方法
CN107247751B (zh) 基于lda主题模型的内容推荐方法
CN109213856A (zh) 一种语义识别方法及系统
CN115080694A (zh) 一种基于知识图谱的电力行业信息分析方法及设备
CN113094578A (zh) 基于深度学习的内容推荐方法、装置、设备及存储介质
CN113821605B (zh) 一种事件抽取方法
CN109299277A (zh) 舆情分析方法、服务器及计算机可读存储介质
CN104462064A (zh) 一种移动终端信息通讯提示输入内容的方法和系统
CN109522416A (zh) 一种金融风险控制知识图谱的构建方法
CN116542817B (zh) 一种智能数字人律师咨询方法及系统
CN113807103B (zh) 基于人工智能的招聘方法、装置、设备及存储介质
CN108345612A (zh) 一种问题处理方法和装置、一种用于问题处理的装置
CN113590810A (zh) 摘要生成模型训练方法、摘要生成方法、装置及电子设备
CN116561274A (zh) 一种基于数字人技术与自然语言大模型的知识问答方法
CN110059179A (zh) 一种基于深度学习的歌曲文本命名实体识别方法
CN114443846B (zh) 一种基于多层级文本异构图的分类方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190726