CN108717425A - 一种基于多数据源的知识图谱人物实体对齐方法 - Google Patents
一种基于多数据源的知识图谱人物实体对齐方法 Download PDFInfo
- Publication number
- CN108717425A CN108717425A CN201810385484.4A CN201810385484A CN108717425A CN 108717425 A CN108717425 A CN 108717425A CN 201810385484 A CN201810385484 A CN 201810385484A CN 108717425 A CN108717425 A CN 108717425A
- Authority
- CN
- China
- Prior art keywords
- similarity
- entities
- people entities
- knowledge
- data source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013507 mapping Methods 0.000 title claims description 11
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000011160 research Methods 0.000 claims abstract description 18
- 238000012790 confirmation Methods 0.000 claims abstract 3
- 239000013598 vector Substances 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 2
- 238000010828 elution Methods 0.000 claims 1
- 238000010801 machine learning Methods 0.000 abstract description 2
- 230000001105 regulatory effect Effects 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 230000007812 deficiency Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于多数据源的知识图谱人物实体对齐方法,该方法首先从知识图谱中将同名的人物实体规约在一起,然后对两个及以上相同名字的实体相互之间进行比较,计算两者之间相似度,设置相应的阈值区间[a,b],相似度大于b则判断是相同的实体,如果相似度大于a而小于b则加入到人工确认合并候选集,由人工进行确认,如果相似度小于a,则直接判定为不同实体。本发明在本体信息不完备的情形下进行人物实体合并,通过利用百科知识库、基于共同发文网络关系和研究领域相似度的方法进行加权求和,最后综合判断,且加权参数根据机器学习的结果实时更新,机器自主学习,让结果更加精准。
Description
技术领域
本发明属于大数据处理,具体涉及一种基于多数据源的知识图谱人物实体对齐方法。
背景技术
知识图谱又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。随着知识图谱提出与建立,能够更方便地、清晰地、准确地搜索和查询信息,越来越多行业在建立各行业的专业知识图谱。
通过知网、万方、自建成果库等不同数据源,采集电力相关成果的数据来构建电力知识图谱,过程中存在着实体对齐问题,其中最突出的是人物实体对齐,主要表现在人物在其不同阶段发表的论文和期刊、申请的专利和一些科研成果数据,被分割成不同人物的问题。所谓实体对齐也被称作实体匹配,是指对于异构数据源知识库中的各个实体,找出属于现实世界中的同一实体。因为采集数据包含作者(发明人)、发表时间(申请时间)、发表单位(申请单位)、访问地址、doi、分类号、相关知识点,并不具备完备本体信息,所以现有基于本体方法或制定领域规则的方法难以完成人物实体对齐。目前知网、万方等往往以人工的方式来解决人物实体对齐问题。但是人工的方式成本较高,且效率低下。另一方面,在本体信息不完备时,机器处理的准确性低适应性差。
发明内容
发明目的:针对上述现有技术的不足,本发明提供一种基于多数据源的知识图谱人物实体对齐方法,该方法在本体信息不完备的情况下,通过算法和数据分析实现自动对齐,提高人物实体对其的准确性,并且加以人工辅助的判定人物实体对齐,满足大规模人物实体合并的需求。
技术方案:一种基于多数据源的知识图谱实体对齐方法,所述的方法包括以下步骤:
(1)利用网络百科知识库判断人物实体的相识度;
(2)基于共同发文网络关系人物实体的相识度判断;
(3)基于研究方向的人物实体相识度计算;
(4)人物实体的总体相识度计算及实体对齐。
进一步的,步骤(1)具体如下:
(11)根据知识图谱中人物实体从网络百科中爬取该人物对应的百科信息,通过数据清洗提取出人物特征信息,然后根据人物特征信息形成经历单位对照列表,所述的人物特征信息包括工作时间、工作单位和工作地点;
(12)判断基于网络百科的人物实体相似度:若待比较的两个人物实体所属单位都在单位对照列表中,则认为相似度为1,否则相似度为0,若百科中不存在该人物信息,则相似度也为0。
进一步的,步骤(2)具体如下:
(21)利用知识图谱中人物、机构和论文图结构,选取同名通过最大流算法构建共同发文社区网络关系;
(22)计算同名人物实体相互两者之间可达路径数;
(23)计算在同一个社区内同名人物之间的可达路径数,对所有同名的人物进行合作、引用网络构建,利用最大流算法构建共同发文的社区网络,计算每个社区内同名人物之间的最大流量Pathmax(A,B),2arctan(Pathmax(A,B))/π映射到[0,1],大于阈值表示为相同人物实体,否则表示为不相同人物实体。
进一步的,步骤(3)具体如下:
(31)检索待对齐人物的科技文献关键词信息,所述的文献包括发表的论文、期刊和专利;论文检索将抽取网页上论文的关键词及分类作为人物的研究领域,通过自然语言处理技术转化为词向量的形式;专利检索通过专利的摘要,抽取出关键词作为其研究领域;
(32)先对采集的科技文献语料库进行预处理,进行分词,通过word2vec工具进行词向量训练,得到词向量集合vectors,计算词向量之间的相似度,再结合改进的Monge-Elkan算法表示人物之间研究领域相似度,大于阈值表示相同人物实体,否则表示不相同人物实体。
更进一步的,步骤(4)中对于每两个待对齐人物实体之间的总体相识度计算为步骤(1)-步骤(3)所得到的相似度计算值进行加权求和。
更进一步的,所述人物实体对齐的判定方法为设置相应的置信区间[a,b],相似度大于b,则判断是否为相同的人物实体,如果相似度大于a而小于b,则加入到人工确认合并候选集,由人工进行确认,如果相似度小于a,则直接判定为不同人物实体。
有益效果:本发明相比现有技术其显著的效果在于,本发明在本体信息不完备的情形下将人物实体合并,通过利用基于百科知识库、基于共同发文网络关系、基于研究领域相似度等方法的加权综合判断,加权参数是根据机器学习的结果实时更新的,机器自主学习,让结果越来越精准。
附图说明
图1是本发明所述的实体对齐流程图;
图2是本发明所述的共同发文社交网络例图。
具体实施方式
为了详细的说明本发明公开的技术方案,下面结合说明书附图和具体实施例做详细的阐述。
一种基于多数据源的知识图谱人物实体对齐的方法,本实施例以电力领域的人物实体对齐为例,在计算人物相似度,其处理的步骤流程图如图1所示。
(1)基于百科知识库计算相似度
首先采集文献数据清晰的定义了电力专家人物实体特征信息及其所属单位,然后根据知识图谱中的人物实体从网络百科中爬取该电力专家所在网络知识库中对应的百科信息,所述的百科信息包括该人物实体的特征信息,其特征信息包括工作经历,具体包含工作单位、工作时间和工作地点,然后形成经历单位列表;最后根据经历单位列表进行判断实体的相似度,具体的判断方法如下:
首先将待比较的两个或者两个以上人物实体所属单位与同名人物的单位对照列表比较,若单位出现在单位经历列表中则认为相似度为1,否则相似度为0。
例如,有<武守远,中国电力科学研究院>、<武守远,中电普瑞科技有限公司>同名不同单位的武守远,从武守远的百科简历中抽取出工作列表<武守远,(中国电力科学研究院、电力电子技术研究所、中电普瑞科技有限公司)>。两个不同的单位包含在工作列表中,则认为是同一人物实体。
(2)基于共同发文网络关系计算相似度
通过知识图谱中论文、专利、成果的相互合作情况,通过最大流算法构建合作社交网络,计算两个实体的可达路径数Path(A,B),取2arctan(Pathmax(A,B))/π来判断如果大于阈值则表示相同实体,否则就是不同实体。
例如,同名戴朝波构建共同发文社交网络的某个社区如图2所示,计算该社区内三个同名戴朝波相似度,可以发现2arctan(Pathmax(A,B))/π约为0.84,2arctan(Pathmax(A,C))/π约为0.5,其中A为戴朝波[国网电力科学研究院]、B为戴朝波[中国电力科学研究院]、C为戴朝波[中电普瑞科技有限公司]。可见这三个戴朝波是同一人物实体。
(3)基于研究领域计算相似度
将论文、成果等的关键词、分类视为作者的研究领域形成最终的研究方向集合,使用基于word2vec工具并改进的Monge-Elkan算法计算同名人物实体的领域相似度方法,公式如下:
其中,vec(ai)、vec(bj)表示关键词对应的词向量。simword2vec(A,B)值越大表示两者研究领域相似度越高,大于设定阈值认为是相同实体,否则为不同实体。
(4)加权判断实体的相似度
步骤(1)-步骤(3)三种计算两个人物实体相似度的方法,但是单一的方法只能识别出较少的相同实体。因此,给每种方法赋予适当的初始权重值,通过对每种方法的加权求和来综合评估两个同名人物实体的相似度,公式如下:
其中xi是加权,fi是某种方法的相似度值。通过人工标注的数据,得到sim(A,B)等于1或0,求得新权重xi值,让后续结果越来越精准。
当然,计算相似度方法包括但不限于上述方法,其他的方法如:人物重名概率、人物发表期刊偏好方法也可以衡量人物实体之间的相似度。
本发明一方面以机器自动对齐为主,人工处理为辅,减少人工处理;另一方面提出了结合基于百科知识库、基于共同发文网络关系、基于研究领域相似度等方法的优势以加权方式来判定实体对齐,弥补了本体信息不完备情况下单一方法判定的不足,提高了准确性。
Claims (6)
1.一种基于多数据源的知识图谱人物实体对齐方法,其特征在于:包括以下步骤:
(1)利用网络百科知识库判断人物实体的相识度;
(2)基于共同发文网络关系人物实体的相识度判断;
(3)基于研究方向的人物实体相识度计算;
(4)人物实体的总体相识度计算及实体对齐。
2.根据权利要求1所述的一种基于多数据源的知识图谱人物实体对齐方法,其特征在于:步骤(1)具体如下:
(11)根据知识图谱中人物实体从网络百科中爬取该人物对应的百科信息,通过数据清洗提取出人物特征信息,然后根据人物特征信息形成经历单位对照列表,所述的人物特征信息包括工作时间、工作单位和工作地点;
(12)判断基于网络百科的人物实体相似度:若待比较的两个人物实体所属单位都在单位对照列表中,则认为相似度为1,否则相似度为0,若百科中不存在该人物信息,则相似度为0。
3.根据权利要求1所述的一种基于多数据源的知识图谱人物实体对齐方法,其特征在于:步骤(2)具体如下:
(21)利用知识图谱中人物、机构和论文图结构,选取同名通过最大流算法构建共同发文社区网络关系;
(22)计算同名人物实体相互两者之间可达路径数;
(23)计算在同一个社区内同名人物之间的可达路径数,对所有同名的人物进行合作、引用网络构建,利用最大流算法构建共同发文的社区网络,计算每个社区内同名人物之间的最大流量Pathmax(A,B),2arctan(Pathmax(A,B))/π映射到[0,1],大于阈值表示为相同人物实体,否则表示为不相同人物实体。
4.根据权利要求1所述的一种基于多数据源的知识图谱人物实体对齐方法,其特征在于:步骤(3)具体如下:
(31)检索待对齐人物的科技文献关键词信息,所述的文献包括发表的论文、期刊和专利;
(32)先对采集的科技文献语料库进行预处理,进行分词,通过word2vec工具进行词向量训练,得到词向量集合vectors,计算词向量之间的相似度,再结合改进的Monge-Elkan算法表示人物之间研究领域相似度,大于阈值表示相同人物实体,否则为不相同人物实体。
5.根据权利要求1所述的一种基于多数据源的知识图谱人物实体对齐方法,其特征在于:步骤(4)中对于每两个待对齐人物实体之间的总体相识度计算为步骤(1)-步骤(3)所得到的相似度计算值进行加权求和。
6.根据权利要求1所述的一种基于多数据源的知识图谱人物实体对齐方法,其特征在于:所述人物实体对齐的判定包括设置相应的置信区间[a,b],相似度大于b则判断是否为相同的人物实体,如果相似度大于a而小于b则加入到人工确认合并候选集,由人工进行确认,如果相似度小于a,则直接判定为不同人物实体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810385484.4A CN108717425A (zh) | 2018-04-26 | 2018-04-26 | 一种基于多数据源的知识图谱人物实体对齐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810385484.4A CN108717425A (zh) | 2018-04-26 | 2018-04-26 | 一种基于多数据源的知识图谱人物实体对齐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108717425A true CN108717425A (zh) | 2018-10-30 |
Family
ID=63899249
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810385484.4A Pending CN108717425A (zh) | 2018-04-26 | 2018-04-26 | 一种基于多数据源的知识图谱人物实体对齐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108717425A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110110094A (zh) * | 2019-04-22 | 2019-08-09 | 华侨大学 | 基于社交网络知识图谱的跨网络人物关联方法 |
CN110196848A (zh) * | 2019-04-09 | 2019-09-03 | 广联达科技股份有限公司 | 一种面向公共资源交易数据的清洗去重方法及其系统 |
CN110275919A (zh) * | 2019-06-18 | 2019-09-24 | 合肥工业大学 | 数据集成方法及装置 |
CN110334220A (zh) * | 2019-07-15 | 2019-10-15 | 中国人民解放军战略支援部队航天工程大学 | 一种基于多数据源的知识图谱构建方法 |
CN110688407A (zh) * | 2019-09-09 | 2020-01-14 | 创新奇智(南京)科技有限公司 | 一种社会关系挖掘的方法 |
CN110928894A (zh) * | 2019-11-18 | 2020-03-27 | 精硕科技(北京)股份有限公司 | 实体对齐的方法及装置 |
CN111078859A (zh) * | 2019-11-22 | 2020-04-28 | 北京市科学技术情报研究所 | 一种基于引用次数的作者推荐方法 |
CN111191045A (zh) * | 2019-12-30 | 2020-05-22 | 创新奇智(上海)科技有限公司 | 一种应用于知识图谱的实体对齐方法及系统 |
CN111309867A (zh) * | 2020-02-18 | 2020-06-19 | 北京航空航天大学 | 一种知识库动态更新方法 |
CN111597788A (zh) * | 2020-05-18 | 2020-08-28 | 腾讯科技(深圳)有限公司 | 基于实体对齐的属性融合方法、装置、设备及存储介质 |
CN111666411A (zh) * | 2020-05-29 | 2020-09-15 | 中国工商银行股份有限公司 | 企业知识图谱构建方法及装置 |
CN111680163A (zh) * | 2020-04-21 | 2020-09-18 | 国网内蒙古东部电力有限公司 | 一种面向电力科技成果的知识图谱可视化方法 |
CN111914092A (zh) * | 2019-05-09 | 2020-11-10 | 富士通株式会社 | 针对作者消歧的信息处理装置、方法和介质 |
CN112463977A (zh) * | 2020-10-22 | 2021-03-09 | 三盟科技股份有限公司 | 基于知识图谱的社区挖掘方法、系统、计算机及存储介质 |
CN113222771A (zh) * | 2020-07-10 | 2021-08-06 | 杭州海康威视数字技术股份有限公司 | 一种基于知识图谱确定目标群体的方法、装置及电子设备 |
CN114461817A (zh) * | 2022-02-10 | 2022-05-10 | 深圳市查策网络信息技术有限公司 | 一种文本大数据的图谱分析方法 |
CN116702745A (zh) * | 2023-06-14 | 2023-09-05 | 上交所技术有限责任公司 | 一种基于语义匹配模型的启发式实体对齐方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104035975A (zh) * | 2014-05-23 | 2014-09-10 | 华东师范大学 | 一种利用中文在线资源实现远程监督人物关系抽取的方法 |
CN106156082A (zh) * | 2015-03-31 | 2016-11-23 | 华为技术有限公司 | 一种本体对齐方法及装置 |
CN106202041A (zh) * | 2016-07-01 | 2016-12-07 | 北京奇虎科技有限公司 | 一种解决知识图谱中的实体对齐问题的方法和装置 |
CN107590128A (zh) * | 2017-09-21 | 2018-01-16 | 湖北大学 | 一种基于高置信度特征属性分层聚类方法的论文同名作者消歧方法 |
CN107766322A (zh) * | 2017-08-31 | 2018-03-06 | 平安科技(深圳)有限公司 | 同名实体识别方法、电子设备及计算机可读存储介质 |
-
2018
- 2018-04-26 CN CN201810385484.4A patent/CN108717425A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104035975A (zh) * | 2014-05-23 | 2014-09-10 | 华东师范大学 | 一种利用中文在线资源实现远程监督人物关系抽取的方法 |
CN106156082A (zh) * | 2015-03-31 | 2016-11-23 | 华为技术有限公司 | 一种本体对齐方法及装置 |
CN106202041A (zh) * | 2016-07-01 | 2016-12-07 | 北京奇虎科技有限公司 | 一种解决知识图谱中的实体对齐问题的方法和装置 |
CN107766322A (zh) * | 2017-08-31 | 2018-03-06 | 平安科技(深圳)有限公司 | 同名实体识别方法、电子设备及计算机可读存储介质 |
CN107590128A (zh) * | 2017-09-21 | 2018-01-16 | 湖北大学 | 一种基于高置信度特征属性分层聚类方法的论文同名作者消歧方法 |
Non-Patent Citations (1)
Title |
---|
黄峻福等: "中文异构百科知识库实体对齐", 《计算机应用》 * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110196848A (zh) * | 2019-04-09 | 2019-09-03 | 广联达科技股份有限公司 | 一种面向公共资源交易数据的清洗去重方法及其系统 |
CN110196848B (zh) * | 2019-04-09 | 2022-04-12 | 广联达科技股份有限公司 | 一种面向公共资源交易数据的清洗去重方法及其系统 |
CN110110094B (zh) * | 2019-04-22 | 2022-07-01 | 华侨大学 | 基于社交网络知识图谱的跨网络人物关联方法 |
CN110110094A (zh) * | 2019-04-22 | 2019-08-09 | 华侨大学 | 基于社交网络知识图谱的跨网络人物关联方法 |
CN111914092A (zh) * | 2019-05-09 | 2020-11-10 | 富士通株式会社 | 针对作者消歧的信息处理装置、方法和介质 |
CN110275919A (zh) * | 2019-06-18 | 2019-09-24 | 合肥工业大学 | 数据集成方法及装置 |
CN110334220A (zh) * | 2019-07-15 | 2019-10-15 | 中国人民解放军战略支援部队航天工程大学 | 一种基于多数据源的知识图谱构建方法 |
CN110688407B (zh) * | 2019-09-09 | 2022-05-17 | 创新奇智(南京)科技有限公司 | 一种社会关系挖掘的方法 |
CN110688407A (zh) * | 2019-09-09 | 2020-01-14 | 创新奇智(南京)科技有限公司 | 一种社会关系挖掘的方法 |
CN110928894A (zh) * | 2019-11-18 | 2020-03-27 | 精硕科技(北京)股份有限公司 | 实体对齐的方法及装置 |
CN111078859A (zh) * | 2019-11-22 | 2020-04-28 | 北京市科学技术情报研究所 | 一种基于引用次数的作者推荐方法 |
CN111078859B (zh) * | 2019-11-22 | 2021-02-09 | 北京市科学技术情报研究所 | 一种基于引用次数的作者推荐方法 |
CN111191045A (zh) * | 2019-12-30 | 2020-05-22 | 创新奇智(上海)科技有限公司 | 一种应用于知识图谱的实体对齐方法及系统 |
CN111191045B (zh) * | 2019-12-30 | 2023-06-16 | 创新奇智(上海)科技有限公司 | 一种应用于知识图谱的实体对齐方法及系统 |
CN111309867A (zh) * | 2020-02-18 | 2020-06-19 | 北京航空航天大学 | 一种知识库动态更新方法 |
CN111309867B (zh) * | 2020-02-18 | 2022-05-31 | 北京航空航天大学 | 一种知识库动态更新方法 |
CN111680163A (zh) * | 2020-04-21 | 2020-09-18 | 国网内蒙古东部电力有限公司 | 一种面向电力科技成果的知识图谱可视化方法 |
CN111597788B (zh) * | 2020-05-18 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 基于实体对齐的属性融合方法、装置、设备及存储介质 |
CN111597788A (zh) * | 2020-05-18 | 2020-08-28 | 腾讯科技(深圳)有限公司 | 基于实体对齐的属性融合方法、装置、设备及存储介质 |
CN111666411A (zh) * | 2020-05-29 | 2020-09-15 | 中国工商银行股份有限公司 | 企业知识图谱构建方法及装置 |
CN111666411B (zh) * | 2020-05-29 | 2023-10-31 | 中国工商银行股份有限公司 | 企业知识图谱构建方法及装置 |
CN113222771B (zh) * | 2020-07-10 | 2023-10-20 | 杭州海康威视数字技术股份有限公司 | 一种基于知识图谱确定目标群体的方法、装置及电子设备 |
CN113222771A (zh) * | 2020-07-10 | 2021-08-06 | 杭州海康威视数字技术股份有限公司 | 一种基于知识图谱确定目标群体的方法、装置及电子设备 |
CN112463977A (zh) * | 2020-10-22 | 2021-03-09 | 三盟科技股份有限公司 | 基于知识图谱的社区挖掘方法、系统、计算机及存储介质 |
CN114461817A (zh) * | 2022-02-10 | 2022-05-10 | 深圳市查策网络信息技术有限公司 | 一种文本大数据的图谱分析方法 |
CN116702745A (zh) * | 2023-06-14 | 2023-09-05 | 上交所技术有限责任公司 | 一种基于语义匹配模型的启发式实体对齐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108717425A (zh) | 一种基于多数据源的知识图谱人物实体对齐方法 | |
CN109948165B (zh) | 基于混合注意力网络的细粒度情感极性预测方法 | |
CN108763354B (zh) | 一种个性化的学术文献推荐方法 | |
CN106682172A (zh) | 一种基于关键词的文献研究热点推荐方法 | |
CN103778227A (zh) | 从检索图像中筛选有用图像的方法 | |
CN106250438A (zh) | 基于随机游走模型的零引用文章推荐方法及系统 | |
Arrish et al. | Shape-based plagiarism detection for flowchart figures in texts | |
CN104809105B (zh) | 基于最大熵的事件论元及论元角色的识别方法及系统 | |
CN117151659B (zh) | 一种基于大语言模型的生态修复工程全生命周期追溯方法 | |
CN110766273A (zh) | 一种优化特征权值的半监督聚类教学资产分类方法 | |
CN108132961A (zh) | 一种基于引用预测的参考文献推荐方法 | |
CN105095271B (zh) | 微博检索方法和微博检索装置 | |
CN110110116A (zh) | 一种整合深度卷积网络和语义分析的商标图像检索方法 | |
CN103778206A (zh) | 一种网络服务资源的提供方法 | |
Başarslan et al. | Sentiment analysis with ensemble and machine learning methods in multi-domain datasets | |
CN104778283A (zh) | 一种基于微博的用户职业分类方法及系统 | |
CN103761286B (zh) | 一种基于用户兴趣的服务资源检索方法 | |
CN104572915A (zh) | 一种基于内容环境增强的用户事件相关度计算方法 | |
CN114722217A (zh) | 一种基于链接预测和协同过滤的内容推送方法 | |
CN103324707A (zh) | 一种基于半监督聚类的查询扩展方法 | |
Sun et al. | Detecting ambiguous author names in crowdsourced scholarly data | |
CN112597273A (zh) | 一种基于nl2sql技术的配电自动化图表生成方法 | |
CN107122420A (zh) | 一种旅游热点事件检测方法及系统 | |
CN114944191B (zh) | 一种基于网络爬虫和多模态特征的成分-靶点相互作用预测方法 | |
CN106816871B (zh) | 一种电力系统状态相似性分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181030 |
|
RJ01 | Rejection of invention patent application after publication |