CN109739994A - 一种基于参考文档的api知识图谱构建方法 - Google Patents

一种基于参考文档的api知识图谱构建方法 Download PDF

Info

Publication number
CN109739994A
CN109739994A CN201811529971.XA CN201811529971A CN109739994A CN 109739994 A CN109739994 A CN 109739994A CN 201811529971 A CN201811529971 A CN 201811529971A CN 109739994 A CN109739994 A CN 109739994A
Authority
CN
China
Prior art keywords
api
concept
knowledge
sentence
general character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811529971.XA
Other languages
English (en)
Other versions
CN109739994B (zh
Inventor
彭鑫
刘名威
赵文耘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN201811529971.XA priority Critical patent/CN109739994B/zh
Publication of CN109739994A publication Critical patent/CN109739994A/zh
Application granted granted Critical
Publication of CN109739994B publication Critical patent/CN109739994B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于软件工程与智能化软件开发技术领域,具体为一种基于参考文档的API知识图谱构造方法。本发明方法包括,通过文档结构解析获得API元素的基本骨架结构,通过对API元素描述性内容中的句子进行自动分类来识别功能描述和使用方式描述;在不同API元素的描述信息之间进行共性概念的识别和链接,实现内部知识融合;在API元素描述信息中的共性概念与通用知识图谱中相关的技术概念之间进行概念链接,实现外部知识融合。本发明所构造的API知识图谱包括API包、类、接口、方法、属性、异常、方法参数与返回值以及这些元素之间的关系;本发明构造的API知识图谱,通过结构化的知识表示支持API知识语义查询、自动问答、辅助代码理解和代码推荐等智能化应用。

Description

一种基于参考文档的API知识图谱构建方法
技术领域
本发明属于软件工程与智能化软件开发技术领域,具体涉及一种API知识图谱构造方法。
背景技术
知识图谱(Knowledge Graph)是由Google在2012年正式提出的,其初衷是为了提高搜索引擎的能力,改善用户的搜索质量以及体验。知识图谱将真实世界中存在的各种实体、概念以及它们之间的关系用图的形式加以描述,从而为信息处理提供知识基础。目前已经有一些大规模通用知识图谱,如FreeBase、Yogo、Wikidata等。而在金融、电商、医疗等领域也产生了大量的领域知识图谱,用于支撑欺诈检测、电商管控、辅助决策等行业应用。知识图谱已经成为人工智能的关键技术之一,被广泛应用于智能搜索、自动问答、个性化推荐、内容分发等应用中。
软件开发是一个知识密集型的过程。其中各种编程语言、软件开发框架、软件组件包等所提供的API(Application Programming Interface,即应用编程接口)是开发人员所依赖的一种重要的开发资源,与之相关的知识对于开发人员有着重要的作用。与API相关的知识内容散布在很多不同的地方,例如API参考文档、API教程、API实现和使用代码、软件开发技术论坛等。当开发人员寻找并了解所需要的API或希望找到API相关问题的解决方案时,他们只能通过各种渠道获得零散的信息,无法获得有针对性的知识服务。同时,相关软件开发工具在完成代码理解和代码推荐等自动化任务时也缺少API相关的知识基础提供支撑。
发明内容
本发明的目的在于提供一种能够支持API知识语义查询、自动问答、辅助代码理解和代码推荐等智能化应用的基于参考文档的API知识图谱构建方法。
本发明在API参考文档等文档资源以及通用知识图谱基础上构造API知识图谱,以图谱化的方式刻画API元素、功能描述、使用约束以及与相关背景知识概念之间的关系,为API知识搜索、问答和各种相关的智能化应用提供知识基础。
本发明提供的基于参考文档的API知识图谱构建方法,具体步骤如下。
(1)API元素结构性知识抽取。API元素结构性知识包括各种API元素(例如API包、类、接口、方法、属性、异常、方法参数与返回值等)及其之间的结构关系(例如包含、继承、实现、类型、抛出异常等)。在规范格式的API参考文档(一般为HTML页面)基础上,通过网页包装器解析文档内容,从中抽取各种API元素以及相互之间的关系。
(2)API描述性句子自动分类。API参考文档中对于每个API元素都有一系列描述性句子,其中主要包含功能描述、使用方式(如参数约束)、其他三种类别。这一步通过自动分类从描述性句子中选取功能描述、使用方式两类句子,予以保留,加入API知识图谱。
具体包括以下子步骤:
1)从API参考文档中抽取每个API元素的描述性句子,过滤掉低质量的句子(如过短的句子)之后用于后续处理;
2)随机选取一部分描述性句子,由熟悉相关API的开发者人工标注为功能描述、使用方式、其他三种类别之一;
3)将所有API元素的描述性句子作为语料训练,利用无监督学习为其中的每个词产生一个词向量,同时针对每个描述性句子通过词向量平均得到句向量;
4)在人工标注的句子分类基础上训练一个深度学习分类器,以描述性句子的句向量作为输入,句子分类结果(功能描述、使用方式、或其他)作为输出;
5)利用训练好的句子分类器对所有API元素的描述性句子进行分类,将属于功能描述、使用方式这两类的句子加入API知识图谱。
(3)内部知识融合。不同的API描述性语句中可能会包含共性的概念,例如“Socket”、“thread”等。这一步识别和抽取不同的API描述性语句中的共性概念,并与相应的API描述性语句建立关联链接,实现内部知识融合。
具体包括以下子步骤:
1)针对知识图谱中每个API元素的功能描述或使用方式描述句子,通过词性标注、词干化、句子成分分析、依赖树解析之后,选取其中所有名词短语作为候选的共性概念;
2)针对所有候选的共性概念,通过词形和语义两个方面计算两两之间的相似度,其中词形相似度是概念名称的杰卡德相似度(取决于其中公共的词根比例)、语义相似度是它们所在的句子的句向量的余弦相似度;
3)针对所有候选的共性概念,基于它们两两之间的相似度进行聚类,两两相似度高的概念被聚到一起,将其中处于聚类中心的概念作为共性概念;
4)将每个聚类中的共性概念加入到API知识图谱中,并在该聚类中其他概念的来源句子与这个共性概念之间建立关联链接,从而实现内部知识融合。
(4)基于通用知识图谱的技术概念抽取。WikiData等通用知识图谱中包含大量的通用概念,其中一部分与计算机和软件相关,可以成为API知识图谱的背景知识。这一步基于通用知识图谱中概念的描述文本(如WikiData中概念对应的Wikipedia页面)自动识别与计算机和软件相关的技术概念;将所有技术概念的概念,及其在通用知识图谱中的关系都加入到API知识图谱中。
具体包括以下子步骤:
1)人工选取一部分通用知识图谱中的概念进行标注,将其分为与计算机和软件相关的技术概念以及非技术概念两类;
2)以通用知识图谱中所有概念的文本描述信息为语料,利用无监督学习为其中的每个词产生一个词向量,同时针对通用知识图谱中的每个概念利用其描述文本的词向量平均得到相应的概念向量表示;
3)在人工标注的概念分类基础上训练一个深度学习分类器,以概念的向量表示作为输入,概念分类结果(技术概念、非技术概念)作为输出;
4)通过训练好的分类器对通用知识图谱中所有的概念进行分类,将所有被分类为技术概念的概念(称为通用概念)及其在通用知识图谱中的关系都加入到API知识图谱中。
(5)外部知识融合。API描述性语句中提及的共性概念(例如“Socket”、“thread”等)中有很多在通用知识图谱中都有定义,可以通过建立概念链接实现与背景知识的融合。这一步基于文本及上下文分析在API元素以及共性概念与第4步得到的通用概念之间建立链接关系,实现外部知识融合。
具体包括以下子步骤:
1)针对API知识图谱中所有的结点(API元素、共性概念、通用概念等)收集文本描述信息构成文本语料,其中API元素的描述就是它们在API参考文档中对应的描述文本、API描述性句子的描述就是其本身、共性概念的描述是所有与之存在关联链接的API描述性句子、通用概念的描述是它们在通用知识图谱中对应的文本描述;
2)基于所收集的文本语料进行无监督的词向量训练,从而使所有结点文本描述中的词都有一个统一的词向量表示,同时针对API知识图谱中的每个结点通过其描述文本的词向量平均获得对应的结点向量表示;
3)对于API知识图谱中的每一个API元素和共性概念,计算与每一个通用概念的向量余弦相似度,如果相似度高于给定阈值那么就在API知识图谱中建立它们之间的关联链接,从而实现外部知识融合。
本发明所构造的API知识图谱,其高层结构如图1所示。整个API知识图谱,包括API包、类、接口、方法、属性、异常、方法参数与返回值等API元素以及这些元素之间的关系,同时还包括API元素的功能描述和使用方式两类描述性知识内容,并在不同API元素的描述信息之间以及这些描述与WikiData等通用知识图谱之间实现知识融合。为此,本发明通过文档结构解析获得API元素的基本骨架结构,然后通过对API元素描述性内容中的句子进行自动分类来识别功能描述和使用方式描述;在此基础上,本发明在不同API元素的描述信息之间进行共性概念(称为API概念)的识别和链接,实现内部知识融合;同时在API元素描述信息中的API概念与通用知识图谱中相关的技术概念之间进行概念链接,实现外部知识融合。
本发明基于通用API(如JDK、Android API)的参考文档自动化地构造API知识图谱,从而通过结构化的知识表示支持API知识语义查询、自动问答、辅助代码理解和代码推荐等智能化应用。
附图说明
图1为本发明的所构建的API知识图谱的高层结构。
具体实施方式
以下针对JDK 1.8以及Android API 27的API知识图谱构建,进一步描述本发明。
(1)API元素结构性知识抽取。利用Python库Scrapy自动爬取网页形式的JDK 1.8以及Android API 27参考文档,然后利用Python库Beautiful Soup实现解析API参考文档的网页包装器来抽取API元素结构性知识。
(2)API描述性句子自动分类。使用Python库Beautiful Soup来将HTML格式的描述文本转换成纯文本描述,利用Python库Spacy进行词性标注、词干化、句子成分分析、依赖树解析等文本预处理。然后使用谷歌提供的开源工具Word2Vec来训练词向量,训练的模型选择CBOW(Continuous Bag-of-Word,连续词袋)模型。使用反向传播神经网络(BackPropagation Neural Network)建立句子分类的深度学习模型。
(3)内部知识融合。在候选共性概念的抽取中,使用Python库Spacy来进行词性标注、词干化、句子成分分析、依赖树解析等文本预处理。概念相似度计算中将词形相似度与语义相似度的权重设置为1:1。使用层次聚类(Hierarchical Clustering)实现概念聚类,得到一个有层次的嵌套树结构,其中的层次聚类算法采用Python库Sklearn提供的实现。
(4)基于通用知识图谱的技术概念抽取。使用通用知识图谱WikiData作为通用概念的来源,将每个概念对应的Wikipedia页面的内容作为它的文本描述。然后使用谷歌提供的开源工具Word2Vec来训练词向量,训练的模型选择CBOW(Continuous Bag-of-Word,连续词袋)模型。使用反向传播神经网络(Back Propagation Neural Network)建立概念分类的深度学习模型。
(5)外部知识融合。使用谷歌提供的开源工具Word2Vec来训练词向量,训练的模型选择CBOW(Continuous Bag-of-Word,连续词袋)模型。在概念链接计算中,选择在余弦相似度大于0.8的API元素或共性概念和通用概念之间建立关联链接。
根据本发明构建的API知识图谱,不仅包含结构关系,而且还包含通过内部知识融合和外部知识融合所建立的概念关联,为API元素及其描述性句子提供了丰富的上下文信息。这种基于图的上下文信息为API元素及其描述提供了丰富的语义信息,能够为弥补各种关于API的文本描述(如API知识查询与API描述、不同的技术问答贴等)之间的概念鸿沟提供知识基础。基于这种API知识图谱可以实现API知识查询与汇编、API问题讨论推荐、开源项目API文档自动合成、API 知识自动问答等应用。

Claims (6)

1.基于参考文档的API知识图谱构建方法,其特征在于,具体步骤如下:
(1)API元素结构性知识抽取;
API元素结构性知识包括各种API元素及其之间的结构关系,所述API元素包括API包、类、接口、方法、属性、异常、方法参数与返回值,所述结构关系包括包含、继承、实现、类型、抛出异常;在规范格式的API参考文档基础上,通过网页包装器解析文档内容,从中抽取各种API元素以及相互之间的关系;
(2)API描述性句子自动分类:
API参考文档中对于每个API元素都有一系列描述性句子,主要有功能描述、使用方式、其他三种类型;通过自动分类从描述性句子中选取功能描述、使用方式两类句子,并将这两类的句子加入API知识图谱;
(3)内部知识融合:
不同的API描述性语句中可能会包含共性的概念,识别和抽取不同的API描述性语句中的共性概念,并与相应的API描述性语句建立关联链接,实现内部知识融合;
(4)基于通用知识图谱的技术概念抽取:
通用知识图谱中包含大量的通用概念,其中一部分与计算机和软件相关,可以成为API知识图谱的背景知识;基于通用知识图谱中概念的描述文本自动识别与计算机和软件相关的技术概念;将所有技术概念的概念,及其在通用知识图谱中的关系都加入到API知识图谱中;
(5)外部知识融合:
API描述性语句中提及的共性概念中有很多在通用知识图谱中都有定义,通过建立概念链接实现与背景知识的融合;基于文本及上下文分析在API元素以及共性概念与第4步得到的技术概念即通用概念之间建立链接关系,实现外部知识融合。
2.根据权利要求1所述的基于参考文档的API知识图谱构建方法,其特征在于,步骤(2)中所述的API描述性句子自动分类,具体包括以下子步骤:
1)从API参考文档中抽取每个API元素的描述性句子,过滤掉低质量的句子之后用于后续处理;
2)随机选取一部分描述性句子,由熟悉相关API的开发者人工标注为功能描述、使用方式、其他三种类别之一;
3)将所有API元素的描述性句子作为语料训练,利用无监督学习为其中的每个词产生一个词向量,同时针对每个描述性句子通过词向量平均得到句向量;
4)在人工标注的句子分类基础上训练一个深度学习分类器,以描述性句子的句向量作为输入,句子分类结果:功能描述、使用方式、或其他,作为输出;
5)利用训练好的句子分类器对所有API元素的描述性句子进行分类,将属于功能描述、使用方式这两类的句子加入API知识图谱。
3.根据权利要求2所述的基于参考文档的API知识图谱构建方法,其特征在于,步骤(3)中所述的内部知识融合,具体包括以下子步骤:
1)针对知识图谱中每个API元素的功能描述或使用方式描述句子,通过词性标注、词干化、句子成分分析、依赖树解析之后,选取其中所有名词短语作为候选的共性概念;
2)针对所有候选的共性概念,通过词形和语义两个方面计算两两之间的相似度,其中,词形相似度是概念名称的杰卡德相似度,语义相似度是它们所在的句子的句向量的余弦相似度;
3)针对所有候选的共性概念,基于它们两两之间的相似度进行聚类,两两相似度高的概念被聚到一起,将其中处于聚类中心的概念作为共性概念;
4)将每个聚类中的共性概念加入到API知识图谱中,并在该聚类中其他概念的来源句子与这个共性概念之间建立关联链接,从而实现内部知识融合。
4.根据权利要求3所述的基于参考文档的API知识图谱构建方法,其特征在于,步骤(4)中所述的基于通用知识图谱的技术概念抽取,具体包括以下子步骤:
1)人工选取一部分通用知识图谱中的概念进行标注,将其分为与计算机和软件相关的技术概念以及非技术概念两类;
2)以通用知识图谱中所有概念的文本描述信息为语料,利用无监督学习为其中的每个词产生一个词向量,同时针对通用知识图谱中的每个概念利用其描述文本的词向量平均得到相应的概念向量表示;
3)在人工标注的概念分类基础上训练一个深度学习分类器,以概念的向量表示作为输入,概念分类结果:技术概念、非技术概念,作为输出;
4)通过训练好的分类器对通用知识图谱中所有的概念进行分类,将所有被分类为技术概念的概念,及其在通用知识图谱中的关系都加入到API知识图谱中。
5.根据权利要求4所述的基于参考文档的API知识图谱构建方法,其特征在于,步骤(5)中所述的外部知识融合,具体包括以下子步骤:
1)针对API知识图谱中所有的结点:API元素、共性概念、通用概念;收集文本描述信息构成文本语料,其中,API元素的描述就是它们在API参考文档中对应的描述文本,API描述性句子的描述就是其本身,共性概念的描述是所有与之存在关联链接的API描述性句子,通用概念的描述是它们在通用知识图谱中对应的文本描述;
2)基于所收集的文本语料进行无监督的词向量训练,使所有结点文本描述中的词都有一个统一的词向量表示,同时针对API知识图谱中的每个结点通过其描述文本的词向量平均获得对应的结点向量表示;
3)对于API知识图谱中的每一个API元素和共性概念,计算与每一个通用概念的向量余弦相似度,如果相似度高于给定阈值那么就在API知识图谱中建立它们之间的关联链接,从而实现外部知识融合。
6.由权利要求1-5之一所述的方法构建的API知识图谱,其特征在于,包括API包、类、接口、方法、属性、异常、方法参数与返回值这些API元素以及这些元素之间的关系,同时还包括API元素的功能描述和使用方式两类描述性知识内容,并在不同API元素的描述信息之间以及这些描述与通用知识图谱之间实现知识融合;其中,通过文档结构解析获得API元素的基本骨架结构,然后通过对API元素描述性内容中的句子进行自动分类来识别功能描述和使用方式描述;在此基础上,在不同API元素的描述信息之间进行共性概念的识别和链接,实现内部知识融合;同时在API元素描述信息中的API概念与通用知识图谱中相关的技术概念之间进行概念链接,实现外部知识融合。
CN201811529971.XA 2018-12-14 2018-12-14 一种基于参考文档的api知识图谱构建方法 Active CN109739994B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811529971.XA CN109739994B (zh) 2018-12-14 2018-12-14 一种基于参考文档的api知识图谱构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811529971.XA CN109739994B (zh) 2018-12-14 2018-12-14 一种基于参考文档的api知识图谱构建方法

Publications (2)

Publication Number Publication Date
CN109739994A true CN109739994A (zh) 2019-05-10
CN109739994B CN109739994B (zh) 2023-05-02

Family

ID=66358998

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811529971.XA Active CN109739994B (zh) 2018-12-14 2018-12-14 一种基于参考文档的api知识图谱构建方法

Country Status (1)

Country Link
CN (1) CN109739994B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110874431A (zh) * 2019-11-20 2020-03-10 云南财经大学 基于JAVA Doc知识图谱的多维评估推荐方法
CN110990003A (zh) * 2019-11-15 2020-04-10 南通大学 一种基于词嵌入技术的api推荐方法
CN111241307A (zh) * 2020-01-23 2020-06-05 复旦大学 面向软件系统的软件项目及第三方库知识图谱构造方法
CN111737471A (zh) * 2020-06-28 2020-10-02 中国农业科学院农业信息研究所 一种基于知识图谱的档案管理模型构建方法及系统
CN111814472A (zh) * 2020-09-03 2020-10-23 平安国际智慧城市科技股份有限公司 文本识别方法、装置、设备及存储介质
CN111966818A (zh) * 2020-07-26 2020-11-20 复旦大学 一种基于深度学习的交互式api代码片段推荐方法
CN112100322A (zh) * 2020-08-06 2020-12-18 复旦大学 一种基于知识图谱的api元素比较结果自动生成方法
CN112100314A (zh) * 2020-08-16 2020-12-18 复旦大学 一种基于软件开发问答网站的api教程汇编生成方法
CN112346711A (zh) * 2019-08-07 2021-02-09 上海交通大学 用于语义识别的编程规范知识图谱构建系统及方法
CN112395884A (zh) * 2020-11-15 2021-02-23 复旦大学 一种基于代码文档的安卓api语义关系图谱构建方法
CN113849163A (zh) * 2021-10-09 2021-12-28 中国科学院软件研究所 基于api文档图谱的操作系统智能编程方法及装置
CN114661872A (zh) * 2022-02-25 2022-06-24 北京大学 一种面向初学者的api自适应推荐方法与系统
CN114969272A (zh) * 2022-06-27 2022-08-30 哈尔滨工业大学 在api知识图谱上基于q学习的api序列搜索方法
CN117236435A (zh) * 2023-11-08 2023-12-15 中国标准化研究院 一种设计理性知识网络的知识融合方法、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488724A (zh) * 2013-09-16 2014-01-01 复旦大学 一种面向图书的阅读领域知识图谱构建方法
CN106777274A (zh) * 2016-06-16 2017-05-31 北京理工大学 一种中文旅游领域知识图谱构建方法及系统
CN108959433A (zh) * 2018-06-11 2018-12-07 北京大学 一种从软件项目数据中提取知识图谱并问答的方法与系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488724A (zh) * 2013-09-16 2014-01-01 复旦大学 一种面向图书的阅读领域知识图谱构建方法
CN106777274A (zh) * 2016-06-16 2017-05-31 北京理工大学 一种中文旅游领域知识图谱构建方法及系统
CN108959433A (zh) * 2018-06-11 2018-12-07 北京大学 一种从软件项目数据中提取知识图谱并问答的方法与系统

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112346711A (zh) * 2019-08-07 2021-02-09 上海交通大学 用于语义识别的编程规范知识图谱构建系统及方法
CN110990003A (zh) * 2019-11-15 2020-04-10 南通大学 一种基于词嵌入技术的api推荐方法
CN110874431A (zh) * 2019-11-20 2020-03-10 云南财经大学 基于JAVA Doc知识图谱的多维评估推荐方法
CN111241307A (zh) * 2020-01-23 2020-06-05 复旦大学 面向软件系统的软件项目及第三方库知识图谱构造方法
CN111737471A (zh) * 2020-06-28 2020-10-02 中国农业科学院农业信息研究所 一种基于知识图谱的档案管理模型构建方法及系统
CN111737471B (zh) * 2020-06-28 2023-10-13 中国农业科学院农业信息研究所 一种基于知识图谱的档案管理模型构建方法及系统
CN111966818B (zh) * 2020-07-26 2024-03-08 复旦大学 一种基于深度学习的交互式api代码片段推荐方法
CN111966818A (zh) * 2020-07-26 2020-11-20 复旦大学 一种基于深度学习的交互式api代码片段推荐方法
CN112100322A (zh) * 2020-08-06 2020-12-18 复旦大学 一种基于知识图谱的api元素比较结果自动生成方法
CN112100314B (zh) * 2020-08-16 2022-07-22 复旦大学 一种基于软件开发问答网站的api教程汇编生成方法
CN112100314A (zh) * 2020-08-16 2020-12-18 复旦大学 一种基于软件开发问答网站的api教程汇编生成方法
CN111814472B (zh) * 2020-09-03 2021-04-06 平安国际智慧城市科技股份有限公司 文本识别方法、装置、设备及存储介质
CN111814472A (zh) * 2020-09-03 2020-10-23 平安国际智慧城市科技股份有限公司 文本识别方法、装置、设备及存储介质
CN112395884B (zh) * 2020-11-15 2022-04-12 复旦大学 一种基于代码文档的安卓api语义关系图谱构建方法
CN112395884A (zh) * 2020-11-15 2021-02-23 复旦大学 一种基于代码文档的安卓api语义关系图谱构建方法
CN113849163A (zh) * 2021-10-09 2021-12-28 中国科学院软件研究所 基于api文档图谱的操作系统智能编程方法及装置
CN114661872A (zh) * 2022-02-25 2022-06-24 北京大学 一种面向初学者的api自适应推荐方法与系统
CN114661872B (zh) * 2022-02-25 2023-07-21 北京大学 一种面向初学者的api自适应推荐方法与系统
CN114969272A (zh) * 2022-06-27 2022-08-30 哈尔滨工业大学 在api知识图谱上基于q学习的api序列搜索方法
CN114969272B (zh) * 2022-06-27 2024-07-02 哈尔滨工业大学 在api知识图谱上基于q学习的api序列搜索方法
CN117236435A (zh) * 2023-11-08 2023-12-15 中国标准化研究院 一种设计理性知识网络的知识融合方法、装置及存储介质
CN117236435B (zh) * 2023-11-08 2024-01-30 中国标准化研究院 一种设计理性知识网络的知识融合方法、装置及存储介质

Also Published As

Publication number Publication date
CN109739994B (zh) 2023-05-02

Similar Documents

Publication Publication Date Title
CN109739994A (zh) 一种基于参考文档的api知识图谱构建方法
Li et al. Imbalanced text sentiment classification using universal and domain-specific knowledge
CN106250412B (zh) 基于多源实体融合的知识图谱构建方法
CN106156286B (zh) 面向专业文献知识实体的类型抽取系统及方法
CN114417004A (zh) 一种知识图谱和事理图谱的融合方法、装置和系统
Castellanos et al. Formal concept analysis for topic detection: a clustering quality experimental analysis
CN108052593A (zh) 一种基于主题词向量和网络结构的主题关键词提取方法
Chawla et al. Product opinion mining using sentiment analysis on smartphone reviews
CN112100322B (zh) 一种基于知识图谱的api元素比较结果自动生成方法
CN102708164B (zh) 电影期望值的计算方法及系统
CN109543034A (zh) 基于知识图谱的文本聚类方法、装置及可读存储介质
Santosh et al. Opinion mining of online product reviews from traditional LDA Topic Clusters using Feature Ontology Tree and Sentiwordnet
CN106294845A (zh) 基于权重学习和多特征抽取的多情绪分类方法及装置
CN103279458A (zh) 一种领域本体的构建及实例化方法
CN116303996B (zh) 基于多焦点图神经网络的主题事件抽取方法
Xu et al. Novel approach of semantic annotation by fuzzy ontology based on variable precision rough set and concept lattice
Pavlić et al. Graph-based formalisms for knowledge representation
CN109299286A (zh) 非结构化数据的知识挖掘方法及系统
Yin et al. Two-stage Text-to-BIMQL semantic parsing for building information model extraction using graph neural networks
Kalo et al. Knowlybert-hybrid query answering over language models and knowledge graphs
CN114911893A (zh) 基于知识图谱的自动化构建知识库的方法及系统
CN110209767A (zh) 一种用户画像构建方法
CN103699568B (zh) 一种从维基中抽取领域术语间上下位关系的方法
CN113239143A (zh) 融合电网故障案例库的输变电设备故障处理方法及系统
Norouzifard et al. Using natural language processing in order to create SQL queries

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant