CN109993381B - 基于知识图谱的需求管理应用方法、装置、设备及介质 - Google Patents
基于知识图谱的需求管理应用方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN109993381B CN109993381B CN201711475015.3A CN201711475015A CN109993381B CN 109993381 B CN109993381 B CN 109993381B CN 201711475015 A CN201711475015 A CN 201711475015A CN 109993381 B CN109993381 B CN 109993381B
- Authority
- CN
- China
- Prior art keywords
- knowledge
- graph
- participle
- triple
- work order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000011218 segmentation Effects 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims abstract description 23
- 238000004590 computer program Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 description 15
- 238000011161 development Methods 0.000 description 11
- 230000018109 developmental process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000033772 system development Effects 0.000 description 7
- 238000012423 maintenance Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 239000000969 carrier Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 230000002354 daily effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了基于知识图谱的需求管理应用方法、装置、设备及介质。该方法包括:获取用于描述需求的若干个工单数据;对所述工单数据中的文本内容进行分词处理,并基于预设的电信行业词库对处理后的分词进行识别;将识别后的结果输入到预设的知识图谱,若确定知识图谱中存在与所述识别后的结果相匹配的知识,则将该知识对应的知识标签作为所述若干个工单数据所描述需求的属性。通过本发明的技术方案,能够基于知识图谱的学习能力对各类工单数据进行有效地分类,便于后续为用户提供有价值的需求内容。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种基于知识图谱的需求管理应用方法、装置、设备及介质。
背景技术
随着全业务竞争格局加剧,在电信行业竞争激烈的市场环境以及互联网跨越式的发展下,新业务、新技术层出不穷,伴随着新业务、新系统、新设备的不断部署上线。在提升系统支撑能力的同时,需求管理平台中各开发、维护、问题需求每天产生大量数据,提出人、项目经理、专家、厂商负责人每天需要分析处理大量需求及功能点。
现有以人工输入关键词匹配方式已无法满足系统研发强度下相关知识的搜索展示,然而,在进行发明创造的过程中,发明人发现,现有技术存在如下缺点:日常需求管理中因重复、低效、不明确等原因导致开发需求的系统研发资源损耗,延长了需求管理的全生命周期。传统归类的分析方式,无法根据需求自动提取知识点进行匹配,从而无法关联该需求开发过程中可能涉及的风险、问题。由于需求管理人员知识不对称、业务水平不相同造成的需求开发及维护过程中风险大大增加。
综上所述,如何提供一种智能的的知识库需求管理应用方法从而辅助人工进行沟通决策提升效率是一个亟待解决的问题。
发明内容
本发明实施例提供了一种基于知识图谱的需求管理应用方法、装置、设备及介质。
第一方面,本发明实施例提供了一种基于知识图谱的需求管理应用方法,方法包括:
获取用于描述需求的若干个工单数据;
对所述工单数据中的文本内容进行分词处理,并基于预设的电信行业词库对处理后的分词进行识别;
将识别后的结果输入到预设的知识图谱,若确定知识图谱中存在与所述识别后的结果相匹配的知识,则将该知识对应的知识标签作为所述若干个工单数据所描述需求的属性。
第二方面,本发明实施例提供了一种基于知识图谱的需求管理应用装置,装置包括:
获取单元,用于获取用于描述需求的若干个工单数据;
分词单元,用于对所述工单数据中的文本内容进行分词处理,并基于预设的电信行业词库对处理后的分词进行识别;
处理单元,用于将识别后的结果输入到预设的知识图谱,若确定知识图谱中存在与所述识别后的结果相匹配的知识,则将该知识对应的知识标签作为所述工单数据所描述需求的属性。
本发明实施例提供了一种基于知识图谱的需求管理应用设备,包括:至少一个处理器、至少一个存储器以及存储在存储器中的计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当计算机程序指令被处理器执行时实现如上述实施方式中第一方面的方法。
本发明实施例提供的基于知识图谱的需求管理应用方法、装置、设备及介质,首先对描述需求的工单数据进行分词处理,接着输入到知识图谱中进行匹配,若匹配成功,则将匹配的知识设置为该工单数据的属性,从而能够为各个类型的工单数据进行分类标记,能够基于知识图谱的学习能力对各类工单数据进行有效地分类关系,便于后续为用户提供有价值的需求内容。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明一个实施例提供的一种基于知识图谱的需求管理应用方法实施例流程图;
图2示出了本发明一个实施例提供的工单分词示意图;
图3示出了本发明一个实施例提供的知识图谱匹配示意图;
图4示出了本发明一个实施例提供的各类知识库示意图;
图5示出了本发明一个实施例提供的一种基于知识图谱的需求管理应用方法完整实施例流程图;
图6示出了本发明一个实施例提供的一种基于用户输入输出相关需求的示例;
图7示出了本发明一个实施例提供的另一种基于用户输入输出相关需求的示例;
图8示出了本发明一个实施例提供的基于知识图谱的需求管理应用方法示意图;
图9示出了本发明一个实施例提供的一种基于知识图谱的需求管理应用装置结构示意图;
图10示出了本发明一个实施例提供的一种电子设备结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语
“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为便于理解,首先解释一下知识图谱的概念。知识图谱:即科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,可用于描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
基于此,第一方面,本发明实施例提供了一种基于知识图谱的需求管理应用方法,如图1所示,所述方法包括:
S101、获取用于描述需求的若干个工单数据;
其中,这里的工单数据有很多种类型,用于描述不同种类的需求。例如这里的工单数据可以包括问题工单、维护工单、测试案例、需求专家知识或者风险点。当然还可以根据实际需要采集其他类型的工单数据,对于工单数据的分类也可以有多种,本发明实施例对此不作具体限定。图2的左侧文字部分即为描述一种需求两个工单示例。
S102、对所述工单数据中的文本内容进行分词处理,并基于预设的电信行业词库对处理后的分词进行识别;
具体来说,如图2所示的工单文本1至工单文本N,将具体的文本描述内容通过语言处理技术进行处理,例如可以通过NLP技术进行自然语言处理。再根据行业词库(例如电信行业词库)对文本进行分词。如图2所示,有两段工单文本,通过NLP对这两段文本进行分词,在电信领域中有其独有的行业词库,即电信行业的一些常用词语和专业词语。在图2的两段工单文本进行分词后,识别出其中属于行业词库中的词语,如图2右栏所示的业务分词,最后取出这些分词作为分词结果进行后续处理,如图2中带底色且加框的分词。识别之后同时统计各个分词的词性以及词频,以便后续输入到知识图谱中进行匹配。
S103、将识别后的结果输入到预设的知识图谱,若确定知识图谱中存在与所述识别后的结果相匹配的知识,则将该知识对应的知识标签作为所述工单数据所描述需求的属性。
图2左侧保存的知识图谱以表格的形式展现出来,知识存储基本单元为三元组(SPO),其中S和O为实体,P为关系。表1示出了一种三元组的示例。
表1三元组示例
S | P | O |
营业厅 | 打印 | 详单 |
SPO这些基本单元的集合链接起来成为一个有向图(graph),每个节点是一个一个实体,每条边是一个关系,或者说是一个事实(fact),链接通过训练完成组合。
每条知识有一个知识标签(即知识ID)对应,将上述两段文本的分词结果与知识图谱存储的知识逐条对比。在对比时,根据词频和词性将文本内容中每句话的三个词组成三元组,再与知识图谱中的知识匹配。这里根据词频和词性生成三元组并匹配的过程与现有的知识图谱匹配过程类似,在此不再赘述。不难发现,图2的知识图谱中,有三条知识匹配成功(也即这三条知识存储的分词与根据文本内容生成的三元组中的分词相同),即知识ID分别为100535,100536,143663的知识匹配成功,将这三个知识标齐标签作为原数据(即这两段文本)的一条属性。
本发明实施例提供的基于知识图谱的需求管理应用方法中,首先对描述需求的工单数据进行分词处理,接着输入到知识图谱中进行匹配,若匹配成功,则将匹配的知识设置为该工单数据的属性,从而能够为各个类型的工单数据进行分类标记,能够基于知识图谱的学习能力对各类工单数据进行有效地分类关系,便于后续为用户提供有价值的需求内容。
在具体实施时,本发明实施例提供的方法还可以包括:
S103、对于匹配后剩余的第一分词,在所述工单数据的文本内容中若存在与所述第一分词的词间距小于预设的词间距,且能够与所述第一分词组成三元组实例的第二分词以及第三分词,则将所述第一分词、第二分词以及第三分词组成三元组实例;其中,在所述三元组实例中,第一分词、第二分词以及第三分词中的两个用于表示两个实体,另外一个用于表示两个实体之间的关系;
具体来说,对于匹配剩余的内容,将图谱中未记录的新词按照在文本内容中的词间距获取,并以三元组实例形成疑似新知识进行训练,还以图2中的需求为例,如图3所示,对于上述分词结果中匹配后剩余的分词记录,如“渠道”“转化”“归属地”“中国移动”等,将这些剩余的分词按照一定的词间距组成新是三元组实例进行训练。比如“渠道”附近有语句“给予渠道一定的奖励政策”,则可以组成三元组实例:渠道、获得、政策奖励。
S104、若确定知识图谱中存在与所述三元组实例结构相似的知识,则将所述三元组实例加入到知识图谱中,并为所述三元组实例赋予新的知识标签。
这里确定是否存在结构相似的知识可以通过如下方式来进行:若知识图谱中存在第一知识,所述第一知识包含的分词中有两个分词与所述三元组实例包含的分词相同,则确定知识图谱中存在与所述三元组实例结构相似的知识。还以图3中的例子来进行说明。图3中“渠道”、“奖励政策”和知识图谱中的知识ID为302998的知识结构比较相似,因为知识ID为302998的知识中有两个分词“渠道”、“政策奖励”与组成的三元组示例中的分词相同,因此可以形成新的知识(即图3示中知识ID为302921的知识),并加入到知识图谱中。同理,“用户转化为移动4G用户”中“用户”“转化”和知识图谱中知识ID为150779的知识结构比较相似,因此可形成新的知识,为其分配新的知识ID(即图3示中知识ID为150868的知识),同时加入到知识图谱中进行存储,建立与现有知识的关联。进一步地,这里为提升准确性可辅以人工研判。
而对于分词“归属地”,其附近词间距内并未找到分词组合形成三元组且与知识图谱结构类似,这种分词无法训练成新的知识。
在具体实施时,本发明实施例提供的方法还可以包括:
S104、为所述若干个工单数据分配一个需求编号,并与相匹配的知识标签对应存储。
也即如图4左上角所示,图4示出的两段工单文本描述的需求ID可以设置为R20170304001,并与相匹配的知识标签对应存储。
进一步地,本发明实施例提供的方法还可以包括:
S105、在接收到用户输入的搜索内容后,若确定所述知识图谱中存在与所述搜索内容相匹配的知识,则生成该搜索内容的知识点,所述知识点中包含与所述搜索内容相匹配的所有知识;
也就是说,在接收到用户输入的搜索内容后,首先对内容进行分词处理,接着输入到知识图谱中与知识图谱中存储的知识进行匹配,匹配的过程与现有技术中匹配的过程相同,在此不再赘述。接着将匹配成功的知识点挑选出来生成知识点。
其中,这里的搜索内容可以为若干个词汇或整段语料。也就是说本发明实施例提供的方法可提供全文匹配、多类数据匹配的模式。
S106、若在指定的知识库中确定存在第一需求,所述第一需求对应的知识与所述知识点中包含的知识中相同知识的数量超过预设值,则将所述第一需求输出。
具体来说,在实际情况中可能有多种不同类型的知识库。各个知识库存储了经过知识图谱匹配过的若干个需求,每个需求都可以查询到其对应的知识ID。若根据知识ID判断得知知识点包含的知识与某一需求对应的知识相同知识的数量大于预设值,则将该需求输出,作为用户输入内容的相似需求。
其中,这里可以使用ElasticSearch工具在各个知识库中进行查询,当然也可以采用其他查询方法,本发明实施例对此不作具体限定。
图5示出了本发明实施例提供的方法的一个示例性流程,由于前文已经对各个步骤进行了说明,在此不再赘述。
图6示出了用户查询的一个示例。基于知识图谱的知识库管理平台,提供知识搜索功能,在支持“精确搜索”的前提下,同时提供将原有以“已知”搜索“已知”变为“已知”搜索“未知”的能力。便于业务部门获取与目标相似的已存在信息,从而提升基于模糊搜索的搜索结果准确性。
图7示出了用户查询的一个示例。基于知识图谱的知识库管理平台,可提供全文匹配、多类数据匹配的模式,在业务部门提出需求时,即可通过数据的相似“知识点”与其他各类数据中具备相似知识的数据,如“相似需求”、“相关风险点”、“保障方式”、“上线后问题单”等。减少重复、相似、高风险、低效等类型的系统需求,提升系统开发中分析、开发效率,降低上线后风险,进而能够提供多元化搜索结果和挖掘结果,降低损耗,提升系统开发设计效率。
此外,基于知识图谱的知识库管理平台,可对所有系统维护、需求上线后问题进行统一分析。以往只能靠维护分类、问题分类进行统计,与分类是一对一的关系。但一般来说问题可能由多个因素造成,数据经过知识图谱计算并具备特征后,可通过特征进行统计,并可根据需求将不同特征组合,实现问题与知识点的一对多关系,便于统计发现业务支撑系统当前存在问题所具备的各类特征,进而能够提升系统问题总结分析能力,为系统改进提供数据支撑。
综上所述,本发明实施例基于知识图谱技术构建电信行业业务知识图谱,提供了一种基于知识图谱的需求管理应用方法,如图8所示。本发明实施例以业务词库及自然语言处理技术将需求、问题、知识库描述、测试案例、风险点及描述等文本进行清洗,转变为以电信行业术语为基础的格式化数据,然后将格式化数据输入行业知识图谱计算,获取文本之间的逻辑知识关联,最后根据不同应用场景,以“输入联想结果”替代“输入查询结果”,以智能方式代替人工繁复查询获取更有效的信息。
第二方面,本发明实施例提供了一种基于知识图谱的需求管理应用装置,如图9所示,所述装置包括:
获取单元201,用于获取用于描述需求的若干个工单数据;
分词单元202,用于对所述工单数据中的文本内容进行分词处理,并基于预设的电信行业词库对处理后的分词进行识别;
处理单元203,用于将识别后的结果输入到预设的知识图谱,若确定知识图谱中存在与所述识别后的结果相匹配的知识,则将该知识对应的知识标签作为所述工单数据所描述需求的属性。
可选地,所述处理单元203还用于:
对于匹配后剩余的第一分词,在所述工单数据的文本内容中若存在与所述第一分词的词间距小于预设的词间距,且能够与所述第一分词组成三元组实例的第二分词以及第三分词,则将所述第一分词、第二分词以及第三分词组成三元组实例;其中,在所述三元组实例中,第一分词、第二分词以及第三分词中的两个用于表示两个实体,另外一个用于表示两个实体之间的关系;
若确定知识图谱中存在与所述三元组实例结构相似的知识,则将所述三元组实例加入到知识图谱中,并为所述三元组实例赋予新的知识标签。
可选地,所述处理单元203确定知识图谱中存在与所述三元组实例结构相似的知识,包括:
若所述知识图谱中存在第一知识,所述第一知识包含的分词中有两个分词与所述三元组实例包含的分词相同,则确定知识图谱中存在与所述三元组实例结构相似的知识。
可选地,所述装置还包括:
存储单元204,用于为所述若干个工单数据分配一个需求编号,并与相匹配的知识标签对应存储。
可选地,所述处理单元203还包括:
在接收到用户输入的搜索内容后,若确定所述知识图谱中存在与所述搜索内容相匹配的知识,则生成该搜索内容的知识点,所述知识点中包含与所述搜索内容相匹配的所有知识;
若在指定的知识库中确定存在第一需求,所述第一需求对应的知识与所述知识点中包含的知识中相同知识的数量超过预设值,则将所述第一需求输出。
可选地,所述处理单元203在指定的知识库中确定存在第一需求,包括:
使用ElasticSearch工具在指定的知识库中进行查询,确定存在第一需求。
可选地,所述搜索内容为若干个词汇或整段语料。
另外,结合图10述的本发明实施例的基于知识图谱的需求管理应用方法可以由基于知识图谱的需求管理应用设备来实现。图10示出了本发明实施例提供的基于知识图谱的需求管理应用设备的硬件结构示意图。
基于知识图谱的需求管理应用设备可以包括处理器301以及存储有计算机程序指令的存储器302。
具体地,上述处理器301可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器302可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器302可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器302可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器302可在数据处理装置的内部或外部。在特定实施例中,存储器302是非易失性固态存储器。在特定实施例中,存储器302包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器301通过读取并执行存储器302中存储的计算机程序指令,以实现上述实施例中的任意一种基于知识图谱的需求管理应用方法。
在一个示例中,基于知识图谱的需求管理应用设备还可包括通信接口303和总线310。其中,如图10所示,处理器301、存储器302、通信接口303通过总线310连接并完成相互间的通信。
通信接口303,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线310包括硬件、软件或两者,将基于知识图谱的需求管理应用设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线310可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
另外,结合上述实施例中的基于知识图谱的需求管理应用方法,本发明实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于知识图谱的需求管理应用方法。
本发明上述各个实施例提供的各个技术方案能够获得如下有益效果中的至少一个:
1、大幅提升了移动业务支撑系统开发效率
有效减少因重复、低效、不明确等开发需求导致的系统研发资源损耗,提升效能后,在同一时间能处理更多需求,缩短需求全生命周期,有效支撑市场及业务部门。
2、大幅提升了系统开发问题总结及分析能力
传统问题归类的分析方式,无法从分类上获取问题的核心特征,通过知识图谱的应用,以特征的视角去分析问题,真正有效分析总结存在问题具备的核心特征,为在业务支撑系统开发中提升效率,降低风险提供数据支持。
3、有效降低系统开发风险
基于知识图谱的知识库内容关联,为业务支撑系统开发各环节处理人员提供辅助的支持,最大限度降低因人员知识不对称、业务水平不相同造成的开发及维护风险。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (9)
1.一种基于知识图谱的需求管理应用方法,其特征在于,所述方法包括:
获取用于描述需求的若干个工单数据;
对所述工单数据中的文本内容进行分词处理,并基于预设的电信行业词库对处理后的分词进行识别;
将识别后的结果输入到预设的知识图谱,若确定知识图谱中存在与所述识别后的结果相匹配的知识,则将该知识对应的知识标签作为所述若干个工单数据所描述需求的属性;
在接收到用户输入的搜索内容后,若确定所述知识图谱中存在与所述搜索内容相匹配的知识,则生成该搜索内容的知识点,所述知识点中包含与所述搜索内容相匹配的所有知识;
若在指定的知识库中确定存在第一需求,所述第一需求对应的知识与所述知识点中包含的知识中相同知识的数量超过预设值,则将所述第一需求输出;
其中,所述知识图谱包括多个知识,所述知识的存储基本单元为三元组实例,所述三元组实例包括第一分词、第二分词和第三分词,所述三元组实例中的任意两个分词表示两个实体,另一个分词用于表示两个实体之间的关系,所述多个知识的三元组实例组成一个有向图,所述有向图中的每一个节点表示一个实体,每一条边表示一个关系。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对于匹配后剩余的第一分词,在所述工单数据的文本内容中若存在与所述第一分词的词间距小于预设的词间距,且能够与所述第一分词组成三元组实例的第二分词以及第三分词,则将所述第一分词、第二分词以及第三分词组成三元组实例;
若确定知识图谱中存在与所述三元组实例结构相似的知识,则将所述三元组实例加入到知识图谱中,并为所述三元组实例赋予新的知识标签。
3.根据权利要求2所述的方法,其特征在于,所述确定知识图谱中存在与所述三元组实例结构相似的知识,包括:
若所述知识图谱中存在第一知识,所述第一知识包含的分词中有两个分词与所述三元组实例包含的分词相同,则确定知识图谱中存在与所述三元组实例结构相似的知识。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
为所述若干个工单数据分配一个需求编号,并与相匹配的知识标签对应存储。
5.根据权利要求1所述的方法,其特征在于,所述在指定的知识库中确定存在第一需求,包括:
使用ElasticSearch工具在指定的知识库中进行查询,确定存在第一需求。
6.根据权利要求1或5所述的方法,其特征在于,所述搜索内容为若干个词汇或整段语料。
7.一种基于知识图谱的需求管理应用装置,其特征在于,所述装置包括:
获取单元,用于获取用于描述需求的若干个工单数据;
分词单元,用于对所述工单数据中的文本内容进行分词处理,并基于预设的电信行业词库对处理后的分词进行识别;
处理单元,用于将识别后的结果输入到预设的知识图谱,若确定知识图谱中存在与所述识别后的结果相匹配的知识,则将该知识对应的知识标签作为所述工单数据所描述需求的属性;
所述处理单元,还用于在接收到用户输入的搜索内容后,若确定所述知识图谱中存在与所述搜索内容相匹配的知识,则生成该搜索内容的知识点,所述知识点中包含与所述搜索内容相匹配的所有知识;
若在指定的知识库中确定存在第一需求,所述第一需求对应的知识与所述知识点中包含的知识中相同知识的数量超过预设值,则将所述第一需求输出;
其中,所述知识图谱包括多个知识,所述知识的存储基本单元为三元组实例,所述三元组实例包括第一分词、第二分词和第三分词,所述三元组实例中的任意两个分词表示两个实体,另一个分词用于表示两个实体之间的关系,所述多个知识的三元组实例组成一个有向图,所述有向图中的每一个节点表示一个实体,每一条边表示一个关系。
8.一种基于知识图谱的需求管理应用设备,其特征在于,包括:至少一个处理器、至少一个存储器以及存储在所述存储器中的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现如权利要求1-6中任一项所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,当所述计算机程序指令被处理器执行时实现如权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711475015.3A CN109993381B (zh) | 2017-12-29 | 2017-12-29 | 基于知识图谱的需求管理应用方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711475015.3A CN109993381B (zh) | 2017-12-29 | 2017-12-29 | 基于知识图谱的需求管理应用方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109993381A CN109993381A (zh) | 2019-07-09 |
CN109993381B true CN109993381B (zh) | 2021-11-30 |
Family
ID=67108718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711475015.3A Active CN109993381B (zh) | 2017-12-29 | 2017-12-29 | 基于知识图谱的需求管理应用方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109993381B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112232748A (zh) * | 2019-07-15 | 2021-01-15 | 广州汽车集团股份有限公司 | 研发活动的知识管理方法、系统、存储介质及终端设备 |
CN110674123B (zh) * | 2019-09-16 | 2021-09-14 | 北京云从科技有限公司 | 数据预处理方法、装置、设备及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105760495A (zh) * | 2016-02-17 | 2016-07-13 | 扬州大学 | 一种基于知识图谱针对bug问题进行探索性搜索方法 |
CN105868313A (zh) * | 2016-03-25 | 2016-08-17 | 浙江大学 | 一种基于模板匹配技术的知识图谱问答系统及方法 |
CN106844658A (zh) * | 2017-01-23 | 2017-06-13 | 中山大学 | 一种中文文本知识图谱自动构建方法及系统 |
CN106997399A (zh) * | 2017-05-24 | 2017-08-01 | 海南大学 | 一种基于数据图谱、信息图谱、知识图谱和智慧图谱关联架构的分类问答系统设计方法 |
CN107341215A (zh) * | 2017-06-07 | 2017-11-10 | 北京航空航天大学 | 一种基于分布式计算平台的多源垂直知识图谱分类集成查询方法 |
CN107480125A (zh) * | 2017-07-05 | 2017-12-15 | 重庆邮电大学 | 一种基于知识图谱的关系链接方法 |
CN107480191A (zh) * | 2017-07-12 | 2017-12-15 | 清华大学 | 一种迭代的实体对齐模型 |
-
2017
- 2017-12-29 CN CN201711475015.3A patent/CN109993381B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105760495A (zh) * | 2016-02-17 | 2016-07-13 | 扬州大学 | 一种基于知识图谱针对bug问题进行探索性搜索方法 |
CN105868313A (zh) * | 2016-03-25 | 2016-08-17 | 浙江大学 | 一种基于模板匹配技术的知识图谱问答系统及方法 |
CN106844658A (zh) * | 2017-01-23 | 2017-06-13 | 中山大学 | 一种中文文本知识图谱自动构建方法及系统 |
CN106997399A (zh) * | 2017-05-24 | 2017-08-01 | 海南大学 | 一种基于数据图谱、信息图谱、知识图谱和智慧图谱关联架构的分类问答系统设计方法 |
CN107341215A (zh) * | 2017-06-07 | 2017-11-10 | 北京航空航天大学 | 一种基于分布式计算平台的多源垂直知识图谱分类集成查询方法 |
CN107480125A (zh) * | 2017-07-05 | 2017-12-15 | 重庆邮电大学 | 一种基于知识图谱的关系链接方法 |
CN107480191A (zh) * | 2017-07-12 | 2017-12-15 | 清华大学 | 一种迭代的实体对齐模型 |
Also Published As
Publication number | Publication date |
---|---|
CN109993381A (zh) | 2019-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109189901B (zh) | 一种智能客服系统中自动发现新分类以及对应语料的方法 | |
CN107291783B (zh) | 一种语义匹配方法及智能设备 | |
CN109872162B (zh) | 一种处理用户投诉信息的风控分类识别方法及系统 | |
US11429810B2 (en) | Question answering method, terminal, and non-transitory computer readable storage medium | |
CN112163424B (zh) | 数据的标注方法、装置、设备和介质 | |
CN111144723A (zh) | 人岗匹配推荐方法及系统、存储介质 | |
CN110765889B (zh) | 法律文书的特征提取方法、相关装置及存储介质 | |
CN116629275B (zh) | 一种基于大数据的智能决策支持系统及方法 | |
CN110826320A (zh) | 一种基于文本识别的敏感数据发现方法及系统 | |
CN113836925B (zh) | 预训练语言模型的训练方法、装置、电子设备及存储介质 | |
CN111105209A (zh) | 适用于人岗匹配推荐系统的职位简历匹配方法及装置 | |
CN109918984A (zh) | 保险单号码识别方法、装置、电子设备及存储介质 | |
CN108734296A (zh) | 优化监督学习的训练数据的方法、装置、电子设备和介质 | |
CN109582788A (zh) | 垃圾评论训练、识别方法、装置、设备及可读存储介质 | |
CN112417121A (zh) | 客户意图识别方法、装置、计算机设备及存储介质 | |
CN116089873A (zh) | 模型训练方法、数据分类分级方法、装置、设备及介质 | |
CN109993381B (zh) | 基于知识图谱的需求管理应用方法、装置、设备及介质 | |
CN116881430A (zh) | 一种产业链识别方法、装置、电子设备及可读存储介质 | |
CN108830302B (zh) | 一种图像分类方法、训练方法、分类预测方法及相关装置 | |
CN116402166B (zh) | 一种预测模型的训练方法、装置、电子设备及存储介质 | |
CN110852082B (zh) | 同义词的确定方法及装置 | |
CN114741483B (zh) | 数据识别的方法和装置 | |
CN113282686B (zh) | 一种不平衡样本的关联规则确定方法及装置 | |
CN115062126A (zh) | 一种语句分析方法、装置、电子设备及可读存储介质 | |
CN110851572A (zh) | 会话标注方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |