CN109213750B - 一种基于知识库标签的信息资源推荐方法 - Google Patents
一种基于知识库标签的信息资源推荐方法 Download PDFInfo
- Publication number
- CN109213750B CN109213750B CN201710521954.0A CN201710521954A CN109213750B CN 109213750 B CN109213750 B CN 109213750B CN 201710521954 A CN201710521954 A CN 201710521954A CN 109213750 B CN109213750 B CN 109213750B
- Authority
- CN
- China
- Prior art keywords
- information
- data
- information resources
- combing
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000009960 carding Methods 0.000 claims abstract description 10
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000012790 confirmation Methods 0.000 claims description 3
- 230000003370 grooming effect Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于知识库标签的信息资源推荐方法,用于对场景中的信息资源进行高效率梳理时,基于知识库中标签数据自动推荐对业务层各层信息资源进行梳理,将准备梳理的元素部门特性标签与在前已经抽取的知识库标签进行对比或匹配,根据标签的匹配度或标签大数据的相似度推荐相关的信息资源数据项,从而准备梳理的元素信息资源在业务职责和/或业务信息资源和/或信息资源数据项的各层上根据推荐的数据项进行相同的梳理。本发明能有效提高数据梳理的效率。
Description
技术领域
本发明涉及大数据共享领域,尤其是一种基于知识库标签的信息资源推荐方法。
背景技术
互联网浪潮之下,尤其是计算机及其存储设备、互联网、云计算等技术的发展,使得我国大数据应用领域不断扩展,相关数据资源日益丰富。据报告中国数据总量正在以年均50%的速度增长,预计到2020年将占全球21%,届时中国将成为世界第一数据资源大国和全球的数据中心。
在信息化时代,大数据产业无疑是未来社会向智能化变革的重要根基,这已是人们的共识,而数据资源服务于民的前提便是能够实现充分共享,这却是当下我国大数据产业存在的一大难题。
在信息化城市建设中,由于过去数据的分散建设以及数据标准不统一等因素,造成我国虽然数据资源丰富,却无法实现这些资源的有效共享和应用,尤其是各级政务数据资源之间不清楚,出现严重的信息孤岛,对于数量庞大的信息数据缺乏有效的盘活机制。
其中对大量信息资源的梳理成为信息共享的基础模块,是实现有效信息资源共享的先决条件。如何提高数据梳理的效率是其中需要解决的重要的技术问题。
发明内容
针对上述存在的问题,本发明提供一种基于知识库标签的信息资源推荐方法,用于对场景中的信息资源进行高效率梳理时,基于知识库中标签数据产生自动推荐并用于对业务层各层信息资源进行梳理。
其中包含所有梳理结果的信息构成了信息资源知识库,该知识库随着场景所有数据的逐步梳理而不断完善,最终成为包含场景中所有级别和元素等单元的全部信息的数据库。
其中从业务层对一个场景的信息资源进行业务层梳理时,依次按照场景业务部门-业务职责-业务信息资源-信息资源数据项的顺序进行梳理。
梳理结果是通过数据梳理系统对获取的各方面信息资源的关系从业务层和技术层分别进行梳理分析,根据应用场景自动或手动生成各级业务关系和各级数据信息关系,并建立信息资源、业务关系、数据信息三者之间的关联。
在场景包含的多个具体元素进行信息资源梳理,形成包含多个元素的信息资源,并对知识库中每个元素里每个部门以及信息资源抽取标签;
根据准备梳理的具体元素包含的部门配置,抽取各部门特性的标签;
将准备梳理的元素部门特性标签与在前已经抽取的知识库标签进行对比或匹配;
根据标签的匹配度或标签大数据的相似度推荐相关的信息资源数据项,从而准备梳理的元素信息资源在业务职责和/或业务信息资源和/或信息资源数据项的各层上根据推荐的数据项进行相同的梳理。
在推荐数据项之后加入人工确认步骤用于确认是否用于梳理。
优先推荐较低级别且相同上级区域的资源数据项。
综上所述,采用了上述技术方案带来一系列有益效果是:对信息资源进行有效梳理,并基于知识库的标签推荐有效的数据项,提高信息资源梳理的效率,在不同级别的数据梳理上均能有效应用。
具体实施方式
结合具体实施例对本发明进行详细说明。
本发明提供了一种基于知识库标签的信息资源自动推荐方法,用于对场景中的信息资源进行梳理时基于知识库中标签数据生成自动推荐并用于进行业务层各层信息资源的梳理。其中,应用的场景包括政务、公司、行业等,多种应用场景的信息资源可以为通过数据采集获得的大量数据,也可以为由相应数据库提供的数据。
在一个实施例中,在已有梳理结果数据基础上,通过文本分析、标签(自动聚类)等技术,智能判断政府部门可能需要的数据资源。
其中梳理结果是通过数据梳理系统对获取的各方面信息资源的关系从业务层和技术层分别进行梳理分析,根据应用场景自动或手动生成各级业务关系和各级数据信息关系,并建立信息资源、业务关系、数据信息三者之间的关联。
对于包含所有梳理结果的信息构成了信息资源知识库,该知识库为随着大场景数据的逐步梳理而完善,最终成为包含场景中所有级别和部门等单元的全部信息的数据库。
其中从业务层对一个场景或机构的信息资源时,依次按照场景业务部门-业务职责-业务信息资源-信息资源数据项的顺序进行梳理。
在一个实施例中通过政务数据标签的知识推荐包括:在多个城市进行信息资源梳理,形成包含多个城市的信息资源,并对知识库中每个城市每个部门以及信息资源抽取标签。
下一步根据准备梳理的城市行政部门的配置,抽取部门特性的标签。具体的,用于准备梳理的城市已经在城市业务部门层进行了基本梳理,因而在已经梳理的部门层抽取部门特性的标签。
下一步,将准备梳理的城市部门特性标签与在前已经抽取的知识库标签进行对比或匹配,根据标签的匹配度或标签大数据的相似度推荐相关的信息资源数据项,从而准备梳理的城市信息资源在业务职责和/或业务信息资源和/或信息资源数据项的各层上根据推荐数据项进行相同的梳理。还可以在推荐数据项之后加入人工确认步骤用于确认是否用于梳理。
在一个具体实施例中,对江苏省宿迁市梳理的水路货运吞吐量、周转量等信息资源后,对宿迁市知识库中的部门和信息资源抽取相关标签;当转而在梳理成都市崇州市的政务数据时,系统自动根据标签相关或标签数据匹配推荐崇州所有与“货运周转量”标签相关的所有可能的政务数据资源,进而依据推荐的资源项进行崇州市政务数据梳理。
进一步的,还包括优先推荐较低级别相同上级行政区域的资源。比如梳理崇州市,优先推荐共同上级成都市的新津县,其次为共同上级四川省的巴中市南江县,其次推荐共同上级中国的江苏省宿迁市宿豫区。推荐优先级可以在构建全国各区划的各行政划分框架的基础上根据行政级别参数自动生成。
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。
Claims (3)
1.一种基于知识库标签的信息资源推荐方法,其特征在于,对场景中的信息资源进行梳理时,基于知识库中的标签数据生成自动推荐并用于对业务层各层信息资源进行梳理;包含所有梳理结果的信息构成了信息资源知识库,该知识库随着场景所有数据的逐步梳理而不断完善,最终成为包含场景中所有级别和元素单元的全部信息的数据库;
从业务层对一个场景的信息资源进行业务层梳理时,依次按照场景业务部门-业务职责-业务信息资源-信息资源数据项的顺序进行梳理;梳理结果是通过数据梳理系统对获取的各方面信息资源的关系从业务层和技术层分别进行梳理分析,根据应用场景自动或手动生成各级业务关系和各级数据信息关系,并建立信息资源、业务关系、数据信息三者之间的关联;
所述对场景中的信息资源进行梳理时基于知识库中的标签数据生成自动推荐并用于对业务层各层信息资源进行梳理具体包括:
对场景包含的多个具体元素进行信息资源在业务部门层的初步梳理,形成包含准备梳理的多个元素的信息资源,并对知识库中每个元素里每个部门以及信息资源抽取标签;
根据准备梳理的具体元素包含的部门配置,抽取各部门特性的标签;
将准备梳理的元素部门特性标签与在前已经抽取的知识库标签进行匹配;
根据标签的匹配度推荐相关的信息资源数据项,从而准备梳理的元素信息资源在业务职责和/或业务信息资源和/或信息资源数据项的各层上根据推荐的数据项进行相同的梳理。
2.如权利要求1所述的方法,其特征在于,在推荐数据项之后加入人工确认步骤用于确认是否用于梳理。
3.如权利要求2所述的方法,其特征在于,优先推荐较低级别且相同上级区域的资源数据项。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710521954.0A CN109213750B (zh) | 2017-06-30 | 2017-06-30 | 一种基于知识库标签的信息资源推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710521954.0A CN109213750B (zh) | 2017-06-30 | 2017-06-30 | 一种基于知识库标签的信息资源推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109213750A CN109213750A (zh) | 2019-01-15 |
CN109213750B true CN109213750B (zh) | 2024-04-16 |
Family
ID=64961062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710521954.0A Active CN109213750B (zh) | 2017-06-30 | 2017-06-30 | 一种基于知识库标签的信息资源推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109213750B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111752997A (zh) * | 2020-07-01 | 2020-10-09 | 浪潮云信息技术股份公司 | 一种基础库数据标签分析系统及方法 |
CN112330307B (zh) * | 2020-12-30 | 2021-03-16 | 江苏数兑科技有限公司 | 一种基于数据图谱和业务图谱的事项办理智能推荐方法 |
CN112381627B (zh) * | 2021-01-14 | 2021-05-07 | 北京育学园健康管理中心有限公司 | 育儿知识下的商品评分处理推荐方法、装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1952929A (zh) * | 2005-10-20 | 2007-04-25 | 关涛 | 面向领域基于样本的互联网结构化数据抽取方法及其系统 |
WO2009078649A2 (en) * | 2007-12-18 | 2009-06-25 | Korea Institute Of Science & Technology Information | Method and server for constructing knowledge base |
CN102637163A (zh) * | 2011-01-09 | 2012-08-15 | 华东师范大学 | 一种基于语义的多层次本体匹配的控制方法及系统 |
CN103870926A (zh) * | 2014-03-06 | 2014-06-18 | 西安邮电大学 | 一种业务梳理与分类方法 |
CN103942220A (zh) * | 2013-01-23 | 2014-07-23 | 成都勤智数码科技股份有限公司 | 一种适用于it运维系统的工单智能关联知识库知识的方法 |
CN104035975A (zh) * | 2014-05-23 | 2014-09-10 | 华东师范大学 | 一种利用中文在线资源实现远程监督人物关系抽取的方法 |
CN104123584A (zh) * | 2013-04-28 | 2014-10-29 | 成都勤智数码科技股份有限公司 | 基于信息系统的组织优化方法 |
CN105787282A (zh) * | 2016-03-24 | 2016-07-20 | 国家卫生计生委统计信息中心 | 一种医疗数据字典自动标准化的方法与系统 |
CN106599547A (zh) * | 2016-11-23 | 2017-04-26 | 中山健康医疗信息技术有限公司 | 基于标签的智能医学知识库管理系统 |
-
2017
- 2017-06-30 CN CN201710521954.0A patent/CN109213750B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1952929A (zh) * | 2005-10-20 | 2007-04-25 | 关涛 | 面向领域基于样本的互联网结构化数据抽取方法及其系统 |
WO2009078649A2 (en) * | 2007-12-18 | 2009-06-25 | Korea Institute Of Science & Technology Information | Method and server for constructing knowledge base |
CN102637163A (zh) * | 2011-01-09 | 2012-08-15 | 华东师范大学 | 一种基于语义的多层次本体匹配的控制方法及系统 |
CN103942220A (zh) * | 2013-01-23 | 2014-07-23 | 成都勤智数码科技股份有限公司 | 一种适用于it运维系统的工单智能关联知识库知识的方法 |
CN104123584A (zh) * | 2013-04-28 | 2014-10-29 | 成都勤智数码科技股份有限公司 | 基于信息系统的组织优化方法 |
CN103870926A (zh) * | 2014-03-06 | 2014-06-18 | 西安邮电大学 | 一种业务梳理与分类方法 |
CN104035975A (zh) * | 2014-05-23 | 2014-09-10 | 华东师范大学 | 一种利用中文在线资源实现远程监督人物关系抽取的方法 |
CN105787282A (zh) * | 2016-03-24 | 2016-07-20 | 国家卫生计生委统计信息中心 | 一种医疗数据字典自动标准化的方法与系统 |
CN106599547A (zh) * | 2016-11-23 | 2017-04-26 | 中山健康医疗信息技术有限公司 | 基于标签的智能医学知识库管理系统 |
Non-Patent Citations (1)
Title |
---|
数据梳理在电子政务中的应用分析;郭理桥;;中国建设信息(第23期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109213750A (zh) | 2019-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103714139B (zh) | 一种移动海量客户群识别的并行数据挖掘方法 | |
CN111831636B (zh) | 一种数据处理方法、装置、计算机系统及可读存储介质 | |
Yoon et al. | Exploring technological opportunities by linking technology and products: Application of morphology analysis and text mining | |
CN109213750B (zh) | 一种基于知识库标签的信息资源推荐方法 | |
CN109739820A (zh) | 一种基于大数据分析的电子政务信息服务系统 | |
CN110990474A (zh) | 一种区域性产业画像分析的方法及装置 | |
CN111882403A (zh) | 一种基于用户数据的金融服务平台智能推荐方法 | |
Yudhistyra et al. | Exploring big data research: a review of published articles from 2010 to 2018 related to logistics and supply chains | |
CN105976188A (zh) | 一种多渠道客户信息处理系统及处理方法 | |
CN111191123A (zh) | 业务信息推送方法、装置、可读存储介质和计算机设备 | |
CN112860899B (zh) | 标签生成方法、装置、计算机设备和计算机可读存储介质 | |
CN114119068A (zh) | 一种药店企业微信客户群的智能分析方法及管理平台 | |
CN114049089A (zh) | 一种构建政务大数据平台的方法及系统 | |
CN110472996A (zh) | 一种客户信息管理方法和系统 | |
CN110134511A (zh) | 一种OpenTSDB共享存储优化方法 | |
CN113505295A (zh) | 一种企业获客推送算法实现方法及系统 | |
CN110175199A (zh) | 基于k均值聚类算法的能源企业关键用户识别分析方法 | |
CN113392113A (zh) | 一种云视频开放平台精细化用户画像实时推荐方法 | |
CN114118672A (zh) | 电力系统项目需求自动生成方法及系统 | |
CN112528100A (zh) | 一种标签策略推荐和打标方法、终端设备及存储介质 | |
Chen et al. | Spatio-temporal analysis of retail customer behavior based on clustering and sequential pattern mining | |
Ingvaldsen et al. | Semantic business process mining of SAP transactions | |
CN113159594B (zh) | 液化天然气运输车的调度方法及装置 | |
Fandi et al. | Design of Business Process Management in Waste Bank Application Based on BMC and SWOT Analysis | |
Li et al. | The Research and Design of Wage Supervision Service Platform for Migrant Workers Based on Big Data and Iris Recognition Technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |