CN110196937A - 一种项目信息实时抓取和分析系统 - Google Patents

一种项目信息实时抓取和分析系统 Download PDF

Info

Publication number
CN110196937A
CN110196937A CN201910321030.5A CN201910321030A CN110196937A CN 110196937 A CN110196937 A CN 110196937A CN 201910321030 A CN201910321030 A CN 201910321030A CN 110196937 A CN110196937 A CN 110196937A
Authority
CN
China
Prior art keywords
project
project information
information
module
real time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910321030.5A
Other languages
English (en)
Inventor
刘玉荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Tingchuang Zhijia Science And Technology Service Co Ltd
Original Assignee
Hefei Tingchuang Zhijia Science And Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Tingchuang Zhijia Science And Technology Service Co Ltd filed Critical Hefei Tingchuang Zhijia Science And Technology Service Co Ltd
Priority to CN201910321030.5A priority Critical patent/CN110196937A/zh
Publication of CN110196937A publication Critical patent/CN110196937A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种项目信息实时抓取和分析系统,该系统包括项目信息配置模块、项目信息挖掘模块、项目信息分析模块、项目信息通知模块和项目信息显示模块。用户首先配置系统的检索关键词和网站信息等输入参数,基于网络爬虫技术系统对网络中的项目信息进行关键词比对检索,按照所属行业、归口管理部门和发布时间等进行分类,并将同类型和相同项目进行差异化对比,第一时间通知到用户,通过图表的形式直观的显示给用户。该系统便于项目申报人员及时获取项目申报信息和理解项目发布信息。

Description

一种项目信息实时抓取和分析系统
技术领域
本发明涉及项目申报系统技术领域,特别是涉及一种项目信息实时抓取和分析系统。
背景技术
国家各级政府及部门面向企业发布的各类申请项目,是企业项目申报的主要来源之一,企业项目申报人员通过关注政府官网跟踪项目资助方向。目前,企业项目申报人员主要通过关注各级政府及相关主管部门的官网的项目信息发布平台,定期查询项目信息发布动态来获取项目通知。
但是,政府部门在进行项目信息发布时,往往时间不固定,往年同类项目申报信息发布时间甚至相差数月,项目申报人员常常错过申报。同时,随着鼓励企业创新创业政策的不断落实,项目申报中对企业申请条件的要求也在不断发生变化,往年的项目经验往往不能适用于当年,项目申报人员需要耗费大量的时间和精力逐字逐句地解读项目指南中的政策变化。
发明内容
为了应对上述项目申报信息时间不固定、每年政策变化大的现状,帮助项目申报人员及时掌握项目发布信息、直观理解往年的政策的变化趋势,本发明提供了一种项目信息实时抓取和分析系统。该系统通过配置网站信息,添加检索关键词,挖掘网络中的项目发布信息,并对收集的项目信息进行整合分析,以消息的形式实时通知到项目申报人员,并在直观的显示给用户。该系统有效解决了企业项目申报人员获取项目发布信息不及时,项目信息解读不畅的问题。
按照本发明所提供的设计方案,一种项目信息实时抓取和分析系统包括:项目信息配置模块、项目信息挖掘模块、项目信息分析模块、项目信息通知模块和项目信息显示模块。
一种项目信息实时抓取和分析系统所述的项目信息配置模块,用于定义项目检索的关键词,定义项目的来源网站,作为项目信息挖掘模块的输入;所述的项目信息挖掘模块,用于根据用户定义的检索关键词,从选定的网络中抓取项目发布信息并实时反馈;所述项目信息分析模块,用于将挖掘出的项目信息进行分类,并将同类型和相同项目进行差异化对比;所述项目信息通知模块,用于将项目信息挖掘模块和项目信息分析模块的项目信息第一时间通知到用户;所述项目信息显示系统,用于将项目信息通过图表的形式直观的显示给用户。
一种项目信息实时抓取和分析系统,所述的项目信息配置模块,包括用户输入项目检索关键词和勾选和添加项目网站。
一种项目信息实时抓取和分析系统,所述的项目信息挖掘模块,具体为利用网络爬虫技术从选定的网站中比对检索关键词,实时抓取最新发布项目信息。
一种项目信息实时抓取和分析系统,所述的项目信息分析模块,包括项目信息分类和项目信息比对,根据项目所属行业、归口管理部门和发布时间等属性进行分类,并对往年相同的项目信息进行比对,发现项目申报要求的变化。
一种项目信息实时抓取和分析系统,所述的项目信息通知模块,具体为将网络爬虫实时抓取的项目申报信息和项目信息分析模块的项目分类和对比结果以短信和邮件的形式第一时间通知到用户。
一种项目信息实时抓取和分析系统,所述的项目信息显示模块,具体为将将项目信息检索结果、项目分类和项目比对结果以图表的形式直观的显示给用户。
一种项目信息实时抓取和分析系统,其特征在于,包括。
步骤1、用户配置系统的输入参数,包括勾选网站和添加网站,并定义项目检索关键词。
步骤2、根据用户配置信息,利用网络爬虫技术实时监控网络中的项目信息发布动态,与检索关键词比对,将比对成功项目信息储存到本地存储和网络服务器中。
步骤3、按照项目所属行业、归口管理部门和发布时间等对项目信息进行分类,往年相同的项目进行差异比对。
步骤4、将项目检索结果、项目分类结果和往年项目的差异化比对结果以短信和邮件的形式第一时间通知到用户。
步骤5、将项目检索结果、项目分类结果和往年项目的差异化比对结果以图表的形式直观的显示给用于,辅助项目申报信息的分析。
与现有技术相比,本发明的有益效果是针对企业项目管理人员在项目申报信息的获取时,无法第一时间获取项目信息,错过项目申报的时间,项目信息政策变化较大,给项目指南的解读带来困难,利用网络爬虫定向获取相关政府网站中的项目申报信息,并根据用户的配置条件进行网络挖掘,在此基础上进行信息的分类和比对,第一时间以短信和邮件的方式通知到企业项目申报人员,给项目申报人员获取项目和理解项目带来了极大的便利。
附图说明
图1为本发明的系统模块组成图。
图2为具体实施例流程图。
具体实施方式
为了使本发明的目的、技术方案即优点更加清楚明白,以下结合附图及实施例,对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参考图2所示,一种项目信息实时抓取和分析系统,其特征在于,包括。
步骤1、用户配置系统的输入参数,包括勾选网站和添加网站,并定义项目检索关键词。
步骤2、根据用户配置信息,利用网络爬虫技术实时监控网络中的项目信息发布动态,与检索关键词比对,将比对成功项目信息储存到本地存储和网络服务器中。
步骤3、按照项目所属行业、归口管理部门和发布时间等对项目信息进行分类,往年相同的项目进行差异比对。
步骤4、将项目检索结果、项目分类结果和往年项目的差异化比对结果以短信和邮件的形式第一时间通知到用户。
步骤5、将项目检索结果、项目分类结果和往年项目的差异化比对结果以图表的形式直观的显示给用于,辅助项目申报信息的分析。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种项目信息实时抓取和分析系统,其特征在于:包括项目信息配置模块、项目信息挖掘模块、项目信息分析模块、项目信息通知模块和项目信息显示模块;
所述的项目信息配置模块,用于定义项目检索的关键词,定义项目的来源网站,作为项目信息挖掘模块的输入;
所述的项目信息挖掘模块,用于根据用户定义的检索关键词,从选定的网络中抓取项目发布信息并实时反馈;
所述项目信息分析模块,用于将挖掘出的项目信息进行分类,并将同类型和相同项目进行差异化对比;
所述项目信息通知模块,用于将项目信息挖掘模块和项目信息分析模块的项目信息第一时间通知到用户;
所述项目信息显示系统,用于将项目信息通过图表的形式直观的显示给用户。
2.根据权利要求1项目信息实时抓取和分析系统,所述的项目信息配置模块,包括用户输入项目检索关键词和勾选和添加项目网站。
3.根据权利要求1项目信息实时抓取和分析系统,所述的项目信息挖掘模块,具体为利用网络爬虫技术从选定的网站中比对检索关键词,实时抓取最新发布项目信息。
4.根据权利要求1项目信息实时抓取和分析系统,所述的项目信息分析模块,包括项目信息分类和项目信息比对,根据项目所属行业、归口管理部门和发布时间等属性进行分类,并对往年相同的项目信息进行比对,发现项目申报要求的变化。
5.根据权利要求1项目信息实时抓取和分析系统,所述的项目信息通知模块,具体为将网络爬虫实时抓取的项目申报信息和项目信息分析模块的项目分类和对比结果以短信和邮件的形式第一时间通知到用户。
6.根据权利要求1项目信息实时抓取和分析系统,所述的项目信息显示模块,具体为将将项目信息检索结果、项目分类和项目比对结果以图表的形式直观的显示给用户。
7.一种项目信息实时抓取和分析系统,其特征在于,包括:
步骤1、用户配置系统的输入参数,包括勾选网站和添加网站,并定义项目检索关键词;
步骤2、根据用户配置信息,利用网络爬虫技术实时监控网络中的项目信息发布动态,与检索关键词比对,将比对成功项目信息储存到本地存储和网络服务器中;
步骤3、按照项目所属行业、归口管理部门和发布时间等对项目信息进行分类,往年相同的项目进行差异比对;
步骤4、将项目检索结果、项目分类结果和往年项目的差异化比对结果以短信和邮件的形式第一时间通知到用户;
步骤5、将项目检索结果、项目分类结果和往年项目的差异化比对结果以图表的形式直观的显示给用于,辅助项目申报信息的分析。
CN201910321030.5A 2019-04-21 2019-04-21 一种项目信息实时抓取和分析系统 Pending CN110196937A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910321030.5A CN110196937A (zh) 2019-04-21 2019-04-21 一种项目信息实时抓取和分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910321030.5A CN110196937A (zh) 2019-04-21 2019-04-21 一种项目信息实时抓取和分析系统

Publications (1)

Publication Number Publication Date
CN110196937A true CN110196937A (zh) 2019-09-03

Family

ID=67752159

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910321030.5A Pending CN110196937A (zh) 2019-04-21 2019-04-21 一种项目信息实时抓取和分析系统

Country Status (1)

Country Link
CN (1) CN110196937A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114202260A (zh) * 2022-02-18 2022-03-18 天津中新智冠信息技术有限公司 一种项目里程碑管理系统、方法、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600232A (zh) * 2016-12-19 2017-04-26 广东技术师范学院 一种个性化的项目申报信息推送系统与方法
CN107203618A (zh) * 2017-05-24 2017-09-26 苏州唯亚信息科技股份有限公司 适用于研发企业的数据归类方法
CN108647938A (zh) * 2018-05-10 2018-10-12 芜湖金钥匙信息科技有限公司 一种快速为企业挑选项目和资料储存的管理系统
CN108897683A (zh) * 2018-06-27 2018-11-27 珠海市恒南科技有限公司 一种企业科技项目申报智能匹配和自测软件

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600232A (zh) * 2016-12-19 2017-04-26 广东技术师范学院 一种个性化的项目申报信息推送系统与方法
CN107203618A (zh) * 2017-05-24 2017-09-26 苏州唯亚信息科技股份有限公司 适用于研发企业的数据归类方法
CN108647938A (zh) * 2018-05-10 2018-10-12 芜湖金钥匙信息科技有限公司 一种快速为企业挑选项目和资料储存的管理系统
CN108897683A (zh) * 2018-06-27 2018-11-27 珠海市恒南科技有限公司 一种企业科技项目申报智能匹配和自测软件

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114202260A (zh) * 2022-02-18 2022-03-18 天津中新智冠信息技术有限公司 一种项目里程碑管理系统、方法、电子设备及存储介质

Similar Documents

Publication Publication Date Title
Esposito et al. A knowledge-based platform for big data analytics based on publish/subscribe services and stream processing
Zhang et al. Attribute reduction theory and approach to concept lattice
Lehmann DL-Learner: learning concepts in description logics
CN110163621A (zh) 一种电力客服大数据决策支持系统
US20150262124A1 (en) Artificial intelligence system and method for processing multilevel bills of materials
CN105183625A (zh) 一种日志数据处理方法和装置
Barga et al. Event correlation and pattern detection in CEDR
CN110196937A (zh) 一种项目信息实时抓取和分析系统
CN105630785A (zh) 一种发票使用异常预警方法和系统
Fernandes et al. A logic-based integration of active and deductive databases
CN113988725A (zh) 利用记录载体对设备全生命周期进行管控的系统及方法
Kim et al. σ-algorithm: Structured workflow process mining through amalgamating temporal workcases
Lokanan Financial fraud detection: the use of visualization techniques in credit card fraud and money laundering domains
Adaikkalavan et al. Formalization and Detection of Events Using Interval-Based Semantics.
Grigoriev et al. Non-diagrammatic method and multi-representation tool for integrated enterprise architecture and business process engineering
Nica et al. Exploring heterogeneous sequential data on river networks with relational concept analysis
Laksmiwati et al. Modeling unpredictable data and moving object in disaster management information system based on spatio-temporal data model
Bifet et al. Adaptive XML tree classification on evolving data streams
du Toit et al. Filtering spam e-mail with generalized additive neural networks
Cheh et al. Cyber-physical topology language: Definition, operations, and application
CN111415100A (zh) 一种经济管理成本控制系统
Bommisetty et al. Discovering spatial high utility itemsets in high-dimensional spatiotemporal databases
Kyurdzhiev et al. Determining of the scales of shadow economy on the basis of comparative analysis of GDP and volume of monetary cash
Hu et al. Two new optimal models for controlling discrete event systems
Mamadou Financial Development and Economic Growth: Case of Mali

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190903

WD01 Invention patent application deemed withdrawn after publication