CN103914562A - 一种基于大数据分析实现it论证采集的系统和方法 - Google Patents

一种基于大数据分析实现it论证采集的系统和方法 Download PDF

Info

Publication number
CN103914562A
CN103914562A CN201410154077.4A CN201410154077A CN103914562A CN 103914562 A CN103914562 A CN 103914562A CN 201410154077 A CN201410154077 A CN 201410154077A CN 103914562 A CN103914562 A CN 103914562A
Authority
CN
China
Prior art keywords
analysis
dimension
industry
retrieval
large data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410154077.4A
Other languages
English (en)
Inventor
陈桂芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201410154077.4A priority Critical patent/CN103914562A/zh
Publication of CN103914562A publication Critical patent/CN103914562A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2264Multidimensional index structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实现一种基于大数据分析的IT论证采集系统和方法,用户提出一个假设性观点后,系统将从行业宏观维度,客户需求维度,竞争信息维度和专家意见维度自动收集和分析论证依据,系统通过互联网检索并根据检索的结果使用历史数据法,未来数据法,拐点数据法,专业咨询数据法的大数据分析,分别提取和分析行业论据,客户论据,竞争厂家论据和专家意见证据,并通过图,表和文字的表达形式输出大数据分析结果。

Description

一种基于大数据分析实现IT论证采集的系统和方法
技术领域
本发明涉及大数据分析领域,特别涉及到基于大数据分析实现IT论证采集的系统和方法。
背景技术
在一些IT企业,电信企业,咨询顾问等企业,他们都有战略规划部门或者产品规划部门,这些部门的规划工程师往往要基于一些分析,给业务决策者提供某种业务的决策依据。在规划工程师的分析中,通常会提出一些业界或者行业的观点给决策者参考,但这些观点是需要很多的证据和论证来支撑,这样导致这些工程师论证的工作量较大,大部分时间都在收集和查询类似相关信息,并且可能找不到非常有力的证据。比如观点“SDN是未来数据通信领域的发展趋势”,有哪些论证来论述这个观点是正确的?目前的一些搜索网站只能提供一些信息的查询,但不提供观点的证明,本发明专利关注到了这方面的问题,发明了通过互联网检索和基于大数据分析的方法实现IT论证采集的系统。
发明内容
本发明的主要目的是一种基于大数据分析实现IT论证采集的系统和方法,用户提出一个假设性观点后,系统将通过互联网检索和大数据分析的方法,收集多维度的证据,并通过合适的形式进行展现。
本发明解决其技术问题所采用的技术方案包括:建立4个数据表包括行业分析表,客户分析表,竞争分析表,专家分析表,每个表记录了查询的关键字,主要检索的网络URL地址,系统缺省设置业界通用的关键字和URL,同时用户可以定制增加,删除和修改相关的配置。用户输入假设的观点和所处的行业,公司名称,竞争厂商名称,系统将根据这些条件检索本地的4个表,提取条件和检索的URL,自动提交到百度和GOOGLE进行互联网检索。系统根据互联网搜索返回结果进行大数据分析,采用历史数据法,未来数据法,拐点数据法,专业咨询数据法,分别提取行业论据,客户论据,竞争厂家论据和专家意见证据,并通过图,表和文字3类表达形式展示大数据分析结果。
本发明的有益效果是,通过互联网检索和基于大数据分析方法,对用户提出一个假设性观点进行论证,从行业,客户,竞争和专家的4大维度进行举证,并用图,表和文字3类表达形式自动输出,大大减少人工检索时间,提高分析效率;
附图说明
下面结合附图与实施例对本发明进一步说明
图1为本发明一种基于大数据分析实现IT论证采集的方法的流程示意图
图2为本发明一种基于大数据分析实现IT论证采集的系统模块示意图
具体实施方式
本发明实施主要是通过建立本地的行业分析表,客户分析表,竞争分析表和专家分析表,并通过用户输入的假设性观点后进行关键字和网络URL的互联网检索,根据检索的结果使用历史数据法,未来数据法,拐点数据法,专业咨询数据法的大数据分析,分别提取行业论据,客户论据,竞争厂家论据和专家意见证据,并通过图,表和文字3类表达形式展示大数据分析结果。
参照图一,本发明一种基于大数据分析实现IT论证采集的方法实施步骤包括:
步骤S101,系统建立行业分析表,客户分析表,竞争分析表和专家分析表,每张表格包括不限于序号,关键字,检索的网络URL地址,系统根据目前IT公司和行业网站配置缺省数据,同时提供用户增加,修改,查询的功能,系统根据互联网搜索的结果进行自我学习和完善缺省的配置;
步骤S102,当用户有一个观点需要证据证明时,通过系统输入假设的观点,所处的行业,所在公司名称,竞争厂商名称,然后提交给系统,系统对输入的参数进行相关合法性判断,不合法给予提示,合法则进入下一个步骤;
步骤S103,系统首先匹配和遍历本地行业分析表,取出满足条件的关键字列表和对应的网络URL,通过互联网查询接口分别提交百度和Google进行互联网检索,并将百度和Google检索的初步结果存入行业分析结果库,该结果库是一个临时库文件,由于检索的结果非常多,系统主要取前面的1万条行业分析初步记录。
步骤S104,系统其次匹配和遍历本地客户分析表,取出满足条件的关键字列表和对应的网络URL,通过互联网查询接口分别提交百度和Google进行互联网检索,并将百度和Google检索的初步结果存入客户分析结果库,该结果库是一个临时库文件,由于检索的结果非常多,系统主要取前面的1万条客户分析初步记录。
步骤S105,系统再次匹配和遍历本地竞争分析表,取出满足条件的关键字列表和对应的网络URL,通过互联网查询接口分别提交百度和Google进行互联网检索,并将百度和Google检索的初步结果存入竞争分析结果库,该结果库是一个临时库文件,由于检索的结果非常多,系统主要取前面的1万条竞争分析初步记录。
步骤S106,系统最后匹配和遍历本地专家分析表,取出满足条件的关键字列表和对应的网络URL,通过互联网查询接口分别提交百度和Google进行互联网检索,并将百度和Google检索的初步结果存入专家分析结果库,该结果库是一个临时库文件,由于检索的结果非常多,系统主要取前面的1万条专家分析初步记录。
步骤S107,启动大数据分析依次使用历史数据法,未来数据法,拐点数据法,专业咨询数据法依次分析行业分析临时结果库,客户分析临时结果库,竞争分析临时结果库和专家分析临时结果库,并将分析的结果形成正式的证据导入结果库,并保存。
步骤S108,向用户展示输出证据结果,用户设置输出的表达形式包括不限于图,表和文字,系统将根据用户需要的表达形式从结果库中得到行业证据,客户证据,竞争证据和专家证据,并通过WEB网页方式进行呈现;
参照图二,本发明一种基于大数据分析实现IT论证采集的系统主要实施模块包括:
201分析表模块,主要实现行业分析表,客户分析表,竞争分析表和专家分析表的建立和维护,表的配置,查询,同时实现自我学习完善缺省数据的功能。
202本地智能检索模块,主要实现根据用户输入的条件进行本地快速的遍历,得到提交互联网查询的相关条件和参数。
203互联网接口模块,主要实现与百度,Google互联网搜索的接口,向网站提交检索参数,同时接收搜索引擎返回的结果。
204结果库模块,主要实现互联网搜索返回结果在本地的临时存储,由于数据量较大,本系统通过建立临时数据库的方式实现,快速主要是通过内存数据库实现;
205大数据分析模块,该模块主要由501历史数据分析模块,502未来数据分析模块,503拐点数据分析模块和504专业咨询数据分析模块构建。这些模块从时间维度来审视行业宏观信息,客户诉求变化,竞争形势变化,专家在官方和权威载体发表的相关证词,同时504专业咨询数据分析模块针对行业的咨询公司的数据进行分析,包括不限于IDC,Gartner,各种智库。
206结果展现模块,根据用户需要显示的形式,实现图,表和文字的结果展示,方便用户自行制作PPT,WORD,PDF等报告的输出。
与现有的实现技术相比,本发明方法能够快速的从行业宏观维度,客户需求维度,竞争信息维度和专家意见维度自动收集和分析论证依据,执行效率非常高,而且能够准确的检索到最关键的论据信息。
以上对本发明实施例所提供的技术方案进行了详细介绍,本文中应用了具体个例对本发明实施例的原理以及实施方式进行了阐述,以上实施例的说明只适用于帮助理解本发明实施例的原理;同时,对于本领域的一般技术人员,依据本发明实施例,在具体实施方式以及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (4)

1.一种基于大数据分析实现IT论证采集的系统和方法,其特征是:用户提出一个假设性观点后,从行业宏观维度,客户需求维度,竞争信息维度和专家意见维度自动收集和分析论证依据,基于互联网检索并根据检索的结果使用历史数据法,未来数据法,拐点数据法和专业咨询数据法的大数据分析,分别提取和分析行业论据,客户论据,竞争厂家论据和专家意见证据,并通过图,表和文字的表达形式输出分析结果。
2.根据权利要求1所述的从行业宏观维度,客户需求维度,竞争信息维度和专家意见维度自动收集和分析论证依据,其特征是:建立行业分析表,客户分析表,竞争分析表和专家分析表,每张表格包括不限于序号,关键字,检索网络URL地址,系统根据互联网搜索的结果进行自我学习和完善缺省配置,同时提供用户增加,修改,查询的功能。
3.根据权利要求1所述的基于互联网检索并根据检索结果使用历史数据法,未来数据法,拐点数据法和专业咨询数据法的大数据分析,其特征是:互联网搜索返回结果在本地建立的临时内存数据库保存,并从时间维度来审视行业宏观信息,客户诉求变化和竞争形势变化,专家在官方和权威载体发表的相关证词和针对行业的咨询公司的数据进行分析,包括不限于IDC,Gartner,各种智库。
4.根据权利要求1所述的通过图,表和文字的表达形式输出大数据分析结果,其特征是:用户设置输出表达形式包括不限于图,表和文字,系统根据用户需要的表达形式从结果库中得到行业证据,客户证据,竞争证据和专家证据,并通过WEB网页方式进行呈现。
CN201410154077.4A 2014-04-11 2014-04-11 一种基于大数据分析实现it论证采集的系统和方法 Pending CN103914562A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410154077.4A CN103914562A (zh) 2014-04-11 2014-04-11 一种基于大数据分析实现it论证采集的系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410154077.4A CN103914562A (zh) 2014-04-11 2014-04-11 一种基于大数据分析实现it论证采集的系统和方法

Publications (1)

Publication Number Publication Date
CN103914562A true CN103914562A (zh) 2014-07-09

Family

ID=51040242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410154077.4A Pending CN103914562A (zh) 2014-04-11 2014-04-11 一种基于大数据分析实现it论证采集的系统和方法

Country Status (1)

Country Link
CN (1) CN103914562A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239573A (zh) * 2014-10-08 2014-12-24 无锡慧方科技有限公司 一种带有新型开放式和集成式搜索引擎的医疗系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5963946A (en) * 1996-11-11 1999-10-05 Nec Corporation Information retrieval system for presenting information obtained through efficient retrieval of a data base and processing of the retrieval results
CN102279849A (zh) * 2010-06-09 2011-12-14 中兴通讯股份有限公司 一种大数据查询的方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5963946A (en) * 1996-11-11 1999-10-05 Nec Corporation Information retrieval system for presenting information obtained through efficient retrieval of a data base and processing of the retrieval results
CN102279849A (zh) * 2010-06-09 2011-12-14 中兴通讯股份有限公司 一种大数据查询的方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239573A (zh) * 2014-10-08 2014-12-24 无锡慧方科技有限公司 一种带有新型开放式和集成式搜索引擎的医疗系统

Similar Documents

Publication Publication Date Title
Hao et al. Integrating and navigating engineering design decision-related knowledge using decision knowledge graph
CN106126648B (zh) 一种基于重做日志的分布式商品信息爬虫方法
CN102760058B (zh) 面向大规模协作开发的海量软件项目共享方法
US20120323627A1 (en) Real-time Monitoring of Public Sentiment
CN111967761B (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
CN103473672A (zh) 企业级数据中心的元数据质量稽核系统、方法及平台
CN101118554A (zh) 智能交互式问答系统及其处理方法
CN101178728A (zh) 一种网址导航的方法和系统
CN102521232B (zh) 一种互联网元数据的分布式采集处理系统及方法
CN105550189A (zh) 基于本体的信息安全事件智能检索系统
CN113254630B (zh) 一种面向全球综合观测成果的领域知识图谱推荐方法
CN102955802B (zh) 从数据报表中获取数据的方法和装置
KR20210063874A (ko) 지식 그래프 기반 마케팅 정보 분석 서비스 제공 방법 및 그 장치
CN102819600B (zh) 面向电力生产管理系统关系数据库的关键词搜索方法
CN103116635A (zh) 面向领域的暗网资源采集方法和系统
Poveda et al. Application of semantic search in Idea Management Systems
CN103440199A (zh) 测试引导方法和装置
CN115757689A (zh) 一种信息查询系统、方法及设备
CN114860916A (zh) 知识检索方法及装置
US10397326B2 (en) IRC-Infoid data standardization for use in a plurality of mobile applications
Shi et al. Human resources balanced allocation method based on deep learning algorithm
Rizvi et al. A preliminary review of web-page recommendation in information retrieval using domain knowledge and web usage mining
KR20220074574A (ko) 지식 그래프 기반 라이브스트림 실시간 채팅 내용 분석 방법 및 그 장치
Abbas et al. Quality factors enhancement of requirement engineering: A systematic literature review
CN103914562A (zh) 一种基于大数据分析实现it论证采集的系统和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140709

WD01 Invention patent application deemed withdrawn after publication