CN106446084A - 一种互联网人物搜索信息整合分析方法 - Google Patents

一种互联网人物搜索信息整合分析方法 Download PDF

Info

Publication number
CN106446084A
CN106446084A CN201610815527.9A CN201610815527A CN106446084A CN 106446084 A CN106446084 A CN 106446084A CN 201610815527 A CN201610815527 A CN 201610815527A CN 106446084 A CN106446084 A CN 106446084A
Authority
CN
China
Prior art keywords
information
electrically
unit
module
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610815527.9A
Other languages
English (en)
Inventor
屈银川
曾琰
李瑾璠
赫中翮
周忠诚
陈俊良
霍旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gaodig Information Technology Co Ltd
Original Assignee
Beijing Gaodig Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gaodig Information Technology Co Ltd filed Critical Beijing Gaodig Information Technology Co Ltd
Priority to CN201610815527.9A priority Critical patent/CN106446084A/zh
Publication of CN106446084A publication Critical patent/CN106446084A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明公开了互联网技术领域的一种互联网人物搜索信息整合分析方法,包括信息提取单元和关键词分类模块,所述信息提取单元和关键词分类模块均电性输出连接信息源采集单元,所述运维管理中心电性双向连接存储节点,所述存储节点电性输出连接分布式存储系统,所述运维管理中心电性输入连接信息比对模块,所述信息比对模块电性双向连接中心数据库,该系统能够有效的针对互联网人物搜索信息进行整合,有利于改善目前信息的分散分布,改善用户体验并提高人物信息搜索效率,使信息检索更具系统性,能够一步到位的实现信息整合,并加大信息存储量。

Description

一种互联网人物搜索信息整合分析方法
技术领域
本发明涉及互联网技术领域,具体为一种互联网人物搜索信息整合分析方法。
背景技术
互联网技术的蓬勃发展带来了与传统多媒体的不同之处,传统多媒体通常由于其专业性,文章以及新闻的发布带有系统以及知识的完备性。而互联网的信息通常是零散的,分布的,需要进行多次的整合,传统的信息检索缺乏系统性,信息整合未能实现一步到位。为此,我们发明了一种互联网人物搜索信息整合分析方法投入使用,以解决上述问题。
发明内容
本发明的目的在于提供一种互联网人物搜索信息整合分析方法,以解决上述背景技术中提出的信息检索缺乏系统性,其资源整合未能实现一步到位的问题。
为实现上述目的,本发明提供如下技术方案:一种互联网人物搜索信息整合分析方法,包括信息提取单元和关键词分类模块,所述信息提取单元和关键词分类模块均电性输出连接信息源采集单元,所述信息源采集单元电性输出连接信息处理分析模块,所述信息处理分析模块电性输出连接信息源整合单元,所述信息源整合模块电性输出连接运维管理中心,所述运维管理中心电性输出连接无线通讯模块,所述无线通讯模块电性输出连接显示终端,所述运维管理中心电性双向连接存储节点,所述存储节点电性输出连接分布式存储系统,所述运维管理中心电性输入连接信息比对模块,所述信息比对模块电性双向连接中心数据库。
优选的,所述信息源整合单元包括信息源转换模块、数据聚合单元、信息关联模块和信息挖掘单元,所述信息源转换模块、数据聚合单元、信息关联模块和信息挖掘单元均电性双向连接信息整合管理系统,所述信息整合管理系统电性双向连接信息数据库,所述信息数据库电性输入连接信息查询输入端口。
优选的,该互联网人物搜索信息整合分析方法步骤如下:
S1:在搜索引擎中输入人物检索信息,在互联网数据库中对输入信息进行特征提取;
S2:针对不完整信息源输入,利用数据关联系统对输入的信息源做关键词分类;
S3:对检索出的人物信息网页采用数据处理分析模块对网页集合进行分析处理,利用分布式的程序算法,缩短系统响应时间;
S4:针对不符合信息关联要求的信息源进行帅选过滤;
S5:检索出的网页集合经过数据分析后,将同等类型的信息源通过信息源整合单元整合,并提供数据查询端口;
S6:经过整合处理后的信息源,通过无线通讯模块上传至显示终端,完成整个检索过程。
与现有技术相比,本发明的有益效果是:该系统能够有效的针对互联网人物搜索信息进行整合,有利于改善目前信息的分散分布,改善用户体验并提高人物信息搜索效率,使信息检索更具系统性,能够一步到位的实现信息整合,并加大信息存储量。
附图说明
图1为本发明系统框图;
图2为本发明信息处理分析模块系统框图;
图3为本发明信息源整合单元系统框图。
图中:1信息提取单元、2关键词分类模块、3信息源采集单元、4信息处理分析模块、41数据输入单元、42实时存储单元、43实时计算单元、44批量存储单元、45批量计算单元、46数据输出单元、5信息源整合单元、51信息源转换模块、52数据聚合单元、53信息关联模块、54信息挖掘单元、55信息整合管理系统、56信息数据库、57信息查询输入端口、6运维管理中心、7无线通讯模块、8显示终端、9存储节点、10分布式存储系统、11信息比对模块、12中心数据库。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,本发明提供一种技术方案:一种互联网人物搜索信息整合分析方法,包括信息提取单元1和关键词分类模块2,所述信息提取单元1和关键词分类模块2均电性输出连接信息源采集单元3,所述信息源采集单元3电性输出连接信息处理分析模块4,所述信息处理分析模块4电性输出连接信息源整合单元5,所述信息源整合模块5电性输出连接运维管理中心6,所述运维管理中心6电性输出连接无线通讯模块7,所述无线通讯模块7电性输出连接显示终端8,所述运维管理中心6电性双向连接存储节点9,所述存储节点9电性输出连接分布式存储系统10,所述运维管理中心6电性输入连接信息比对模块11,所述信息比对模块11电性双向连接中心数据库12。
其中,所述信息处理分析模块4包括数据输入单元41,所述数据输入单元41分别电性输出连接实时存储单元42和批量存储单元44,实时存储单元42能够有效的降低数据库空间的存储压力,针对实时流数据模型存储效率方面增加其稳定性和有效性,所述实时存储单元42电性输出连接实时计算单元43,实时计算单元43能够实时的响应计算结果,可以动态实时的刷新用户访问数据,展示网站实时流量的变化情况,并分析流量和用户的分布情况,所述批量存储单元44电性输出连接批量计算单元45,所述实时计算单元43和批量计算单元45均电性输出连接数据输出单元46,所述信息源整合单元5包括信息源转换模块51、数据聚合单元52、信息关联模块53和信息挖掘单元54,信息源转换模块51对数据的合并、整合和清理,通过转换可以实现不同的信息源在语义上的一致性,数据聚合单元52可以将极度分散、高度相关、前后依存的信息碎片,迅速、及时的整合成完整的、有参考价值的信息,利用信息聚合技术,可以过滤噪声数据的干扰,迅速获得有价值的信息,通过信息挖掘单元54能够获取用户个性化的信息需求,根据目标特征信息在网络上,或者信息库中进行有目的的信息搜寻,所述信息源转换模块51、数据聚合单元52、信息关联模块53和信息挖掘单元54均电性双向连接信息整合管理系统55,所述信息整合管理系统55电性双向连接信息数据库56,所述信息数据库56电性输入连接信息查询输入端口57。
该互联网人物搜索信息整合分析方法步骤如下:
S1:在搜索引擎中输入人物检索信息,在互联网数据库中对输入信息进行特征提取;
S2:针对不完整信息源输入,利用数据关联系统对输入的信息源做关键词分类;
S3:对检索出的人物信息网页采用数据处理分析模块4对网页集合进行分析处理,利用分布式的程序算法,缩短系统响应时间;
S4:针对不符合信息关联要求的信息源进行帅选过滤;
S5:检索出的网页集合经过数据分析后,将同等类型的信息源通过信息源整合单元5整合,并提供数据查询端口;
S6:经过整合处理后的信息源,通过无线通讯模块7上传至显示终端8,完成整个检索过程。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (4)

1.一种互联网人物搜索信息整合分析方法,包括信息提取单元(1)和关键词分类模块(2),其特征在于:所述信息提取单元(1)和关键词分类模块(2)均电性输出连接信息源采集单元(3),所述信息源采集单元(3)电性输出连接信息处理分析模块(4),所述信息处理分析模块(4)电性输出连接信息源整合单元(5),所述信息源整合模块(5)电性输出连接运维管理中心(6),所述运维管理中心(6)电性输出连接无线通讯模块(7),所述无线通讯模块(7)电性输出连接显示终端(8),所述运维管理中心(6)电性双向连接存储节点(9),所述存储节点(9)电性输出连接分布式存储系统(10),所述运维管理中心(6)电性输入连接信息比对模块(11),所述信息比对模块(11)电性双向连接中心数据库(12)。
2.根据权利要求1所述的一种互联网人物搜索信息整合分析方法,其特征在于:所述信息处理分析模块(4)包括数据输入单元(41),所述数据输入单元(41)分别电性输出连接实时存储单元(42)和批量存储单元(44),所述实时存储单元(42)电性输出连接实时计算单元(43),所述批量存储单元(44)电性输出连接批量计算单元(45),所述实时计算单元(43)和批量计算单元(45)均电性输出连接数据输出单元(46)。
3.根据权利要求1所述的一种互联网人物搜索信息整合分析方法,其特征在于:所述信息源整合单元(5)包括信息源转换模块(51)、数据聚合单元(52)、信息关联模块(53)和信息挖掘单元(54),所述信息源转换模块(51)、数据聚合单元(52)、信息关联模块(53)和信息挖掘单元(54)均电性双向连接信息整合管理系统(55),所述信息整合管理系统(55)电性双向连接信息数据库(56),所述信息数据库(56)电性输入连接信息查询输入端口(57)。
4.一种采用如权利要求1所述的一种互联网人物搜索信息整合分析方法,其特征在于:该互联网人物搜索信息整合分析方法步骤如下:
S1:在搜索引擎中输入人物检索信息,在互联网数据库中对输入信息进行特征提取;
S2:针对不完整信息源输入,利用数据关联系统对输入的信息源做关键词分类;
S3:对检索出的人物信息网页采用数据处理分析模块(4)对网页集合进行分析处理,利用分布式的程序算法,缩短系统响应时间;
S4:针对不符合信息关联要求的信息源进行帅选过滤;
S5:检索出的网页集合经过数据分析后,将同等类型的信息源通过信息源整合单元(5)整合,并提供数据查询端口;
S6:经过整合处理后的信息源,通过无线通讯模块(7)上传至显示终端(8),完成整个检索过程。
CN201610815527.9A 2016-09-09 2016-09-09 一种互联网人物搜索信息整合分析方法 Pending CN106446084A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610815527.9A CN106446084A (zh) 2016-09-09 2016-09-09 一种互联网人物搜索信息整合分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610815527.9A CN106446084A (zh) 2016-09-09 2016-09-09 一种互联网人物搜索信息整合分析方法

Publications (1)

Publication Number Publication Date
CN106446084A true CN106446084A (zh) 2017-02-22

Family

ID=58168656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610815527.9A Pending CN106446084A (zh) 2016-09-09 2016-09-09 一种互联网人物搜索信息整合分析方法

Country Status (1)

Country Link
CN (1) CN106446084A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009298A (zh) * 2017-12-27 2018-05-08 海口经济学院 一种互联网人物搜索信息整合分析控制方法
CN109145019A (zh) * 2018-07-10 2019-01-04 武汉海云健康科技股份有限公司 一种大数据动态人物画像信息提取方法
CN109902137A (zh) * 2019-03-05 2019-06-18 山东女子学院 一种基于互联网的地域文化整理系统
CN111913936A (zh) * 2020-07-31 2020-11-10 南京中诚区块链研究院有限公司 一种涉及多领域溯源系统
CN111935115A (zh) * 2020-07-30 2020-11-13 南京中诚区块链研究院有限公司 一种采用多种信息整合方式区块链

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110276555A1 (en) * 2002-09-23 2011-11-10 Alex Fiero Broadcast Network Platform System
CN103914545A (zh) * 2014-04-08 2014-07-09 百度在线网络技术(北京)有限公司 搜索展现方法及装置
CN105677802A (zh) * 2015-12-31 2016-06-15 宁波公众信息产业有限公司 一种互联网信息分析系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110276555A1 (en) * 2002-09-23 2011-11-10 Alex Fiero Broadcast Network Platform System
CN103914545A (zh) * 2014-04-08 2014-07-09 百度在线网络技术(北京)有限公司 搜索展现方法及装置
CN105677802A (zh) * 2015-12-31 2016-06-15 宁波公众信息产业有限公司 一种互联网信息分析系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108009298A (zh) * 2017-12-27 2018-05-08 海口经济学院 一种互联网人物搜索信息整合分析控制方法
CN108009298B (zh) * 2017-12-27 2021-08-31 海口经济学院 一种互联网人物搜索信息整合分析控制方法
CN109145019A (zh) * 2018-07-10 2019-01-04 武汉海云健康科技股份有限公司 一种大数据动态人物画像信息提取方法
CN109902137A (zh) * 2019-03-05 2019-06-18 山东女子学院 一种基于互联网的地域文化整理系统
CN111935115A (zh) * 2020-07-30 2020-11-13 南京中诚区块链研究院有限公司 一种采用多种信息整合方式区块链
CN111913936A (zh) * 2020-07-31 2020-11-10 南京中诚区块链研究院有限公司 一种涉及多领域溯源系统

Similar Documents

Publication Publication Date Title
CN106446084A (zh) 一种互联网人物搜索信息整合分析方法
CN107945086A (zh) 一种应用于智慧城市的大数据资源管理系统
CN104331435B (zh) 一种基于Hadoop大数据平台的低影响高效率的海量数据抽取方法
CN106651633A (zh) 一种基于大数据技术的用电信息采集系统及其采集方法
CN105956015A (zh) 一种基于大数据的服务平台整合方法
CN104820670A (zh) 一种电力信息大数据的采集和存储方法
CN104111996A (zh) 基于hadoop平台的医保门诊大数据抽取系统及方法
CN106850249A (zh) 基于大数据分析的通信网络预警分析系统
CN106709035A (zh) 一种电力多维全景数据的预处理系统
CN103455636A (zh) 一种基于互联网税务数据自动抓取与智能分析的方法
CN106302522A (zh) 一种基于神经网络和大数据的网络安全态势分析方法和系统
CN106777027B (zh) 大规模并行处理行列混合数据存储装置及存储、查询方法
CN110147360A (zh) 一种数据整合方法、装置、存储介质和服务器
CN111090643B (zh) 一种基于数据分析系统下的海量用电数据挖掘方法
Zhang et al. Analysis of power consumer behavior based on the complementation of K-means and DBSCAN
CN107423343A (zh) 一种基于混合协同过滤的图书馆图书推荐方法及系统
CN109634940A (zh) 一种基于海量低压台区用电数据的典型低压台区用电模型构建方法
CN108829704A (zh) 一种大数据分布式挖掘分析服务技术
CN1275137C (zh) 海量数据处理方法和系统
CN107656995A (zh) 面向大数据的数据管理系统
CN108228787A (zh) 按照多级类目处理信息的方法和装置
KR101693727B1 (ko) 소셜 네트워크를 활용한 연구개발 관점의 사회적 이슈 재구성 장치 및 방법
CN106127602A (zh) 一种基于约简离群点算法的窃电辨识方法及装置
CN109286521A (zh) 一种计量箱反窃电检测报警系统及方法
CN109978598A (zh) 基于大数据分析销售数据算法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170222