CN108897832A - 一种自动分析价值信息的方法与装置 - Google Patents

一种自动分析价值信息的方法与装置 Download PDF

Info

Publication number
CN108897832A
CN108897832A CN201810651484.4A CN201810651484A CN108897832A CN 108897832 A CN108897832 A CN 108897832A CN 201810651484 A CN201810651484 A CN 201810651484A CN 108897832 A CN108897832 A CN 108897832A
Authority
CN
China
Prior art keywords
information
value
module
analysis
repository
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810651484.4A
Other languages
English (en)
Other versions
CN108897832B (zh
Inventor
曾锲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Declarer (guangzhou) Intelligent Technology Development Co Ltd
Original Assignee
Declarer (guangzhou) Intelligent Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Declarer (guangzhou) Intelligent Technology Development Co Ltd filed Critical Declarer (guangzhou) Intelligent Technology Development Co Ltd
Priority to CN201810651484.4A priority Critical patent/CN108897832B/zh
Publication of CN108897832A publication Critical patent/CN108897832A/zh
Application granted granted Critical
Publication of CN108897832B publication Critical patent/CN108897832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种自动分析价值信息的方法与装置,本发明结构简单,结果信息存储库连接信息导出模块,可以使用户选择进行信息数据的导出下载;信息分析模块进行被分析信息的主干提取,也可称之为标签提取,主要为确定待分析信息的类型方面,提取的枝叶信息即为特征信息,特性信息用来区分相同类型的信息;若被分析信息与大数据信息库中的主杆无一致,则价值等级为最高等级,若主杆信息一致,则根据特性信息有无一致来区别其价值的等级,其中价值等级可分为若干等级,若特征信息与大数据信息库中的信息不一致个数为越多,价值等级越高;调令编码即为可以输入编码直接跳转出此条信息,调令编码的方式可为多种。

Description

一种自动分析价值信息的方法与装置
技术领域
本发明涉及互联网信息分析技术领域,尤其涉及一种自动进行信息价值分析,且能够将信息按照价值的大小进行分类。
背景技术
随着互联网技术的发展,Web技术成为互联网上最重要、最广泛的业务方式之一。随着网络信息的迅猛发展,庞大的网络信息资源和人们特定的信息需求之间形成了巨大的矛盾,基于此,目前互联网市场上出现了各种各样的服务平台,比如电子商务平台、健康服务平台、产品销售服务网站、信息咨询服务网站等,这些服务平台能够为用户提供基于产品或者信息的明确要求提供检索服务。
目前这些服务平台都是基于用户输入的关键字作关键字挖掘,搜索包含关键字的信息,将这些信息反馈给用户。该方式属于静态信息搜索方式,仅能对基于产品或者信息的明确要求提供检索服务,检索结果只是包含用户输入的关键字的信息,且有些信息难以根据客户的需要进行筛选,造成许许多多的重复信息,会使用户浪费大量时间。
因此现在提出一种能够进行信息的自动价值分析,将有用的信息进行展现存储,且随时可以调取的装置十分重要。
发明内容
本发明的目的是为了克服现有技术的不足,本发明是通过以下技术方案实现:一方面,本发明提供一种自动分析价值信息的装置,其特征在于:包括信息采集模块,用于进行数据信息的采集;大数据信息库,用于进行各个方面大量信息的存储;结果信息存储库,用于进行存放分析后的信息;信息分析模块,用于进行信息价值的分析、衡量权重。
作为上述一种优选方式,所述结果信息存储库连接有信息导出模块,用于在分析后的信息进行自行选择导出。
通过上述技术方案,结果信息存储库连接信息导出模块,可以使用户选择进行信息数据的导出下载。
作为上述一种优选方式,所述信息分析模块包括主杆提取模块、枝叶提取模块,所述主杆提取模块用于提取信息中的主要信息,即信息中缩句;所述枝叶提取模块用于提取信息中的特征信息,即修饰词。
通过上述技术方案,信息分析模块进行被分析信息的主干提取,也可称之为标签提取,主要为确定待分析信息的类型方面,提取的枝叶信息即为特征信息,特性信息用来区分相同类型的信息。
作为上述一种优选方式,所述信息分析模块还包括近似分析模块,所述近似分析模块用于进行对于主要信息近似词语的分析,且将信息与大数据信息库中的信息进行相似比对。
作为上述一种优选方式,所述信息分析模块还包括信息等级划分模块,所述信息等级划分模块用于将近似分析模块分析后的信息进行等级划分,并将其存储至结果信息存储库。
通过上述技术方案,若被分析信息与大数据信息库中的主杆无一致,则价值等级为最高等级,若主杆信息一致,则根据特性信息有无一致来区别其价值的等级,其中价值等级可分为若干等级,若特征信息与大数据信息库中的信息不一致个数为越多,价值等级越高。
作为上述一种优选方式,所述结果信息存储库连接有一个调令提取模块,所述调令提取模块用于进行结果信息存储库内信息的调令,所述结果信息存储库内划分为若干存储区域,信息存储至结果信息存储库内带有调令编码。
通过上述技术方案,调令编码即为可以输入编码直接跳转出此条信息,调令编码的方式可为多种。
另一方门,本发明提供一种自动分析价值信息的方法,其特征在于:包括以下步骤:S1、预设大数据信息库,内设大量资源数据信息;
S2、信息采集模块新增数据信息;
S3、新增信息进行信息分析,提取信息的主杆信息以及特征信息;
S4、主干信息和特征信息与大数据信息库内数据进行对比;
S5、结果信息输出,进行信息价值的评断,加入编号存入结果信息存储库。
作为上述一种优选方式,步骤S4中,首先筛选主杆信息一致的信息,随后若特征信息与大数据信息库内的主干信息的特征信息不一致,则判定为价值大,不一致的信息越多,则价值越大。
作为上述一种优选方式,步骤S5中,同一类型的信息具有相同的编号,价值的大小按等级分为若干级别,同一价值级别的信息的编号相同
通过上述技术方案,若价值级别设置有五级,编号为01-05,类型设置有十个类型,则编码为01-10,其后四位为信息自身编码;若一个02类型的信息,其等级为03等级,且其在03等级中编号为1111,则其编码信息为02031111。
与现有的技术相比,本发明的有益效果是:本发明结构简单,结果信息存储库连接信息导出模块,可以使用户选择进行信息数据的导出下载;信息分析模块进行被分析信息的主干提取,也可称之为标签提取,主要为确定待分析信息的类型方面,提取的枝叶信息即为特征信息,特性信息用来区分相同类型的信息;若被分析信息与大数据信息库中的主杆无一致,则价值等级为最高等级,若主杆信息一致,则根据特性信息有无一致来区别其价值的等级,其中价值等级可分为若干等级,若特征信息与大数据信息库中的信息不一致个数为越多,价值等级越高;调令编码即为可以输入编码直接跳转出此条信息,调令编码的方式可为多种;同一类型的信息具有相同的编号,价值的大小按等级分为若干级别,同一价值级别的信息的编号相同。
附图说明
图1为本发明系统结构框图;
图2为本发明工作流程图。
附图标记:1-信息采集模块;2-大数据信息库;3-结果信息存储库;4-信息分析模块;5-信息导出模块;6-主杆提取模块;7-枝叶提取模块;8-近似分析模块;9-信息等级划分模块;10-调令提取模块。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参阅附图所示,一方面,本发明提供一种自动分析价值信息的装置,其特征在于:包括信息采集模块1,用于进行数据信息的采集;大数据信息库2,用于进行各个方面大量信息的存储;结果信息存储库3,用于进行存放分析后的信息;信息分析模块4,用于进行信息价值的分析、衡量权重。
作为上述一种优选方式,所述结果信息存储库3连接有信息导出模块5,用于在分析后的信息进行自行选择导出。
通过上述技术方案,结果信息存储库3连接信息导出模块5,可以使用户选择进行信息数据的导出下载。
作为上述一种优选方式,所述信息分析模块4包括主杆提取模块6、枝叶提取模块7,所述主杆提取模块6用于提取信息中的主要信息,即信息中缩句;所述枝叶提取模块7用于提取信息中的特征信息,即修饰词。
通过上述技术方案,信息分析模块4进行被分析信息的主干提取,也可称之为标签提取,主要为确定待分析信息的类型方面,提取的枝叶信息即为特征信息,特性信息用来区分相同类型的信息。
作为上述一种优选方式,所述信息分析模块4还包括近似分析模块8,所述近似分析模块8用于进行对于主要信息近似词语的分析,且将信息与大数据信息库2中的信息进行相似比对。其中近似分析有助于防止遗漏相似主杆信息,例如“枯萎”和“干枯”为近义词,意思相近,则可进行信息排除。
通过上述技术方案,例如“快递小哥哭诉xx拖欠工资”,那么其主杆为“快递小哥”以及“XX”,修饰即为“拖欠工资”,“XX”即为这条信息的最引人注目的一方,且为什么其引人注目,是因为其“拖欠工资”,且若这个信息在大数据信息库2中以“XX”为主体的信息中没有出现“拖欠工资”则此信息的价值度高。
作为上述一种优选方式,所述信息分析模块4还包括信息等级划分模块9,所述信息等级划分模块9用于将近似分析模块8分析后的信息进行等级划分,并将其存储至结果信息存储库3。
通过上述技术方案,若被分析信息与大数据信息库2中的主杆无一致,则价值等级为最高等级,若主杆信息一致,则根据特性信息有无一致来区别其价值的等级,其中价值等级可分为若干等级,若特征信息与大数据信息库2中的信息不一致个数为越多,价值等级越高。
作为上述一种优选方式,所述结果信息存储库3连接有一个调令提取模块10,所述调令提取模块10用于进行结果信息存储库3内信息的调令,所述结果信息存储库3内划分为若干存储区域,信息存储至结果信息存储库3内带有调令编码。
通过上述技术方案,调令编码即为可以输入编码直接跳转出此条信息,调令编码的方式可为多种。
另一方门,本发明提供一种自动分析价值信息的方法,其特征在于:包括以下步骤:S1、预设大数据信息库2,内设大量资源数据信息;
S2、信息采集模块1新增数据信息;
S3、新增信息进行信息分析,提取信息的主杆信息以及特征信息;
S4、主干信息和特征信息与大数据信息库2内数据进行对比;
S5、结果信息输出,进行信息价值的评断,加入编号存入结果信息存储库3。
作为上述一种优选方式,步骤S4中,首先筛选主杆信息一致的信息,随后若特征信息与大数据信息库2内的主干信息的特征信息不一致,则判定为价值大,不一致的信息越多,则价值越大。
作为上述一种优选方式,步骤S5中,同一类型的信息具有相同的编号,价值的大小按等级分为若干级别,同一价值级别的信息的编号相同
通过上述技术方案,若价值级别设置有五级,编号为01-05,类型设置有十个类型,则编码为01-10,其后四位为信息自身编码;若一个02类型的信息,其等级为03等级,且其在03等级中编号为1111,则其编码信息为02031111。
与现有的技术相比,本发明的有益效果是:本发明结构简单,结果信息存储库3连接信息导出模块5,可以使用户选择进行信息数据的导出下载;信息分析模块4进行被分析信息的主干提取,也可称之为标签提取,主要为确定待分析信息的类型方面,提取的枝叶信息即为特征信息,特性信息用来区分相同类型的信息;若被分析信息与大数据信息库2中的主杆无一致,则价值等级为最高等级,若主杆信息一致,则根据特性信息有无一致来区别其价值的等级,其中价值等级可分为若干等级,若特征信息与大数据信息库2中的信息不一致个数为越多,价值等级越高;调令编码即为可以输入编码直接跳转出此条信息,调令编码的方式可为多种;同一类型的信息具有相同的编号,价值的大小按等级分为若干级别,同一价值级别的信息的编号相同。
在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种自动分析价值信息的装置,其特征在于:包括信息采集模块(1),用于进行数据信息的采集;大数据信息库(2),用于进行各个方面大量信息的存储;结果信息存储库(3),用于进行存放分析后的信息;信息分析模块(4),用于进行信息价值的分析、衡量权重。
2.根据权利要求1所述的自动分析价值信息的装置,其特征在于:所述结果信息存储库(3)连接有信息导出模块(5),用于在分析后的信息进行自行选择导出。
3.根据权利要求1所述的自动分析价值信息的装置,其特征在于:所述信息分析模块(4)包括主杆提取模块(6)、枝叶提取模块(7),所述主杆提取模块(6)用于提取信息中的主要信息,即信息中缩句;所述枝叶提取模块(7)用于提取信息中的特征信息,即修饰词。
4.根据权利要求3所述的自动分析价值信息的装置,其特征在于:所述信息分析模块(4)还包括近似分析模块(8),所述近似分析模块(8)用于进行对于主要信息近似词语的分析,且将信息与大数据信息库(2)中的信息进行相似比对。
5.根据权利要求3所述的自动分析价值信息的装置,其特征在于:所述信息分析模块(4)还包括信息等级划分模块(9),所述信息等级划分模块(9)用于将近似分析模块(8)分析后的信息进行等级划分,并将其存储至结果信息存储库(3)。
6.根据权利要求1所述的自动分析价值信息的装置,其特征在于:所述结果信息存储库(3)连接有一个调令提取模块(10),所述调令提取模块(10)用于进行结果信息存储库(3)内信息的调令,所述结果信息存储库(3)内划分为若干存储区域,信息存储至结果信息存储库(3)内带有调令编码。
7.一种根据权利要求1-6所述的自动分析价值信息的方法,其特征在于:包括以下步骤:S1、预设大数据信息库(2),内设大量资源数据信息;
S2、信息采集模块(1)新增数据信息;
S3、新增信息进行信息分析,提取信息的主杆信息以及特征信息;
S4、主干信息和特征信息与大数据信息库(2)内数据进行对比;
S5、结果信息输出,进行信息价值的评断,加入编号存入结果信息存储库(3)。
8.根据权利要求7所述的自动分析价值信息的管理方法,其特征在于:步骤S4中,首先筛选主杆信息一致的信息,随后若特征信息与大数据信息库(2)内的主干信息的特征信息不一致,则判定为价值大,不一致的信息越多,则价值越大。
9.根据权利要求7所述的自动分析价值信息的管理方法,其特征在于:步骤S5中,同一类型的信息具有相同的编号,价值的大小按等级分为若干级别,同一价值级别的信息的编号相同。
CN201810651484.4A 2018-06-22 2018-06-22 一种自动分析价值信息的方法与装置 Active CN108897832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810651484.4A CN108897832B (zh) 2018-06-22 2018-06-22 一种自动分析价值信息的方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810651484.4A CN108897832B (zh) 2018-06-22 2018-06-22 一种自动分析价值信息的方法与装置

Publications (2)

Publication Number Publication Date
CN108897832A true CN108897832A (zh) 2018-11-27
CN108897832B CN108897832B (zh) 2021-09-03

Family

ID=64345644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810651484.4A Active CN108897832B (zh) 2018-06-22 2018-06-22 一种自动分析价值信息的方法与装置

Country Status (1)

Country Link
CN (1) CN108897832B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111212390A (zh) * 2019-12-23 2020-05-29 北京健康之家科技有限公司 消息队列的处理方法、装置及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101937436A (zh) * 2009-06-29 2011-01-05 华为技术有限公司 一种文本分类方法及装置
CN105718473A (zh) * 2014-12-05 2016-06-29 成都复晓科技有限公司 一种数据建模的方法
CN106372225A (zh) * 2016-09-07 2017-02-01 知识产权出版社有限责任公司 一种基于高价值对比库的信息处理装置及方法
US20170277998A1 (en) * 2009-07-28 2017-09-28 Fti Consulting, Inc. System And Method For Providing Document Classification Suggestions
US20170300564A1 (en) * 2016-04-19 2017-10-19 Sprinklr, Inc. Clustering for social media data
CN107273431A (zh) * 2017-05-23 2017-10-20 合肥智权信息科技有限公司 一种基于大数据的文献参考价值评估系统和方法
CN107480249A (zh) * 2017-08-08 2017-12-15 中国工商银行股份有限公司 海量信息的评级方法、设备以及系统
CN107807936A (zh) * 2016-09-09 2018-03-16 腾讯科技(深圳)有限公司 评论信息排序方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101937436A (zh) * 2009-06-29 2011-01-05 华为技术有限公司 一种文本分类方法及装置
US20170277998A1 (en) * 2009-07-28 2017-09-28 Fti Consulting, Inc. System And Method For Providing Document Classification Suggestions
CN105718473A (zh) * 2014-12-05 2016-06-29 成都复晓科技有限公司 一种数据建模的方法
US20170300564A1 (en) * 2016-04-19 2017-10-19 Sprinklr, Inc. Clustering for social media data
CN106372225A (zh) * 2016-09-07 2017-02-01 知识产权出版社有限责任公司 一种基于高价值对比库的信息处理装置及方法
CN107807936A (zh) * 2016-09-09 2018-03-16 腾讯科技(深圳)有限公司 评论信息排序方法及装置
CN107273431A (zh) * 2017-05-23 2017-10-20 合肥智权信息科技有限公司 一种基于大数据的文献参考价值评估系统和方法
CN107480249A (zh) * 2017-08-08 2017-12-15 中国工商银行股份有限公司 海量信息的评级方法、设备以及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邹立君,等: "图书馆的信息价值链分析", 《图书馆研究》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111212390A (zh) * 2019-12-23 2020-05-29 北京健康之家科技有限公司 消息队列的处理方法、装置及设备

Also Published As

Publication number Publication date
CN108897832B (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
US10671750B2 (en) System and method for data classification centric sensitive data discovery
KR101536520B1 (ko) 토픽을 추출하고, 추출된 토픽의 적합성을 평가하는 방법 및 서버
US11947605B2 (en) Automatically separating claim into elements/limitations and automatically finding art for each element/limitation
CN103118111B (zh) 一种基于多个数据交互中心的数据进行信息推送的方法
CN108959244A (zh) 地址分词的方法和装置
CN109902216A (zh) 一种基于社交网络的数据采集与分析方法
CN103902579B (zh) 获取信息的方法和装置
CN110334178A (zh) 数据检索方法、装置、设备及可读存储介质
CN107341399A (zh) 评估代码文件安全性的方法及装置
CN105205356B (zh) 一种app应用重打包检测方法
CN111767716A (zh) 企业多级行业信息的确定方法、装置及计算机设备
Boella et al. Using classification to support legal knowledge engineers in the Eunomos legal document management system
CN114138985A (zh) 文本数据处理的方法、装置、计算机设备以及存储介质
CN110020161B (zh) 数据处理方法、日志处理方法和终端
CN111143394B (zh) 知识数据处理方法、装置、介质及电子设备
Castell-Uroz et al. URL-based Web tracking detection using deep learning
Aranovich et al. Beyond NVD: Cybersecurity meets the Semantic Web.
Wagner Privacy Policies Across the Ages: Content and Readability of Privacy Policies 1996--2021
CN108897832A (zh) 一种自动分析价值信息的方法与装置
CN107766342A (zh) 一种应用的识别方法和装置
Castell-Uroz et al. ASTrack: Automatic Detection and Removal of Web Tracking Code with Minimal Functionality Loss
CN107145600A (zh) 适用于同类别企业公开信息归类方法
Seddiqui et al. An efficient metric of automatic weight generation for properties in instance matching technique
Cheng et al. MSDetector: A Static PHP Webshell Detection System Based on Deep-Learning
US20220358293A1 (en) Alignment of values and opinions between two distinct entities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant