CN105677768A - 基于复杂产品网络化分类分析系统 - Google Patents

基于复杂产品网络化分类分析系统 Download PDF

Info

Publication number
CN105677768A
CN105677768A CN201511024250.XA CN201511024250A CN105677768A CN 105677768 A CN105677768 A CN 105677768A CN 201511024250 A CN201511024250 A CN 201511024250A CN 105677768 A CN105677768 A CN 105677768A
Authority
CN
China
Prior art keywords
data
unit
processing unit
classification
structured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201511024250.XA
Other languages
English (en)
Inventor
高辉
尚成辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhu Leruisi Information Consulting Co Ltd
Original Assignee
Wuhu Leruisi Information Consulting Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhu Leruisi Information Consulting Co Ltd filed Critical Wuhu Leruisi Information Consulting Co Ltd
Priority to CN201511024250.XA priority Critical patent/CN105677768A/zh
Publication of CN105677768A publication Critical patent/CN105677768A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及产品网络化运营技术领域,具体地说是一种基于复杂产品网络化分类分析系统,其特征在于设有信息处理中心服务器,所述信息处理中心服务器上设有数据获取单元、数据预处理单元、数据挖掘单元以及处理结果输出单元;所述数据获取单元中设有结构化数据获取单元和非结构化数据获取单元;所述数据预处理单元设有数据筛选单元、数据结构化处理单元、数据归一化处理单元,与现有技术相比,通过对海量数据进行有效的预处理,删除缺损、重复信息,并将非结构化数据处理为易分析维护的结构化数据,有效提高了系统分析准确性和可靠性,具有工作效率高、输出结果准确等显著的优点。

Description

基于复杂产品网络化分类分析系统
技术领域:
本发明涉及产品网络化运营技术领域,具体地说是一种基于复杂产品网络化分类分析系统。
背景技术:
随着网络的高速发展,网络作为最大的信息载体和交流平台,已成为当前进行信息宣传的重要途径。常规的信息(如新闻、广告、商品等)是制定媒介策略,透过媒体定位覆盖目标受众,为实现精准,也不过在投放后再以数据去验证、调整,很难实现考虑受众是否感兴趣和接收。而对于互联网实时信息推送(如个性新闻发布,实时广告竞价,个性商品展示等),在投放前就已寻找到合适的受众,真正实现互联网化广告的精准投放、个性营销。
目前,对企业中如何把业务数据迅速转化成为对市场、对运营状况的认知,从而辅助企业决策,不断优化决策管理流程,提升对市场变化的响应能力,已经成为销售部门迫切需要解决的问题。
面对大量待分析数据,如何维护和使用是一个亟待解决的问题,其中海量的数据中包含大量非结构化文本,非结构化文本不方便用数据库二维逻辑表来表现的文本数据,由此导致大量文本内容难于被分析与维护,而结构化文本则可通过数据库的二维表结构来逻辑表达,因而便于文本内容的维护及基于该结构化文本进行数据挖掘。
发明内容:
本发明针对现有技术中存在的缺点和不足,提出了一种效率高、准确率高的基于复杂产品网络化分类分析系统。
本发明可以通过一下措施达到:
一种基于复杂产品网络化分析分类系统,其特征在于设有信息处理中心服务器,所述信息处理中心服务器上设有数据获取单元、数据预处理单元、数据挖掘单元以及处理结果输出单元;所述数据获取单元中设有结构化数据获取单元和非结构化数据获取单元;所述数据预处理单元设有数据筛选单元、数据结构化处理单元、数据归一化处理单元。
本发明所述数据预处理单元中的数据筛选单元用于滤除数据中重复、缺损的数据;所述数据结构化处理单元用于将非结构化数据处理为结构化数据。
本发明所述数据结构化处理单元包括:文本获取模块,用于获取与中心词相关的非结构化文本,其中,所述中心词表示所述非结构化文本所阐述的词语;分类获取模块,用于基于预定分类模型,对所述非结构化文本进行分类分析,以获取所述中心词的分类;生成模块,用于根据所述分类,生成所述中心词的结构化信息实体。
本发明所述数据结构化处理单元还包括:模板获取模块,用于根据所述分类,获取与所述分类相对应的属性模板;其中,所述生成模块用于根据所述分类及其对应的该属性模板,生成包含所述属性模板的所述信息实体。
本发明与现有技术相比,通过对海量数据进行有效的预处理,删除缺损、重复信息,并将非结构化数据处理为易分析维护的结构化数据,有效提高了系统分析准确性和可靠性,具有工作效率高、输出结果准确等显著的优点。
附图说明:
附图1是本发明的结构框图。
附图标记:信息处理中心服务器1、数据获取单元2、数据预处理单元3、数据挖掘单元4、处理结果输出单元5、结构化数据获取单元6非结构化数据获取单元7、数据筛选单元8、数据结构化处理单元9、数据归一化处理单元10。
具体实施方式:
下面结合附图对本发明作进一步的说明:
如附图所示,本发明提出了一种基于复杂产品网络化分析分类系统,其特征在于设有信息处理中心服务器1,所述信息处理中心服务器上设有数据获取单元2、数据预处理单元3、数据挖掘单元4以及处理结果输出单元5;所述数据获取单元2中设有结构化数据获取单元6和非结构化数据获取单元7;所述数据预处理单元3设有数据筛选单元8、数据结构化处理单元9、数据归一化处理单元10。
本发明所述数据预处理单元3中的数据筛选单元8用于滤除数据中重复、缺损的数据;所述数据结构化处理单元9用于将非结构化数据处理为结构化数据。
本发明所述数据结构化处理单元9包括:文本获取模块,用于获取与中心词相关的非结构化文本,其中,所述中心词表示所述非结构化文本所阐述的词语;分类获取模块,用于基于预定分类模型,对所述非结构化文本进行分类分析,以获取所述中心词的分类;生成模块,用于根据所述分类,生成所述中心词的结构化信息实体。
本发明所述数据结构化处理单元9还包括:模板获取模块,用于根据所述分类,获取与所述分类相对应的属性模板;其中,所述生成模块用于根据所述分类及其对应的该属性模板,生成包含所述属性模板的所述信息实体。
本发明与现有技术相比,通过对海量数据进行有效的预处理,删除缺损、重复信息,并将非结构化数据处理为易分析维护的结构化数据,有效提高了系统分析准确性和可靠性,具有工作效率高、输出结果准确等显著的优点。

Claims (4)

1.一种基于复杂产品网络化分析分类系统,其特征在于设有信息处理中心服务器,所述信息处理中心服务器上设有数据获取单元、数据预处理单元、数据挖掘单元以及处理结果输出单元;所述数据获取单元中设有结构化数据获取单元和非结构化数据获取单元;所述数据预处理单元设有数据筛选单元、数据结构化处理单元、数据归一化处理单元。
2.根据权利要求1所述的一种基于复杂产品网络化分析分类系统,其特征在于所述数据预处理单元中的数据筛选单元用于滤除数据中重复、缺损的数据;所述数据结构化处理单元用于将非结构化数据处理为结构化数据。
3.根据权利要求2所述的一种基于复杂产品网络化分析分类系统,其特征在于所述数据结构化处理单元包括:文本获取模块,用于获取与中心词相关的非结构化文本,其中,所述中心词表示所述非结构化文本所阐述的词语;分类获取模块,用于基于预定分类模型,对所述非结构化文本进行分类分析,以获取所述中心词的分类;生成模块,用于根据所述分类,生成所述中心词的结构化信息实体。
4.根据权利要求3所述的一种基于复杂产品网络化分析分类系统,其特征在于所述数据结构化处理单元还包括:模板获取模块,用于根据所述分类,获取与所述分类相对应的属性模板;其中,所述生成模块用于根据所述分类及其对应的该属性模板,生成包含所述属性模板的所述信息实体。
CN201511024250.XA 2015-12-30 2015-12-30 基于复杂产品网络化分类分析系统 Pending CN105677768A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511024250.XA CN105677768A (zh) 2015-12-30 2015-12-30 基于复杂产品网络化分类分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511024250.XA CN105677768A (zh) 2015-12-30 2015-12-30 基于复杂产品网络化分类分析系统

Publications (1)

Publication Number Publication Date
CN105677768A true CN105677768A (zh) 2016-06-15

Family

ID=56298189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511024250.XA Pending CN105677768A (zh) 2015-12-30 2015-12-30 基于复杂产品网络化分类分析系统

Country Status (1)

Country Link
CN (1) CN105677768A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339451A (zh) * 2016-08-26 2017-01-18 成都汉康信息产业有限公司 基于大数据的数据挖掘系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214208A (zh) * 2011-04-27 2011-10-12 百度在线网络技术(北京)有限公司 一种基于非结构化文本生成结构化信息实体的方法与设备
CN104123659A (zh) * 2014-07-30 2014-10-29 杭州野工科技有限公司 基于商品网络化基因的品牌知识产权保护平台
CN104679827A (zh) * 2015-01-14 2015-06-03 北京得大信息技术有限公司 一种基于大数据的公开信息关联方法及挖掘引擎

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102214208A (zh) * 2011-04-27 2011-10-12 百度在线网络技术(北京)有限公司 一种基于非结构化文本生成结构化信息实体的方法与设备
CN104123659A (zh) * 2014-07-30 2014-10-29 杭州野工科技有限公司 基于商品网络化基因的品牌知识产权保护平台
CN104679827A (zh) * 2015-01-14 2015-06-03 北京得大信息技术有限公司 一种基于大数据的公开信息关联方法及挖掘引擎

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106339451A (zh) * 2016-08-26 2017-01-18 成都汉康信息产业有限公司 基于大数据的数据挖掘系统

Similar Documents

Publication Publication Date Title
Trotta et al. Assessing industry 4.0 maturity: An essential scale for SMEs
CN110851667B (zh) 一种多源头大量数据的整合分析方法及工具
CN109829733B (zh) 一种基于购物行为序列数据的虚假评论检测系统和方法
WO2015165408A1 (zh) 一种商品评价信息过滤方法及系统
CN106991175B (zh) 一种客户信息挖掘方法、装置、设备以及存储介质
CN110196848B (zh) 一种面向公共资源交易数据的清洗去重方法及其系统
CN104321802A (zh) 图像分析装置、图像分析系统、图像分析方法
Ferrari et al. NLP for requirements engineering: tasks, techniques, tools, and technologies
CN112000773B (zh) 基于搜索引擎技术的数据关联关系挖掘方法及应用
CN103886501B (zh) 一种基于语义情感分析的贷后风险预警系统
WO2012146440A1 (fr) Procédé et dispositif permettant de repérer et d'étiqueter des pics, des augmentations ou des variations anormales ou exceptionnelles du débit d'un flux de documents numériques
CN110955690A (zh) 一种基于大数据技术的自助数据标签平台及自助数据标签方法
CN104850617A (zh) 短文本处理方法及装置
CN114048892A (zh) 一种基于大数据的中小企业风险预警系统及方法
CN113268603A (zh) 一种新闻舆情知识图谱的构建方法及装置、介质、设备
CN107330076B (zh) 一种网络舆情信息展示系统及方法
CN105677768A (zh) 基于复杂产品网络化分类分析系统
CN113240455A (zh) 一种基于互联网的电子商务平台数据分析决策系统
CN105550358A (zh) 网络信息应用领域的分类分析系统
Kim et al. Customer preference analysis based on SNS data
Deitrick et al. Enhancing sentiment analysis on twitter using community detection
CN109213873B (zh) 一种为待售专利自动匹配潜在买方的专利匹配方法和匹配系统
CN114312930B (zh) 基于日志数据的列车运行异常诊断方法和装置
CN114398562A (zh) 一种店铺数据管理方法、装置、设备及存储介质
Kenza et al. A Conceptual Framework using Big Data Analytics for Effective Email Marketing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160615

WD01 Invention patent application deemed withdrawn after publication