CN111861241A - 一种产业融合度指数计算及可视化方法 - Google Patents

一种产业融合度指数计算及可视化方法 Download PDF

Info

Publication number
CN111861241A
CN111861241A CN202010734022.6A CN202010734022A CN111861241A CN 111861241 A CN111861241 A CN 111861241A CN 202010734022 A CN202010734022 A CN 202010734022A CN 111861241 A CN111861241 A CN 111861241A
Authority
CN
China
Prior art keywords
fusion
industrial
index
data
fusion degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010734022.6A
Other languages
English (en)
Inventor
吴亚东
廖竞
张野
王娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University of Science and Engineering
Original Assignee
Sichuan University of Science and Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University of Science and Engineering filed Critical Sichuan University of Science and Engineering
Priority to CN202010734022.6A priority Critical patent/CN111861241A/zh
Publication of CN111861241A publication Critical patent/CN111861241A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及产业融合度相关领域,具体为,一种产业融合度指数计算及可视化方法,步骤如下;S10、产业融合数据获取与存储;S20、产业融合度指数计算;S30、基于多层次地图及词云的产业融合度可视化;该方法利用有效的数据获取、算法设计技术和可视化技术,针对产业融合度分析不适应大数据环境、图表单一、分析难度较大等问题,提出大数据环境下产业融合度指数获取、计算和可视化方法,设计产业融合度指数计算方法,利用运用层次分析法确定各项指标的权重系数,然后运用TOPSIS法评估产业融合度指数,解决产业融合度量化分析中的计算问题,设计产业分级地图、视觉编码、关键词词云等产业融合度指数可视化方法,帮助用户快速便捷地了解各地区产业融合的情况。

Description

一种产业融合度指数计算及可视化方法
技术领域
本发明涉及产业融合度相关领域,尤其涉及一种产业融合度指数计算及可视化方法。
背景技术
进入21世纪后,国际经济正发生着深刻变化,产业之间的渗透融合日益深入,产业融合作为一种新型的产业创新方式,成为新时期拓展产业发展空间,推动产业价值增长的最主要源泉与动力之一;在不同的产业领域内,产业融合以不同的方式演进,最终将促成整个产业结构的高度化、合理化,并构架出融合型的产业新体系;近年来大数据分析、挖掘技术的飞速发展为产业融合相关研究带来了新的视角;产业融合度指数是反映产业融合的一个综合性指标,可以很直观地从宏观和微观层面体现出当前产业融合的发展状况,促进产业融合深度发展。
传统方法和技术主要集中在使用较单一的定量分析方法,这些方法各有优劣;在数据处理和分析上,投入产业法最为准确,但要求数据精确到各产业各部门间的依赖关系,但我国各产业相关数据往往不健全,无法计算出精确的结果;灰色关联分析是动态发展态势的量化比较分析,但需要对各项指标的最优值进行现行确定,主观性过强,同时部分指标最优值难以确定;专利数据法通常适用于判断产业之间的技术融合程度,而有些国家的专利统计很少按照产业来分类,并且我国专利统计对应产业时也不是那么准确,因此运用有局限;对于产业融合来说,企业开发的产品涉及到的行业与产业融合发展的程度成正比关系,然而对于综合性很强的产业来说,资料难以收集,存在的客观困难意味着熵指数法的运用难度较大;HHI指数法较全面,但对数据的要求较高,而且含义不直观,实施难度很大;随着产业数据越来越庞大,现有方法和技术在数据处理和数据分析上越来越难以处理大规模的产业数据,分析效果往往达不到需要。
发明内容
本发明的目的在于提供一种产业融合度指数计算及可视化方法,以解决上述背景技术中提出的产业数据越来越庞大,现有方法和技术在数据处理和数据分析上越来越难以处理大规模的产业数据,分析效果往往达不到需要等的问题。
为了实现以上目的,本发明采用的技术方案为:一种产业融合度指数计算及可视化方法,步骤如下;
S10、产业融合数据获取与存储;S20、产业融合度指数计算;S30、基于多层次地图及词云的产业融合度可视化。
进一步的,所述S10、产业融合数据获取与存储包括:
S101、制定宏观指数与微观指数涵盖的内容和范围,然后进行定时、增量数据爬取;
S102、数据清洗和去重后,采用Hadoop大数据平台实现产业融合数据的存储,通过关系数据库和Hadoop平台间双向转移技术,实现产业融合数据的使用。
进一步的,所述S20、产业融合度指数计算算法如下:步骤一,假设原始数据矩阵A=(aij)m×n,运用变量规范化公式
Figure BSA0000215020420000021
对矩阵数据进行规范化处理;
步骤二,结合指标的权数,利用公式V=(vij)m×n=(wj×zij)m×n进行加权规范化处理;
步骤三,确定理想解V*和负理想解V-,其中:
Figure BSA0000215020420000022
Figure BSA0000215020420000031
步骤四,分别计算准则层各指标到理想解V*的距离和s*与负理想解V-的距离和s-,利用公式r=s-/(s-+s*)计算产业融合度指数。
进一步的,所述S30、基于多层次地图及词云的产业融合度可视化通过按行政区划的分级地图、视觉编码、关键词词云等可视化技术进行开发,辅助用户进行分析和决策,包括:S301、各省区市及地级城市在地图上,以行政区划(省-市-县)分级,采用视觉通道中优先级最高较高的形状和颜色来呈现,用颜色深浅来区分军民融合度指数大小;S302、根据描述融合度词频和重要性计算各关键词的权重,根据权重大小进行字体大小编码,字体越大表示该关键字权重更高,更能描述该地区的产业融合度,从而体现该地区的产业融合特点;S303、基于用户探索的交互,用户通过鼠标指向某行政区域,将在词云区视图上呈现该区域的融合度特点,同时采用钻取式探索,实现层级间的跳转交互。
本发明的有益效果为:该方法在于:利用有效的数据获取、算法设计技术和可视化技术,针对产业融合度分析不适应大数据环境、图表单一、分析难度较大等问题,提出大数据环境下产业融合度指数获取、计算和可视化方法,帮助用户快速便捷地了解各地区产业融合的情况,帮助人们进行产业规划和政策调整,促进经济发展;设计产业融合度指数计算方法,利用运用层次分析法确定各项指标的权重系数,然后运用TOPSIS法评估产业融合度指数,解决产业融合度量化分析中的计算问题;基于多层次地图、词云和交互技术,提出可交互探索的产业融合度可视化方法。
附图说明
图1为本发明一种产业融合度指数计算及可视化方法系统框架流程图。
图2为本发明一种产业融合度指数计算及可视化方法数据获取与存储流程图。
图3为本发明一种产业融合度指数计算及可视化方法多级地图可视化示意图。
图4为本发明一种产业融合度指数计算及可视化方法基于用户探索的交互示意图。
图5为本发明一种产业融合度指数计算及可视化方法词云示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图4,本发明提供一种技术方案:一种产业融合度指数计算及可视化方法,步骤如下;
S10、产业融合数据获取与存储;S20、产业融合度指数计算;S30、基于多层次地图及词云的产业融合度可视化。
优选的,所述S10、产业融合数据获取与存储包括:
S101、制定宏观指数与微观指数涵盖的内容和范围,然后进行定时、增量数据爬取;
S102、数据清洗和去重后,采用Hadoop大数据平台实现产业融合数据的存储,通过关系数据库和Hadoop平台间双向转移技术,实现产业融合数据的使用。
具体的:应用网络爬虫技术,根据指数涵盖的范围,实时或定时自动采集指定网站的各产业相关企业信息、产品信息、专利信息、新闻信息、政策法规等内容,通过正则表达式进行内容解析,然后返回到服务器;这是一个增量过程,即对每个网站内容的爬取是增量的,从而避免重复爬取;提取爬取到内容的标题、关键字等对数据进行去重,然后通过缺失值、异常值查找确定问题数据,使用均值、相关值计算、删除严重异常数据以及人工补全的方式完成数据清洗;最后通过Hadoop平台及MySQL数据库进行存储,为大数据分析提供数据基础,处理流程如图2。
优选的,所述S20、产业融合度指数计算算法如下:
步骤一,假设原始数据矩阵A=(aij)m×n,运用变量规范化公式
Figure BSA0000215020420000051
对矩阵数据进行规范化处理;
步骤二,结合指标的权数,利用公式V=(vij)m×n=(wj×zij)m×n进行加权规范化处理;
步骤三,确定理想解V*和负理想解V-,其中:
Figure BSA0000215020420000052
Figure BSA0000215020420000053
步骤四,分别计算准则层各指标到理想解V*的距离和s*与负理想解V-的距离和s-,利用公式r=s-/(s-+s*)计算产业融合度指数r。
优选的,所述S30、基于多层次地图及词云的产业融合度可视化包括:S301、各省区市及地级城市在地图上,以行政区划(省-市-县)分级,采用视觉通道中优先级最高较高的形状和颜色来呈现,用颜色深浅来区分军民融合度指数大小;S302、根据描述融合度词频和重要性计算各关键词的权重,根据权重大小进行字体大小编码,字体越大表示该关键字权重更高,更能描述该地区的产业融合度,从而体现该地区的产业融合特点;S303、基于用户探索的交互,用户通过鼠标指向某行政区域,将在词云区视图上呈现该区域的融合度特点,同时采用钻取式探索,实现层级间的跳转交互。
具体的:所述S30、基于多层次地图及词云的产业融合度可视化包括S101、各省区市及地级城市在地图上,以行政区划(省-市-县)分级,采用视觉通道中优先级最高较高的形状和颜色来呈现,用颜色深浅来区分军民融合度指数大小;S102、根据描述融合度词频和重要性计算各关键词的权重,根据权重大小进行字体大小编码,字体越大表示该关键字权重更高,更能描述该地区的产业融合度,从而体现该地区的产业融合特点;S103、基于用户探索的交互,用户通过鼠标指向某行政区域,将在词云区视图上呈现该区域的融合度特点,同时采用钻取式探索,实现层级间的跳转交互。
各省市区及各地级城市的产业融合度指数数据映射到地图上,以视觉通道中优先级较高的形状和颜色来呈现,用颜色来区分融合度指数大小,各省市区整体采用暖色,背景采用冷色,根据各省市区产业融合度指数的不同,编码为不同的颜色,融合度越高,颜色越深(偏向红色),反之颜色越浅,如图3。
基于用户探索的交互,用户通过鼠标指向某行政区域,将在词云区视图上呈现该区域的融合度特点,同时采用钻取式探索实现层级间的跳转交互并更新词云区域,以保持用户探索区域和词云内容一致,如图4。
对某行政区域在产业融合相关政策、措施、通知等文本中出现频率较高的关键词予以视觉上的突出,形成关键词渲染,从而过滤掉大量的次要文本信息,生成的一幅图像;用户只要看一眼就能够明白该区域产业融合的特点或特征;在词云设计中,首先对抽取到的关键词进行修正,把人称代词、语气词、形容词等过滤掉,主要保留名词性的关键词,然后根据词频和重要性计算各关键词的权重,根据权重大小进行字体大小编码,字体越大表示该关键字权重更高,更能描述该地区的产业融合度,并体现该地区的军民融合特点或特征,同时以红白两种颜色,采用紧凑布局进行显示,如图5。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实例的说明只是用于帮助理解本发明的方法及其核心思想。以上所述仅是本发明的优选实施方式,应当指出,由于文字表达的有限性,而客观上存在无限的具体结构,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进、润饰或变化,也可以将上述技术特征以适当的方式进行组合;这些改进润饰、变化或组合,或未经改进将发明的构思和技术方案直接应用于其它场合的,均应视为本发明的保护范围。

Claims (4)

1.一种产业融合度指数计算及可视化方法,其特征在于:步骤如下;
S10、产业融合数据获取与存储;S20、产业融合度指数计算;S30、基于多层次地图及词云的产业融合度可视化。
2.根据权利要求1所述的方法,其特征在于:所述S10、产业融合数据获取与存储包括:
S101、制定宏观指数与微观指数涵盖的内容和范围,然后进行定时、增量数据爬取;
S102、数据清洗和去重后,采用Hadoop大数据平台实现产业融合数据的存储,通过关系数据库和Hadoop平台间双向转移技术,实现产业融合数据的使用。
3.根据权利要求1所述的方法,其特征在于:所述S20、产业融合度指数计算算法如下:
步骤一,假设原始数据矩阵A=(aij)m×n,运用变量规范化公式
Figure FSA0000215020410000011
对矩阵数据进行规范化处理;
步骤二,结合指标的权数,利用公式V=(vij)m×n=(wj×zij)m×n进行加权规范化处理;
步骤三,确定理想解V*和负理想解V-,其中:
Figure FSA0000215020410000012
Figure FSA0000215020410000013
步骤四,分别计算准则层各指标到理想解V*的距离和s*与负理想解V-的距离和s-,利用公式r=s-/(s-+s*)计算产业融合度指数r。
4.根据权利要求1所述方法,其特征在于:所述S30、基于多层次地图及词云的产业融合度可视化包括:S301、各省区市及地级城市在地图上,以行政区划(省-市-县)分级,采用视觉通道中优先级最高较高的形状和颜色来呈现,用颜色深浅来区分军民融合度指数大小;S302、根据描述融合度词频和重要性计算各关键词的权重,根据权重大小进行字体大小编码,字体越大表示该关键字权重更高,更能描述该地区的产业融合度,从而体现该地区的产业融合特点;S303、基于用户探索的交互,用户通过鼠标指向某行政区域,将在词云区视图上呈现该区域的融合度特点,同时采用钻取式探索,实现层级间的跳转交互。
CN202010734022.6A 2020-07-28 2020-07-28 一种产业融合度指数计算及可视化方法 Pending CN111861241A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010734022.6A CN111861241A (zh) 2020-07-28 2020-07-28 一种产业融合度指数计算及可视化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010734022.6A CN111861241A (zh) 2020-07-28 2020-07-28 一种产业融合度指数计算及可视化方法

Publications (1)

Publication Number Publication Date
CN111861241A true CN111861241A (zh) 2020-10-30

Family

ID=72947436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010734022.6A Pending CN111861241A (zh) 2020-07-28 2020-07-28 一种产业融合度指数计算及可视化方法

Country Status (1)

Country Link
CN (1) CN111861241A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765232A (zh) * 2021-01-05 2021-05-07 广东核电合营有限公司 核电厂重大设备的数据管理方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522359A (zh) * 2018-11-02 2019-03-26 大连瀚闻资讯有限公司 基于大数据的可视化产业分析方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522359A (zh) * 2018-11-02 2019-03-26 大连瀚闻资讯有限公司 基于大数据的可视化产业分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘宏亮: "基于TOPSIS法的区域农村一二三产业融合发展综合评价研究", 福建茶叶, vol. 42, no. 04, pages 102 - 103 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112765232A (zh) * 2021-01-05 2021-05-07 广东核电合营有限公司 核电厂重大设备的数据管理方法及系统
CN112765232B (zh) * 2021-01-05 2024-03-19 广东核电合营有限公司 核电厂重大设备的数据管理方法及系统

Similar Documents

Publication Publication Date Title
CN101685455B (zh) 数据检索的方法和系统
CN101630314B (zh) 一种基于领域知识的语义查询扩展方法
Archambault et al. ThemeCrowds: Multiresolution summaries of twitter usage
CN110941692A (zh) 互联网政治外交类新闻事件抽取方法
CN106909680A (zh) 一种基于知识组织语义关系的科技专家信息聚合方法
CA2545232A1 (en) Method and system for creating a taxonomy from business-oriented metadata content
KR20120054020A (ko) 시맨틱 트레이딩 플로어
CN111967761A (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
CN102163214A (zh) 一种数字地图生成装置及方法
CN110659357B (zh) 一种基于本体语义相似度的地理知识问答系统
CN105930470A (zh) 一种基于特征权重分析技术的文件检索方法
CN110245816B (zh) 基于浏览器历史记录的用户工作效率可视评估方法
CN103279458A (zh) 一种领域本体的构建及实例化方法
Qi et al. Culture under complex perspective: a classification for traditional chinese cultural elements based on nlp and complex networks
CN114510566A (zh) 基于工单的热词挖掘、分类和分析的方法和系统
CN115618014A (zh) 一种应用大数据技术的标准文献分析管理系统及方法
CN111861241A (zh) 一种产业融合度指数计算及可视化方法
CN115203337A (zh) 一种数据库元数据关系知识图谱生成方法
CN109460467B (zh) 一种网络信息分类体系构建方法
KR100855238B1 (ko) 범위 검색을 통하여 계층적으로 종속된 하위 특허 분류 기호에 관한 검색 결과를 자동으로 포함하도록 하는 검색 서비스 제공 방법 및 그 시스템
Qingjie et al. Research on domain knowledge graph based on the large scale online knowledge fragment
KR20120052147A (ko) 니치 평가 모델 생성 및 니치 기술 영역 평가 방법 및 그 시스템
Khademi et al. A review of approaches to solving the problem of BIM search: Towards intelligence-assisted design
Xiao et al. Research on the Construction of Cutting Edge Technology Monitoring System Based on Multi-Source Heterogeneous Data
Jiao et al. Global Urban Design Research from 2007 to 2017: a Systematic Research Review.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination