CN116049243A - 企业知识产权大数据情报分析系统、方法及存储介质 - Google Patents
企业知识产权大数据情报分析系统、方法及存储介质 Download PDFInfo
- Publication number
- CN116049243A CN116049243A CN202310025428.0A CN202310025428A CN116049243A CN 116049243 A CN116049243 A CN 116049243A CN 202310025428 A CN202310025428 A CN 202310025428A CN 116049243 A CN116049243 A CN 116049243A
- Authority
- CN
- China
- Prior art keywords
- data
- intellectual property
- enterprise
- module
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 48
- 238000004458 analytical method Methods 0.000 title claims description 45
- 238000012545 processing Methods 0.000 claims abstract description 84
- 238000011156 evaluation Methods 0.000 claims abstract description 81
- 238000013500 data storage Methods 0.000 claims abstract description 58
- 238000005516 engineering process Methods 0.000 claims description 69
- 238000007781 pre-processing Methods 0.000 claims description 22
- 230000006399 behavior Effects 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000011218 segmentation Effects 0.000 claims description 11
- 238000004140 cleaning Methods 0.000 claims description 9
- 238000002372 labelling Methods 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 230000009193 crawling Effects 0.000 claims description 5
- 238000013139 quantization Methods 0.000 claims description 4
- 238000011158 quantitative evaluation Methods 0.000 claims description 2
- 230000007812 deficiency Effects 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 28
- 238000010586 diagram Methods 0.000 description 16
- 238000011161 development Methods 0.000 description 11
- 230000018109 developmental process Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 230000008901 benefit Effects 0.000 description 8
- 238000013439 planning Methods 0.000 description 7
- 238000012216 screening Methods 0.000 description 5
- 238000011835 investigation Methods 0.000 description 4
- 238000012827 research and development Methods 0.000 description 4
- 238000012800 visualization Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 210000000026 apposition eye Anatomy 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/184—Intellectual property management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Tourism & Hospitality (AREA)
- Technology Law (AREA)
- Operations Research (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种企业知识产权大数据情报分析系统、方法、控制器及计算机存储介质,系统包括数据获取模块、数据处理模块、企业评测模块、数据存储模块和数据检索模块,其中,数据处理模块用于对预处理后的企业知识产权数据进行分类处理,得到知识产权标签数据,企业评测模块用于进行知识产权评估处理,得到知识产权评估数据,数据检索模块用于根据企业名称从数据存储模块中获取对应的知识产权标签数据和知识产权评估数据,本申请以知识产权大数据作为基点进行数据加工,解决传统检索方式中的高分散性及信息缺失的问题,便于用户高效获取知识产权相关信息,并从企业专利价值与科技力的角度评测企业的数据,为用户进行重大决策提供数据支撑。
Description
技术领域
本申请涉及同步带传动结构技术领域,具体涉及一种企业知识产权大数据情报分析系统、企业知识产权大数据情报分析方法、控制器及计算机存储介质。
背景技术
随着信息技术的发展,大数据在金融场景下的应用越发优势,而在知识产权强国建设战略下,国家日益强调创新、硬科技的发展,越来越多企业投入到科技创新中,知识产权是企业创新成果转化的结果,也是企业持续经营、增长的动力。对于投资人来说,科技型企业的知识产权实力情况能够反映企业的技术水平,并直接关系到企业的发展效益,影响投资人的利益;
故当前发展趋势中,存在着有别于传统中过分依赖线下方式,而利用大数据技术将企业的知识产权信息、工商信息、融资历史情报、舆情等情报信息深度融合、关联分析后,进行项目筛选、风险评估、投资决策、政策制定的强烈需求;
然而现有技术中,进行科创企业及其所在行业的重大决策需要对广泛、丰富的情报进行挖掘及分析,而通常知识产权大数据信息量庞大,商情、舆情等数据具有分散性及噪音较大的特性,导致传统的检索方法存在提取有效信息耗时长、效率低,检索结果查全率低,同时多样复杂的数据之间的直接关联性低,使得检索所得的信息分散性较大,需要用户额外花费时间与精力进行数据二次分类、筛选及处理后才有一定的使用价值,影响用户获取知识产权相关信息的效率。
发明内容
本申请实施例提供一种企业知识产权大数据情报分析系统、企业知识产权大数据情报分析方法、控制器及计算机存储介质,至少能保证,本申请方案通过数据获取模块、数据处理模块、企业评测模块、数据存储模块和数据检索模块,进行企业知识产权大数据情报分析处理,以知识产权大数据作为基点进行数据加工,解决传统检索方式中的高分散性及信息缺失的问题,便于用户高效获取知识产权相关信息,并从企业专利价值与科技力的角度评测企业的数据,为用户进行重大决策提供数据支撑。
第一方面,本申请实施例提供了一种企业知识产权大数据情报分析系统,所述系统包括数据获取模块、数据处理模块、企业评测模块、数据存储模块和数据检索模块:
所述数据获取模块用于获取企业知识产权数据;
所述数据处理模块用于对所述企业知识产权数据进行预处理,并对预处理后的所述企业知识产权数据进行分类处理,得到知识产权标签数据;
所述企业评测模块用于根据所述企业知识产权数据进行知识产权评估处理,得到知识产权评估数据;
所述数据存储模块用于存储所述知识产权标签数据和所述知识产权评估数据;
所述数据检索模块用于根据企业名称从所述数据存储模块中获取对应的所述知识产权标签数据和所述知识产权评估数据。
在一些实施例中,所述企业知识产权数据包括第三方提供数据和爬虫抓取数据,
所述数据获取模块用于从数据第三方获取所述第三方提供数据,从知识产权公开网页获取所述爬虫抓取数据,并将所述第三方提供数据和所述爬虫抓取数据存储于所述数据存储模块,
所述第三方提供数据和所述爬虫抓取数据包括企业的知识产权信息、工商注册信息、投融资信息和知识产权风险信息。
在一些实施例中,所述数据处理模块包括数据清洗子模块、数据预处理子模块、数据转化子模块、数据分类子模块和数据标签子模块,
所述数据清洗子模块用于从所述数据存储模块中得到所述企业知识产权数据,并对所述企业知识产权数据进行噪音去除处理,得到知识产权文本数据;
所述数据预处理子模块用于对所述知识产权文本数据进行文本切分处理,得到多个知识产权关键词数据;
所述数据转化子模块用于对所述知识产权关键词数据进行向量化处理,得到多个特征向量;
所述数据分类子模块用于根据多个所述特征向量对所述企业知识产权数据进行分类处理,得到分类结果;
所述数据标签子模块用于根据所述分类结果得到企业对应的知识产权标签数据,并将所述知识产权标签数据存储于所述数据存储模块。
在一些实施例中,所述企业评测模块包括专利估值子模块、企业科技力子模块和企业技术相似度子模块,
所述专利估值子模块用于根据所述知识产权标签数据和所述企业知识产权数据,对企业专利价值进行量化评估处理,得到企业的专利估值,并将所述专利估值存储于所述数据存储模块;
所述企业科技力子模块用于根据所述知识产权标签数据和所述企业知识产权数据,对企业科技水平进行量化评分处理,得到企业的科技评分,并将所述科技评分存储于所述数据存储模块;
所述企业技术相似度子模块用于根据多个所述知识产权标签数据和多个所述企业知识产权数据,对多个企业专利文档相似度进行数值量化处理,得到多个企业间的技术相似度,并将所述技术相似度存储于所述数据存储模块。
在一些实施例中,所述数据存储模块存储有与多个企业对应的多个企业信用代码,所述企业信用代码各自对应的专利信息包括所述企业知识产权数据、所述知识产权标签数据、所述专利估值、所述科技评分和所述技术相似度,
所述数据检索模块用于根据企业名称从所述数据存储模块中获取对应的所述企业信用代码,并根据所述企业信用代码获取所述专利信息。
在一些实施例中,所述系统还包括用户行为记录模块,
所述用户行为记录模块用于记录所述数据检索模块中检索过的企业名称,以使所述数据检索模块根据检索过的企业名称获取所述专利信息。
在一些实施例中,所述系统还包括数据下载模块,
所述数据下载模块用于对所述专利信息进行数据下载处理,得到专利信息数据,并以预设形式显示所述专利信息数据,所述预设格式包括文字、图表、数据和表格。
第二方面,本申请实施例提供了一种企业知识产权大数据情报分析方法,所述企业知识产权大数据情报分析方法应用于企业知识产权大数据情报分析系统,所述系统包括数据获取模块、数据处理模块、企业评测模块、数据存储模块和数据检索模块,所述方法包括:
通过所述数据获取模块获取企业知识产权数据;
通过所述数据处理模块对所述企业知识产权数据进行预处理,并对预处理后的所述企业知识产权数据进行分类处理,得到知识产权标签数据;
通过所述企业评测模块根据所述企业知识产权数据进行知识产权评估处理,得到知识产权评估数据;
通过所述数据存储模块存储所述知识产权标签数据和所述知识产权评估数据;
通过所述数据检索模块根据企业名称从所述数据存储模块中获取对应的所述知识产权标签数据和所述知识产权评估数据。
第三方面,本申请实施例提供了一种控制器,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第二方面中任意一项实施例所述的企业知识产权大数据情报分析方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令用于执行如第二方面中任意一项实施例所述的企业知识产权大数据情报分析方法。
本申请至少具有以下有益效果:所述系统包括数据获取模块、数据处理模块、企业评测模块、数据存储模块和数据检索模块:所述数据获取模块用于获取企业知识产权数据;所述数据处理模块用于对所述企业知识产权数据进行预处理,并对预处理后的所述企业知识产权数据进行分类处理,得到知识产权标签数据;所述企业评测模块用于根据所述企业知识产权数据进行知识产权评估处理,得到知识产权评估数据;所述数据存储模块用于存储所述知识产权标签数据和所述知识产权评估数据;所述数据检索模块用于根据企业名称从所述数据存储模块中获取对应的所述知识产权标签数据和所述知识产权评估数据,通过本申请的企业知识产权大数据情报分析系统,以知识产权大数据作为基点,融汇知识产权信息、企业工商注册数据信息、企业投融资信息、舆情、诉讼情报等海量多元情报后对数据加工,解决传统检索方式中的高分散性及信息缺失的问题;其次,对企业的具体行为、历史记录进行标签化后抽象化处理,实现企业信息的可视化,直观地为用户刻画以知识产权作为主视角的多元化的企业画像;同时,用大数据的思维高效准确地为广义投资者,银行、政府职能部门、园区、科技公司的锁定潜在投资标的、投资标的或贷款企业尽调、投资决策、招商引资、产业集群规划、政策制定、实时掌握竞对技术动态,提供数据支持及决策参考,便于用户高效获取知识产权相关信息,并从企业专利价值与科技力的角度评测企业的数据,为用户进行重大决策提供数据支撑。
附图说明
图1为本申请一实施例提出的企业知识产权大数据情报分析系统的模块示意图;
图2为本申请一实施例提出的企业知识产权大数据情报分析系统中,数据获取模块的模块示意图;
图3为本申请一实施例提出的企业知识产权大数据情报分析系统中,数据处理模块模块的模块示意图;
图4为本申请一实施例提出的企业知识产权大数据情报分析系统中,数据处理模块模块进行数据处理的示意图;
图5为本申请一实施例提出的企业知识产权大数据情报分析系统中,企业评测模块的模块示意图;
图6为本申请另一实施例提出的企业知识产权大数据情报分析方法的流程图;
图7为本申请另一实施例提出的企业知识产权大数据情报分析方法的实例图;
图8为本申请另一实施例提出的控制器的结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
在一些实施例中,虽然在系统示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于系统中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语第一、第二等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
随着相关政策的提出,知识产权发展被提升到国家战略,引导加大科技创新,从强调技术引进和消化向强调自主创新和自主研发转变,加快关键核心技术攻关,解决“卡脖子”问题,减少对国际市场的过度依赖,增强国家的科技安全为当前技术发展的重要问题。
政府有关创新产业及其产业集群等支持、引导的政策制定,需要统筹相关的信息。传统的信息统筹,不同地区不同部门的一线,以公开资料收集,要求企业填报,上门收集信息等方式,存在着效率低、人力成本高的缺点,以及信息零碎散乱易遗漏的风险;随着信息技术的发展,大数据在金融场景下的应用越发优势。出资方机构、政策制定部门能够运用大数据技术能收集海量的数据,并将其关联分析,形成更高层次的洞察视角,缩小甚至消除融资方与出资方的信息不对称,提高效率、降低成本、提高风险可控性。
在知识产权强国建设战略下,国家日益强调创新、硬科技的发展,越来越多企业投入到科技创新中,政府也引导投融资人、银行等金融机构支持科技型企业。在投资、贷款决策过程中,出资方除了关注企业的经营、财务、管理等内部状态,也关注关联公司、客户等外部产业链状况,更是关注企业的研发体系、知识产权、技术团队等创新相关情报信息;知识产权是企业创新成果转化的结果,也是企业持续经营、增长的动力。对于投资人来说,科技型企业的知识产权实力情况能够反映企业的技术水平,并直接关系到企业的发展效益,影响投资人的利益;政府也积极推广知识产权质押获得债权融资。对于银行来说,企业的知识产权的实力情况能够映射企业的持续经营能力,知识产权能作为质押标的。
综上,进行科创型投资标的选择、科技型企业的金融支持、精准扶持科技型企业规划及政策制定等重大决策需要对广泛、丰富的科创类情报进行挖掘及分析。科创类情报涵盖知识产权信息、商情、舆情等数据。知识产权信息,具有客观有效及不可篡改等属性,是决策有利的参考基础,政府、银行、投资人在知识产权强国建设的战略下,对于有别于传统中过分依赖线下方式,而利用大数据技术将企业的知识产权信息、工商信息、融资历史情报、舆情等情报信息深度融合、关联分析后,进行项目筛选、风险评估、投资决策、政策制定的强烈需求。
然而,通常知识产权大数据信息量庞大,商情、舆情等数据具有分散性及噪音较大的特性。导致传统的检索方法存在提取有效信息耗时长、效率低,检索结果查全率低。同时多样复杂的数据之间的直接关联性低,使得检索所得的信息分散性较大,需要用户额外花费时间与精力进行数据二次分类、筛选及处理后才有一定的使用价值。
为至少解决上述问题,本申请公开了一种企业知识产权大数据情报分析系统、企业知识产权大数据情报分析方法、控制器及计算机存储介质,其中,本申请方案通过数据获取模块、数据处理模块、企业评测模块、数据存储模块和数据检索模块进行企业知识产权大数据情报分析:数据获取模块用于获取企业知识产权数据;数据处理模块用于对企业知识产权数据进行预处理,并对预处理后的企业知识产权数据进行分类处理,得到知识产权标签数据;企业评测模块用于根据企业知识产权数据进行知识产权评估处理,得到知识产权评估数据;数据存储模块用于存储知识产权标签数据和知识产权评估数据;数据检索模块用于根据企业名称从数据存储模块中获取对应的知识产权标签数据和知识产权评估数据,通过本申请的企业知识产权大数据情报分析系统,以知识产权大数据作为基点,融汇知识产权信息、企业工商注册数据信息、企业投融资信息、舆情、诉讼情报等海量多元情报后对数据加工,解决传统检索方式中的高分散性及信息缺失的问题;其次,对企业的具体行为、历史记录进行标签化后抽象化处理,实现企业信息的可视化,直观地为用户刻画以知识产权作为主视角的多元化的企业画像;同时,用大数据的思维高效准确地为广义投资者,银行、政府职能部门、园区、科技公司的锁定潜在投资标的、投资标的或贷款企业尽调、投资决策、招商引资、产业集群规划、政策制定、实时掌握竞对技术动态,提供数据支持及决策参考,便于用户高效获取知识产权相关信息,并从企业专利价值与科技力的角度评测企业的数据,为用户进行重大决策提供数据支撑。
下面结合附图,对本申请实施例作进一步描述。
参考图1,图1为本申请一实施例提出的企业知识产权大数据情报分析系统的模块示意图,本申请实施例提供了一种企业知识产权大数据情报分析系统,系统包括数据获取模块、数据处理模块、企业评测模块、数据存储模块和数据检索模块:数据获取模块用于获取企业知识产权数据;数据处理模块用于对企业知识产权数据进行预处理,并对预处理后的企业知识产权数据进行分类处理,得到知识产权标签数据;企业评测模块用于根据企业知识产权数据进行知识产权评估处理,得到知识产权评估数据;数据存储模块用于存储知识产权标签数据和知识产权评估数据;数据检索模块用于根据企业名称从数据存储模块中获取对应的知识产权标签数据和知识产权评估数据。
在一些实施例中,系统还包括用户行为记录模块,用户行为模块用于标识用户的检索记录等信息,并存储至数据库,用户行为记录模块用于记录数据检索模块中检索过的企业名称,以使数据检索模块根据检索过的企业名称获取专利信息。
在一些实施例中,系统还包括数据下载模块,数据下载模块用于将目标企业的知识产权大数据以电子报告的形式下载,数据下载模块用于对专利信息进行数据下载处理,得到专利信息数据,并以预设形式显示专利信息数据,预设格式包括文字、图表、数据和表格。
在一些实施例中,通过本申请提出的数据获取模块、数据处理模块、企业评测模块、数据存储模块、数据检索模块、用户行为记录模块和数据下载模块,本申请能有效的进行知识产权大数据的挖掘与分析,融汇商情、舆情、诉讼等数据,提供一种企业知识产权大数据情报分析系统,对企业的专利价值和科技实力进行量化评测,以此预测企业科技发展潜力和市场价值;获取赛道领域排名,精确锁定所检索企业的技术直接对标企业,为广义投资者,银行、政府职能部门、园区、科技公司的锁定潜在投资标的、投资标的或贷款企业尽调、投资决策、招商引资、产业集群规划、政策制定、实时掌握竞对技术动态提供数据支持及决策参考。
在一些实施例中,在现有技术中进行科创企业及其所在行业的重大决策需要对广泛、丰富的情报进行挖掘及分析,而通常知识产权大数据信息量庞大,商情、舆情等数据具有分散性及噪音较大的特性。导致传统的检索方法存在提取有效信息耗时长、效率低,检索结果查全率低。同时多样复杂的数据之间的直接关联性低,使得检索所得的信息分散性较大,需要用户额外花费时间与精力进行数据二次分类、筛选及处理后才有一定的使用价值,参考图1,本申请通过提供一种企业知识产权大数据情报分析系统,便于用户高效获取从企业专利价值与科技力的角度评测企业的数据,为用户进行重大决策提供数据支撑。
具体的,参考图1,数据获取模块获取企业知识产权数据,并将企业知识产权数据传输至数据处理模块,数据处理模块将对企业知识产权数据进行预处理,并对预处理后的企业知识产权数据进行分类处理,得到知识产权标签数据,将知识产权标签数据存储在数据存储模块中,同时将知识产权标签数据发送给企业评测模块,企业评测模块根据知识产权标签数据进行知识产权评估处理,得到知识产权评估数据,将知识产权评估数据存储在数据存储模块中;此时,数据检索模块可以根据数据存储模块中的知识产权标签数据和知识产权评估数据进行检索,获取检索的企业名称对应的知识产权标签数据和知识产权评估数据,数据下载模块可以为用户下载企业名称对应的知识产权标签数据和知识产权评估数据,用户行为记录模块可以将检索的企业名称作为数据记录存储在数据存储模块中,以使数据检索模块根据检索过的企业名称获取专利信息,进而便于用户高效获取知识产权相关信息,并从企业专利价值与科技力的角度评测企业的数据,为用户进行重大决策提供数据支撑。
在一些实施例中,数据存储模块用于存储执行标签工程后的企业及其对应的知识产权情报数据,数据存储模块存储有与多个企业对应的多个企业信用代码,企业信用代码各自对应的专利信息包括企业知识产权数据、知识产权标签数据、专利估值、科技评分和技术相似度,信用代码为企业的ID,其他信息作为标签的形式添加到企业的属性内,使本申请系统以企业的名称作为检索的条件,企业的信用代码作为企业信息调取的索引条件,分类标签、企业技术相似度等内容作为企业的详情信息展示。
在一些实施例中,本申请系统以展示企业的知识产权信息数据为检索目标,所以检索条件为企业名称,用户选择企业全称,企业全称关联信用代码,索引处企业的信息,并运算企业的专利价值及科技实力。
参考图2,图2为本申请一实施例提出的企业知识产权大数据情报分析系统中,数据获取模块的模块示意图,在一些实施例中,企业知识产权数据包括第三方提供数据和爬虫抓取数据,数据获取模块用于从数据第三方获取第三方提供数据,从知识产权公开网页获取爬虫抓取数据,并将第三方提供数据和爬虫抓取数据存储于数据存储模块,第三方提供数据和爬虫抓取数据包括企业的知识产权信息、工商注册信息、投融资信息和知识产权风险信息。
具体的,数据获取模块用于采集数据,用于从数据第三方导入第三方提供数据,从知识产权公开网页爬取爬虫抓取数据,即包括从第三方提供的数据信息,或利用网络爬虫技术从公开网页抓取的数据信息。
其中,数据第三方,即第三方提供的数据信息来源包括国家知识产权局知识产权出版社、国家工商局企业注册信用信息提供方、企查查、爱企查和天眼查。
其中,知识产权公开网页,即从公开网页抓取的数据信息来源包括中国政府网、各地方政府网、企业官方网址、北京证券交易所官网、上海证券交易所官网、深圳证券交易所官网、中国审判流程信息公开网、线上论坛、舆情引擎。
在一些实施例中,数据信息包括企业的知识产权信息、工商注册信息、企业投融资信息、企业知识产权风险信息;知识产权信息包括企业的专利信息、软著信息、商标信息、知识产权获取、知识产权维护、知识产权运用、发明人团队、获奖情况、联合研发情况等信息;工商注册信息包括公司名称、曾用名、企业logo、法人名称、成立日期、企业状态、注册资本、企业地址、网站地址、社会统一信息社会代码、纳税人识别号、经营范围等信息;企业投融资信息包括企业历轮融资时间、融资金额、投资方、轮次对应的估值等信息;企业知识产权风险信息包括诉讼事件、知识产权许可事件、知识产权变更事件、知识产权质押事件、知识产权丧失等信息。
参考图3,图3为本申请一实施例提出的企业知识产权大数据情报分析系统中,数据处理模块模块的模块示意图,在一些实施例中,数据处理模块包括数据清洗子模块、数据预处理子模块、数据转化子模块、数据分类子模块和数据标签子模块,数据清洗子模块用于从数据存储模块中得到企业知识产权数据,并对企业知识产权数据进行噪音去除处理,得到知识产权文本数据;数据预处理子模块用于对知识产权文本数据进行文本切分处理,得到多个知识产权关键词数据;数据转化子模块用于对知识产权关键词数据进行向量化处理,得到多个特征向量;数据分类子模块用于根据多个特征向量对企业知识产权数据进行分类处理,得到分类结果;数据标签子模块用于根据分类结果得到企业对应的知识产权标签数据,并将知识产权标签数据存储于数据存储模块。
在一些实施例中,数据处理模块的数据流向如图3所示,数据处理模块包括以下子模块:数据清洗、数据预处理、数据转化、数据分类、数据计算、数据标签;数据清洗子模块用于去除文本数据中的噪音内容。去除文本数据中的噪音内容是指通过有效内容与噪音内容的区分性特征,去除广告、二次链接、导航、目录菜单等噪音信息;数据预处理子模块用于切分文本数据。切分文本数据是指将粗颗粒度的文本通过切分技术转化为细颗粒度的文本数据,并通过技术去除噪音内容,如通识常用词、数字及标点符号;数据转化子模块用于将原始数据变换为可用于向量计算的数据格式,将文本数据转化为数值形式的向量化数据,这些向量化数据将指定为每篇文档中的特征向量;数据分类子模块用于将数据分类;数据标签工程子模块用于将标签添加至企业。
参考图4,图4为本申请一实施例提出的企业知识产权大数据情报分析系统中,数据处理模块模块进行数据处理的示意图,在一些实施例中,本申请通过去噪音技术和分词技术,进行从知识产权公开网页获取爬虫抓取数据,并对爬虫抓取数据进行数据清洗和数据预处理的过程。
在一些实施例中,去噪音技术应用于由网络爬取数据,从目标网页页面中提取所需信息,进行数据清洗,去除非所需信息的过程。具体过程如下:
1)爬取网页页面,解码后演绎为可读的形式,去除页面中的脚本、注释;
2)将网页页面解析成不同的部分及其对应的代码。网页页面一般包括头部信息,指修饰网页的原数据,如角标、logo等信息;骨架内容,包含文字段落、图片等信息,如图4所示;
3)分析所需信息的信息特征,如信息形式、文本长度、文本路径长度特征;
4)依据信息特征,截取包含所需信息的片段。
在一些实施例中,分词技术应用于数据预处理过程中进行拆分字符串,筛选有效字符串、去除无效信息字符串,选取关键词形成特征信息作为标签;分词环节中,去除字符串中的标点、数字、字母后,结合开源分词工具,如哈工大LTP、中科院计算所NLPIR、清华大学THULAC和jieba,将目标文本从长字符串拆分为短字符串。拆分的逻辑是将长字符串组合进一步拆分为相同长度的字符串,匹配词典中的词语。若该字符串与词典中的词语一致,则认为匹配成功,提取该词作为待筛选字符串集合中。不断改变拆分字符串的长度,直至所有拆分长度计算完毕,形成待筛选字符串集合。
在一些实施例中,去除无效信息字符串环节中,除去常见的停用词语和特定文本中常用词语;去除常见停用词语是通过网络下载不同的常见停用词表,将待筛选字符串集合匹配常见停用词表,若匹配不成功,则提取该字符串作为关键词集合A,该关键词集合A用于上述实施例提出的数据转化过程,根据关键词进行向量化,得到特征向量。
参考图5,图5为本申请一实施例提出的企业知识产权大数据情报分析系统中,企业评测模块的模块示意图,企业评测模块用于计算专利估值、企业科技力、企业技术相似度,分别应用在系统的不同功能模块,在一些实施例中,企业评测模块包括专利估值子模块、企业科技力子模块和企业技术相似度子模块,专利估值子模块用于根据知识产权标签数据和企业知识产权数据,对企业专利价值进行量化评估处理,得到企业的专利估值,并将专利估值存储于数据存储模块;企业科技力子模块用于根据知识产权标签数据和企业知识产权数据,对企业科技水平进行量化评分处理,得到企业的科技评分,并将科技评分存储于数据存储模块;企业技术相似度子模块用于根据多个知识产权标签数据和多个企业知识产权数据,对多个企业专利文档相似度进行数值量化处理,得到多个企业间的技术相似度,并将技术相似度存储于数据存储模块。
在一些实施例中,专利估值子模块用于利用算法模型对企业拥有的有权有效专利进行量化评估,包括得分与估值;企业科技力评分子模块用于利用算法模型对于企业整体科技实力进行量化评分;在同技术领域中对得分排序。技术领域是依据国际专利分类方式(IPC)划分,同技术领域指企业拥有数量最多的专利所属的IPC分类;技术相似度子模块用于对照企业间专利文档的相似度并输出数值表达。专利文档包括但不限于专利标题、专利摘要、专利说明书。
参考图6,图6为本申请另一实施例提出的企业知识产权大数据情报分析方法的流程图,在一些实施例中,本申请实施例提供了一种企业知识产权大数据情报分析方法,企业知识产权大数据情报分析方法应用于企业知识产权大数据情报分析系统,系统包括数据获取模块、数据处理模块、企业评测模块、数据存储模块和数据检索模块,方法包括但不限于有以下步骤S610、步骤S620、步骤S630、步骤S640和步骤S650;
步骤S610,通过数据获取模块获取企业知识产权数据;
步骤S620,通过数据处理模块对企业知识产权数据进行预处理,并对预处理后的企业知识产权数据进行分类处理,得到知识产权标签数据;
步骤S630,通过企业评测模块根据企业知识产权数据进行知识产权评估处理,得到知识产权评估数据;
步骤S640,通过数据存储模块存储知识产权标签数据和知识产权评估数据;
步骤S650,通过数据检索模块根据企业名称从数据存储模块中获取对应的知识产权标签数据和知识产权评估数据。
在一些实施例中,通过上述步骤S610至步骤S650,本申请以知识产权大数据作为基点,融汇知识产权信息、企业工商注册数据信息、企业投融资信息、舆情、诉讼情报等海量多元情报后对数据加工,解决传统检索方式中的高分散性及信息缺失的问题;其次,对企业的具体行为、历史记录进行标签化后抽象化处理,实现企业信息的可视化,直观地为用户刻画以知识产权作为主视角的多元化的企业画像;同时,用大数据的思维高效准确地为广义投资者,银行、政府职能部门、园区、科技公司的锁定潜在投资标的、投资标的或贷款企业尽调、投资决策、招商引资、产业集群规划、政策制定、实时掌握竞对技术动态,提供数据支持及决策参考,便于用户高效获取知识产权相关信息,并从企业专利价值与科技力的角度评测企业的数据,为用户进行重大决策提供数据支撑。
参考图7,图7为本申请另一实施例提出的企业知识产权大数据情报分析方法的实例图,企业知识产权大数据情报分析包括以下步骤:
1)数据获取步骤,获取企业相关的数据情报信息;
2)数据处理步骤,包括数据清洗、数据预处理、数据转化、数据分类、数据标签;
3)情报分析步骤,通过专利估值、科技力评分、赛道领域排名、技术竞争对手多角度综合评价企业的科技能力;
4)信息存储步骤,存储经历标签工程后的知识产权大数据;
5)数据检索步骤,利用企业名称索引数据库中的知识产权大数据情报;
6)用户行为记录步骤,记录用户检索记录,并存储到数据库;
7)数据下载步骤,对指定企业的知识产权大数据情报分析结果以报告的形式下载,其中通过上述步骤,本申请以知识产权大数据作为基点进行数据加工,解决传统检索方式中的高分散性及信息缺失的问题,便于用户高效获取知识产权相关信息,并从企业专利价值与科技力的角度评测企业的数据,为用户进行重大决策提供数据支撑。
在一些实施例中,本申请企业知识产权大数据情报分析系统包括1)数据获取、数据预处理环节与情报分析环节、2)数据检索环节、3)用户行为记录环节和4)数据下载环节,具体实施过程如下:
1)数据获取、数据预处理环节与情报分析环节(对应数据获取模块、数据处理模块、数据存储模块和企业评测模块):数据获取包括从第三方提供的数据信息,或利用网络爬虫技术从公开网页抓取的数据信息;第三方提供的数据信息来源包括国家知识产权局知识产权出版社、国家工商局企业注册信用信息提供方、企查查、爱企查和天眼查。从公开网页抓取的数据信息来源包括中国政府网、各地方政府网、企业官方网址、北京证券交易所官网、上海证券交易所官网、深圳证券交易所官网、中国审判流程信息公开网、线上论坛、舆情引擎。数据信息包括企业的知识产权信息、工商注册信息、企业投融资信息、企业知识产权风险信息;知识产权信息包括企业的专利信息、软著信息、商标信息、知识产权获取、知识产权维护、知识产权运用、发明人团队、获奖情况、联合研发情况等信息;工商注册信息包括公司名称、曾用名、企业logo、法人名称、成立日期、企业状态、注册资本、企业地址、网站地址、社会统一信息社会代码、纳税人识别号、经营范围等信息;企业投融资信息包括企业历轮融资时间、融资金额、投资方、轮次对应的估值等信息;企业知识产权风险信息包括诉讼事件、知识产权许可事件、知识产权变更事件、知识产权质押事件、知识产权丧失等信息。
数据获取过程包括,第三方提供的数据直接录入系统,或利用java程序将结构化的Excel数据表导入数据库中;或利用接口调用第三方数据的数据并解析提取到数据库中;从网页抓取的数据信息通过爬虫技术抓取,并将抓取的页面信息经以下方式处理后存入数据库中。
在获取企业知识产权数据,并存储在数据存储模块的过程中,将网页页面中的企业知识产权数据解析解码成可读的形式,去除页面中的脚本、注释;将网页页面中的企业知识产权数据解析成不同的部分及其对应的代码,其中,网页页面一般包括头部信息,指修饰网页的原数据,如角标、logo等信息;骨架内容,包含文字段落、图片等信息;同时识别企业知识产权数据中有用信息、噪音信息的特征区别,依据特征区别,提取有效信息,去除噪音信息。
具体的,爬取的网页页面中,所需信息(或形容为”有用信息“)一般展示在网页骨架内容中,以文字形式存在。非所需信息(”噪音信息“)一般在网页的头部信息中,如网页菜单栏、导航栏、广告、推荐外部链接、依据算法展示的相似内容链接等,分布在网页的四侧,以图片、音频、带链接文字等形式存在。
有用信息与噪音信息特征存在区别:
a)存在形式特征:有用的信息一般以文字的形式存在,噪音信息以图片、音频、带链接文字等形式存在;
b)文本长度:有用信息的文本长度比噪音信息的文本长度更长;
c)文本标点特征:有用信息的文本含有标点比噪音信息含有的标点更多;
d)存储位置路径:有用信息存储特定的固定位置,噪音信息存储于非特定的位置。
具体的,依据有用信息和噪音信息特征的差异,区分二者,通过截取有用信息,达到去噪音的效果。例如,在对标企业详情中,展示的上市企业的市值、市盈率等行情数据,从公开网页中爬取。市值、市盈率均以数字的文本形式展示,从不同上市企业对应的不同的网页中,截取相同位置,字符串长度形似的信息。
导入/提取到数据库的信息,使用分词技术对数据预处理。;分词技术在去除字符串中的标点、数字、字母后,将目标文本从长字符串拆分为短字符串。通过下载不同的开源词典,建立一个可视为“足够丰富”的词典。将长字符串组合进一步拆分为相同长度的字符串,匹配词典中的词语。若该字符串与词典中的词语一致,则认为匹配成功,提取该词作为待筛选字符串集合中。不断改变拆分字符串的长度,直至所有拆分长度计算完毕。形成待筛选字符串集合。
具体的,从网络下载哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表等常见停用词表,整合建立为一个常见停用集合表,包括如“的”、“得”、“地”、“你”、“我”、“他”、“是“、”不是“。将待筛选字符串集合匹配常见停用集合表,提取匹配不成功的字符串,组成关键词集合A,并使用决策树、NaNve NaNeN、K近邻、集成模型等分类器对关键词集合中的数据分类,并形成标签;进而将信息赋予数据分类子模块,信息分类为不同的类目和基于类目层级的标签,以企业的信用代码作为基本属性,将该些标签按照类目,添加到企业属性中,添加标签后的企业数据,存储在数据库中;同时,依据估值或评分模型,调用企业的标签数据后计算,将计算结果以标签,添加到企业属性中。
2)数据检索环节(对应数据检索模块):用户可以通过输入企业名称检索词进行模糊检索,或输入企业全称进行准确检索。
具体的,当用户输入企业名称检索词时,系统会从数据库中搜索与检索词对应或相近的企业名称。若数据库存在与用户检索词对应的企业名称,系统将企业名称返回给用户;若数据库中不存在与用户检索词对应的企业名称,系统从数据库检索与检索词相近的企业名称,并计算系统搜索的关键词与用户检索词的相近度,当相近度高于预设值,则返回企业名称列表给用户。反之,则不返回企业名称列表给用户。
具体的,用户点击列表中的企业名称后,进入信息展示页面实现在线浏览。信息展示的形式多种多样,包括但不限于文字、数字、表格、图表、外部信息链接。其中,图表的展示形式包括但不限于数据可视化工具制作的柱状图、折线图、饼状图、散点图、热力图、数据集、雷达图、矩形树图、词云图、树图等。
3)用户行为记录环节(对应用户行为记录模块):为了便利用户交互,减少重复输入企业名称检索词,系统记录用户的最近查询的企业全称;同时,用户查询企业数据后,系统将自动记录该查询记录。当用户再次选择检索框时,系统将调用该用户的查询企业记录,以列表形式展示用户最近10项查询企业全称供用户选择。用户可选择输入企业名称检索词或在列表中选择。
4)数据下载环节(对应数据下载模块):用户可通过数据下载模块将系统中相关企业信息的专利信息(企业知识产权数据、知识产权标签数据、专利估值、科技评分和技术相似度)下载,包括不限于文字、图表、数据、表格等内容。当用户下达下载指令后,同时,系统将执行生成《中国企业专利价值评估与科技力评测报告》任务,根据专利信息生成“中国企业专利价值评估与科技力评测报告”,为用户实现在线预览报告。用户通过”导出“指令,将企业信息以pdf的数据格式下载。
在一些实施例中,本申请将知识产权大数据情报分析系统作为整体,对企业的专利价值和科技实力进行量化评测,以此预测企业科技发展潜力和市场价值;获取赛道领域排名,精确锁定所检索企业的技术直接对标企业,应用于锁定潜在投资标的、投资标的或贷款企业尽调、投资决策、招商引资、产业集群规划、政策制定、实时掌握竞对技术动态,且本申请中的企业知识产权大数据情报分析系统以可执行的软件形式存储在存储介质中,具备以下有益效果,以知识产权大数据作为基点,融汇知识产权信息、企业工商注册数据信息、企业投融资信息、舆情、诉讼情报等海量多元情报后对数据加工,解决传统检索方式中的高分散性及信息缺失的问题;对企业的具体行为、历史记录进行标签化后抽象化处理,实现企业信息的可视化,直观地为用户刻画以知识产权作为主视角的多元化的企业画像;用大数据的思维高效准确地为广义投资者,银行、政府职能部门、园区、科技公司的锁定潜在投资标的、投资标的或贷款企业尽调、投资决策、招商引资、产业集群规划、政策制定、实时掌握竞对技术动态。提供数据支持及决策参考。
参考图8,图8是本申请实施例提供的控制器的结构示意图。
本申请的一些实施例提供了一种控制器,控制器包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任意一项实施例的企业知识产权大数据情报分析方法,例如,执行以上描述的图6中的方法步骤S610至步骤S650。
本申请实施例的控制器800包括一个或多个处理器810和存储器820,图8中以一个处理器810及一个存储器820为例。
处理器810和存储器820可以通过总线或者其他方式连接,图8中以通过总线连接为例。
存储器820作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器820可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。
在一些实施方式中,存储器820可选包括相对于处理器810远程设置的存储器820,这些远程存储器可以通过网络连接至控制器800,同时,上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
在一些实施例中,处理器执行计算机程序时按照预设间隔时间执行上述任意一项实施例的企业知识产权大数据情报分析方法。
本领域技术人员可以理解,图8中示出的系统结构并不构成对控制器800的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
在图8所示的控制器800中,处理器810可以用于调用存储器820中储存的企业知识产权大数据情报分析方法,从而实现企业知识产权大数据情报分析方法。
基于上述控制器800的硬件结构,提出本申请的企业知识产权大数据情报分析系统的各个实施例,同时,实现上述实施例的企业知识产权大数据情报分析方法所需的非暂态软件程序以及指令存储在存储器中,当被处理器执行时,执行上述实施例的企业知识产权大数据情报分析方法。
此外,本申请实施例的还提供了一种企业知识产权大数据情报分析系统,该企业知识产权大数据情报分析系统包括由上述的控制器。
在一些实施例中,由于本申请实施例的企业知识产权大数据情报分析系统具有上述实施例的控制器,并且上述实施例的控制器能够执行上述实施例的企业知识产权大数据情报分析方法,因此,本申请实施例的企业知识产权大数据情报分析系统的具体实施方式和技术效果,可以参照上述任一实施例的企业知识产权大数据情报分析方法的具体实施方式和技术效果。
本申请实施例的还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于执行上述的企业知识产权大数据情报分析方法,例如,可使得上述一个或多个处理器执行上述方法实施例中的企业知识产权大数据情报分析方法,例如,执行以上描述的图6中的方法步骤S610至步骤S650。
以上所描述的系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络节点上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机可读存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机可读存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机可读存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储系统、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本申请的较佳实施进行了具体说明,但本申请并不局限于上述实施方式,熟悉本领域的技术人员在不违背本申请精神的前提下还可作出种种等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.一种企业知识产权大数据情报分析系统,其特征在于,所述系统包括数据获取模块、数据处理模块、企业评测模块、数据存储模块和数据检索模块:
所述数据获取模块用于获取企业知识产权数据;
所述数据处理模块用于对所述企业知识产权数据进行预处理,并对预处理后的所述企业知识产权数据进行分类处理,得到知识产权标签数据;
所述企业评测模块用于根据所述企业知识产权数据进行知识产权评估处理,得到知识产权评估数据;
所述数据存储模块用于存储所述知识产权标签数据和所述知识产权评估数据;
所述数据检索模块用于根据企业名称从所述数据存储模块中获取对应的所述知识产权标签数据和所述知识产权评估数据。
2.根据权利要求1所述的企业知识产权大数据情报分析系统,其特征在于,所述企业知识产权数据包括第三方提供数据和爬虫抓取数据,
所述数据获取模块用于从数据第三方获取所述第三方提供数据,从知识产权公开网页获取所述爬虫抓取数据,并将所述第三方提供数据和所述爬虫抓取数据存储于所述数据存储模块,
所述第三方提供数据和所述爬虫抓取数据包括企业的知识产权信息、工商注册信息、投融资信息和知识产权风险信息。
3.根据权利要求2所述的企业知识产权大数据情报分析系统,其特征在于,所述数据处理模块包括数据清洗子模块、数据预处理子模块、数据转化子模块、数据分类子模块和数据标签子模块,
所述数据清洗子模块用于从所述数据存储模块中得到所述企业知识产权数据,并对所述企业知识产权数据进行噪音去除处理,得到知识产权文本数据;
所述数据预处理子模块用于对所述知识产权文本数据进行文本切分处理,得到多个知识产权关键词数据;
所述数据转化子模块用于对所述知识产权关键词数据进行向量化处理,得到多个特征向量;
所述数据分类子模块用于根据多个所述特征向量对所述企业知识产权数据进行分类处理,得到分类结果;
所述数据标签子模块用于根据所述分类结果得到企业对应的知识产权标签数据,并将所述知识产权标签数据存储于所述数据存储模块。
4.根据权利要求3所述的企业知识产权大数据情报分析系统,其特征在于,所述企业评测模块包括专利估值子模块、企业科技力子模块和企业技术相似度子模块,
所述专利估值子模块用于根据所述知识产权标签数据和所述企业知识产权数据,对企业专利价值进行量化评估处理,得到企业的专利估值,并将所述专利估值存储于所述数据存储模块;
所述企业科技力子模块用于根据所述知识产权标签数据和所述企业知识产权数据,对企业科技水平进行量化评分处理,得到企业的科技评分,并将所述科技评分存储于所述数据存储模块;
所述企业技术相似度子模块用于根据多个所述知识产权标签数据和多个所述企业知识产权数据,对多个企业专利文档相似度进行数值量化处理,得到多个企业间的技术相似度,并将所述技术相似度存储于所述数据存储模块。
5.根据权利要求4所述的企业知识产权大数据情报分析系统,其特征在于,所述数据存储模块存储有与多个企业对应的多个企业信用代码,所述企业信用代码各自对应的专利信息包括所述企业知识产权数据、所述知识产权标签数据、所述专利估值、所述科技评分和所述技术相似度,
所述数据检索模块用于根据企业名称从所述数据存储模块中获取对应的所述企业信用代码,并根据所述企业信用代码获取所述专利信息。
6.根据权利要求5所述的企业知识产权大数据情报分析系统,其特征在于,所述系统还包括用户行为记录模块,
所述用户行为记录模块用于记录所述数据检索模块中检索过的企业名称,以使所述数据检索模块根据检索过的企业名称获取所述专利信息。
7.根据权利要求5所述的企业知识产权大数据情报分析系统,其特征在于,所述系统还包括数据下载模块,
所述数据下载模块用于对所述专利信息进行数据下载处理,得到专利信息数据,并以预设形式显示所述专利信息数据,所述预设格式包括文字、图表、数据和表格。
8.一种企业知识产权大数据情报分析方法,其特征在于,所述企业知识产权大数据情报分析方法应用于企业知识产权大数据情报分析系统,所述系统包括数据获取模块、数据处理模块、企业评测模块、数据存储模块和数据检索模块,所述方法包括:
通过所述数据获取模块获取企业知识产权数据;
通过所述数据处理模块对所述企业知识产权数据进行预处理,并对预处理后的所述企业知识产权数据进行分类处理,得到知识产权标签数据;
通过所述企业评测模块根据所述企业知识产权数据进行知识产权评估处理,得到知识产权评估数据;
通过所述数据存储模块存储所述知识产权标签数据和所述知识产权评估数据;
通过所述数据检索模块根据企业名称从所述数据存储模块中获取对应的所述知识产权标签数据和所述知识产权评估数据。
9.一种控制器,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求8所述的企业知识产权大数据情报分析方法。
10.一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令用于执行如权利要求8所述的企业知识产权大数据情报分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310025428.0A CN116049243A (zh) | 2023-01-09 | 2023-01-09 | 企业知识产权大数据情报分析系统、方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310025428.0A CN116049243A (zh) | 2023-01-09 | 2023-01-09 | 企业知识产权大数据情报分析系统、方法及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116049243A true CN116049243A (zh) | 2023-05-02 |
Family
ID=86121543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310025428.0A Pending CN116049243A (zh) | 2023-01-09 | 2023-01-09 | 企业知识产权大数据情报分析系统、方法及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116049243A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117575827A (zh) * | 2024-01-16 | 2024-02-20 | 之江实验室科技控股有限公司 | 一种企业报告的智能可视化管理系统及方法 |
-
2023
- 2023-01-09 CN CN202310025428.0A patent/CN116049243A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117575827A (zh) * | 2024-01-16 | 2024-02-20 | 之江实验室科技控股有限公司 | 一种企业报告的智能可视化管理系统及方法 |
CN117575827B (zh) * | 2024-01-16 | 2024-05-03 | 之江实验室科技控股有限公司 | 一种企业报告的智能可视化管理系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Khder | Web scraping or web crawling: State of art, techniques, approaches and application. | |
CN111428053B (zh) | 一种面向税务领域知识图谱的构建方法 | |
US11663254B2 (en) | System and engine for seeded clustering of news events | |
US8131684B2 (en) | Adaptive archive data management | |
CN107066599A (zh) | 一种基于知识库推理的相似上市公司企业检索分类方法及系统 | |
CN111767716B (zh) | 企业多级行业信息的确定方法、装置及计算机设备 | |
CN109522562B (zh) | 一种基于文本图像融合识别的网页知识抽取方法 | |
CN110704572A (zh) | 疑似非法集资风险的预警方法、装置、设备和存储介质 | |
CN110543595B (zh) | 一种站内搜索系统及方法 | |
CN107885793A (zh) | 一种微博热点话题分析预测方法及系统 | |
CN111737421A (zh) | 一种知识产权大数据情报检索系统及存储介质 | |
CN110134842B (zh) | 基于信息图谱的信息匹配方法、装置、存储介质和服务器 | |
CN104899229A (zh) | 基于群体智能的行为聚类系统 | |
CA2956627A1 (en) | System and engine for seeded clustering of news events | |
Zhang | Application of data mining technology in digital library. | |
CN113723737A (zh) | 一种基于企业画像的政策匹配方法、装置、设备及介质 | |
Verma et al. | Data mining: next generation challenges and futureDirections | |
CN116049243A (zh) | 企业知识产权大数据情报分析系统、方法及存储介质 | |
Aliakbary et al. | Web page classification using social tags | |
CN112434126B (zh) | 一种信息处理方法、装置、设备和存储介质 | |
Motallebi et al. | Bibliometric analysis of the emergence and evolution of Industry 4.0 in the supply chain | |
CN111966946A (zh) | 一种页面权威值的识别方法、装置、设备和存储介质 | |
CN116431895A (zh) | 安全生产知识个性化推荐方法及系统 | |
Li et al. | Automatic classification algorithm for multisearch data association rules in wireless networks | |
CN117056392A (zh) | 一种基于动态超图技术的大数据检索服务系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |