CN116681217A - 一种基于区块链技术的未来产业数据知识产权管理系统 - Google Patents
一种基于区块链技术的未来产业数据知识产权管理系统 Download PDFInfo
- Publication number
- CN116681217A CN116681217A CN202310962195.7A CN202310962195A CN116681217A CN 116681217 A CN116681217 A CN 116681217A CN 202310962195 A CN202310962195 A CN 202310962195A CN 116681217 A CN116681217 A CN 116681217A
- Authority
- CN
- China
- Prior art keywords
- data
- module
- expansion
- intellectual property
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005516 engineering process Methods 0.000 title claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 39
- 230000009286 beneficial effect Effects 0.000 claims abstract description 27
- 230000013011 mating Effects 0.000 claims abstract description 18
- 238000007726 management method Methods 0.000 claims description 35
- 238000000034 method Methods 0.000 claims description 17
- 238000012805 post-processing Methods 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000012937 correction Methods 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000007246 mechanism Effects 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 claims description 3
- 238000013481 data capture Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000012827 research and development Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000003416 augmentation Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/184—Intellectual property management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Technology Law (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Multimedia (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及软件系统领域,具体涉及基于区块链技术的未来产业数据知识产权管理系统。该系统包括:交底输入模块、检索模块、数据处理模块和数据抓取模块;交底输入模块,用于输入专利申请的交底文件;交底文件包括特征数据和有益效果数据;检索模块,用于提取交底文件中的特征数据和有益效果数据,并对特征部分进行关键词识别,获得第一关键数据;对有益效果数据进行关键词识别,获得第二关键数据;数据处理模块,用于对第一关键数据和第二关键数据进行扩充处理;获得扩充后的第一扩充数据和第二扩充数据;数据抓取模块,用于基于第一扩充数据和第二扩充数据,抓取文献数据,并基于文献数据给出判断数据,判断数据包括申请建议数据。
Description
技术领域
本发明涉及软件系统领域,尤其涉及基于区块链技术的未来产业数据知识产权管理方法、系统、计算机设备及存储介质。
背景技术
知识产权,也称其为“知识所属权”,指“权利人对其所创作的智力劳动成果所享有的财产权利”,一般在有限时间期内有效。各种智力创造比如发明、文学和艺术作品,以及在商业中使用的标志、名称、图像以及外观设计,都可被认为是某一个人或组织所拥有的知识产权,现有知识产权主要体现在专利、商标和著作权三个方面,随着经济的发展,人们已经越来越多认识到知识产权的重要性。
未来产业二大发展方向:一是智能、绿色、健康;各国政府将出台更有力的产业政策,持续推动本国“未来产业”加速发展;二是各国政府将出台更有力的产业政策,持续推动本国“未来产业”加速发展。
企业在进行未来产业研发和专利申请过程中,需要对现有技术进行检索,判断研发工作和申请工作的工作方向是否已经为现有技术,避免做无用功,而目前该工作通常依靠人工来完成,人工检索的可靠性不能够得到保证,为了解决该技术问题现提出一种基于区块链技术的未来产业数据知识产权管理系统。
发明内容
为了解决上述现有技术中存在的技术问题,本发明提供了一种基于区块链技术的未来产业数据知识产权管理方法、系统、计算机设备及存储介质。
为实现上述目的,本发明实施例提供了如下的技术方案:
第一方面,在本发明提供的一个实施例中,提供了基于区块链技术的未来产业数据知识产权管理系统,该系统包括:交底输入模块、检索模块、数据处理模块和数据抓取模块;
所述交底输入模块,用于输入专利申请的交底文件;所述交底文件包括特征数据和有益效果数据;
所述检索模块,用于提取交底文件中的特征数据和有益效果数据,并对所述特征部分进行关键词识别,获得第一关键数据;对有益效果数据进行关键词识别,获得第二关键数据;
所述数据处理模块,用于对第一关键数据和第二关键数据进行扩充处理;获得扩充后的第一扩充数据和第二扩充数据;
所述数据抓取模块,用于基于所述第一扩充数据和第二扩充数据,抓取区块链中的文献数据,并基于文献数据给出判断数据,所述判断数据包括申请建议数据。
作为本发明的进一步方案,所述交底输入模块包括录入单元、数据上传单元和数据识别单元;
所述录入单元,用于用户在预设模板中进行文字输入;
所述数据上传单元,用于用户上传预编辑的交底基础数据,所述交底基础数据包括word文件、PDF文件或者图片文件;
所述数据识别单元可以通过OCR技术对PDF文件或者图片文件中的图片文字进行识别。
作为本发明的进一步方案,所述预设模板包括特征输入区域、背景技术输入区域和有益效果输入区域。
作为本发明的进一步方案,所述数据识别单元包括预处理子单元、处理子单元、文字识别子单元和后处理子单元;
所述预处理子单元,用于对交底基础数据进行预处理;
所述处理子单元,用于对预处理后的交底基础数据进行二值化、去噪和校正处理,获得识别文件数据;
所述文字识别子单元,用于将所述识别文件数据进行版面分析、字符切割和字符识别,获得初步识别数据;
所述后处理子单元,将初步识别数据进行后处理,获得识别数据。
作为本发明的进一步方案,所述校正处理包括,利用图像空间转换模块或者引用视觉注意力机制进行校正处理。
作为本发明的进一步方案,所述后处理子单元,用于利用语义推理模块根据上下文信息和语义信息,对识别结果进行校正,获得识别数据。
作为本发明的进一步方案,所述数据处理模块,用于获取第一关键数据或第二关键数据的具有相同语音的第一关键词数据或第二关键词数据;所述第一关键词数据与第一关键数据组成第一扩充数据;所述第二关键词数据与第二关键数据组成第二扩充数据。
作为本发明的进一步方案,所述数据抓取模块包括文献数据获取单元和判断单元;
所述文献数据获取单元,用于基于所述第一扩充数据和第二扩充数据,抓取区块链中的文献数据;
所述判断单元,用于基于文献数据给出判断数据,所述判断数据包括申请建议数据。
作为本发明的进一步方案,该系统还包括费用管理模块;
费用管理模块,用于自动抓取申请人相关的专利申请数据,所述专利申请数据包括申请日期和官费缴纳数据;并根据官费缴纳数据,定时输出缴费提醒。
作为本发明的进一步方案,该系统还包括标记分类模块;
用于对交底文件数据进行语义识别,对交底文件数据的技术领域进行技术归类,方便后续查看。
本发明提供的技术方案,具有如下有益效果:
本发明输入专利申请的交底文件;所述交底文件包括特征数据和有益效果数据;提取交底文件中的特征数据和有益效果数据,并对所述特征部分进行关键词识别,获得第一关键数据;对有益效果数据进行关键词识别,获得第二关键数据;对第一关键数据和第二关键数据进行扩充处理;获得扩充后的第一扩充数据和第二扩充数据;基于所述第一扩充数据和第二扩充数据,抓取区块链中的文献数据,并基于文献数据给出判断数据,所述判断数据包括申请建议数据。本发明实现了自动对交底数据进行识别,自动对交底数据进行检索判断,自动给出申请建议;解决了现有技术企业专利申请或者在研发之前依赖人工检索的问题。
本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明一个实施例的基于区块链技术的未来产业数据知识产权管理方法的流程图。
图2为本发明一个实施例的基于区块链技术的未来产业数据知识产权管理方法中步骤S10的具体流程图。
图3为本发明一个实施例的基于区块链技术的未来产业数据知识产权管理系统的结构框图一。
图4为本发明一个实施例的基于区块链技术的未来产业数据知识产权管理系统中交底输入模块的结构框图。
图5为本发明一个实施例的基于区块链技术的未来产业数据知识产权管理系统中数据识别单元图。
图6为本发明一个实施例的基于区块链技术的未来产业数据知识产权管理系统中数据抓取模块的结构框图。
图7为本发明一个实施例的基于区块链技术的未来产业数据知识产权管理系统的结构框图二。
图中标记说明:交底输入模块-100;
录入单元-101、数据上传单元-102、数据识别单元-103;
预处理子单元-1031、处理子单元-1032、文字识别子单元-1033、后处理子单元-1034;
检索模块-200;
数据处理模块-300;
数据抓取模块-400;
文献数据获取单元-401、判断单元-402。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
具体地,下面结合附图,对本发明实施例作进一步阐述。
请参阅图1,图1是本发明实施例提供的一种基于区块链技术的未来产业数据知识产权管理方法的流程图,如图1所示,该基于区块链技术的未来产业数据知识产权管理方法包括步骤S10至步骤S40。
S10、输入专利申请的交底文件;所述交底文件包括特征数据和有益效果数据;
参见图2所示,在本发明的实施例中,所述步骤S10、包括:
S101、用户在预设模板中进行文字输入;
S102、用户上传预编辑的交底基础数据,所述交底基础数据包括word文件、PDF文件或者图片文件;
S103、用于对述交底基础数据中的数据进行识别,获得文本数据,并上传。
在本发明的实施例中,所述步骤S103、包括:
S1031、对交底基础数据进行预处理;
S1032、对预处理后的交底基础数据进行二值化、去噪和校正处理,获得识别文件数据;
S1033、将所述识别文件数据进行版面分析、字符切割和字符识别,获得初步识别数据;
S1034、将初步识别数据进行后处理,获得识别数据。
S20、提取交底文件中的特征数据和有益效果数据,并对所述特征部分进行关键词识别,获得第一关键数据;对有益效果数据进行关键词识别,获得第二关键数据;
S30、对第一关键数据和第二关键数据进行扩充处理;获得扩充后的第一扩充数据和第二扩充数据。
S40、基于所述第一扩充数据和第二扩充数据,抓取区块链中的文献数据,并基于文献数据给出判断数据,所述判断数据包括申请建议数据。
在本发明的另一些实施例中,所述基于所述第一扩充数据和第二扩充数据,抓取区块链中的文献数据,包括:
S401、基于所述第一扩充数据和第二扩充数据,获得区块链中原始网页数据。
在本发明实施例中,所述基于所述第一扩充数据和第二扩充数据,获得区块链中原始网页数据,包括:
将数据库中的网页数据与所述第一扩充数据和第二扩充数据进行比对;获得原始网页数据。
其中,所述原始网页数据包括第一原始子数据和第二原始子数据;所述第一原始子数据中的网页数据包括第一扩充数据和第二网页数据;所述第二原始子数据包括第一扩充数据。
具体的,所述第一原始子数据和第二原始子数据中的网页数据是根据第一扩充数据和第二网页数据重复次数进行排序。
S402、对所述原始网页数据中的网页数据进行去噪处理,以获得去噪网页数据。如此能够将网页数据中的干扰信息,包括广告、导航和相关链接,从而提取出网页的正文信息,提高后续网页解析的准确度。
S403、对去噪网页数据进行网页特征提取,获取网页特征数据。具体的,从网页中提取出用来表征网页信息的特征值,所述特征值可以为网页中的若干个片段或者为若干词语;将所述特征值组成一个特征向量,所述特征向量即为网页的特征数据。
S404、对网页特征数据进行特征压缩编码处理,以获得压缩网页数据。具体的,可以利用哈希函数将所述特征数据转化为数字串,如此方便后续储存,减小储存负担,且如此更方便后续数据比较,提高计算相似度的效率。
S405、对压缩网页数据,进行网页相似度计算,获得相似度计算数据。所述网页相似度计算可以用海明距离计算两个哈希值之间的相似性。
S406、基于所述相似度计算数据,进行相似网页聚类,获得文献数据,如此实现了对相似网页数据去重操作。
本发明输入专利申请的交底文件;所述交底文件包括特征数据和有益效果数据;提取交底文件中的特征数据和有益效果数据,并对所述特征部分进行关键词识别,获得第一关键数据;对有益效果数据进行关键词识别,获得第二关键数据;对第一关键数据和第二关键数据进行扩充处理;获得扩充后的第一扩充数据和第二扩充数据;基于所述第一扩充数据和第二扩充数据,抓取区块链中的文献数据,并基于文献数据给出判断数据,所述判断数据包括申请建议数据。本发明实现了自动对交底数据进行识别,自动对交底数据进行检索判断,自动给出申请建议;解决了现有技术企业专利申请或者在研发之前依赖人工检索的问题。
应该理解的是,上述虽然是按照某一顺序描述的,但是这些步骤并不是必然按照上述顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,本实施例的一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,参见图3所示,在本发明的实施例中还提供了基于区块链技术的未来产业数据知识产权管理系统,该系统包括交底输入模块100、检索模块200、数据处理模块300和数据抓取模块400。
所述交底输入模块100,用于输入专利申请的交底文件;所述交底文件包括特征数据和有益效果数据。
参见图4所示,所述交底输入模块100包括录入单元101、数据上传单元102和数据识别单元103;
所述录入单元101,用于用户在预设模板中进行文字输入。具体的,所述预设模板包括特征输入区域、背景技术输入区域和有益效果输入区域。
所述数据上传单元102,用于用户上传预编辑的交底基础数据,所述交底基础数据包括word文件、PDF文件或者图片文件。
所述数据识别单元103,用于对述交底基础数据中的数据进行识别,获得文本数据,并上传。
所述数据识别单元103可以通过OCR技术对PDF文件或者图片文件中的图片文字进行识别。
参见图5所示,在本发明实施例中,所述数据识别单元103包括预处理子单元1031、处理子单元1032、文字识别子单元1033和后处理子单元1034。
所述预处理子单元1031,用于对交底基础数据进行预处理。
在本发明实施例中,所述预处理子单元1031,用于对交底基础数据,进行校正处理。
所述校正处理包括,利用图像空间转换模块或者引用视觉注意力机制进行校正处理。
所述处理子单元1032,用于对预处理后的交底基础数据进行二值化、去噪和校正处理,获得识别文件数据。
具体的,由于有些图片文件具有彩色,为了能够对彩色图进行处理,采用二值化处理,定义图片文件的前景信息为黑色,背景信息为白色。如此提高识别效率。
所述文字识别子单元1033,用于将所述识别文件数据进行版面分析、字符切割和字符识别,获得初步识别数据。
所述后处理子单元1034,将初步识别数据进行后处理,获得识别数据。
在本发明实施例中,所述后处理子单元1034,用于利用语义推理模块根据上下文信息和语义信息,对识别结果进行校正,获得识别数据。
所述检索模块200,用于提取交底文件中的特征数据和有益效果数据,并对所述特征部分进行关键词识别,获得第一关键数据;对有益效果数据进行关键词识别,获得第二关键数据。
所述数据处理模块300,用于对第一关键数据和第二关键数据进行扩充处理;获得扩充后的第一扩充数据和第二扩充数据。
在本发明实施例中,所述数据处理模块300,用于获取第一关键数据或第二关键数据的具有相同语音的第一关键词数据或第二关键词数据;所述第一关键词数据与第一关键数据组成第一扩充数据;所述第二关键词数据与第二关键数据组成第二扩充数据。
所述数据抓取模块400,用于基于所述第一扩充数据和第二扩充数据,抓取区块链中的文献数据,并基于文献数据给出判断数据,所述判断数据包括申请建议数据。
所述数据抓取模块400包括文献数据获取单元401和判断单元402。
所述文献数据获取单元401,用于基于所述第一扩充数据和第二扩充数据,抓取区块链中的文献数据。
所述判断单元402,用于基于文献数据给出判断数据,所述判断数据包括申请建议数据。
在本发明的一些实施例中,所述利用区块链技术对待抓取数据库中的数据,获得文献数据,包括:
对数据库或/和数据源的数据中有价值数据的筛选;所述有价值数据具体为符合用户需求或其价值得到共识的非冗余、不重复、无错误、未失效并有效的数据;所述用户需求包括数据领域需求、数据内容需求、数据精准度需求、数据来源需求、数据时效需求、数据体量需求、数据格式需求、数据结构需求中的一项或若干项。
在本发明的另一些实施例中,所述文献数据获取单元401包括抓取子单元4011、去噪子单元4012、特征提取子单元4013、压缩子单元4014、相似度计算子单元4015和网页聚类子单元4016。
所述抓取子单元4011,用于基于所述第一扩充数据和第二扩充数据,获得区块链中原始网页数据。
在本发明实施例中,所述基于所述第一扩充数据和第二扩充数据,获得区块链中原始网页数据,包括:
将数据库中的网页数据与所述第一扩充数据和第二扩充数据进行比对;获得原始网页数据。
其中,所述原始网页数据包括第一原始子数据和第二原始子数据;所述第一原始子数据中的网页数据包括第一扩充数据和第二网页数据;所述第二原始子数据包括第一扩充数据。
具体的,所述第一原始子数据和第二原始子数据中的网页数据是根据第一扩充数据和第二网页数据重复次数进行排序。
所述去噪子单元4012,用于对所述原始网页数据中的网页数据进行去噪处理,以获得去噪网页数据。如此能够将网页数据中的干扰信息,包括广告、导航和相关链接,从而提取出网页的正文信息,提高后续网页解析的准确度。
所述特征提取子单元4013,用于对去噪网页数据进行网页特征提取,获取网页特征数据。具体的,从网页中提取出用来表征网页信息的特征值,所述特征值可以为网页中的若干个片段或者为若干词语;将所述特征值组成一个特征向量,所述特征向量即为网页的特征数据。
所述压缩子单元4014,用于对网页特征数据进行特征压缩编码处理,以获得压缩网页数据。具体的,可以利用哈希函数将所述特征数据转化为数字串,如此方便后续储存,减小储存负担,且如此更方便后续数据比较,提高计算相似度的效率。
所述相似度计算子单元4015,用于对压缩网页数据,进行网页相似度计算,获得相似度计算数据。所述网页相似度计算可以用海明距离计算两个哈希值之间的相似性。
所述网页聚类子单元4016,用于基于所述相似度计算数据进行相似网页聚类,获得文献数据,如此实现了对相似网页数据去重操作。
参见图7所示,在一个实施例中,本系统还包括费用管理模块500。
费用管理模块500,用于自动抓取申请人相关的专利申请数据,所述专利申请数据包括申请日期和官费缴纳数据;并根据官费缴纳数据,定时输出缴费提醒。
参见图7所示,在一个实施例中,本系统还包括标记分类模块600。
标记分类模块600,用于对交底文件数据进行语义识别,对交底文件数据的技术领域进行技术归类,方便后续查看。
本发明输入专利申请的交底文件;所述交底文件包括特征数据和有益效果数据;提取交底文件中的特征数据和有益效果数据,并对所述特征部分进行关键词识别,获得第一关键数据;对有益效果数据进行关键词识别,获得第二关键数据;对第一关键数据和第二关键数据进行扩充处理;获得扩充后的第一扩充数据和第二扩充数据;基于所述第一扩充数据和第二扩充数据,抓取区块链中的文献数据,并基于文献数据给出判断数据,所述判断数据包括申请建议数据。本发明实现了自动对交底数据进行识别,自动对交底数据进行检索判断,自动给出申请建议;解决了现有技术企业专利申请或者在研发之前依赖人工检索的问题。
在一个实施例中,在本发明的实施例中还提供了一种计算机设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信。
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的计算机程序时,执行所述的基于区块链技术的未来产业数据知识产权管理方法,该处理器执行指令时实现上述方法实施例中的步骤。
上述终端提到的通信总线可以是外设部件互联标准(PeripheralComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended IndustryStandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(ApplicationSpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-ProgrammableGate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
还应当理解,在本发明说明书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
在本发明的一个实施例中还提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。
Claims (10)
1.一种基于区块链技术的未来产业数据知识产权管理系统,其特征在于,该系统包括:交底输入模块、检索模块、数据处理模块和数据抓取模块;
所述交底输入模块,用于输入专利申请的交底文件;所述交底文件包括特征数据和有益效果数据;
所述检索模块,用于提取交底文件中的特征数据和有益效果数据,并对所述特征部分进行关键词识别,获得第一关键数据;对有益效果数据进行关键词识别,获得第二关键数据;
所述数据处理模块,用于对第一关键数据和第二关键数据进行扩充处理;获得扩充后的第一扩充数据和第二扩充数据;
所述数据抓取模块,用于基于所述第一扩充数据和第二扩充数据,抓取区块链中的文献数据,并基于文献数据给出判断数据,所述判断数据包括申请建议数据。
2.如权利要求1所述的基于区块链技术的未来产业数据知识产权管理系统,其特征在于,所述交底输入模块包括录入单元、数据上传单元和数据识别单元;
所述录入单元,用于用户在提供的预设模板中进行文字输入;
所述数据上传单元,用于用户上传预编辑的交底基础数据,所述交底基础数据包括word文件、PDF文件或者图片文件;
所述数据识别单元,用于通过OCR技术对PDF文件或者图片文件中的图片文字进行识别。
3.如权利要求2所述的基于区块链技术的未来产业数据知识产权管理系统,其特征在于,所述预设模板包括特征输入区域、背景技术输入区域和有益效果输入区域。
4.如权利要求2所述的基于区块链技术的未来产业数据知识产权管理系统,其特征在于,所述数据识别单元包括预处理子单元、处理子单元、文字识别子单元和后处理子单元;
所述预处理子单元,用于对交底基础数据进行预处理;
所述处理子单元,用于对预处理后的交底基础数据进行二值化、去噪和校正处理,获得识别文件数据;
所述文字识别子单元,用于将所述识别文件数据进行版面分析、字符切割和字符识别,获得初步识别数据;
所述后处理子单元,将初步识别数据进行后处理,获得识别数据。
5.如权利要求4所述的基于区块链技术的未来产业数据知识产权管理系统,其特征在于,所述校正处理包括,利用图像空间转换模块或者引用视觉注意力机制进行校正处理。
6.如权利要求4所述的基于区块链技术的未来产业数据知识产权管理系统,其特征在于,所述后处理子单元,用于利用语义推理模块根据上下文信息和语义信息,对识别结果进行校正,获得识别数据。
7.如权利要求1所述的基于区块链技术的未来产业数据知识产权管理系统,其特征在于,所述数据处理模块,用于获取第一关键数据或第二关键数据的具有相同语音的第一关键词数据或第二关键词数据;所述第一关键词数据与第一关键数据组成第一扩充数据;所述第二关键词数据与第二关键数据组成第二扩充数据。
8.如权利要求1所述的基于区块链技术的未来产业数据知识产权管理系统,其特征在于,所述数据抓取模块包括文献数据获取单元和判断单元;
所述文献数据获取单元,用于基于所述第一扩充数据和第二扩充数据,抓取区块链中的文献数据;
所述判断单元,用于基于文献数据给出判断数据,所述判断数据包括申请建议数据。
9.如权利要求1所述的基于区块链技术的未来产业数据知识产权管理系统,其特征在于,该系统还包括费用管理模块;
费用管理模块,用于自动抓取申请人相关的专利申请数据,所述专利申请数据包括申请日期和官费缴纳数据;并根据官费缴纳数据,定时输出缴费提醒。
10.如权利要求1所述的基于区块链技术的未来产业数据知识产权管理系统,其特征在于,该系统还包括标记分类模块;
用于对交底文件数据进行语义识别,对交底文件数据的技术领域进行技术归类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310962195.7A CN116681217A (zh) | 2023-08-02 | 2023-08-02 | 一种基于区块链技术的未来产业数据知识产权管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310962195.7A CN116681217A (zh) | 2023-08-02 | 2023-08-02 | 一种基于区块链技术的未来产业数据知识产权管理系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116681217A true CN116681217A (zh) | 2023-09-01 |
Family
ID=87791277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310962195.7A Pending CN116681217A (zh) | 2023-08-02 | 2023-08-02 | 一种基于区块链技术的未来产业数据知识产权管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116681217A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930316A (zh) * | 2016-05-06 | 2016-09-07 | 长沙市麓智信息科技有限公司 | 专利撰写辅助系统及其辅助方法 |
CN110414757A (zh) * | 2018-04-28 | 2019-11-05 | 南方电网科学研究院有限责任公司 | 一种技术立项风险把控的管理系统及管理方法 |
CN112435006A (zh) * | 2020-11-24 | 2021-03-02 | 大连理工江苏研究院有限公司 | 一种应用区块链技术的专利全过程管理方法、系统及设备 |
CN112836073A (zh) * | 2021-02-02 | 2021-05-25 | 嘉应学院 | 一种历史文献数字化方法、系统、装置及存储介质 |
CN112905759A (zh) * | 2021-01-30 | 2021-06-04 | 抚州果小秘品牌管理有限公司 | 一种知识产权检索系统及方法 |
CN114092287A (zh) * | 2021-11-23 | 2022-02-25 | 徐州工业职业技术学院 | 一种基于区块链的知识产权管理系统及管理方法 |
CN114881012A (zh) * | 2022-04-11 | 2022-08-09 | 深圳市网睿科技有限公司 | 基于自然语言处理的文章标题及内容的智能改写系统及方法 |
-
2023
- 2023-08-02 CN CN202310962195.7A patent/CN116681217A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930316A (zh) * | 2016-05-06 | 2016-09-07 | 长沙市麓智信息科技有限公司 | 专利撰写辅助系统及其辅助方法 |
CN110414757A (zh) * | 2018-04-28 | 2019-11-05 | 南方电网科学研究院有限责任公司 | 一种技术立项风险把控的管理系统及管理方法 |
CN112435006A (zh) * | 2020-11-24 | 2021-03-02 | 大连理工江苏研究院有限公司 | 一种应用区块链技术的专利全过程管理方法、系统及设备 |
CN112905759A (zh) * | 2021-01-30 | 2021-06-04 | 抚州果小秘品牌管理有限公司 | 一种知识产权检索系统及方法 |
CN112836073A (zh) * | 2021-02-02 | 2021-05-25 | 嘉应学院 | 一种历史文献数字化方法、系统、装置及存储介质 |
CN114092287A (zh) * | 2021-11-23 | 2022-02-25 | 徐州工业职业技术学院 | 一种基于区块链的知识产权管理系统及管理方法 |
CN114881012A (zh) * | 2022-04-11 | 2022-08-09 | 深圳市网睿科技有限公司 | 基于自然语言处理的文章标题及内容的智能改写系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108595583B (zh) | 动态图表类页面数据爬取方法、装置、终端及存储介质 | |
WO2021012570A1 (zh) | 数据录入方法、装置、设备及存储介质 | |
CN110851598B (zh) | 文本分类方法、装置、终端设备及存储介质 | |
CN110321466B (zh) | 一种基于语义分析的证券资讯查重方法及系统 | |
CN105279277A (zh) | 知识数据的处理方法和装置 | |
CN110837590B (zh) | 资讯推送方法、装置、计算机设备和存储介质 | |
CN114780746A (zh) | 基于知识图谱的文档检索方法及其相关设备 | |
CN111061887A (zh) | 一种新闻人物照片提取方法、装置、设备及存储介质 | |
CN110532449B (zh) | 一种业务文档的处理方法、装置、设备和存储介质 | |
CN112818200A (zh) | 基于静态网站的数据爬取及事件分析方法及系统 | |
CN111177421A (zh) | 一种面向数字人文的电子邮件历史事件轴生成方法及装置 | |
EP3564833B1 (en) | Method and device for identifying main picture in web page | |
CN108334800B (zh) | 印章图像的处理装置、方法以及电子设备 | |
CN112579781A (zh) | 文本归类方法、装置、电子设备及介质 | |
CN115129897B (zh) | 利用知识图谱分析感知数据的方法、装置、设备和介质 | |
CN116681217A (zh) | 一种基于区块链技术的未来产业数据知识产权管理系统 | |
CN115511645A (zh) | 理赔图片的检测方法、装置、设备及存储介质 | |
CN114417860A (zh) | 一种信息检测方法、装置及设备 | |
CN115080745A (zh) | 基于人工智能的多场景文本分类方法、装置、设备及介质 | |
CN113704623A (zh) | 一种数据推荐方法、装置、设备及存储介质 | |
CN112287186B (zh) | 一种用于城市管理的智能分类方法及其系统 | |
CN110853115A (zh) | 一种开发流程页面的创建方法及设备 | |
Suh et al. | Lumped approach to recognize types of construction defect from text with hand-drawn circles | |
CN114219985B (zh) | 信息识别处理方法、装置、计算机设备、存储介质 | |
CN117058432B (zh) | 图像查重方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |