CN111680093B

CN111680093B - 知识产权案件分析方法、装置、计算机设备及存储介质

Info

Publication number: CN111680093B
Application number: CN202010506064.4A
Authority: CN
Inventors: 葛婷婷; 张亦龙; 芦惠娟; 顾正
Original assignee: Shenzhen Huayun Zhongsheng Technology Co ltd
Current assignee: Shenzhen Huayun Zhongsheng Technology Co ltd
Priority date: 2020-06-05
Filing date: 2020-06-05
Publication date: 2023-07-21
Anticipated expiration: 2040-06-05
Also published as: CN111680093A

Abstract

本发明涉及知识产权案件分析方法、装置、计算机设备及存储介质，该方法包括根据不同的数据源获取对应的知识产权信息，以得到初始信息；对初始信息进行数据分析，以得到汇聚库；对汇聚库内的数据进行数据识别，以得到字段信息；对字段信息进行数据处理并构建对应的数据库，以得到主题库以及专题库；获取需要分析的知识产权案件信息，以得到待分析信息；根据待分析信息对主题库以及专题库进行数据的分析以及挖掘，以得到分析结果；反馈分析结果至终端，以在终端显示分析结果。本发明实现快速查找知识产权案件相关信息，节省案件处理时间，提高案件处理效率。

Description

知识产权案件分析方法、装置、计算机设备及存储介质

技术领域

本发明涉及知识产权分析方法，更具体地说是指知识产权案件分析方法、装置、计算机设备及存储介质。

背景技术

知识产权是指人们对脑力劳动创造出来的智力成果所依法享有的权利。知识产权是专利权、著作权、植物新品种圈、集成电路布图设计圈、商标权、商号权、地理标志圈等民事权利的统称。知识经济时代，知识产权已成为个人致富、企业生存发展、国家富强的重要凭借。由于其蕴涵着巨大的经济价值，知识产权转让、许可、出资等交易日益活跃，与此同时，侵害知识产权的情形也频繁出现。不论是交易中确定知识产权的对价，还是侵权后核定知识产权损害赔偿额，都要面临一个至关重要的问题，如何衡量和确定相关知识产权的价值。

由于知识产权类案件较为专业，涉及到的内容较为庞杂，需要大量专业知识作为办案基础，当前办案人员在办理案件的过程中，为了对案件做出更好的判断，需要耗费大量时间和人力进行多方查找相应的商标或专利信息。

因此，有必要设计一种新的方法，实现快速查找知识产权案件相关信息，节省案件处理时间，提高案件处理效率。

发明内容

本发明的目的在于克服现有技术的缺陷，提供知识产权案件分析方法、装置、计算机设备及存储介质。

为实现上述目的，本发明采用以下技术方案：知识产权案件分析方法，包括：

根据不同的数据源获取对应的知识产权信息，以得到初始信息；

对所述初始信息进行数据分析，以得到汇聚库；

对汇聚库内的数据进行数据识别，以得到字段信息；

对所述字段信息进行数据处理并构建对应的数据库，以得到主题库以及专题库；

获取需要分析的知识产权案件信息，以得到待分析信息；

根据待分析信息对主题库以及专题库进行数据的分析以及挖掘，以得到分析结果；

反馈所述分析结果至终端，以在终端显示所述分析结果。

其进一步技术方案为：所述对所述初始信息进行数据分析，以得到汇聚库，包括：

对所述初始信息划分为结构化数据和非结构化数据；

对非结构化数据进行格式转换，以得到转换文件；

对所述结构化数据通过定时抽取的方式进行汇聚，并与转换文件进行整合，以得到汇聚库。

其进一步技术方案为：所述对非结构化数据进行格式转换，以得到转换文件，包括：

根据预设的规则库确定非结构化数据的定义描述以及格式转换规则；

根据定义描述以及格式转换规则对非结构化数据进行转换，以得到转换文件。

其进一步技术方案为：所述对汇聚库内的数据进行数据识别，以得到字段信息，包括：

对汇聚库内的数据进行扫描，以得到扫描内容；

对扫描内容按照商标和专利的结构进行数据识别，以得到字段信息。

其进一步技术方案为：所述对所述字段信息进行数据处理并构建对应的数据库，以得到主题库以及专题库，包括：

对所述字段信息进行清洗和分类，以得到标准库；

在汇聚库以及标准库的基础上构建主题库以及专题库。

其进一步技术方案为：所述根据待分析信息对主题库以及专题库进行数据的分析以及挖掘，以得到分析结果，包括：

将待分析信息作为搜索条件在专题库以及主题库内进行内容搜索，以得到搜索结果；

筛选搜索结果中与待分析信息不同的内容，并进行标注，以得到分析结果。

本发明还提供了知识产权案件分析装置，包括：

初始信息获取单元，用于根据不同的数据源获取对应的知识产权信息，以得到初始信息；

数据分析单元，用于对所述初始信息进行数据分析，以得到汇聚库；

数据识别单元，用于对汇聚库内的数据进行数据识别，以得到字段信息；

构建单元，用于对所述字段信息进行数据处理并构建对应的数据库，以得到主题库以及专题库；

待分析信息获取单元，用于获取需要分析的知识产权案件信息，以得到待分析信息；

分析挖掘单元，用于根据待分析信息对主题库以及专题库进行数据的分析以及挖掘，以得到分析结果；

反馈单元，用于反馈所述分析结果至终端，以在终端显示所述分析结果。

其进一步技术方案为：所述数据分析单元包括：

信息划分子单元，用于对所述初始信息划分为结构化数据和非结构化数据；

格式转换子单元，用于对非结构化数据进行格式转换，以得到转换文件；

汇集子单元，用于对所述结构化数据通过定时抽取的方式进行汇聚，并与转换文件进行整合，以得到汇聚库。

本发明还提供了一种计算机设备，所述计算机设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现上述的方法。

本发明还提供了一种存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时可实现上述的方法。

本发明与现有技术相比的有益效果是：本发明通过先从不同的来源获取到所有知识产权数据，再对这些数据进行数据分析、数据识别以及数据提取后，构成专题库以及主题库，当有需要分析知识产权案件的需求时，依据待分析信息从主题库以及专题库内筛选出对应的内容并进行分析，形成分析结果反馈至终端，无需耗费大量时间以及人力进行多方查找对应的信息，实现快速查找知识产权案件相关信息，节省案件处理时间，提高案件处理效率。

下面结合附图和具体实施例对本发明作进一步描述。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的知识产权案件分析方法的应用场景示意图；

图2为本发明实施例提供的知识产权案件分析方法的流程示意图；

图3为本发明实施例提供的知识产权案件分析方法的子流程示意图；

图4为本发明实施例提供的知识产权案件分析方法的子流程示意图；

图5为本发明实施例提供的知识产权案件分析方法的子流程示意图；

图6为本发明实施例提供的知识产权案件分析方法的子流程示意图；

图7为本发明实施例提供的知识产权案件分析方法的子流程示意图；

图8为本发明实施例提供的知识产权案件分析装置的示意性框图；

图9为本发明实施例提供的知识产权案件分析装置的数据分析单元的示意性框图；

图10为本发明实施例提供的知识产权案件分析装置的格式转换子单元的示意性框图；

图11为本发明实施例提供的知识产权案件分析装置的数据识别单元的示意性框图；

图12为本发明实施例提供的知识产权案件分析装置的构建单元的示意性框图；

图13为本发明实施例提供的知识产权案件分析装置的分析挖掘单元的示意性框图；

图14为本发明实施例提供的计算机设备的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

请参阅图1和图2，图1为本发明实施例提供的知识产权案件分析方法的应用场景示意图。图2为本发明实施例提供的知识产权案件分析方法的示意性流程图。该知识产权案件分析方法应用于服务器中。该服务器与第一终端以及第二终端进行数据交互，从第一终端处获取到对应的初始信息后，进行分析处理，构建主题库以及专题库，从第二终端处获取到待分析信息，利用主题库以及专题库构建与待分析信息相关的内容，并将内容反馈至第二终端。

图2是本发明实施例提供的知识产权案件分析方法的流程示意图。如图2所示，该方法包括以下步骤S110至S170。

S110、根据不同的数据源获取对应的知识产权信息，以得到初始信息。

在本实施例中，初始信息是指包括法院办案卷宗数据、检察院统一业务系统数据、外部数据，也就是与知识产权相关的所有数据。

数据获取有三种来源，法院办案卷宗数据、检察院统一业务系统数据、外部数据，此三种数据源都有不同的数据类型，包括结构化数据、卷宗非结构化数据。对于不同数据的来源渠道，可判断出其数据结构，比如法院办案系统中用接口传输过来的数据可直接入库的为结构化数据，对于一些图片、音视频等不能直接入库的归类为非结构化数据；对于检察院统一业务系统数据均为结构化数据；外部数据是通过爬虫获取生成的html文件，可归类为结构化数据。数据信息主要包括来自检察院的数据，比如案卡数据信息、受理案件文书、抗诉文书、出席再审法庭文书等多种文书类型，来自法院的数据，比如判决书、裁定书、调解书、决定数、通知书等非结构化数据，来自外部平台的数据，比如国家知识产权局内的商标、专利数据，企查查、天眼查等网站内的商标、专利数据。

S120、对所述初始信息进行数据分析，以得到汇聚库。

在本实施例中，汇聚库是指集合与知识产权相关的结构化数据的数据库。

根据数据的来源不同，可划分为内部数据和外部数据，除自身平台之外的数据都为外部数据，数据的类型、结构、价值不同而得出的信息也是不同的，获取知识产权类案件包含的信息需要多方数据相结合，在得出结论时，可通过数据看到是内部数据准确性高还是外部数据起到的作用更大，为以后为办案人员提供更准确的数据做铺垫。

在一实施例中，请参阅图3，上述的步骤S120可包括步骤S121～S123。

S121、对所述初始信息划分为结构化数据和非结构化数据。

在本实施例中，根据来源的不同划分出结构化数据和非结构化数据。

S122、对非结构化数据进行格式转换，以得到转换文件。

在本实施例中，转换文件是指非结构化数据转换为结构化数据后形成的json文件。

在一实施例中，请参阅图4，上述的步骤S122可包括步骤S1221～S1222。

S1221、根据预设的规则库确定非结构化数据的定义描述以及格式转换规则。

在本实施例中，定义描述是指非结构化数据每个字段的含义，格式转换规则是指非结构化数据转换为结构化数据所对应的规则。

S1222、根据定义描述以及格式转换规则对非结构化数据进行转换，以得到转换文件。

非结构化数据主要是通过解析文书的方式定时抽取到分布式文件系统中，转化为结构化数据。在非结构化数据的格式转换开始前，首先要建立规则库，具体地，对非结构化数据格式进行定义与分析，将该定义存储到规则库中；对格式转换规则进行定义与分析，以形成转换规则，再将该转换规则存储到规则库中；对已知类型的非结构化数据描述，将这些描述存储到规则库中；根据转换规则描述所需的数据的格式转换规则，并存储到规则库中。先提取原始数据与目标数据的格式描述，其中，原始数据是指非结构化数据，目标数据是指结构化数据，如果规则库内没有这一项描述，则根据非结构化数据定义生成描述，并存储到规则库中；提取相应转换规则的描述内容，如果没有，根据格式转换规则进行描述并存储到规则库中。根据以上规则库设定的转换规则，可将非结构化数据转化为结构化数据。

S123、对所述结构化数据通过定时抽取的方式进行汇聚，并与转换文件进行整合，以得到汇聚库。

对于结构化数据通过定时抽取的方式汇聚到汇聚库中；通过创建定时任务将数据以增量的方式抽取到汇聚库中，定时任务频率采取T+1的方式，非实时的获取数据；汇聚库为最原始的数据库，数据抽取过来不做任何修改和加工，保持数据的最原始状态；其作用是为建设下一层打好基础。另外，外部数据主要通过接口传输、网站定时爬取、数据导入等方式获取。获取到数据后形成汇聚库以供数据处理使用，汇聚库的另一个作用是确保数据的原始性，汇聚库主要包括案件数据、商标数据、专利数据等。

S130、对汇聚库内的数据进行数据识别，以得到字段信息。

在本实施例中，字段信息是指商标及专利的数据信息。

在一实施例中，请参阅图5，上述的步骤S130可包括步骤S131～S132。

S131、对汇聚库内的数据进行扫描，以得到扫描内容。

在本实施例中，扫描内容是指对汇聚库内的数据进行扫描所得的所有结果。

S132、对扫描内容按照商标和专利的结构进行数据识别，以得到字段信息。

先对获取到的数据进行扫描处理，在扫描结果中提取商标及专利的数据信息，商标数据信息包括商标LOGO图、商标名称、申请/注册号、申请人名称、申请时间、注册时间、类似群、商品/服务；专利数据信息包括：发明名称、申请号、申请日、公开(公告)号、公开(公告)日、优先权日、优先权号、发明人、申请(专利权)人、代理机构、代理人、IPC分类号、CPC分类号、申请人地址、申请人邮编、摘要、摘要附图、法律状态、权利要求、说明书。结合对以上的商标数据信息和专利数据信息名称的确定，实现大数据识别网络构建，通过仿真实验，依据商标与专利数据特定化结构，归类扫描所得的数据所对应的内容，以此识别出对应的字段信息，以便于从数据提取这些字段信息。

S140、对所述字段信息进行数据处理并构建对应的数据库，以得到主题库以及专题库。

在本实施例中，主题库是指关于知识产权的不同主题所构成的数据库，专题库是指针对知识产权的专用主题的数据库。

在一实施例中，请参阅图6，上述的步骤S140可包括步骤S141～S142。

S141、对所述字段信息进行清洗和分类，以得到标准库。

在本实施例中，标准库是指将汇聚库内的数据按照类别的标准进行划分，形成的数据库。

S142、在汇聚库以及标准库的基础上构建主题库以及专题库。

通过数据清洗、标准分类，形成标准库，在汇聚库和标准库的基础上建立不同的主题库和专题库。其中，主题库是在汇聚库和标准库的基础之上，根据特定的需求，针对一组特定的某个案件类型、某个行政单位或者某些特殊类型而进行分类的数据集合层。根据特定需求建立主题库，主要包括：当事人信息库、商标信息库、专利信息库、专利对比文件库，如表1所示。专题库：当事人案件库、当事人证据库、行政机关证据库，如表2所示。

表1.知识产权专题库

表2.知识产权专题库

S150、获取需要分析的知识产权案件信息，以得到待分析信息。

在本实施例中，待分析信息是指由终端输入且包括待分析的知识产权案件的名称、申请人之类的信息，比如侵权知识产权案件中侵权双方的关键信息，如双方案件的名称。

S160、根据待分析信息对主题库以及专题库进行数据的分析以及挖掘，以得到分析结果。

在本实施例中，分析结果是指从主题库以及专题库内提取与待分析信息相关的知识产权数据，并进行区别点标注所形成的内容。

在一实施例中，请参阅图7，上述的步骤S160可包括步骤S161～S162。

S161、将待分析信息作为搜索条件在专题库以及主题库内进行内容搜索，以得到搜索结果。

在本实施例中，搜索结果是指专题库以及主题库内与待分析信息相关的内容。

S162、筛选搜索结果中与待分析信息不同的内容，并进行标注，以得到分析结果。

将待分析信息作为搜索条件，通过专题库、主题库得到对应信息，进行组合，比如：根据当事人信息库内存储的当事人信息，如姓名、性别、年龄、国籍、证件类型、证件号码、职业、政治面貌、单位、家庭住址等，确定当事人，根据确定的当事人从当事人案件库中获取到当事人案件信息，同时根据当事人信息，获取当事人证据库及确定其所对应的案件信息中的行政机关信息，将行政机关证据从行政机关证据库中提取出来，根据识别出的当事人案件信息提取出商标信息库与专利信息库中的全部数据，再根据专利信息库中的专利信息，提取出专利对比文件库中的全部数据，可以将以上所有库中提取出的数据反馈至终端，便于办案人员使用。

S170、反馈所述分析结果至终端，以在终端显示所述分析结果。

自动从法院办案卷宗数据、检察院统一业务系统数据、外部数据中获取、分析、识别、提取办案人员需要的数据，节约办案时间。从检察官、法院办案角度对案件的办理起到积极作用，更能体现出对社会和谐发展的馈赠，为办理知识产权类案件人员节省大量办案时间，提高办案效率。

举个例子，通过高检案卷数据、文书数据中提取了商标名称、申请/注册号、注册时间、类似群，确定当前案件为商标纠纷案件，从文书中根据提及到的引证商标一、引证商标二、引证商标三，分析涉及到的引证商标共有3个。类似群一般指的是商品或服务的功能、用途和销售渠道相类似；检索查询时应一并将目标群组和类似群组进行检索。

服务器依据对案案卷数据、文书数据的解析，智能识别出案件涉及到的诉争商标和3个引证商标的信息，包括诉争商标与三个引证商标的商标名称、申请/注册号、申请时间、注册时间以及诉争商标的类似群和具体商品名称，存储于主题库中的商标信息库内，平台能够读取卷宗列表，实现对卷宗列表的优先解析，并通过列表名称及文书题目，自动提取卷宗中涉及字段，同时对于商标类的图形文件，进行下载及拉取，为后续工作做准备；对商标信息库内的信息进行判断，分析出未从文书中提取到的数据，如三个引证商标的类似群、具体商品名称，根据这两个特定的字段从国家专利局的商标网上抓取对应的引证商标信息进行补充，将抓取到三个引证商标对应的商标图标图片、类似群与具体商品名称，存储于商标信息库内；平台会根据既往案件，构建不同类型的商标查询综合体，这种商标查询综合体是从案件角度出发，将全国出现的商标争议案件判决形成比较体系，如某科技公司彼此诉讼，出现商标争议，则商标所属行业为哪些、商标注册时间为何时，商标争议焦点表述内容，同时应用AI识别，将卷宗中商标提取，依托AI图像识别，形成商标外观关键点的分析结果，此时就可以将以上列举的几点进行横向对比，并根据对比结果形成打分，同时比对判决结果，不断矫正商标查询综合体的准确度，为下一步工作做准备。将库内所有存储的商标信息展示在商标信息页面，同时将诉争商标和引证商标的注册时间、类似群、具体商品名称进行对比，标记出诉争商标和三个引证商标注册时间、类似群、具体商品名称的不同之处：(1)注册时间，如诉争商标与引证商标的注册年份和月份都相同，则将日单独标记出来，年份、月份标记规则与日相同；(2)类似群，比较诉争商标和三个引证商标的类似群，将相同的类似群标记出来，如诉争商标的类似群内包含4227这个类似群，引证商标的类似群内也包含这个类似群，则在诉争商标和引证商标的类似群内将其标记出来；(3)具体商标名称，比较诉争商标和引证商标的具体商品名称是否有相同的，如果有，则在引证商标与诉争商标内同时将其标记出来；以此展现形式将更好的便于办案人员在办理案件时了解案件信息。通过以上的分析可得出下图的结果，结合打分结果及检察官对既往案件的判断，形成对争议商标判决结果的认定等情况判断。上述阐述了如何构建对应的数据库，当获取到待分析信息后，可以借助上述的数据库，将对应的信息进行挖掘和分析，由此形成分析结果呈现至终端，便于协助终端持有者进行查阅以及办案处理。根据以上的分析方法，可以查看到诉争商标和引证商标较为全面的信息，同时可以初步判断出诉争商标和引证商标的争议之处即标记出来的注册时间、类似群与具体商品名称，从而便于办案人员在办理案件时更好的分析案情，有助于法院、检察院对案件的审查做出正确的决策。

本方法能够快速、准确提取案件中知识产权信息，法院、检察院办案人员能够快速了解案件中涉及到的多方商标、专利信息，不必耗费大量时间查找，提高办案效率。且提供当事人基本信息及涉案情况，便于办案人员更全面的了解当事人，针对当事人的实际情况进行分析，提高决策能力。将案件信息分析后，提取出关键信息，便于办案人员查看，避免办案人员耗费精力在无关信息上，抓住办案的核心问题，解决办案人员知识产权知识存储不足问题。

上述的知识产权案件分析方法，通过先从不同的来源获取到所有知识产权数据，再对这些数据进行数据分析、数据识别以及数据提取后，构成专题库以及主题库，当有需要分析知识产权案件的需求时，依据待分析信息从主题库以及专题库内筛选出对应的内容并进行分析，形成分析结果反馈至终端，无需耗费大量时间以及人力进行多方查找对应的信息，实现快速查找知识产权案件相关信息，节省案件处理时间，提高案件处理效率。

图8是本发明实施例提供的一种知识产权案件分析装置300的示意性框图。如图8所示，对应于以上知识产权案件分析方法，本发明还提供一种知识产权案件分析装置300。该知识产权案件分析装置300包括用于执行上述知识产权案件分析方法的单元，该装置可以被配置于服务器中。具体地，请参阅图8，该知识产权案件分析装置300包括初始信息获取单元301、数据分析单元302、数据识别单元303、构建单元304、待分析信息获取单元305、分析挖掘单元306以及反馈单元307。

初始信息获取单元301，用于根据不同的数据源获取对应的知识产权信息，以得到初始信息；数据分析单元302，用于对所述初始信息进行数据分析，以得到汇聚库；数据识别单元303，用于对汇聚库内的数据进行数据识别，以得到字段信息；构建单元304，用于对所述字段信息进行数据处理并构建对应的数据库，以得到主题库以及专题库；待分析信息获取单元305，用于获取需要分析的知识产权案件信息，以得到待分析信息；分析挖掘单元306，用于根据待分析信息对主题库以及专题库进行数据的分析以及挖掘，以得到分析结果；反馈单元307，用于反馈所述分析结果至终端，以在终端显示所述分析结果。

在一实施例中，如图9所示，所述数据分析单元302包括信息划分子单元3021、格式转换子单元3022以及汇集子单元3023。

信息划分子单元3021，用于对所述初始信息划分为结构化数据和非结构化数据；格式转换子单元3022，用于对非结构化数据进行格式转换，以得到转换文件；汇集子单元3023，用于对所述结构化数据通过定时抽取的方式进行汇聚，并与转换文件进行整合，以得到汇聚库。

在一实施例中，请参阅图10，所述格式转换子单元3022包括规则确定模块30221以及转换模块30222。

规则确定模块30221，用于根据预设的规则库确定非结构化数据的定义描述以及格式转换规则；转换模块30222，用于根据定义描述以及格式转换规则对非结构化数据进行转换，以得到转换文件。

在一实施例中，请参阅图11，所述数据识别单元303包括扫描子单元3031以及识别子单元3032。

扫描子单元3031，用于对汇聚库内的数据进行扫描，以得到扫描内容；识别子单元3032，用于对扫描内容按照商标和专利的结构进行数据识别，以得到字段信息。

在一实施例中，请参阅图12，所述构建单元304包括分类子单元3041以及数据库构建子单元3042。

分类子单元3041，用于对所述字段信息进行清洗和分类，以得到标准库；数据库构建子单元3042，用于在汇聚库以及标准库的基础上构建主题库以及专题库。

在一实施例中，请参阅图13，所述分析挖掘单元306包括搜索子单元3061以及筛选子单元3062。

搜索子单元3061，用于将待分析信息作为搜索条件在专题库以及主题库内进行内容搜索，以得到搜索结果；筛选子单元3062，用于筛选搜索结果中与待分析信息不同的内容，并进行标注，以得到分析结果。

需要说明的是，所属领域的技术人员可以清楚地了解到，上述知识产权案件分析装置300和各单元的具体实现过程，可以参考前述方法实施例中的相应描述，为了描述的方便和简洁，在此不再赘述。

上述知识产权案件分析装置300可以实现为一种计算机程序的形式，该计算机程序可以在如14所示的计算机设备上运行。

请参阅图14，图14是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500是服务器，其中，服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。

参阅图14，该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令，该程序指令被执行时，可使得处理器502执行一种知识产权案件分析方法。

该处理器502用于提供计算和控制能力，以支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行一种知识产权案件分析方法。

该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解，图14中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现如下步骤：

根据不同的数据源获取对应的知识产权信息，以得到初始信息；对所述初始信息进行数据分析，以得到汇聚库；对汇聚库内的数据进行数据识别，以得到字段信息；对所述字段信息进行数据处理并构建对应的数据库，以得到主题库以及专题库；获取需要分析的知识产权案件信息，以得到待分析信息；根据待分析信息对主题库以及专题库进行数据的分析以及挖掘，以得到分析结果；反馈所述分析结果至终端，以在终端显示所述分析结果。

在一实施例中，处理器502在实现所述对所述初始信息进行数据分析，以得到汇聚库步骤时，具体实现如下步骤：

对所述初始信息划分为结构化数据和非结构化数据；对非结构化数据进行格式转换，以得到转换文件；对所述结构化数据通过定时抽取的方式进行汇聚，并与转换文件进行整合，以得到汇聚库。

在一实施例中，处理器502在实现所述对非结构化数据进行格式转换，以得到转换文件步骤时，具体实现如下步骤：

根据预设的规则库确定非结构化数据的定义描述以及格式转换规则；根据定义描述以及格式转换规则对非结构化数据进行转换，以得到转换文件。

在一实施例中，处理器502在实现所述对汇聚库内的数据进行数据识别，以得到字段信息步骤时，具体实现如下步骤：

对汇聚库内的数据进行扫描，以得到扫描内容；对扫描内容按照商标和专利的结构进行数据识别，以得到字段信息。

在一实施例中，处理器502在实现所述对所述字段信息进行数据处理并构建对应的数据库，以得到主题库以及专题库步骤时，具体实现如下步骤：

对所述字段信息进行清洗和分类，以得到标准库；在汇聚库以及标准库的基础上构建主题库以及专题库。

在一实施例中，处理器502在实现所述根据待分析信息对主题库以及专题库进行数据的分析以及挖掘，以得到分析结果步骤时，具体实现如下步骤：

将待分析信息作为搜索条件在专题库以及主题库内进行内容搜索，以得到搜索结果；筛选搜索结果中与待分析信息不同的内容，并进行标注，以得到分析结果。

应当理解，在本申请实施例中，处理器502可以是中央处理单元(CentralProcessing Unit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令，计算机程序可存储于一存储介质中，该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行，以实现上述方法的实施例的流程步骤。

因此，本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序，其中该计算机程序被处理器执行时使处理器执行如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述对所述初始信息进行数据分析，以得到汇聚库步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述对非结构化数据进行格式转换，以得到转换文件步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述对汇聚库内的数据进行数据识别，以得到字段信息步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述对所述字段信息进行数据处理并构建对应的数据库，以得到主题库以及专题库步骤时，具体实现如下步骤：

在一实施例中，所述处理器在执行所述计算机程序而实现所述根据待分析信息对主题库以及专题库进行数据的分析以及挖掘，以得到分析结果步骤时，具体实现如下步骤：

所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的。例如，各个单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。

本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，终端，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.知识产权案件分析方法，其特征在于，包括：

对所述初始信息进行数据分析，以得到汇聚库；

对汇聚库内的数据进行数据识别，以得到字段信息；

获取需要分析的知识产权案件信息，以得到待分析信息；

反馈所述分析结果至终端，以在终端显示所述分析结果；

所述对所述初始信息进行数据分析，以得到汇聚库，包括：

对所述初始信息划分为结构化数据和非结构化数据；

对非结构化数据进行格式转换，以得到转换文件；

对所述结构化数据通过定时抽取的方式进行汇聚，并与转换文件进行整合，以得到汇聚库；

所述对非结构化数据进行格式转换，以得到转换文件，包括：

根据定义描述以及格式转换规则对非结构化数据进行转换，以得到转换文件；

在非结构化数据的格式转换开始前，首先要建立规则库，具体地，对非结构化数据格式进行定义与分析，将该定义存储到规则库中；对格式转换规则进行定义与分析，以形成转换规则，再将该转换规则存储到规则库中；对已知类型的非结构化数据描述，将这些描述存储到规则库中；根据转换规则描述所需的数据的格式转换规则，并存储到规则库中，先提取原始数据与目标数据的格式描述，其中，原始数据是指非结构化数据，目标数据是指结构化数据，如果规则库内没有这一项描述，则根据非结构化数据定义生成描述，并存储到规则库中；提取相应转换规则的描述内容，如果没有，根据格式转换规则进行描述并存储到规则库中，根据以上规则库设定的转换规则，可将非结构化数据转化为结构化数据。

2.根据权利要求1所述的知识产权案件分析方法，其特征在于，所述对汇聚库内的数据进行数据识别，以得到字段信息，包括：

对汇聚库内的数据进行扫描，以得到扫描内容；

3.根据权利要求1所述的知识产权案件分析方法，其特征在于，所述对所述字段信息进行数据处理并构建对应的数据库，以得到主题库以及专题库，包括：

对所述字段信息进行清洗和分类，以得到标准库；

在汇聚库以及标准库的基础上构建主题库以及专题库。

4.根据权利要求3所述的知识产权案件分析方法，其特征在于，所述根据待分析信息对主题库以及专题库进行数据的分析以及挖掘，以得到分析结果，包括：

5.知识产权案件分析装置，其特征在于，包括：

反馈单元，用于反馈所述分析结果至终端，以在终端显示所述分析结果；

所述数据分析单元包括：

汇集子单元，用于对所述结构化数据通过定时抽取的方式进行汇聚，并与转换文件进行整合，以得到汇聚库；

所述格式转换子单元包括规则确定模块以及转换模块；

规则确定模块，用于根据预设的规则库确定非结构化数据的定义描述以及格式转换规则；转换模块，用于根据定义描述以及格式转换规则对非结构化数据进行转换，以得到转换文件；

6.一种计算机设备，其特征在于，所述计算机设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的方法。

7.一种存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时可实现如权利要求1至4中任一项所述的方法。