CN113535787A - 一种基于dikw的专利智能辅助审查方法及系统 - Google Patents

一种基于dikw的专利智能辅助审查方法及系统 Download PDF

Info

Publication number
CN113535787A
CN113535787A CN202110659936.5A CN202110659936A CN113535787A CN 113535787 A CN113535787 A CN 113535787A CN 202110659936 A CN202110659936 A CN 202110659936A CN 113535787 A CN113535787 A CN 113535787A
Authority
CN
China
Prior art keywords
search
searching
map
user
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110659936.5A
Other languages
English (en)
Inventor
段玉聪
湛楼高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan University
Original Assignee
Hainan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan University filed Critical Hainan University
Priority to CN202110659936.5A priority Critical patent/CN113535787A/zh
Publication of CN113535787A publication Critical patent/CN113535787A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2425Iterative querying; Query formulation based on the results of a preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Technology Law (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于DIKW的专利智能辅助审查方法,包括下列步骤:构建DIKW图谱;确定用户投入以及用户搜索需求;根据用户搜索需求,遍历所述DIKW图谱以搜索与所述用户搜索需求相匹配的搜索结果,将所述搜索结果划分为具有正趋势的正向搜索结果以及具有负趋势的负向搜索结果;对所述正向搜索结果以及负向搜索结果进行递进搜索,并计算每次搜索结果的资源置信度,并判断双向搜索结果的资源置信度的正负比是否在阈值区间内,若是,输出置信度高的搜索结果,若否,继续对所述正向搜索结果以及负向搜索结果进行递进搜索,本申请可消除具有歧义倾向和虚假信息的资源,避免针对无限和复杂问题的死循环,从而提供一个高精度的搜索结果。

Description

一种基于DIKW的专利智能辅助审查方法及系统
技术领域
本发明涉及DIKW图谱技术领域,尤其涉及一种基于DIKW的专利智能辅助审查方法及系统。
背景技术
DIKW是关于数据、信息、知识和智慧的体系,它解释了四种元素之间的关系。其也在信息科学和知识管理领域中一直被讨论。它是最基本的,最广泛认可的和最理所当然的模型之一,DIKW图谱架构包括数据图谱、信息图谱和知识图谱。
数据图谱(Data Graph)是各种数据结构,如栈、队列等。其可以记录对象的频度属性,如时间频度、空间频度和结构频度等,然后通过计算它们的综合频度以服务信息图谱和知识图谱的信息清洗和语义计算。
信息图谱(Information Graph)用于存储专利内容资源间的各种交互关系,如产品组件之间的组合、产品设计的步骤等,并通过有向图的形式可视化展示。
知识图谱(Knowledge Graph)是用于记录规则的有向图,能够被用来进行各种语义计算。
专利文献CN111988339A公开一种基于DIKW模型的网络攻击路径发现、提取和关联的方法,属于网络安全技术领域。是为了解决传统网络检测方法只能发现孤立的攻击事件和判断单个攻击事件的威胁程度,缺少对攻击事件信息提取分析能力和对攻击态势整体判断能力的问题。对网络攻击信息进行总结形成知识图谱,通过采集的网络行为数据D与知识K库进行比对匹配,对匹配到的网络行为数据D进行扩展、去重与合并,得到的攻击信息I进入对应的智慧模型W,判定信息I和关联信息是否满足智慧模型W中的逻辑关系,是则生成攻击事件链条,否则对攻击信息I进行存盘。适用于传统互联网,工业互联网、移动互联网和物联网等网络安全领域。
专利文献CN111858960A公开一种面向本质计算的跨DIKW图谱的虚拟社区资源处理方法、装置、设备及可读存储介质,该方法包括:利用虚拟社区的网络类型资源,建立DIKW图谱;DIKW图谱中包括数据图谱、信息图谱和知识图谱;对DIKW图谱中的数据、信息和知识进行相互转换,并利用转换结果更新DIKW图谱,直到DIKW图谱达到动态平衡;从DIKW图谱中提取目标客户端的交互关系元组,并利用交互关系元组确定出目标客户端的亲密交流关系客户端;结合交互关系元组和亲密交流关系客户端,确定目标客户端的特征标签;从虚拟社区中确定出与特征标签对应的目标资源,并将目标资源分配给目标客户端。该本方法能够实现个性化分配资源,能够满足用户的个性化需求。
专利文献CN112232082A公开一种面向本质计算的多模态DIKW内容多语义分析方法,该方法包括以下步骤:S1、获取类型资源进行语义识别,根据识别结果判断是否存在多语义,所述类型资源包括数据资源DDIKW、信息资源IDIKW和知识资源KDIKW;S2、存在多语义时,分析多语义形成原因;S3、基于多语义形成原因,采用相应策略将原类型资源转换为新的类型资源,获取最终语义识别结果。本发明可以帮助人工智能系统提高语言文本识别效率,并提高识别结果准确率。
在发明专利的智能辅助审查过程中,不可或缺的是对现有发明技术的检索需求,如何找到审查员想要的现有技术在审查中是非常重要的,目前现有技术中并未发现将DIKW图谱用于专利审查的搜索技术,因此,将DIKW图谱用于专利审查的搜索分析依然是本领域技术人员的研究方向。
发明内容
本发明的目的在于提供一种基于DIKW的专利智能辅助审查方法及系统,在审查检索过程中,针对具有正向和负向趋势的问题提供渐进式搜索方法,通过多次渐进式搜索来提高资源的可信度,在渐进式搜索过程中,将消除具有歧义倾向和虚假信息的资源,避免针对无限和复杂问题的死循环,从而提供一个高精度的搜索结果。
本发明是通过以下技术方案实现的:本发明第一方面提供了一种基于DIKW的专利智能辅助审查方法,包括下列步骤:
基于基础数据,构建DIKW图谱,其中所述基础数据至少包括专利数据库中的专利数据,所述DIKW图谱至少包括数据图谱、信息图谱以及知识图谱;
确定用户投入以及用户搜索需求;
根据用户搜索需求,遍历所述DIKW图谱以搜索与所述用户搜索需求相匹配的搜索结果,将所述搜索结果划分为具有正趋势的正向搜索结果以及具有负趋势的负向搜索结果;
对所述正向搜索结果以及负向搜索结果进行递进搜索,并计算每次搜索结果的资源置信度;
基于所述资源置信度,判断双向搜索结果的资源置信度的正负比是否在阈值区间内,若是,输出置信度高的搜索结果,若否,继续对所述正向搜索结果以及负向搜索结果进行递进搜索。
可选的,所述用户投入至少包括用户为了获得搜索结果所付出的时间以及金钱代价。
可选的,遍历所述DIKW图谱以搜索与所述用户搜索需求相匹配的搜索结果,包括:
依次计算数据图谱、信息图谱以及知识图谱的搜索效率;
若所述数据图谱的搜索效率大于所述信息图谱以及知识图谱的搜索效率,则通过所述数据图谱搜索与所述用户搜索需求相匹配的搜索结果;
若所述数据图谱的搜索效率大于所述信息图谱的搜索效率,且所述数据图谱的搜索效率小于所述知识图谱的搜索效率,则通过所述知识图谱搜索与所述用户搜索需求相匹配的搜索结果;
若所述数据图谱的搜索效率小于所述信息图谱的搜索效率,且所述信息图谱的搜索效率大于所述知识图谱的搜索效率,则通过所述知识图谱搜索与所述用户搜索需求相匹配的搜索结果;
若所述数据图谱的搜索效率小于所述信息图谱的搜索效率,且所述信息图谱的搜索效率小于所述知识图谱的搜索效率,则通过所述信息图谱搜索与所述用户搜索需求相匹配的搜索结果。
可选的,对所述正向搜索结果以及负向搜索结果进行递进搜索,包括:
计算具有正趋势的正向搜索结果权重Weightp和具有负趋势的负向搜索结果权重WeightN,其具体的计算方式为:正向搜索结果权重
Figure BDA0003112974640000041
其负向搜索结果权重
Figure BDA0003112974640000042
其中ResourceP代表正向搜索结果,ResourceN代表负向搜索结果,所述ResourceT代表所有资源的量;
根据得到的正负双向搜索结果所在权重分配用户投入,确定正向和反向搜索分别要花费的时间和金钱,其中正向/反向递进搜索需要花费的时间通过下式进行计算:T(P/N)=T*Weight(P/N),而正向/反向递进搜索需要花费的金钱通过下式进行计算:M(P/N)=M*Weight(P/N),其中T(P/N)表示正向与反向搜索分别要花费的时间,M(P/N)表示正向与反向搜索分别要花费的金钱,P/N表示正或反;
将正向/反向递进搜索需要花费的时间以及金钱与用户投入进行对比,进而确定正负双向搜索分别要递进搜索的次数。
可选的,计算每次搜索结果的资源置信度,包括:
计算信息熵
Figure BDA0003112974640000051
其中
Figure BDA0003112974640000052
表示逐次搜索中的某个因素在时间TK中获得的资源的熵,pi表示每种类型答案的概率;
计算一定的相关因子进行渐进式搜索时,不同条件下资源的加权平均熵
Figure BDA0003112974640000053
其中
Figure BDA0003112974640000054
基于下式计算搜索结果的资源置信度
Figure BDA0003112974640000055
可选的,判断双向搜索结果的资源置信度的正负比是否在阈值区间内,包括:
Figure BDA0003112974640000056
则将正向搜索结果作为高置信度结果返回给用户;
Figure BDA0003112974640000057
则将负向搜索结果作为高置信度结果返回给用户;
其中,τ为阈值。
可选的,所述方法还包括,若用户对所述高置信度的搜索结果不满意,重新设定确定用户投入以及用户搜索需求,从而获得新的高置信度搜索结果。
本发明第二方面提供了基于DIKW的专利智能辅助审查系统,其包括:
DIKW图谱生成模块,用于根据基础数据,生成至少包括数据图谱、信息图谱以及知识图谱在内的DIKW图谱;
用户需求输入模块,用于输入用户投入以及用户搜索需求;
第一搜索模块,根据用户搜索需求,遍历所述DIKW图谱以搜索与所述用户搜索需求相匹配的搜索结果,将所述搜索结果划分为具有正趋势的正向搜索结果以及具有负趋势的负向搜索结果;
第二搜索模块,用于将所述正向搜索结果以及负向搜索结果进行递进搜索,并计算每次搜索结果的资源置信度;
结果输出模块,用于判断双向搜索结果的资源置信度的正负比是否在阈值区间内,并且输出置信度高的搜索结果。
与现有技术相比,本发明达到的有益效果如下:
本发明提供的一种基于DIKW的专利智能辅助审查方法及系统,针对具有正向和负向趋势的问题提供渐进式搜索方法,通过多次渐进式搜索来提高资源的可信度,在渐进式搜索过程中,将消除具有歧义倾向和虚假信息的资源,避免针对无限和复杂问题的死循环,从而提供一个高精度的搜索结果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的优选实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种基于DIKW的专利智能辅助审查方法的流程图;
图2为本发明提供的一种基于DIKW的搜索效率计算方法的流程图;
图3为本发明提供的一种对正向搜索结果以及负向搜索结果进行递进搜索的搜索方法的流程图;
图4为本发明实施例提供的基于DIKW的专利智能辅助审查系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,本发明第一方面提供了一种基于DIKW的专利智能辅助审查方法,包括下列步骤:
步骤S1、基于基础数据,构建DIKW图谱,其中所述基础数据至少包括专利数据库中的专利数据,所述DIKW图谱至少包括数据图谱、信息图谱以及知识图谱;
步骤S2、确定用户投入以及用户搜索需求;
步骤S3、根据用户搜索需求,遍历所述DIKW图谱以搜索与所述用户搜索需求相匹配的搜索结果,将所述搜索结果划分为具有正趋势的正向搜索结果以及具有负趋势的负向搜索结果;
步骤S4、对所述正向搜索结果以及负向搜索结果进行递进搜索,并计算每次搜索结果的资源置信度;
步骤S5、基于所述资源置信度,判断双向搜索结果的资源置信度的正负比是否在阈值区间内,若是,输出置信度高的搜索结果,若否,继续对所述正向搜索结果以及负向搜索结果进行递进搜索。
进一步的,在步骤S1中,DIKW图谱由服务器根据国知局专利数据库中的所有内容建立,也可以由中文文献数据库或英文文献数据库建立,其中中文文献数据库或英文文献数据库至少包括中国知网文献数据库、万方文献数据库、中国国家图书馆文献数据库中的一种或多种。
具体的,其数据资源可以理解为结构化的资源,例如发明人,申请号,代理人等;信息资源可以理解为非结构化的资源,例如摘要或说明书中或文献中的特定句子等;信息图谱可以理解为专利内容资源间的各种交互关系,例如如产品组件之间的组合、产品设计的步骤等,而知识图谱可以理解为客观存在的限定规则,例如权利要求的限定项数等。
在步骤S2中,其用户投入至少包括用户为了获得搜索结果所付出的时间以及金钱代价,而用户搜索需求可以为专利中的发明人的信息、申请号、代理人、摘要、技术方案等,即用户根据自身需求输入的关键字进行搜索,资源总量为资源的集合。
当用户输入的是申请号时,直接将申请号在数据图谱中遍历,直接就能找到;当用户输入的是句子时,在信息图谱中遍历相似的句子结构、步骤、过程等;当用户输入的是规则时,跟在信息图谱中遍历的情形一样,不过搜索的是规则信息;在专利检索中,有些内容可以理解为信息,也可以理解为知识,数据信息知识都是可以相互转化的。
关于构建DIKW图谱的相关内容,可以参见申请人同日申请的专利申请文件,其发明名称为“基于DIKW图谱的专利智能辅助答复方法及系统”,而关于DIKW的其他相关内容可以参见申请人同日申请的另外两篇专利申请文件,发明名称分别为“一种基于DIKW的专利智能申请方法及系统”,“一种基于DIKW的专利内容检索方法及系统”。
参见图2,本申请还公开了一种搜索效率计算方法,用于计算数据图谱、信息图谱以及知识图谱的搜索效率,其步骤S3还包括下列子步骤:
步骤一:根据用户搜索的需求确定搜索目标集合,包括资源类型和资源总量;
步骤二:计算在DIKW图谱各层上的搜索资源代价:
SearchCost=(λ*α*scale(GraphDIK)+(1-λ)*β*ReasoningCost)*|Initial_res|
ReasoningCost=Ncost+Ecost
其中scale表示图谱的规模,即节点数和边的个数,GraphDIK代表DIKW图谱中的DIKW资源,ReasoningCost表示知识推理代价,λ表示图谱上存在答案的概率,α和β表示直接搜索代价和推理代价占搜索代价的权重,Ncost表示推理出新节点的代价,Ecost表示推理出新关系的代价;
步骤三、计算在数据图谱、信息图谱以及知识图谱上搜索目标资源的效率:
Figure BDA0003112974640000091
其中|Resource|表示在该层图谱上搜索到的资源量。
进一步的,本申请还公开了一种搜索方法,用于遍历所述DIKW图谱以搜索与所述用户搜索需求相匹配的搜索结果,其包括下列步骤:
步骤一、若数据图谱的搜索效率大于所述信息图谱以及知识图谱的搜索效率,则通过所述数据图谱搜索与所述用户搜索需求相匹配的搜索结果;
步骤二、若所述数据图谱的搜索效率大于所述信息图谱的搜索效率,且所述数据图谱的搜索效率小于所述知识图谱的搜索效率,则通过所述知识图谱搜索与所述用户搜索需求相匹配的搜索结果;
步骤三、若所述数据图谱的搜索效率小于所述信息图谱的搜索效率,且所述信息图谱的搜索效率大于所述知识图谱的搜索效率,则通过所述知识图谱搜索与所述用户搜索需求相匹配的搜索结果;
步骤四、若所述数据图谱的搜索效率小于所述信息图谱的搜索效率,且所述信息图谱的搜索效率小于所述知识图谱的搜索效率,则通过所述信息图谱搜索与所述用户搜索需求相匹配的搜索结果。
参见图3,本申请实施例提供的对所述正向搜索结果以及负向搜索结果进行递进搜索的搜索方法,步骤S4还包括下列子步骤:
计算具有正趋势的正向搜索结果权重Weightp和具有负趋势的负向搜索结果权重WeightN,其具体的计算方式为:正向搜索结果权重
Figure BDA0003112974640000092
其负向搜索结果权重
Figure BDA0003112974640000093
其中ResourceP代表正向搜索结果,ResourceN代表负向搜索结果,所述ResourceT代表所有资源的量;
根据得到的正负双向搜索结果所在权重分配用户投入,确定正向和反向搜索分别要花费的时间和金钱。
在本申请的实施方式中,其正向/反向递进搜索需要花费的时间通过下式进行计算:T(P/N)=T*Weight(P/N),其中T=S_times*S_items*Pert_item,S_times表示由用户投资预设的渐进式搜索时间,S_items表示每次搜索的项目数量,Pert_item表示每个项目的搜索时间
同理,正向/反向递进搜索需要花费的金钱通过下式进行计算:M(P/N)=M*Weight(P/N)
其中T(P/N)表示正向与反向搜索分别要花费的时间,M(P/N)表示正向与反向搜索分别要花费的金钱,P/N表示正或反;
将正向/反向递进搜索需要花费的时间以及金钱与用户投入进行对比,若多次搜索所花费的总时间以及总金钱超过了用户的投入,则重新选择新的搜索次数,直到多次搜索所花费的总时间以及总金钱无限逼近用户的投入,进而确定正负双向搜索分别要递进搜索的次数。
更进一步的,在步骤S5中,计算每次搜索结果的资源置信度,包括:
计算信息熵
Figure BDA0003112974640000101
其中
Figure BDA0003112974640000102
表示逐次搜索中的某个因素在时间TK中获得的资源的熵,pi表示每种类型答案的概率;
计算一定的相关因子进行渐进式搜索时,不同条件下资源的加权平均熵
Figure BDA0003112974640000103
其中资源的时效性
Figure BDA0003112974640000104
Tt是资源终止传播的时间,Tc是当前搜索者搜索资源的时间,Ts是资源开始出现的时间;
基于下式计算搜索结果的资源置信度
Figure BDA0003112974640000111
可选的,在本申请的实施例中,判断双向搜索结果的资源置信度的正负比是否在阈值区间内,包括:
Figure BDA0003112974640000112
则将正向搜索结果作为高置信度结果返回给用户;
Figure BDA0003112974640000113
则将负向搜索结果作为高置信度结果返回给用户;
其中,τ为阈值,优选的,所述阈值取为1,即当
Figure BDA0003112974640000114
时,则将正向搜索结果作为高置信度结果返回给用户,当
Figure BDA0003112974640000115
则将负向搜索结果作为高置信度结果返回给用户.
可选的,在本申请的一个可选实施方式中,所述方法还包括,若用户对所述高置信度的搜索结果不满意,重新设定确定用户投入以及用户搜索需求,并重复步骤S1-S5,从而获得新的高置信度搜索结果,其高置信度的搜索结果即作为检索结果呈现给审查员,帮助审查员快速、精确的找到现有技术。
参见图4,本发明第二方面提供了基于DIKW的专利智能辅助审查系统,其包括:
DIKW图谱生成模块501,用于根据基础数据,生成至少包括数据图谱、信息图谱以及知识图谱在内的DIKW图谱;
用户需求输入模块502,用于输入用户投入以及用户搜索需求;
第一搜索模块503,根据用户搜索需求,遍历所述DIKW图谱以搜索与所述用户搜索需求相匹配的搜索结果,将所述搜索结果划分为具有正趋势的正向搜索结果以及具有负趋势的负向搜索结果;
第二搜索模块504,用于将所述正向搜索结果以及负向搜索结果进行递进搜索,并计算每次搜索结果的资源置信度;
结果输出模块505,用于判断双向搜索结果的资源置信度的正负比是否在阈值区间内,并且输出置信度高的搜索结果。
需要说明的是,本发明实施例提供的基于DIKW的专利智能辅助审查系统与前述实施例所述的基于DIKW的专利智能辅助审查方法属于相同的技术构思,其具体实施过程可参照前述实施例中对方法步骤的说明,在此不再赘述。
应当理解,以上基于DIKW的专利智能辅助审查系统包括的单元仅为根据该装置实现的功能进行的逻辑划分,实际应用中,可以进行上述单元的叠加或拆分。并且该实施例提供的基于DIKW的专利智能辅助审查系统所实现的功能与上述实施例提供的基于DIKW的专利智能辅助审查方法一一对应,对于该装置所实现的更为详细的处理流程,在上述方法实施例中已做详细描述,此处不再详细描述。
另外,本发明还包括服务器,其服务器包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上文所述的基于DIKW的专利智能辅助审查方法,或者,运行如上文所述的基于DIKW的专利智能辅助审查系统。
需要说明的是:本发明实施例提供的基于DIKW的专利智能辅助审查方法的先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (9)

1.一种基于DIKW的专利智能辅助审查方法,其特征在于,包括下列步骤:
基于基础数据,构建DIKW图谱,其中所述基础数据至少包括专利数据库中的专利数据,所述DIKW图谱至少包括数据图谱、信息图谱以及知识图谱;
确定用户投入以及用户搜索需求;
根据用户搜索需求,遍历所述DIKW图谱以搜索与所述用户搜索需求相匹配的搜索结果,将所述搜索结果划分为具有正趋势的正向搜索结果以及具有负趋势的负向搜索结果;
对所述正向搜索结果以及负向搜索结果进行递进搜索,并计算每次搜索结果的资源置信度;
基于所述资源置信度,判断双向搜索结果的资源置信度的正负比是否在阈值区间内,若是,输出置信度高的搜索结果,若否,继续对所述正向搜索结果以及负向搜索结果进行递进搜索。
2.根据权利要求1所述的一种基于DIKW的专利智能辅助审查方法,其特征在于,所述用户投入至少包括用户为了获得搜索结果所付出的时间以及金钱代价。
3.根据权利要求1所述的一种基于DIKW的专利智能辅助审查方法,其特征在于,遍历所述DIKW图谱以搜索与所述用户搜索需求相匹配的搜索结果,包括:
依次计算数据图谱、信息图谱以及知识图谱的搜索效率;
若所述数据图谱的搜索效率大于所述信息图谱以及知识图谱的搜索效率,则通过所述数据图谱搜索与所述用户搜索需求相匹配的搜索结果;
若所述数据图谱的搜索效率大于所述信息图谱的搜索效率,且所述数据图谱的搜索效率小于所述知识图谱的搜索效率,则通过所述知识图谱搜索与所述用户搜索需求相匹配的搜索结果;
若所述数据图谱的搜索效率小于所述信息图谱的搜索效率,且所述信息图谱的搜索效率大于所述知识图谱的搜索效率,则通过所述知识图谱搜索与所述用户搜索需求相匹配的搜索结果;
若所述数据图谱的搜索效率小于所述信息图谱的搜索效率,且所述信息图谱的搜索效率小于所述知识图谱的搜索效率,则通过所述信息图谱搜索与所述用户搜索需求相匹配的搜索结果。
4.根据权利要求3所述的一种基于DIKW的专利智能辅助审查方法,其特征在于,对所述正向搜索结果以及负向搜索结果进行递进搜索,包括:
计算具有正趋势的正向搜索结果权重Weightp和具有负趋势的负向搜索结果权重WeightN,其具体的计算方式为:正向搜索结果权重
Figure FDA0003112974630000021
其负向搜索结果权重
Figure FDA0003112974630000022
其中ResourceP代表正向搜索结果,ResourceN代表负向搜索结果,所述ResourceT代表所有资源的量;
根据得到的正负双向搜索结果所在权重分配用户投入,确定正向和反向搜索分别要花费的时间和金钱,其中正向/反向递进搜索需要花费的时间通过下式进行计算:T(P/N)=T*Weight(P/N),而正向/反向递进搜索需要花费的金钱通过下式进行计算:M(P/N)=M*Weight(P/N),其中T(P/N)表示正向与反向搜索分别要花费的时间,M(P/N)表示正向与反向搜索分别要花费的金钱,P/N表示正或反;
将正向/反向递进搜索需要花费的时间以及金钱与用户投入进行对比,进而确定正负双向搜索分别要递进搜索的次数。
5.根据权利要求4所述的一种基于DIKW的专利智能辅助审查方法,其特征在于,计算每次搜索结果的资源置信度,包括:
计算信息熵
Figure FDA0003112974630000031
其中
Figure FDA0003112974630000032
表示逐次搜索中的某个因素在时间TK中获得的资源的熵,pi表示每种类型答案的概率;
计算一定的相关因子进行渐进式搜索时,不同条件下资源的加权平均熵
Figure FDA0003112974630000033
其中
Figure FDA0003112974630000034
Tt是资源终止传播的时间,Tc是当前搜索者搜索资源的时间,Ts是资源开始出现的时间;
基于下式计算搜索结果的资源置信度
Figure FDA0003112974630000035
6.根据权利要求5所述的一种基于DIKW的专利智能辅助审查方法,其特征在于,判断双向搜索结果的资源置信度的正负比是否在阈值区间内,包括:
Figure FDA0003112974630000036
则将正向搜索结果作为高置信度结果返回给用户;
Figure FDA0003112974630000037
则将负向搜索结果作为高置信度结果返回给用户;
其中,τ为阈值。
7.根据权利要求6所述的一种基于DIKW的专利智能辅助审查方法,其特征在于,所述方法还包括,若用户对所述高置信度的搜索结果不满意,重新确定用户投入以及用户搜索需求,从而获得新的高置信度搜索结果。
8.基于DIKW的专利智能辅助审查系统,其特征在于,其包括:
DIKW图谱生成模块,用于根据基础数据,生成至少包括数据图谱、信息图谱以及知识图谱在内的DIKW图谱;
用户需求输入模块,用于输入用户投入以及用户搜索需求;
第一搜索模块,根据用户搜索需求,遍历所述DIKW图谱以搜索与所述用户搜索需求相匹配的搜索结果,将所述搜索结果划分为具有正趋势的正向搜索结果以及具有负趋势的负向搜索结果;
第二搜索模块,用于将所述正向搜索结果以及负向搜索结果进行递进搜索,并计算每次搜索结果的资源置信度;
结果输出模块,用于判断双向搜索结果的资源置信度的正负比是否在阈值区间内,并且输出置信度高的搜索结果。
9.服务器,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-7任一项所述的基于DIKW的专利智能辅助审查方法,或者,运行如权利要求8所述的基于DIKW的专利智能辅助审查系统。
CN202110659936.5A 2021-06-11 2021-06-11 一种基于dikw的专利智能辅助审查方法及系统 Pending CN113535787A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110659936.5A CN113535787A (zh) 2021-06-11 2021-06-11 一种基于dikw的专利智能辅助审查方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110659936.5A CN113535787A (zh) 2021-06-11 2021-06-11 一种基于dikw的专利智能辅助审查方法及系统

Publications (1)

Publication Number Publication Date
CN113535787A true CN113535787A (zh) 2021-10-22

Family

ID=78124964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110659936.5A Pending CN113535787A (zh) 2021-06-11 2021-06-11 一种基于dikw的专利智能辅助审查方法及系统

Country Status (1)

Country Link
CN (1) CN113535787A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107016135A (zh) * 2017-06-09 2017-08-04 海南大学 一种面向非确定、不保真、超复杂资源环境的正反双向动态平衡搜索策略
CN107038263A (zh) * 2017-06-23 2017-08-11 海南大学 一种面向事务计算效率的基于数据图谱、信息图谱和知识图谱的搜索优化方法
CN107103100A (zh) * 2017-06-10 2017-08-29 海南大学 一种投入驱动的容错的基于数据图谱、信息图谱和知识图谱架构的智能语义搜索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107016135A (zh) * 2017-06-09 2017-08-04 海南大学 一种面向非确定、不保真、超复杂资源环境的正反双向动态平衡搜索策略
CN107103100A (zh) * 2017-06-10 2017-08-29 海南大学 一种投入驱动的容错的基于数据图谱、信息图谱和知识图谱架构的智能语义搜索方法
CN107038263A (zh) * 2017-06-23 2017-08-11 海南大学 一种面向事务计算效率的基于数据图谱、信息图谱和知识图谱的搜索优化方法

Similar Documents

Publication Publication Date Title
CN110704743B (zh) 一种基于知识图谱的语义搜索方法及装置
CN109101479A (zh) 一种用于中文语句的聚类方法及装置
CN110222045A (zh) 一种数据报表获取方法、装置及计算机设备、存储介质
CN106446162A (zh) 一种面向领域的本体知识库文本检索方法
CN108073576A (zh) 智能搜索方法、搜索装置以及搜索引擎系统
Liao et al. Coronavirus pandemic analysis through tripartite graph clustering in online social networks
CN113515589A (zh) 数据推荐方法、装置、设备以及介质
Phan et al. Building a Vietnamese question answering system based on knowledge graph and distributed CNN
CN113946686A (zh) 电力营销知识图谱构建方法及系统
CN114741581A (zh) 一种图像分类方法、装置、计算机设备及介质
Zulfa et al. Inter-structure and intra-structure similarity of use case diagram using greedy graph edit distance
CN116975271A (zh) 文本相关性的确定方法、装置、计算机设备和存储介质
CN113821588A (zh) 文本处理方法、装置、电子设备及存储介质
CN113343692A (zh) 搜索意图的识别方法、模型训练方法、装置、介质及设备
CN113535787A (zh) 一种基于dikw的专利智能辅助审查方法及系统
Origlia et al. A multi-source graph representation of the movie domain for recommendation dialogues analysis
CN115391551A (zh) 事件检测方法及装置
Swetha et al. Lexicon ontology driven concept lattice framework for semantic web service discovery
Mitsui et al. Query generation as result aggregation for knowledge representation
Bai et al. Entity Thematic Similarity Measurement for Personal Explainable Searching Services in the Edge Environment
Sukumar et al. Knowledge Graph Generation for Unstructured Data Using Data Processing Pipeline
Li et al. A framework of ontology-based knowledge management system
Narula et al. Improving statistical multimedia information retrieval model by using ontology
Sheeba et al. A fuzzy logic based improved keyword extraction from meeting transcripts
de Sousa et al. Using a Domain Ontology to Bridge the Gap between User Intention and Expression in Natural Language Queries.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211022

RJ01 Rejection of invention patent application after publication