CN115905577B - 知识图谱的构建方法及装置、法规检索方法和装置 - Google Patents
知识图谱的构建方法及装置、法规检索方法和装置 Download PDFInfo
- Publication number
- CN115905577B CN115905577B CN202310137202.XA CN202310137202A CN115905577B CN 115905577 B CN115905577 B CN 115905577B CN 202310137202 A CN202310137202 A CN 202310137202A CN 115905577 B CN115905577 B CN 115905577B
- Authority
- CN
- China
- Prior art keywords
- class
- target
- node
- class node
- nodes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供了一种基于法规文件的知识图谱的构建方法以及法规检索方法。该方法包括:针对每一份法规文件,从该法规文件的标题中提取出主题词;对于提取出的每一个主题词,使用所述知识图谱中的一个第一类节点表征该主题词;对于每一个法规文件,使用所述知识图谱中的一个第二类节点表征该法规文件;如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系,从而生成所述基于法规文件的知识图谱,并基于该知识图谱进行法规的检索。本说明书实施例能够针对法规文件快速、准确地得到检索结果。
Description
技术领域
本说明书一个或多个实施例涉及网络通信技术,尤其涉及基于法规文件的知识图谱的构建方法及装置、法规检索方法和装置。
背景技术
各种机构及组织颁发了海量的法律、部门规则、规范性文件以及各类通知要求等。当用户需要开展一个业务项目时,需要了解与该类型的业务项目相关的法规要求,从而才能保证业务项目的执行符合相关法规要求。
在现有技术中,会在系统中保存各类型的法规文件,当用户向系统中输入需要检索的法规相关的查询关键词时,系统会搜索出包括该查询关键词的相关法规文件,并提供给用户。
可见,在现有技术中,只是按照常用的关键词搜索方法来检索用户需要的法规文件,这样往往会导致检索结果不准确,比如无法检索出有价值的、相关性强的法规文件。因此,需要一种更为有效的法规检索方法。
发明内容
本说明书一个或多个实施例描述了基于法规文件的知识图谱的构建方法及装置、法规检索方法和装置,能够针对法规文件快速、准确地得到检索结果。
根据第一方面,提供了一种基于法规文件的知识图谱的构建方法,其中,该方法包括:
针对每一份法规文件,从该法规文件的标题中提取出主题词;
对于提取出的每一个主题词,使用所述知识图谱中的一个第一类节点表征该主题词;
对于每一个法规文件,使用所述知识图谱中的一个第二类节点表征该法规文件;
并且,执行如下操作中的至少一项:
如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系;
如果两个第一类节点所表征的两个主题词是从同一个法规文件的标题中提取出来的,则在该两个第一类节点之间连接一条边,并设置该边的属性为共现关系;
如果一个第二类节点表征的法规文件是依据另一个第二类节点表征的法规文件而制定的,则在该两个第二类节点之间连接一条边,并设置该边的属性为依据关系;
其中,所述主题词包括如下中的至少一种:与机构相关的机构词、与地区相关的地区词、与法规内容相关的业务词。
根据第二方面,提供了法规检索方法,其中,该方法包括:
得到用户的查询关键词;
在预先构建的基于法规文件的知识图谱中,根据各个第一类节点所表征的各个主题词查找与用户的查询关键词相匹配的目标第一类节点;
在基于法规文件的知识图谱中,查找与目标第一类节点之间连接有边的目标第二类节点;
将查找到的目标第二类节点所表征的法规文件作为检索结果;
其中,基于法规文件的知识图谱的构建方法包括:
针对每一份法规文件,从该法规文件的标题中提取出主题词;
对于提取出的每一个主题词,使用所述知识图谱中的一个第一类节点表征该主题词;
对于每一个法规文件,使用所述知识图谱中的一个第二类节点表征该法规文件;
如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系。
根据第三方面,提供了基于法规文件的知识图谱的构建装置,其中,该装置包括:
主题词提取模块,配置为针对每一份法规文件,从该法规文件的标题中提取出主题词;
第一类节点设置模块,配置为对于提取出的每一个主题词,使用所述知识图谱中的一个第一类节点表征该主题词;
第二类节点设置模块,配置为对于每一个法规文件,使用所述知识图谱中的一个第二类节点表征该法规文件;
边设置模块,配置为执行如下操作中的至少一项:
如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系;
如果两个第一类节点所表征的两个主题词是从同一个法规文件的标题中提取出来的,则在该两个第一类节点之间连接一条边,并设置该边的属性为共现关系;
如果一个第二类节点表征的法规文件是依据另一个第二类节点表征的法规文件而制定的,则在该两个第二类节点之间连接一条边,并设置该边的属性为依据关系;
其中,所述主题词包括如下中的至少一种:与机构相关的机构词、与地区相关的地区词、与法规内容相关的业务词。
根据第四方面,提供了法规检索装置,其中,该装置包括:
查询关键词获取模块,配置为得到用户的查询关键词;
匹配模块,配置为在基于法规文件的知识图谱中,根据各个第一类节点所表征的各个主题词查找与用户的查询关键词相匹配的目标第一类节点;
查找模块,配置为在基于法规文件的知识图谱中,查找与目标第一类节点之间连接有边的目标第二类节点;
检索结果处理模块,配置为将查找到的目标第二类节点所表征的法规文件作为检索结果。
根据第五方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现本说明书任一实施例所述的方法。
本说明书实施例提供的知识图谱的构建方法及法规的检索方法及装置,将主题词作为知识图谱的一类节点,这样,就保证了在后续利用知识图谱进行法规检索时,是基于法规文件中出现过的词,以词为单位进行检索,比如“理财”是作为一个词出现过,而不是现有技术中只要包括“理财”这两个字比如“办理财产”就认为匹配成功,即不是现有技术中以字为单位进行检索。并且,将法规文件作为知识图谱中的另一类节点,通过两类节点之间的连接边,则可以体现主题词与法规文件之间的关联关系,从而可以实现后续快速、准确的法规检索。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书一个实施例中基于法规文件的知识图谱的构建方法的流程图。
图2是本说明书一个实施例中利用属性为关联关系的边所构建的知识图谱的示意图。
图3是本说明书一个实施例中利用属性为关联关系的边、属性为共现关系的边所构建的知识图谱的示意图。
图4是本说明书一个实施例中利用属性为关联关系的边、属性为共现关系的边、属性为依据关系的边所构建的知识图谱的示意图。
图5是本说明书一个实施例构建出的基于法规文件的知识图谱的示意图。
图6是本说明书一个实施例中法规的检索方法的流程图。
图7是本说明书一个实施例中基于法规文件的知识图谱的构建装置的结构示意图。
图8是本说明书一个实施例中法规的检索装置的结构示意图。
图9是本说明书另一个实施例中法规的检索装置的结构示意图。
实施方式
在现有技术中,对于法规的检索方法就是常用的使用关键词包括的字进行逐字匹配的检索方法,即一个法规文件的标题中包括用户输入的查询关键词中的字时,将该法规文件作为检索出的结果提供给用户。但是,此种方法也常常会将不相关的法规文件作为检索结果提供给用户。比如,用户输入的查询关键词是“理财”,系统中包括一个标题为“XX部门关于处理财务问题的若干规定”,该标题中包括“理财”这两个字,但是这两个字在该标题中并不是一个词,现有技术只要匹配到查询关键词包括的字,就作为检索结果的做法,导致检索到大量无关的法规文件。
下面结合附图,对本说明书提供的方案进行描述。
首先需要说明的是,在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本说明书实施例的思路是:首先构建基于法规文件的知识图谱,通过知识图谱来体现法规文件中体现关键信息的主题词与法规文件的关联关系,同时也能够体现不同法规文件通过该主题词形成的关联关系。后续,利用基于法规文件的知识图谱进行检索,就能够更快、更准确地得到法规检索结果。
下面首先说明本说明书实施例中构建基于法规文件的知识图谱的方法。
图1是本说明书一个实施例中基于法规文件的知识图谱的构建方法的流程图。可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。参见图1,该方法包括:
步骤101:针对每一份法规文件,从该法规文件的标题中提取出主题词。
步骤103:对于提取出的每一个主题词,使用所述知识图谱中的一个第一类节点表征该主题词;
步骤105:对于每一个法规文件,使用所述知识图谱中的一个第二类节点表征该法规文件;
步骤107:如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系,从而生成所述基于法规文件的知识图谱。
可见,在图1所示的知识图谱的构建方法中,会从法规文件的标题中提取出主题词,并将主题词作为知识图谱的一类节点,这样,就保证了在后续利用知识图谱进行法规检索时,是基于法规文件中出现过的词,以词为单位进行检索,比如“理财”是作为一个词出现过,而不是现有技术中只要包括“理财”这两个字比如“办理财产”就作为检索结果,即不是现有技术中以字为单位进行检索。并且,将法规文件作为知识图谱中的另一类节点,通过两类节点之间的连接边,则可以体现主题词与法规文件之间的关联关系,从而可以实现后续快速、准确的法规检索。并且,同一个主题词如果出现在不同的法规文件中,也可以通过所构建的知识图谱上的一个第一类节点与不同第二类节点之间的连接边,来体现此种关系,并快速、准确地得到更为丰富的检索结果。
下面结合具体的例子对图1所示方法进行说明。
首先对于步骤101:针对每一份法规文件,从该法规文件的标题中提取出主题词。
需要说明的是,在本说明书一个实施例中,法规文件并不是特指某一种级别的法律性/规定性文件,而是泛指各种类型、各种机构颁发的、各种级别的与法律或规定相关的文件。比如对于金融行业,本说明书实施例中的法规文件可以是各种组织或者部门颁发或下发的海量的法律、规定、部门规则、规范性文件以及各类通知要求等。
在本步骤101中,法规文件标题中的主题词通常体现了法规文件相关的核心内容。对于一份法规文件,用户关心的核心内容可以包括颁发该法规文件的机构、该法规文件所适用到的机构。其中,颁发机构决定了法规文件的效力级别。其中,法规文件所适用到的机构则体现了法规文件的适用范围,比如一个法规文件的标题中包括“非银行金融机构”,其中的“非银行金融机构”就是法规文件所适用到的机构的相关信息。因此,在本步骤101中,主题词中可以包括与机构相关的机构词。机构词比如可以是:非银行金融机构、物联网联盟、某银行等。
对于一份法规文件,用户关心的核心内容还可以包括与地区相关的信息,因为地区相关信息决定了法规文件可适用到的地域,比如适用于农村地区或者在某一个省内适用。因此,在本步骤101中,主题词中可以包括与地区相关的地区词。地区词比如可以是:农村地区、某省、某县等。
对于一份法规文件,用户关心的核心内容还可以包括与法规内容相关的业务信息,比如是关于外汇业务的法规文件,还是关于跨境电子商务的法规文件。因此,在本步骤101中,主题词中可以包括与法规内容相关的业务词。业务词比如可以是:外汇业务、跨境电子商务、银行收单、客户、准入退出等。
接下来对于步骤103:对于提取出的每一个主题词,使用知识图谱中的一个第一类节点表征该主题词。
知识图谱是由节点及节点之间的边构成的。为了实现后续的检索,可以将步骤101中提取出的每一个法规文件的标题中的每一个主题词都作为知识图谱中的一个节点(同样的主题词只使用一个节点来表征),从而作为后续的检索索引。为便于描述和区分,将表征各个主题词的各个节点描述为第一类节点。这样,知识图谱中就会包括所有可得到的法规文件的标题中提取出的所有主题词。
接下来对于步骤105:对于每一个法规文件,使用知识图谱中的一个第二类节点表征该法规文件。
可以将每一个法规文件都作为知识图谱中的一个节点(即叶子节点),从而在后续中能够通过知识图谱中的第一类节点检索到用户查询的法规文件。为便于描述和区分,将表征各个法规文件的各个节点描述为第二类节点(第二类节点都是叶子节点)。这样,知识图谱中就会包括所有可得到的法规文件。
接下来对于步骤107:如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系,从而生成了基于法规文件的知识图谱。
为了能够在后续过程中通过主题词检索到法规文件,因此,可以执行本步骤107中的在第一类节点及其相关的第二类节点之间连接一条边的处理,从而可以通过边检索到需要查询的法规文件。
在本说明书的一个实施例中,考虑到使用用户的查询关键词很可能会检索到数量众多的比如上百件法规文件,而根据何种排序方式来顺序提供各个检索到的法规文件,也是法规检索过程中需要考虑的问题。因为如果将用户不关心的大量的检索结果优先显示,而用户关心的检索结果靠后显示,很可能会导致用户看不到自己真正关心的检索结果。因此,为了提高后续法规检索的准确性,在知识图谱中可以设置如下任意一种或多种类型的边:
第一、属性为关联关系的边。
第二、属性为共现关系的边。
第三、属性为依据关系的边。
首先对于上述“第一、属性为关联关系的边”进行说明。
正如上述对步骤107的相关描述,对于连接在表征主题词的第一类节点与表征法规文件的第二类节点之间的边,该类边的属性为关联关系。关联关系体现了边所对应/连接的主题词是从边所对应/连接的法规文件的标题中提取出来的。
在本说明书实施例中,对于属性为关联关系的边,可以根据该边连接的第二类节点所表征的法规文件的法律重要性等级,设置该边的关联关系的强度等级。边的关联关系的强度等级可以用于后续对检索结果的排序,从而确定应该优先向用户提供哪一个检索结果。比如,关联关系的强度等级包括三级:核心关联、强关联、弱关联。属性为核心关联的边连接的第二类节点可以是法律、法规、部门规章等类型的法规文件,也就是说核心关联表示法规文件的法律重要性等级相对最高,用户应该优先了解;属性为强关联的边连接的第二类节点可以是规范性文件,也就是说强关联表示法规文件的法律重要性等级为中等;属性为弱关联的边连接的第二类节点可以是通知类型为主的法规文件,也就是说弱关联表示法规文件的法律重要性等级相对较低。
比如,在本说明书一个实施例中,利用上述属性为关联关系的边所形成的知识图谱可以参见图2所示。
下面对于上述“第二、属性为共现关系的边”进行说明。
在实际的业务中,存在一种情况:当用户需要检索一个法规文件时,根据用户的查询关键词有可能只能检索到数量较少的法规文件,这样,很可能导致无法检索出用户真正关心的法规文件。本说明书实施例中,在知识图谱中设置属性为共现关系的边,可以用于后续扩展检索结果,从而得到更为丰富的检索结果。
因此,在本说明书实施例中,在生成基于法规文件的知识图谱时,如果两个第一类节点(无论任意一个第一类节点表征的是机构词、地区词还是业务词)所表征的两个主题词是从同一个法规文件的标题中提取出来的,则在该两个第一类节点之间连接一条边,并设置该边的属性为共现关系。比如从一个法规文件的标题中提取出的主题词同时包括:非银行金融机构和外汇业务,在知识图谱中,一个第一类节点比如节点1表征非银行金融机构,另一个第一类节点比如节点2表征外汇业务,那么则会在节点1与节点2之间连接一条边,并设置该边的属性为:共现关系。可以理解,后续如果根据用户的查询关键词只匹配到了节点1,将节点1连接的第二类节点表征的法规文件作为检索结果,同时,为了扩展检索结果,可以将节点2连接的第二类节点表征的法规文件也同时作为检索结果。
比如,在本说明书一个实施例中,利用上述属性为关联关系的边、属性为共现关系的边所形成的知识图谱可以参见图3所示。
下面对于上述“第三、属性为依据关系的边”进行说明。
法规文件具有特殊性,比如一个规范性文件是依据一个法律文件来制定的,现有技术通常只能检索出该规范性文件,而不能检索出该规范性文件所依据的该法律文件。但是,实际情况中,所依据的法律文件往往也是用户真正需要的检索结果。
另外,在现有技术中,在向用户提供检索结果时,通常只能依据诸如发布时间、匹配程度等来对检索结果进行排序,并将排序后的检索结果提供给用户。此种方式并不适用于法规文件的排序。法规文件具有特殊性,比如各类法规文件之间有重要级别的区别,法律文件的重要级别大于规范性文件的重要级别,如果法律文件与规范性文件出现矛盾,应当以法律文件的规定为准。
根据上述法规文件的特殊性,在本说明书实施例中,在知识图谱中可以设置属性为依据关系的边。在知识图谱中设置属性为依据关系的边的具体实现方法包括:在生成基于法规文件的知识图谱时,如果一个第二类节点表征的法规文件是依据另一个第二类节点表征的法规文件而制定的,则在该两个第二类节点之间连接一条边,并设置该边的属性为依据关系。例如法规文件1中的第一条条款中记载了本法规文件1是根据法规文件2、法规文件3、法规文件4制定的,那么,可以在节点A与节点B之间连接一条属性为依据关系的边,并在节点A与节点C之间连接一条属性为依据关系的边,并在节点A及节点D之间连接一条属性为依据关系的边;其中,节点A表征法规文件1,节点B表征法规文件2,节点C表征法规文件3,节点D表征法规文件4。
后续在检索时,通过在两个第二类节点之间连接的属性为依据关系的边,则可以在查找到一个第二类节点作为检索结果之后,通过该属性为依据关系的边查找到至少一个其他的第二类节点,从而扩展了检索结果,并且进一步向用户提供了与用户查询关键词匹配的法规文件所依据的更高级别的法规文件。
比如,在本说明书一个实施例中,利用上述属性为关联关系的边、属性为共现关系的边、属性为依据关系的边所形成的知识图谱可以参见图4所示。
在本说明书实施例中,用第一类节点来表征主题词,用第二类节点来表征法规文件,可以形成如图5所示的一种基于法规文件的知识图谱。
在构建完成知识图谱之后,当用户需要检索所需的相关法规文件时,本说明书实施例可以利用上述任一实施例构建的基于法规文件的知识图谱进行法规文件的检索。参见图6,该检索方法包括:
步骤601:得到用户的查询关键词。
步骤603:在预先构建的基于法规文件的知识图谱中,根据各个第一类节点所表征的各个主题词查找与用户的查询关键词相匹配的目标第一类节点;
其中,基于法规文件的知识图谱的构建方法包括:
针对每一份法规文件,从该法规文件的标题中提取出主题词;
对于提取出的每一个主题词,使用所述知识图谱中的一个第一类节点表征该主题词;
对于每一个法规文件,使用所述知识图谱中的一个第二类节点表征该法规文件;
如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系。
步骤605:在基于法规文件的知识图谱中,查找与目标第一类节点之间具有连接边的目标第二类节点。
步骤607:将查找到的目标第二类节点所表征的法规文件作为检索结果。
下面对图6所示的流程进行说明。
首先,对于步骤601:得到用户的查询关键词。
当一个用户需要检索自己需要的法规文件时,会向相关的检索网站中输入查询语句,服务器侧则可以从用户输入的查询语句中提取出查询关键词。比如,用户输入“与电商相关的税务规定”,服务器则可以从该查询语句中提取出查询关键词:电商、税务。
接下来对于步骤603:在基于法规文件的知识图谱中,根据各个第一类节点所表征的各个主题词查找与用户的查询关键词相匹配的目标第一类节点。
在本说明书一个实施例中,相匹配可以包括:第一类节点表征的主题词与用户的查询关键词相同。比如,步骤601中得到的查询关键词为电商、税务,那么,本步骤603中则可以在基于法规文件的知识图谱中查找表征电商、税务的第一类节点。
在本说明书一个实施例中,相匹配也可以包括:第一类节点表征的主题词与用户的查询关键词为近义词或者为同义词。在实际的业务实现中,用户的查询关键词有可能不是法规文件的标题中使用的词,虽然涉及的法规内容相同,但是用词不同,比如,用户的查询关键词为电商,但是法规文件的标题中使用的是电子商务,但实际上两者指向相同,因此,为了提高检索结果的准确性,在步骤603中可以使用与用户的查询关键词为近义词或者同义词的词在知识图谱中查找目标第一类节点。也就是说,相匹配包括:第一类节点表征的主题词与用户的查询关键词为近义词或者为同义词。
在本步骤603中,目标第一类节点可以只包括:直接匹配的目标第一类节点。也就是说,匹配到哪一个第一类节点,就将哪一个第一类节点作为目标第一类节点。
如前所述,两个第一类节点之间可能会连接有属性为共现关系的边,那么该两个第一类节点与相同或者相似的法规内容相关,很可能都是用户关心的法规内容。因此,在本步骤603中,目标第一类节点也可以包括:直接匹配的目标第一类节点以及间接匹配的目标第一类节点。其中,间接匹配的目标第一类节点是指:与直接匹配的目标第一类节点之间连接有属性为共现关系的边的第一类节点。相应地,步骤603的过程包括:如果一个第一类节点表征的主题词与用户的查询关键词相同或者为近义词或者为同义词,则将该第一类节点作为直接匹配的目标第一类节点;得到与该直接匹配的目标第一类节点直接连接的其他第一类节点,将得到的该其他第一类节点作为间接匹配的目标第一类节点。
接下来对于步骤605:在基于法规文件的知识图谱中,查找与目标第一类节点之间具有直连边的目标第二类节点。
接下来对于步骤607:将查找到的目标第二类节点所表征的法规文件作为检索结果。
通常,查找到的目标第二类节点的个数大于1;因此,在步骤607得到了检索结果后,进一步包括:
对各个目标第二类节点进行排序;
按照排序后的顺序,将各目标第二类节点所表征的法规文件依次作为检索结果提供给用户。
在本说明书一个实施例中,对查找到的各个目标第二类节点进行排序的方法,包括如下各排序方法中的至少一项。
排序方法1:对于任意两个目标第二类节点,其中的第一目标第二类节点的排序相对于其中的第二目标第二类节点的排序靠前;其中,第一目标第二类节点所连接边的关联关系的强度等级高于第二目标第二类节点所连接边的关联关系的强度等级。
如前所述,比如,关联关系的强度等级包括三级:核心关联、强关联、弱关联。可以将属性为核心关联的边连接的目标第二类节点所表征的法规文件如法律文件优先显示,比如作为检索结果在第一页中进行显示;将属性为强关联的边连接的目标第二类节点所表征的法规文件如规范性文件稍后显示,比如作为检索结果在第2-5页中进行显示;将属性为弱关联的边连接的目标第二类节点所表征的法规文件比如通知类型的文件最后显示。
排序方法2:对于任意两个目标第二类节点,其中的第三目标第二类节点的排序相对于其中的第四目标第二类节点的排序靠前;其中,第三目标第二类节点所连接的目标第一类节点的数量较多,第四目标第二类节点所连接的目标第一类节点的数量较少。
在该排序方法2中,因为同时连接更多目标第一类节点的目标第二类节点是能够匹配到更多用户查询关键词的节点,因此,此种目标第二类节点表征的法规文件更有可能是用户需要的检索结果。比如,用户的查询关键词包括:电商、税务、A城市。根据该三个查询关键词匹配到了3个目标第一类节点,该3个目标第一类节点同时连接到同一个目标第二类节点S,其中的2个目标第一类节点还同时连接到同一个目标第二类节点M,其中的1个目标第一类节点还连接到目标第二类节点N,这样,在排序上,目标第二类节点S先于目标第二类节点M,目标第二类节点M先于目标第二类节点N,也就是说,在向用户显示检索结果时,目标第二类节点S表征的法规文件先于目标第二类节点M表征的法规文件进行显示,目标第二类节点M表征的法规文件先于目标第二类节点N表征的法规文件进行显示。
排序方法3:对于任意两个目标第二类节点,其中的被直接召回的目标第二类节点的排序相对于其中的被间接召回的目标第二类节点的排序靠前;其中,所述被直接召回的目标第二类节点为:与用户的查询关键词匹配的目标第一类节点所直接连接的第二类节点;其中,所述被间接召回的目标第二类节点为:与所述被直接召回的目标第二类节点之间连接有属性为依据关系的边的第二类节点。
排序方法4:对于任意两个目标第二类节点,其中的第五目标第二类节点的排序相对于其中的第六目标第二类节点的排序靠前;其中,第五目标第二类节点所直接连接的目标第一类节点在知识图谱中的权重值较大,第六目标第二类节点所直接连接的目标第一类节点在知识图谱中的权重值较小。
在该排序方法4中,可以根据基于法规文件的知识图谱中的目标第一类节点的属性,比如所连接的边的数量、属于机构词还是业务词还是地区词、所连接的各边的属性(比如关联关系的强度的等级)中的任意一个或多个,来计算该目标第一类节点在知识图谱中的权重值。比如基于PageRank算法原理,来计算目标第一类节点在知识图谱中的权重值,比如根据一个目标第一类节点所连接的各目标第二类节点所表征的法规文件的重要性等级,来计算该目标第一类节点在知识图谱中的权重值。
排序方法5:如果用户输入的包括所述查询关键词的查询语句与一个目标第二类节点所表征的法规文件的标题相同,则该目标第二类节点的排序在前。
在该排序方法5中,如果用户输入的包括所述查询关键词的查询语句与一个目标第二类节点所表征的法规文件的标题相同,则该目标第二类节点可以排在第一位进行显示,比如显示为第一个检索结果。
排序方法6:对于任意两个目标第二类节点,其中的第七目标第二类节点的排序相对于其中的第八目标第二类节点的排序靠前;其中,在第七目标第二类节点对应的标题词集/内容词集中所匹配到的用户的查询关键词的数量较多,在其中第八目标第二类节点对应的标题词集/内容词集中匹配到的用户的查询关键词的数量较少。
在该排序方法6中,一个目标第二类节点对应的标题词集是:从该目标第二类节点表征的法规文件的标题中去除停用词(即无内容含义的词比如“的”、“了”、“关于”等)之后,提取出的所有词的集合。
一个目标第二类节点对应的内容词集是:从该目标第二类节点表征的法规文件的文件内容中去除停用词(即无内容含义的词比如“应当”、“的”、“了”、“关于”等)之后,提取出的所有词的集合。
排序方法7:根据各个目标第二类节点所表征的法规文件的发布时间的先后顺序,对各个目标第二类节点进行排序。
本说明书的一个实施例中,提供了一种基于法规文件的知识图谱的构建装置,参见图7,该装置包括:
主题词提取模块701,配置为针对每一份法规文件,从该法规文件的标题中提取出主题词;
第一类节点设置模块702,配置为对于提取出的每一个主题词,使用所述知识图谱中的一个第一类节点表征该主题词;
第二类节点设置模块703,配置为对于每一个法规文件,使用所述知识图谱中的一个第二类节点表征该法规文件;
边设置模块704,配置为执行如下操作中的至少一项:
如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系;
如果两个第一类节点所表征的两个主题词是从同一个法规文件的标题中提取出来的,则在该两个第一类节点之间连接一条边,并设置该边的属性为共现关系;
如果一个第二类节点表征的法规文件是依据另一个第二类节点表征的法规文件而制定的,则在该两个第二类节点之间连接一条边,并设置该边的属性为依据关系;
其中,所述主题词包括如下中的至少一种:与机构相关的机构词、与地区相关的地区词、与法规内容相关的业务词。
在本说明书装置的一个实施例中,主题词包括如下中的至少一种:与机构相关的机构词、与地区相关的地区词、与法规内容相关的业务词。
在本说明书装置的一个实施例中,边设置模块704进一步被配置为执行:在生成所述知识图谱时,如果两个第一类节点所表征的两个主题词是从同一个法规文件的标题中提取出来的,则在该两个第一类节点之间连接一条边,并设置该边的属性为共现关系。
在本说明书装置的一个实施例中,边设置模块704进一步被配置为执行:在生成所述知识图谱时,如果一个第二类节点表征的法规文件是依据另一个第二类节点表征的法规文件而制定的,则在该两个第二类节点之间连接一条边,并设置该边的属性为依据关系。
在本说明书装置的一个实施例中,边设置模块704被配置为执行:根据该边连接的第二类节点所表征的法规文件的法律重要性等级,设置该边的关联关系的强度等级。
本说明书实施例提出了一种法规检索装置,参见图8,该装置包括:
查询关键词获取模块801,配置为得到用户的查询关键词;
匹配模块802,配置为在知识图谱构建装置所构建出的基于法规文件的知识图谱中,根据各个第一类节点所表征的各个主题词查找与用户的查询关键词相匹配的目标第一类节点;
查找模块803,配置为在知识图谱构建装置所构建出的基于法规文件的知识图谱中,查找与目标第一类节点之间连接有边的目标第二类节点;
检索结果处理模块804,配置为将查找到的目标第二类节点所表征的法规文件作为检索结果;
其中,知识图谱的构建装置包括:
主题词提取模块,配置为针对每一份法规文件,从该法规文件的标题中提取出主题词;
第一类节点设置模块,配置为对于提取出的每一个主题词,使用所述知识图谱中的一个第一类节点表征该主题词;
第二类节点设置模块,配置为对于每一个法规文件,使用所述知识图谱中的一个第二类节点表征该法规文件;
边设置模块,配置为如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系。
在图8所示的本说明书装置的一个实施例中,相匹配包括:第一类节点表征的主题词与用户的查询关键词相同或者为近义词或者为同义词。
在本说明书装置的一个实施例中,目标第一类节点包括:直接匹配的目标第一类节点以及间接匹配的目标第一类节点;
相应地,匹配模块802被配置为执行:
如果一个第一类节点表征的主题词与用户的查询关键词相同或者为近义词或者为同义词,则将该第一类节点作为直接匹配的目标第一类节点;得到与该直接匹配的目标第一类节点直接连接的其他第一类节点,将得到的该其他第一类节点作为间接匹配的目标第一类节点。
参见图9,法规文件检索装置进一步包括:检索结果提供模块901;
其中,查找到的目标第二类节点的个数大于1;
检索结果提供模块901配置为执行:对各个目标第二类节点进行排序;按照排序后的顺序,将各目标第二类节点所表征的法规文件依次作为检索结果提供给用户。
在图9所示的本说明书装置的实施例中,检索结果提供模块901在对查找到的各个目标第二类节点进行排序时,被配置为执行如下中的至少一项:
对于任意两个目标第二类节点,其中的第一目标第二类节点的排序相对于其中的第二目标第二类节点的排序靠前;其中,第一目标第二类节点所连接边的关联关系的强度等级高于第二目标第二类节点所连接边的关联关系的强度等级;
对于任意两个目标第二类节点,其中的第三目标第二类节点的排序相对于其中的第四目标第二类节点的排序靠前;其中,第三目标第二类节点所连接的目标第一类节点的数量较多,第四目标第二类节点所连接的目标第一类节点的数量较少;
对于任意两个目标第二类节点,其中的被直接召回的目标第二类节点的排序相对于其中的被间接召回的目标第二类节点的排序靠前;其中,所述被直接召回的目标第二类节点为:与用户的查询关键词匹配的目标第一类节点所直接连接的第二类节点;其中,所述被间接召回的目标第二类节点为:与所述被直接召回的目标第二类节点之间连接有属性为依据关系的边的第二类节点;
对于任意两个目标第二类节点,其中的第五目标第二类节点的排序相对于其中的第六目标第二类节点的排序靠前;其中,第五目标第二类节点所直接连接的目标第一类节点的权重值较大,第六目标第二类节点所直接连接的目标第一类节点的权重值较小;
如果用户输入的包括所述查询关键词的查询语句与一个目标第二类节点所表征的法规文件的标题相同,则该目标第二类节点的排序在前;
对于任意两个目标第二类节点,其中的第七目标第二类节点的排序相对于其中的第八目标第二类节点的排序靠前;其中,在第七目标第二类节点对应的标题词集/内容词集中所匹配到的用户的查询关键词的数量较多,在其中第八目标第二类节点对应的标题词集/内容词集中匹配到的用户的查询关键词的数量较少;
根据各个目标第二类节点所表征的法规文件的发布时间的先后顺序,对各个目标第二类节点进行排序。
需要说明的是,上述各装置通常实现于服务器端,可以分别设置于独立的服务器,也可以其中部分或全部装置的组合设置于同一服务器。该服务器可以是单个的服务器,也可以是由多个服务器组成的服务器集群,服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品。上述各装置还可以实现于具有较强计算能力的计算机终端。
本说明书一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行说明书中任一个实施例中的方法。
本说明书一个实施例提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现执行说明书中任一个实施例中的方法。
可以理解的是,本说明书实施例示意的结构并不构成对本说明书实施例的装置的具体限定。在说明书的另一些实施例中,上述装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、挂件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
Claims (10)
1.基于法规文件的知识图谱的构建方法,其中,该方法包括:
针对每一份法规文件,从该法规文件的标题中提取出主题词;
对于提取出的每一个主题词,使用所述知识图谱中的一个第一类节点表征该主题词;
对于每一个法规文件,使用所述知识图谱中的一个第二类节点表征该法规文件;
并且,执行如下操作中的至少一项:
如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系;
如果两个第一类节点所表征的两个主题词是从同一个法规文件的标题中提取出来的,则在该两个第一类节点之间连接一条边,并设置该边的属性为共现关系;
如果一个第二类节点表征的法规文件是依据另一个第二类节点表征的法规文件而制定的,则在该两个第二类节点之间连接一条边,并设置该边的属性为依据关系;
其中,所述主题词包括如下中的至少一种:与机构相关的机构词、与地区相关的地区词、与法规内容相关的业务词。
2.根据权利要求1所述的方法,其中,所述设置该边的属性为关联关系,包括:
根据该边连接的第二类节点所表征的法规文件的法律重要性等级,设置该边的关联关系的强度等级。
3.法规检索方法,其中,该方法包括:
得到用户的查询关键词;
在预先构建的基于法规文件的知识图谱中,根据各个第一类节点所表征的各个主题词查找与用户的查询关键词相匹配的目标第一类节点;
其中,基于法规文件的知识图谱的构建方法包括:针对每一份法规文件,从该法规文件的标题中提取出主题词;对于提取出的每一个主题词,使用所述知识图谱中的一个第一类节点表征该主题词;对于每一个法规文件,使用所述知识图谱中的一个第二类节点表征该法规文件;如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系;
在基于法规文件的知识图谱中,查找与目标第一类节点之间连接有边的目标第二类节点;
将查找到的目标第二类节点所表征的法规文件作为检索结果。
4.根据权利要求3所述的方法,其中,所述相匹配包括:第一类节点表征的主题词与用户的查询关键词相同或者为近义词或者为同义词。
5.根据权利要求3所述的方法,其中,所述目标第一类节点包括:直接匹配的目标第一类节点以及间接匹配的目标第一类节点;
所述查找与用户的查询关键词相匹配的目标第一类节点,包括:
如果一个第一类节点表征的主题词与用户的查询关键词相同或者为近义词或者为同义词,则将该第一类节点作为直接匹配的目标第一类节点;得到与该直接匹配的目标第一类节点直接连接的其他第一类节点,将得到的该其他第一类节点作为间接匹配的目标第一类节点。
6.根据权利要求3所述的方法,其中,所述查找到的目标第二类节点的个数大于1;
该方法进一步包括:
对各个目标第二类节点进行排序;
按照排序后的顺序,将各目标第二类节点所表征的法规文件依次作为检索结果提供给用户。
7.根据权利要求6所述的方法,其中,所述对各个目标第二类节点进行排序,包括如下中的至少一项:
对于任意两个目标第二类节点,其中的第一目标第二类节点的排序相对于其中的第二目标第二类节点的排序靠前;其中,第一目标第二类节点所连接边的关联关系的强度等级高于第二目标第二类节点所连接边的关联关系的强度等级;
对于任意两个目标第二类节点,其中的第三目标第二类节点的排序相对于其中的第四目标第二类节点的排序靠前;其中,第三目标第二类节点所连接的目标第一类节点的数量较多,第四目标第二类节点所连接的目标第一类节点的数量较少;
对于任意两个目标第二类节点,其中的被直接召回的目标第二类节点的排序相对于其中的被间接召回的目标第二类节点的排序靠前;其中,所述被直接召回的目标第二类节点为:与用户的查询关键词匹配的目标第一类节点所直接连接的第二类节点;其中,所述被间接召回的目标第二类节点为:与所述被直接召回的目标第二类节点之间连接有属性为依据关系的边的第二类节点;其中,如果一个第二类节点表征的法规文件是依据另一个第二类节点表征的法规文件而制定的,则该两个第二类节点之间连接有一条边,且该边的属性为依据关系;
对于任意两个目标第二类节点,其中的第五目标第二类节点的排序相对于其中的第六目标第二类节点的排序靠前;其中,第五目标第二类节点所直接连接的目标第一类节点的权重值较大,第六目标第二类节点所直接连接的目标第一类节点的权重值较小;
如果用户输入的包括所述查询关键词的查询语句与一个目标第二类节点所表征的法规文件的标题相同,则该目标第二类节点的排序在前;
对于任意两个目标第二类节点,其中的第七目标第二类节点的排序相对于其中的第八目标第二类节点的排序靠前;其中,在第七目标第二类节点对应的标题词集/内容词集中所匹配到的用户的查询关键词的数量较多,在其中第八目标第二类节点对应的标题词集/内容词集中匹配到的用户的查询关键词的数量较少;
根据各个目标第二类节点所表征的法规文件的发布时间的先后顺序,对各个目标第二类节点进行排序。
8.基于法规文件的知识图谱的构建装置,其中,该装置包括:
主题词提取模块,配置为针对每一份法规文件,从该法规文件的标题中提取出主题词;
第一类节点设置模块,配置为对于提取出的每一个主题词,使用所述知识图谱中的一个第一类节点表征该主题词;
第二类节点设置模块,配置为对于每一个法规文件,使用所述知识图谱中的一个第二类节点表征该法规文件;
边设置模块,配置为执行如下操作中的至少一项:
如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系;
如果两个第一类节点所表征的两个主题词是从同一个法规文件的标题中提取出来的,则在该两个第一类节点之间连接一条边,并设置该边的属性为共现关系;
如果一个第二类节点表征的法规文件是依据另一个第二类节点表征的法规文件而制定的,则在该两个第二类节点之间连接一条边,并设置该边的属性为依据关系;
其中,所述主题词包括如下中的至少一种:与机构相关的机构词、与地区相关的地区词、与法规内容相关的业务词。
9.法规检索装置,其中,该装置包括:
查询关键词获取模块,配置为得到用户的查询关键词;
匹配模块,配置为在知识图谱构建装置所构建出的基于法规文件的知识图谱中,根据各个第一类节点所表征的各个主题词查找与用户的查询关键词相匹配的目标第一类节点;
查找模块,配置为在知识图谱构建装置所构建出的基于法规文件的知识图谱中,查找与目标第一类节点之间连接有边的目标第二类节点;
检索结果处理模块,配置为将查找到的目标第二类节点所表征的法规文件作为检索结果;
其中,知识图谱的构建装置包括:
主题词提取模块,配置为针对每一份法规文件,从该法规文件的标题中提取出主题词;
第一类节点设置模块,配置为对于提取出的每一个主题词,使用所述知识图谱中的一个第一类节点表征该主题词;
第二类节点设置模块,配置为对于每一个法规文件,使用所述知识图谱中的一个第二类节点表征该法规文件;
边设置模块,配置为如果一个第一类节点所表征的主题词是从一个第二类节点所表征的法规文件的标题中提取出来的,那么在该第一类节点与该第二类节点之间连接一条边,并设置该边的属性为关联关系。
10.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310137202.XA CN115905577B (zh) | 2023-02-08 | 2023-02-08 | 知识图谱的构建方法及装置、法规检索方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310137202.XA CN115905577B (zh) | 2023-02-08 | 2023-02-08 | 知识图谱的构建方法及装置、法规检索方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115905577A CN115905577A (zh) | 2023-04-04 |
CN115905577B true CN115905577B (zh) | 2023-06-02 |
Family
ID=86489934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310137202.XA Active CN115905577B (zh) | 2023-02-08 | 2023-02-08 | 知识图谱的构建方法及装置、法规检索方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115905577B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750995A (zh) * | 2019-10-29 | 2020-02-04 | 上海德拓信息技术股份有限公司 | 一种基于自定义图谱的文件管理方法 |
CN112860908A (zh) * | 2021-01-27 | 2021-05-28 | 云南电网有限责任公司电力科学研究院 | 基于多源异构电力设备数据的知识图谱自动化构建方法 |
CN113553420A (zh) * | 2020-04-22 | 2021-10-26 | 国网电力科学研究院有限公司 | 基于知识图谱的电网故障处理规程推荐方法和系统 |
CN114936291A (zh) * | 2022-06-01 | 2022-08-23 | 深圳得理科技有限公司 | 一种法律常识知识图谱的自动化构建方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787105B (zh) * | 2016-03-21 | 2019-04-19 | 浙江大学 | 一种基于迭代模型的中文百科知识图谱分类体系构建方法 |
CN107122444A (zh) * | 2017-04-24 | 2017-09-01 | 北京科技大学 | 一种法律知识图谱自动构建方法 |
CN108563773B (zh) * | 2018-04-20 | 2021-03-30 | 武汉工程大学 | 基于知识图谱的法律条文精准搜索排序方法 |
CN111104525B (zh) * | 2019-12-31 | 2022-03-25 | 西安理工大学 | 一种基于图数据库的建筑设计规范知识图谱构建方法 |
US11416524B2 (en) * | 2020-01-22 | 2022-08-16 | Accenture Global Solutions Limited | Data classification and modelling based application compliance analysis |
CN112632226B (zh) * | 2020-12-29 | 2021-10-26 | 天津汇智星源信息技术有限公司 | 基于法律知识图谱的语义搜索方法、装置和电子设备 |
CN113723047A (zh) * | 2021-07-27 | 2021-11-30 | 山东旗帜信息有限公司 | 一种基于法律文件的图谱构建方法、设备及介质 |
CN113688255A (zh) * | 2021-09-02 | 2021-11-23 | 大连理工大学 | 一种基于中文电子病历的知识图谱构建方法 |
CN113590846B (zh) * | 2021-09-24 | 2021-12-17 | 天津汇智星源信息技术有限公司 | 法律知识图谱构建方法及相关设备 |
-
2023
- 2023-02-08 CN CN202310137202.XA patent/CN115905577B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110750995A (zh) * | 2019-10-29 | 2020-02-04 | 上海德拓信息技术股份有限公司 | 一种基于自定义图谱的文件管理方法 |
CN113553420A (zh) * | 2020-04-22 | 2021-10-26 | 国网电力科学研究院有限公司 | 基于知识图谱的电网故障处理规程推荐方法和系统 |
CN112860908A (zh) * | 2021-01-27 | 2021-05-28 | 云南电网有限责任公司电力科学研究院 | 基于多源异构电力设备数据的知识图谱自动化构建方法 |
CN114936291A (zh) * | 2022-06-01 | 2022-08-23 | 深圳得理科技有限公司 | 一种法律常识知识图谱的自动化构建方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115905577A (zh) | 2023-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8666994B2 (en) | Document analysis and association system and method | |
US7783644B1 (en) | Query-independent entity importance in books | |
JP5379696B2 (ja) | 概念ベースの検索とランク付けを伴う情報検索のシステム、方法およびソフトウェア | |
US8606778B1 (en) | Document ranking based on semantic distance between terms in a document | |
CN103678576B (zh) | 基于动态语义分析的全文检索系统 | |
US8204874B2 (en) | Abbreviation handling in web search | |
US20090119281A1 (en) | Granular knowledge based search engine | |
US10528662B2 (en) | Automated discovery using textual analysis | |
JP2011175670A (ja) | 情報検索システムにおけるフレーズに基づく検索方法 | |
WO2021082123A1 (zh) | 信息推荐方法及装置、电子设备 | |
CN112231494B (zh) | 信息抽取方法、装置、电子设备及存储介质 | |
CN111522905A (zh) | 一种基于数据库的文档搜索方法和装置 | |
Mahdabi et al. | The effect of citation analysis on query expansion for patent retrieval | |
KR101707941B1 (ko) | 일반용어와 법률용어 간의 자동변환을 통한 판례검색방법, 판례검색장치 및 이를 위한 컴퓨터 판독가능 기록매체 | |
US20190362003A1 (en) | Techniques for processing long-tail search queries against a vertical search corpus | |
JP5250009B2 (ja) | サジェスチョンクエリ抽出装置及び方法、並びにプログラム | |
US10565188B2 (en) | System and method for performing a pattern matching search | |
Kantorski et al. | Automatic filling of hidden web forms: a survey | |
JP2003271609A (ja) | 情報監視装置及び情報監視方法 | |
JP2009122807A (ja) | 連想検索システム | |
CN115905577B (zh) | 知识图谱的构建方法及装置、法规检索方法和装置 | |
Li et al. | Complex query recognition based on dynamic learning mechanism | |
CN113468339A (zh) | 基于知识图谱的标签提取方法、系统、电子设备及介质 | |
US20080033953A1 (en) | Method to search transactional web pages | |
CN116738065B (zh) | 一种企业搜索方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40088399 Country of ref document: HK |