CN105930546A - 文件关联显示方法 - Google Patents
文件关联显示方法 Download PDFInfo
- Publication number
- CN105930546A CN105930546A CN201610534962.4A CN201610534962A CN105930546A CN 105930546 A CN105930546 A CN 105930546A CN 201610534962 A CN201610534962 A CN 201610534962A CN 105930546 A CN105930546 A CN 105930546A
- Authority
- CN
- China
- Prior art keywords
- legal document
- dictionary
- title
- article
- hyperlink
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000008878 coupling Effects 0.000 claims description 31
- 238000010168 coupling process Methods 0.000 claims description 31
- 238000005859 coupling reaction Methods 0.000 claims description 31
- 239000000203 mixture Substances 0.000 claims description 17
- 239000000284 extract Substances 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 7
- 230000001151 other effect Effects 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 230000007704 transition Effects 0.000 claims description 5
- 238000012795 verification Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9558—Details of hyperlinks; Management of linked annotations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Technology Law (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开一种文件关联显示方法,包括:确定目标法律文件的关联文件;确定所述关联文件的链接地址,所述链接地址用于链接到所述关联文件;显示所述目标法律文件时,同步显示所述关联文件或者所述关联文件的链接地址。本发明实施例的文件关联显示方法,确定目标法律文件的关联文件,确定关联文件的链接地址,显示目标法律文件时同步显示关联文件或者关联文件的链接地址,从而实现同步显示关联法律文件,以节约用户检索时间,增加用户体验。
Description
技术领域
本发明涉及计算机领域,尤其涉及一种文件关联显示方法。
背景技术
随着法律文件的不断增加,法律文件之间往往存在关联,读者在阅读一篇法律文件时,往往需要进一步阅读关联文件。如果读者在面对浩如烟海的法律文件中搜索关联文件,会耗费读者的时间与精力。
发明内容
本发明实施例提供一种文件关联显示方法,能够同步显示关联的法律文件。
本发明实施例采用如下技术方案:
一种文件关联显示方法,包括:
确定目标法律文件的关联文件;
确定所述关联文件的链接地址,所述链接地址用于链接到所述关联文件;
显示所述目标法律文件的时,同时显示所述关联文件或者所述关联文件的链接地址。
可选的,所述目标法律文件的关联文件为与所述目标法律文件具有引用关系的法律文件,所述确定目标法律文件的关联文件包括:
建立反超链接统计信息表,所述超链接统计信息表记录与所述目标法律文件具有引用关系的法律文件;
查询所述反超链接统计信息表,得到与所述目标法律文件具有引用关系的法律文件。
可选的,所述建立反超链接统计信息表包括:
确定标题字典;
使用所述标题字典为存储法律文件的数据库加载标题字典,所述法律文件的数据库存储所有备选的法律文件;
对加载的标题字典建立树形哈希索引;
索引建立完成后,匹配所有法律文件库中的所有法律文件,得到匹配结果;
根据所述匹配结果提取文章之间的关联,建立超链接统计信息表;
根据所述超链接统计信息表建立所述反超链接统计信息表。
可选的,所述确定标题字典包括:
确定适用于作为标题字典的栏目和库别;
设置适宜作为标题字典的文章的筛选条件,建立标题字典;
其中,所述标题字典中的每一条标题包括:字典主题词、唯一标志,所述字典主题词是标题字典用于匹配的关键词,所述唯一标志是法律文件在数库的唯一编码;
所述标题字典中的每一条标题还包括:
前缀、后缀、发布日期、地区编码,所述前缀位于所述字典主题词前面,用于标记国别、地域名称、发布单位、第一标记性词语,所述后缀位于所述字典主题词后面的第二标记性词语,所述发布日期标识指法律文件的发布时间,所述地区编码是指根据法律文件发布单位所在地区计算的地区编码。
可选的,所述对加载的标题字典建立树形哈希索引包括:
根据加载字典所有条目的字典主题词的第一个字建立第一层哈希索引,重复的字只记录一个节点,作为树根索引;
根据第二个字建立第二层子节点的哈希索引,建立第二层索引时,用第一个字匹配第一个字的哈希索引,在第一层索引上用第二个字派生第二层索引;
依次派生第三层、第四层直到第N层索引,N=字典主题词的长度,N是索引树的叶子节点,存储前缀、后缀、发布日期、地区编码、唯一标志信息;
如果两个或者两个以上字典主题词完全相同而前缀、后缀、发布日期、地区编码、唯一标志信息不同,则所有这些相同的字典主题词在叶子节点中存成 一个数组,分别存储。
可选的,所述匹配所有法律文件库中的所有法律文件,得到匹配结果包括:
各法律文件库正文开始匹配索引,正文逐字放到索引中进行匹配;
如果匹配到叶子节点表示匹配成功,根据叶子节点的前缀、后缀、发布日期、地区编码、唯一标志和该篇文章本身的发布日期、地区编码、唯一标志计算匹配是否合理;
合理性判断原则为:一篇法律文件只能引用在它发布日期之前发布的法律文件;一篇法律文件只能引用当前地域和中央发布的法律文件;
符合合理性原则的匹配为有效匹配,根据有效匹配字符串前后的字符串和叶子节点的前缀、后缀、发布日期进一步匹配,查找适合的匹配扩展;
确定匹配范围,根据字典的唯一标志在正文中匹配的位置添加超链;在匹配的标题后面第X条、X条这样的文字,对X进行数字验证,如果X是中文数字或者阿拉伯数字则认为匹配的标题后面是对于超链标题条的引用,给条引用替添加详细到条号的超链;依次匹配整篇法律文件的所有文字,至一篇法律文件完成,将匹配的结果单独存储;依照目前的索引算法,整篇法律文件加超链的时间=文章长度,属于速度最优的算法。
可选的,根据所述匹配结果提取文章之间的关联,建立超链接统计信息表包括:
根据匹配的结果提取文章之间的引用关联,提取内容为:文章库别、文章唯一标志、文章引用法规的库别、文章引用法规的唯一标志、文章引用法规的条号;
根据添加的超链提取法律文件之间的匹配关系;
根据提取的匹配关系扩展填充引用的法律文件和被引用的法律文件的标题、发布日期、库别,组成引用法规与被引用法规的完整映射关系,完整的文章引用关系即为超链接统计信息表;
超链接统计信息表根据被引用法规的库别效力级别、唯一标志、条号进行 分组统计,计算出被引用法规、被引用法规的某一条被不同库别引用的篇数和次数;其中,次数指被引用法规或者被引用法规的某一条在某一分组中被引用的总次数,一篇法律文件可能引用另一篇法律文件多次,每引用自此计数都加一;篇数指每一篇不管引用多少次都只计数一。
可选的,根据所述超链接统计信息表建立所述反超链接统计信息表包括:
最后按照被引用法律文件的库别、效力级别分组,再组合上被引用法规的标题、发布日期等等信息,再关联上该篇文章在各个分组中的统计篇数和次数就成为了反超链接统计信息表。
可选的,所述确定目标法律文件的关联文件包括:
统计目标法律文件引用的文章和引用目标法律文件的法律文件,确定目标法律文件的关联文件。
可选的,所述确定目标法律文件的关联文件包括:
将目标法律文件整个变迁过程中涉及的所有法律文件,作为所述目标法律文件的关联文件。
基于上述技术方案的文件关联显示方法,确定目标法律文件的关联文件,确定关联文件的链接地址,显示目标法律文件时同步显示关联文件或者关联文件的链接地址,从而实现同步显示关联法律文件,以节约用户检索时间,增加用户体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本发明实施例提供的文件关联显示方法的流程图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描 述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
本发明实施例建立一种机制,通过自动化处理的方式,来完成法律法规、司法案例、法学期刊、专题参考之间引用与被引用的关联工作。从而在法律信息服务中为用户灵活的提供各栏目之间的关联体系。提升法律文件之间关联性,提升用户查询法律文件的效率,提升用户扩展阅读的兴趣。
本发明实施例通过建立法律法规、司法案例、法学期刊、专题参考等栏目之间的引用与被引用的关联关系,建立标题字典,通过标题字典在法律文件正文中进行匹配和规则套用,为关联成功的法律文件建立各引用与被引用的关联。
如图1所示,本发明实施例提供一种文件关联显示方法,包括:
11、确定目标法律文件的关联文件。
本发明实施例中,目标法律文件可以为法律法规、司法案例、法学期刊、法律专题、法律文章中任意一种,目标法律文件的关联文件可以为法律法规、司法案例、法学期刊、法律专题、法律文章中一种或多种。
12、确定所述关联文件的链接地址,所述链接地址用于链接到所述关联文件。
本发明实施例中,关联文件的链接地址可以根据关联文件的存储位置确定。
13、显示所述目标法律文件时,同时显示所述关联文件或者所述关联文件的链接地址。
本发明实施例中,如果关联的法律文件数量较多,可以显示每篇关联法律文件的概要,也可以在每篇关联法律文件的概要上添加链接,链接对应的关联法律文件。
可选的,所述目标法律文件的关联文件为与所述目标法律文件具有引用关系的法律文件,所述确定目标法律文件的关联文件包括:
建立反超链接统计信息表,所述超链接统计信息表记录与所述目标法律文件具有引用关系的法律文件;
查询所述反超链接统计信息表,得到与所述目标法律文件具有引用关系的法律文件。
本发明实施例中,与所述目标法律文件具有引用关系的法律文件包括引用所述目标法律文件的法律文件及所述目标法律文件引用的法律文件。
可选的,所述建立反超链接统计信息表包括:
确定标题字典;
使用所述标题字典为存储法律文件的数据库加载标题字典,所述法律文件的数据库存储所有备选的法律文件;
对加载的标题字典建立树形哈希索引;
索引建立完成后,匹配所有法律文件库中的所有法律文件,得到匹配结果;
根据所述匹配结果提取文章之间的关联,建立超链接统计信息表;
根据所述超链接统计信息表建立所述反超链接统计信息表。
本发明实施例中,显示与所述目标法律文件具有引用关系的法律文件时,可以分别显示所述目标法律文件引用的法律文件、引用所述目标法律文件的法律文件。
例如,在所述目标法律文件右侧显示目标法律文件引用的法律文件(例如法规):
根据超链接统计信息表,查询出目标法律文件章引用过的其他法律文件(法律文件库别=当前法律文件库别and法律文件唯一标志=当前法律文件唯一标志)。按照被引用法律文件的库别分组,每组选择发布日期最近的10篇法律文件。展示的时候在正文右侧分组依次排列展示,展示标题后面添加括弧注明发布日期,根据引用法规的库别和唯一标志生成跳转链接,点击链接可在弹 出窗口中直接跳转到该法律文件。
例如,在所述目标法律文件右侧显示引用目标法律文件的法律文件(例如法规):
根据超链统计信息表,查询出引用过目标法律文件的其他法律文件(引用法律文件(例如法规)的库别=当前法律文件库别and引用法律文件(例如法规)的唯一标志=当前法律文件唯一标志)。按照引用法律文件的库别、效力级别分组,每组选择发布日期最近的10篇法律文件。展示的时候在正文右侧“目标法律文件引用法规”下面排列,按照分组依次排列展示,展示标题后面添加括弧注明发布日期,根据被引用法规的库别和唯一标志生成跳转链接,点击链接可在弹出窗口中直接跳转到该法律文件。
可选的,所述确定标题字典包括:
确定适用于作为标题字典的栏目和库别;
设置适宜作为标题字典的文章的筛选条件,建立标题字典;
其中,所述标题字典中的每一条标题包括:字典主题词、唯一标志,所述字典主题词是标题字典用于匹配的关键词,所述唯一标志是法律文件在数库的唯一编码;
所述标题字典中的每一条标题还包括:
前缀、后缀、发布日期、地区编码,所述前缀位于所述字典主题词前面,用于标记国别、地域名称、发布单位、第一标记性词语,所述后缀位于所述字典主题词后面的第二标记性词语,所述发布日期标识指法律文件的发布时间,所述地区编码是指根据法律文件发布单位所在地区计算的地区编码。
具体的,建立适合的标题字典过程可以包括:
自动匹配或者根据人工筛选适用于作为标题字典的栏目和库别。栏目可以为根据法律文件属性所做的分类,也可以为根据法律文件的类别所做的分类,还可以根据其他方式划分的栏目本繁忙实施例不做限定。库别可以为根据法律文件属性所做的分类,例如法律法规库、司法案例库、法学期刊库等。获取人 工设置的或者自动提取适宜作为标题字典的文章的筛选条件,通过自动程序建立标题字典,为了提高准确性和适用性,标题字典中的每一条标题分为:“字典主题词”、“前缀”、“后缀”、“发布日期”、“地区编码”、“唯一标志”这6个组成部分,每个标题字典必须有“字典主题词”、“唯一标志”这两个部分,其他部分根据情况补充。
“字典主题词”是字典用于匹配的主要关键词;“前缀”是指国别、地域名称、发布单位、标记性词语(关于、批准、修改、转发等),等“字典主题词”前面的内容;“后缀”是指“字典主题词”后面出现的标记性词语(答复、函、通知)之后的部分;“发布日期”指文章的发布时间,一篇文章原则上只能被在该篇文章发布日期之后发布的文章引用,这个原则是超链字典匹配的重要的原则;“地区编码”是指根据文件发布单位所在地区计算的地区编码;“唯一标志”是文章在我们法规数库的唯一编码。例“中华人民共和国刑法(97)
17010”超链标题字典处理结果为:字典主题词:刑法、前缀:中华人民共和国、发布日期:19970314、唯一标志:17010。
标题字典建立后根据栏目、库别分别存储,方便使用时灵活调用。可通过维护平台对标题字典进行精细加工,定期运行自动程序增量更新超链标题字典。
可选的,使用所述标题字典为存储法律文件的数据库加载标题字典,所述法律文件的数据库存储所有备选的法律文件,所述法律文件的数据库可以为所有法律文件的总库,其可以包含多个子库。
具体的,各栏目各库别的数据添加超链时需要根据情况加载不同的超链字典,各库具体加载哪些字典由计算机自动获取或者根据输入确定。字典加载完毕后,对加载的字典建立树形哈希索引。
可选的,所述对加载的标题字典建立树形哈希索引包括:
根据加载字典所有条目的字典主题词的第一个字建立第一层哈希索引,重复的字只记录一个节点,作为树根索引;
根据第二个字建立第二层子节点的哈希索引,建立第二层索引时,用第一个字匹配第一个字的哈希索引,在第一层索引上用第二个字派生第二层索引;
依次派生第三层、第四层直到第N层索引,N=字典主题词的长度,N是索引树的叶子节点,存储前缀、后缀、发布日期、地区编码、唯一标志信息;
如果两个或者两个以上字典主题词完全相同而前缀、后缀、发布日期、地区编码、唯一标志信息不同,则所有这些相同的字典主题词在叶子节点中存成一个数组,分别存储。
可选的,所述匹配所有法律文件库中的所有法律文件,得到匹配结果包括:
各法律文件库正文开始匹配索引,正文逐字放到索引中进行匹配;
如果匹配到叶子节点表示匹配成功,根据叶子节点的前缀、后缀、发布日期、地区编码、唯一标志和该篇文章本身的发布日期、地区编码、唯一标志计算匹配是否合理;
合理性判断原则为:一篇法律文件只能引用在它发布日期之前发布的法律文件;一篇法律文件只能引用当前地域和中央发布的法律文件;
符合合理性原则的匹配为有效匹配,根据有效匹配字符串前后的字符串和叶子节点的前缀、后缀、发布日期进一步匹配,查找适合的匹配扩展;
确定匹配范围,根据字典的唯一标志在正文中匹配的位置添加超链;在匹配的标题后面第X条、X条这样的文字,对X进行数字验证,如果X是中文数字或者阿拉伯数字则认为匹配的标题后面是对于超链标题条的引用,给条引用替添加详细到条号的超链;依次匹配整篇法律文件的所有文字,至一篇法律文件完成,将匹配的结果单独存储;依照目前的索引算法,整篇法律文件加超链的时间=文章长度,属于速度最优的算法。
可选的,根据所述匹配结果提取文章之间的关联,建立超链接统计信息表包括:
根据匹配的结果提取文章之间的引用关联,提取内容为:文章库别、文章唯一标志、文章引用法规的库别、文章引用法规的唯一标志、文章引用法规的 条号;
根据添加的超链提取法律文件之间的匹配关系;
根据提取的匹配关系扩展填充引用的法律文件和被引用的法律文件的标题、发布日期、库别,组成引用法规与被引用法规的完整映射关系,完整的文章引用关系即为超链接统计信息表;
超链接统计信息表根据被引用法规的库别效力级别、唯一标志、条号进行分组统计,计算出被引用法规、被引用法规的某一条被不同库别引用的篇数和次数;其中,次数指被引用法规或者被引用法规的某一条在某一分组中被引用的总次数,一篇法律文件可能引用另一篇法律文件多次,每引用自此计数都加一;篇数指每一篇不管引用多少次都只计数一。
具体的,根据匹配的结果提取法律文件之间的引用关联。提取内容:法律文件库别、法律文件唯一标志、法律文件引用的法律文件(例如法规)的库别、文章引用的法律文件(例如法规)的唯一标志、法律文件引用的法律文件(例如法规)的条号(篇引用的条号为0)。根据之前添加的超链提取法律文件(例如法规)之间的匹配关系。根据提取的匹配关系扩展填充引用法律文件和被引用法律文件的标题、发布日期、库别、等信息,就组成了引用法律文件(例如法规)与被引用法律文件(例如法规)的完整映射关系。完整的法律文件引用关系即为超链标题引用表、超链接统计信息表。超链标题引用表根据被引用法规的库别效力级别(目前只有中央库分组详细到效力级别,其他库只分组到库别)、唯一标志、条号进行分组统计,计算出被引用法律文件(例如法规)、被引用法律文件(例如法规)的某一条被不同库别引用的篇数和次数(次数指被引用法律文件(例如法规)或者被引用法律文件(例如法规)的某一条在某一分组中被引用的总次数,一篇法律文件可能引用另一篇文章多次,每引用自此计数都加一;篇数指每一篇只不管引用多少次都只计数一,排除了多次引用同一篇的重复计数)。
可选的,根据所述超链接统计信息表建立所述反超链接统计信息表包括:
最后按照被引用法律文件的库别、效力级别分组,再组合上被引用法规的标题、发布日期等等信息,再关联上该篇文章在各个分组中的统计篇数和次数就成为了反超链接统计信息表。
本发明实施例中,还可以建立人工维护平台,人工或自动化建立现有技术无法自动化处理的关联关系。编著、本法变迁史维护平台。人工录入有历史沿革关系的法规标题录入关联关系。根据录入的标题获取对应正文,自动程序逐条比较有关联关系的正文,根据法条内容的相似度匹配详细到条的沿革关系。自动程序匹配完成后,人工校对匹配的准确性,达到100%的准确性。匹配关系作为补充内容,按照第一部分的匹配规则导入超链、反超链统计表。
实务概要、条文释义、英文翻译、法学教程等其它不适宜匹配的关联关系的建立和维护。实务概要、条文释义、英文翻译、法学教程等特殊内容,不适宜通过第一部分的匹配关系建立关联。这部分法律文件与其他法律文件的关联关系完全由人工维护。人工维护完毕后,按照第一部分的匹配规则,定期将差异数据导入超链、反超链统计表。
可选的,所述确定目标法律文件的关联文件包括:
统计目标法律文件引用的文章和引用目标法律文件的法律文件,确定目标法律文件的关联文件。
例如,通过法宝联想栏目对法律文件之间关联关系的集中展示。
这个栏目通过展示被引用的法律文件和引用该法律文件其他法律文件的栏目统计,关联该法律文件的每一篇被引用。栏目首页按照效力级别和库别分组展示被引用法律文件,每个分组按照引用篇数降序排列列出最多12篇法律文件(即列出每个分组被引用篇数最多的12篇法律文件)的标题,右侧显示引用栏目的统计数字(按照法规、案例、论文分组统计数字),每个分组设有“更多”按钮可以跳转展示该分组的更多法律文件。
首页设有检索框,根据被引用文章的标题匹配输入检索,分组展示检索结果。
点击标题进入该篇法律文件被引用的详细情况页面,该页展示该篇法律文件以及该篇文章的每一条,被各个库别和效力级别引用的篇数和次数的详细情况。展示的条号和每一个引用关系都可以点击。点击条号可以在弹出框中跳转到该篇法律文件对应的条。点击引用关系,在弹出框中跳转到被该篇法律文件的该条引用的法律文件的列表页。
引用法律文件列表页详细的列出了引用法律文件的列表。列表依据发布日期倒序排列,左侧展示列表的类别等聚类统计信息。列表中的每篇法律文件有“更多命中”和“展示全文”按钮,点击“更多命中”展示被引用法律文件在引用文章正文中的命中摘要(根据超链标记计算得到),点击“展示全文”跳转到引用法律文件的正文。
列表顶端列出了该篇法律文件被引用过的栏目分组,点击这些栏目分组可以切换展示对应分组的法律文件列表。条文释义、英文翻译、法学教程、修订沿革等关联内容有特殊的展示方式:条文释义直接展示该篇或者该条的释义内容;英文翻译跳转到该篇或者该条的英文译本站点;法学教程跳转到该文章或者该条对应的法学教程站点;修订沿革展示该篇或者该条的历史沿革情况,篇沿革展示沿革文章列表,条沿革展示法条和法条内容变更过程。
列表页还提供了“引用合计”、“引用标题”、“引用各条”、“引用单条”四种类型列表展示方式。“引用合计”展示引用了该篇法律文件标题或者引用该篇文某些条目的法律文件列表(排过重);“引用标题”只展示引用了该篇法律文件标题,未引用该篇文章具体条目的法律文件列表;“引用各条”展示该篇文章的条目被引用的情况,先展示第一条的被引用列表,点击翻页展示其他条的被引用列表;“引用单条”展示只引用了该篇法律文件某条目,而没有引用整篇法律文件的文章列表(排过重)。
可选的,所述确定目标法律文件的关联文件包括:
将目标法律文件整个变迁过程中涉及的所有法律文件,作为所述目标法律文件的关联文件。
例如,在被引用法规的正文中插入详细到条的发表联想内容,增加正文内容丰富性。
首先在正文首部添加本法变迁史的引用关系,按照发布日期升序一次排列,标题后面标注发布日期,列出该篇文章整个变迁过程中涉及的所有文件,点击可跳转到关联文件。
正文内容预先由人工添加过标记,标记了正文开始位置和每一条的结束位置。将该篇法规被引用情况以条为单位,用文字描述出来组成法宝联想描述内容,描述内容包括引用文章的库别效力级别和引用数量(例:法宝联想:法律约22篇行政法规约47篇部门规章约1654篇司法解释约10篇其他规范性文件约14篇地方法规规章约8646篇高法公报案例约1篇案例与裁判文书约1301篇法学期刊约854篇律所实务约49篇实务专题约24篇条文释义法学教程约1篇法学文献约715篇)。将描述内容依次插入对应的法条结束位置,整篇文章的引用情况插入正文开始位置。这样就在整篇文章中添加了法宝联想的详细信息,正文展示时候带着法宝联想一起展示。
正文中插入的法宝联想的每个关联关系都可以点击跳转,点击后跳转到该关联关系对应的法宝联想栏目展示页面。
本发明实施例中,正文右侧可以显示其他关联关系,其他业务关联项目较多,这里仅举例如下,这些项目都是根据关联关系或者根据案由进行关联:
本发明实施例的文件关联显示方法,确定目标法律文件的关联文件,确定关联文件的链接地址,显示目标法律文件时同步显示关联文件或者关联文件的链接地址,从而实现同步显示关联法律文件,以节约用户检索时间,增加用户体验。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种文件关联显示方法,其特征在于,包括:
确定目标法律文件的关联文件;
确定所述关联文件的链接地址,所述链接地址用于链接到所述关联文件;
显示所述目标法律文件时,同步显示所述关联文件或者所述关联文件的链接地址。
2.根据权利要求1所述的方法,其特征在于,所述目标法律文件的关联文件为与所述目标法律文件具有引用关系的法律文件,所述确定目标法律文件的关联文件包括:
建立反超链接统计信息表,所述超链接统计信息表记录与所述目标法律文件具有引用关系的法律文件;
查询所述反超链接统计信息表,得到与所述目标法律文件具有引用关系的法律文件。
3.根据权利要求2所述的方法,其特征在于,所述建立反超链接统计信息表包括:
确定标题字典;
使用所述标题字典为存储法律文件的数据库加载标题字典,所述法律文件的数据库存储所有备选的法律文件;
对加载的标题字典建立树形哈希索引;
索引建立完成后,匹配所有法律文件库中的所有法律文件,得到匹配结果;
根据所述匹配结果提取文章之间的关联,建立超链接统计信息表;
根据所述超链接统计信息表建立所述反超链接统计信息表。
4.根据权利要求3所述的方法,其特征在于,所述确定标题字典包括:
确定适用于作为标题字典的栏目和库别;
设置适宜作为标题字典的文章的筛选条件,建立标题字典;
其中,所述标题字典中的每一条标题包括:字典主题词、唯一标志,所述字典主题词是标题字典用于匹配的关键词,所述唯一标志是法律文件在数库的唯一编码;
所述标题字典中的每一条标题还包括:
前缀、后缀、发布日期、地区编码,所述前缀位于所述字典主题词前面,用于标记国别、地域名称、发布单位、第一标记性词语,所述后缀位于所述字典主题词后面的第二标记性词语,所述发布日期标识指法律文件的发布时间,所述地区编码是指根据法律文件发布单位所在地区计算的地区编码。
5.根据权利要求3所述的方法,其特征在于,所述对加载的标题字典建立树形哈希索引包括:
根据加载字典所有条目的字典主题词的第一个字建立第一层哈希索引,重复的字只记录一个节点,作为树根索引;
根据第二个字建立第二层子节点的哈希索引,建立第二层索引时,用第一个字匹配第一个字的哈希索引,在第一层索引上用第二个字派生第二层索引;
依次派生第三层、第四层直到第N层索引,N=字典主题词的长度,N是索引树的叶子节点,存储前缀、后缀、发布日期、地区编码、唯一标志信息;
如果两个或者两个以上字典主题词完全相同而前缀、后缀、发布日期、地区编码、唯一标志信息不同,则所有这些相同的字典主题词在叶子节点中存成一个数组,分别存储。
6.根据权利要求3所述的方法,其特征在于,所述匹配所有法律文件库中的所有法律文件,得到匹配结果包括:
各法律文件库正文开始匹配索引,正文逐字放到索引中进行匹配;
如果匹配到叶子节点表示匹配成功,根据叶子节点的前缀、后缀、发布日期、地区编码、唯一标志和该篇文章本身的发布日期、地区编码、唯一标志计算匹配是否合理;
合理性判断原则为:一篇法律文件只能引用在它的发布日期之前发布的法律文件;一篇法律文件只能引用当前地域和中央发布的法律文件;
符合合理性原则的匹配为有效匹配,根据有效匹配字符串前后的字符串和叶子节点的前缀、后缀、发布日期进一步匹配,查找适合的匹配扩展;
确定匹配范围,根据字典的唯一标志在正文中匹配的位置添加超链;在匹配的标题后面第X条、X条这样的文字,对X进行数字验证,如果X是中文数字或者阿拉伯数字则认为匹配的标题后面是对于超链标题条的引用,给条引用替添加详细到条号的超链;依次匹配整篇法律文件的所有文字,至一篇法律文件完成,将匹配的结果单独存储;依照目前的索引算法,整篇法律文件加超链的时间=文章长度,属于速度最优的算法。
7.根据权利要求3所述的方法,其特征在于,根据所述匹配结果提取文章之间的关联,建立超链接统计信息表包括:
根据匹配的结果提取文章之间的引用关联,提取内容为:文章库别、文章唯一标志、文章引用法规的库别、文章引用法规的唯一标志、文章引用法规的条号;
根据添加的超链提取法律文件之间的匹配关系;
根据提取的匹配关系扩展填充引用的法律文件和被引用的法律文件的标题、发布日期、库别,组成引用法规与被引用法规的完整映射关系,完整的文章引用关系即为超链接统计信息表;
超链接统计信息表根据被引用法规的库别效力级别、唯一标志、条号进行分组统计,计算出被引用法规、被引用法规的某一条被不同库别引用的篇数和次数;其中,次数指被引用法规或者被引用法规的某一条在某一分组中被引用的总次数,一篇法律文件可能引用另一篇法律文件多次,每引用自此计数都加一;篇数指每一篇不管引用多少次都只计数一。
8.根据权利要求3所述的方法,其特征在于,根据所述超链接统计信息表建立所述反超链接统计信息表包括:
最后按照被引用法律文件的库别、效力级别分组,再组合上被引用法规的标题、发布日期等等信息,再关联上该篇文章在各个分组中的统计篇数和次数就成为了反超链接统计信息表。
9.根据权利要求1或2所述的方法,其特征在于,所述确定目标法律文件的关联文件包括:
统计目标法律文件引用的文章和引用目标法律文件的法律文件,确定目标法律文件的关联文件。
10.根据权利要求1或2或9所述的方法,其特征在于,所述确定目标法律文件的关联文件包括:
将目标法律文件整个变迁过程中涉及的所有法律文件,作为所述目标法律文件的关联文件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610534962.4A CN105930546B (zh) | 2016-07-08 | 2016-07-08 | 文件关联显示方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610534962.4A CN105930546B (zh) | 2016-07-08 | 2016-07-08 | 文件关联显示方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105930546A true CN105930546A (zh) | 2016-09-07 |
CN105930546B CN105930546B (zh) | 2020-04-03 |
Family
ID=56827166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610534962.4A Active CN105930546B (zh) | 2016-07-08 | 2016-07-08 | 文件关联显示方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105930546B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108132941A (zh) * | 2016-11-30 | 2018-06-08 | 北京国双科技有限公司 | 法律文献的关联关系的处理方法和装置 |
CN108763442A (zh) * | 2018-05-25 | 2018-11-06 | 平安科技(深圳)有限公司 | 工作簿过滤方法、装置、计算机设备及存储介质 |
CN109101512A (zh) * | 2017-06-21 | 2018-12-28 | 北京国双科技有限公司 | 法律数据库的构建方法、法律数据查询方法及装置 |
CN110287292A (zh) * | 2019-07-04 | 2019-09-27 | 科大讯飞股份有限公司 | 一种裁判量刑偏离度预测方法及装置 |
CN110555198A (zh) * | 2018-05-31 | 2019-12-10 | 北京百度网讯科技有限公司 | 用于生成文章的方法、装置、设备和计算机可读存储介质 |
WO2020010996A1 (zh) * | 2018-07-13 | 2020-01-16 | 腾讯科技(深圳)有限公司 | 超链接的处理方法和装置及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101539904A (zh) * | 2009-04-21 | 2009-09-23 | 武汉大学 | 一种引文自动标引方法 |
CN102087669A (zh) * | 2011-03-11 | 2011-06-08 | 北京汇智卓成科技有限公司 | 基于语义关联的智能搜索引擎系统 |
CN103412921A (zh) * | 2013-08-12 | 2013-11-27 | 同方光盘股份有限公司 | 文献资源知网节的展示结构 |
CN104428764A (zh) * | 2012-06-29 | 2015-03-18 | 汤姆森路透社全球资源公司 | 用于处理、呈现和推荐引用的系统、方法和软件 |
CN105404677A (zh) * | 2015-11-20 | 2016-03-16 | 四川神琥科技有限公司 | 一种基于树形结构的检索方法 |
CN105488151A (zh) * | 2015-11-27 | 2016-04-13 | 小米科技有限责任公司 | 参考文档的推荐方法及装置 |
-
2016
- 2016-07-08 CN CN201610534962.4A patent/CN105930546B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101539904A (zh) * | 2009-04-21 | 2009-09-23 | 武汉大学 | 一种引文自动标引方法 |
CN102087669A (zh) * | 2011-03-11 | 2011-06-08 | 北京汇智卓成科技有限公司 | 基于语义关联的智能搜索引擎系统 |
CN104428764A (zh) * | 2012-06-29 | 2015-03-18 | 汤姆森路透社全球资源公司 | 用于处理、呈现和推荐引用的系统、方法和软件 |
CN103412921A (zh) * | 2013-08-12 | 2013-11-27 | 同方光盘股份有限公司 | 文献资源知网节的展示结构 |
CN105404677A (zh) * | 2015-11-20 | 2016-03-16 | 四川神琥科技有限公司 | 一种基于树形结构的检索方法 |
CN105488151A (zh) * | 2015-11-27 | 2016-04-13 | 小米科技有限责任公司 | 参考文档的推荐方法及装置 |
Non-Patent Citations (1)
Title |
---|
刘盛博: "科学论文的引用内容分析及其应用", 《中国博士学位论文全文数据库经济与管理科学辑》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108132941A (zh) * | 2016-11-30 | 2018-06-08 | 北京国双科技有限公司 | 法律文献的关联关系的处理方法和装置 |
CN108132941B (zh) * | 2016-11-30 | 2021-03-26 | 北京国双科技有限公司 | 法律文献的关联关系的处理方法和装置 |
CN109101512A (zh) * | 2017-06-21 | 2018-12-28 | 北京国双科技有限公司 | 法律数据库的构建方法、法律数据查询方法及装置 |
CN108763442A (zh) * | 2018-05-25 | 2018-11-06 | 平安科技(深圳)有限公司 | 工作簿过滤方法、装置、计算机设备及存储介质 |
CN110555198A (zh) * | 2018-05-31 | 2019-12-10 | 北京百度网讯科技有限公司 | 用于生成文章的方法、装置、设备和计算机可读存储介质 |
CN110555198B (zh) * | 2018-05-31 | 2023-05-23 | 北京百度网讯科技有限公司 | 用于生成文章的方法、装置、设备和计算机可读存储介质 |
WO2020010996A1 (zh) * | 2018-07-13 | 2020-01-16 | 腾讯科技(深圳)有限公司 | 超链接的处理方法和装置及存储介质 |
US11275888B2 (en) | 2018-07-13 | 2022-03-15 | Tencent Technology (Shenzen) Company Limited | Hyperlink processing method and apparatus |
CN110287292A (zh) * | 2019-07-04 | 2019-09-27 | 科大讯飞股份有限公司 | 一种裁判量刑偏离度预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105930546B (zh) | 2020-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105930546A (zh) | 文件关联显示方法 | |
AU2005203239B2 (en) | Phrase-based indexing in an information retrieval system | |
AU2005203237B2 (en) | Phrase-based generation of document description | |
US7599914B2 (en) | Phrase-based searching in an information retrieval system | |
Coffano et al. | CRIOS-Patstat database: sources, contents and access rules | |
US20060212441A1 (en) | Full text query and search systems and methods of use | |
US20050021551A1 (en) | Current mailing address identification and verification | |
Vercoustre et al. | Entity ranking in wikipedia | |
CN100501745C (zh) | 电子文本处理与检索的便捷方法和系统 | |
CN101320387A (zh) | 基于用户关注时间的网页文本与图像排序方法 | |
CN101382939B (zh) | 基于眼球跟踪的网页文本个性化搜索方法 | |
Yi et al. | Revisiting the syntactical and structural analysis of Library of Congress Subject Headings for the digital environment | |
CN102693304A (zh) | 一种搜索引擎的反馈信息处理方法及搜索引擎 | |
CN101390093B (zh) | 利用语言链提供搜索结果的方法和装置 | |
CN103793523A (zh) | 一种基于内容相似度计算的自动搜索引擎构建方法 | |
Ravi et al. | Using structured text for large-scale attribute extraction | |
Pera et al. | A sophisticated library search strategy using folksonomies and similarity matching | |
CN106372123B (zh) | 一种基于标签的相关内容推荐方法和系统 | |
Chi et al. | Word segmentation and recognition for web document framework | |
Hsiang et al. | Discovering relationships from imperial court documents of Qing China | |
Bai et al. | Text mining from internet resources using information retrieval techniques | |
Patrick | Zooming In and Out: Theories of Poetry from Checking the Periodical Poetry Index | |
Plamadă | Exploiting comparable corpora for domain-specific statistical machine translation | |
Holloway | Big Data, Big Deal: Use of Google Books Ngram Viewer and JSTOR Data for Research for Charting the Rise of Assyriology | |
Francom et al. | Creating a web-based lexical corpus and information-extraction tools for the Semitic language Maltese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |