CN106502996A - 一种基于语义匹配的裁判文书检索方法和服务器 - Google Patents

一种基于语义匹配的裁判文书检索方法和服务器 Download PDF

Info

Publication number
CN106502996A
CN106502996A CN201611142655.8A CN201611142655A CN106502996A CN 106502996 A CN106502996 A CN 106502996A CN 201611142655 A CN201611142655 A CN 201611142655A CN 106502996 A CN106502996 A CN 106502996A
Authority
CN
China
Prior art keywords
judgement document
vector
information
retrieval
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611142655.8A
Other languages
English (en)
Inventor
赵泛舟
潘嵘
杨洋
梅林�
曾宏生
薛隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ipin Information Technology Co Ltd
Original Assignee
Shenzhen Ipin Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ipin Information Technology Co Ltd filed Critical Shenzhen Ipin Information Technology Co Ltd
Priority to CN201611142655.8A priority Critical patent/CN106502996A/zh
Publication of CN106502996A publication Critical patent/CN106502996A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于语义匹配的裁判文书检索方法和服务器,通过设计一种基于语义匹配的裁判文书检索方法和服务器,让案例检索不需要直接输入与裁判文书中的关键词精确匹配的词语,而是直接用自然语言描述遇到的法律问题或者案情即可找到匹配的裁判文书,解决了上述问题,大大的降低了文书检索服务器的使用门槛,提高了检索效率。

Description

一种基于语义匹配的裁判文书检索方法和服务器
技术领域
本发明属于数据检索领域,更具体的,涉及一种基于语义匹配的裁判文书检索方法和服务器。
背景技术
现有的各种裁判文书检索服务器中都是使用关键词检索技术,系统通过在裁判文书中查找用户所输入的词或者词的组合来判断推送哪些文书。由于语言表述的模糊性与多样性,在裁判文书中可能会出现同一个词在不同的上下文中的意思不一样的情形,也可能出现不同的词表达的是同一个意思的情形。在关键词检索服务器中,由于词语是严格的按照字面来匹配的,由于上述的语言表述的多样性,用户需要十分熟练的掌握法律知识,熟悉裁判文书的常见表达后,才能通过关键词搭配组合的方式检索到类似的案例,这以特性导致现有的裁判文书检索服务器的使用门槛很高,并且需要花费较长的时间才能找到与需求相匹配的裁判文书。造成这个问题的深层次原因是现在的检索服务器是基于语言文字的计算机存储内容来做的,文字存储的是编码(通用的是UTF-8)后的二进制内容,一个文字一般是1~4个字节,检索服务器在库里精确查找出现这些字节内容的文本。目前的现有技术存在下列问题:在这些系统中用户需要输入文书中包含的精确的关键词才能找到类似的案例,需要用户具有较高的法律专业知识才可以使用。当需要查找的信息比较明确时,输入的关键词较多时,由于需要全都匹配到,往往会查找不到。当需要查找的信息比较模糊时,输入的关键词会较少,会出来大量的无关内容,难以定位出用户真正需要的内容。当用户输入不够精准,例如出现错别字,或者使用同义词,或者使用非法律专业术语,将查找不到期望的内容。对于搜索结果的排序通常是基于输入的关键词的概率来进行的,而没有关注用户输入内容的意义及重点。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。
为此,本发明的目的在于,提供一种基于语义匹配的裁判文书检索方法和服务器,通过设计一种基于语义匹配的裁判文书检索方法和服务器,让案例检索不需要直接输入与裁判文书中的关键词精确匹配的词语,而是直接用自然语言描述遇到的法律问题或者案情即可找到匹配的裁判文书,解决了上述问题,大大的降低了文书检索服务器的使用门槛,提高了检索效率。
为实现上述目的,本发明提供一种基于语义匹配的裁判文书检索方法,包括:
步骤1,客户端接收用户输入的检索信息,将所述检索信息发送至服务器端,所述检索信息为待搜索的字段和/或筛选条件;
步骤2,服务器端接收所述检索信息,将检索信息进行向量化,生成检索信息向量;
步骤3,将得到的所述检索信息向量于预存储的裁判文书向量进行对比,获取最匹配的裁判文书向量,将所述最匹配的裁判文书向量对应的裁判文书结果发送至客户端。
优选的,在所述步骤1之前还包括:
服务器端采集裁判文书;
将采集的裁判文书进行数据清洗,解析成多个关键字段,每个关键字段设置不同的标签;
将所述多个关键字段进行向量化处理,生成关键字段向量;
将生成的关键字段向量与裁判文书建立映射关系;
将所述关键字段向量、映射关系、裁判文书存储在数据库中。
优选的,所述筛选条件包括:律师信息、事务所信息、地域信息、年份信息、案件类型信息中的一种或几种。
更优的,所述地域信息包括案件发生地、案件管辖地和/或其他案件涉及到的地理位置。
优选的,所述将得到的所述检索信息向量于预存储的裁判文书向量进行对比为采用距离测度法或相似性函数法进行向量对比。
本发明另一方面还提供一种基于语义匹配的裁判文书检索服务器,包括:
接收模块,服务器端接收所述检索信息,所述检索信息为客户端接收的用户输入的检索信息;
向量生成模块,用于将检索信息进行向量化,生成检索信息向量;
对比分析模块,将得到的所述检索信息向量于预存储的裁判文书向量进行对比,获取最匹配的裁判文书向量;
发送模块,用于将所述最匹配的裁判文书向量对应的裁判文书结果发送至客户端;
所述检索信息为待搜索的字段和/或筛选条件。
优选的,还包括:数据清洗模块,用于将采集的裁判文书进行数据清洗,解析成多个关键字段,每个关键字段设置不同的标签;
映射模块,将所述多个关键字段进行向量化处理,生成关键字段向量,将生成的关键字段向量与裁判文书建立映射关系;
数据库,用于存储所述关键字段向量、映射关系、裁判文书。
优选的,所述筛选条件包括:律师信息、事务所信息、地域信息、年份信息、案件类型信息中的一种或几种。
优选的,所述地域信息包括案件发生地、案件管辖地和/或其他案件涉及到的地理位置。
优选的,所述将得到的所述检索信息向量于预存储的裁判文书向量进行对比为采用距离测度法或相似性函数法进行向量对比。
通过本发明设计的一种基于语义匹配的裁判文书检索方法和服务器,让案例检索不需要直接输入与裁判文书中的关键词精确匹配的词语,而是直接用自然语言描述遇到的法律问题或者案情即可找到匹配的裁判文书,解决了上述问题,大大的降低了文书检索服务器的使用门槛,提高了检索效率。
附图说明
图1示出了本发明一种基于语义匹配的裁判文书检索方法的流程图;
图2示出了本发明一种基于语义匹配的裁判文书检索服务器的结构框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本发明一种基于语义匹配的裁判文书检索方法的流程图。
如图1所示,根据本发明一种基于语义匹配的裁判文书检索方法,包括:
步骤1,客户端接收用户输入的检索信息,将所述检索信息发送至服务器端,所述检索信息为待搜索的字段和/或筛选条件。
所述筛选条件包括:律师信息、事务所信息、地域信息、年份信息、案件类型信息中的一种或几种。
所述地域信息包括案件发生地、案件管辖地和/或其他案件涉及到的地理位置。
所述案件类型包括:普通民事纠纷、房地产类、合同纠纷、涉外类、公司纠纷、海事海商、知识产权、投融资业务、赔偿案件、行政纠纷和刑事;
普通民事纠纷包括:债权债务纠纷、婚姻家庭、交通事故、医疗纠纷、劳动争议、侵权损害赔偿纠纷、其他普通民事纠纷;
房地产类包括:建设工程合同纠纷和房地产开发经营纠纷;
合同纠纷包括:常见合同纠纷、土地矿产类合同纠纷和其他类合同纠纷;所述常见合同纠纷包括:买卖合同纠纷、租赁合同纠纷、房屋租赁合同纠纷、车辆租赁合同纠纷、承揽合同纠纷、劳务合同纠纷、不当得利纠纷、合伙合同纠纷、电信服务合同纠纷、委托合同纠纷、服务合同纠纷、居间合同纠纷、供用热力合同纠纷、公交运输合同纠纷、供用水合同纠纷、供用电力合同纠纷、法律服务合同纠纷、供用气合同纠纷、保管合同纠纷、仓储合同纠纷、行纪合同纠纷;
涉外类包括:国际贸易金融合同纠纷、涉外仲裁和信用证纠纷;
公司纠纷包括:股东权益、公司并购收购、公司破产清算、其他公司纠纷;
知识产权包括:垄断不正当竞争、专利、商标、著作权纠纷、技术合同和其他知识产权纠纷;
投融资业务包括:证券纠纷、期货交易纠纷、信托纠纷和票据纠纷。
步骤2,服务器端接收所述检索信息,将检索信息进行向量化,生成检索信息向量。
接收到检索信息后,将检索信息进行向量化处理,生成检索信息向量,此向量化的处理方法可采用如下方式进行处理,但不仅限于此方式:
例如,对一系统中的每一篇文章,我们首先计算每个单词的出现频率(TF:TermFrequency),即该单词出现的次数除以文章总单词数,然后统计这个单词的反比文档频率(IDF:Inverse Document Frequency),在所有文章中出现的次数,并用该数除文章总数,即总文章数除以出现该单词文章的数目。由上面的定义可以看出,单词越重要,他的单词出现频率TF就越高,单词越是只在这篇文章中出现,很少在其它文章中出现,那该单词越对本篇文章具有重要意义。通过一定的公式,可以计算出每个单词的对每篇文章的权重,这样所有单词加上其对应的权重,就形成了一个多维术语向量。
步骤3,将得到的所述检索信息向量于预存储的裁判文书向量进行对比,获取最匹配的裁判文书向量,将所述最匹配的裁判文书向量对应的裁判文书结果发送至客户端。
优选的,所述将得到的所述检索信息向量于预存储的裁判文书向量进行对比为采用距离测度法或相似性函数法进行向量对比。这两种向量对比方法为本领域的常用方法,本发明不再一一赘述。
优选的,在所述步骤1之前还包括:
服务器端采集裁判文书;
将采集的裁判文书进行数据清洗,解析成多个关键字段,每个关键字段设置不同的标签;
将所述多个关键字段进行向量化处理,生成关键字段向量,其中关键字段是预设的,和上述检索信息向量中的字段需要对应;
将生成的关键字段向量与裁判文书建立映射关系;
将所述关键字段向量、映射关系、裁判文书存储在数据库中。
当服务器接收到检索信息后,生成检索向量,再通过与预存储的裁判文书向量进行对比,获取最匹配的裁判文书向量,最后通过映射关系找出对应的裁判文书,把此裁判文书发送至客户端,完成整个的检索过程。
图2示出了本发明一种基于语义匹配的裁判文书检索服务器的结构框图。
如图2所示,本发明提供一种基于语义匹配的裁判文书检索服务器,包括:
接收模块,服务器端接收所述检索信息,所述检索信息为客户端接收的用户输入的检索信息;
向量生成模块,用于将检索信息进行向量化,生成检索信息向量;
对比分析模块,将得到的所述检索信息向量于预存储的裁判文书向量进行对比,获取最匹配的裁判文书向量;
发送模块,用于将所述最匹配的裁判文书向量对应的裁判文书结果发送至客户端;
所述检索信息为待搜索的字段和/或筛选条件。
所述筛选条件包括:律师信息、事务所信息、地域信息、年份信息、案件类型信息中的一种或几种。
所述地域信息包括案件发生地、案件管辖地和/或其他案件涉及到的地理位置。
所述案件类型包括:普通民事纠纷、房地产类、合同纠纷、涉外类、公司纠纷、海事海商、知识产权、投融资业务、赔偿案件、行政纠纷和刑事;
普通民事纠纷包括:债权债务纠纷、婚姻家庭、交通事故、医疗纠纷、劳动争议、侵权损害赔偿纠纷、其他普通民事纠纷;
房地产类包括:建设工程合同纠纷和房地产开发经营纠纷;
合同纠纷包括:常见合同纠纷、土地矿产类合同纠纷和其他类合同纠纷;所述常见合同纠纷包括:买卖合同纠纷、租赁合同纠纷、房屋租赁合同纠纷、车辆租赁合同纠纷、承揽合同纠纷、劳务合同纠纷、不当得利纠纷、合伙合同纠纷、电信服务合同纠纷、委托合同纠纷、服务合同纠纷、居间合同纠纷、供用热力合同纠纷、公交运输合同纠纷、供用水合同纠纷、供用电力合同纠纷、法律服务合同纠纷、供用气合同纠纷、保管合同纠纷、仓储合同纠纷、行纪合同纠纷;
涉外类包括:国际贸易金融合同纠纷、涉外仲裁和信用证纠纷;
公司纠纷包括:股东权益、公司并购收购、公司破产清算、其他公司纠纷;
知识产权包括:垄断不正当竞争、专利、商标、著作权纠纷、技术合同和其他知识产权纠纷;
投融资业务包括:证券纠纷、期货交易纠纷、信托纠纷和票据纠纷。
接收到检索信息后,将检索信息进行向量化处理,生成检索信息向量,此向量化的处理方法可采用如下方式进行处理,但不仅限于此方式:
例如,对一系统中的每一篇文章,我们首先计算每个单词的出现频率(TF:TermFrequency),即该单词出现的次数除以文章总单词数,然后统计这个单词的反比文档频率(IDF:Inverse Document Frequency),在所有文章中出现的次数,并用该数除文章总数,即总文章数除以出现该单词文章的数目。由上面的定义可以看出,单词越重要,他的单词出现频率TF就越高,单词越是只在这篇文章中出现,很少在其它文章中出现,那该单词越对本篇文章具有重要意义。通过一定的公式,可以计算出每个单词的对每篇文章的权重,这样所有单词加上其对应的权重,就形成了一个多维术语向量。
优选的,还包括:数据清洗模块,用于将采集的裁判文书进行数据清洗,解析成多个关键字段,每个关键字段设置不同的标签;
映射模块,将所述多个关键字段进行向量化处理,生成关键字段向量,将生成的关键字段向量与裁判文书建立映射关系,其中关键字段是预设的,和上述检索信息向量中的字段需要对应;
数据库,用于存储所述关键字段向量、映射关系、裁判文书。
优选的,所述将得到的所述检索信息向量于预存储的裁判文书向量进行对比为采用距离测度法或相似性函数法进行向量对比。这两种向量对比方法为本领域的常用方法,本发明不再一一赘述。
在本说明书的描述中,术语“安装”、“相连”、“连接”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于语义匹配的裁判文书检索方法,其特征在于,包括:
步骤1,客户端接收用户输入的检索信息,将所述检索信息发送至服务器端,所述检索信息为待搜索的字段和/或筛选条件;
步骤2,服务器端接收所述检索信息,将检索信息进行向量化,生成检索信息向量;
步骤3,将得到的所述检索信息向量于预存储的裁判文书向量进行对比,获取最匹配的裁判文书向量,将所述最匹配的裁判文书向量对应的裁判文书结果发送至客户端。
2.根据权利要求1所述的一种基于语义匹配的裁判文书检索方法,其特征在于,在所述步骤1之前还包括:
服务器端采集裁判文书;
将采集的裁判文书进行数据清洗,解析成多个关键字段,每个关键字段设置不同的标签;
将所述多个关键字段进行向量化处理,生成关键字段向量;
将生成的关键字段向量与裁判文书建立映射关系;
将所述关键字段向量、映射关系、裁判文书存储在数据库中。
3.根据权利要求1所述的一种基于语义匹配的裁判文书检索方法,其特征在于,所述筛选条件包括:律师信息、事务所信息、地域信息、年份信息、案件类型信息中的一种或几种。
4.根据权利要求3所述的一种基于语义匹配的裁判文书检索方法,其特征在于,所述地域信息包括案件发生地、案件管辖地和/或其他案件涉及到的地理位置。
5.根据权利要求1所述的一种基于语义匹配的裁判文书检索方法,其特征在于,所述将得到的所述检索信息向量于预存储的裁判文书向量进行对比为采用距离测度法或相似性函数法进行向量对比。
6.一种基于语义匹配的裁判文书检索服务器,其特征在于,包括:
接收模块,服务器端接收所述检索信息,所述检索信息为客户端接收的用户输入的检索信息;
向量生成模块,用于将检索信息进行向量化,生成检索信息向量;
对比分析模块,将得到的所述检索信息向量于预存储的裁判文书向量进行对比,获取最匹配的裁判文书向量;
发送模块,用于将所述最匹配的裁判文书向量对应的裁判文书结果发送至客户端;
所述检索信息为待搜索的字段和/或筛选条件。
7.根据权利要求6所述的一种基于语义匹配的裁判文书检索服务器,其特征在于,还包括:
数据清洗模块,用于将采集的裁判文书进行数据清洗,解析成多个关键字段,每个关键字段设置不同的标签;
映射模块,将所述多个关键字段进行向量化处理,生成关键字段向量,将生成的关键字段向量与裁判文书建立映射关系;
数据库,用于存储所述关键字段向量、映射关系、裁判文书。
8.根据权利要求6所述的一种基于语义匹配的裁判文书检索服务器,其特征在于,所述筛选条件包括:律师信息、事务所信息、地域信息、年份信息、案件类型信息中的一种或几种。
9.根据权利要求8所述的一种基于语义匹配的裁判文书检索服务器,其特征在于,所述地域信息包括案件发生地、案件管辖地和/或其他案件涉及到的地理位置。
10.根据权利要求6所述的一种基于语义匹配的裁判文书检索服务器,其特征在于,所述将得到的所述检索信息向量于预存储的裁判文书向量进行对比为采用距离测度法或相似性函数法进行向量对比。
CN201611142655.8A 2016-12-13 2016-12-13 一种基于语义匹配的裁判文书检索方法和服务器 Pending CN106502996A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611142655.8A CN106502996A (zh) 2016-12-13 2016-12-13 一种基于语义匹配的裁判文书检索方法和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611142655.8A CN106502996A (zh) 2016-12-13 2016-12-13 一种基于语义匹配的裁判文书检索方法和服务器

Publications (1)

Publication Number Publication Date
CN106502996A true CN106502996A (zh) 2017-03-15

Family

ID=58329939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611142655.8A Pending CN106502996A (zh) 2016-12-13 2016-12-13 一种基于语义匹配的裁判文书检索方法和服务器

Country Status (1)

Country Link
CN (1) CN106502996A (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106970987A (zh) * 2017-03-29 2017-07-21 陈�峰 一种数据分析方法及装置
CN107122438A (zh) * 2017-04-21 2017-09-01 安徽富驰信息技术有限公司 一种司法案件检索方法及系统
CN107247743A (zh) * 2017-05-17 2017-10-13 安徽富驰信息技术有限公司 一种司法类案检索方法及系统
CN107563912A (zh) * 2017-08-29 2018-01-09 广东蔚海数问大数据科技有限公司 一种律师推荐方法及系统
CN107918921A (zh) * 2017-11-21 2018-04-17 南京擎盾信息科技有限公司 刑事案件判决结果度量方法及系统
CN108255926A (zh) * 2017-11-14 2018-07-06 宫辉 一种基于甘特图的法律事务管理方法和系统
CN108573057A (zh) * 2018-04-25 2018-09-25 王慧 一种法律文书与法律法规对应性检索方法
CN108595547A (zh) * 2018-04-09 2018-09-28 南京网感至察信息科技有限公司 一种基于语义抽取的相似案件检索方法
CN108694178A (zh) * 2017-04-06 2018-10-23 北京国双科技有限公司 一种推荐司法知识的方法及装置
CN109033105A (zh) * 2017-06-09 2018-12-18 北京国双科技有限公司 获取裁判文书焦点的方法和装置
CN109255737A (zh) * 2017-07-12 2019-01-22 北京国双科技有限公司 庭审先例的推送方法及装置
CN109284359A (zh) * 2018-09-13 2019-01-29 巫溪县片刻网络科技有限公司 一种审判辅助数据管理平台
CN109285094A (zh) * 2017-07-19 2019-01-29 北京国双科技有限公司 法律文书的处理方法及装置
CN109656941A (zh) * 2018-12-27 2019-04-19 上海百事通信息技术股份有限公司 案例推送系统
CN109739888A (zh) * 2018-12-25 2019-05-10 北京市律典通科技有限公司 同案同判方法和系统
CN110019663A (zh) * 2017-09-30 2019-07-16 北京国双科技有限公司 一种案件信息的推送方法、系统、存储介质和处理器
CN110019655A (zh) * 2017-07-21 2019-07-16 北京国双科技有限公司 先例案件获取方法及装置
WO2019170015A1 (zh) * 2018-03-09 2019-09-12 北京国双科技有限公司 裁判文书搜索方法及装置
CN110647504A (zh) * 2018-06-25 2020-01-03 阿里巴巴集团控股有限公司 司法文书的检索方法及装置
CN110968664A (zh) * 2018-09-30 2020-04-07 北京国双科技有限公司 一种文书检索方法、装置、设备及介质
CN112597273A (zh) * 2020-12-02 2021-04-02 国网浙江省电力有限公司台州供电公司 一种基于nl2sql技术的配电自动化图表生成方法
CN112765311A (zh) * 2020-12-29 2021-05-07 长春市把手科技有限公司 一种裁判文书的搜索方法
CN113239206A (zh) * 2021-06-18 2021-08-10 广东博维创远科技有限公司 一种裁判文书精准化数据归类分析方法及计算机可以读取的存储装置
CN113535933A (zh) * 2021-06-01 2021-10-22 科大讯飞股份有限公司 案例检索方法及装置和电子设备、存储装置
CN117609440A (zh) * 2023-10-27 2024-02-27 中国司法大数据研究院有限公司 一种面向裁判文书的文档级智能问答实现方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110213784A1 (en) * 2010-03-01 2011-09-01 Microsoft Corporation Semantic object characterization and search
CN106156023A (zh) * 2015-03-23 2016-11-23 华为技术有限公司 语义匹配的方法、装置和系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110213784A1 (en) * 2010-03-01 2011-09-01 Microsoft Corporation Semantic object characterization and search
CN106156023A (zh) * 2015-03-23 2016-11-23 华为技术有限公司 语义匹配的方法、装置和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
向李兴: "基于自然语义处理的裁判文书推荐系统设计与实现", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106970987A (zh) * 2017-03-29 2017-07-21 陈�峰 一种数据分析方法及装置
CN108694178B (zh) * 2017-04-06 2020-11-27 北京国双科技有限公司 一种推荐司法知识的方法及装置
CN108694178A (zh) * 2017-04-06 2018-10-23 北京国双科技有限公司 一种推荐司法知识的方法及装置
CN107122438A (zh) * 2017-04-21 2017-09-01 安徽富驰信息技术有限公司 一种司法案件检索方法及系统
CN107247743A (zh) * 2017-05-17 2017-10-13 安徽富驰信息技术有限公司 一种司法类案检索方法及系统
CN109033105B (zh) * 2017-06-09 2022-03-01 北京国双科技有限公司 获取裁判文书焦点的方法和装置
CN109033105A (zh) * 2017-06-09 2018-12-18 北京国双科技有限公司 获取裁判文书焦点的方法和装置
CN109255737B (zh) * 2017-07-12 2022-04-12 北京国双科技有限公司 庭审先例的推送方法及装置
CN109255737A (zh) * 2017-07-12 2019-01-22 北京国双科技有限公司 庭审先例的推送方法及装置
CN109285094A (zh) * 2017-07-19 2019-01-29 北京国双科技有限公司 法律文书的处理方法及装置
CN109285094B (zh) * 2017-07-19 2021-11-30 北京国双科技有限公司 法律文书的处理方法及装置
CN110019655A (zh) * 2017-07-21 2019-07-16 北京国双科技有限公司 先例案件获取方法及装置
CN107563912A (zh) * 2017-08-29 2018-01-09 广东蔚海数问大数据科技有限公司 一种律师推荐方法及系统
CN110019663A (zh) * 2017-09-30 2019-07-16 北京国双科技有限公司 一种案件信息的推送方法、系统、存储介质和处理器
CN108255926A (zh) * 2017-11-14 2018-07-06 宫辉 一种基于甘特图的法律事务管理方法和系统
CN107918921B (zh) * 2017-11-21 2021-10-08 南京擎盾信息科技有限公司 刑事案件判决结果度量方法及系统
CN107918921A (zh) * 2017-11-21 2018-04-17 南京擎盾信息科技有限公司 刑事案件判决结果度量方法及系统
WO2019170015A1 (zh) * 2018-03-09 2019-09-12 北京国双科技有限公司 裁判文书搜索方法及装置
CN108595547A (zh) * 2018-04-09 2018-09-28 南京网感至察信息科技有限公司 一种基于语义抽取的相似案件检索方法
CN108573057A (zh) * 2018-04-25 2018-09-25 王慧 一种法律文书与法律法规对应性检索方法
CN110647504B (zh) * 2018-06-25 2023-03-21 阿里巴巴集团控股有限公司 司法文书的检索方法及装置
CN110647504A (zh) * 2018-06-25 2020-01-03 阿里巴巴集团控股有限公司 司法文书的检索方法及装置
CN109284359A (zh) * 2018-09-13 2019-01-29 巫溪县片刻网络科技有限公司 一种审判辅助数据管理平台
CN110968664A (zh) * 2018-09-30 2020-04-07 北京国双科技有限公司 一种文书检索方法、装置、设备及介质
CN109739888A (zh) * 2018-12-25 2019-05-10 北京市律典通科技有限公司 同案同判方法和系统
CN109656941A (zh) * 2018-12-27 2019-04-19 上海百事通信息技术股份有限公司 案例推送系统
CN112597273A (zh) * 2020-12-02 2021-04-02 国网浙江省电力有限公司台州供电公司 一种基于nl2sql技术的配电自动化图表生成方法
CN112765311A (zh) * 2020-12-29 2021-05-07 长春市把手科技有限公司 一种裁判文书的搜索方法
CN113535933A (zh) * 2021-06-01 2021-10-22 科大讯飞股份有限公司 案例检索方法及装置和电子设备、存储装置
CN113239206A (zh) * 2021-06-18 2021-08-10 广东博维创远科技有限公司 一种裁判文书精准化数据归类分析方法及计算机可以读取的存储装置
CN113239206B (zh) * 2021-06-18 2023-05-12 广东博维创远科技有限公司 一种裁判文书精准化数据归类分析方法及计算机可以读取的存储装置
CN117609440A (zh) * 2023-10-27 2024-02-27 中国司法大数据研究院有限公司 一种面向裁判文书的文档级智能问答实现方法

Similar Documents

Publication Publication Date Title
CN106502996A (zh) 一种基于语义匹配的裁判文书检索方法和服务器
CN102171702B (zh) 机密信息的检测
CN106372798B (zh) 一种基于风险的用户自定义的合同生成方法和系统
US8762191B2 (en) Systems, methods, apparatus, and schema for storing, managing and retrieving information
Maali et al. Enabling interoperability of government data catalogues
US9063985B2 (en) Method, system, apparatus, program code and means for determining a redundancy of information
US8510300B2 (en) Systems and methods for managing information associated with legal, compliance and regulatory risk
US20210312352A1 (en) Systems and methods for investigating and evaluating financial crime and sanctions-related risks
US8996481B2 (en) Method, system, apparatus, program code and means for identifying and extracting information
US20050044037A1 (en) Systems and methods for automated political risk management
CA3138730C (en) Public-opinion analysis method and system for providing early warning of enterprise risks
US20050210048A1 (en) Automated posting systems and methods
US20050021551A1 (en) Current mailing address identification and verification
US20050210047A1 (en) Posting data to a database from non-standard documents using document mapping to standard document types
US20050210016A1 (en) Confidence-based conversion of language to data systems and methods
US7519587B2 (en) Method, system, apparatus, program code, and means for determining a relevancy of information
CN104158828B (zh) 基于云端内容规则库识别可疑钓鱼网页的方法及系统
CN104298683B (zh) 主题挖掘方法和设备、以及查询扩展方法和设备
CN111753171A (zh) 一种恶意网站的识别方法和装置
CN110162754A (zh) 一种岗位描述文档的生成方法及设备
US20050210046A1 (en) Context-based conversion of language to data systems and methods
CN105786810B (zh) 类目映射关系的建立方法与装置
WO2014113327A2 (en) Intellectual property asset information retrieval system
Paulsson et al. 3D property research-a survey of the occurrence of legal topics in publications
CN108234392A (zh) 一种网站的监控方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170315

WD01 Invention patent application deemed withdrawn after publication