CN109902288A - 智能条款分析方法、装置、计算机设备及存储介质 - Google Patents

智能条款分析方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN109902288A
CN109902288A CN201910044759.2A CN201910044759A CN109902288A CN 109902288 A CN109902288 A CN 109902288A CN 201910044759 A CN201910044759 A CN 201910044759A CN 109902288 A CN109902288 A CN 109902288A
Authority
CN
China
Prior art keywords
information
keyword
contract
text information
contract terms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910044759.2A
Other languages
English (en)
Inventor
徐定伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201910044759.2A priority Critical patent/CN109902288A/zh
Publication of CN109902288A publication Critical patent/CN109902288A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种智能条款分析方法、装置、计算机设备及存储介质,包括:获取待分析的合同条款文本信息,合同条款文本信息来自于网络获取的文本信息或上传的扫描文件;获取用户输入的问题信息的关键字,通过关键字在合同条款文本信息中搜索匹配;提取与关键字匹配的文档信息按照预设规则进行显示;本申请的技术方案无需签署合同的人员通篇阅读合同全文,系统自动分析合同,用户只需通过关键字查询需要了解的问题信息,便可自动从合同条款文本信息中提取相关内容,并进行分析,协助用户阅读该合同条款;同时可自动识别合同条款文本信息,从数据库中匹配风险提示信息,以便于提醒用户对相关条款进行分析,从而降低合同签订时的法律风险。

Description

智能条款分析方法、装置、计算机设备及存储介质
技术领域
本发明涉及计算机应用技术领域,具体而言,本发明涉及一种智能条款分析方法、装置、计算机设备及存储介质。
背景技术
合同条款是为了维护合作双方的利益签订的条款,一般由其中一方制定,对于制定合同条款的一方可能存在将条款设计成更利于自己一方,且在合同中隐藏某些不公平条约,这对于不是法律专业人士的用户来说,很容易忽略这些问题。
且由于合同条款都是很枯燥的文字,有的条款设计的款项和内容很多,普通用户很少会有兴趣一字一句地阅读并理解,为了节省时间和省事情,大致浏览一下便签订了合同,或者对于非法律专业人士,即使仔细阅读了该条款,也不容易联想到可能存在的问题,从而增加了法律风险。
发明内容
本发明的目的旨在至少能解决上述的技术缺陷之一,公开一种智能条款分析方法、装置、计算机设备及存储介质,能够协助用户阅读合同条款,且通过对条款进行语意识别,匹配对应的风险信息以进行提醒,减少法律风险。
为了达到上述目的,本发明公开一种智能条款分析方法,包括:
获取待分析的合同条款文本信息,所述合同条款文本信息来自于网络获取的文本信息或上传的扫描文件;
获取用户输入的问题信息的关键字,通过所述关键字在所述合同条款文本信息中搜索匹配;
提取与所述关键字匹配的文档信息按照预设规则进行显示。
可选的,所述通过所述关键字在所述合同条款文本信息中搜索匹配的方法包括:
在所述合同条款文本信息中锁定所有与所述关键字匹配的目标信息,所述目标信息包括与所述关键字相同、近义,和/或与所述关键字具有映射关系的文本信息;
对锁定的目标信息进行语意识别;
通过识别的语意匹配与所述关键字的关联度,并根据所述关联度对所述目标信息进行排序。
可选的,所述预设规则包括:按照所述目标信息关联度的排序进行显示。
可选的,根据所述目标信息的关键字和语意,在预设数据库中匹配风险提示信息以在终端窗口显示。
可选的,还包括:
获取历史输入数据,所述历史输入数据包括所有用户输入的待咨询的问题信息;
提取所述问题信息的关键字,并统计单位时间内该关键字出现的频次;
根据频次对所述问题信息进行排序;
将排序值在预设范围内的问题信息在终端窗口显示。
可选的,还包括:
获取所述合同条款文本信息中合作方的名称;
根据所述名称在网络上爬取与所述名称相关的法律信息,所述法律信息包括背景调查信息、法律纠纷信息。
可选的,还包括:所述问题信息通过语音方式输入,通过语音语意识别获取所述问题信息的关键字。
另一方面,本申请公开一种智能条款分析装置,包括:
获取模块:被配置为执行获取待分析的合同条款文本信息,所述合同条款文本信息来自于网络获取的文本信息或上传的扫描文件;
处理模块:被配置为执行获取用户输入的问题信息的关键字,通过所述关键字在所述合同条款文本信息中搜索匹配;
执行模块:被配置为执行提取与所述关键字匹配的文档信息按照预设规则进行显示。
可选的,还包括:
目标信息锁定模块:被配置为执行在所述合同条款文本信息中锁定所有与所述关键字匹配的目标信息,所述目标信息包括与所述关键字相同、近义,和/或与所述关键字具有映射关系的文本信息;
语意识别模块:被配置为执行对锁定的目标信息进行语意识别;
关联度排序模块:被配置为执行通过识别的语意匹配与所述关键字的关联度,并根据所述关联度对所述目标信息进行排序。
可选的,所述预设规则包括:按照所述目标信息关联度的排序进行显示。
可选的,还包括:风险提示匹配模块:被配置为根据所述目标信息的关键字和语意,在预设数据库中匹配风险提示信息以在终端窗口显示。
可选的,还包括:
历史数据获取模块:被配置为执行获取历史输入数据,所述历史输入数据包括所有用户输入的待咨询的问题信息;
频次统计模块:被配置为执行提取所述问题信息的关键字,并统计单位时间内该关键字出现的频次;
频次排序模块:被配置为执行根据频次对所述问题信息进行排序;
显示模块:被配置为执行将排序值在预设范围内的问题信息在终端窗口显示。
可选的,还包括:
名称获取模块:被配置为执行获取所述合同条款文本信息中合作方的名称;
信息爬取模块:被配置为执行根据所述名称在网络上爬取与所述名称相关的法律信息,所述法律信息包括背景调查信息、法律纠纷信息。
可选的,还包括:所述问题信息通过语音方式输入,通过语音语意识别获取所述问题信息的关键字。
另一方面,本申请公开一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述任意一项所述的智能条款分析方法的步骤。
另一方面,本申请公开一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任意一项所述的智能条款分析方法的步骤。
本发明的有益效果是:
本申请公开一种智能条款分析方法、装置、计算机设备及存储介质,本申请的技术方案无需签署合同的人员通篇阅读合同全文,系统自动分析合同,用户只需通过关键字查询需要了解的问题信息,便可自动从合同条款文本信息中提取相关内容,并进行分析,协助用户阅读该合同条款;同时可自动识别合同条款文本信息,从数据库中匹配风险提示信息,以便于提醒用户对相关条款进行分析,从而降低合同签订时的法律风险。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明智能条款分析方法示意图;
图2为本发明通过关键字在合同文本信息中匹配的方法流程图;
图3为本发明根据名称获取法律信息的方法流程图;
图4为本发明通过历史数据推送问题信息的方法流程图;
图5为本发明一种智能条款分析装置框图结构示意图;
图6为本发明计算机设备基本结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
具体的,请参阅图1,本发明公开一种智能条款分析方法,包括:
S1000、获取待分析的合同条款文本信息,所述合同条款文本信息来自于网络获取的文本信息或上传的扫描文件;
合同条款文本为用户在网络上或者线下执行某项合作行为时所签订的合同。当这种行为来自于网络上时,合同条款可以是在网上执行某个合同项目的合同,比如在网上授权某个银行卡进行支付,或者是在网上参加某个活动需要承担的某些条款等,在执行这些活动之前,通常会弹出一个协议窗口,供用户阅读以及供用户选择是否授权该条款。很多时候,无论是线上需要签订的一些合同,或者线下需要签订的合同,用户都不会仔细去看,或者因为条款字数太多,用户查看不会太仔细,亦或者是用户仔细看了,但是由于不是专业的法律人士,不容易识破其中的陷阱,这些因素都容易被一些不法商家钻空子,影响消费者的合法权益。
本申请的技术方案为通过获取合同条款文本以及用户输入的问题信息,自动进行搜索匹配并进行风险提醒。要达到这一目的,第一步为获取合同条款文本,本申请中,合同条款文本信息可通过两种方式获取,第一种方式为通过网络上电子档的合同直接导入,这类合同使用在线上进行某种操作时获取的合同,此类合同,直接将合同条款文本信息导入或者复制至目标位置即可进行后续的分析。
另一种合同条款文本来自于线下活动,比如与某人或者某个公司合作时,签订的纸质合同。这种情况下,可将所述纸质合同通过扫描或者拍照的转变成图片或者PDF格式上传至目标位置即可。通过OCR图片识别技术识别,OCR文字识别软件,指利用OCR(OpticalCharacter Recognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本,具体方法包括:
1)检测和提取图片中的文本区域,图片一般包括空白或者图案区域,还包括记载有考勤数据的文字区域,故第一步将文字区域提取出来,以便于后续的文字识别;
2)利用radon变换或hough变换等方法进行文本校正;
3)通过投影直方图分割出单行的文本的图片;图片中文字信息较多的时候,通常会有多行,通过此方法,可将文字的大致区域进行分割提取;
4)分割字符,获取单个文字;当获取了文字的大致区域,则可对每个文字的轮廓进行逐一提取,获取每个单独的文字;
5)识别语意,当识别出了文字的轮廓后,则可确定该文字具体含义,由于单个文字不具备特定的含义,故需要与前后的文字相结合,以获取具体的含义。
S2000、获取用户输入的问题信息的关键字,通过所述关键字在所述合同条款文本信息中搜索匹配;
通过步骤S1000获取了合同条款文本信息后,则根据用户输入的问题信息在所述合同条款文本信息中进行匹配,需要说明的是,用户输入的问题信息可以是通过文字进行输入的,比如用户输入“解除劳动合同注意事项”、“工作时间”等相关问题,则在全文中搜索关于“解除劳动合同”的相关内容,以及“工作时间”的相关内容,并进行匹配,具体的,本申请中,请参阅图2,通过所述关键字在所述合同条款文本信息中搜索匹配的方法包括:
S2100、在所述合同条款文本信息中锁定所有与所述关键字匹配的目标信息,所述目标信息包括与所述关键字相同、近义,和/或与所述关键字具有映射关系的文本信息;
锁定目标信息表示从所述合同条款文本信息中将所有与关键字相同、近义,或者是与关键字具有映射关系的文本信息,比如,在一份劳动合同中,若用户输入的问题是“解除劳动合同注意事项”,系统在劳动合同中检索与解除劳动合同及注意事项有关的内容,将关于解除劳动合同相关的条款罗列,但是关于解除劳动合同条款除了关键字所映射的段落条款,比如“九、劳动合同的解除、终止和续订;(一)双方协商一致,可以解除劳动合同。由甲方提出协商解除劳动合同的,应依法支付乙方经济补偿金;由乙方提出协商解除劳动合同的,甲方无需支付乙方经济补偿……”,除此之外,还有其他的条款也涉及“解除劳动合同”,比如:“十、违约责任……(五)甲方违约解除或者终止劳动合同的,应当依照本劳动合同第九条第十项规定的经济补偿标准的二倍向乙方支付赔偿金。……”等与关键字有相近意思的段落,系统对上述包含“解除劳动合同”相同、相近的文字段落,以及该关键字所映射的文字段落都进行锁定,以便于后续的分析。
S2200、对锁定的目标信息进行语意识别;
由于上述文字锁定的内容包括多个,需要对具体的内容进行识别,以从锁定的段落中分析出用户需要的信息。语意识别包括:
文本基本处理:首先为分词,在一实施例中,可采用全切分方法,它首先切分出与词库匹配的所有可能的词,再运用统计语言模型决定最优的切分结果。它的优点在于可以解决分词中的歧义问题。例如,对于文本串“南京市长江大桥”,首先进行词条检索(一般用Trie存储),找到匹配的所有词条(南京,市,长江,大桥,南京市,长江大桥,市长,江大桥,江大,桥),以词网格(word lattices)形式表示,接着做路径搜索,基于统计语言模型(例如n-gram)找到最优路径,最后可能还需要命名实体识别。由于“南京市长江大桥”的语言模型得分,即P(南京市,长江,大桥)最高,则为最优切分。
进一步的,本申请中的粉刺,还可以采用由字构词的分词方法。可以理解为字的分类问题,也就是自然语言处理中的sequence labeling问题,通常做法里利用HMM(隐马尔可夫模型,Hidden Markov Model),MAXENT(最大熵模型,Maximum Entropy Models)),MEMM(Maximum Entropy Markov Model,最大熵马尔科夫模型),CRF(conditional randomfield algorithm,条件随机场算法)等预测文本串每个字的分类标签tag,譬如B,E,I,S,这四个tag分别表示:beginning,inside,ending,single,也就是一个词的开始,中间,结束,以及单个字的词。例如“南京市长江大桥”的标注结果可能为:“南(B)京(I)市(E)长(B)江(E)大(B)桥(E)”。由于CRF既可以像最大熵模型一样加各种领域feature,又避免了HMM的齐次马尔科夫假设,所以基于CRF的分词目前是效果最好的。
除了HMM,CRF等模型,分词也可以基于深度学习方法来做,首先对每一个字进行Lookup Table,映射到一个固定长度的特征向量(这里可以利用词向量,boundaryentropy,accessor variety等);接着经过一个标准的神经网络,分别是linear,sigmoid,linear层,对于每个字,预测该字属于B,E,I,S的概率;最后输出是一个矩阵,矩阵的行是B,E,I,S4个tag,利用viterbi算法就可以完成标注推断,从而得到分词结果。一个文本串除了分词,还需要做词性标注,命名实体识别,新词发现等。通常有两种方案,一种是pipelineapproaches,就是先分词,再做词性标注;另一种是joint approaches,就是把这些任务用一个模型来完成。语言模型是用来计算一个句子产生概率的概率模型,即P(w_1,w_2,w_3…w_m),m表示词的总个数。根据贝叶斯公式:P(w_1,w_2,w_3…w_m)=P(w_1)P(w_2|w_1)P(w_3|w_1,w_2)…P(w_m|w_1,w_2…w_{m-1})。
最简单的语言模型是N-Gram,它利用马尔科夫假设,认为句子中每个单词只与其前n–1个单词有关,即假设产生w_m这个词的条件概率只依赖于前n–1个词,则有P(w_m|w_1,w_2…w_{m-1})=P(w_m|w_{m-n+1},w_{m-n+2}…w_{m-1})。其中n越大,模型可区别性越强,n越小,模型可靠性越高。
N-Gram语言模型简单有效,除此之外还包括更多的语言模型,例如Class-basedngram model,topic-based ngram model,cache-based ngram model,skipping ngrammodel,指数语言模型(最大熵模型,条件随机域模型)等。
进一步,还包括神经网络语言模型,例如基于N-Gram的神经网络模型,首先将每个单词w_{m-n+1},w_{m-n+2}…w_{m-1}映射到词向量空间,再把各个单词的词向量组合成一个更大的向量作为神经网络输入,输出是P(w_m)。这个模型解决了传统n-gram的两个缺陷:(1)词语之间的相似性可以通过词向量来体现;(2)自带平滑功能。
对文本分词后,接下来需要对分词后的每个term计算一个权重,重要的term应该给与更高的权重。举例来说,“什么产品对减肥帮助最大?”的term weighting结果可能是:“什么0.1,产品0.5,对0.1,减肥0.8,帮助0.3,最大0.2”。Term weighting在文本检索,文本相关性,核心词提取等任务中都有重要作用。Tf-Idf是一种最常见的term weighting方法。在上面的公式体系里,Tf-Idf的local weight是FREQ,glocal weight是IDFB,normalization是None。tf是词频,表示这个词出现的次数。df是文档频率,表示这个词在多少个文档中出现。idf则是逆文档频率,idf=log(TD/df),TD表示总文档数。Tf-Idf在很多场合都很有效,但缺点也比较明显,以“词频”度量重要性,不够全面,譬如在搜索广告的关键词匹配时就不够用。
有了训练数据,接下来提取特征,基于逻辑回归模型来预测文本串中每个term的重要性。所提取的特征包括:
term的自解释特征,例如term专名类型,term词性,term idf,位置特征,term的长度等;
term与文本串的交叉特征,例如term与文本串中其他term的字面交叉特征,term转移到文本串中其他term的转移概率特征,term的文本分类、topic与文本串的文本分类、topic的交叉特征等。
对短文本串分词后,利用上面介绍的term weighting方法,获取term weight后,取一定的阈值,就可以提取出短文本串的核心词。
长文本串(譬如web page)的关键词提取。这里简单介绍几种方法:
采用基于规则的方法。考虑到位置特征,网页特征等。
基于广告主购买的bidword和高频query建立多模式匹配树,在长文本串中进行全字匹配找出候选关键词,再结合关键词weight,以及某些规则找出优质的关键词。
类似于有监督的term weighting方法,也可以训练关键词weighting的模型。
基于文档主题结构的关键词抽取。
前面讲到一些文本基本处理方法。一个文本串,对其进行分词和重要性打分后(当然还有更多的文本处理任务),就可以开始更高层的语义分析任务。
进一步的,本申请采用卷积神经网络来进行语意识别,卷积神经网络是一种特殊的、简化的深层神经网络模型,它的每个卷积层都是由多个卷积滤波器组成。在CNN(Convolutional Neural Network,卷积神经网络)中,图像的一小部分(局部感受区域)作为层级结构的最低层的输入,信息再依次传输到不同的层,每层通过多个卷积滤波器去获得观测数据的最显著的特征。基于CNN,可以用来做文本分类,情感分析,本体分类等。传统文本分类等任务,一般基于bag of words或者基于word的特征提取,此类方法一般需要领域知识和人工特征。利用CNN做,方法也类似,但一般都是基于raw text,CNN模型的输入可以是word series,可以是word vector,还可以是单纯的字符。比起传统方法,CNN不需要过多的人工特征。
将word series作为输入,利用CNN做文本分类。CNN一般共分四层,第一层是词向量层,doc中的每个词,都将其映射到词向量空间,假设词向量为k维,则n个词映射后,相当于生成一张n*k维的图像;第二层是卷积层,多个滤波器作用于词向量层,不同滤波器生成不同的feature map;第三层是pooling层,取每个feature map的最大值,这样操作可以处理变长文档,因为第三层输出只依赖于滤波器的个数;第四层是一个全连接的softmax层,输出是每个类目的概率。除此之外,输入层可以有两个channel,其中一个channel采用预先利用word2vec训练好的词向量,另一个channel的词向量可以通过backpropagation在训练过程中调整。
利用CNN做文本分类,还可以考虑到词的顺序。利用传统的”bag-of-words+maxent/svm”方法,是没有考虑词之间的顺序的。将doc character作为输入,利用CNN做文本分类。
S2300、通过识别的语意匹配与所述关键字的关联度,并根据所述关联度对所述目标信息进行排序。
通过上述方式识别与关键字相关联的目标信息后,对这些目标信息与所述关键字的关联性进行等级排序,比如上述S2100识别的“解除劳动合同”的第九点是最为贴近的关于解除劳动合同的注意事项款项,故可评级为第一级,而后续的违约责任并非正常解除劳动合同,只是违约情况下涉及解除劳动合同的情况,可评级为第二级,若后续还有其他的相关条款,根据与用户提出的问题的关键字的符合程度,依次进行评级。系统通过上述步骤中的评级,将评级的级别最高的内容放在最前面,级别较低的放在后面。
S3000、提取与所述关键字匹配的文档信息按照预设规则进行显示。
与所述关键字匹配的文档信息即为目标信息,在本申请中,所述预设规则包括:按照所述目标信息关联度的排序进行显示。通过识别了目标信息的语意,并按照语意信息对所有的目标信息的关联度进行了等级排序,则在最后的显示过程中,按照等级的大小依次显示该目标信息,比如在本申请中,第一级为最高级别,表示该目标信息的关联度最高,因此将第一级别放在最前面,第二级为次高级,放在第一级后面,因此在显示终端进行显示的顺序为:最前面为第一级的“解除劳动合同”的第九点,后续显示的是关于违约责任涉及到解除劳动合同部分的相关内容。
需要说明的是,所述问题信息还可通过语音方式输入,通过语音语意识别获取所述问题信息的关键字。这种方案只是问题信息的获取方式不一样而已,在本申请中,若问题信息是通过语音方式获得的,则比上述的通过文字获取的方法多了一个步骤,即进行语音识别,将语音信息转换成文字信息,然后再对文字信息进行关键字提取。
在一实施例中,可采用神经网络模型来对语音进行识别,并将语音信息转换成文字,只需要将收集的语音信息输入神经网络模型中即可输出对应的文字信息。
语音信息输入时要先经过预处理,包括预加重、分帧加窗等,预加重的目的是为了加强语音的高频部分,以便在特征提取阶段进行频频分析。分帧加窗的目的是为了使帧与帧之间平滑过渡,保持连续性以及保持语音信号的短时平稳性。进行特征提取,语音特征参数的时间序列构成语音的模式,将其与获得的参考模式逐一比较,获得最佳匹配的参考式得到识别结果。
语音识别使用神经网络构建,可使用的两种类型的神经网络,分别是多层感知器(MLP)和循环神经网路(RNN),通过任意一种神经网络模型,可对语音语意进行识别。
其中语音识别中需要对语言进行语法、语义分析以达到识别的目的。因此需要进行语言建模,语言建模能够有效的结合汉语语法和语义的知识,描述词之间的内在关系,从而提高识别率,减少搜索范围。语言模型分为三个层次:字典知识,语法知识,句法知识。对训练文本数据库进行语法、语义分析,经过基于统计模型训练得到语言模型。可采用以下两种语言建模方法:(1)基于规则模型;(2)基于统计模型。
基于上述方法,则可将输入的语音信息转换成文字信息,并根据上述步骤S2000的方式从转换的文字信息中提取关键字,并通过关键字匹配合同条款文本信息。
在一实施例中,还包括:根据所述合同条款文本信息的语意,在预设数据库中匹配风险提示信息以在终端窗口显示。
预设数据库为收集好的关于各种合同条款可能存在的风险库,由于合同有很多种,比如公司与公司之间的服务合同、房产购买合同、金融产品购买合同、劳动合同等等,在预设数据库中,可根据合同的类别,分别保存对应的风险提示,以便于通过自动识别合同条款文本信息的内容,替用户分析出潜在的风险。
例如在一份劳动合同中,可能存在工作时间不合理,加班费补贴不合理的情况,比如国家规定上班时间是每天不高于8小时,多出的时间需要支付1.5倍工资,而周六需要支付2倍工资,过节加班支付3倍工资,在一些公司的劳动合同中,可能备注的上班时间包括了周六日,但是却没有关于1.5倍工资的相关内容,则可通过识别该合同的内容,从数据库中关于劳动合同分类中的匹配非法加班的风险提示以在终端窗口进行显示。
上述的风险提示信息的获取方法,可通过人工归类后手动输入,还可以通过爬取法律判决相关网页中的判决书,识别判决书中争议点所对应的关键字,并按照关键字以及涉及的类别,生成提示信息,存储的预设数据库中,进一步的,可将对应的判决书文件链接或标题存储在预设数据库中对应的位置,以便于作为风险提示信息在终端窗口显示。用户在阅读相关合同条款文本信息时,通过识别该合同条款文本信息的类别,在提示栏中显示上述类别的相关提示信息,以便于协助用户分析和阅读该合同条款文本信息。
进一步的,用户输入问题信息,表示用户可能对该合同中的上述问题比较重视,因此可通过通过识别用户输入的问题信息的关键字,在预设数据库中搜索对应问题关键字的提示信息,并显示在提示栏中,针对用户的实际需求给出对应的提示,以降低用户签订合同时的法律风险。
在另一实施例中,上述法律风险还包括合同条款文本信息的主体存在风险,因此,请参阅图3,还可进一步包括:
S3100、获取所述合同条款文本信息中合作方的名称;
S3200、根据所述名称在网络上爬取与所述名称相关的法律信息,所述法律信息包括背景调查信息、法律纠纷信息。
这一步骤是通过获取合同条款文本信息中的合约人的名称,并通过该名称在网络上爬取涉及到该名称的法律信息,比如法律诉讼、侵权新闻,合作纠纷等相关信息,将这些信息的标题以及链接一并在提示栏中显示,以便于用户在签订合同之前,了解合作公司的相关情况,避免发生类似的纠纷。通过了解该公司的更多信息,对该公司的背景有个大致的了解,以便于降低法律风险。
在另一实施例中,请参阅图4,还包括:
S4000、获取历史输入数据,所述历史输入数据包括所有用户输入的待咨询的问题信息;
历史输入数据为针对同一合同条款文本信息,其他签订该合同的人曾经输入的问题信息,只要该合同条款文本信息不是第一次签订,都涉及到历史数据,历史数据不局限于输入的问题信息,还包括之前签订合同的用户的浏览信息、签约信息、身份信息、合同修改信息等等。
S5000、提取所述问题信息的关键字,并统计单位时间内该关键字出现的频次;
通过提取这些历史输入数据中的问题信息以及该问题信息对应的关键字,可统计出该关键字出现的频次,需要说明的是,统计出现的频次需要一个时间节点,比如统计的开始时间和结束时间,例如,开始时间为2018.1.1,结束时间为当前查询时间的前一分钟,以此得到最及时的信息。
S6000、根据频次对所述问题信息进行排序;
不同的人针对同一合同条款文本信息可能关注的问题不一样,因此可能同一合同条款文本信息存在很多输入的问题信息,根据问题信息的关键字对其在单位时间内进行统计,即可得到对应关键字的问题信息被输入的次数多少,次数越多表示越多人关注这个问题。
S7000、将排序值在预设范围内的问题信息在终端窗口显示。
根据上述步骤中的问题信息的统计,可将咨询数量最多的问题信息在终端窗口上显示,以便于向用户显示其他人的关注要点,通过浏览其他人的关注要点,提示自己是否有必要了解这方面的情况。
本申请的智能条款分析方法通过根据关键字查找对应的条款内容,以及根据条款内容,自动分析条款的提示信息以及给出辅助理解和了解相关条款信息的间接信息,比如其他人关注的问题点,合约人的背景信息等,以此让用户在阅读合同条款文本信息时不再枯燥地阅读,而是带着问题去阅读,加上提示栏以及相关的引导信息,引导用户关注可能出现法律风险的内容,让用户主动去了解合同条款,以降低法律风险。
另一方面,请参阅图5,本申请公开一种智能条款分析装置,包括:
获取模块:被配置为执行获取待分析的合同条款文本信息,所述合同条款文本信息来自于网络获取的文本信息或上传的扫描文件;
处理模块:被配置为执行获取用户输入的问题信息的关键字,通过所述关键字在所述合同条款文本信息中搜索匹配;
执行模块:被配置为执行提取与所述关键字匹配的文档信息按照预设规则进行显示。
可选的,还包括:
目标信息锁定模块:被配置为执行在所述合同条款文本信息中锁定所有与所述关键字匹配的目标信息,所述目标信息包括与所述关键字相同、近义,和/或与所述关键字具有映射关系的文本信息;
语意识别模块:被配置为执行对锁定的目标信息进行语意识别;
关联度排序模块:被配置为执行通过识别的语意匹配与所述关键字的关联度,并根据所述关联度对所述目标信息进行排序。
可选的,所述预设规则包括:按照所述目标信息关联度的排序进行显示。
可选的,还包括:风险提示匹配模块:被配置为根据所述目标信息的关键字和语意,在预设数据库中匹配风险提示信息以在终端窗口显示。
可选的,还包括:
历史数据获取模块:被配置为执行获取历史输入数据,所述历史输入数据包括所有用户输入的待咨询的问题信息;
频次统计模块:被配置为执行提取所述问题信息的关键字,并统计单位时间内该关键字出现的频次;
频次排序模块:被配置为执行根据频次对所述问题信息进行排序;
显示模块:被配置为执行将排序值在预设范围内的问题信息在终端窗口显示。
可选的,还包括:
名称获取模块:被配置为执行获取所述合同条款文本信息中合作方的名称;
信息爬取模块:被配置为执行根据所述名称在网络上爬取与所述名称相关的法律信息,所述法律信息包括背景调查信息、法律纠纷信息。
可选的,还包括:所述问题信息通过语音方式输入,通过语音语意识别获取所述问题信息的关键字。
由于上述公开的智能条款分析装置是智能条款分析方法一一对应的产品的介绍,其功能一样,此处不再赘述。
本发明实施例提供计算机设备基本结构框图请参阅图6。
该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种智能条款分析方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种智能条款分析方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
计算机设备通过接收关联的客户端发送的提示行为的状态信息,即关联终端是否开启提示以及贷款人是否关闭该提示任务。通过验证上述任务条件是否达成,进而向关联终端发送对应的预设指令,以使关联终端能够根据该预设指令执行相应的操作,从而实现了对关联终端的有效监管。同时,在提示信息状态与预设的状态指令不相同时,服务器端控制关联终端持续进行响铃,以防止关联终端的提示任务在执行一段时间后自动终止的问题。
本发明还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例所述智能条款分析方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种智能条款分析方法,其特征在于,包括:
获取待分析的合同条款文本信息,所述合同条款文本信息来自于网络获取的文本信息或上传的扫描文件;
获取用户输入的问题信息的关键字,通过所述关键字在所述合同条款文本信息中搜索匹配;
提取与所述关键字匹配的文档信息按照预设规则进行显示。
2.根据权利要求1所述的智能条款分析方法,其特征在于,所述通过所述关键字在所述合同条款文本信息中搜索匹配的方法包括:
在所述合同条款文本信息中锁定所有与所述关键字匹配的目标信息,所述目标信息包括与所述关键字相同、近义,和/或与所述关键字具有映射关系的文本信息;
对锁定的目标信息进行语意识别;
通过识别的语意匹配与所述关键字的关联度,并根据所述关联度对所述目标信息进行排序。
3.根据权利要求2所述的智能条款分析方法,其特征在于,所述预设规则包括:按照所述目标信息关联度的排序进行显示。
4.根据权利要求2所述的智能条款分析方法,其特征在于,根据所述目标信息的关键字和语意,在预设数据库中匹配风险提示信息以在终端窗口显示。
5.根据权利要求1所述的智能条款分析方法,其特征在于,还包括:
获取历史输入数据,所述历史输入数据包括所有用户输入的待咨询的问题信息;
提取所述问题信息的关键字,并统计单位时间内该关键字出现的频次;
根据频次对所述问题信息进行排序;
将排序值在预设范围内的问题信息在终端窗口显示。
6.根据权利要求1所述的智能条款分析方法,其特征在于,还包括:
获取所述合同条款文本信息中合作方的名称;
根据所述名称在网络上爬取与所述名称相关的法律信息,所述法律信息包括背景调查信息、法律纠纷信息。
7.根据权利要求1所述的智能条款分析方法,其特征在于,还包括:所述问题信息通过语音方式输入,通过语音语意识别获取所述问题信息的关键字。
8.一种智能条款分析装置,包括:
获取模块:被配置为执行获取待分析的合同条款文本信息,所述合同条款文本信息来自于网络获取的文本信息或上传的扫描文件;
处理模块:被配置为执行获取用户输入的问题信息的关键字,通过所述关键字在所述合同条款文本信息中搜索匹配;
执行模块:被配置为执行提取与所述关键字匹配的文档信息按照预设规则进行显示。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述的智能条款分析方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述的智能条款分析方法的步骤。
CN201910044759.2A 2019-01-17 2019-01-17 智能条款分析方法、装置、计算机设备及存储介质 Pending CN109902288A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910044759.2A CN109902288A (zh) 2019-01-17 2019-01-17 智能条款分析方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910044759.2A CN109902288A (zh) 2019-01-17 2019-01-17 智能条款分析方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN109902288A true CN109902288A (zh) 2019-06-18

Family

ID=66943820

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910044759.2A Pending CN109902288A (zh) 2019-01-17 2019-01-17 智能条款分析方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN109902288A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110347903A (zh) * 2019-07-17 2019-10-18 江苏东网信息科技有限公司 基于统计语言模型算法的智能信息评估和营销系统
CN110377626A (zh) * 2019-06-19 2019-10-25 深圳壹账通智能科技有限公司 信息展示方法、装置、设备及存储介质
CN110457659A (zh) * 2019-07-05 2019-11-15 中国平安人寿保险股份有限公司 条款文档生成方法及终端设备
CN110545355A (zh) * 2019-07-31 2019-12-06 努比亚技术有限公司 一种智能提醒方法、终端及计算机可读存储介质
CN110688847A (zh) * 2019-08-23 2020-01-14 上海市研发公共服务平台管理中心 技术合同判定方法、装置、计算机设备和存储介质
CN110929029A (zh) * 2019-11-04 2020-03-27 中国科学院信息工程研究所 一种基于图卷积神经网络的文本分类方法及系统
CN111143505A (zh) * 2019-11-28 2020-05-12 泰康保险集团股份有限公司 文档处理方法、装置、介质及电子设备
CN111368124A (zh) * 2020-02-28 2020-07-03 北京百度网讯科技有限公司 风险识别方法、风险识别装置和电子设备
CN111666408A (zh) * 2020-05-26 2020-09-15 中国工商银行股份有限公司 重要条款筛选与展示的方法及装置
CN111783781A (zh) * 2020-05-22 2020-10-16 平安国际智慧城市科技股份有限公司 基于产品协议字符识别的恶意条款识别方法、装置、设备
CN111898159A (zh) * 2020-07-31 2020-11-06 维沃移动通信有限公司 风险提示方法、装置、电子设备及可读存储介质
CN112148858A (zh) * 2020-09-23 2020-12-29 创新奇智(青岛)科技有限公司 一种合同的分析方法、装置、电子设备及存储介质
CN112328738A (zh) * 2020-10-10 2021-02-05 中国农业银行股份有限公司河北省分行 语音检索方法、终端设备及可读存储介质
CN112528665A (zh) * 2019-08-30 2021-03-19 广州市安固信息科技有限公司 一种基于语义理解的信息提取方法
CN113204610A (zh) * 2021-05-06 2021-08-03 广东博维创远科技有限公司 基于刑事案件电子卷宗的自动编目的方法、计算机可以读取的存储装置
CN113779640A (zh) * 2021-09-01 2021-12-10 北京橙色云科技有限公司 合同签订方法、装置以及存储介质
CN114187143A (zh) * 2021-12-21 2022-03-15 厦门大学 基于人工智能的建筑施工合同风险审查方法及系统
CN114663069A (zh) * 2022-04-11 2022-06-24 中国建筑第二工程局有限公司 一种工程项目合同全流程管理方法及系统
CN116976683A (zh) * 2023-09-25 2023-10-31 江铃汽车股份有限公司 一种合同条款自动审核方法、系统、存储介质及设备
CN117252690A (zh) * 2023-11-17 2023-12-19 杭州钱袋数字科技有限公司 一种贷款合同在线签订方法与系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020177991A1 (en) * 2001-03-30 2002-11-28 Ejerhed Eva Ingegerd Method of finding answers to questions
CN101408876A (zh) * 2007-10-09 2009-04-15 中兴通讯股份有限公司 一种电子文档全文检索的方法及系统
US20100268528A1 (en) * 2009-04-16 2010-10-21 Olga Raskina Method & Apparatus for Identifying Contract Characteristics
CN103366231A (zh) * 2012-03-29 2013-10-23 上海天闻律师事务所 一种合同风险信息自动处理方法及装置
CN104063513A (zh) * 2011-09-29 2014-09-24 北京奇虎科技有限公司 一种智能垂直搜索方法和系统
CN105069167A (zh) * 2015-08-28 2015-11-18 成都六四三六五科技有限公司 法律信息搜索方法及法律信息搜索装置
US20170103466A1 (en) * 2015-10-13 2017-04-13 Nayeem Syed Risk and Compliance Analytic System
CN106844544A (zh) * 2016-12-30 2017-06-13 全民互联科技(天津)有限公司 一种合同条款风险识别方法及系统
CN107608958A (zh) * 2017-09-07 2018-01-19 湖南湘君奕成信息技术有限公司 基于条款统一建模的合同文本风险信息挖掘方法和系统
CN108519972A (zh) * 2018-03-26 2018-09-11 北京北大英华科技有限公司 一种合同条款的法律风险判定方法、装置及计算机设备
CN108804642A (zh) * 2018-06-05 2018-11-13 中国平安人寿保险股份有限公司 检索方法、装置、计算机设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020177991A1 (en) * 2001-03-30 2002-11-28 Ejerhed Eva Ingegerd Method of finding answers to questions
CN101408876A (zh) * 2007-10-09 2009-04-15 中兴通讯股份有限公司 一种电子文档全文检索的方法及系统
US20100268528A1 (en) * 2009-04-16 2010-10-21 Olga Raskina Method & Apparatus for Identifying Contract Characteristics
CN104063513A (zh) * 2011-09-29 2014-09-24 北京奇虎科技有限公司 一种智能垂直搜索方法和系统
CN103366231A (zh) * 2012-03-29 2013-10-23 上海天闻律师事务所 一种合同风险信息自动处理方法及装置
CN105069167A (zh) * 2015-08-28 2015-11-18 成都六四三六五科技有限公司 法律信息搜索方法及法律信息搜索装置
US20170103466A1 (en) * 2015-10-13 2017-04-13 Nayeem Syed Risk and Compliance Analytic System
CN106844544A (zh) * 2016-12-30 2017-06-13 全民互联科技(天津)有限公司 一种合同条款风险识别方法及系统
CN107608958A (zh) * 2017-09-07 2018-01-19 湖南湘君奕成信息技术有限公司 基于条款统一建模的合同文本风险信息挖掘方法和系统
CN108519972A (zh) * 2018-03-26 2018-09-11 北京北大英华科技有限公司 一种合同条款的法律风险判定方法、装置及计算机设备
CN108804642A (zh) * 2018-06-05 2018-11-13 中国平安人寿保险股份有限公司 检索方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘鸿宇 等: "《合同法》释义与案例查询系统", 天津理工学院学报, vol. 19, no. 02, pages 37 - 40 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020253110A1 (zh) * 2019-06-19 2020-12-24 深圳壹账通智能科技有限公司 信息展示方法、装置、设备及存储介质
CN110377626A (zh) * 2019-06-19 2019-10-25 深圳壹账通智能科技有限公司 信息展示方法、装置、设备及存储介质
CN110457659A (zh) * 2019-07-05 2019-11-15 中国平安人寿保险股份有限公司 条款文档生成方法及终端设备
CN110457659B (zh) * 2019-07-05 2023-07-25 中国平安人寿保险股份有限公司 条款文档生成方法及终端设备
CN110347903A (zh) * 2019-07-17 2019-10-18 江苏东网信息科技有限公司 基于统计语言模型算法的智能信息评估和营销系统
CN110545355A (zh) * 2019-07-31 2019-12-06 努比亚技术有限公司 一种智能提醒方法、终端及计算机可读存储介质
CN110688847A (zh) * 2019-08-23 2020-01-14 上海市研发公共服务平台管理中心 技术合同判定方法、装置、计算机设备和存储介质
CN112528665A (zh) * 2019-08-30 2021-03-19 广州市安固信息科技有限公司 一种基于语义理解的信息提取方法
CN110929029A (zh) * 2019-11-04 2020-03-27 中国科学院信息工程研究所 一种基于图卷积神经网络的文本分类方法及系统
CN111143505A (zh) * 2019-11-28 2020-05-12 泰康保险集团股份有限公司 文档处理方法、装置、介质及电子设备
CN111143505B (zh) * 2019-11-28 2023-11-21 泰康保险集团股份有限公司 文档处理方法、装置、介质及电子设备
CN111368124A (zh) * 2020-02-28 2020-07-03 北京百度网讯科技有限公司 风险识别方法、风险识别装置和电子设备
CN111368124B (zh) * 2020-02-28 2023-05-26 北京百度网讯科技有限公司 风险识别方法、风险识别装置和电子设备
CN111783781A (zh) * 2020-05-22 2020-10-16 平安国际智慧城市科技股份有限公司 基于产品协议字符识别的恶意条款识别方法、装置、设备
CN111783781B (zh) * 2020-05-22 2024-04-05 深圳赛安特技术服务有限公司 基于产品协议字符识别的恶意条款识别方法、装置、设备
CN111666408A (zh) * 2020-05-26 2020-09-15 中国工商银行股份有限公司 重要条款筛选与展示的方法及装置
CN111898159A (zh) * 2020-07-31 2020-11-06 维沃移动通信有限公司 风险提示方法、装置、电子设备及可读存储介质
CN112148858A (zh) * 2020-09-23 2020-12-29 创新奇智(青岛)科技有限公司 一种合同的分析方法、装置、电子设备及存储介质
CN112328738A (zh) * 2020-10-10 2021-02-05 中国农业银行股份有限公司河北省分行 语音检索方法、终端设备及可读存储介质
CN113204610A (zh) * 2021-05-06 2021-08-03 广东博维创远科技有限公司 基于刑事案件电子卷宗的自动编目的方法、计算机可以读取的存储装置
CN113779640A (zh) * 2021-09-01 2021-12-10 北京橙色云科技有限公司 合同签订方法、装置以及存储介质
CN114187143A (zh) * 2021-12-21 2022-03-15 厦门大学 基于人工智能的建筑施工合同风险审查方法及系统
CN114663069A (zh) * 2022-04-11 2022-06-24 中国建筑第二工程局有限公司 一种工程项目合同全流程管理方法及系统
CN116976683A (zh) * 2023-09-25 2023-10-31 江铃汽车股份有限公司 一种合同条款自动审核方法、系统、存储介质及设备
CN116976683B (zh) * 2023-09-25 2024-02-27 江铃汽车股份有限公司 一种合同条款自动审核方法、系统、存储介质及设备
CN117252690A (zh) * 2023-11-17 2023-12-19 杭州钱袋数字科技有限公司 一种贷款合同在线签订方法与系统
CN117252690B (zh) * 2023-11-17 2024-02-23 杭州钱袋数字科技有限公司 一种贷款合同在线签订方法与系统

Similar Documents

Publication Publication Date Title
CN109902288A (zh) 智能条款分析方法、装置、计算机设备及存储介质
CN110633409B (zh) 一种融合规则与深度学习的汽车新闻事件抽取方法
Ding et al. Applications of natural language processing in construction
Daumé III et al. A large-scale exploration of effective global features for a joint entity detection and tracking model
Missikoff et al. Text mining techniques to automatically enrich a domain ontology
CN112131350A (zh) 文本标签确定方法、装置、终端及可读存储介质
Gu et al. Ucphrase: Unsupervised context-aware quality phrase tagging
Lau et al. Automatic domain ontology extraction for context-sensitive opinion mining
CN110889786A (zh) 一种基于lstm技术的法律诉讼被告人保全用审判服务方法
CN113032552B (zh) 一种基于文本摘要的政策要点抽取方法与提取系统
Mozafari et al. BAS: an answer selection method using BERT language model
Liu et al. Domain-specific meta-embedding with latent semantic structures
CN114971730A (zh) 文案素材提取方法及其装置、设备、介质、产品
CN114818717A (zh) 融合词汇和句法信息的中文命名实体识别方法及系统
CN115344668A (zh) 一种多领域与多学科科技政策资源检索方法及装置
Mondal et al. Improved algorithms for keyword extraction and headline generation from unstructured text
Zhou et al. Learning transferable node representations for attribute extraction from web documents
Wang et al. CA-CD: context-aware clickbait detection using new Chinese clickbait dataset with transfer learning method
KR20240110453A (ko) 비정형 데이터 내 개인정보 탐지 장치, 시스템, 방법 및 기록매체
CN110688453A (zh) 基于资讯分类的场景应用方法、系统、介质及设备
Liu et al. Text Analysis of Community Governance Case based on Entity and Relation Extraction
CN114201965B (zh) 一种基于事件本体的多模态事件表示学习方法
Gao et al. Extractive summarization of Chinese judgment documents via sentence embedding and memory network
Gao A combined rule-based and machine learning approach for blackout analysis using natural language processing
KR102458989B1 (ko) 센텐스 티커를 기반으로 뉴스에 대한 뉴스 티커를 결정하는 방법 및 이러한 방법을 수행하는 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
AD01 Patent right deemed abandoned

Effective date of abandoning: 20240322