CN111666408A - 重要条款筛选与展示的方法及装置 - Google Patents
重要条款筛选与展示的方法及装置 Download PDFInfo
- Publication number
- CN111666408A CN111666408A CN202010453228.1A CN202010453228A CN111666408A CN 111666408 A CN111666408 A CN 111666408A CN 202010453228 A CN202010453228 A CN 202010453228A CN 111666408 A CN111666408 A CN 111666408A
- Authority
- CN
- China
- Prior art keywords
- clauses
- screening
- clause
- user input
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012216 screening Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 47
- 238000012549 training Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 17
- 238000012163 sequencing technique Methods 0.000 claims description 9
- 238000002372 labelling Methods 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 15
- 238000004891 communication Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000007405 data analysis Methods 0.000 description 5
- 239000000872 buffer Substances 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000008719 thickening Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010304 firing Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000010893 paper waste Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/358—Browsing; Visualisation therefor
Abstract
本发明提供了一种重要条款筛选与展示的方法及装置。所述方法包括:获取与办理业务相对应的用户输入文本;对所述用户输入文本进行向量化处理;将向量化处理后的所述用户输入文本输入至训练后的条款筛选模型;利用训练后的条款筛选模型匹配对应条款,按照重要性等级输出条款,并展示输出的条款。本发明根据需要可灵活插入各业务办理流程中,根据各业务不同的重要信息进行分类,实现自动将条款按照重要性分级展示,帮助用户在短时间内快速了解协议重要信息,避免双方由协议的知晓程度不同造成的用户纠纷,有效提升用户满意度。
Description
技术领域
本发明涉及自然语言处理技术领域,尤指一种重要条款筛选与展示的方法及装置。
背景技术
随着互联网的发展,个人银行以及很多通讯类公司为方便用户且减少不必要的纸张浪费,从而将传统线下业务移至线上办理,例如,开户,开通通讯业务等。
目前,个人用户在线上无论是办理银行业务还是通讯业务,均需签署用户协议,用户协议篇幅大多数在二十条以上并无标注重点内容,虽然并无阅读了解协议时间限制,但由于协议内容篇幅较大,导致大部分用户并无时间和耐心完全了解信息风险等。签署后,如后续用户对企业使用用户个人信息产生异议,易造成争议。对业务开展,市场开拓均造成不良影响。
发明内容
为了解决上述问题,本发明实施例提供一种重要条款筛选与展示的方法,所述方法包括:
获取与办理业务相对应的用户输入文本;
对所述用户输入文本进行向量化处理;
将向量化处理后的所述用户输入文本输入至训练后的条款筛选模型;
利用训练后的条款筛选模型匹配对应条款,按照重要性等级输出条款,并展示输出的条款。
可选的,在本发明一实施例中,所述方法还包括:获取用户协议文本,确定所述用户协议文本中的标记条款;对所述标记条款进行向量化处理;将向量化处理后的所述标记条款作为训练数据,使用条款筛选模型进行训练,得到训练后的条款筛选模型。
可选的,在本发明一实施例中,在对所述标记条款进行向量化处理之前还包括:对所述标记条款进行打标签及排序。
可选的,在本发明一实施例中,所述对所述用户输入文本进行向量化处理包括:确定所述用户输入文本对应的词频及逆文档频率;根据所述词频及逆文档频率对所述用户输入文本进行向量化处理。
可选的,在本发明一实施例中,所述条款筛选模型包括三个池化操作,以获得三个对应级别的特征映射。
本发明实施例还提供一种重要条款筛选与展示的装置,所述装置包括:
输入文本获取模块,用于获取与办理业务相对应的用户输入文本;
向量化处理模块,用于对所述用户输入文本进行向量化处理;
模型筛选模块,用于将向量化处理后的所述用户输入文本输入至训练后的条款筛选模型;
筛选展示模块,用于利用训练后的条款筛选模型匹配对应条款,按照重要性等级输出条款,并展示输出的条款。
可选的,在本发明一实施例中,所述装置还包括:协议文本获取模块,用于获取用户协议文本,确定所述用户协议文本中的标记条款;条款向量化模块,用于对所述标记条款进行向量化处理;模型训练模块,用于将向量化处理后的所述标记条款作为训练数据,使用条款筛选模型进行训练,得到训练后的条款筛选模型。
可选的,在本发明一实施例中,所述装置还包括:标签排序模块,用于对所述标记条款进行打标签及排序。
可选的,在本发明一实施例中,所述向量化处理模块包括:参数确定单元,用于确定所述用户输入文本对应的词频及逆文档频率;向量化处理单元,用于根据所述词频及逆文档频率对所述用户输入文本进行向量化处理。
可选的,在本发明一实施例中,所述条款筛选模型包括三个池化操作,以获得三个对应级别的特征映射。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
本发明根据需要可灵活插入各业务办理流程中,根据各业务不同的重要信息进行分类,实现自动将条款按照重要性分级展示,帮助用户在短时间内快速了解协议重要信息,避免双方由协议的知晓程度不同造成的用户纠纷,有效提升用户满意度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种重要条款筛选与展示的方法的流程图;
图2为本发明实施例中重要条款筛选的流程图;
图3为本发明实施例中重要条款的展示系统结构图;
图4为本发明实施例中展示系统中主控驱动模块的结构示意图;
图5为本发明实施例一种重要条款筛选与展示的装置的结构示意图;
图6为本发明一实施例所提供的电子设备的结构示意图。
具体实施方式
本发明实施例提供一种重要条款筛选与展示的方法及装置。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示为本发明实施例一种重要条款筛选与展示的方法的流程图,图中所示方法包括:
步骤S1,获取与办理业务相对应的用户输入文本;
步骤S2,对所述用户输入文本进行向量化处理;
步骤S3,将向量化处理后的所述用户输入文本输入至训练后的条款筛选模型;
步骤S4,利用训练后的条款筛选模型匹配对应条款,按照重要性等级输出条款,并展示输出的条款。
在本实施例中,用户输入文本为与办理的业务相对应的用户协议文本,经过向量化处理后,输入至训练好的条款筛选模型中,得到按照重要性等级输出的条款,并展示给用户。具体的,可按照重要性等级对于筛选出来的条款进行排序,准备向前端输出,前端输出可使用弹框形式或更为能因其用户注意的方式来展示筛选出的条款,可用颜色或字体粗细来表示各个等级重要性条款,使得用户可以在短时间内阅读完用户协议中的重要条款。
作为本发明的一个实施例,方法还包括:获取用户协议文本,确定所述用户协议文本中的标记条款;对所述标记条款进行向量化处理;将向量化处理后的所述标记条款作为训练数据,使用条款筛选模型进行训练,得到训练后的条款筛选模型。其中,用户协议文本为条款筛选模型的训练数据。
在本实施例中,读取各类型用户协议文本,筛选各种协议文本中公司已将重要的条款进行了加粗等其他操作的条款。将条款重要性进行打标签,并根据条款重要性将用户协议条款按照重要性进行排列,其中,打标签的方式为,选取的各种协议文本中公司已将重要的条款进行了加粗等其他操作的条款进行打标签。对于筛选出的句子或段落进行向量化处理。将向量化的数据作为训练数据,使用VDCNN(very deep convolutional networks)模型作为条款筛选模型进行训练。将模型训练结果输出并部署成为服务,方便后续直接将需预测的文本进行预测。
在本实施例中,在对标记条款进行向量化处理之前还包括:对标记条款进行打标签及排序。
在本实施例中,选取的各种协议文本中公司已将重要的条款进行了加粗等其他操作的条款进行打标签,并依据条款的重要程度进行排序。
作为本发明的一个实施例,对用户输入文本进行向量化处理包括:确定用户输入文本对应的词频及逆文档频率;根据词频及逆文档频率对用户输入文本进行向量化处理。其中,用户输入文本与用户协议文本的向量化处理一致。
在本实施例中,词频为词在重要性条款中出现的次数,逆文档频率为在词频的基础上对于每个词分配一个权重值,出现次数越多权重值越小,反之出现次数越少权重值越大。
作为本发明的一个实施例,条款筛选模型包括三个池化操作,以获得三个对应级别的特征映射。使用VDCNN模型作为条款筛选模型,模型结构包含三个池化操作,获得三个级别的特征映射,卷积层的输出结果可以看做是输入的条款的高级表示。
进一步的,如图2所示为本发明实施例中重要条款筛选的流程图,输入与办理业务相对应的用户协议1,进入筛选模型匹配相似性高的条款2,按重要性等级输出条款3,其中,本发明可直接插入各业务中,方便用户了解协议也加快办理效率,在将本发明插入线上办理业务系统中后,可减少每次进入本发明后重新输入协议进行匹配的步骤,进一步加快办理业务效率,筛选模型将对新输入的用户协议进行重要条款预测,根据条款重要性标签寻找一级重要条款和二级重要条款,按照重要性等级对于筛选出来的条款进行排序,准备向前端输出,前端输出可使用弹框形式或更为能因其用户注意的方式来展示筛选出的条款,可用颜色或字体粗细来表示各个等级重要性条款,使得用户可以在3-5分钟内阅读完用户协议中最为重要的一些条款。
具体的,本发明使用TF-IDF算法进行文本向量化处理。其中,TF为词频,为词在重要性条款中出现的次数。IDF为逆文档频率,在词频的基础上对于每个词分配一个权重值,出现次数越多权重值越小,反之出现次数越少权重值越大。首先将分别计算标准化后的TF和IDF的值。
随之计算出TF-IDF:
TF-IDF=TF×IDF
这样便可将重要性条款中的词进行向量化,而且TF-IDF算法简单快速,结果比较符合实际。在VDCNN模型将文本转化成向量之前,将文本进行向量化,方便后续模型训练。
其中模型VDCNN作为训练模型,VDCNN是字符级,且仅用小的卷积和pooling,实现了29层卷积层。由于一些重要性条款中含有一些复杂的语法和语义信息,一般的浅层模型很难做到精准的预测。因此,本发明引入此模型弥补此缺点。
此模型架构中,每层使用为3的滤波器,并连接暂时卷积块。此外,模型结构包含三个池化(pooling)操作,获得三个级别的特征映射(128,256,512),卷积层的输出结果可以看做是输入的条款的高级表示。对于不同大小的输入,卷机编码其提供了依赖于最初长度的输入条款表示。将条款向量化这是十分重要的一步,尤其与attention机制相结合将获得很好的结果。本发明中所使用的模型采用多层的小卷积核,堆叠四层,网络可以自己学习如何最好的结合这些三元模型。
当数据经过512卷积模块后,输出的结果首先进行k-max pooling下采样获得特定维度,获得K个重要特征,且这些特征不依赖于句子的位置,512*K获得的特征转换成单一向量,并输入到三个全连接层。
输出训练好的模型并部署成为服务,方便后续直接将需预测的文本进行预测。
在本发明一具体实施例中,利用本发明重要条款筛选与展示的方法的展示系统结构示意图如图3所示,包括:主控驱动模块4:用于对整个系统进行控制;数据读取模块5:用于对用户提供的数据进行读取;数据分析模块6:用于对用户提供的数据与相对应的条款进行分析,所述数据分析模块6包括存储模块及数据分类模块,所述数据分析模块6通过数据传输及存储模块与数据分类模块进行信息交互,所述数据分类模块与数据读取模块5连接,所述数据分析模块6通过数据传输及存储模块与数据库进行信息交互,从而完成对用户提供的数据进行等级分析;数据管理模块7:用于对用户提供的数据进行筛选管理,数据管理模块7包括微处理器、条件筛选模块、剔除筛选模块和优先级筛选模块,所述微处理器接收数据分析模块6处理后的数据信息,所述微处理器向条件筛选模块输出筛选条件信息,所述微处理器向剔除筛选模块输出剔除条件信息,从而将不重要的信息进行剔除,避免浪费客户阅读时间,所述微处理器向优先级筛选模块输出若干优先级条件信息,从而使得客户优先读取重要信息,所述微处理器通过主控驱动模块4向展示模块8输出数据筛选信息;展示模块8:用于将筛选后的数据进行展示。其中,主控驱动模块结构示意图如图4所示,主控驱动模块4包括执行单元9、数据调取单元10和中央处理单元11。
本发明可根据各公司需要,灵活地插入各业务办理流程中,根据业务的不同,将重要信息进行分类,实现自动将条款按照重要性分级展示,帮助用户在短时间内快速了解协议重要信息,避免双方由协议的知晓程度不同造成的用户纠纷,从侧面提升用户满意度,同时,本发明可帮助用户在办理线上或无纸化业务中快速了解用户协议内容,让用户在短时间内了解协议中重要的部分,避免产生不必要的误解,根据重要等级以颜色区分更方便用户阅读。
如图5所示为本发明实施例一种重要条款筛选与展示的装置的结构示意图,图中所示装置包括:
输入文本获取模块10,用于获取与办理业务相对应的用户输入文本;
向量化处理模块20,用于对所述用户输入文本进行向量化处理;
模型筛选模块30,用于将向量化处理后的所述用户输入文本输入至训练后的条款筛选模型;
筛选展示模块40,用于利用训练后的条款筛选模型匹配对应条款,按照重要性等级输出条款,并展示输出的条款。
作为本发明的一个实施例,装置还包括:协议文本获取模块,用于获取用户协议文本,确定所述用户协议文本中的标记条款;条款向量化模块,用于对所述标记条款进行向量化处理;模型训练模块,用于将向量化处理后的所述标记条款作为训练数据,使用条款筛选模型进行训练,得到训练后的条款筛选模型。
作为本发明的一个实施例,装置还包括:标签排序模块,用于对所述标记条款进行打标签及排序。
作为本发明的一个实施例,向量化处理模块包括:参数确定单元,用于确定所述用户输入文本对应的词频及逆文档频率;向量化处理单元,用于根据所述词频及逆文档频率对所述用户输入文本进行向量化处理。
作为本发明的一个实施例,条款筛选模型包括三个池化操作,以获得三个对应级别的特征映射。
基于与上述一种重要条款筛选与展示的方法相同的申请构思,本发明还提供了上述一种重要条款筛选与展示的装置。由于该一种重要条款筛选与展示的装置解决问题的原理与一种重要条款筛选与展示的方法相似,因此该一种重要条款筛选与展示的装置的实施可以参见一种重要条款筛选与展示的方法的实施,重复之处不再赘述。
本发明可根据各公司需要,灵活地插入各业务办理流程中,根据业务的不同,将重要信息进行分类,实现自动将条款按照重要性分级展示,帮助用户在短时间内快速了解协议重要信息,避免双方由协议的知晓程度不同造成的用户纠纷,从侧面提升用户满意度,同时,本发明可帮助用户在办理线上或无纸化业务中快速了解用户协议内容,让用户在短时间内了解协议中重要的部分,避免产生不必要的误解,根据重要等级以颜色区分更方便用户阅读。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。如图6所示,该电子设备600还可以包括:通信模块110、输入单元120、音频处理单元130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图6中所示的所有部件;此外,电子设备600还可以包括图6中没有示出的部件,可以参考现有技术。
如图6所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器100接收输入并控制电子设备600的各个部件的操作。
其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序,以实现信息存储或处理等。
输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。
存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种重要条款筛选与展示的方法,其特征在于,所述方法包括:
获取与办理业务相对应的用户输入文本;
对所述用户输入文本进行向量化处理;
将向量化处理后的所述用户输入文本输入至训练后的条款筛选模型;
利用训练后的条款筛选模型匹配对应条款,按照重要性等级输出条款,并展示输出的条款。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用户协议文本,确定所述用户协议文本中的标记条款;
对所述标记条款进行向量化处理;
将向量化处理后的所述标记条款作为训练数据,使用条款筛选模型进行训练,得到训练后的条款筛选模型。
3.根据权利要求2所述的方法,其特征在于,在对所述标记条款进行向量化处理之前还包括:对所述标记条款进行打标签及排序。
4.根据权利要求1所述的方法,其特征在于,所述对所述用户输入文本进行向量化处理包括:
确定所述用户输入文本对应的词频及逆文档频率;
根据所述词频及逆文档频率对所述用户输入文本进行向量化处理。
5.根据权利要求1所述的方法,其特征在于,所述条款筛选模型包括三个池化操作,以获得三个对应级别的特征映射。
6.一种重要条款筛选与展示的装置,其特征在于,所述装置包括:
输入文本获取模块,用于获取与办理业务相对应的用户输入文本;
向量化处理模块,用于对所述用户输入文本进行向量化处理;
模型筛选模块,用于将向量化处理后的所述用户输入文本输入至训练后的条款筛选模型;
筛选展示模块,用于利用训练后的条款筛选模型匹配对应条款,按照重要性等级输出条款,并展示输出的条款。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
协议文本获取模块,用于获取用户协议文本,确定所述用户协议文本中的标记条款;
条款向量化模块,用于对所述标记条款进行向量化处理;
模型训练模块,用于将向量化处理后的所述标记条款作为训练数据,使用条款筛选模型进行训练,得到训练后的条款筛选模型。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:标签排序模块,用于对所述标记条款进行打标签及排序。
9.根据权利要求6所述的装置,其特征在于,所述向量化处理模块包括:
参数确定单元,用于确定所述用户输入文本对应的词频及逆文档频率;
向量化处理单元,用于根据所述词频及逆文档频率对所述用户输入文本进行向量化处理。
10.根据权利要求6所述的装置,其特征在于,所述条款筛选模型包括三个池化操作,以获得三个对应级别的特征映射。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010453228.1A CN111666408A (zh) | 2020-05-26 | 2020-05-26 | 重要条款筛选与展示的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010453228.1A CN111666408A (zh) | 2020-05-26 | 2020-05-26 | 重要条款筛选与展示的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111666408A true CN111666408A (zh) | 2020-09-15 |
Family
ID=72384521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010453228.1A Pending CN111666408A (zh) | 2020-05-26 | 2020-05-26 | 重要条款筛选与展示的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111666408A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114722185A (zh) * | 2022-04-06 | 2022-07-08 | 建识科技(成都)有限公司 | 建筑规范条款智能筛选确定方法 |
CN117252690A (zh) * | 2023-11-17 | 2023-12-19 | 杭州钱袋数字科技有限公司 | 一种贷款合同在线签订方法与系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109902288A (zh) * | 2019-01-17 | 2019-06-18 | 深圳壹账通智能科技有限公司 | 智能条款分析方法、装置、计算机设备及存储介质 |
CN109918635A (zh) * | 2017-12-12 | 2019-06-21 | 中兴通讯股份有限公司 | 一种合同文本风险检测方法、装置、设备及存储介质 |
CN110019819A (zh) * | 2019-03-26 | 2019-07-16 | 方正株式(武汉)科技开发有限公司 | 分类模型生成方法、电子合同内容自动分类方法及装置 |
US10452784B1 (en) * | 2018-12-07 | 2019-10-22 | Capital One Services, Llc | Systems and methods for generating a plain English interpretation of a legal clause |
CN110705265A (zh) * | 2019-08-27 | 2020-01-17 | 阿里巴巴集团控股有限公司 | 合同条款风险识别方法以及装置 |
CN110765765A (zh) * | 2019-09-16 | 2020-02-07 | 平安科技(深圳)有限公司 | 基于人工智能的合同关键条款提取方法、装置及存储介质 |
-
2020
- 2020-05-26 CN CN202010453228.1A patent/CN111666408A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109918635A (zh) * | 2017-12-12 | 2019-06-21 | 中兴通讯股份有限公司 | 一种合同文本风险检测方法、装置、设备及存储介质 |
US10452784B1 (en) * | 2018-12-07 | 2019-10-22 | Capital One Services, Llc | Systems and methods for generating a plain English interpretation of a legal clause |
CN109902288A (zh) * | 2019-01-17 | 2019-06-18 | 深圳壹账通智能科技有限公司 | 智能条款分析方法、装置、计算机设备及存储介质 |
CN110019819A (zh) * | 2019-03-26 | 2019-07-16 | 方正株式(武汉)科技开发有限公司 | 分类模型生成方法、电子合同内容自动分类方法及装置 |
CN110705265A (zh) * | 2019-08-27 | 2020-01-17 | 阿里巴巴集团控股有限公司 | 合同条款风险识别方法以及装置 |
CN110765765A (zh) * | 2019-09-16 | 2020-02-07 | 平安科技(深圳)有限公司 | 基于人工智能的合同关键条款提取方法、装置及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114722185A (zh) * | 2022-04-06 | 2022-07-08 | 建识科技(成都)有限公司 | 建筑规范条款智能筛选确定方法 |
CN117252690A (zh) * | 2023-11-17 | 2023-12-19 | 杭州钱袋数字科技有限公司 | 一种贷款合同在线签订方法与系统 |
CN117252690B (zh) * | 2023-11-17 | 2024-02-23 | 杭州钱袋数字科技有限公司 | 一种贷款合同在线签订方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240078386A1 (en) | Methods and systems for language-agnostic machine learning in natural language processing using feature extraction | |
CN111859960B (zh) | 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质 | |
CN110377759B (zh) | 事件关系图谱构建方法及装置 | |
CN109872162B (zh) | 一种处理用户投诉信息的风控分类识别方法及系统 | |
CN110956956A (zh) | 基于策略规则的语音识别方法及装置 | |
CN116127020A (zh) | 生成式大语言模型训练方法以及基于模型的搜索方法 | |
CN110798567A (zh) | 短信分类显示方法及装置、存储介质、电子设备 | |
CN113722438A (zh) | 基于句向量模型的句向量生成方法、装置及计算机设备 | |
CN111798118B (zh) | 企业经营风险监控方法及装置 | |
CN111666408A (zh) | 重要条款筛选与展示的方法及装置 | |
CN112926471A (zh) | 业务单据影像内容识别方法及装置 | |
CN110209772B (zh) | 一种文本处理方法、装置、设备及可读存储介质 | |
CN111783432A (zh) | 信用证审单检查要点清单的生成方法及装置 | |
CN110059178A (zh) | 问题派发方法及装置 | |
CN110222282A (zh) | 数据处理方法、装置、服务器及存储介质 | |
CN112905787B (zh) | 文本信息处理方法、短信处理方法、电子设备及可读介质 | |
CN117349402A (zh) | 一种基于机器阅读理解的情绪原因对识别方法及系统 | |
CN116955591A (zh) | 用于内容推荐的推荐语生成方法、相关装置和介质 | |
KR102487820B1 (ko) | 유사한 비교콘텐츠들과의 차별점을 제공하는 콘텐츠 기획과 제작을 위한 통합 플랫폼 서비스 제공 장치, 방법 및 프로그램 | |
CN111477212A (zh) | 内容识别、模型训练、数据处理方法、系统及设备 | |
CN114021004A (zh) | 一种理科相似题推荐方法、装置、设备及可读存储介质 | |
CN111581347B (zh) | 语句相似度匹配方法及装置 | |
CN113657773A (zh) | 话术质检方法、装置、电子设备及存储介质 | |
CN112199954A (zh) | 基于语音语义的疾病实体匹配方法、装置及计算机设备 | |
CN110931014A (zh) | 基于正则匹配规则的语音识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200915 |