CN110969547A - 一种文本生成方法及装置 - Google Patents

一种文本生成方法及装置 Download PDF

Info

Publication number
CN110969547A
CN110969547A CN201811139234.9A CN201811139234A CN110969547A CN 110969547 A CN110969547 A CN 110969547A CN 201811139234 A CN201811139234 A CN 201811139234A CN 110969547 A CN110969547 A CN 110969547A
Authority
CN
China
Prior art keywords
text
target
data
entity object
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811139234.9A
Other languages
English (en)
Inventor
张宇航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201811139234.9A priority Critical patent/CN110969547A/zh
Publication of CN110969547A publication Critical patent/CN110969547A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Technology Law (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种文本生成方法及装置,获取原始数据文本,分析所述原始数据文本,得到审判类型,确定所述审判类型对应的目标裁判文书模板,基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书。使用本发明中的文本生成方法及装置,可以自动生成裁判文书,减少人力。

Description

一种文本生成方法及装置
技术领域
本发明涉及数据处理领域,更具体的说,涉及一种文本生成方法及装置。
背景技术
裁判文书记载人民法院审理的过程和结果,它是诉讼活动结果的载体,也是人民法院确定和分配当事人实体权利义务的唯一凭证。
庭审结束后,需要生成裁判文书。具体的,人工根据庭审的前置文书,比如民事一审审理流程,需要人工根据庭审笔录、起诉状、答辩状等综合信息,手动汇总得到裁判文书。但是,人工手动生成裁判文书,费时费力。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种文本生成方法及装置。
一种文本生成方法,包括:
获取原始数据文本;所述原始数据文本包括前置文书;
分析所述原始数据文本中与审判领域相关的词语,得到审判类型;
确定所述审判类型对应的目标裁判文书模板;
基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书。
优选地,基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书,包括:
获取所述目标裁判文书模板中的每一数据标识;其中,所述数据标识位于所述目标裁判文书模板中需要填充数据的位置;
从所述原始数据文本中获取每一数据标识对应的目标内容;
对于每一所述目标内容,将获取的所述目标内容替换所述目标内容对应的数据标识,并生成所述目标裁判文书。
优选地,从所述原始数据文本中获取每一数据标识对应的目标内容,包括:
获取预设实体类中每一实体对象与每一实体对象的数据获取规则;其中,实体对象与数据标识对应;
对于每一实体对象,基于所述实体对象的数据获取规则,从所述原始数据文本中获取所述实体对象对应的文本内容;
获取实体对象与数据标识的对应关系;
基于所述对应关系,将每一实体对象对应的文本内容作为相应的实体对象对应的数据标识对应的文本内容;
将每一所述数据标识对应的文本内容作为相应的数据标识对应的目标内容。
优选地,基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书之后,还包括:
确定需要进行编辑处理的目标内容作为待处理目标内容;
生成并显示所述待处理目标内容对应的编辑按钮;
获取点击所述编辑按钮后生成的操作指令;
响应所述操作指令,对所述待处理目标内容进行修改。
优选地,分析所述原始数据文本中与审判领域相关的词语,得到审判类型,包括:
基于预设词语提取规则,从所述原始数据文本中提取出关键词语;预设词语提取规则为与审判领域相关的词语提取规则;
分析所述关键词语,得到所述审判类型。
一种文本生成装置,包括:
文本获取模块,用于获取原始数据文本;
类型分析模块,用于分析所述原始数据文本中与审判领域相关的词语,得到审判类型;
模板确定模块,用于确定所述审判类型对应的目标裁判文书模板;
文本生成模块,用于基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书。
优选地,所述文本生成模块包括:
标识确定子模块,用于获取所述目标裁判文书模板中的每一数据标识;其中,所述数据标识位于所述目标裁判文书模板中需要填充数据的位置;
内容获取子模块,用于从所述原始数据文本中获取每一数据标识对应的目标内容;
替换子模块,用于对于每一所述目标内容,将获取的所述目标内容替换所述目标内容对应的数据标识,并生成所述目标裁判文书。
优选地,所述内容获取子模块包括:
规则获取单元,用于获取预设实体类中每一实体对象与每一实体对象的数据获取规则;其中,实体对象与数据标识对应;
内容获取单元,用于对于每一实体对象,基于所述实体对象的数据获取规则,从所述原始数据文本中获取所述实体对象对应的文本内容;
关系获取单元,用于获取实体对象与数据标识的对应关系;
第一内容确定单元,用于基于所述对应关系,将每一实体对象对应的文本内容作为相应的实体对象对应的数据标识对应的文本内容;
第二内容确定单元,用于将每一所述数据标识对应的文本内容作为相应的数据标识对应的目标内容。
一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述的文本生成方法。
一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述的文本生成方法。
借由上述技术方案,本发明提供的文本生成方法及装置,获取原始数据文本,分析所述原始数据文本,得到审判类型,确定所述审判类型对应的目标裁判文书模板,基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书。使用本发明中的文本生成方法及装置,可以自动生成裁判文书,减少人力。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种文本生成方法的方法流程图;
图2示出了本发明实施例提供的另一种文本生成方法的方法流程图;
图3示出了本发明实施例提供的再一种文本生成方法的方法流程图;
图4示出了本发明实施例提供的又一种文本生成方法的方法流程图;
图5示出了本发明实施例提供的一种文本生成装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种文本生成方法,参照图1,可以包括:
S11、获取原始数据文本;
其中,原始数据文本包括前置文书,前置文书为对应审理流程、且具有标准格式的文书。
民事一审的前置文书包括起诉状、答辩状、庭审笔录;民事二审的前置文书包括上诉状、上诉答辩状、庭审笔录、一审裁判文书;行政一审的前置文书包括被诉行政决定,庭审笔录;刑事一审的前置文书包括刑事自诉书、刑事起诉书、刑事辩护词、量刑建议书、庭审笔录;刑事二审的前置文书包括一审裁判文书、庭审笔录等。
S12、分析所述原始数据文本中与审判领域相关的词语,得到审判类型;
可选的,在本实施例的基础上,步骤S12可以包括:
基于预设词语提取规则,从所述原始数据文本中提取出关键词语,分析所述关键词语,得到所述审判类型。
具体的,预设词语提取规则为与审判领域相关的词语提取规则。
预设词语提取规则中规定了提取哪些词语,词语可以是上诉书、答辩状等。然后从原始数据文本中查找是否有规定提取的词语,如果有,则提取出来作为关键词语,进而依据关键词语确定审判类型。一般来说,关键词语可以是原始数据文本名称。
如关键词语为上诉状,则可以确定属于民事二审,关键词语为刑事自诉书,可以确定属于刑事一审。
S13、确定所述审判类型对应的目标裁判文书模板;
具体的,确定出属于民事一审、民事二审还是行政一审等后,就可以确定民事一审、民事二审、行政一审对应的模板。其中,模板可以是Java模板引擎Velocity模板,裁判文书Velocity模板是根据标准裁判文书类型而对应使用Velocity语法创建的不同段落组装成的一个模板,其中,每一段落都由裁判文书固定文本以及占位参数构成,最终形成以下裁判文书的模板:比如民事一审判决书模板(普通程序用)、民事二审裁定书模板(二审终结诉讼用)、刑事判决书模板(形式一审公诉判决用)等等。
Velocity模板,本质为使用Velocity脚本的语法串联起固定文本以及占位参数,其中,占位参数可以是#if、#else、#end、#foreach等。
S14、基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书。
其中,目标裁判文书即为裁判文本。
本实施例中,获取原始数据文本,分析所述原始数据文本,得到审判类型,确定所述审判类型对应的目标裁判文书模板,基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书。使用本发明实施例中的文本生成方法,可以自动生成裁判文书,减少人力,节约了法官的时间,降低了手工生成文书出错的可能性。
另外,根据前置文书一键生成裁判文书,对于法官来言,省事省力并且不易出错,颠覆传统生成裁判文书的工作模式;同时,按照法院以及标准裁判文书可以提取出固定的裁判文书模板,易于对模板进行扩展以及编辑维护。
可选的,在上述文本生成方法的实施例的基础上,参照图2,步骤S14可以包括:
S21、获取所述目标裁判文书模板中的每一数据标识;
其中,所述数据标识位于所述目标裁判文书模板中需要填充数据的位置。
具体的,目标裁判文书模板中包括多个数据标识,目标裁判文书模板中需要替换为数据的地方均设置有数据标识,该数据标识表征了该数据标识所在的位置应该放置什么数据,如数据标识为当事人名称,则该数据标识最终放置的数据为当事人名称,如张三、李四等。其中,数据标识为英文,如当事人名称对应的英文表示。
S22、从所述原始数据文本中获取每一数据标识对应的目标内容;
可选的,在本实施例的基础上,参照图3,步骤S22可以包括:
S31、获取预设实体类中每一实体对象与每一实体对象的数据获取规则;其中,实体对象与数据标识对应;
具体的,预设实体类为java实体类,实体类中包括实体对象、实体对象对应的数据、以及实体对象的数据获取规则。不同的实体对象的数据获取规则不同。
实体对象与数据标识对应,可选的,实体对象和数据标识的名称可以相同,或者是有映射关系。
数据获取规则了从原始数据文本中如何获取到实体对象的对应的文本内容。如实体对象为当事人名称,则数据获取规则可以是将原告、被告后的文本作为当事人名称对应的文本内容。实体对象为诉讼请求,则数据获取规则规定了以哪些文本开头、以哪些文本结束的文本为诉讼请求对应的文本内容。
S32、对于每一实体对象,基于所述实体对象的数据获取规则,从所述原始数据文本中获取所述实体对象对应的文本内容;
具体的,步骤S31中举例介绍了数据获取规则,依据数据获取规则,从原始数据文本中获取到每一实体对象的文本内容。
需要说明的是,当原始数据文本为多个时,对于每一实体对象,可以按照预先设定的优先级,优先从优先级最高的原始数据文本获取数据,当优先级最高的原始数据文本中没有该数据时,然后从优先级次高的原始数据文本获取数据,以此类推,直到找到实体对象对应的文本内容时停止。
S33、获取实体对象与数据标识的对应关系;
其中,实体对象和数据标识可以命名一致,即与实体对象有相同名称的数据标识为与该实体对象对应的数据标识。此外,实体对象也可以和数据标识命名不同,此时,需要预先建立实体对象与数据标识的对应关系,即映射关系。
S34、基于所述对应关系,将每一实体对象对应的文本内容作为相应的实体对象对应的数据标识对应的文本内容;
具体的,对应关系获取后,对于每一数据标识,确定该数据标识对应的实体对象,进而该实体对象对应的文本内容,即为该数据标识对应的文本内容。
S35、将每一所述数据标识对应的文本内容作为相应的数据标识对应的目标内容。
S23、对于每一所述目标内容,将获取的所述目标内容替换所述目标内容对应的数据标识,并生成所述目标裁判文书。
具体的,将数据标识替换为目标标识对应的目标内容,即得到目标裁判文书。
本实施例中,提出了利用java实体类来实现生成裁判文书的过程,通过java实体类确定每一数据标识对应的目标内容,然后将目标内容替换了数据标识,即完成了Velocity模板的填充,最终完成裁判文书的生成。
可选的,在上一文本生成方法的实施例的基础上,步骤S14之后,参照图4,还可以包括:
S45、确定需要进行编辑处理的目标内容作为待处理目标内容;
具体的,裁判文书生成后,如果需要对裁判文书中的某些内容进行修改,此时可以将需要进行编辑处理的目标内容作为待处理目标内容。如,待处理目标内容可以是“本院认为部分”。
S46、生成并显示所述待处理目标内容对应的编辑按钮;
具体的,可以在待处理目标内容那设置编辑按钮,编辑按钮可以是添加事实认定模板、类例事实认定模板、添加本院类案事实认定模板、删除等按钮。
编辑按钮可以设置在待处理目标内容的右上方,当点击待处理目标内容时,编辑按钮出现,当不点击待处理目标内容时,不显示编辑按钮。
S47、获取点击所述编辑按钮后生成的操作指令;
S48、响应所述操作指令,对所述待处理目标内容进行修改。
具体的,用户通过输入设备,如鼠标,点击编辑按钮中的一个按钮,此时会响应该点击的按钮。如当点击的按钮为类例事实认定模板时,则会在待处理目标内容中显示类例事实认定模板,人工可以通过在类例事实认定模板中添加内容,来形成本次审理最终的裁判文书。
当点击的按钮为删除按钮时,则会将待处理目标内容清空。
本实施例中,通过设置编辑按钮,可以对自动生成的裁判文书进行修改,以生成符合用户需求的裁判文书。
可选的,在上述文本生成方法的实施例的基础上,本发明的另一实施例提供了一种文本生成装置,参照图5,可以包括:
文本获取模块101,用于获取原始数据文本;所述原始数据文本包括前置文书;
类型分析模块102,用于分析所述原始数据文本中与审判领域相关的词语,得到审判类型;
模板确定模块103,用于确定所述审判类型对应的目标裁判文书模板;
文本生成模块104,用于基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书。
进一步,所述类型分析模块102可以包括:
词语提取子模块,用于基于预设词语提取规则,从所述原始数据文本中提取出关键词语;预设词语提取规则为与审判领域相关的词语提取规则;
词语分析子模块,用于分析所述关键词语,得到所述审判类型。
本实施例中,获取原始数据文本,分析所述原始数据文本,得到审判类型,确定所述审判类型对应的目标裁判文书模板,基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书。使用本发明实施例中的文本生成方法,可以自动生成裁判文书,减少人力,节约了法官的时间,降低了手工生成文书出错的可能性。
需要说明的是,本实施例中的各个模块和子模块的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
可选的,在上述任一文本生成装置的实施例的基础上,所述文本生成模块104可以包括:
标识确定子模块,用于获取所述目标裁判文书模板中的每一数据标识;其中,所述数据标识位于所述目标裁判文书模板中需要填充数据的位置;
内容获取子模块,用于从所述原始数据文本中获取每一数据标识对应的目标内容;
替换子模块,用于对于每一所述目标内容,将获取的所述目标内容替换所述目标内容对应的数据标识,并生成所述目标裁判文书。
进一步,所述内容获取子模块包括:
规则获取单元,用于获取预设实体类中每一实体对象与每一实体对象的数据获取规则;其中,实体对象与数据标识对应;
内容获取单元,用于对于每一实体对象,基于所述实体对象的数据获取规则,从所述原始数据文本中获取所述实体对象对应的文本内容;
关系获取单元,用于获取实体对象与数据标识的对应关系;
第一内容确定单元,用于基于所述对应关系,将每一实体对象对应的文本内容作为相应的实体对象对应的数据标识对应的文本内容;
第二内容确定单元,用于将每一所述数据标识对应的文本内容作为相应的数据标识对应的目标内容。
本实施例中,提出了利用java实体类来实现生成裁判文书的过程,通过java实体类确定每一数据标识对应的目标内容,然后将目标内容替换了数据标识,即完成了Velocity模板的填充,最终完成裁判文书的生成。
需要说明的是,本实施例中的各个模块、子模块和单元的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
进一步,在上一实施例的基础上,还包括:
内容确定模块,用于文本生成模块基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书后,确定需要进行编辑处理的目标内容作为待处理目标内容;
按钮生成模块,用于生成并显示所述待处理目标内容对应的编辑按钮;
指令获取模块,用于获取点击所述编辑按钮后生成的操作指令;
修改模块,用于响应所述操作指令,对所述待处理目标内容进行修改。
本实施例中,通过设置编辑按钮,可以对自动生成的裁判文书进行修改,以生成符合用户需求的裁判文书。
需要说明的是,本实施例中的各个模块的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
可选的,本发明的实施例还提供了一种文本生成装置,所述文本生成装置包括处理器和存储器,上述文本获取模块、类型分析模块、模板确定模块和文本生成模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来可以自动生成裁判文书,减少人力,节约了法官的时间,降低了手工生成文书出错的可能性。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述文本生成方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述文本生成方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
一种文本生成方法,包括:
获取原始数据文本;所述原始数据文本包括前置文书;
分析所述原始数据文本中与审判领域相关的词语,得到审判类型;
确定所述审判类型对应的目标裁判文书模板;
基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书。
进一步,基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书,包括:
获取所述目标裁判文书模板中的每一数据标识;其中,所述数据标识位于所述目标裁判文书模板中需要填充数据的位置;
从所述原始数据文本中获取每一数据标识对应的目标内容;
对于每一所述目标内容,将获取的所述目标内容替换所述目标内容对应的数据标识,并生成所述目标裁判文书。
进一步,从所述原始数据文本中获取每一数据标识对应的目标内容,包括:
获取预设实体类中每一实体对象与每一实体对象的数据获取规则;其中,实体对象与数据标识对应;
对于每一实体对象,基于所述实体对象的数据获取规则,从所述原始数据文本中获取所述实体对象对应的文本内容;
获取实体对象与数据标识的对应关系;
基于所述对应关系,将每一实体对象对应的文本内容作为相应的实体对象对应的数据标识对应的文本内容;
将每一所述数据标识对应的文本内容作为相应的数据标识对应的目标内容。
进一步,基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书之后,还包括:
确定需要进行编辑处理的目标内容作为待处理目标内容;
生成并显示所述待处理目标内容对应的编辑按钮;
获取点击所述编辑按钮后生成的操作指令;
响应所述操作指令,对所述待处理目标内容进行修改。
进一步,分析所述原始数据文本中与审判领域相关的词语,得到审判类型,包括:
基于预设词语提取规则,从所述原始数据文本中提取出关键词语;预设词语提取规则为与审判领域相关的词语提取规则;
分析所述关键词语,得到所述审判类型。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:一种文本生成方法,包括:
获取原始数据文本;所述原始数据文本包括前置文书;
分析所述原始数据文本中与审判领域相关的词语,得到审判类型;
确定所述审判类型对应的目标裁判文书模板;
基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书。
进一步,基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书,包括:
获取所述目标裁判文书模板中的每一数据标识;其中,所述数据标识位于所述目标裁判文书模板中需要填充数据的位置;
从所述原始数据文本中获取每一数据标识对应的目标内容;
对于每一所述目标内容,将获取的所述目标内容替换所述目标内容对应的数据标识,并生成所述目标裁判文书。
进一步,从所述原始数据文本中获取每一数据标识对应的目标内容,包括:
获取预设实体类中每一实体对象与每一实体对象的数据获取规则;其中,实体对象与数据标识对应;
对于每一实体对象,基于所述实体对象的数据获取规则,从所述原始数据文本中获取所述实体对象对应的文本内容;
获取实体对象与数据标识的对应关系;
基于所述对应关系,将每一实体对象对应的文本内容作为相应的实体对象对应的数据标识对应的文本内容;
将每一所述数据标识对应的文本内容作为相应的数据标识对应的目标内容。
进一步,基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书之后,还包括:
确定需要进行编辑处理的目标内容作为待处理目标内容;
生成并显示所述待处理目标内容对应的编辑按钮;
获取点击所述编辑按钮后生成的操作指令;
响应所述操作指令,对所述待处理目标内容进行修改。
进一步,分析所述原始数据文本中与审判领域相关的词语,得到审判类型,包括:
基于预设词语提取规则,从所述原始数据文本中提取出关键词语;预设词语提取规则为与审判领域相关的词语提取规则;
分析所述关键词语,得到所述审判类型。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种文本生成方法,其特征在于,包括:
获取原始数据文本;所述原始数据文本包括前置文书;
分析所述原始数据文本中与审判领域相关的词语,得到审判类型;
确定所述审判类型对应的目标裁判文书模板;
基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书。
2.根据权利要求1所述的文本生成方法,其特征在于,基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书,包括:
获取所述目标裁判文书模板中的每一数据标识;其中,所述数据标识位于所述目标裁判文书模板中需要填充数据的位置;
从所述原始数据文本中获取每一数据标识对应的目标内容;
对于每一所述目标内容,将获取的所述目标内容替换所述目标内容对应的数据标识,并生成所述目标裁判文书。
3.根据权利要求2所述的文本生成方法,其特征在于,从所述原始数据文本中获取每一数据标识对应的目标内容,包括:
获取预设实体类中每一实体对象与每一实体对象的数据获取规则;其中,实体对象与数据标识对应;
对于每一实体对象,基于所述实体对象的数据获取规则,从所述原始数据文本中获取所述实体对象对应的文本内容;
获取实体对象与数据标识的对应关系;
基于所述对应关系,将每一实体对象对应的文本内容作为相应的实体对象对应的数据标识对应的文本内容;
将每一所述数据标识对应的文本内容作为相应的数据标识对应的目标内容。
4.根据权利要求2所述的文本生成方法,其特征在于,基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书之后,还包括:
确定需要进行编辑处理的目标内容作为待处理目标内容;
生成并显示所述待处理目标内容对应的编辑按钮;
获取点击所述编辑按钮后生成的操作指令;
响应所述操作指令,对所述待处理目标内容进行修改。
5.根据权利要求1所述的文本生成方法,其特征在于,分析所述原始数据文本中与审判领域相关的词语,得到审判类型,包括:
基于预设词语提取规则,从所述原始数据文本中提取出关键词语;预设词语提取规则为与审判领域相关的词语提取规则;
分析所述关键词语,得到所述审判类型。
6.一种文本生成装置,其特征在于,包括:
文本获取模块,用于获取原始数据文本;
类型分析模块,用于分析所述原始数据文本中与审判领域相关的词语,得到审判类型;
模板确定模块,用于确定所述审判类型对应的目标裁判文书模板;
文本生成模块,用于基于所述目标裁判文书模板以及所述原始数据文本,生成目标裁判文书。
7.根据权利要求6所述的文本生成装置,其特征在于,所述文本生成模块包括:
标识确定子模块,用于获取所述目标裁判文书模板中的每一数据标识;其中,所述数据标识位于所述目标裁判文书模板中需要填充数据的位置;
内容获取子模块,用于从所述原始数据文本中获取每一数据标识对应的目标内容;
替换子模块,用于对于每一所述目标内容,将获取的所述目标内容替换所述目标内容对应的数据标识,并生成所述目标裁判文书。
8.根据权利要求7所述的文本生成装置,其特征在于,所述内容获取子模块包括:
规则获取单元,用于获取预设实体类中每一实体对象与每一实体对象的数据获取规则;其中,实体对象与数据标识对应;
内容获取单元,用于对于每一实体对象,基于所述实体对象的数据获取规则,从所述原始数据文本中获取所述实体对象对应的文本内容;
关系获取单元,用于获取实体对象与数据标识的对应关系;
第一内容确定单元,用于基于所述对应关系,将每一实体对象对应的文本内容作为相应的实体对象对应的数据标识对应的文本内容;
第二内容确定单元,用于将每一所述数据标识对应的文本内容作为相应的数据标识对应的目标内容。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至5中任意一项所述的文本生成方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至5中任意一项所述的文本生成方法。
CN201811139234.9A 2018-09-28 2018-09-28 一种文本生成方法及装置 Pending CN110969547A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811139234.9A CN110969547A (zh) 2018-09-28 2018-09-28 一种文本生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811139234.9A CN110969547A (zh) 2018-09-28 2018-09-28 一种文本生成方法及装置

Publications (1)

Publication Number Publication Date
CN110969547A true CN110969547A (zh) 2020-04-07

Family

ID=70027765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811139234.9A Pending CN110969547A (zh) 2018-09-28 2018-09-28 一种文本生成方法及装置

Country Status (1)

Country Link
CN (1) CN110969547A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112070634A (zh) * 2020-08-07 2020-12-11 潍坊钰微软件科技有限公司 智能读取、提高庭审时效及自动生成法律文书的方法
CN112651220A (zh) * 2021-01-28 2021-04-13 宁夏智诚安环科技发展股份有限公司四川分公司 一种环境影响评价报告生成方法及其系统
CN113569538A (zh) * 2020-04-29 2021-10-29 北京国双科技有限公司 文书的生成方法、装置、存储介质及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912902A (zh) * 2005-08-12 2007-02-14 鸿富锦精密工业(深圳)有限公司 法律文书生成系统及方法
AU2009201864A1 (en) * 2009-05-11 2010-11-25 Fiona MacPhee Semi-automated court document production
CN103412868A (zh) * 2013-07-02 2013-11-27 福建榕基软件股份有限公司 文书生成方法及装置
CN105632498A (zh) * 2014-10-31 2016-06-01 株式会社东芝 生成会议记录的方法、装置和系统
CN108009299A (zh) * 2017-12-28 2018-05-08 北京市律典通科技有限公司 法律审判业务处理方法和装置
CN108519968A (zh) * 2018-04-09 2018-09-11 北京智慧正安科技有限公司 刑事案件裁判文书生成方法、装置及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1912902A (zh) * 2005-08-12 2007-02-14 鸿富锦精密工业(深圳)有限公司 法律文书生成系统及方法
AU2009201864A1 (en) * 2009-05-11 2010-11-25 Fiona MacPhee Semi-automated court document production
CN103412868A (zh) * 2013-07-02 2013-11-27 福建榕基软件股份有限公司 文书生成方法及装置
CN105632498A (zh) * 2014-10-31 2016-06-01 株式会社东芝 生成会议记录的方法、装置和系统
CN108009299A (zh) * 2017-12-28 2018-05-08 北京市律典通科技有限公司 法律审判业务处理方法和装置
CN108519968A (zh) * 2018-04-09 2018-09-11 北京智慧正安科技有限公司 刑事案件裁判文书生成方法、装置及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
范春晓: "《Web数据分析关键技术及解决方案》", 31 October 2017 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569538A (zh) * 2020-04-29 2021-10-29 北京国双科技有限公司 文书的生成方法、装置、存储介质及电子设备
CN112070634A (zh) * 2020-08-07 2020-12-11 潍坊钰微软件科技有限公司 智能读取、提高庭审时效及自动生成法律文书的方法
CN112651220A (zh) * 2021-01-28 2021-04-13 宁夏智诚安环科技发展股份有限公司四川分公司 一种环境影响评价报告生成方法及其系统

Similar Documents

Publication Publication Date Title
CN110969547A (zh) 一种文本生成方法及装置
CN111444750B (zh) 一种pdf文档识别方法、装置及电子设备
CN110688349B (zh) 一种文档整理方法、装置、终端及计算机可读存储介质
CN111400387A (zh) 导入导出数据的转换方法、装置、终端设备及存储介质
CN109284492B (zh) 一种生成通知文书的方法和装置
CN110990274A (zh) 一种生成测试案例的数据处理方法、装置及系统
CN114638232A (zh) 一种文本转换成视频的方法、装置、电子设备及存储介质
CN108874379B (zh) 页面的处理方法及装置
CN110309295B (zh) 生成裁判文书经审理查明段的方法及装置
CN112749536A (zh) 文书生成方法、装置和设备
CN110991352A (zh) 一种卷宗数据审查方法及装置
CN113485746B (zh) 应用程序接口文档的生成方法及装置
CN115719073A (zh) 一种多语资源的翻译方法、设备及介质
CN111461901B (zh) 车辆保险理赔信息的输出方法和装置
CN113761863A (zh) 一种列表页面的配置方法、设备及存储介质
CN110443202B (zh) 论文字体工整度即时分析系统、方法及存储介质
CN113988020A (zh) 工程技术标标书编制方法、装置、设备及存储介质
CN109344372B (zh) 基于大数据的单证生成方法及系统
CN112579764A (zh) 一种庭审提纲的生成方法、装置、设备及存储介质
CN112835903A (zh) 一种敏感数据识别的方法及设备
CN112579747A (zh) 一种身份信息提取方法及装置
CN112650864A (zh) 一种数据处理方法、装置、电子设备及存储介质
JP6828287B2 (ja) 情報処理装置及び情報処理プログラム
CN111143356A (zh) 报表检索方法及装置
CN114418130B (zh) 一种模型训练方法、数据处理方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200407