CN110162756A - 一种自动修正文本信息的方法和系统 - Google Patents
一种自动修正文本信息的方法和系统 Download PDFInfo
- Publication number
- CN110162756A CN110162756A CN201910312611.2A CN201910312611A CN110162756A CN 110162756 A CN110162756 A CN 110162756A CN 201910312611 A CN201910312611 A CN 201910312611A CN 110162756 A CN110162756 A CN 110162756A
- Authority
- CN
- China
- Prior art keywords
- data
- information
- rule
- document
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种自动修正文本信息的方法和系统,系统包括替换数据模块;匹配规则模块;数据替换控制单元,用于接收到用户输入数据后,将用户输入数据逐一与匹配规则模块中的规则进行对比,根据匹配的结果,得到全文结构、光标所处结构、结构名称标志词和被替换数据范围和文字起始位置;最后对需要替换的内容进行数据替换;和数据展示模块,用于展示文本内容,用户在输入时检测输入内容,获取当前输入的段落、内容、光标所处位置,并将所述用户输入数据传入数据替换控制单元。本发明解决法律文书撰写过程中的繁琐和重复的工作,节约律师的法律文书撰写时间,提升法律文书撰写体验。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种自动修正文本信息的方法和系统。
背景技术
目前,在使用word、wps等文本编辑软件或网页中的文本编辑器编辑文件时,可以设置固定模板,但是不能自动进行替换,需要手动选中所需要的文字内容或者文章结构的一部分,再进行输入、删除、增加文字内容等操作,才能完成信息的替换。
尤其是在法律文书等领域中,文本格式相对固定,但仍然需要手工选择要处理的信息块,再进行编写对应的内容。书写效率低,容易出现人为错误,影响了法律办案效率、效果。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种自动修正文本信息的方法和系统,解决法律文书撰写过程中的繁琐和重复的工作,节约律师的法律文书撰写时间,提升法律文书撰写体验。
为实现上述目的,本发明提供了
本发明的一种自动修正文本信息的方法,包括以下步骤:
步骤1:按照文书类型,对用户书写的文书进行分类,并提取文书拆分的规则,所述规则用于提取出每种文书结构、文书结构所包含的特征和提取出每种文书的当事人信息部分,得到每个当事人信息的组成;
步骤2:导入全国工商信息数据,根据步骤1中的当事人信息组成,把全国工商信息中的每条数据进行拼装,使之符合步骤1中文书的当事人信息组成;
步骤3:检测输入内容,获取当前输入的段落、内容、光标所处位置;
步骤4:接收到用户输入数据后,将用户输入数据逐一与规则进行对比,根据匹配规则的内容,得到全文结构、光标所处结构、结构名称标志词、被替换数据范围和文字起始位置;判断所述光标所处结构是否为需要替换的部分,如果是,执行步骤5;如果否,则终止;
步骤5:从所述结构名称标志词所处位置开始截取,直到光标位置;将得到的字符J与替换数据匹配,将完全包含字符J的数据组织成一个列表F;
步骤6:将得到的所述列表F进行展示,用于给用户进行选择;
步骤7:根据步骤4中得到的被替换数据范围,在用户点击步骤6中的所述列表F的一条数据后,把被替换数据先进行删除,然后插入步骤5中的替换数据。
上述文书类型包括民事起诉状、民事上诉状和公函。
民事起诉状中,如果是自然人,则当事人信息组成为:姓名、性别、民族、职业、出生年月、身份证、手机号、现住址;如果是法人单位,则当事人信息组成为:名称、统一社会信用代码、法定代表人姓名、法定代表人职务、电话、地址。
民事起诉书中当事人为机构时,需要替换的数据包括机构名称、统一社会信用代码、电话、地址、法定代表人姓名、法定代表人职务、负责人姓名、负责人职务。
步骤1中,文书结构为标题、原告信息、被告信息、诉讼请求、事实理由;原告信息和被告信息需要替换;
规则1,在段落开头出现标志“原告:”;
规则2,原告信息只会出现在原告信息、被告信息上方;
规则3,原告的个数大于等于1;
同时满足规则1,规则2,规则3,则为原告;
规则4,在段落的开头出现标志“被告:”;
规则5,被告信息只出现在原告信息的下方;
规则6,被告信息在诉讼请求上方;
同时满足规则4、规则5、规则6,则为被告;
规则7,两个相邻部分之间的段落,为上一个部分的内容。
上述文书结构所包含的特征包括文本中的位置、标志和顺序。
本发明的一种自动修正文本信息的系统,包括:
替换数据模块,用于导入全国工商信息数据,并将每条所述全国工商信息数据按照文书格式,把需要替换的数据处理成一个字符串;
匹配规则模块,用于对用户书写的文书进行分析,制定文书类型,拆分文书结构的多个规则,提取出文书结构和文书结构所包含的特征;
数据替换控制单元,用于接收到用户输入数据后,将用户输入数据逐一与匹配规则模块中的规则进行对比,根据匹配的结果,得到全文结构、光标所处结构、结构名称标志词和被替换数据范围和文字起始位置;最后对需要替换的内容进行数据替换;
数据展示模块,用于展示文本内容,用户在输入时检测输入内容,获取当前输入的段落、内容、光标所处位置,并将所述用户输入数据传入数据替换控制单元。
上述匹配规则模块提取文书的结构所包含的特征包括文本中的位置、标志、顺序。
本发明的有益效果是:
本发明只需要用户点击列表中的名称,就可以完成整块内容的替换,大大减少了用户操作的步骤,提升了用户的工作效率,解决了法律文书撰写过程中的繁琐和重复的工作,节约律师的法律文书撰写时间,提升法律文书撰写体验。本发明相较于使用Word等文本编辑软件,可以极大地提升工作效率,减轻工作负担,减少工作失误。
附图说明
图1是本发明的方法工作流程图。
图2是本发明的系统原理框图。
图3是本发明的匹配规则模块示意图。
具体实施方式
如图1所示,本发明提供了一种自动修正文本信息的方法,包括以下步骤:
步骤1:按照文书类型,如民事起诉状、民事上诉状、公函等文书,对用户书写的文书进行分类,并提取该类型文书拆分规则,该规则用于提取出每种文书结构和文书结构所包含的特征,尤其是每种文书的当事人信息部分,得到每个当事人信息的组成,如民事起诉状,如果是自然人,则当事人信息组成为:姓名、性别、民族、职业、出生年月、身份证、手机号、现住址;如果是法人单位,则当事人信息组成为:名称、统一社会信用代码、法定代表人姓名、法定代表人职务、电话、地址。
步骤2:导入全国工商信息数据,根据步骤1中的当事人信息组成成分,把全国工商信息中的每条数据进行拼装,使之符合步骤1中文书的当事人信息组成。
步骤3:数据展示模块展示文本内容,用户在输入时检测输入内容,获取当前输入的段落、内容、光标所处位置,并将用户输入数据传入数据替换控制单元;
步骤4:数据替换控制单元接收到用户输入数据后,将用户输入数据逐一与匹配规则模块中的规则进行对比,根据匹配的结果,得到全文结构、光标所处结构、结构名称标志词、被替换数据范围及文字起始位置;
如果光标所处结构为需要替换的部分,执行步骤5;
如果光标所处结构不需要替换,终止;
步骤5:从结构名称标志词所处位置开始截取,直到光标位置将得到的字符J与替换数据模块中的替换数据匹配,将完全包含J的数据组织成一个列表 F回传到数据展示模块,给用户选择;
步骤6:数据展示模块将得到的列表F在前端进行展示,用户根据自己的需求进行选择;
步骤7:根据步骤4中得到的被替换数据范围,在用户点击步骤6中的列表F的一条数据后,把被替换数据先进行删除,然后插入步骤5中的替换数据。
其中,步骤1全国工商信息数据包含公司机构名称、统一社会信用代码、电话、地址、法定代表人姓名、法定代表人职务、主要负责人姓名、主要负责人职务。步骤2文书的结构所包含的特征包括:文本中的位置、标志、顺序。
如图2所示,一种自动修正文本信息的系统,包括:
替换数据模块,用于导入全国工商信息数据,并将每条数据按照文书格式,把需要替换的数据处理成一个字符串;
匹配规则模块,用于对用户要书写的文书进行分析,制定该类型文书,拆分文书结构的多个规则,提取出该文书的结构和结构所包含的特征;
数据替换控制单元,用于接收到用户输入数据后,将用户输入数据逐一与匹配规则模块中的规则进行对比,根据匹配的结果,得到全文结构、光标所处结构、结构名称标志词、被替换数据范围及文字起始位置,最后对需要替换的为内容进行数据替换;
数据展示模块,用于展示文本内容,用户在输入时检测输入内容,获取当前输入的段落、内容、光标所处位置,并将用户输入数据传入数据替换控制单元。
其中,替换数据模块导入的全国工商信息数据包含公司机构名称、统一社会信用代码、电话、地址、法定代表人姓名、法定代表人职务、主要负责人姓名、主要负责人职务。匹配规则模块提取文书的结构所包含的特征包括:文本中的位置、标志、顺序。
本发明实施例如下:
用户书写民事起诉书,自动替换起诉书中的原告信息。
步骤1:按照文书类型,如民事起诉状、民事上诉状、公函等文书,对用户书写的文书进行分类,并提取该类型文书拆分规则,该规则用于提取出每种文书结构和文书结构所包含的特征,尤其是每种文书的当事人信息部分,得到每个当事人信息的组成,如民事起诉状,如果是自然人,则当事人信息组成为:姓名、性别、民族、职业、出生年月、身份证、手机号、现住址;如果是法人单位,则当事人信息组成为:名称、统一社会信用代码、法定代表人姓名、法定代表人职务、电话、地址。民事起诉书中当事人为机构时,替换的内容为:机构名称,统一社会信用代码,法定代表人姓名(或主要负责人姓名),法定代表人职务(主要负责人职务),电话,地址。假设工商信息有:公司A,与公司A名称类似的公司B。对应的替换数据内容为:公司A,统一社会信用代码:xxxxxxxxxxxxxxxxxxx,法定代表人姓名:姓名A。
步骤2:导入全国工商信息数据,根据步骤1中的当事人信息组成成分,把全国工商信息中的每条数据进行拼装,使之符合步骤1中民事起诉书的当事人信息组成。民事起诉书的结构为标题、原告信息、被告信息、诉讼请求、事实理由、其他。原告信息、被告信息需要替换。
规则1,在段落开头出现标志“原告:”。
规则2,原告信息只会出现在原告信息、被告信息上方。
规则3,原告的个数大于等于1。
同时满足规则1,规则2,规则3,则为原告。
规则4,在段落的开头出现标志“被告:”。
规则5,被告信息只出现在原告信息的下方。
规则6,被告信息在诉讼请求上方。
同时满足规则4、规则5、规则6,则为被告。
规则7,两个相邻部分之间的段落,为上一个部分的内容。
假设当前民事起诉书内容为:
民事起诉书
原告:张三
性别,民族,出生年月,身份证号,电话,地址。
被告:李四
性别,民族,出生年月,身份证号,电话,地址。
诉讼请求:
要求内容。
事实理由。
事实理由内容。
此致
Xx法院
具状人:张三
2019年1月21日
步骤3:数据展示模块,用户在编辑器中书写文书时,系统检测到用户在上面“原告:张三”中删除了张三,并且输入“公司A名称的关键字”,输入段落为第2段,内容为“原告:公司A名称的关键字”,光标在“原告:公司 A名称的关键字”后,即第7个字符后,将数据传入数据替换控制单元。
步骤4:数据控制单元接收到数据后,将数据逐一对比规则模块中的规则。
据匹配规则的内容,可得到光标在原告信息部分,结构名称标志词为“原告:”,被替换数据为“原告:张三,性别,民族,出生年月,身份证号,电话,地址。”,即第2段第3个字符至最后一个字符。
光标所处结构为需要替换的部分,执行步骤5。
步骤5:从结构名称标志词“原告:”所处位置开始截取,直到光标位置,将得到的字符“公司A名称的关键字”,匹配替换数据模块中的数据,将完全包含“公司A名称的关键字”的数据组织成一个列表,列表内容为:公司A,与公司A名称相似的公司B。
步骤6:数据展示模块将得到的列表在前端进行展示。假设用户需要输入“公司A”,用户点击列表中的“公司A”。对应的替换数据为:公司A,统一社会信用代码:xxxxxxxxxxxxxxxxxxx,法定代表人姓名:姓名A。
步骤7:根据步骤4中得到的被替换数据范围为第2段第3个字符至最后一个字符。把被替换数据先进行删除,然后插入步骤5中的替换数据“公司A,统一社会信用代码:xxxxxxxxxxxxxxxxxxx,法定代表人姓名:姓名A。”。这样自动将原本起诉书中的内容“原告:张三性别,民族,出生年月,身份证号,电话,地址。”,替换为了“公司A,统一社会信用代码:xxxxxxxxxxxxxxxxxxx,法定代表人姓名:姓名A。”,不需要先删除部分文字,再填写对应的内容,大大节约了用户的操作步骤和书写内容,进而提升了书写效率。
综上所述,本发明只需要用户点击列表中的名称,就可以完成整块内容的替换,大大减少了用户操作的步骤,提升了用户的工作效率。解决了法律文书撰写过程中的繁琐和重复的工作,节约律师的法律文书撰写时间,提升法律文书撰写体验。相较于使用Word等文本编辑软件,可以极大地提升工作效率,减轻工作负担,减少工作失误。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (8)
1.一种自动修正文本信息的方法,其特征在于,包括以下步骤:
步骤1:按照文书类型,对用户书写的文书进行分类,并提取文书拆分的规则,所述规则用于提取出每种文书结构、文书结构所包含的特征和提取出每种文书的当事人信息部分,得到每个当事人信息的组成;
步骤2:导入全国工商信息数据,根据步骤1中的当事人信息组成,把全国工商信息中的每条数据进行拼装,使之符合步骤1中文书的当事人信息组成;
步骤3:检测输入内容,获取当前输入的段落、内容、光标所处位置;
步骤4:接收到用户输入数据后,将用户输入数据逐一与规则进行对比,根据匹配规则的内容,得到全文结构、光标所处结构、结构名称标志词、被替换数据范围和文字起始位置;判断所述光标所处结构是否为需要替换的部分,如果是,执行步骤5;如果否,则终止;
步骤5:从所述结构名称标志词所处位置开始截取,直到光标位置;将得到的字符J与替换数据匹配,将完全包含字符J的数据组织成一个列表F;
步骤6:将得到的所述列表F进行展示,用于给用户进行选择;
步骤7:根据步骤4中得到的被替换数据范围,在用户点击步骤6中的所述列表F的一条数据后,把被替换数据先进行删除,然后插入步骤5中的替换数据。
2.如权利要求1所述的一种自动修正文本信息的方法,其特征在于,步骤1中,所述文书类型包括民事起诉状、民事上诉状和公函。
3.如权利要求2所述的一种自动修正文本信息的方法,其特征在于,民事起诉状中,如果是自然人,则当事人信息组成为:姓名、性别、民族、职业、出生年月、身份证、手机号、现住址;如果是法人单位,则当事人信息组成为:名称、统一社会信用代码、法定代表人姓名、法定代表人职务、电话、地址。
4.如权利要求2所述的一种自动修正文本信息的方法,其特征在于:民事起诉书中当事人为机构时,需要替换的数据包括机构名称、统一社会信用代码、电话、地址、法定代表人姓名、法定代表人职务、负责人姓名、负责人职务。
5.如权利要求1所述的一种自动修正文本信息的方法,其特征在于:
步骤1中,文书结构为标题、原告信息、被告信息、诉讼请求、事实理由;原告信息和被告信息需要替换;
规则1,在段落开头出现标志“原告:”;
规则2,原告信息只会出现在原告信息、被告信息上方;
规则3,原告的个数大于等于1;
同时满足规则1,规则2,规则3,则为原告;
规则4,在段落的开头出现标志“被告:”;
规则5,被告信息只出现在原告信息的下方;
规则6,被告信息在诉讼请求上方;
同时满足规则4、规则5、规则6,则为被告;
规则7,两个相邻部分之间的段落,为上一个部分的内容。
6.如权利要求1所述的一种自动修正文本信息的方法,其特征在于:步骤1中,所述文书结构所包含的特征包括文本中的位置、标志和顺序。
7.一种自动修正文本信息的系统,其特征在于,包括:
替换数据模块,用于导入全国工商信息数据,并将每条所述全国工商信息数据按照文书格式,把需要替换的数据处理成一个字符串;
匹配规则模块,用于对用户书写的文书进行分析,制定文书类型,拆分文书结构的多个规则,提取出文书结构和文书结构所包含的特征;
数据替换控制单元,用于接收到用户输入数据后,将用户输入数据逐一与匹配规则模块中的规则进行对比,根据匹配的结果,得到全文结构、光标所处结构、结构名称标志词和被替换数据范围和文字起始位置;最后对需要替换的内容进行数据替换;
和数据展示模块,用于展示文本内容,用户在输入时检测输入内容,获取当前输入的段落、内容、光标所处位置,并将所述用户输入数据传入数据替换控制单元。
8.如权利要求7所述的一种自动修正文本信息的系统,其特征在于:所述匹配规则模块提取文书的结构所包含的特征包括文本中的位置、标志、顺序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910312611.2A CN110162756A (zh) | 2019-04-18 | 2019-04-18 | 一种自动修正文本信息的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910312611.2A CN110162756A (zh) | 2019-04-18 | 2019-04-18 | 一种自动修正文本信息的方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110162756A true CN110162756A (zh) | 2019-08-23 |
Family
ID=67639439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910312611.2A Pending CN110162756A (zh) | 2019-04-18 | 2019-04-18 | 一种自动修正文本信息的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110162756A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101361064A (zh) * | 2005-12-16 | 2009-02-04 | Emil有限公司 | 文本编辑装置和方法 |
AU2009201864A1 (en) * | 2009-05-11 | 2010-11-25 | Fiona MacPhee | Semi-automated court document production |
CN106844318A (zh) * | 2016-12-20 | 2017-06-13 | 北京华宇信息技术有限公司 | 文书智能编写方法、文书智能编写装置和计算机存储介质 |
CN108363500A (zh) * | 2018-03-07 | 2018-08-03 | 重庆海特科技发展有限公司 | 一种工程检测数据快速录入编辑方法及装置 |
CN109284492A (zh) * | 2017-07-19 | 2019-01-29 | 北京国双科技有限公司 | 一种生成通知文书的方法和装置 |
-
2019
- 2019-04-18 CN CN201910312611.2A patent/CN110162756A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101361064A (zh) * | 2005-12-16 | 2009-02-04 | Emil有限公司 | 文本编辑装置和方法 |
AU2009201864A1 (en) * | 2009-05-11 | 2010-11-25 | Fiona MacPhee | Semi-automated court document production |
CN106844318A (zh) * | 2016-12-20 | 2017-06-13 | 北京华宇信息技术有限公司 | 文书智能编写方法、文书智能编写装置和计算机存储介质 |
CN109284492A (zh) * | 2017-07-19 | 2019-01-29 | 北京国双科技有限公司 | 一种生成通知文书的方法和装置 |
CN108363500A (zh) * | 2018-03-07 | 2018-08-03 | 重庆海特科技发展有限公司 | 一种工程检测数据快速录入编辑方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109582861B (zh) | 一种数据隐私信息检测系统 | |
CN106021394A (zh) | 一种网站的建站方法和装置 | |
CN109445794B (zh) | 一种页面构造方法及装置 | |
CN103778200A (zh) | 一种报文信息源抽取方法及其系统 | |
CN107133198A (zh) | 一种文档的排版和格式转换方法 | |
CN112926299B (zh) | 一种文本比对方法、合同审阅方法、审核系统 | |
CN111552704A (zh) | 一种数据报表生成方法、装置、计算机设备及存储介质 | |
CN107766163A (zh) | 一种待用信息粘贴方法、装置、设备及存储介质 | |
CN107748738A (zh) | 电子书目录的生成方法及装置、存储介质、计算设备 | |
CN109783184B (zh) | 用户自定义表单生成方法 | |
US9619445B1 (en) | Conversion of content to formats suitable for digital distributions thereof | |
CN107943782A (zh) | 一种字符处理方法及终端 | |
CN110889266A (zh) | 一种会议记录整合方法和装置 | |
CN112418875B (zh) | 跨平台税务智能客服语料迁移方法及装置 | |
CN107766549A (zh) | 文本文件删除方法及装置、终端装置与可读存储介质 | |
CN110162756A (zh) | 一种自动修正文本信息的方法和系统 | |
CN107203510A (zh) | 文字检测方法及装置 | |
CN106648618B (zh) | 虚拟应用的文本信息生成方法和装置 | |
KR102469983B1 (ko) | 교차검증, 사이트 검색 및 포맷 재구성을 이용한 논문 내 참고문헌 적합성 검증 서비스 제공 시스템 | |
CN111522939B (zh) | 一种处理笔记的方法、装置、计算机存储介质及终端 | |
CN111931479A (zh) | 基于合同纠纷判决书的信息抽取方法及装置 | |
CN115859988B (zh) | 一种针对社交文本的实体账号抽取方法及系统 | |
JP3672473B2 (ja) | 個体名の抽出装置、抽出方法、並びに、記録媒体 | |
CN113268283B (zh) | 一种基于卷宗材料批量处理的方法 | |
CN103106288A (zh) | 一种为新建电子表格文档生成推荐文件名称的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |