CN113448544A - 一种程序开发中文档自动生成方法及系统 - Google Patents

一种程序开发中文档自动生成方法及系统 Download PDF

Info

Publication number
CN113448544A
CN113448544A CN202110705301.4A CN202110705301A CN113448544A CN 113448544 A CN113448544 A CN 113448544A CN 202110705301 A CN202110705301 A CN 202110705301A CN 113448544 A CN113448544 A CN 113448544A
Authority
CN
China
Prior art keywords
document
character string
information
task
requirement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110705301.4A
Other languages
English (en)
Inventor
何怀正
郑希
肖忠杰
梁荣嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110705301.4A priority Critical patent/CN113448544A/zh
Publication of CN113448544A publication Critical patent/CN113448544A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/10Requirements analysis; Specification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本申请提供的一种程序开发中文档自动生成方法及系统,可用于金融领域或其他领域,方法包括:获取管理人员通过一信息介质记载的文档需求信息;基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息;根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档;通过简单的自然语言语法分析得到生成任务文档所需的信息,并根据解析出来的信息执行文档生成操作,实现了文档生成与转换的自动化,并且由于文档是根据预设的规则生成,非手工处理,不会出现人工编写文档时出现笔误等的情况。

Description

一种程序开发中文档自动生成方法及系统
技术领域
本申请涉及金融领域,具体涉及一种程序开发中文档自动生成方法及系统。
背景技术
在目前的工作中,开发人员通过会通过邮件系统接收到大量来自管理人员的各种文档梳理请求。这些文档梳理请求通常为对现有的或正在开发的系统进行各种各样的梳理,如按管理者要求的格式编写系统规格书、软件需求说明书、接口文档、修改明细、程序调用关系等。
根据传统的软件工程流程,系统规格书、软件需求说明书等文档,都是在编码前编写完成,然后才开始进行编码等工作。在编码工作中,往往会遇到很多对原有设计方案的修改,然后在后续的测试和运营过程中,也会不断地对系统的代码进行修改,这时就会出现代码与系统规格书和接口文档等文档出现不一致的情况。为解决这种不一致,通常在修改代码的同时,还要手工同步修改对应的接口文档和程序规格说明书等。
除了手工修改对应的文档,还可以通过现有的文档生成器对代码和文档进行同步。例如使用基于现有代码注释或代码本身生成对应接口文档的应用软件,如各种javaDoc,jsDoc生成器,就可以重新生成程序的接口文档和程序说明文档。
而对于管理者进行的程序调用关系梳理的需求,目前常见的IDE也有这种功能,可输出对应的程序调用关系图。
而目前基于邮件开展对应文档工作的技术,也有诸如专利CN29291980569.4(基于邮件的工单处理方法、装置、电子设备和介质)等。
手工同步代码和程序相关设计文档的方法是最常见的办法,但手工维护文档耗费的人力资源实在太大,而且针对同一个程序一般都会有多个涉及文档,同一个修改点往往要在不同用途的文档之间加上类似的但因为格式文档而不完全相同的修改说明,这样重复工作将会造成巨大的人力资源浪费。
现有的文档生成器目前能生成的文档种类太少,例如只有接口文档和程序说明文档等,而且在格式上往往不符合管理者的各种各样且不断变化的要求。同理,现有IDE程序调用关系梳理工具的输出文档,也有这个问题。最后,所有的文档往往都要手工处理或转换一遍。根据现有的工作经验以及管理人员层出不穷的要求,这些文档同步和梳理工作,往往是代码修改本身工作量的2~3倍。
而目前基于邮件系统开展对应文档工作的技术,如之前提到的CN29291980569.4,则对邮件文本本身具有较高的格式要求。例如要管理人员填写派工单,然后通过邮件系统发送给开发人员,才可以开始对应的操作。对于习惯于制定规范而不是遵守规范的管理人员来说,这是不可接受的,最终派工单的填写工作还是会落到开发人员手上,从而又要支出另外一笔人力资源成本。
发明内容
针对现有技术中的问题,本申请提供一种程序开发中文档自动生成方法及系统,通过语义解析对文档需求信息进行准确的解析,然后根据解析后的文档需求信息自动生成任务文档,从而实现了文档生成与转换的自动化。
为解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种程序开发中文档自动生成方法,包括:
在程序开发过程中,获取管理人员通过一信息介质记载的文档需求信息,所述文档需求信息包括至少一个语句;
基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息;
根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档。
进一步地,所述基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息,包括:
结合预设的字词数据库以及文档类型集合对所述文档需求信息进行解析,得到任务文档需求字符串;
结合文档版本正则表达式对所述任务文档需求字符串进行解析,得到文档版本信息。
进一步地,所述任务文档需求字符串包括主语字符串集合、宾语字符串集合以及定语或状语字符串集合,所述结合预设的字词数据库以及文档类型集合对所述文档需求信息进行解析,得到任务文档需求字符串,包括:
根据所述文档类型集合对所述任务文档生成语义进行解析,得到文档类型字符串;
根据所述字词数据库对位于所述文档类型字符串前的所有文本进行解析,得到主语字符串集合、宾语字符串集合以及定语或状语字符串集合。
进一步地,所述根据所述字词数据库对位于所述文档类型字符串前的所有文本进行解析,得到主语字符串集合、宾语字符串集合以及定语或状语字符串集合,包括:
提取位于所述文档类型字符串前两个字符长度的字符串作为当前第一待处理字符串;
结合字词数据库查找所述第一待处理字符串,若所述第一待处理字符串仅有唯一词性,则执行第一操作;
所述第一操作包括:将所述第一待处理字符串归集到对应词性集合,其中,若所述第一待处理字符串唯一词性为动词属性,则将所述第一待处理字符串归集至谓语字符串集合,若所述第一待处理字符串唯一词性为名词或代词属性,则将所述第一待处理字符串归集为主语字符串集合;
清空当前待处理字符串;
提取位于所述第一待处理字符串前两个字符长度的字符串作为当前第二待处理字符串;
结合字词数据库查找所述第二待处理字符串;
若所述第一待处理字符串包括多个词性或无词性,则执行第二操作;
所述第二操作包括:将位于所述第一待处理字符串前一个字符长度的字符串以及所述第一待处理字符串作为第三待处理字符串;
结合字词数据库查找所述第三待处理字符串;
若所述第三待处理字符串仅有唯一词性,则执行第一操作;
若所述第三待处理字符串无词性,则执行第三操作;
所述第三操作包括:将所述第一待处理字符串归集至定语或状语字符串集合,并将所述第一待处理字符串从当前待处理字符串中删除;
选取所述第三待处理字符串中剩余字符串作为当前待处理字符串;
重复上述操作,直至所述文档类型字符串前所处位置前的所有字符串均完成词性查询。
进一步地,所述获取管理人员通过一信息介质记载的文档需求信息,包括:
结合预设的信息过滤规则集合对理人员发送的信息进行匹配;
若所述信息符合所述信息过滤规则集合,则将所述信息归集为文档需求信息。
进一步地,所述基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息,还包括:
根据模板文档提取具有相同含义的文档表头名称,生成文档正则表达式。
进一步地,所述根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档,包括:
根据所述任务文档需求字符串确定任务文档模板;
根据所述任务文档模板以及所述文档版本信息生成任务文档。
进一步地,所述根据所述任务文档模板以及所述文档版本信息生成任务文档,包括:
根据所述任务文档模板确定生成任务文档所需的文档内容信息;
根据所述文档内容信息以及所述文档模板确定任务文档内容;
根据所述任务文档模板以及所述任务文档内容生成所述任务文档。
第二方面,本申请提供一种程序开发方法,包括:
在程序开发过程中,获取管理人员通过一信息介质记载的文档需求信息,所述文档需求信息包括至少一个语句;
基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息;
根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档;
根据所述任务文档进行程序开发。
第三方面,本申请提供一种程序开发中文档自动生成系统,包括:
信息获取模块:在程序开发过程中,获取管理人员通过一信息介质记载的文档需求信息,所述文档需求信息包括至少一个语句;
语义解析模块:基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息;
文档生成模块:根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档。
进一步地,所述语义解析模块包括:
语义解析单元:结合预设的字词数据库以及文档类型集合对所述任务文档生成语义进行解析,得到任务文档需求字符串;
字符串解析单元:结合文档版本正则表达式对所述任务文档需求字符串进行解析,得到文档版本信息。
进一步地,所述任务文档需求字符串包括主语字符串集合、宾语字符串集合以及定语或状语字符串集合,所述语义解析单元包括:
文档类型子单元:根据所述文档类型集合对所述任务文档生成语义进行解析,得到文档类型字符串;
词性解析子单元:根据所述字词数据库对位于所述文档类型字符串前的所有文本进行解析,得到主语字符串集合、宾语字符串集合以及定语和/或状语字符串集合。
进一步地,所述信息获取模块包括:
信息匹配单元:结合预设的信息过滤规则集合对理人员发送的信息进行匹配;
信息筛选单元:若所述信息符合所述信息过滤规则集合,则将所述信息归集为文档需求信息。
进一步地,所述语义解析模块还包括:
属性近义词集合:根据模板文档提取具有相同含义的文档表头名称,生成文档正则表达式。
进一步地,所述文档生成模块包括:
模板选取单元:根据所述文档类型信息确定任务文档模板;
文档生成单元:根据所述任务文档模板以及所述文档版本信息生成任务文档。
进一步地,所述文档生成单元包括:
模板解析子单元:根据所述任务文档模板确定生成任务文档所需的文档内容信息;
文档内容获取子单元:根据所述文档内容信息以及所述文档模板确定任务文档内容;
文档生成子单元:根据所述任务文档模板以及所述任务文档内容生成所述任务文档。
第四方面,本申请提供一种程序开发系统,包括:
文档自动生成模块:所述文档自动生成模块根据文档需求信息生成对应的任务文档;
程序开发模块:根据所述任务文档进行程序开发。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的程序开发中文档自动生成方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的程序开发中文档自动生成方法。
由上述技术方案可知,本申请提供的一种程序开发中文档自动生成方法及系统,方法包括:获取管理人员通过一信息介质记载的文档需求信息;基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息;根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档;通过简单的自然语言语法分析得到生成任务文档所需的信息,并根据解析出来的信息执行文档生成操作,实现了文档生成与转换的自动化,并且由于文档是根据预设的规则生成,非手工处理,不会出现人工编写文档时出现笔误等的情况。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例中的程序开发中文档自动生成方法的流程示意图。
图2是本申请实施例中的程序开发中文档自动生成方法中步骤200的流程示意图。
图3是本申请实施例中的程序开发中文档自动生成方法中步骤100的流程示意图。
图4是本申请实施例中的程序开发中文档自动生成方法中步骤300的流程示意图。
图5是本申请实施例中程序开发方法的流程示意图。
图6是本申请实施例中程序开发中文档自动生成系统的结构示意图。
图7是本申请实施例中程序开发中文档自动生成系统的语义解析模块结构示意图。
图8是本申请实施例中程序开发中文档自动生成系统的文档生成模块的结构示意图。
图9是本申请实施例中程序开发系统的结构示意图。
图10是本申请实施例中的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请公开的程序开发中文档自动生成方法及系统可用于金融领域,也可用于除金融领域之外的任意领域,本申请公开的程序开发中文档自动生成方法及系统的应用领域不做限定。
考虑到现有的同步代码和程序相关设计文档的方法往往会造成巨大的人力资源浪费,同时现有的文档生成器目前能生成的文档种类太少,本申请提供一种程序开发中文档自动生成方法以及程序开发方法,通过简单的自然语言语法分析得到生成任务文档所需的信息,并根据解析出来的信息执行文档生成操作,实现了文档生成与转换的自动化,并且由于文档是根据预设的规则生成,非手工处理,不会出现人工编写文档时出现笔误等的情况。
基于上述内容,本申请还提供一种用于实现本申请一个或多个实施例中提供的程序开发中文档自动生成以及程序开发方法的程序开发中文档自动生成以及程序开发系统,该程序开发中文档自动生成以及程序开发系统可以与客户端设备之间通信连接,所述客户终端设备可以设有多个,程序开发中文档自动生成以及程序开发系统具体可以通过应用服务器访问所述客户终端设备。
其中,所述程序开发中文档自动生成系统可以自客户终端设备接收管理人员发送的文档需求信息,并自该文档希求信息中获取生成任务文档所需的任务文档需求字符串以及文档版本信息,所述程序开发中文档自动生成系统根据该任务文档需求字符串以及文档版本信息生成对应的任务文档,而后,所述程序开发中文档自动生成系统可以将任务文档发送至客户端设备以及程序开发系统进行显示,以使管理人员通过客户端设备获得任务文档。开发人员通过程序开发系统获得任务文档进行程序开发。
可以理解的是,所述客户端设备可以包括智能手机、平板电子设备、便携式计算机、台式电脑、个人数字助理(PDA)等。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。例如,通信单元可以将文档需求信息发送至分类处理中心的服务器,以便服务器根据文档需求信息进行语义解析。通信单元还可以接收服务器返回的任务文档。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
上述服务器与所述客户端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
本申请提供的程序开发中文档自动生成及程序开发方法、程序开发中文档自动生成及程序开发系统、电子设备和计算机可读存储介质,通过简单的自然语言语法分析得到生成任务文档所需的信息,并根据解析出来的信息执行文档生成操作,实现了文档生成与转换的自动化,并且由于文档是根据预设的规则生成,非手工处理,不会出现人工编写文档时出现笔误等的情况。
具体通过下述多个实施例及应用实例分别进行说明。
为了解决现有的同步代码和程序相关设计文档的方法往往会造成巨大的人力资源浪费,同时现有的文档生成器目前能生成的文档种类太少的问题,本申请提供一种程序开发中文档自动生成方法的实施例,参见图1,所述程序开发中文档自动生成方法具体包含有如下内容:
步骤100:在程序开发过程中,获取管理人员通过一信息介质记载的文档需求信息,所述文档需求信息包括至少一个语句。
可以理解的是,管理人员通过一信息介质发送文档需求信息,所述信息介质可以是邮件、短信或文件,若文件为纸质文件,可以对纸质文件进行扫描,提取纸质文件中的文本内容为文档需求信息,文档需求信息至少包括一个有完整语义的语句。
步骤200:基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息。
步骤300:根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档。
可以理解的是,通过简单的自然语言语法分析,从文档需求信息中获取生成任务文档所需的任务文档需求字符串以及文档版本信息,根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档,文档需求信息包括发件人信息、收件人信息、文档主题、正文和附件等数据结构。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成方法,获取管理人员通过一信息介质记载的文档需求信息;基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息;根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档;通过简单的自然语言语法分析得到生成任务文档所需的信息,并根据解析出来的信息执行文档生成操作,实现了文档生成与转换的自动化,并且由于文档是根据预设的规则生成,非手工处理,不会出现人工编写文档时出现笔误等的情况。
为了进一步提高文档需求信息解析的多样性,在本申请提供的程序开发中文档自动生成方法的一个实施例中,提供一种语义解析的优选方式,参见图2,在所述程序开发中文档自动生成方法中的步骤200具体包含有如下内容:
步骤210:结合预设的字词数据库以及文档类型集合对所述文档需求信息进行解析,得到任务文档需求字符串。
步骤211:结合文档版本正则表达式对所述任务文档需求字符串进行解析,得到文档版本信息。
可以理解的是,通过对开源字典应用,如MDict、GoldenDict或深蓝字典等,或外购商业字典,如有道字典、金山词霸或欧路等的数据库进行解析,从而转换得出大量的字词记录。每条字词记录的属性包括:名称、词性和意义。所有的字词记录整体为一个xml文件或一张数据库表,构成字词数据库。文档类型集合是根据手工整理外部规范文件和模板文件而形成的文档类型名称的正则表达式字符串,如:“(投产梳理|软件需求说明书|接口文档|系统规格书|……)”。通过预设的字词数据库以及文档类型集合对文档需求信息中的主题及正文进行解析,得到任务文档需求字符串,任务文档需求字符串包括主语字符串集合、宾语字符串集合、定语或状语字符串集合以及文档类型字符串。通过文档版本正则表达式对任务文档需求字符串进行解析,得到文档版本信息。文档版本正则表达式是用于匹配出版本信息的正则表达式,具体为类似以下格式的字符串:“[/d一二三四五六七八九十]+月版本?/w*|[A-Z]{1,2}\d{5,8}[\-_]\w+|\w+项目|……”。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成方法,通过字词数据库和文档类型集合对文档需求信息中的主题和正文进行解析,得到生成任务文档所需的文档版本信息和任务文档需求字符串,该语义解析对文档需求信息的格式要求较低,能够解析多种格式的文档需求信息。
为了进一步提高文档需求信息解析的准确性,在本申请提供的程序开发中文档自动生成方法的一个实施例中,提供一种任务文档需求字符串解析的优选方式,所述任务文档需求字符串包括主语字符串集合、宾语字符串集合以及定语或状语字符串集合,在所述程序开发中文档自动生成方法中的步骤210具体包含有如下内容:
步骤2101:根据所述文档类型集合对所述任务文档生成语义进行解析,得到文档类型字符串。
步骤2102:根据所述字词数据库对位于所述文档类型字符串前的所有文本进行解析,得到主语字符串集合、宾语字符串集合以及定语或状语字符串集合。
可以理解的是,通过文档类型集合对文档需求信息进行解析,得到文档类型字符串,通过字词数据库对文档类型前的所有字符串进行解析,得到主语字符串集合、宾语字符串集合以及定语或状语字符串集合。例如,文档需求信息为”请各位抽空填一下X月版投产明细,模板如下:”,通过文档类型集合匹配搜索到文档类型为“投产明细”,通过字词数据库对“投产明细”前的所有字符串“请各位抽空填一下X月版”进行解析。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成方法,先通过文档类型集合匹配搜索到文档类型字符串,再对文档类型字符串前的文本进行解析,无需对文档需求信息中的每个文本进行解析,简化了语义解析的工作流程,能够满足多种格式的文档需求信息的语义解析。
为了进一步提高文档需求信息解析的准确性,在本申请提供的程序开发中文档自动生成方法的一个实施例中,提供一种语义解析的优选方式,在所述程序开发中文档自动生成方法中的步骤2102具体包含有如下内容:
步骤2121:提取位于所述文档类型字符串前两个字符长度的字符串作为当前第一待处理字符串。
步骤2122:结合字词数据库查找所述第一待处理字符串,若所述第一待处理字符串仅有唯一词性,则执行第一操作;
所述第一操作包括:将所述第一待处理字符串归集到对应词性集合,其中,若所述第一待处理字符串唯一词性为动词属性,则将所述第一待处理字符串归集至谓语字符串集合,若所述第一待处理字符串唯一词性为名词或代词属性,则将所述第一待处理字符串归集为主语字符串集合。
步骤2123:清空当前待处理字符串。
步骤2124:提取位于所述第一待处理字符串前两个字符长度的字符串作为当前第二待处理字符串。
步骤2125:结合字词数据库查找所述第二待处理字符串。
步骤2126:若所述第一待处理字符串包括多个词性或无词性,则执行第二操作;
所述第二操作包括:将位于所述第一待处理字符串前一个字符长度的字符串以及所述第一待处理字符串作为第三待处理字符串。
步骤2127:结合字词数据库查找所述第三待处理字符串。
步骤2128:若所述第三待处理字符串仅有唯一词性,则执行第一操作。
步骤2129:若所述第三待处理字符串无词性,则执行第三操作;
所述第三操作包括:将所述第一待处理字符串归集至定语或状语字符串集合,并将所述第一待处理字符串从当前待处理字符串中删除;
步骤21210:选取所述第三待处理字符串中剩余字符串作为当前待处理字符串。
步骤21211:重复上述操作,直至所述文档类型字符串前所处位置前的所有字符串均完成词性查询。
可以理解的是,对每个符合要求的文档需求信息,查找其正文中匹配“文档类型集合”的文本;若匹配到一段文本,则以该段文本的位置回溯一个字符到当前处理字符串;使用当前处理字符串,查找“字词数据库”中对应名称的字词记录;若记录仅有动词属性,则将当前处理字符串加入到“谓语字符串集合”中,清空当前字符串,回溯一个字符到当前处理字符串,并使用当前字符串继续执行查询操作,否则继续往前回溯取一个字符加入到当前处理字符串前方,并使用当前字符串继续执行查询操作;若查找不到记录,则将上一字符串加入到“定语/状语字符串集合”,并将其从当前处理字符串后方删除,并使用当前字符串继续执行查询操作;若记录仅有名词或代词属性,则将当前处理字符串加入到“主语字符串集合”中,清空当前字符串,并执行“文档类型集合”匹配操作;否则继续往前回溯取一个字符加入到当前处理字符串前方,并使用当前字符串继续执行查询操作。
下面结合具体实施例对文档需求信息的语义解析进行具体说明。
若一字词数据库包括如下字词记录:
<字词记录>
<名称>版</名称>
<意义 词性="名词">筑土墙用的夹板</意义>
<意义 词性="名词">
印刷用的底子,上有文字或图形,过去用木板、金属板,现多用胶片
</意义>
<意义 词性="名词">照相的底片</意义>
<意义 词性="量词">
书籍排印一次为一版,一版可以包括多次印刷
</意义>
<意义词性="量词">报纸的一个版面为一版</意义>
</字词记录>
<字词记录>
<名称>月</名称>
<意义 词性="名词">月亮;月球</意义>
<意义 词性="名词">计时单位,一年分为十二个月</意义>
<意义 词性="形容词">形状像月亮那样圆的</意义>
</字词记录>
<字词记录>
<名称>下</名称>
<意义词性="名词">低处;底部(跟“上”相对)</意义>
……
<意义词性="形容词">处于低处的</意义>
<意义词性="动词">低于;少于(常用于否定)</意义>
……
<意义词性="量词">用于器物的放入量</意义>
……
</字词记录>
<字词记录>
<名称>一下</名称>
<意义 词性="副词">表示动作突然或短暂</意义>
<意义 词性="副词">用在动词后,有试着做或略微的意思</意义>
</字词记录>
<字词记录>
<名称>填</名称>
<意义 词性="动词">把低洼凹陷的地方填平;把空缺的地方塞满</意义>
<意义 词性="动词">补充</意义>
<意义 词性="动词">填写</意义>
</字词记录>
<字词记录>
<名称>空</名称>
<意义 词性="形容词">里面没有东西</意义>
<意义 词性="形容词">内容浮泛,不切实际</意义>
<意义 词性="名词">天空</意义>
<意义 词性="动词">无;没有</意义>
<意义 词性="副词">白白地;徒然</意义>
</字词记录>
<字词记录>
<名称>抽空</名称>
<意义词性="动词">从繁忙中挤出时间(做其它事)</意义>
</字词记录>
<字词记录>
<名称>位</名称>
<意义词性="名词">位置,所在的地方</意义>
……
<意义词性="量词">用于人(含敬意)</意义>
</字词记录>
文档需求信息正文如下:“请各位抽空填一下X月版投产明细,模板如下:”
则通过“文档类型集合”匹配搜索到“投产明”,然后往前回溯一个字符;
当前处理的字符串为“版”,查找“字词数据库”中对应名称的字词记录,发现“版”没有动词词性,则继续往前回溯取一个字符;
当前处理字符串为“月版”,在“字词数据库”中查找不到记录,则将上一字符串放入“定语/状语字符串集合”,并从当前处理字符串中删除;
当前处理字符串为“月”,查找“字词数据库”中对应名称的字词记录,发现其不是仅有动词词性,因此继续往前回溯取一个字符;
当前处理字符串为“X月”,在“字词数据库”中查找不到记录,则将上一字符串放入“定语/状语字符串集合”,并从当前处理字符串中删除;
当前处理字符串为“X”,查找“字词数据库”中对应名称的字词记录,发现其不是仅有动词词性,因此继续往前回溯取一个字符;
当期处理字符串为“下X”,在“字词数据库”中查找不到记录,则将上一字符串放入“定语/状语字符串集合”,并从当前处理字符串中删除;
当前处理字符串为“下”,查找“字词数据库”中对应名称的字词记录,发现其不是仅有动词词性,于是再往前回溯一个字符;
当前处理字符串为“一下”,查找“字词数据库”中对应名称的字词记录,发现其仅有副词属性,于是将其放入到“定语/状语字符串集合”中,清空当前处理字符串,继续往前回溯取一个字符;
当前处理字符串为“填”,查找“字词数据库”中对应名称的字词记录,发现其仅有动词属性,于是将其放入到“谓语字符串集合”中,清空当前处理字符串,并继续往前回溯取一个字符;
当前处理字符串为“空”,查找“字词数据库”中对应名称的字词记录,发现其不仅有名词或代词属性,于是继续回溯一个字符;
当前处理字符串为“抽空”,查找“字词数据库”中对应名称的字词记录,发现其没有名词和代词词性,于是继续回溯一个字符;
当前处理字符串为“位抽空”,在“字词数据库”中查找不到记录,则将上一字符串放入“定语/状语字符串集合”,并从当前处理字符串中删除;
当前处理字符串为“位”,查找“字词数据库”中对应名称的字词记录,发现其不仅有名词或代词词性,于是继续回溯一个字符;
当前处理字符串为“各位”,查找“字词数据库”中对应名称的字词记录,发现其仅有代词词性,于是将其放入到“主语字符串集合”中,结束本邮件的处理;
该轮针对一个邮件的处理循环后,上述三个语集为:
主语集合:“各位”
谓语集合:“填”
定语/状语集合:“抽空|一下|X|月|版”。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成方法,结合字词数据库对文档需求信息的正文部分进行解析,根据每个文本的词性对文档需求信息的正文中的所有文本进行分类,进一步提高了文本语义解析的准确性。
为了进一步提高文档需求信息获取的准确性,在本申请提供的程序开发中文档自动生成方法的一个实施例中,提供一种信息获取的优选方式,参见图3,在所述程序开发中文档自动生成方法中的步骤100具体包含有如下内容:
步骤110:结合预设的信息过滤规则集合对理人员发送的信息进行匹配。
步骤111:若所述信息符合所述信息过滤规则集合,则将所述信息归集为文档需求信息。
可以理解的是,定期调用现有信息获取接口,产科是否有新的信息,若有新的信息,则调用信息过滤规则集合对信息进行匹配筛选,将符合信息过滤规则集合的信息归集为文档需求信息。信息过滤规则集合通过对本地信息数据库的人工分析,将大部分有梳理要求的信息的特征,撰写成脚本文件的形式类似以下格式的脚本文件:(({$主题}或{$正文})匹配“.*(梳理|整理|……).*”)且({$收件人}匹配“(管理|行政|经理|*.总|……).*”)。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成方法,在执行语义解析操作前,对所有获取的信息进行梳理筛选,提取出符合要求的信息,再对符合要求的信息进行处理,提高了文档需求信息获取效率。
为了进一步提高语义解析的效率,在本申请提供的程序开发中文档自动生成方法的一个实施例中,提供一种正则表达式的优选方式,在所述程序开发中文档自动生成方法中的步骤200具体包含有如下内容:
根据模板文档提取具有相同含义的文档表头名称,生成文档正则表达式。
可以理解的是,文档正则表达式通过属性近义词原则对外部规范文件和模板文件进行手工整理,获得具有相同意义的表头名称集合的正则表达式字符串,例如:“项目名(称)?”、“项目(编)?号”、“\w*(负责|修改)人”、“修改(点|内容|描述)”、“(涉及)?程序名(称)?”。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成方法,将属性相近的表头名称的正则表达式形成一个正则表达式字符串,使得在进行语义解析时,对一些属性相近的文本无需二次解析,提高了语义解析的效率。
为了进一步提高文档自动生成的准确性,在本申请提供的程序开发中文档自动生成方法的一个实施例中,提供一种文档自动生成的优选方式,参见图4,在所述程序开发中文档自动生成方法中的步骤300具体包含有如下内容:
步骤310:根据所述任务文档需求字符串确定任务文档模板。
步骤320:根据所述任务文档模板以及所述文档版本信息生成任务文档。
可以理解的是,根据任务文档需求字符串确定任务文档模板,若文档需求信息中上送的文档模板不为空,则使用上送的文档模板,否则根据任务文档需求字符串,到模板文件库中寻找对应的文档模板;根据文档模板生成任务文档。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成方法,根据文档需求信息中上送的文档模板或者是模板文件库中对应的文档模板,生成任务文档,能够完成各种类型的文档生成与转换,并且由于文档是由预设的规则生成,非手工处理,不会出现人工编写文档时出现笔误等的情况。
为了进一步提高文档自动生成的准确性,在本申请提供的程序开发中文档自动生成方法的一个实施例中,提供一种文档自动生成的优选方式,在所述程序开发中文档自动生成方法中的步骤320具体包含有如下内容:
步骤321:根据所述任务文档模板确定生成任务文档所需的文档内容信息。
步骤322:根据所述文档内容信息以及所述文档模板确定任务文档内容。
步骤323:根据所述任务文档模板以及所述任务文档内容生成所述任务文档。
可以理解的是,解析文档模板中的需要填写的数据,通过html解析接口、xls解析接口或doc解析接口等工具,组织出需要返回的格式数据,该数据为一个树状数据结构,实际数据举例如下:
Figure BDA0003130942500000171
根据格式数据的结构,新建一个文档;遍历格式数据的叶子节点,对于每个叶子节点,进行以下处理:根据叶子节点和版本信息生成数据请求,将获取到的数据填写到文档对应的位置中,生成任务文档,根据文档需求信息中的收件人信息,将任务文档返回至收件人。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成方法,采用树状数据结构,获取相应叶子节点中的数据,生成任务文档,避免出现文档数据错误的情况发生。
为了让开发人员从繁重的几乎与开发工作无关的文档整理工作中解放出来,转而可专心致志地进行研发的工作,本申请提供一种程序开发方法,参见图5,所述程序开发方法具体包含有如下内容:
步骤400:在程序开发过程中,获取管理人员通过一信息介质记载的文档需求信息,所述文档需求信息包括至少一个语句。
可以理解的是,管理人员通过一信息介质发送文档需求信息,所述信息介质可以是邮件、短信或文件,若文件为纸质文件,可以对纸质文件进行扫描,提取纸质文件中的文本内容为文档需求信息,文档需求信息至少包括一个有完整语义的语句。
步骤500:基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息。
步骤600:根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档。
步骤700:根据所述任务文档进行程序开发。
可以理解的是,通过简单的自然语言语法分析,从文档需求信息中获取生成任务文档所需的任务文档需求字符串以及文档版本信息,根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档,将任务文档发送给开发人员,开发人员根据任务文档进行后续的程序开发或修改。
从上述描述可知,本申请实施例提供的程序开发方法,根据现有开发出的代码和注释,以及现有技术生成的文档,并将生成出来的文档自动回复给研发人员,便于研发人员根据任务文档进行后续开发。
从软件层面来说,为了解决现有的同步代码和程序相关设计文档的方法往往会造成巨大的人力资源浪费,同时现有的文档生成器目前能生成的文档种类太少的问题,本申请提供一种用于执行所述程序开发中文档自动生成方法中全部或部分内容的程序开发中文档自动生成系统的实施例,参见图6,所述程序开发中文档自动生成系统具体包含有如下内容:
信息获取模块100:在程序开发过程中,获取管理人员通过一信息介质记载的文档需求信息,所述文档需求信息包括至少一个语句。
可以理解的是,信息获取模块100获取管理人员通过一信息介质发送文档需求信息,所述信息介质可以是邮件、短信或文件,若文件为纸质文件,可以对纸质文件进行扫描,提取纸质文件中的文本内容为文档需求信息,文档需求信息至少包括一个有完整语义的语句。
语义解析模块200:基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息。
文档生成模块300:根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成系统,系统获取管理人员通过一信息介质记载的文档需求信息;基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息;根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档;通过简单的自然语言语法分析得到生成任务文档所需的信息,并根据解析出来的信息执行文档生成操作,实现了文档生成与转换的自动化,并且由于文档是根据预设的规则生成,非手工处理,不会出现人工编写文档时出现笔误等的情况。
为了进一步提高文档需求信息解析的多样性,在本申请提供的程序开发中文档自动生成系统的一个实施例中,提供一种语义解析的优选方式,参见图7,在所述程序开发中文档自动生成系统中语义解析模块200具体包括如下内容:
语义解析单元210:结合预设的字词数据库以及文档类型集合对所述任务文档生成语义进行解析,得到任务文档需求字符串。
字符串解析单元220:结合文档版本正则表达式对所述任务文档需求字符串进行解析,得到文档版本信息。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成系统,通过字词数据库和文档类型集合对文档需求信息中的主题和正文进行解析,得到生成任务文档所需的文档版本信息和任务文档需求字符串,该语义解析对文档需求信息的格式要求较低,能够解析多种格式的文档需求信息。
为了进一步提高文档需求信息解析的准确性,在本申请提供的程序开发中文档自动生成系统的一个实施例中,提供一种任务文档需求字符串解析的优选方式,所述任务文档需求字符串包括主语字符串集合、宾语字符串集合以及定语或状语字符串集合,在所述程序开发中文档自动生成系统中的语义解析单元210具体包含有如下内容:
文档类型子单元211:根据所述文档类型集合对所述任务文档生成语义进行解析,得到文档类型字符串。
词性解析子单元212:根据所述字词数据库对位于所述文档类型字符串前的所有文本进行解析,得到主语字符串集合、宾语字符串集合以及定语和/或状语字符串集合。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成系统,先通过文档类型集合匹配搜索到文档类型字符串,再对文档类型字符串前的文本进行解析,无需对文档需求信息中的每个文本进行解析,简化了语义解析的工作流程,能够满足多种格式的文档需求信息的语义解析。
为了进一步提高文档需求信息获取的准确性,在本申请提供的程序开发中文档自动生成系统的一个实施例中,提供一种信息获取的优选方式,在所述程序开发中文档自动生成系统中的信息获取模块100具体包含有如下内容:
信息匹配单元110:结合预设的信息过滤规则集合对理人员发送的信息进行匹配;
信息筛选单元120:若所述信息符合所述信息过滤规则集合,则将所述信息归集为文档需求信息。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成系统,将属性相近的表头名称的正则表达式形成一个正则表达式字符串,使得在进行语义解析时,对一些属性相近的文本无需二次解析,提高了语义解析的效率。
为了进一步提高文档自动生成的准确性,在本申请提供的程序开发中文档自动生成系统的一个实施例中,提供一种文档自动生成的优选方式,参见图8,在所述程序开发中文档自动生成系统中的文档生成模块300具体包含有如下内容:
模板选取单元310:根据所述文档类型信息确定任务文档模板;
文档生成单元320:根据所述任务文档模板以及所述文档版本信息生成任务文档。
可以理解的是,模板选取单元310根据任务文档需求字符串确定任务文档模板,若文档需求信息中上送的文档模板不为空,则使用上送的文档模板,否则根据任务文档需求字符串,到模板文件库中寻找对应的文档模板;文档生成单元320:根据文档模板生成任务文档。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成系统,根据文档需求信息中上送的文档模板或者是模板文件库中对应的文档模板,生成任务文档,能够完成各种类型的文档生成与转换,并且由于文档是由预设的规则生成,非手工处理,不会出现人工编写文档时出现笔误等的情况。
为了进一步提高文档自动生成的准确性,在本申请提供的程序开发中文档自动生成系统的一个实施例中,提供一种文档自动生成的优选方式,在所述程序开发中文档自动生成系统中的文档生成单元320具体包含有如下内容:
模板解析子单元321:根据所述任务文档模板确定生成任务文档所需的文档内容信息。
文档内容获取子单元322:根据所述文档内容信息以及所述文档模板确定任务文档内容。
文档生成子单元323:根据所述任务文档模板以及所述任务文档内容生成所述任务文档。
从上述描述可知,本申请实施例提供的程序开发中文档自动生成系统,采用树状数据结构,获取相应叶子节点中的数据,生成任务文档,避免出现文档数据错误的情况发生。
为了让开发人员从繁重的几乎与开发工作无关的文档整理工作中解放出来,转而可专心致志地进行研发的工作,本申请提供一种程序开发系统,参见图9,所述程序开发系统具体包含有如下内容:
文档自动生成模块400:所述文档自动生成模块根据文档需求信息生成对应的任务文档;
程序开发模块500:根据所述任务文档进行程序开发。
可以理解的是,文档自动生成模块400通过简单的自然语言语法分析,从文档需求信息中获取生成任务文档所需的任务文档需求字符串以及文档版本信息,根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档,程序开发模块500将任务文档发送给开发人员,开发人员根据任务文档进行后续的程序开发或修改。
从上述描述可知,本申请实施例提供的程序开发系统,根据现有开发出的代码和注释,以及现有技术生成的文档,并将生成出来的文档自动回复给研发人员,便于研发人员根据任务文档进行后续开发。
从硬件层面来说,为了解决现有的同步代码和程序相关设计文档的方法往往会造成巨大的人力资源浪费,同时现有的文档生成器目前能生成的文档种类太少的问题,本申请提供一种用于实现所述程序开发中文档自动生成方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包含有如下内容:
图10为本申请实施例的电子设备9600的系统构成的示意框图。如图10所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图10是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
在一实施例中,程序开发中文档自动生成功能可以被集成到中央处理器中。其中,中央处理器可以被配置为进行如下控制:
步骤100:在程序开发过程中,获取管理人员通过一信息介质记载的文档需求信息,所述文档需求信息包括至少一个语句。
步骤200:基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息。
步骤300:根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档。
从上述描述可知,本申请实施例提供的电子设备,获取管理人员通过一信息介质记载的文档需求信息;基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息;根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档;通过简单的自然语言语法分析得到生成任务文档所需的信息,并根据解析出来的信息执行文档生成操作,实现了文档生成与转换的自动化,并且由于文档是根据预设的规则生成,非手工处理,不会出现人工编写文档时出现笔误等的情况。
在另一个实施方式中,程序开发中文档自动生成系统可以与中央处理器9100分开配置,例如可以将程序开发中文档自动生成系统配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现程序开发中文档自动生成功能。
如图10所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图10中所示的所有部件;此外,电子设备9600还可以包括图10中没有示出的部件,可以参考现有技术。
如图10所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器9140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
本申请的实施例还提供能够实现上述实施例中的程序开发中文档自动生成方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的程序开发中文档自动生成方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤100:在程序开发过程中,获取管理人员通过一信息介质记载的文档需求信息,所述文档需求信息包括至少一个语句。
步骤200:基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息。
步骤300:根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档。
从上述描述可知,本申请实施例提供的计算机可读介质,获取管理人员通过一信息介质记载的文档需求信息;基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息;根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档;通过简单的自然语言语法分析得到生成任务文档所需的信息,并根据解析出来的信息执行文档生成操作,实现了文档生成与转换的自动化,并且由于文档是根据预设的规则生成,非手工处理,不会出现人工编写文档时出现笔误等的情况。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序语义实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序语义到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的语义产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序语义也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的语义产生包括语义装置的制造品,该语义装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序语义也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的语义提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (19)

1.一种程序开发中文档自动生成方法,其特征在于,包括:
在程序开发过程中,获取管理人员通过一信息介质记载的文档需求信息,所述文档需求信息包括至少一个语句;
基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息;
根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档。
2.根据权利要求1所述的程序开发中文档自动生成方法,其特征在于,所述基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息,包括:
结合预设的字词数据库以及文档类型集合对所述文档需求信息进行解析,得到任务文档需求字符串;
结合文档版本正则表达式对所述任务文档需求字符串进行解析,得到文档版本信息。
3.根据权利要求2所述的程序开发中文档自动生成方法,其特征在于,所述任务文档需求字符串包括主语字符串集合、宾语字符串集合以及定语或状语字符串集合,所述结合预设的字词数据库以及文档类型集合对所述文档需求信息进行解析,得到任务文档需求字符串,包括:
根据所述文档类型集合对所述任务文档生成语义进行解析,得到文档类型字符串;
根据所述字词数据库对位于所述文档类型字符串前的所有文本进行解析,得到主语字符串集合、宾语字符串集合以及定语或状语字符串集合。
4.根据权利要求3所述的程序开发中文档自动生成方法,其特征在于,所述根据所述字词数据库对位于所述文档类型字符串前的所有文本进行解析,得到主语字符串集合、宾语字符串集合以及定语或状语字符串集合,包括:
提取位于所述文档类型字符串前两个字符长度的字符串作为当前第一待处理字符串;
结合字词数据库查找所述第一待处理字符串,若所述第一待处理字符串仅有唯一词性,则执行第一操作;
所述第一操作包括:将所述第一待处理字符串归集到对应词性集合,其中,若所述第一待处理字符串唯一词性为动词属性,则将所述第一待处理字符串归集至谓语字符串集合,若所述第一待处理字符串唯一词性为名词或代词属性,则将所述第一待处理字符串归集为主语字符串集合;
清空当前待处理字符串;
提取位于所述第一待处理字符串前两个字符长度的字符串作为当前第二待处理字符串;
结合字词数据库查找所述第二待处理字符串
若所述第一待处理字符串包括多个词性或无词性,则执行第二操作;
所述第二操作包括:将位于所述第一待处理字符串前一个字符长度的字符串以及所述第一待处理字符串作为第三待处理字符串;
结合字词数据库查找所述第三待处理字符串;
若所述第三待处理字符串仅有唯一词性,则执行第一操作;
若所述第三待处理字符串无词性,则执行第三操作;
所述第三操作包括:将所述第一待处理字符串归集至定语或状语字符串集合,并将所述第一待处理字符串从当前待处理字符串中删除;
选取所述第三待处理字符串中剩余字符串作为当前待处理字符串;
重复上述操作,直至所述文档类型字符串前所处位置前的所有字符串均完成词性查询。
5.根据权利要求1所述的程序开发中文档自动生成方法,其特征在于,所述获取管理人员通过一信息介质记载的文档需求信息,包括:
结合预设的信息过滤规则集合对理人员发送的信息进行匹配;
若所述信息符合所述信息过滤规则集合,则将所述信息归集为文档需求信息。
6.根据权利要求2所述的程序开发中文档自动生成方法,其特征在于,所述基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息,还包括:
根据模板文档提取具有相同含义的文档表头名称,生成文档正则表达式。
7.根据权利要求1所述的程序开发中文档自动生成方法,其特征在于,所述根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档,包括:
根据所述任务文档需求字符串确定任务文档模板;
根据所述任务文档模板以及所述文档版本信息生成任务文档。
8.根据权利要求7所述的程序开发中文档自动生成方法,其特征在于,所述根据所述任务文档模板以及所述文档版本信息生成任务文档,包括:
根据所述任务文档模板确定生成任务文档所需的文档内容信息;
根据所述文档内容信息以及所述文档模板确定任务文档内容;
根据所述任务文档模板以及所述任务文档内容生成所述任务文档。
9.一种程序开发方法,其特征在于,包括:
在程序开发过程中,获取管理人员通过一信息介质记载的文档需求信息,所述文档需求信息包括至少一个语句;
基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息;
根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档;
根据所述任务文档进行程序开发。
10.一种程序开发中文档自动生成系统,其特征在于,包括:
信息获取模块:在程序开发过程中,获取管理人员通过一信息介质记载的文档需求信息,所述文档需求信息包括至少一个语句;
语义解析模块:基于语义解析所述文档需求信息得到任务文档需求字符串以及文档版本信息;
文档生成模块:根据所述任务文档需求字符串以及所述文档版本信息生成对应的任务文档。
11.根据权利要求10所述的程序开发中文档自动生成系统,其特征在于,所述语义解析模块包括:
语义解析单元:结合预设的字词数据库以及文档类型集合对所述任务文档生成语义进行解析,得到任务文档需求字符串;
字符串解析单元:结合文档版本正则表达式对所述任务文档需求字符串进行解析,得到文档版本信息。
12.根据权利要求11所述的程序开发中文档自动生成系统,其特征在于,所述任务文档需求字符串包括主语字符串集合、宾语字符串集合以及定语或状语字符串集合,所述语义解析单元包括:
文档类型子单元:根据所述文档类型集合对所述任务文档生成语义进行解析,得到文档类型字符串;
词性解析子单元:根据所述字词数据库对位于所述文档类型字符串前的所有文本进行解析,得到主语字符串集合、宾语字符串集合以及定语和/或状语字符串集合。
13.根据权利要求10所述的程序开发中文档自动生成系统,其特征在于,所述信息获取模块包括:
信息匹配单元:结合预设的信息过滤规则集合对理人员发送的信息进行匹配;
信息筛选单元:若所述信息符合所述信息过滤规则集合,则将所述信息归集为文档需求信息。
14.根据权利要求11所述的程序开发中文档自动生成系统,其特征在于,所述语义解析模块还包括:
属性近义词集合:根据模板文档提取具有相同含义的文档表头名称,生成文档正则表达式。
15.根据权利要求10所述的程序开发中文档自动生成系统,其特征在于,所述文档生成模块包括:
模板选取单元:根据所述文档类型信息确定任务文档模板;
文档生成单元:根据所述任务文档模板以及所述文档版本信息生成任务文档。
16.根据权利要求11所述的程序开发中文档自动生成系统,其特征在于,所述文档生成单元包括:
模板解析子单元:根据所述任务文档模板确定生成任务文档所需的文档内容信息;
文档内容获取子单元:根据所述文档内容信息以及所述文档模板确定任务文档内容;
文档生成子单元:根据所述任务文档模板以及所述任务文档内容生成所述任务文档。
17.一种程序开发系统,其特征在于,包括:
文档自动生成模块:所述文档自动生成模块根据文档需求信息生成对应的任务文档;
程序开发模块:根据所述任务文档进行程序开发。
18.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至8任一项所述的程序开发中文档自动生成方法。
19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至8任一项所述的程序开发中文档自动生成方法。
CN202110705301.4A 2021-06-24 2021-06-24 一种程序开发中文档自动生成方法及系统 Pending CN113448544A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110705301.4A CN113448544A (zh) 2021-06-24 2021-06-24 一种程序开发中文档自动生成方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110705301.4A CN113448544A (zh) 2021-06-24 2021-06-24 一种程序开发中文档自动生成方法及系统

Publications (1)

Publication Number Publication Date
CN113448544A true CN113448544A (zh) 2021-09-28

Family

ID=77812464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110705301.4A Pending CN113448544A (zh) 2021-06-24 2021-06-24 一种程序开发中文档自动生成方法及系统

Country Status (1)

Country Link
CN (1) CN113448544A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115086206A (zh) * 2022-06-14 2022-09-20 工银科技有限公司 一种客户端软件调试方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115086206A (zh) * 2022-06-14 2022-09-20 工银科技有限公司 一种客户端软件调试方法和装置

Similar Documents

Publication Publication Date Title
JP5247983B2 (ja) アクション可能な電子メールドキュメント
Wiltshier Researching with NVivo
US8074202B2 (en) WIKI application development tool that uses specialized blogs to publish WIKI development content in an organized/searchable fashion
CN101334774A (zh) 一种字符输入的方法和输入法系统
CN102362277A (zh) 用于应用的可共享的分发的词典
JP2020191075A (ja) Web APIおよび関連エンドポイントの推薦
JP2022031625A (ja) 情報をプッシュするための方法および装置、電子機器、記憶媒体並びにコンピュータプログラム
US20190095803A1 (en) Intelligent inferences of authoring from document layout and formatting
KR102436549B1 (ko) 딥러닝을 이용한 자연어처리 기반의 faq 및 챗봇을 위한 학습데이터를 자동으로 생성하기 위한 방법 및 이를 위한 장치
CN113779062A (zh) Sql语句生成方法、装置、存储介质及电子设备
CN112579733A (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
JP2004310691A (ja) 文章情報処理装置
CN113448544A (zh) 一种程序开发中文档自动生成方法及系统
CN111933128B (zh) 调查问卷的题库的处理方法、装置、电子设备
CN117370242A (zh) 通过解析接口文档生成多语言sdk客户端的适配器和方法
WO2023007791A1 (ja) プログラムコード自動生成システム
CN111831624A (zh) 数据表创建方法、装置、计算机设备及存储介质
JP2014229275A (ja) 質問応答装置、及び質問応答方法
CN101089841B (zh) 基于知识编码的精确搜索方法和系统
CN115374764A (zh) 一种基于用户故事的需求模型自动生成方法及系统
CN114968917A (zh) 一种文件数据快速导入方法及装置
CN109891410A (zh) 用于新的会话对话系统的数据收集
JP2022190776A (ja) プログラムコード自動生成システム
CN111783465A (zh) 一种命名实体归一化方法、系统及相关装置
Hockey The rendering of humanities information in a digital context: Current trends and future developments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination