发明内容
本发明的目的在于提出一种基于自然语言处理的语义化服务接口自动设计方法与系统,语义化的设计方法能够扩展服务接口的描述能力,提高服务接口的可理解性和日志的可读性,使研发人员在软件开发过程中能够更有效的沟通与协作。为实现本发明的目的,采用以下方案:
第一方面,本发明提出一种基于自然语言处理的语义化服务接口自动设计方法,所述方法包括以下步骤:
建立软件系统功能需求说明的第一文件;
构建算法模型一,用于读取第一文件并根据其特征输出需求关键词和关键词间的关联关系作为第二文件;
构建算法模型二,用于将第二文件的语言转换为编码阶段使用的语言种类得到第三文件;
根据一般语义理解习惯建立服务接口定义范式一;
建立主程序一,用于耦接算法模型一和算法模型二,进行流水线处理自动生成符合范式一的语义化服务接口。
进一步的改进在于,建立第一文件的具体方法包括:
建立词汇集合一,其元素为可以在多种业务领域重用的规范化词汇;
建立词汇集合二,其元素为针对一特定业务领域的规范化词汇;
对软件系统需求进行调研和采集,根据调研和采集的结果、集合一和集合二建立软件系统功能需求说明的第一文件。
进一步的改进在于,所述第一文件使用集合一和集合二中的规范化词汇,并使用一般语法进行词汇组织,第一文件可按照一般的语言含义、语法规则被一般人理解,所述第二文件与第一文件使用相同语言种类,所述第二文件可由经过专业训练的研发人员理解,若编码阶段使用的语言种类与第二文件的语言种类相同,则第三文件与第二文件等价,将第二文件直接作为第三文件。
进一步的改进在于,所述第二文件还包括对业务实体的一具体操作,以及由一系列业务实体操作按一定次序组合而成的业务流程;一具体操作包括查询列表数据、查询详细数据、添加/创建数据、更新/修改数据、删除数据。
进一步的改进在于,所述服务接口定义范式一至少包括接口版本定义、接口场景定义、接口实体定义、接口操作定义、接口参数定义、接口返回值定义中的一种或多种。
进一步的改进在于,所述接口版本定义的方法包括:采用VX.Y的格式定义和区分服务接口版本,其中V表示版本,X和Y均为递增的非负整数,X代表的是主版本号,Y代表的是特征版本号,以X主版本号的增加表示一服务接口新增一功能模块,以Y特征版本号的增加表示对已有功能模块的一改进或新增一特性。
进一步的改进在于,所述接口场景定义的方法至少包括采用根据客户端设备类型定义法、根据业务场景定义法、根据服务权限定义法之一,针对不同的方法列举所有可能的接口场景以提供给主程序一使用。
第二方面,本发明提出一种基于自然语言处理的语义化服务接口自动设计系统,利用如第一方面中任意一项所述的一种基于自然语言处理的语义化服务接口自动设计方法,所述系统包括:
第一建立模块,配置为用于建立软件系统功能需求说明的第一文件;
算法模型一构建模块,配置为用于构建算法模型一,用于读取第一文件并根据其特征输出需求关键词和关键词间的关联关系作为第二文件;
算法模型二构建模块,配置为用于构建算法模型二,用于将第二文件的语言转换为编码阶段使用的语言种类得到第三文件;
定义范式建立模块,配置为用于根据一般语义理解习惯建立服务接口定义范式一;
主程序建立模块,配置为用于建立主程序一,用于耦接算法模型一和算法模型二,进行流水线处理自动生成符合范式一的语义化服务接口。
第三方面,本发明提出一种终端设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现第一方面中任意一项所述的一种基于自然语言处理的语义化服务接口自动设计方法的步骤。
第四方面,本发明提出一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如第一方面中任意一项所述的一种基于自然语言处理的语义化服务接口自动设计方法的步骤。
本发明的有益效果:
本发明提出的一种基于自然语言处理的语义化服务接口自动设计方法是基于自然语言处理的语义化服务接口自动设计方法,增强了服务接口的描述能力,能够有效避免设计服务接口时沿用固化的设计原则而导致的问题,从而提高研发人员对业务的理解与合作中的沟通效率。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
请参考附图1-4,如图1、图2、图3所示,为本发明第一方面的实施例提供的一种基于自然语言处理的语义化服务接口自动设计方法的流程图,作为示例而非限定,该方法包括:
步骤S1:建立软件系统功能需求说明的第一文件;
步骤S2:构建算法模型一,所述算法模型一为关键词提取和关联分析算法模型,用于读取第一文件并根据其特征输出需求关键词(业务实体,Entity)和关键词间的关联关系(业务实体关系,Entity-Relationship)作为第二文件;
步骤S3:构建算法模型二,所述算法模型二为机器翻译算法模型,用于将第二文件的语言转换为编码阶段使用的语言种类得到第三文件;
步骤S4:根据一般语义理解习惯建立服务接口定义范式一;
步骤S5:建立主程序一,用于耦接算法模型一和算法模型二,进行流水线处理自动生成符合范式一的语义化服务接口。
具体地,在本发明实施例中,所述步骤S1中建立第一文件的具体方法包括:
步骤S11:建立词汇集合一,其元素为可以在多种业务领域重用的规范化词汇;
步骤S12:建立词汇集合二,其元素为针对一特定业务领域的规范化词汇;
步骤S13:对软件系统需求进行调研和采集,根据调研和采集的结果、集合一和集合二建立软件系统功能需求说明的第一文件。
在一些实施例中,所述词汇集合一和词汇集合二不存在次序上的先后关系,仅代表不同的规范化词汇集合。
在一些实施例中,所述调研和采集的方法包括人工调查问卷法、人工访谈法、基于语音识别的半自动方法,以及上述方法的组合方法等;形成第一文件的方法是通过人工撰写;所述第一文件为一特殊的基于自然语言的软件系统功能需求说明文件。
在一些实施例中,形成第一文件的方法还包括,将人工撰写的第一文件通过一计算机程序规范处理,以提高第一文件的规范程度。
在一些实施例中,所述算法模型一和所述算法模型二均采用自然语言处理技术构建。
在一些实施例中,建立算法模型一和算法模型二的方法包括采用深度神经网络模型、图卷积神经网络模型、Transformer模型等。
在一些实施例中,建立词汇集合一和词汇集合二的方法包括:通过分词算法对使用自然语言记录的软件系统原始需求文件进行分词处理,得到通用需求名词、通用需求动词、业务领域名词、业务领域动词、业务领域场景描述词等词汇信息,进而选择通俗易懂、无歧义的词汇作为规范化词汇。
具体地,在本发明实施例中,所述第一文件使用集合一和集合二中的规范化词汇,并使用一般语法进行词汇组织,第一文件可按照一般的语言含义、语法规则被一般人理解,所述第二文件与第一文件使用相同语言种类,所述第二文件可由经过专业训练的研发人员理解,若编码阶段使用的语言种类与第二文件的语言种类相同,则第三文件与第二文件等价,将第二文件直接作为第三文件。
具体地,在本发明实施例中,所述第二文件还包括对业务实体的一具体操作,以及由一系列业务实体操作按一定次序组合而成的业务流程;一具体操作包括查询列表数据、查询详细数据、添加/创建数据、更新/修改数据、删除数据。
具体地,在本发明实施例中,所述服务接口定义范式一至少包括接口版本(Version)定义、接口场景(Scene)定义、接口实体(Entity)定义、接口操作(Action)定义、接口参数(Parameter)定义、接口返回值(Return-Value)定义中的一种或多种。
优选地,所述接口版本定义的方法包括:采用VX.Y的格式定义和区分服务接口版本,其中V表示英文单词Version版本,X和Y均为递增的非负整数,X代表的是主版本号,Y代表的是特征版本号,以X主版本号的增加表示一服务接口新增一功能模块,以Y特征版本号的增加表示对已有功能模块的一改进或新增一特性。
优选地,所述接口场景定义的方法至少包括采用根据客户端设备类型定义法、根据业务场景定义法、根据服务权限定义法之一,针对不同的方法列举所有可能的接口场景以提供给主程序一使用。
在一些实施例中,所述步骤S5生成的语义化服务接口格式如下:
/{Version}/{NameSpace}/{Entity}/{Action}[?Parameter]。
该格式还包括数据传输协议(Protocol)、访问域名(Domain)和端口(Port),如下:
Protocol://{Domain}[:Port]/{Version}/{NameSpace}/{Entity}/{Action}[?Parameter]。
在一些实施例中,主程序一安装并运行在计算机设备中;主程序一提供一用户接口以便程序用户操作和使用主程序一提供的功能;一用户接口面向不同的使用场景,包括图像用户接口、命令式用户接口、API式用户接口等。
本发明提出的一种基于自然语言处理的语义化服务接口自动设计方法是基于自然语言处理的语义化服务接口自动设计方法,增强了服务接口的描述能力,能够有效避免设计服务接口时沿用固化的设计原则而导致的问题,从而提高研发人员对业务的理解与合作中的沟通效率。
本发明第二方面的实施例提出一种基于自然语言处理的语义化服务接口自动设计系统,利用如第一方面实施例中任意一项所述的一种基于自然语言处理的语义化服务接口自动设计方法,作为示例而非限定,与上述本发明第一方面的实施例提供的一种基于自然语言处理的语义化服务接口自动设计方法相对应,由于本发明实施例提供的一种基于自然语言处理的语义化服务接口自动设计系统与上述本发明第一方面的实施例提供的一种基于自然语言处理的语义化服务接口自动设计方法相对应,因此在前述一种基于自然语言处理的语义化服务接口自动设计方法的实施方式也适用于本实施例提供的一种基于自然语言处理的语义化服务接口自动设计系统,在本实施例中不再详细描述。如图4所示,所述系统包括:
第一建立模块,配置为用于建立软件系统功能需求说明的第一文件;
算法模型一构建模块,配置为用于构建算法模型一,用于读取第一文件并根据其特征输出需求关键词和关键词间的关联关系作为第二文件;
算法模型二构建模块,配置为用于构建算法模型二,用于将第二文件的语言转换为编码阶段使用的语言种类得到第三文件;
定义范式建立模块,配置为用于根据一般语义理解习惯建立服务接口定义范式一;
主程序建立模块,配置为用于建立主程序一,用于耦接算法模型一和算法模型二,进行流水线处理自动生成符合范式一的语义化服务接口。
具体地,在本发明实施例中,所述第一建立模块具体包括:
第一建立单元:配置为用于建立词汇集合一,其元素为可以在多种业务领域重用的规范化词汇;
第二建立单元:配置为用于建立词汇集合二,其元素为针对一特定业务领域的规范化词汇;
第三建立单元:配置为用于对软件系统需求进行调研和采集的结果、集合一和集合二建立软件系统功能需求说明的第一文件。
本发明第三方面实施例提出一种终端设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现第一方面实施例中任意一项所述的一种基于自然语言处理的语义化服务接口自动设计方法的步骤。
本发明第四方面实施例提出一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如第一方面实施例中任意一项所述的一种基于自然语言处理的语义化服务接口自动设计方法的步骤。
本申请所述的终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备还可以包括更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器可以是所述终端设备的内部存储单元,例如终端设备的硬盘或内存。所述存储器也可以是所述终端设备的外部存储设备,例如所述终端设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)等等。进一步地,所述存储器还可以既包括所述终端设备的内部存储单元也包括外部存储设备。所述存储器用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccessMemory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。