CN110532487B - 标签的生成方法及装置 - Google Patents
标签的生成方法及装置 Download PDFInfo
- Publication number
- CN110532487B CN110532487B CN201910856301.7A CN201910856301A CN110532487B CN 110532487 B CN110532487 B CN 110532487B CN 201910856301 A CN201910856301 A CN 201910856301A CN 110532487 B CN110532487 B CN 110532487B
- Authority
- CN
- China
- Prior art keywords
- keywords
- description information
- calculation
- function
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9562—Bookmark management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Stored Programmes (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例提供一种标签的生成方法及装置,涉及计算机网络领域,具体包括:接收用户输入的标签描述信息;根据自然语言处理NLP方法,将标签描述信息转换为标签引擎系统可识别的多个关键词;根据多个关键词与计算函数元信息,得到多个关键词对应的计算函数,计算函数元信息中包括关键词的描述信息;根据多个关键词对应的计算函数的逻辑关系,生成工作流;执行工作流,生成标签,即用户只需要输入标签描述信息,本申请实施例就可以自动为用户生成需要的标签,生成标签的方式非常灵活。
Description
技术领域
本申请涉及计算机网络技术,尤其涉及一种标签的生成方法及装置。
背景技术
网络标签是一种互联网内容的组织方式,用于帮助人们描述和分类内容,便于后续的检索和分享。
已有的标签引擎系统中主要通过以下几种方式生成标签:(1)将标签固化到系统中,用户只需要点击即可生成相应的标签,操作简单。但是有新的需求时,仍然需要开发人员生成该新的标签,不适用于更新频繁或者新需求比较多的场景。(2)自定义标签算子,用户可以通过界面拖拽的方式对标签算子进行操作,生成新的标签。该方式比较灵活,但仍需要技术人员操作,技术门槛较高。(3)将标签的计算过程模板化,相似的标签用相同的标签模板生成。该方式需要人工将标签归属到某个标签模板。
已有的标签生成方式,需要专业人员操作,且灵活性差。
发明内容
本申请实施例提供一种标签的生成方法及装置,以解决现有技术中标签生成灵活性差的技术问题。
本申请实施例第一方面提供一种标签的生成方法,包括:
接收用户输入的标签描述信息;
根据自然语言处理NLP方法,将所述标签描述信息转换为标签引擎系统可识别的多个关键词;
根据所述多个关键词与计算函数元信息,得到所述多个关键词对应的计算函数,所述计算函数元信息中包括关键词的描述信息,所述描述信息包括函数模板;
根据所述多个关键词对应的计算函数的逻辑关系,生成工作流;
执行所述工作流,生成标签。
本申请实施例中,用户希望设置自定义标签时,只需要输入标签描述信息,终端设备就可以结合自然语言处理技术,将标签描述转换为计算机可以识别的底层语言,自动生成标签,从而使得用户可以灵活的生成需要的标签。
可选的,所述根据所述多个关键词与计算函数元信息,得到所述多个关键词对应的计算函数,包括:
将每个关键词与所述计算函数元信息进行匹配,得到所述每个关键词对应的描述信息;
根据每个关键词与所述关键词的描述信息中的函数模板,得到所述多个关键词对应的计算函数。
可选的,所述多个关键词包括第一类关键词和第二类关键词,所述函数模板包括描述函数模板和计算函数模板,所述第一类关键词的描述信息中包括字段替换规则和所述描述函数模板,所述第二类关键词的描述信息中包括所述计算函数模板;所述根据每个关键词与所述关键词的描述信息中的函数模板,得到所述多个关键词对应的计算函数,包括:
根据所述字段替换规则对所述第一类关键词进行替换,得到所述第一类关键词的替换值;
将所述第一类关键词的替换值插入所述第一类关键词的描述函数模板,得到所述第一关键词的描述函数;
根据第二类关键词和所述第一类关键词的描述函数对所述第二类关键词对应的计算函数模板中的参数进行赋值,得到所述多个关键词对应的计算函数。
可选的,所述多个关键词包括:数据源所在的表,表的字段、字段替换条件以及操作;
所述数据源所在的表的描述信息包括表的描述函数模板、表的类型、表包括的字段和表的存储路径;
所述表的字段的描述信息,包括字段的含义、字段替换规则和字段的描述函数模板;
所述字段替换条件包括所述字段替换规则的描述函数模板;
所述操作的描述信息包括操作对应的计算函数模板。
可选的,所述根据所述多个关键词对应的计算函数的逻辑关系,生成工作流,包括:
根据所述多个关键词对应的计算函数的逻辑关系,生成包括计算逻辑的工作流,所述计算逻辑包括输入、计算和输出。
可选的,还包括:
配置所述计算函数元信息,所述计算函数元信息包括关键词与描述信息的映射关系。
可选的,所述根据自然语言处理NLP方法,将所述标签描述信息转换为标签引擎系统可识别的多个关键词,包括:
将所述标签描述信息输入基于NLP训练的自然语言处理模型中;
利用所述自然语言处理模型输出标签引擎系统可识别的多个关键词。
本申请实施例第二方面提供一种标签的生成装置,包括:
接收模块,用于接收用户输入的标签描述信息;
关键词得到模块,用于根据自然语言处理NLP方法,将所述标签描述信息转换为标签引擎系统可识别的多个关键词;
计算函数得到模块,用于根据所述多个关键词与计算函数元信息,得到所述多个关键词对应的计算函数,所述计算函数元信息中包括关键词的描述信息,所述描述信息包括函数模板;
工作流生成模块,用于根据所述多个关键词对应的计算函数的逻辑关系,生成工作流;
标签生成模块,用于执行所述工作流,生成标签。
可选的,所述计算函数得到模块包括:
计算函数得到子模块,用于将每个关键词与所述计算函数元信息进行匹配,得到所述每个关键词对应的描述信息;根据每个关键词与所述关键词的描述信息中的函数模板,得到所述多个关键词对应的计算函数。
可选的,所述多个关键词包括第一类关键词和第二类关键词,所述函数模板包括描述函数模板和计算函数模板,所述第一类关键词的描述信息中包括字段替换规则和所述描述函数模板,所述第二类关键词的描述信息中包括所述计算函数模板;所述计算函数得到子模块还用于:
根据所述字段替换规则对所述第一类关键词进行替换,得到所述第一类关键词的替换值;将所述第一类关键词的替换值插入所述第一类关键词的描述函数模板,得到所述第一关键词的描述函数;根据第二类关键词和所述第一类关键词的描述函数对所述第二类关键词对应的计算函数模板中的参数进行赋值,得到所述多个关键词对应的计算函数。
可选的,所述多个关键词包括:数据源所在的表,表的字段、字段替换条件以及操作;
所述数据源所在的表的描述信息包括表的描述函数模板、表的类型、表包括的字段和表的存储路径;
所述表的字段的描述信息,包括字段的含义、字段替换规则和字段的描述函数模板;
所述字段替换条件包括所述字段替换规则的描述函数模板;
所述操作的描述信息包括操作对应的计算函数模板。
可选的,所述工作流生成模块包括:
工作流生成子模块,用于根据所述多个关键词对应的计算函数的逻辑关系,生成包括计算逻辑的工作流,所述计算逻辑包括输入、计算和输出。
可选的,还包括:
配置模块,用于配置所述计算函数元信息,所述计算函数元信息包括关键词与描述信息的映射关系。
可选的,所述关键词得到模块包括:
关键词得到子模块,用于将所述标签描述信息输入基于NLP训练的自然语言处理模型中;利用所述自然语言处理模型输出标签引擎系统可识别的多个关键词。
本申请实施例第三方面提供一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如前述第一方面任一项所述的方法。
本申请实施例第四方面提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如前述第一方面中任一项所述的方法。
综上所述,本申请实施例相对于现有技术的有益效果:
本申请实施例中提供了一种标签的生成方法及装置,用户希望设置自定义标签时,只需要输入标签描述信息,终端设备就可以结合自然语言处理技术,将标签描述转换为计算机可以识别的底层语言,自动生成标签,从而使得用户可以灵活的生成需要的标签。具体的,本申请实施例的自动生成标签的实现为:接收用户输入的标签描述信息;根据自然语言处理NLP方法,将标签描述信息转换为标签引擎系统可识别的多个关键词;根据多个关键词与计算函数元信息,得到多个关键词对应的计算函数,计算函数元信息中包括关键词的描述信息;根据多个关键词对应的计算函数的逻辑关系,生成工作流;执行工作流,生成标签,即用户只需要输入标签描述信息,本申请实施例就可以自动为用户生成需要的标签,生成标签的方式非常灵活。
附图说明
图1为本申请实施例提供的标签的生成方法适应的应该用场景示意图;
图2为本申请实施例提供的标签的生成方法的流程示意图;
图3为本申请实施例提供的一用户界面示意图;
图4为本申请提供的标签的生成装置的装置实施例的结构示意图;
图5是用来实现本申请实施例的标签的生成方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
本申请实施例的标签的生成方法可以应用于终端,终端可以包括:手机、平板电脑、笔记本电脑、台式电脑或者服务器等电子设备。本申请实施例对应用的具体设备不作具体限定。
本申请实施例所描述的标签引擎系统可以是能够支持标签的生成、检索、标注等的系统,本申请实施例对标签引擎系统的具体形式不作限定。
本申请实施例所描述的计算函数元信息也可以称为meta,meta中维护有关键词和描述信息,描述信息具体可以是关键词的函数模板、关键词的类型、关键词的字段、关键词的存储路径、以及各关键词的字段之间的替换规则等,本申请实施例对描述信息不做具体限定。通过meta中的关键词的描述信息,可以得到关键词对应的计算函数。
本申请实施例所描述的计算函数可以是采用任意计算机语言所编写的用于计算的程序代码,本申请实施例对计算函数不作具体限定。
如图1所示,图1为本申请实施例提供的标签的生成方法所适用的应用场景架构示意图。
本申请实施例中,可以由用户在终端设备11中输入标签描述信息,则终端设备11可以根据自然语言处理(natural language processing,NLP)方法将标签描述信息转换为标签引擎系统可识别的多个关键词,然后终端设备11可以根据多个关键词与计算函数元信息,从服务器12或终端设备11本地得到该多个关键词对应的计算函数,该计算函数元信息中包括关键词的描述信息,该计算函数可以是预先存储在终端设备11中的,进一步的,终端设备11可以根据多个关键词对应的计算函数的逻辑关系,生成工作流,并执行工作流,生成标签,即用户只需要输入标签描述信息,本申请实施例就可以自动为用户生成需要的标签,生成标签的方式非常灵活。
可以理解,具体应用中,服务器的数量可以为大于或等于0的任意整数,在终端设备11从本地得到多个关键词对应的计算函数时,则终端设备11可以不与服务器进行交互,本申请实施例对此不作具体限定。
如图2所示,图2为本申请实施例提供的标签的生成方法的流程示意图。
该方法具体可以包括:
步骤S101:接收用户输入的标签描述信息。
本申请实施例的标签生成的方法具体可以应用于标签引擎系统中,在标签引擎系统中可以提供用户界面,在用户界面中可以设置用于接收用户输入的输入框,用户在输入框中输入标签描述信息后,标签系统可以接收到标签描述信息。
可选的,实际应用中,用户界面中也可以设置语音输入入口,用户可以通过语音输入入口以语音的形式输入标签描述信息的音频,则标签引擎系统可以进一步将该音频解析为系统能够识别的标签描述信息。
示例性的,如图3所示,示出了一种用户界面示意图,在终端的用户界面1101中,可以设置标签描述信息输入入口11011,用户可以在标签描述信息输入入口11011输入标签描述信息,可选的,在用户界面1101中还可以包括确认控件和修改控件,在用户点击确认控件后,终端设备可以接收到标签描述信息,在用户点击修改控件后,标签描述信息输入入口11011中的内容可以进入编辑状态,可以理解,用户界面可以根据实际的应用场景进行设定,本申请实施例对此不作具体限定。
可以理解,具体应用中,本领域技术人员还可以根据实际的应用场景采用其他的方式接收用户输入的标签描述信息,本申请实施例对此不作具体限定。
本申请实施例中,标签描述信息可以是用户根据需求任意输入的内容,本申请实施例对标签描述信息不做具体限定。
示例性的,假设用户希望生成常住人口中男性的人数,则标签描述信息可以为“计算出常住人口中,性别等于男性的人数之和”。
步骤S102:根据自然语言处理NLP方法,将所述标签描述信息转换为标签引擎系统可识别的多个关键词。
本申请实施例中,NLP技术是人工智能的一种较为成熟的语言处理算法,根据NLP方法可以将用户输入的标签描述信息转换为标签引擎系统可识别的多个关键词,本申请实施例对转换标签描述信息为标签引擎系统可识别的多个关键词的具体方式不作具体限定。
作为本申请实施例的一种可选实现方式,所述根据自然语言处理NLP方法,将所述标签描述信息转换为标签引擎系统可识别的多个关键词,包括:将所述标签描述信息输入基于NLP训练的自然语言处理模型中;利用所述自然语言处理模型输出标签引擎系统可识别的多个关键词。
示例性的,可以预先训练基于NLP技术的自然语言处理模型,训练自然语言处理模型的过程可以为:先获取大量的包括标签描述信息以及该标签描述信息对应的真实关键词的样本数据,将样本数据输入到预设的神经网络模型中进行训练,得到神经网络预测的多个关键词,通过将预测的多个关键词与样本数据中真实的关键词进行对比,验证是否达到要求,当验证通过,则说明自然语言处理模型训练完成。则将标签描述信息输入到自然语言处理模型中时,自然语言处理模型即可自动输出标签引擎系统可识别的多个关键词。
本申请实施例中,关键词的具体内容和数量可以根据实际的应用场景进行确定,本申请实施例对关键词的具体内容和数量不作限定。
步骤S103:根据所述多个关键词与计算函数元信息,得到所述多个关键词对应的计算函数,所述计算函数元信息中包括关键词的描述信息,所述描述信息包括函数模板。
本申请实施例中,计算函数元信息meta可以预先存储在终端设备中,meta中可以维护有关键词和描述信息的对应关系,描述信息具体可以是关键词的函数模板、关键词的类型、关键词的字段、关键词的存储路径、以及各关键词的字段之间的替换规则等。其中,函数模板可以是没有添加具体参数的通用函数模板,在函数模板中添加关键词的具体信息后可以得到关键词对应的函数;关键词的类型可以用于描述关键词的具体类别,关键词的存储路径可以用于描述关键词所存储的位置,各关键词的字段之间的替换规则可以用于将具有相同含义的字段进行统一替换。本申请实施例对描述信息不做具体限定。通过meta中的关键词的描述信息,可以得到关键词对应的计算函数。
作为本申请实施例的一种可选实现方式,所述根据所述多个关键词与计算函数元信息,得到所述多个关键词对应的计算函数,包括:将每个关键词与所述计算函数元信息进行匹配,得到所述每个关键词对应的描述信息;根据每个关键词与所述关键词的描述信息中的函数模板,得到所述多个关键词对应的计算函数。
本申请实施例中,在得到多个关键词后,可以分别将每个关键词与计算函数元信息进行匹配,从而可以得到各关键词对应的描述信息,该描述信息中包括了关键词对应的函数模板,因此可以根据关键词的具体内容以及该关键词对应的函数模板得到该多个关键词对应的计算函数。
作为本申请实施例的一种可选实现方式,所述多个关键词包括第一类关键词和第二类关键词,所述函数模板包括描述函数模板和计算函数模板,所述第一类关键词的描述信息中包括字段替换规则和所述描述函数模板,所述第二类关键词的描述信息中包括所述计算函数模板;所述根据每个关键词与所述关键词的描述信息中的函数模板,得到所述多个关键词对应的计算函数,包括:根据所述字段替换规则对所述第一类关键词进行替换,得到所述第一类关键词的替换值;将所述第一类关键词的替换值插入所述第一类关键词的描述函数模板,得到所述第一关键词的描述函数;根据第二类关键词和所述第一类关键词的描述函数对所述第二类关键词对应的计算函数模板中的参数进行赋值,得到所述多个关键词对应的计算函数。
本申请实施例中,第一类关键词可以是用于描述具体信息的关键词,第二关键词可以是表示计算规则的关键词,第一类关键词的描述信息中包括字段替换规则和描述函数模板,将第一类关键词的替换值插入第一类关键词的描述函数模板,可以得到第一关键词的描述函数,第二类关键词的描述信息中包括了第二关键词对应的计算函数模板,根据第二关键词和第一关键词的描述函数对第二类关键词对应的计算函数模板中的参数进行赋值,则可以得到最终的计算函数。
作为本申请实施例的一种可选实现方式,所述多个关键词包括:数据源所在的表,表的字段、字段替换条件以及操作;所述数据源所在的表的描述信息包括表的描述函数模板、表的类型、表包括的字段和表的存储路径;所述表的字段的描述信息,包括字段的含义、字段替换规则和字段的描述函数模板;所述字段替换条件包括所述字段替换规则的描述函数模板;所述操作的描述信息包括操作对应的计算函数模板。
示例性的,以步骤S101中的标签描述信息为“计算出常住人口中,性别等于男性的人数之和”为例,可以将该标签描述信息转化为下述关键词:常住人口表(对应于数据源所在的表)、性别(对应于表的字段)、性别等于男性(对应于字段替换条件)、求和(对应于操作)。
则该“常住人口表”、“性别”、“性别等于男性”可以属于第一类关键词,“求和”可以属于第二类关键词。
对于关键词“常住人口表”,可以先在meta中读取常住人口表对应的函数模板为:<DataNode name="read_person"type="DATA_READ"data_type="{data_type}"input_column="{read_person_input_column}"output_column="{read_person_output_column}"table_name="{table_name}"/>
再根据常住人口的表的表名为:“PERSON_INFO”,得到常住人口的表的类型data_type为“MYSQL_TABLE”,常住人口的表的存储路径input_column为“id,SFZH,XM,NL,XB,RKLX,DZ,DJCPH,GLCPH”,output_column是需要取得字段,可以选“id,SFZH,XM,XB,NL,RKLX”,则可以将底层函数的描述变为如下描述函数:<DataNode name="read_person"type="DATA_READ"data_type="MYSQL_TABLE"input_column="id,SFZH,XM,NL,XB,RKLX,DZ,DJCPH,GLCPH"output_column="id,SFZH,XM,XB,NL,RKLX"table_name="PERSON_INFO"/>。
对于关键词“字段”,meta中会保存表的各个模式(schema)字段的中文和英文之间的对应关系,例如,“性别”对应“XB”,则可以将“性别”转化为“XB”。
对于关键词“性别等于男性”,可以先将“性别等于男性”拆分为“性别”、“等于”、“男性”,其中“性别”映射为“XB”,“等于”映射为“==”,将上述条件映射为“XB==男”,然后获取到字段替换条件在meta中的函数模板:<DataNode name="data_filter"type="DATA_FILTER"output_column="{output_column}"conditions="{condition}"/>。
其中,output_column=“id,SFZH,XM”,condition=“XB==男”,可以得到最终的描述函数为:<DataNode name="data_filter"type="DATA_FILTER"output_column="id,SFZH,XM"conditions="XB==男"/>。
对于关键词“求和”,可以先在meta中确定求和对应的计算函数模板:<DataNodename="data_tatistic"type="DATA_STATISTIC"group_column="id"stat_method="{method}"field="{field}"new_column="{new_column}"output_column="{output_column}"/>。
其中method为“count“,field为”XM”,new_column为”count_num”,output_column为”count_num”,可以得到求和对应的计算函数为:<DataNode name="data_tatistic"type="DATA_STATISTIC"group_column="id"stat_method="count"field="XM"new_column="count_num"output_column="count_num"/>。
根据上述的描述函数修改该求和对应的计算函数中的参数,可以得到最终计算函数如下:<DataNode name="data_write"type="DATA_WRITE"data_type="ES_TABLE"output_column="count_num"table_name="statistics"/>。
步骤S104:根据所述多个关键词对应的计算函数的逻辑关系,生成工作流。
本申请实施例中,计算函数中包括了各计算算子(即各关键词对应的函数),以及各计算算子之间的逻辑关系,可以进一步根据计算函数的逻辑关系生成工作流。工作流可以是可执行的应用程序,执行工作流可以得到相应的结果。
所述根据所述多个关键词对应的计算函数的逻辑关系,生成工作流,包括:根据所述多个关键词对应的计算函数的逻辑关系,生成包括计算逻辑的工作流,所述计算逻辑包括输入、计算和输出。
本申请实施例中,工作流中具体包括了输入、计算和输出的计算逻辑。
步骤S105:执行所述工作流,生成标签。
本申请实施例中,在得到工作流后,可以进一步执行工作流,则可以自动生成标签,示例的,以步骤S101中的标签描述信息为“计算出常住人口中,性别等于男性的人数之和”为例,可生成常住人口中男性人数之和的标签。
综上所述,本申请实施例中提供了一种标签的生成方法及装置,用户希望设置自定义标签时,只需要输入标签描述信息,终端设备就可以结合自然语言处理技术,将标签描述转换为计算机可以识别的底层语言,自动生成标签,从而使得用户可以灵活的生成需要的标签。具体的,本申请实施例的自动生成标签的实现为:接收用户输入的标签描述信息;根据自然语言处理NLP方法,将标签描述信息转换为标签引擎系统可识别的多个关键词;根据多个关键词与计算函数元信息,得到多个关键词对应的计算函数,计算函数元信息中包括关键词的描述信息;根据多个关键词对应的计算函数的逻辑关系,生成工作流;执行工作流,生成标签,即用户只需要输入标签描述信息,本申请实施例就可以自动为用户生成需要的标签,生成标签的方式非常灵活。
图4为本申请提供的标签的生成装置一实施例的结构示意图。如图4所示,本实施例提供的标签的生成装置包括:
接收模块,用于接收用户输入的标签描述信息;
关键词得到模块,用于根据自然语言处理NLP方法,将所述标签描述信息转换为标签引擎系统可识别的多个关键词;
计算函数得到模块,用于根据所述多个关键词与计算函数元信息,得到所述多个关键词对应的计算函数,所述计算函数元信息中包括关键词的描述信息,所述描述信息包括函数模板;
工作流生成模块,用于根据所述多个关键词对应的计算函数的逻辑关系,生成工作流;
标签生成模块,用于执行所述工作流,生成标签。
可选的,所述计算函数得到模块包括:
计算函数得到子模块,用于将每个关键词与所述计算函数元信息进行匹配,得到所述每个关键词对应的描述信息;根据每个关键词与所述关键词的描述信息中的函数模板,得到所述多个关键词对应的计算函数。
可选的,所述多个关键词包括第一类关键词和第二类关键词,所述函数模板包括描述函数模板和计算函数模板,所述第一类关键词的描述信息中包括字段替换规则和所述描述函数模板,所述第二类关键词的描述信息中包括所述计算函数模板;所述计算函数得到子模块还用于:
根据所述字段替换规则对所述第一类关键词进行替换,得到所述第一类关键词的替换值;将所述第一类关键词的替换值插入所述第一类关键词的描述函数模板,得到所述第一关键词的描述函数;根据第二类关键词和所述第一类关键词的描述函数对所述第二类关键词对应的计算函数模板中的参数进行赋值,得到所述多个关键词对应的计算函数。
可选的,所述多个关键词包括:数据源所在的表,表的字段、字段替换条件以及操作;
所述数据源所在的表的描述信息包括表的描述函数模板、表的类型、表包括的字段和表的存储路径;
所述表的字段的描述信息,包括字段的含义、字段替换规则和字段的描述函数模板;
所述字段替换条件包括所述字段替换规则的描述函数模板;
所述操作的描述信息包括操作对应的计算函数模板。
可选的,所述工作流生成模块包括:
工作流生成子模块,用于根据所述多个关键词对应的计算函数的逻辑关系,生成包括计算逻辑的工作流,所述计算逻辑包括输入、计算和输出。
可选的,还包括:
配置模块,用于配置所述计算函数元信息,所述计算函数元信息包括关键词与描述信息的映射关系。
可选的,所述关键词得到模块包括:
关键词得到子模块,用于将所述标签描述信息输入基于NLP训练的自然语言处理模型中;利用所述自然语言处理模型输出标签引擎系统可识别的多个关键词。
本申请实施例中提供了一种标签的生成方法及装置,用户希望设置自定义标签时,只需要输入标签描述信息,终端设备就可以结合自然语言处理技术,将标签描述转换为计算机可以识别的底层语言,自动生成标签,从而使得用户可以灵活的生成需要的标签。具体的,本申请实施例的自动生成标签的实现为:接收用户输入的标签描述信息;根据自然语言处理NLP方法,将标签描述信息转换为标签引擎系统可识别的多个关键词;根据多个关键词与计算函数元信息,得到多个关键词对应的计算函数,计算函数元信息中包括关键词的描述信息;根据多个关键词对应的计算函数的逻辑关系,生成工作流;执行工作流,生成标签,即用户只需要输入标签描述信息,本申请实施例就可以自动为用户生成需要的标签,生成标签的方式非常灵活。
本申请各实施例提供的标签的生成装置可用于执行如前述各对应的实施例所示的方法,其实现方式与原理相同,不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图5所示,是根据本申请实施例的标签的生成方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图5所示,该电子设备包括:一个或多个处理器501、存储器502,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器501为例。
存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的标签的生成方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的标签的生成方法。
存储器502作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的标签的生成方法对应的程序指令/模块(例如,附图4所示的接收模块31、关键词得到模块32、计算函数得到模块33、工作流生成模块34和标签生成模块35)。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的标签的生成方法。
存储器502可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据标签的生成电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器502可选包括相对于处理器501远程设置的存储器,这些远程存储器可以通过网络连接至标签的生成电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
标签的生成方法的电子设备还可以包括:输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接,图5中以通过总线连接为例。
输入装置503可接收输入的数字或字符信息,以及产生与标签的生成电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,用户希望设置自定义标签时,只需要输入标签描述信息,终端设备就可以结合自然语言处理技术,将标签描述转换为计算机可以识别的底层语言,自动生成标签,从而使得用户可以灵活的生成需要的标签。具体的,本申请实施例的自动生成标签的实现为:接收用户输入的标签描述信息;根据自然语言处理NLP方法,将标签描述信息转换为标签引擎系统可识别的多个关键词;根据多个关键词与计算函数元信息,得到多个关键词对应的计算函数,计算函数元信息中包括关键词的描述信息;根据多个关键词对应的计算函数的逻辑关系,生成工作流;执行工作流,生成标签,即用户只需要输入标签描述信息,本申请实施例就可以自动为用户生成需要的标签,生成标签的方式非常灵活。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (12)
1.一种标签的生成方法,其特征在于,所述方法包括:
接收用户输入的标签描述信息;
根据自然语言处理NLP方法,将所述标签描述信息转换为标签引擎系统可识别的多个关键词;
将每个关键词与计算函数元信息进行匹配,得到所述每个关键词对应的描述信息;其中,所述计算函数元信息中包括关键词的描述信息,所述描述信息包括函数模板,所述函数模板包括描述函数模板和计算函数模板;多个所述关键词包括第一类关键词和第二类关键词,所述第一类关键词的描述信息中包括字段替换规则和所述描述函数模板,所述第二类关键词的描述信息中包括所述计算函数模板;
根据所述字段替换规则对所述第一类关键词进行替换,得到所述第一类关键词的替换值;
将所述第一类关键词的替换值插入所述第一类关键词的描述函数模板,得到所述第一类关键词的描述函数;
根据第二类关键词和所述第一类关键词的描述函数对所述第二类关键词对应的计算函数模板中的参数进行赋值,得到所述多个关键词对应的计算函数;
根据所述多个关键词对应的计算函数的逻辑关系,生成工作流;
执行所述工作流,生成标签。
2.根据权利要求1所述的方法,其特征在于,所述多个关键词包括:数据源所在的表,表的字段、字段替换条件以及操作;
所述数据源所在的表的描述信息包括表的描述函数模板、表的类型、表包括的字段和表的存储路径;
所述表的字段的描述信息,包括字段的含义、字段替换规则和字段的描述函数模板;
所述字段替换条件包括所述字段替换规则的描述函数模板;
所述操作的描述信息包括操作对应的计算函数模板。
3.根据权利要求1所述的方法,其特征在于,所述根据所述多个关键词对应的计算函数的逻辑关系,生成工作流,包括:
根据所述多个关键词对应的计算函数的逻辑关系,生成包括计算逻辑的工作流,所述计算逻辑包括输入、计算和输出。
4.根据权利要求1所述的方法,其特征在于,还包括:
配置所述计算函数元信息,所述计算函数元信息包括关键词与描述信息的映射关系。
5.根据权利要求1所述的方法,其特征在于,所述根据自然语言处理NLP方法,将所述标签描述信息转换为标签引擎系统可识别的多个关键词,包括:
将所述标签描述信息输入基于NLP训练的自然语言处理模型中;
利用所述自然语言处理模型输出标签引擎系统可识别的多个关键词。
6.一种标签的生成装置,其特征在于,包括:
接收模块,用于接收用户输入的标签描述信息;
关键词得到模块,用于根据自然语言处理NLP方法,将所述标签描述信息转换为标签引擎系统可识别的多个关键词;
计算函数得到模块,用于根据所述多个关键词与计算函数元信息,得到所述多个关键词对应的计算函数;其中,所述计算函数元信息中包括关键词的描述信息,所述描述信息包括函数模板;所述函数模板包括描述函数模板和计算函数模板;多个所述关键词包括第一类关键词和第二类关键词,所述第一类关键词的描述信息中包括字段替换规则和所述描述函数模板,所述第二类关键词的描述信息中包括所述计算函数模板;
工作流生成模块,用于根据所述多个关键词对应的计算函数的逻辑关系,生成工作流;
标签生成模块,用于执行所述工作流,生成标签;
所述计算函数得到模块包括:
计算函数得到子模块,用于根据所述字段替换规则对所述第一类关键词进行替换,得到所述第一类关键词的替换值;将所述第一类关键词的替换值插入所述第一类关键词的描述函数模板,得到所述第一类关键词的描述函数;根据第二类关键词和所述第一类关键词的描述函数对所述第二类关键词对应的计算函数模板中的参数进行赋值,得到所述多个关键词对应的计算函数。
7.根据权利要求6所述的装置,其特征在于,所述多个关键词包括:数据源所在的表,表的字段、字段替换条件以及操作;
所述数据源所在的表的描述信息包括表的描述函数模板、表的类型、表包括的字段和表的存储路径;
所述表的字段的描述信息,包括字段的含义、字段替换规则和字段的描述函数模板;
所述字段替换条件包括所述字段替换规则的描述函数模板;
所述操作的描述信息包括操作对应的计算函数模板。
8.根据权利要求6所述的装置,其特征在于,所述工作流生成模块包括:
工作流生成子模块,用于根据所述多个关键词对应的计算函数的逻辑关系,生成包括计算逻辑的工作流,所述计算逻辑包括输入、计算和输出。
9.根据权利要求6所述的装置,其特征在于,还包括:
配置模块,用于配置所述计算函数元信息,所述计算函数元信息包括关键词与描述信息的映射关系。
10.根据权利要求6所述的装置,其特征在于,所述关键词得到模块包括:
关键词得到子模块,用于将所述标签描述信息输入基于NLP训练的自然语言处理模型中;利用所述自然语言处理模型输出标签引擎系统可识别的多个关键词。
11.一种电子设备,其特征在于,包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-5任一项所述的方法的指令。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,计算机指令用于使所述计算机执行如权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910856301.7A CN110532487B (zh) | 2019-09-11 | 2019-09-11 | 标签的生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910856301.7A CN110532487B (zh) | 2019-09-11 | 2019-09-11 | 标签的生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110532487A CN110532487A (zh) | 2019-12-03 |
CN110532487B true CN110532487B (zh) | 2022-07-29 |
Family
ID=68668147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910856301.7A Active CN110532487B (zh) | 2019-09-11 | 2019-09-11 | 标签的生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110532487B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111768767B (zh) * | 2020-05-22 | 2023-08-15 | 深圳追一科技有限公司 | 用户标签提取方法和装置、服务器、计算机可读存储介质 |
CN111723565A (zh) * | 2020-06-19 | 2020-09-29 | 宫辉 | 一种法律案件关键字处理方法,处理系统及设备 |
CN111753922A (zh) * | 2020-06-30 | 2020-10-09 | 北京联想软件有限公司 | 一种模型训练标签的处理方法、装置及电子设备 |
CN112822284B (zh) * | 2021-01-22 | 2022-11-11 | 平安壹钱包电子商务有限公司 | 基于动态代理的数据处理方法、装置及计算机设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101339500A (zh) * | 2008-05-22 | 2009-01-07 | 清华大学 | 基于xml模式的数据绑定应用程序接口生成方法 |
CN101673236A (zh) * | 2009-10-13 | 2010-03-17 | 中国人民解放军国防科学技术大学 | 一种全覆盖的微处理器测试用例包自动生成方法 |
CN108614862A (zh) * | 2018-03-28 | 2018-10-02 | 国家计算机网络与信息安全管理中心 | 基于流计算引擎的实时标签处理方法和装置 |
CN110134929A (zh) * | 2019-04-17 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 文档校验方法、装置、计算机设备和存储介质 |
CN110147544A (zh) * | 2018-05-24 | 2019-08-20 | 清华大学 | 一种基于自然语言的指令生成方法、装置以及相关设备 |
-
2019
- 2019-09-11 CN CN201910856301.7A patent/CN110532487B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101339500A (zh) * | 2008-05-22 | 2009-01-07 | 清华大学 | 基于xml模式的数据绑定应用程序接口生成方法 |
CN101673236A (zh) * | 2009-10-13 | 2010-03-17 | 中国人民解放军国防科学技术大学 | 一种全覆盖的微处理器测试用例包自动生成方法 |
CN108614862A (zh) * | 2018-03-28 | 2018-10-02 | 国家计算机网络与信息安全管理中心 | 基于流计算引擎的实时标签处理方法和装置 |
CN110147544A (zh) * | 2018-05-24 | 2019-08-20 | 清华大学 | 一种基于自然语言的指令生成方法、装置以及相关设备 |
CN110134929A (zh) * | 2019-04-17 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 文档校验方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110532487A (zh) | 2019-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111428008B (zh) | 用于训练模型的方法、装置、设备以及存储介质 | |
CN110532487B (zh) | 标签的生成方法及装置 | |
CN111859982B (zh) | 语言模型的训练方法、装置、电子设备及可读存储介质 | |
CN110674314B (zh) | 语句识别方法及装置 | |
CN112487814B (zh) | 实体分类模型训练方法、实体分类方法、装置及电子设备 | |
CN111708922A (zh) | 用于表示异构图节点的模型生成方法及装置 | |
US11615242B2 (en) | Method and apparatus for structuring data, related computer device and medium | |
KR20210040316A (ko) | 사용자 상호작용 정보 처리모델 생성방법, 사용자 상호작용 정보 처리방법 및 프로그램 | |
CN112711581B (zh) | 医疗数据校验方法、装置、电子设备及存储介质 | |
CN111339759B (zh) | 领域要素识别模型训练方法、装置及电子设备 | |
CN112036509A (zh) | 用于训练图像识别模型的方法和装置 | |
JP2022018095A (ja) | マルチモーダル事前訓練モデル取得方法、装置、電子デバイス及び記憶媒体 | |
CN111967568A (zh) | 深度学习模型的适配方法、装置及电子设备 | |
CN111078878B (zh) | 文本处理方法、装置、设备及计算机可读存储介质 | |
CN111680517A (zh) | 用于训练模型的方法、装置、设备以及存储介质 | |
CN111158666A (zh) | 实体归一化处理方法、装置、设备及存储介质 | |
CN111709252A (zh) | 基于预训练的语义模型的模型改进方法及装置 | |
CN112506479A (zh) | 页面编辑的方法、装置、设备以及存储介质 | |
CN110688844A (zh) | 一种文本标注方法及装置 | |
CN111858880B (zh) | 获取查询结果的方法、装置、电子设备和可读存储介质 | |
CN111563198B (zh) | 一种物料召回方法、装置、设备及存储介质 | |
CN111090991A (zh) | 场景纠错方法、装置、电子设备和存储介质 | |
CN112015866B (zh) | 用于生成同义文本的方法、装置、电子设备及存储介质 | |
CN111026916B (zh) | 文本描述的转换方法、装置、电子设备及存储介质 | |
CN112397050A (zh) | 韵律预测方法、训练方法、装置、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |