CN112507203B - 一种信息处理方法、装置、电子设备以及存储介质 - Google Patents
一种信息处理方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN112507203B CN112507203B CN202110165933.6A CN202110165933A CN112507203B CN 112507203 B CN112507203 B CN 112507203B CN 202110165933 A CN202110165933 A CN 202110165933A CN 112507203 B CN112507203 B CN 112507203B
- Authority
- CN
- China
- Prior art keywords
- word
- query information
- service query
- target vector
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Evolutionary Computation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种信息处理方法、装置、电子设备以及存储介质,所述信息处理方法,包括:获得服务查询信息;对服务查询信息进行分词处理,获得分词处理后的服务查询信息,分词处理后的服务查询信息包括用于表示服务查询信息完整语句的特殊符号和服务查询信息中的每个词;获得分词处理后的服务查询信息对应的服务查询信息目标向量集,服务查询信息目标向量集包括特殊符号对应的目标向量和每个词对应的目标向量;如果对服务查询信息执行句子粒度处理任务,则根据特殊符号对应的目标向量对服务查询信息执行句子粒度处理任务;如果对服务查询信息执行词粒度处理任务,则根据每个词对应的目标向量对服务查询信息执行词粒度处理任务。
Description
技术领域
本申请涉及信息处理领域,具体涉及一种信息处理方法、装置、电子设备以及存储介质。
背景技术
随着人工智能技术的发展,越来越多的应用领域大量使用机器学习模型对任务进行处理。
现有技术中,搜索引擎对用户的输入的查询信息进行理解时,除了对所述查询信息进行最基本的纠错、改写以及分词之外,还会执行其他任务,例如:意图识别、类目预测、查询信息中词的紧密度计算等。一般来说,上述每一种任务都对应一个单独的机器学习模型,在具体的任务执行时,需要将所述查询信息分别输入不同任务对应的机器学习模型以完成相应的任务。然而,这种做法任务量大,且需要大量的重复计算。
因此,在对用户输入的查询信息进行理解时,如何减少任务量,避免大量重复计算成为本领域亟需解决的问题。
发明内容
为了解决上述技术问题,本申请提供一种信息处理方法、装置、电子设备以及存储介质。
本申请提供的信息处理方法,包括:获得服务查询信息;对所述服务查询信息进行分词处理,获得分词处理后的服务查询信息,所述分词处理后的服务查询信息包括用于表示所述服务查询信息完整语句的特殊符号和所述服务查询信息中的每个词;获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,所述服务查询信息目标向量集包括所述特殊符号对应的目标向量和所述每个词对应的目标向量;如果对所述服务查询信息执行句子粒度处理任务,则根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务;如果对所述服务查询信息执行词粒度处理任务,则根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务。
可选的,所述获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,包括:将所述分词处理后的服务查询信息输入到用于输出向量集的特征抽取网络模型,获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集。
可选的,所述获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,包括:获得所述分词处理后的服务查询信息对应的服务查询信息初始向量集,所述服务查询信息初始向量集包括所述特殊符号对应的初始向量和所述每个词对应的初始向量,所述每个词对应的初始向量是上下文无关的向量;根据所述服务查询信息初始向量集获得所述服务查询信息目标向量集,所述每个词对应的目标向量是具有上下文关系的向量。
可选的,所述根据所述服务查询信息初始向量集获得所述服务查询信息目标向量集,包括:将所述服务查询信息初始向量集输入到堆叠的Transformer编码器层,获得所述服务查询信息目标向量集。
可选的,所述句子粒度处理任务包括意图识别任务;所述根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务,包括:将所述特殊符号对应的目标向量输入到用于识别意图的意图分类模型中,获得针对所述服务查询信息的目标意图信息。
可选的,所述针对所述服务查询信息的目标意图信息包括以下至少一种信息:店铺意图信息;菜品意图信息;服务类目意图信息;地址意图信息。
可选的,所述句子粒度处理任务包括服务类目预测任务;所述根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务,包括:将所述特殊符号对应的目标向量输入到用于预测服务类目的服务类目预测模型中,获得所述服务查询信息对应的目标服务类目信息。
可选的,所述词粒度处理任务包括实体识别任务;所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于识别实体的实体识别模型中,获得所述服务查询信息中的实体信息。
可选的,所述服务查询信息中的实体信息包括以下至少一种信息:店铺名称信息;菜品名称信息;服务类目信息;地址信息。
可选的,所述词粒度处理任务包括词权重预测任务;所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于预测词权重的词权重预测模型中,获得所述每个词在所述服务查询信息中的权重数据。
可选的,所述词粒度处理任务包括词紧密度预测任务;所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于预测词紧密度的词紧密度预测模型中,获得所述每个词中除第一个词之外的任意一个词与所述任意一个词的相邻前一个词之间的紧密度数据。
可选的,所述获得服务查询信息,包括:获得客户端发送的服务查询信息;所述方法还包括:将句子粒度处理任务的处理结果或词粒度处理任务的处理结果发送给所述客户端,或者,将根据句子粒度处理任务的处理结果获得的第一服务信息或将根据词粒度处理任务的处理结果获得的第二服务信息发送给所述客户端。
本申请还提供一种信息处理装置,包括:查询信息获取单元,用于获得服务查询信息;分词处理单元,用于对所述服务查询信息进行分词处理,获得分词处理后的服务查询信息,所述分词处理后的服务查询信息包括用于表示所述服务查询信息完整语句的特殊符号和所述服务查询信息中的每个词;目标向量获取单元,用于获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,所述服务查询信息目标向量集包括所述特殊符号对应的目标向量和所述每个词对应的目标向量;句子粒度任务处理单元,用于如果对所述服务查询信息执行句子粒度处理任务,则根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务;词粒度任务处理单元,用于如果对所述服务查询信息执行词粒度处理任务,则根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务。
可选的,所述获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,包括:将所述分词处理后的服务查询信息输入到用于输出向量集的特征抽取网络模型,获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集。
可选的,所述获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,包括:获得所述分词处理后的服务查询信息对应的服务查询信息初始向量集,所述服务查询信息初始向量集包括所述特殊符号对应的初始向量和所述每个分词对应的初始向量,所述每个分词对应的初始向量是上下文无关的向量;根据所述服务查询信息初始向量集获得所述服务查询信息目标向量集,所述每个词对应的目标向量是具有上下文关系的向量。
可选的,所述根据所述服务查询信息初始向量集获得所述服务查询信息目标向量集,包括:将所述服务查询信息初始向量集输入到堆叠的Transformer编码器层,获得所述服务查询信息目标向量集。
可选的,所述句子粒度处理任务包括意图识别任务;所述根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务,包括:将所述特殊符号对应的目标向量输入到用于识别意图的意图分类模型中,获得针对所述服务查询信息的目标意图信息。
可选的,所述针对所述服务查询信息的目标意图信息包括以下至少一种信息:店铺意图信息;菜品意图信息;服务类目意图信息;地址意图信息。
可选的,所述句子粒度处理任务包括服务类目预测任务;所述根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务,包括:将所述特殊符号对应的目标向量输入到用于预测服务类目的服务类目预测模型中,获得所述服务查询信息对应的目标服务类目信息。
可选的,所述词粒度处理任务包括实体识别任务;所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于识别实体的实体识别模型中,获得所述服务查询信息中的实体信息。
可选的,所述服务查询信息中的实体信息包括以下至少一种信息:店铺名称信息;菜品名称信息;服务类目信息;地址信息。
可选的,所述词粒度处理任务包括分词权重预测任务;所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于预测词权重的词权重预测模型中,获得所述每个词在所述服务查询信息中的权重数据。
可选的,所述词粒度处理任务包括词紧密度预测任务;所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于预测词紧密度的词紧密度预测模型中,获得所述每个词中除第一个词之外的任意一个词与所述任意一个词的相邻前一个词之间的紧密度数据。
可选的,所述获得服务查询信息,包括:获得客户端发送的服务查询信息;所述装置还包括:处理结果发送单元,用于将句子粒度处理任务的处理结果或词粒度处理任务的处理结果发送给所述客户端,或者,将根据句子粒度处理任务的处理结果获得的第一服务信息或将根据词粒度处理任务的处理结果获得的第二服务信息发送给所述客户端。
本申请实施例还提供一种电子设备,包括:处理器;存储器,用于存储方法的程序,所述程序在被所述处理器读取执行时,执行上述任意一项所述的方法。
本申请实施例还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述程序被执行时实现上述任意一项所述的方法。
与现有技术相比,本申请具有以下优点:
本申请提供的信息处理方法,包括:获得服务查询信息;对所述服务查询信息进行分词处理,获得分词处理后的服务查询信息,所述分词处理后的服务查询信息包括用于表示所述服务查询信息完整语句的特殊符号和所述服务查询信息中的每个词;获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,所述服务查询信息目标向量集包括所述特殊符号对应的目标向量和所述每个词对应的目标向量;如果对所述服务查询信息执行句子粒度处理任务,则根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务;如果对所述服务查询信息执行词粒度处理任务,则根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务。上述方法通过对所述服务查询信息进行分词处理,获得所述服务查询信息中特殊符号对应的代表服务查询信息中句子粒度目标向量,以及服务查询信息中包含的词对应的词粒度目标向量;进而针对不同粒度的处理任务,根据相应的所述句子粒度目标向量和词粒度目标向量完成对所述服务查询信息的处理。因此,本申请提供的所述信息处理方法,无需针对不同的信息处理任务设计不同的特征抽取网络模型以完成信息处理任务,减少了工作量和大量重复计算。
附图说明
图1为本申请第一实施例提供的信息处理方法的应用场景示意图。
图1A为本申请第一实施例中集成在服务端中的特征抽取网络和下游任务网络的结构示意图。
图2为本申请第二实施例提供的信息处理方法流程图。
图3为本申请第三实施例提供的信息处理装置的结构示意图。
图4为本申请第四实施例提供的电子设备结构示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
为了更清楚的展示本申请实施例提供的信息处理方法,首先介绍本申请实施例提供的信息处理方法的应用场景。
请参考图1,其为本申请第一实施例提供的所述信息处理方法的应用场景示意图。图1中包括:客户端101、服务端102。客户端101可以是与用户对应的具有查询功能的终端设备,例如:手机、电脑等,在具体应用过程中,用户通过在客户端101中携带的信息搜索框上输入相应的服务查询信息获得相应的查询结果。服务端102是指用于提供搜索结果的服务器或服务器集群,用于获得客户端101提供的用户输入的服务查询信息,并向客户端101返回搜索结果。
一般来说,所述服务查询信息对应的任务包括:句子粒度处理任务和词粒度处理任务。因此,服务端102需要先对所述服务查询信息进行分词处理,获得分词处理后的服务查询信息,所述分词处理后的服务查询信息包括用于表示所述服务查询信息完整语句的特殊符号和所述服务查询信息中的每个词。例如:假设用户输入的服务查询信息为“北京大学”,则针对上述服务查询内容进行分词处理后得到的结果为“[CLS] 北京大学 [SEP]”,其中,“[CLS]”和“[SEP]”为引入的特殊符号,“北”、“京”、“大”、“学”为服务查询信息中的每个词。
特殊符号“[CLS]”作为标识放在句子的首位,经过特征抽取模型获得“[CLS]”对应的目标向量(embedding)后,可用于后续的任务;特殊符号“[SEP]”是用于分开不同句子的分隔符。
获取上述分词处理后的服务查询信息后,还需要进一步的获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集。所述服务查询信息目标向量集包括所述特殊符号对应的目标向量和所述词对应的目标向量。
具体的,所述获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,包括:将所述分词处理后的服务查询信息输入到用于输出向量集的特征抽取网络模型,获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集。
所述特征抽取模型是分类模型的一种,分类模型可以根据数据的特点把未知类别的样本映射到给定类别中的某一个,例如:在本申请第一实施例中,所述特征抽取网络模型用于根据输入分词和特殊符号,获得所述分词和特殊符号对应的目标向量(embedding),具体的,例如:将“北京大学”这一服务查询信息系输入所述特征抽取网络模型时,输入形式为“[CLS]北京大学[SEP]”输出结果为“[CLS]”、“北”、“京”、“大”、“学”、“[SEP]”各自对应的目标向量(embedding)。
具体的,将所述分词处理后的服务查询信息输入到用于输出向量集的特征抽取网络模型后,会先经过所述特征抽取网络模型中的Embedding层,获得所述分词处理后的服务查询信息对应的服务查询信息初始向量集,所述服务查询信息初始向量集包括所述特殊符号对应的初始向量和所述每个词对应的初始向量,所述每个词对应的初始向量是上下文无关的向量;根据所述服务查询信息初始向量集获得所述服务查询信息目标向量集,所述每个词对应的目标向量是具有上下文关系的向量,具体的,所述根据所述服务查询信息初始向量集获得所述服务查询信息目标向量集,包括:将所述服务查询信息初始向量集输入到堆叠的Transformer编码器层,获得所述服务查询信息目标向量集。
例如:所述特征抽取网络模型的输入内容为“[CLS] 北京大学 [SEP]”,则上述内容经过特征抽取网络模型的Embedding层后,输出结果包括:“ECLS”、“E北”、E京、“E大”、“E学”、“ESEP”。其中,“ECLS”和“ESEP”为所述特殊符号对应的初始向量;“E北”、E京、“E大”、“E学”为“北京大学”中每个词(字)对应初始向量,并且,“E北”、E京、“E大”、“E学”之间并无上下文关联。
获得Embedding层的输出结果后,输出结果“ECLS”、“E北”、E京、“E大”、“E学”、“ESEP”会继续输入特征抽取网络模型中堆叠的Transformer编码器层,所述堆叠的Transformer编码器层输出对应的目标向量集:“TCLS”、“T北”、T京、“T大”、“T学”、“TSEP”。其中,目标向量“TCLS”用于表征“北京大学”这一个句子,目标向量“TCLS”、“T北”、T京、“T大”、“T学”之间具有上下文联系。也可以认为,目标向量“TCLS”是句子粒度的目标向量,目标向量“T北”、T京、“T大”、“T学”是词粒度的特征向量。根据前文提到的,本申请第一实施例提供的所述信息处理方法的应用场景中,包括:句子粒度处理任务和词粒度处理任务。在具体的应用过程中,如果确定对应所述服务查询信息执行的是句子粒度处理任务,则根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务;如果确定对应所述服务查询信息执行的是词粒度处理任务,则根据所述每个分词对应的目标向量对所述服务查询信息执行词粒度处理任务。
其中,所述句子粒度处理任务是指,针对用户输入的语句进行分析,获得相应的识别结果。同理,所述词粒度处理任务是指,针对用户输入的语句中的词进行分析,获得相应的识别结果。
具体的,在实际应用过程中,所述句子粒度处理任务包括:意图识别任务、服务类目预测任务等;所述词粒度处理任务包括:实体识别任务、分词权重预测任务、分词紧密度预测任务等。以下对上述任务逐一进行详细说明。
1、如果句子粒度任务为意图识别任务,则所述根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务,包括:将所述特殊符号对应的目标向量输入到用于识别意图的意图分类模型中,获得针对所述服务查询信息的目标意图信息。
具体的,所述服务查询信息的意图信息包括以下至少一种信息:店铺意图信息;菜品意图信息;服务类目意图信息;地址意图信息。
例如:假设用户通过终端设备中某一外卖服务平台的应用程序(APP)的信息搜索框中输入的是“XXX火锅店”(其中,XXX代表火锅店的具体名称),则服务端102对上述搜索内容进行分词处理并输入特征抽取模型后,所述特征抽取模型输入的特殊符号[CLS]对应的目标向量“TCLS”即为输入所述意图分类模型的目标向量。所述意图分类模型根据这一目标向量可以识别出用户输入上述内容是因为用户期望获取的该上述火锅店信息,进而选购餐品等服务。
又例如:假设用户通过终端设备中某一导航服务平台的应用程序(APP)输入“北京大学”,则对“北京大学”这一内容进行分词处理,并输入所述特征抽取网络模型后,获得的特殊符号[CLS]对应的目标向量“TCLS”则为输入所述意图分类模型的目标向量。所述意图分类模型根据上述输入内容中的目标向量得到的就是“北京大学”的地址信息。
2、如果所述句子粒度处理任务为服务类目预测任务,则所述根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务,包括:将所述特殊符号对应的目标向量输入到用于预测服务类目的服务类目预测模型中,获得所述服务查询信息对应的目标服务类目信息。
例如:假设用户在信息搜索框中输入的是“白色上衣”,则将上述内容对应的目标向量“TCLS”输入到所述服务类目预测模型中得到的可能是用户想要购买白色的上衣,也可能是用户想要与白色上衣相关的搭配信息。获取上述信息后,服务端102可以根据“白色上衣”这一输入内容的目标向量“TCLS”对关于白色上衣的搜索结果进行排序并返回客户端101向用户进行展示。
3、如果所述词粒度处理任务为实体识别任务,则根据所述每个词对应的目标向量对所述服务查询信息执行分词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于识别实体的实体识别模型中,获得所述服务查询信息中的实体信息。
具体的,所述实体信息包括以下至少一种:店铺名称信息;菜品名称信息;服务类目信息;地址信息。
例如:假设用户通过某一外卖服务平台输入的是“XX咖啡”(其中,XX为咖啡的具体品牌名称),则所述目标向量包括“TCLS”、“TX”、“TX”、“T咖”、“T啡”、“TCLS”,其中,输入所述实体识别模型中的每个词对应的目标向量为:“TX”、“TX”、“T咖”、“T啡”,将上述目标向量输入到用于识别实体的实体识别模型后,所述实体识别模型输出售卖“XX咖啡”对应的实体店的店铺名称信息、咖啡的种类的信息(例如:拿铁、原味等),以及店铺对应的服务类目信息(例如:营业时间,是否支持外卖服务等)。
4、如果所述词粒度处理任务包括词权重预测任务,则所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于预测词权重的词权重预测模型中,获得所述每个词在所述服务查询信息中的权重数据。
其中,所述每个词在所述服务查询信息中的权重数据是代表每个词在所述服务查询信息中重要程度的数据。
5、如果所述词粒度处理任务包括词紧密度预测任务,则所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于预测词紧密度的词紧密度预测模型中,获得所述每个词中除第一个词之外的任意一个词与所述任意一个词的相邻前一个词之间的紧密度数据。
所述词紧密度标识词与词之间的关联程度,例如:假设用户通过搜索引擎输入的服务查询内容中包括“北京大学”这一内容,且所述引擎得到了两篇候选查询结果分别为《北京大学招生报告》和《北京联合大学就业报告》,由于查询内容中“北京”和“大学”两个词具有高紧密度,因此,查询结果中的《北京大学招生报告》相对于《北京联合大学就业报告》与查询内容“北京大学”更相关。
以服务查询内容为“北京大学”为例,其中,包括分词“北”、“京”、“大”、“学”,将上述分词对应的目标向量输入所述词紧密度预测模型得到的结果中获得所述每个词中除第一个词之外的任意一个词与所述任意一个词的相邻前一个词之间的紧密度数据,即,从“京”这一词开始,获得词“京”与“北”之间的紧密度、词“大”与“京”之间的紧密度以及词“学”与“大”之间的紧密度。
需要说明的是,本申请第一实施例提供的上述词粒度处理任务和句子粒度任务并不局限于上述意图识别任务、服务类目预测任务、实体识别任务、词权重预测任务、词紧密度预测任务。在具体应用中还可以包含其他的任务。另外,上述内容仅介绍了某一任务单独出现的情形,但需要理解的是,上述词粒度处理任务和句子粒度处理任务在具体应用过程中往往混合出现,但处理任务的原理基本相似与上述内容,上述对所述句子粒度处理任务和词粒度处理任务的说明只是为了便于理解本发明,并非用于限定任务的种类以及任务的出现形式。
请参考图1A,其为本申请第一实施例中集成在所述服务端102中的特征抽取网络和下游任务网络的结构示意图。
所述特征抽取网络中,包括特征抽取网络模型101A;所述下游任务网络,用于执行句子粒度的处理任务和词粒度的处理任务。其中,所述句子粒度的处理任务包括:意图分类任务102A、服务类目预测任务103A;所述词粒度的处理任务包括:实体识别任务104A、分词权重预测任务105A、分词紧密度任务106A。
下面以所述服务端102获取的服务查询信息为“北京大学”为例,对所述本申请第一实施例做进一步的说明。
在对所述服务查询信息“北京大学”进行分词后转换为所述特征抽取网络模型的输入形式:[CLS]北京大学[SEP],将上述内容输入所述特征抽取网络模型101A后,上述内容首先经过所述特征抽取网络的Embedding层得到服务查询信息的初始向量集:“ECLS”、“E北”、“E京”、“E大”、“E学”、“ESEP”,其中,“ECLS”和“ESEP”分别为特殊符号[CLS]和[SEP]对应的初始向量,“E北”、“E京”、“E大”、“E学”为每个词(token)对应的初始向量,且每个词对应的初始向量是上下文无关的初始向量,也就是说,初始向量“E北”、“E京”、“E大”、“E学”之间无关。
得到上述初始向量集后,将所述初始向量集输入所述特征抽取网络中堆叠的Transformer编码器层,与所述初始向量对应的目标向量:“TCLS”、“T北”、“T京”、“T大”、“T学”、“TSEP”。其中,目标向量“TCLS”用于表征“北京大学”这一个句子,可以理解为句子粒度对应的目标向量;目标向量“T北”、“T京”、“T大”、“T学”分别用于标识词“E北”、“E京”、“E大”、“E学”对应的目标向量,并且目标向量“T北”、“T京”、“T大”、“T学”之间具有上下文的关联,可以理解为词粒度的目标向量。
具体的,获得所述目标向量后,针对不同的下游任务选取相应目标向量以完成任务,如果所述任务为句子粒度的处理任务,例如:意图识别任务102A,则将TCLS作为所述意图识别任务对应的意图分类模型输入信息,获得所述意图分类模型输出的识别结果。
如果所述任务为分词粒度的处理任务,例如:实体识别任务104A,则将“T北”、“T京”、“T大”、“T学”作为所述词粒度处理任务对应的实体识别模型输入信息,获得所述实体识别模型输出的识别结果。由此可见,本申请第一实施例提供的所述信息处理方法的应用场景中,本质上是通过不同类型的下游任务模型共享同一特征抽取网络模型,以完成相应的识别任务。在实际应用的过程中,本申请第一实施例所述的方案可以基于预训练语言模型BERT(Bidirectional Encoder Representation form Transformer)实现,并应用于服务查询中的多个搜索任务中。在获得所述句子粒度任务的处理结果或词粒度任务的处理结果后,将所述句子粒度任务处理结果发送给所述客户端,或者,将根据句子粒度处理任务的处理结果获得的第一服务信息或将根据词粒度处理任务的处理结果获得的第二服务信息发送给所述客户端,以供所述服务端向用户展示所述处理结果。
上述实施例介绍了所述信息处理方法的具体应用场景,与之相应的,本申请第二实施例提供一种信息处理方法,请参考图2,其为本申请第二实施例所述的信息处理方法流程图。由于本方法实施例基本相似于上述应用场景实施例,所以描述的较为简单,相关之处参见上述场景实施例的部分说明即可。
本申请第二实施例提供的所述信息处理方法包括:步骤S201至步骤S205。
步骤S201,获得服务查询信息。
步骤S202,对所述服务查询信息进行分词处理,获得分词处理后的服务查询信息,所述分词处理后的服务查询信息包括用于表示所述服务查询信息完整语句的特殊符号和所述服务查询信息中的每个词。
步骤S203,获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,所述服务查询信息目标向量集包括所述特殊符号对应的目标向量和所述每个词对应的目标向量。
可选的,所述获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,包括:将所述分词处理后的服务查询信息输入到用于输出向量集的特征抽取网络模型,获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集。
可选的,所述获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,包括:
获得所述分词处理后的服务查询信息对应的服务查询信息初始向量集,所述服务查询信息初始向量集包括所述特殊符号对应的初始向量和所述每个词对应的初始向量,所述每个词对应的初始向量是上下文无关的向量;
根据所述服务查询信息初始向量集获得所述服务查询信息目标向量集,所述每个词对应的目标向量是具有上下文关系的向量。
可选的,所述根据所述服务查询信息初始向量集获得所述服务查询信息目标向量集,包括:将所述服务查询信息初始向量集输入到堆叠的Transformer编码器层,获得所述服务查询信息目标向量集。
步骤S204,如果对所述服务查询信息执行句子粒度处理任务,则根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务。
可选的,所述句子粒度处理任务包括意图识别任务;所述根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务,包括:将所述特殊符号对应的目标向量输入到用于识别意图的意图分类模型中,获得针对所述服务查询信息的目标意图信息。
可选的,所述针对所述服务查询信息的目标意图信息包括以下至少一种信息:店铺意图信息;菜品意图信息;服务类目意图信息;地址意图信息。
可选的,所述句子粒度处理任务包括服务类目预测任务;
所述根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务,包括:将所述特殊符号对应的目标向量输入到用于预测服务类目的服务类目预测模型中,获得所述服务查询信息对应的目标服务类目信息。
步骤S205,如果对所述服务查询信息执行词粒度处理任务,则根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务。
可选的,所述词粒度处理任务包括实体识别任务;
所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于识别实体的实体识别模型中,获得所述服务查询信息中的实体信息。
可选的,所述服务查询信息中的实体信息包括以下至少一种信息:店铺名称信息;菜品名称信息;服务类目信息;地址信息。
可选的,所述词粒度处理任务包括词权重预测任务;
所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于预测词权重的词权重预测模型中,获得所述每个词在所述服务查询信息中的权重数据。
可选的,所述词粒度处理任务包括词紧密度预测任务;
所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于预测词紧密度的词紧密度预测模型中,获得所述每个词中除第一个词之外的任意一个词与所述任意一个词的相邻前一个词之间的紧密度数据。
可选的,所述获得服务查询信息,包括:获得客户端发送的服务查询信息;
进一步的,所述方法还包括:将句子粒度处理任务的处理结果或词粒度处理任务的处理结果发送给所述客户端,或者,将根据句子粒度处理任务的处理结果获得的第一服务信息或将根据词粒度处理任务的处理结果获得的第二服务信息发送给所述客户端。
综上所述,本申请第二实施例提供的所述信息处理方法,上述方法通过对所述服务查询信息进行分词处理,获得所述服务查询信息中特殊符号对应的代表服务查询信息中句子粒度目标向量,以及服务查询信息中包含的分词对应的分词粒度目标向量;进而针对不同粒度的处理任务,根据相应的所述句子粒度目标向量和分词粒度目标向量完成对所述服务查询信息的处理。因此,本申请提供的所述信息处理方法,无需针对不同的处理任务设计不同的特征抽取网络模型以完成信息处理任务,减少了工作量和大量重复计算。
上述内容分别介绍了一种信息处理方法的应用场景实施例、以及所述信息处理方法实施例,与之相应的,本申请第三实施例提供一种信息处理装置,由于该装置实施例基本相似于上述场景实施例和方法实施例,所以描述的比较简单,相关之处参见上述场景实施例和方法实施例的部分说明即可,下面描述的装置实施例仅仅是示意性的。
请参考图3,其为本申请第三实施例提供的信息处理装置的结构示意图,所述信息处理装置包括:
查询信息获取单元301,用于获得服务查询信息;
分词处理单元302,用于对所述服务查询信息进行分词处理,获得分词处理后的服务查询信息,所述分词处理后的服务查询信息包括用于表示所述服务查询信息完整语句的特殊符号和所述服务查询信息中的每个词;
目标向量获取单元303,用于获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,所述服务查询信息目标向量集包括所述特殊符号对应的目标向量和所述每个词对应的目标向量;
句子粒度任务处理单元304,用于如果对所述服务查询信息执行句子粒度处理任务,则根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务;
词粒度任务处理单元305,用于如果对所述服务查询信息执行词粒度处理任务,则根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务。
可选的,所述获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,包括:将所述分词处理后的服务查询信息输入到用于输出向量集的特征抽取网络模型,获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集。
可选的,所述获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,包括:获得所述分词处理后的服务查询信息对应的服务查询信息初始向量集,所述服务查询信息初始向量集包括所述特殊符号对应的初始向量和所述每个分词对应的初始向量,所述每个分词对应的初始向量是上下文无关的向量;根据所述服务查询信息初始向量集获得所述服务查询信息目标向量集,所述每个词对应的目标向量是具有上下文关系的向量。
可选的,所述根据所述服务查询信息初始向量集获得所述服务查询信息目标向量集,包括:将所述服务查询信息初始向量集输入到堆叠的Transformer编码器层,获得所述服务查询信息目标向量集。
可选的,所述句子粒度处理任务包括意图识别任务;所述根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务,包括:将所述特殊符号对应的目标向量输入到用于识别意图的意图分类模型中,获得针对所述服务查询信息的目标意图信息。
可选的,所述针对所述服务查询信息的目标意图信息包括以下至少一种信息:店铺意图信息;菜品意图信息;服务类目意图信息;地址意图信息。
可选的,所述句子粒度处理任务包括服务类目预测任务;所述根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务,包括:将所述特殊符号对应的目标向量输入到用于预测服务类目的服务类目预测模型中,获得所述服务查询信息对应的目标服务类目信息。
可选的,所述词粒度处理任务包括实体识别任务;所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于识别实体的实体识别模型中,获得所述服务查询信息中的实体信息。
可选的,所述服务查询信息中的实体信息包括以下至少一种信息:店铺名称信息;菜品名称信息;服务类目信息;地址信息。
可选的,所述词粒度处理任务包括分词权重预测任务;所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于预测词权重的词权重预测模型中,获得所述每个词在所述服务查询信息中的权重数据。
可选的,所述词粒度处理任务包括词紧密度预测任务;所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于预测词紧密度的词紧密度预测模型中,获得所述每个词中除第一个词之外的任意一个词与所述任意一个词的相邻前一个词之间的紧密度数据。
可选的,所述获得服务查询信息,包括:获得客户端发送的服务查询信息;所述装置还包括:处理结果发送单元,用于将句子粒度处理任务的处理结果或词粒度处理任务的处理结果发送给所述客户端,或者,将根据句子粒度处理任务的处理结果获得的第一服务信息或将根据词粒度处理任务的处理结果获得的第二服务信息发送给所述客户端。
与本申请提供的上述方法实施例和装置实施例相对应的,本申请第四实施例提供了一种电子设备,由于该电子设备基本相似与本申请提供的上述方法实施例和装置实施例,所以描述的比较简单,相关之处参见本申请提供的上述方法实施例部分的说明即可。下面描述的第四实施例仅仅是示意性的。
请参考图4,其为本申请第四实施例提供的所述电子设备结构示意图。
所述电子设备包括:处理器401;
以及存储器402,用于存储方法的程序,所述程序在被所述处理器读取执行时,执行上述方法实施例提供的方法。
需要说明的是,本申请第四实施例提供的电子设备的详细描述,可以参考对本申请提供的上述方法实施例的相关描述,这里不再赘述。
与本申请提供的上述方法实施例和装置实施例相对应的,本申请第五实施例还提供了一种计算机存储介质,由于第五实施例基本相似与本申请提供的上述方法实施例,所以描述的比较简单,相关之处参见本申请提供的上述方法实施例部分的说明即可。下面描述的第五实施例仅仅是示意性的。
所述计算机存储介质存储有计算机程序,所述程序被执行时实现上述方法实施例中提供的方法。
需要说明的是,本申请第五实施例提供的存储介质的详细描述,可以参考对本申请提供的上述方法实施例的相关描述,这里不再赘述。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM) 和/或非易失性内存等形式,如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器(ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
Claims (10)
1.一种信息处理方法,其特征在于,包括:
获得服务查询信息;
对所述服务查询信息进行分词处理,获得分词处理后的服务查询信息,所述分词处理后的服务查询信息包括用于表示所述服务查询信息完整语句的特殊符号和所述服务查询信息中的每个词;
获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,所述服务查询信息目标向量集包括所述特殊符号对应的目标向量和所述每个词对应的目标向量;
如果对所述服务查询信息执行句子粒度处理任务,则根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务;
如果对所述服务查询信息执行词粒度处理任务,则根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务。
2.根据权利要求1所述的方法,其特征在于,所述获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,包括:将所述分词处理后的服务查询信息输入到用于输出向量集的特征抽取网络模型,获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集。
3.根据权利要求1所述的方法,其特征在于,所述句子粒度处理任务包括意图识别任务;所述根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务,包括:将所述特殊符号对应的目标向量输入到用于识别意图的意图分类模型中,获得针对所述服务查询信息的目标意图信息。
4.根据权利要求1所述的方法,其特征在于,所述句子粒度处理任务包括服务类目预测任务;
所述根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务,包括:将所述特殊符号对应的目标向量输入到用于预测服务类目的服务类目预测模型中,获得所述服务查询信息对应的目标服务类目信息。
5.根据权利要求1所述的方法,其特征在于,所述词粒度处理任务包括实体识别任务;
所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于识别实体的实体识别模型中,获得所述服务查询信息中的实体信息。
6.根据权利要求1所述的方法,其特征在于,所述词粒度处理任务包括词权重预测任务;
所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于预测词权重的词权重预测模型中,获得所述每个词在所述服务查询信息中的权重数据。
7.根据权利要求1所述的方法,其特征在于,所述词粒度处理任务包括词紧密度预测任务;
所述根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务,包括:将所述每个词对应的目标向量输入到用于预测词紧密度的词紧密度预测模型中,获得所述每个词中除第一个词之外的任意一个词与所述任意一个词的相邻前一个词之间的紧密度数据。
8.一种信息处理装置,其特征在于,包括:
查询信息获取单元,用于获得服务查询信息;
分词处理单元,用于对所述服务查询信息进行分词处理,获得分词处理后的服务查询信息,所述分词处理后的服务查询信息包括用于表示所述服务查询信息完整语句的特殊符号和所述服务查询信息中的每个词;
目标向量获取单元,用于获得所述分词处理后的服务查询信息对应的服务查询信息目标向量集,所述服务查询信息目标向量集包括所述特殊符号对应的目标向量和所述每个词对应的目标向量;
句子粒度任务处理单元,用于如果对所述服务查询信息执行句子粒度处理任务,则根据所述特殊符号对应的目标向量对所述服务查询信息执行句子粒度处理任务;
词粒度任务处理单元,用于如果对所述服务查询信息执行词粒度处理任务,则根据所述每个词对应的目标向量对所述服务查询信息执行词粒度处理任务。
9.一种电子设备,其特征在于,包括:
处理器;
存储器,用于存储方法的程序,所述程序在被所述处理器读取执行时,执行权利要求1-7任意一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述程序被执行时实现权利要求1-7任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110165933.6A CN112507203B (zh) | 2021-02-05 | 2021-02-05 | 一种信息处理方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110165933.6A CN112507203B (zh) | 2021-02-05 | 2021-02-05 | 一种信息处理方法、装置、电子设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112507203A CN112507203A (zh) | 2021-03-16 |
CN112507203B true CN112507203B (zh) | 2021-05-07 |
Family
ID=74953175
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110165933.6A Active CN112507203B (zh) | 2021-02-05 | 2021-02-05 | 一种信息处理方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112507203B (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11487939B2 (en) * | 2019-05-15 | 2022-11-01 | Salesforce.Com, Inc. | Systems and methods for unsupervised autoregressive text compression |
CN110222188B (zh) * | 2019-06-18 | 2023-04-18 | 深圳司南数据服务有限公司 | 一种多任务学习的公司公告处理方法及服务端 |
CN110889003B (zh) * | 2019-11-20 | 2022-05-03 | 中山大学 | 一种基于文本的车辆图像细粒度检索系统 |
CN111539228B (zh) * | 2020-04-29 | 2023-08-08 | 支付宝(杭州)信息技术有限公司 | 向量模型训练方法及装置、相似度确定方法及装置 |
-
2021
- 2021-02-05 CN CN202110165933.6A patent/CN112507203B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112507203A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11899681B2 (en) | Knowledge graph building method, electronic apparatus and non-transitory computer readable storage medium | |
CN110019616B (zh) | 一种poi现势状态获取方法及其设备、存储介质、服务器 | |
US20130138636A1 (en) | Image Searching | |
CN111522927B (zh) | 基于知识图谱的实体查询方法和装置 | |
WO2017066543A1 (en) | Systems and methods for automatically analyzing images | |
US20120117051A1 (en) | Multi-modal approach to search query input | |
CN111078776A (zh) | 数据表的标准化方法、装置、设备及存储介质 | |
JP7254925B2 (ja) | 改良されたデータマッチングのためのデータレコードの字訳 | |
CN109190007A (zh) | 数据分析方法及装置 | |
CN110737774A (zh) | 图书知识图谱的构建、图书推荐方法、装置、设备及介质 | |
CN111325022A (zh) | 识别层级地址的方法和装置 | |
CN110363206B (zh) | 数据对象的聚类、数据处理及数据识别方法 | |
US10963686B2 (en) | Semantic normalization in document digitization | |
CN110895587B (zh) | 用于确定目标用户的方法和装置 | |
CN117033744A (zh) | 数据查询方法、装置、存储介质以及电子设备 | |
CN112507203B (zh) | 一种信息处理方法、装置、电子设备以及存储介质 | |
CN116756281A (zh) | 知识问答方法、装置、设备和介质 | |
CN111078724A (zh) | 学习系统中的测试题检索方法、装置、设备及存储介质 | |
CN108460131B (zh) | 一种分类标签处理方法及装置 | |
CN115496057A (zh) | 一种产品技术资料管理方法、装置、设备及介质 | |
CN112579774A (zh) | 模型训练方法、模型训练装置及终端设备 | |
CN111597368A (zh) | 一种数据处理方法及装置 | |
CN111444345A (zh) | 菜品名称分类方法及装置 | |
CN113312396B (zh) | 一种基于大数据的元数据处理方法及设备 | |
CN111241893A (zh) | 一种标识识别方法、装置及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |