CN111858839B - 响应用户端请求的处理装置和处理方法 - Google Patents
响应用户端请求的处理装置和处理方法 Download PDFInfo
- Publication number
- CN111858839B CN111858839B CN201910300816.9A CN201910300816A CN111858839B CN 111858839 B CN111858839 B CN 111858839B CN 201910300816 A CN201910300816 A CN 201910300816A CN 111858839 B CN111858839 B CN 111858839B
- Authority
- CN
- China
- Prior art keywords
- vocabulary
- training
- word
- feature vector
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 36
- 238000003672 processing method Methods 0.000 title abstract description 13
- 239000013598 vector Substances 0.000 claims abstract description 477
- 238000012549 training Methods 0.000 claims abstract description 212
- 230000004044 response Effects 0.000 claims abstract description 18
- 230000011218 segmentation Effects 0.000 claims description 71
- 238000000034 method Methods 0.000 claims description 32
- 238000004590 computer program Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 52
- 230000008569 process Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例提供了一种响应用户端请求的处理装置和处理方法,其中,该装置包括:获取模块,用于获取历史出行数据中的样本语料,所述样本语料包括在历史出行数据中用户端与出行服务平台之间的多条会话条目;生成模块,基于所述样本语料,生成初始特征向量;所述初始特征向量包括在会话条目中具有上下文关系的各词汇分别对应的多种特征向量;训练模块,将所述初始特征向量按照对应词汇的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量;响应模块基于训练得到的所述校准后的特征向量,响应用户端的访问请求。本申请实施例能够提高在出行领域中响应用户端访问请求的准确度。
Description
技术领域
本申请涉及信息技术领域,具体而言,涉及一种响应用户端请求的处理装置和处理方法。
背景技术
一个词汇一般对应多种特征向量,不同特征向量具有的含义不同,如,表征词汇的含义、表征词汇中包含的字的含义、表征词汇中包含的字的偏旁结构,词的特征向量可以应用于各种不同业务需求中,比如对用户的问题进行语义分析等。
目前,在确定各种词的特征向量时,一般是基于维基百科实现的,也就是,从维基百科中获取大量的文本,进行词汇提取、处理得到各个词的特征向量,再将这些特征向量应用到不同的业务场景中。
发明内容
有鉴于此,本申请实施例的目的在于提供一种响应用户端请求的处理装置和处理方法,以提高在出行领域中响应用户端访问请求的准确度。
第一方面,本申请实施例提供了一种响应用户端请求的处理装置,该装置包括:
获取模块,用于获取历史出行数据中的样本语料,所述样本语料包括在历史出行数据中用户端与出行服务平台之间的多条会话条目;
生成模块,用于基于所述获取模块获取的所述样本语料,生成初始特征向量;所述初始特征向量包括每个词汇分别对应的多种特征向量;
训练模块,用于将所述生成模块生成的所述初始特征向量按照对应词汇在会话条目中的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量;
响应模块,用于基于所述训练模块训练得到的所述校准后的特征向量,响应用户端的访问请求。
可选地,所述生成模块具体用于:
按照产生时间由远及近的顺序,对所述多条会话条目进行拼接处理;
从拼接处理后的所述多条会话条目中去除干扰条目;
对去除干扰条目的所述多条会话条目进行分词处理,得到分词语料库;
基于所述分词语料库,生成所述初始特征向量。
可选地,所述训练模块具体用于:
根据所述特征向量校准模型对应的目标词汇数目和所述分词语料库中各分词之间的上下文关系,生成多个词汇集;其中每个词汇集中包括的词汇数目等于所述目标词汇数目,且同一词汇集中的各个词汇之间具有上下文关系;
将每个词汇集中包含的各词汇对应的初始特征向量作为所述特征向量校准模型的输入特征,将相应词汇的词标识作为所述特征向量校准模型的输出特征,对所述特征向量校准模型进行训练,得到所述分词语料库中每个词汇分别对应的多种校准后的特征向量。
可选地,所述训练模块还用于根据以下步骤对所述特征向量校准模型进行训练:
从当前次训练对应的当前词汇集中确定中心词汇和与所述中心词汇相邻、且具有上下文关系的非中心词汇;
将所述当前词汇集中的中心词汇对应的初始特征向量、非中心词汇对应的初始特征向量作为所述特征向量校准模型的输入特征,将所述中心词汇的词标识作为所述特征向量校准模型的输出特征,对所述特征向量校准模型进行训练,得到所述当前词汇集中非中心词汇对应的多种校准后的特征向量;
在得到所述当前词汇集中非中心词汇对应的多种校准后的特征向量后,利用该多种校准后的特征向量,更新下一次训练对应的下一个词汇集中各词汇的初始特征向量,将下一个词汇集作为当前词汇集,执行所述从当前次训练对应的当前词汇集中确定中心词汇和与所述中心词汇相邻的且具有上下文关系的非中心词汇的步骤,直到得到所有词汇集中非中心词汇对应的多种校准后的特征向量为止。
可选地,所述装置还包括:调整模块,所述调整模块具体用于:
根据所述训练模块训练得到的所述当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、中心词汇对应的表示向量,以及当前次训练对应的分词语料库中每个词汇对应的表示向量,确定当前次训练对应的损失函数值;
按照使得所述当前次训练对应的损失函数值最小的原则,调整所述当前词汇集对应的多种校准后的特征向量,并更新当前次训练对应的语料库中每个词汇对应的表示向量,将下一次训练对应的下一个词汇集作为当前次训练对应的当前词汇集,执行所述根据得到的所述当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、中心词汇对应的表示向量,以及当前次训练对应的语料库中每个词汇对应的表示向量,确定当前次训练对应的损失函数值的步骤,直到调整完所有词汇集对应的多种校准后的特征向量为止。
可选地,所述调整模块还用于:
根据所有次训练对应的损失函数值,确定总损失函数值;
按照使得总损失函数值最小的原则,调整所述分词语料库中每个词汇分别对应的多种校准后的特征向量。
可选地,所述多种特征向量至少包括表征词汇语义的词汇语义特征向量、表征字语义的字语义特征向量和表征偏旁结构的偏旁特征向量。
可选地,所述调整模块具体用于:
针对所述当前次训练对应的当前词汇集中每种校准后的特征向量,确定该当前词汇集中的非中心词汇对应的该种校准后的特征向量的平均向量;
基于确定的该当前次训练对应的当前词汇集中非中心词汇对应的多种平均向量、中心词汇对应的表示向量,以及该当前次训练对应的语料库中每个词汇对应的表示向量,确定该当前次训练对应的损失函数值。
可选地,所述响应模块具体用于:
获取所述用户端的访问请求,所述访问请求中携带有至少一个具有上下文关系的访问词汇;
从训练得到的所述校准后的特征向量中,分别确定与每个访问词汇对应的校准后的特征向量;
将确定的校准后的特征向量按照所述访问词汇的上下文关系输入到预先设置的请求识别模型中,识别所述用户端的请求意图,并将识别结果反馈给所述用户端。
第二方面,本申请实施例提供了一种响应用户端请求的处理方法,该方法括:
获取历史出行数据中的样本语料,所述样本语料包括在历史出行数据中用户端与出行服务平台之间的多条会话条目;
基于所述样本语料,生成初始特征向量;所述初始特征向量包括每个词汇分别对应的多种特征向量;
将所述初始特征向量按照对应词汇在会话条目中的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量;
基于训练得到的所述校准后的特征向量,响应用户端的访问请求。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如上述方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法的步骤。
本申请实施例提供的响应用户端请求的处理装置,生成模块基于接收到的获取模块发送的针对用户端与出行服务平台之间的样本语料,生成初始特征向量,初始特征向量包括在会话条目中具有上下文关系的各词汇分别对应的多种特征向量,通过训练模块将初始特征向量按照对应词汇的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量,通过响应模块基于接收到的训练模块发送的训练得到的校准后的特征向量,响应用户端的访问请求。这样,利用出行领域的样本语料确定针对出行领域的词汇的特征向量,得到特征向量表征的词汇含义与出行领域词汇的含义更贴近,从而在将得到的特征向量应用于出行领域中的用户请求响应时,可以提高响应的准确度,进而提高出行服务平台的服务质量。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种响应用户端请求的处理装置的第一种结构示意图;
图2示出了本申请实施例所提供的一种响应用户端请求的处理装置的第二种结构示意图;
图3示出了本申请实施例所提供的一种响应用户端请求的处理方法的第一种流程示意图;
图4示出了本申请实施例所提供的一种响应用户端请求的处理方法的第二种流程示意图;
图5示出了本申请实施例所提供的一种响应用户端请求的处理方法的第三种流程示意图;
图6示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“出行场景”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕对出行场景进行描述,但是应该理解,这仅是一个示例性实施例。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请中的术语“乘客”、“请求方”、“服务请求方”和“客户”可互换使用,以指代可以请求或订购服务的个人、实体或工具。本申请中的术语“司机”、“提供方”、“服务提供方”和“供应商”可互换使用,以指代可以提供服务的个人、实体或工具。本申请中的术语“用户”可以指代请求服务、订购服务、提供服务或促成服务的提供的个人、实体或工具。例如,用户可以是乘客、驾驶员、操作员等,或其任意组合。在本申请中,“乘客”和“乘客终端”可以互换使用,“驾驶员”和“驾驶员终端”可以互换使用。
本申请中的术语“服务请求”和“订单”可互换使用,以指代由乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合发起的请求。接受该“服务请求”或“订单”的可以是乘客、服务请求方、司机、服务提供方、或供应商等、或其任意组合。服务请求可以是收费的或免费的。
本申请实施例可以服务于出行服务平台,该出行服务平台用于根据接收的用户端的出行服务请求为用户提供相应的服务。出行服务平台可以包括多个打车系统,如包括出租车打车系统、快车打车系统、专车打车系统、顺风车打车系统等。
本申请实施例的响应用户端请求的处理方法可以应用于出行服务平台的服务器,也可以应用于其它任意具有处理功能的计算设备。在一些实施例中,上述服务器或计算设备可以包括处理器。处理器可以处理与服务请求有关的信息和/或数据,以执行本申请中描述的一个或多个功能。
目前,用户在使用出行服务平台出行时,用户端向出行服务平台发送出行请求,出行服务平台根据接收到的用户端的出行请求中携带的内容,以及获取的词汇的多种特征向量,预测用户的出行意图,其中,多种特征向量可以为表征词汇的含义的词汇语义特征向量、表征字的含义的字语义特征向量、表征字的偏旁结构的特征向量;目前获取的词汇的特征向量主要是利用维基百科通过模型训练得到的。
在利用维基百科确定词汇的特征向量时,一般是从维基百科爬取大量的样本语料,对样本语料进行切词处理,得到样本词汇集,将样本词汇集中每个词汇对应的初始特征向量输入到预先构建的模型中进行训练,以对各个词汇的初始特征向量进行校准,将得到的校准后的特征向量应用于各个领域的各项任务中,而在特征向量被应用过程中,词汇的特征向量表征的词汇的含义与应用领域中词汇的含义越接近,那么,得到的词汇的特征向量的应用准确度越高。
不同的词汇在不同领域具有不同的含义,如,流量在通信领域指代移动端的数据流量,在交通领域指定点的车辆和行人,在自媒体领域指代文章的访问量等等,在将基于维基百科确定的词汇的特征向量应用于出行领域时,由于维基百科针对的领域比较宽泛,没有针对性,因此,在将通过维基百科确定的词汇的特征向量应用于出行服务领域确定用户的出行意图时,利用维基百科确定的词汇的特征向量表征的词汇含义与出行服务领域中的词汇的含义可能相差较远,因此,上述词汇的特征向量在出行服务领域应用时应用准确度会较差。
为了便于描述,本文通过确定针对出行领域的词汇的特征向量,以便于在接收到用户端的请求时,高效、准确地确定用户端的意图,基于此目的,本申请针对出行领域,通过获取在出行领域的历史出行数据中用户端与出行服务平台之间的多条会话条目,形成样本语料,并确定包括在会话条目中具有上下文关系的各词汇分别对应的多种特征向量(初始特征向量),将初始特征向量按照对应词汇的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量,这样,得到的校准后的特征向量表征的词汇的含义更加贴近出行领域中词汇的含义,从而在将基于出行领域的样本语料生成的特征向量应用于出行领域时,能够提高特征向量的应用准确度,进而满足用户端的请求,提高用户端的感受度,同时,提高出行服务平台的服务质量。本申请实施例将基于该思想进行详细描述。
针对上述情况,本申请实施例提供了一种响应用户端请求的处理装置,应用于后台服务器,如图1所示,该装置包括:获取模块11、生成模块12、训练模块13、响应模块14。
获取模块11,用于获取历史出行数据中的样本语料,所述样本语料包括在历史出行数据中用户端与出行服务平台之间的多条会话条目。
这里,历史出行数据一般是从出行服务平台获取的,历史出行数据包括历史订单中的服务请求端与出行服务平台之间的多条会话条目、服务提供端与出行服务平台之间的多条会话条目、服务请求端和服务提供端之间的多条会话条目、服务请求端的出发地和目的地、出行服务时长、服务请求端的评价信息、服务提供端的评价信息等,一般地,将历史订单中包含的多条会话条目作为样本语料,用户端至少包括服务请求端、服务提供端等;会话条目为用户端向出行服务平台发送的出行请求中携带的语料,或者为出行服务平台根据接收到的用户端的出行请求返回的反馈语料,例如,用户端的出行请求携带的内容为“我想取消订单”,“我想取消订单”则为一条会话条目。
生成模块12,用于基于所述获取模块11获取的所述样本语料,生成初始特征向量;所述初始特征向量包括每个词汇分别对应的多种特征向量。
这里,多种特征向量至少包括表征词汇语义的词汇语义特征向量、表征字语义的字语义特征向量和表征偏旁结构的偏旁特征向量,每种特征向量的维度一般为200维,在实际应用中,维度可以根据实际情况确定;词汇一般为一条会话条目中的词汇,如,会话条目为“欢迎进入人工客服”,会话条目中包含的“欢迎”、“进入”、“人工”、“客服”,“欢迎”、“进入”、“人工”、“客服”为具有上下文关系的词汇,“欢迎”对应的多种特征向量分别为“欢迎”对应的词汇语义特征向量、“欢”和“迎”分别对应的字语义特征向量、“欢”和“迎”分别对应的偏旁特征向量,“进入”、“人工”的初始特征向量可参考“欢迎”的初始特征向量。
生成模块12在基于所述语料生成初始特征向量时,具体包括以下步骤:
按照产生时间由远及近的顺序,对所述多条会话条目进行拼接处理;
从拼接处理后的所述多条会话条目中去除干扰条目;
对去除干扰条目的所述多条会话条目进行分词处理,得到分词语料库;
基于所述分词语料库,生成所述初始特征向量。
这里,产生时间为用户端发送出行请求的时间,或者出行服务平台反馈用户端的请求的时间;干扰条目一般为非文字字符,如,标点符号、英文字符、数字等;在进行分词处理时,可以利用分词器对会话条目进行分词处理,分词器包括ansj分词器、Hanlp分词器、结巴分词、oracle_sdk分词等,可以根据实际情况确定。
在具体实施过程中,在获取到用户端与出行服务平台之间的多条会话条目后,按照会话条目的产生时间由远及近的顺序,依次将会话条目进行顺次连接。
若不去除非中文字符,在后续通过训练模型确定词汇的特征向量时,每一次对模型进行训练均需要将非中文字符输入模型,增加了训练次数,降低了训练效率,因此,为了提高训练效率,以及为了减少数字、标点符号、特殊符号等对后续确定的词汇的特征向量的影响,需要将非中文字符从顺次连接的多个会话条目中去除。
在从顺次连接的多个会话条目中去除非中文字符后,需要对去除非中文字符的多个会话条目进行分词处理,以将多个会话条目切割成多个词汇,生成分词语料库,在得到分词语料库后,可以将利用维基百科得到的词汇的多种特征向量,作为分词语料库中每个词汇的初始特征向量,也可以根据词汇在出行服务场景的应用情况为每个词汇确定初始特征向量,可以根据实际情况确定,本申请对此不予限制。其中,初始特征向量的维度一般为200维,也可以根据实际情况确定。
例如,会话条目包括“欢迎进入人工客服。”、“我想取消订单。”,按照对话顺序对会话条目进行顺次连接得到“欢迎您进入人工客服。我想取消订单。”,进一步,将顺次连接的多条会话条目中的非中文字符清除得到“欢迎您进入人工客服我想取消订单”,对去除非中文字符的多条会话条目进行分词处理得到“欢迎”、“您”、“进入”、“人工”、“客服”、“我”、“想”、“取消”、“订单”,形成分词语料库。
训练模块13,用于将所述生成模块12生成的所述初始特征向量按照对应词汇在会话条目中的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量。
这里,特征向量校准模型可以是但不限于卷积神经网络模型(ConvolutionalNeural Network,CNN)、时间递归神经网络模型(Long Short-Term Memory,LSTM)、循环神经网络模型(Recurrent Neural Network,RNN)等,可以根据实际情况确定;词汇的上下文关系一般为会话条目中各个词汇之间上下文关系,如,会话条目为“欢迎进入人工客服”,会话条目中包含的“欢迎”、“进入”、“人工”、“客服”词汇,排序为“欢迎”、“进入”、“人工”、“客服”的词汇为具有上下文关系的词汇。
在将所述初始特征向量按照对应词汇的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量,包括:
根据所述特征向量校准模型对应的目标词汇数目和所述分词语料库中各分词之间的上下文关系,生成多个词汇集;其中每个词汇集中包括的词汇数目等于所述目标词汇数目,且同一词汇集中的各个词汇之间具有上下文关系;
将每个词汇集中包含的各词汇对应的初始特征向量作为所述特征向量校准模型的输入特征,将相应词汇的词标识作为所述特征向量校准模型的输出特征,对所述特征向量校准模型进行训练,得到所述分词语料库中每个词汇分别对应的多种校准后的特征向量。
这里,目标词汇数目一般为预先设置的,目标词汇数目可以为3、5、6等,可根据实际情况确定;词汇集的数目一般可以根据分词数据库中词汇的数目和目标词汇数目确定,不同词汇集包含的词汇的数目可以相同也可以不同,每个词汇集中包含的词汇的数目与目标词汇数目相同;词标识可以为编号,例如,数字等。
在具体实施过程中,在将初始特征向量输入到特征向量校准模型进行校准之前,可以根据预先设置的针对分词语料库的超参数(如目标词汇数目以及激活函数),确定特征向量校准模型的类型,不同的超参数确定不同的特征向量校准模型,也就是,在对根据不同的超参数确定的特征向量校准模型进行训练时,模型的输入特征的数目不同;不同的特征向量校准模型训练得到的校准后的特征向量的准确度不同,损失函数值越小对应的特征向量校准模型的准确度越高,因此,在对初始特征向量进行校准时,可以通过多种特征向量校准模型同时进行训练,根据每种特征向量校准模型对应的损失函数值,选择基于对应的损失函数值最小的特征向量校准模型得到的校准后的特征向量作为分词语料库中每个词汇分别对应的多种校准后的特征向量,以下以一种特征向量校准模型为例进行说明,其它类型的特征向量校准模型的训练过程可参考一下示例。
在对特征向量校准模型进行训练之前,根据特征向量校准模型对应的目标词汇数目,按照分词语料库中各分词之间的上下文关系,依次从分词语料库中确定该对应上述目标词汇数目的词汇,得到多个词汇集。
例如,为了方便描述这里仅以分词语料库中包含的部分词汇为例进行说明,分词语料库中包含的词汇为{欢迎,您,进入,人工,客服,时间},目标词汇的数目为3,那么得到4个词汇集,分别为{欢迎,您,进入}、{您,进入,人工}、{进入,人工,客服}、{人工,客服,时间}。
在得到多个词汇集后,针对每个词汇集,将该词汇集中包含的各词汇对应的初始特征向量作为特征向量校准模型的输入特征,将该词汇集中相应词汇的词标识作为特征向量校准模型的输出特征,对特征向量校准模型进行训练,得到各词汇集中相应词汇对应的多种校准后的特征向量,得到分词语料库中每个词汇分别对应的多种校准后的特征向量。
对特征向量校准模型进行训练,训练模块13根据以下步骤对所述特征向量校准模型进行训练:
从当前次训练对应的当前词汇集中确定中心词汇和与所述中心词汇相邻、且具有上下文关系的非中心词汇;
将所述当前词汇集中的中心词汇对应的初始特征向量、非中心词汇对应的初始特征向量作为所述特征向量校准模型的输入特征,将所述中心词汇的词标识作为所述特征向量校准模型的输出特征,对所述特征向量校准模型进行训练,得到所述当前词汇集中非中心词汇对应的多种校准后的特征向量;
在得到所述当前词汇集中非中心词汇对应的多种校准后的特征向量后,利用该多种校准后的特征向量,更新下一次训练对应的下一个词汇集中各词汇的初始特征向量,将下一个词汇集作为当前词汇集,执行所述从当前次训练对应的当前词汇集中确定中心词汇和与所述中心词汇相邻的且具有上下文关系的非中心词汇的步骤,直到得到所有词汇集中非中心词汇对应的多种校准后的特征向量为止。
这里,中心词汇可以为词汇集中处于中间位置的词汇,也可以为非中间位置的词汇,一般地,选择词汇集中处于中间位置的词汇;非中心词汇为相应词汇集中除中心词外的其它词汇。
在具体实施过程中,从分词语料库对应的多个词汇集中,选择一个词汇集作为当前词汇集,按照分词语料库中的词汇的先后顺序依次确定当前词汇集,直到分词语料库中的最后一个词汇集为止。
在确定当前词汇集后,从当前次训练对应的当前词汇集中确定中心词汇(一个词汇)和非中心词汇(至少两个词汇),将当前词汇集中的中心词汇对应的偏旁特征向量,以及非中心词汇中每个词汇对应的词汇语义特征向量、包含的每个字的字语义特征向量和偏旁特征向量作为特征向量校准模型的输入特征,将中心词汇的词标识作为特征向量校准模型的输出特征,对特征向量校准模型进行训练,得到当前词汇集中非中心词汇中每个词汇的对应的多种校准后的特征向量,也就是,得到非中心词汇中每个词汇对应的校准后的词汇语义特征向量、包含的字的校准后的字语义特征向量和偏旁特征向量。
在得到当前词汇集中非中心词汇对应的多种校准后的特征向量后,从多个词汇集中,选择与当前词汇集相邻的下一个词汇集,进行下一次训练。
在进行下一次训练之前,利用得到的多种校准后的特征向量对下一个词汇集中的初始特征向量进行更新,也就是,将下一个词汇中与当前词汇集中相同的词汇的初始特征向量更新为当前词汇集中相应词汇的校准后的特征向量,这样,可以提高下一次训练得到的校准后的特征向量的应用准确度。
将下一个词汇集作为当前词汇集,执行从当前次训练对应的当前词汇集中确定中心词汇和与所述中心词汇相邻的且具有上下文关系的非中心词汇的步骤,直到得到所有词汇集中非中心词汇对应的多种校准后的特征向量为止。
例如,延续上一个示例,以得到的四个词汇集为例进行说明,词汇集分别为A1:{欢迎,您,进入}、A2:{您,进入,人工}、A3:{进入,人工,客服}、A4:{人工,客服,时间},将A1词汇集作为当前词汇集,A1词汇集中的中心词汇为“您”、非中心词汇为“欢迎”、“进入”,将A1词汇集中“您”对应的偏旁向量、“欢迎”对应的词汇语义特征向量、“进入”对应的词汇语义特恒向量、“欢”对应的字语义特征向量和偏旁特征向量、“迎”对应的字语义特征向量和偏旁特征向量、“进”对应的字语义特征向量和偏旁特征向量、“入”对应的字语义特征向量和偏旁特征向量作为特征向量校准模型的输入特征,将“您”的词标识作为特征向量校准模型的输出特征,对特征向量校准模型进行训练,得到“欢迎”、“进入”分别对应的校准后的词汇语义特征向量、“欢”、“迎”、“进”、“入”对应的校准后的字语义特征向量和校准后的偏旁特征向量。
随后,对A2词汇集中的词汇的初始特征向量进行更新,“您”对应的初始特征向量更新为校准后的词汇语义特征向量、校准后的字语义特征向量、校准后的偏旁特征向量,“进入”对应的初始特征响铃更新为校准后的词汇语义特征向量、包含的每个字的校准后的字语义特征向量和校准后的偏旁特征向量,将下一次训练对应的A2词汇集中作为当前次训练中的当前词汇集,将A2词汇集中的“进入”作为中心词汇,“您”和“人工”作为非中心词汇,将“进入”中每个字的校准后的偏旁特征向量、“您”的校准后的词汇语义特征向量、校准后的字语义特征向量、校准后的偏旁特征向量、“人工”的初始特征向量作为特征向量校准模型的输入特征,将“进入”的词标识作为特征向量校准模型的输入特征,对特征向量校准模型进行训练,得到“您”和“人工”对应的校准后的多种特征向量,其它词汇集中非中心词的多种特征向量的校准过程可以参考上述词汇集,本申请不一一进行叙述,直到得到分词语料库中每个词汇的多种校准后的特征向量位置。
为了进一步提高得到的校准后的特征向量的应用准确度,在特征向量校准模型训练过程,可以通过计算损失函数值对校准后的特征向量进行调整,参考图2,图2与图1中的响应用户端请求的处理装置相比,还包括调整模块15,所述调整模块15与所述训练模块13电连接,所述调整模块15具体用于:
根据得到的所述当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、中心词汇对应的表示向量,以及当前次训练对应的分词语料库中每个词汇对应的表示向量,确定当前次训练对应的损失函数值;
按照使得所述当前次训练对应的损失函数值最小的原则,调整所述当前词汇集对应的多种校准后的特征向量,并更新当前次训练对应的语料库中每个词汇对应的表示向量,将下一次训练对应的下一个词汇集作为当前次训练对应的当前词汇集,执行所述根据得到的所述当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、目标词汇对应的表示向量,以及当前次训练对应的语料库中每个词汇对应的表示向量,确定当前次训练对应的损失函数值的步骤,直到调整完所有词汇集对应的多种校准后的特征向量为止。
调整模块15在根据得到的当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、中心词汇对应的表示向量,以及所述当前次训练对应的分词语料库中每个词汇对应的表示向量,确定所述当前次训练对应的损失函数值时,还可以:
针对所述当前次训练对应的当前词汇集中每种校准后的特征向量,确定该当前词汇集中的非中心词汇对应的该种校准后的特征向量的平均向量;
基于确定的该当前次训练对应的当前词汇集中非中心词汇对应的多种平均向量、中心词汇对应的表示向量,以及该当前次训练对应的语料库中每个词汇对应的表示向量,确定该当前次训练对应的损失函数值。
这里,表示向量表征词汇在语义空间中的位置,表示向量的维度与初始特征向量的维度相同。
在具体实施过程中,在当前次训练完成后,针对当前次训练对应的当前词汇集中每种校准后的特征向量,确定该当前词汇集中的非中心词汇对应的该种校准后的特征向量的平均向量,也就是,非中心词汇包含的每个词汇对应的词汇语义特征向量、字语义特征向量、偏旁特征向量的平均向量;基于确定的该当前次训练对应的当前词汇集中非中心词汇对应的多种平均向量、中心词汇对应的表示向量,以及该当前次训练对应的语料库中每个词汇对应的表示向量,确定该当前次训练对应的损失函数值。
损失函数值的计算公式如下:
其中,L(wi)为第i次训练对应的中心词汇对应的损失函数值,不同的中心词汇对应不同次训练;为第i次训练对应的中心词汇在模型输入的上述中心词汇对应的第k种特征向量所对应的平均向量条件下的概率;α为实数,一般地为e;/>为第i次训练对应的非中心词汇包含的词汇对应的校准后的第k种特征向量的平均向量;/>为第i次训练对应的非中心词汇包含的词汇对应的校准后的第k种特征向量的平均向量的转置向量;/>为第i次训练对应的非中心词汇包含的词汇对应的校准后的词汇语义特征向量的平均向量,/>为第i次训练对应的非中心词汇包含的词汇所包含的字的校准后的字语义特征向量的平均向量,/>为第i次训练对应的非中心词汇包含的词汇所包含的字的校准后的偏旁向量的平均向量,/>为第i次训练对应的中心词汇对应的表示向量,j为正整数,j为分词语料库中第j个词汇,N为分词语料库中的词汇的数目。
按照使得当前次训练对应的损失函数值最小的原则,调整当前词汇集对应的多种校准后的特征向量,在调整当前词汇集对应的多种校准后的特征向量时,也会相应更新分词语料库中每个词汇对应的表示向量,在第一次训练时,分词语料库中每个词汇对应的表示向量为预先设置的,本申请不进行过多介绍。
在更新完当前次训练对应的语料库中每个词汇对应的表示向量,将下一次训练对应的下一个词汇集作为当前次训练对应的当前词汇集,执行根据得到的所述当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、目标词汇对应的表示向量,以及当前次训练对应的语料库中每个词汇对应的表示向量,确定当前次训练对应的损失函数值的步骤,直到调整完所有词汇集对应的多种校准后的特征向量为止。
例如,延续上一个示例,词汇集分别为A1:{欢迎,您,进入}、A2:{您,进入,人工}、A3:{进入,人工,客服}、A4:{人工,客服,时间},在对词汇集A1训练完成后,得到A1词汇集中非中心词汇对应的校准后的特征向量后,分别计算“欢迎”、“进入”对应的词汇语义特征向量的平均向量包含的字的字语义特征向量的平均向量/>包含的字的字语义特征向量的平均向量/>将计算的/>以及您的表示向量、分词语料库中每个词汇的表示向量输入到/>公式,得到/> 将/>输入到公式L(w1),使得L(w1)最小调整A1词汇集中每个非中心词汇对应的校准后的特征向量,其它词汇集中非中心词汇的调整过程与该示例相同,此处不进行一一叙述。
在得到每一次训练对应的损失函数值后,还可以进一步对校准后的特征向量进行调整,具体为:
根据所有次训练对应的损失函数值,确定总损失函数值;
按照使得总损失函数值最小的原则,调整所述分词语料库中每个词汇分别对应的多种校准后的特征向量。
在具体实施过程中,计算每一个训练对应的最小损失函数值的和值,将该和值作为总损失函数值,使得总损失函数值最小,对分词语料库中每个词汇对应的多种校准后的特征向量进行调整。
总损失函数值的计算公式如下:
其中,L(D)为所有中心词汇对应的总损失函数值,D为分词语料库中的所有词汇,m为分词语料库中包含的词汇的数目。
响应模块14,用于基于所述训练模块13训练得到的所述校准后的特征向量,响应用户端的访问请求。
响应模块14在基于训练得到的校准后的特征向量,响应用户端的访问请求时,具体包括:
获取所述用户端的访问请求,所述访问请求中携带有多个具有上下文关系的访问词汇;
从训练得到的所述校准后的特征向量中,分别确定与每个访问词汇对应的校准后的特征向量;
将确定的校准后的特征向量按照所述访问词汇的上下文关系输入到预先设置的请求识别模型中,识别所述用户端的请求意图,并将识别结果反馈给所述用户端。
这里,访问请求为用户端向出行服务平台发送的访问请求,请求识别模型是预先训练得到的,请求识别模型可以是但不限于卷积神经网络模型、长短期记忆网络模型等,可根据实际情况确定。
在具体实施过程中,接收用户端的访问请求,访问请求中可以携带有一条或多条会话条目,对接收到的会话条目进行切词处理,得到访问请求中包括的至少一个具有上下文关系的访问词汇,从分词语料库中,查询与访问词汇一致的词汇,将查询到的词汇对应的校准后的多种特征向量作为相应访问词汇对应的校准后的特征向量,将访问词汇对应的校准后的多种特征向量按照访问词汇的上下文关系输入到请求识别模型,识别用户端的请求意图,并将识别结果发送给用户端。其中,请求识别模型是预先完成训练的,训练请求识别模型的过程不进行过多说明。
在识别用户端的请求意图时,将出行服务领域中每个词汇的特征向量应用到请求识别模型中,由于使用的特征向量表征的词汇含义与出行服务领域中词汇的含义相同,因此,提高了请求识别模型识别结果的准确度。
例如,用户端发送的访问请求为“我要投诉”,对应的访问词汇为“我”、“要”、“投诉”,从校准后的多种特征向量中,确定每个访问词汇对应的校准后的多种特征向量,将“我”、“要”、“投诉”的校准后的多种特征向量输入到请求识别模型中,得到用户端的请求意图对应的标签为“首次申诉”,将该请求意图发送给相应的用户端。
本申请实施例提供的响应用户端请求的处理装置,生成模块基于接收到的获取模块发送的针对用户端与出行服务平台之间的样本语料,生成初始特征向量,初始特征向量包括在会话条目中具有上下文关系的各词汇分别对应的多种特征向量,通过训练模块将初始特征向量按照对应词汇的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量,通过响应模块基于接收到的训练模块发送的训练得到的校准后的特征向量,响应用户端的访问请求。这样,利用出行领域的样本语料确定针对出行领域的词汇的特征向量,得到特征向量表征的词汇含义与出行领域词汇的含义更贴近,从而在将得到的特征向量应用于出行领域中的用户请求响应时,可以提高响应的准确度,进而提高出行服务平台的服务质量。
参照图3所示,为本申请实施例提供的一种响应用户端请求的处理方法的示意图,该方法包括以下步骤:
S301,获取历史出行数据中的样本语料,所述样本语料包括在历史出行数据中用户端与出行服务平台之间的多条会话条目;
S302,基于所述样本语料,生成初始特征向量;所述初始特征向量包括每个词汇分别对应的多种特征向量;
S303,将所述初始特征向量按照对应词汇在会话条目中的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量;
S304,基于训练得到的所述校准后的特征向量,响应用户端的访问请求。
在执行步骤S302时,参考图4,具体包括以下步骤:
S401,按照产生时间由远及近的顺序,对所述多条会话条目进行拼接处理;
S402,从拼接处理后的所述多条会话条目中去除干扰条目;
S403,对去除干扰条目的所述多条会话条目进行分词处理,得到分词语料库;
S404,基于所述分词语料库,生成所述初始特征向量。
在执行步骤S303时,参考图5,包括以下步骤:
S501,根据所述特征向量校准模型对应的目标词汇数目和所述分词语料库中各分词之间的上下文关系,生成多个词汇集;其中每个词汇集中包括的词汇数目等于所述目标词汇数目,且同一词汇集中的各个词汇之间具有上下文关系;
S502,将每个词汇集中包含的各词汇对应的初始特征向量作为所述特征向量校准模型的输入特征,将相应词汇的词标识作为所述特征向量校准模型的输出特征,对所述特征向量校准模型进行训练,得到所述分词语料库中每个词汇分别对应的多种校准后的特征向量。
可选地,根据以下步骤对所述特征向量校准模型进行训练:
从当前次训练对应的当前词汇集中确定中心词汇和与所述中心词汇相邻、且具有上下文关系的非中心词汇;
将所述当前词汇集中的中心词汇对应的初始特征向量、非中心词汇对应的初始特征向量作为所述特征向量校准模型的输入特征,将所述中心词汇的词标识作为所述特征向量校准模型的输出特征,对所述特征向量校准模型进行训练,得到所述当前词汇集中非中心词汇对应的多种校准后的特征向量;
在得到所述当前词汇集中非中心词汇对应的多种校准后的特征向量后,利用该多种校准后的特征向量,更新下一次训练对应的下一个词汇集中各词汇的初始特征向量,将下一个词汇集作为当前词汇集,执行所述从当前次训练对应的当前词汇集中确定中心词汇和与所述中心词汇相邻的且具有上下文关系的非中心词汇的步骤,直到得到所有词汇集中非中心词汇对应的多种校准后的特征向量为止。
可选地,所述方法还包括:
根据得到的所述当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、中心词汇对应的表示向量,以及当前次训练对应的分词语料库中每个词汇对应的表示向量,确定当前次训练对应的损失函数值;
按照使得所述当前次训练对应的损失函数值最小的原则,调整所述当前词汇集对应的多种校准后的特征向量,并更新当前次训练对应的语料库中每个词汇对应的表示向量,将下一次训练对应的下一个词汇集作为当前次训练对应的当前词汇集,执行所述根据得到的所述当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、中心词汇对应的表示向量,以及当前次训练对应的语料库中每个词汇对应的表示向量,确定当前次训练对应的损失函数值的步骤,直到调整完所有词汇集对应的多种校准后的特征向量为止。
可选地,该方法还包括:
根据所有次训练对应的损失函数值,确定总损失函数值;
按照使得总损失函数值最小的原则,调整所述分词语料库中每个词汇分别对应的多种校准后的特征向量。
可选地,所述多种特征向量至少包括表征词汇语义的词汇语义特征向量、表征字语义的字语义特征向量和表征偏旁结构的偏旁特征向量。
可选地,根据得到的当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、中心词汇对应的表示向量,以及所述当前次训练对应的分词语料库中每个词汇对应的表示向量,确定所述当前次训练对应的损失函数值,包括:
针对所述当前次训练对应的当前词汇集中每种校准后的特征向量,确定该当前词汇集中的非中心词汇对应的该种校准后的特征向量的平均向量;
基于确定的该当前次训练对应的当前词汇集中非中心词汇对应的多种平均向量、中心词汇对应的表示向量,以及该当前次训练对应的语料库中每个词汇对应的表示向量,确定该当前次训练对应的损失函数值。
可选地,所述基于训练得到的所述校准后的特征向量,响应用户端的访问请求,包括:
获取所述用户端的访问请求,所述访问请求中携带有多个具有上下文关系的访问词汇;
从训练得到的所述校准后的特征向量中,分别确定与每个访问词汇对应的校准后的特征向量;
将确定的校准后的特征向量按照所述访问词汇的上下文关系输入到预先设置的请求识别模型中,识别所述用户端的请求意图,并将识别结果反馈给所述用户端。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
本申请实施例还提供了一种计算机设备60,如图6所示,为本申请实施例提供的计算机设备60结构示意图,包括:处理器61、存储器62、和总线63。所述存储器62存储有所述处理器61可执行的机器可读指令(比如,图1中的装置中获取模块11、生成模块12、训练模块13和响应模块14对应的执行指令等),当计算机设备60运行时,所述处理器61与所述存储器62之间通过总线63通信,所述机器可读指令被所述处理器61执行时执行如下处理:
获取历史出行数据中的样本语料,所述样本语料包括在历史出行数据中用户端与出行服务平台之间的多条会话条目;
基于所述样本语料,生成初始特征向量;所述初始特征向量包括每个词汇分别对应的多种特征向量;
将所述初始特征向量按照对应词汇在会话条目中的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量;
基于训练得到的所述校准后的特征向量,响应用户端的访问请求。
一种可能的实施方式中,处理器61执行的指令中,所述基于所述样本语料,生成初始特征向量,包括:
按照产生时间由远及近的顺序,对所述多条会话条目进行拼接处理;
从拼接处理后的所述多条会话条目中去除干扰条目;
对去除干扰条目的所述多条会话条目进行分词处理,得到分词语料库;
基于所述分词语料库,生成所述初始特征向量。
一种可能的实施方式中,处理器61执行的指令中,所述将所述初始特征向量按照对应词汇的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量,包括:
根据所述特征向量校准模型对应的目标词汇数目和所述分词语料库中各分词之间的上下文关系,生成多个词汇集;其中每个词汇集中包括的词汇数目等于所述目标词汇数目,且同一词汇集中的各个词汇之间具有上下文关系;
将每个词汇集中包含的各词汇对应的初始特征向量作为所述特征向量校准模型的输入特征,将相应词汇的词标识作为所述特征向量校准模型的输出特征,对所述特征向量校准模型进行训练,得到所述分词语料库中每个词汇分别对应的多种校准后的特征向量。
一种可能的实施方式中,处理器61执行的指令中,根据以下步骤对所述特征向量校准模型进行训练:
从当前次训练对应的当前词汇集中确定中心词汇和与所述中心词汇相邻、且具有上下文关系的非中心词汇;
将所述当前词汇集中的中心词汇对应的初始特征向量、非中心词汇对应的初始特征向量作为所述特征向量校准模型的输入特征,将所述中心词汇的词标识作为所述特征向量校准模型的输出特征,对所述特征向量校准模型进行训练,得到所述当前词汇集中非中心词汇对应的多种校准后的特征向量;
在得到所述当前词汇集中非中心词汇对应的多种校准后的特征向量后,利用该多种校准后的特征向量,更新下一次训练对应的下一个词汇集中各词汇的初始特征向量,将下一个词汇集作为当前词汇集,执行所述从当前次训练对应的当前词汇集中确定中心词汇和与所述中心词汇相邻的且具有上下文关系的非中心词汇的步骤,直到得到所有词汇集中非中心词汇对应的多种校准后的特征向量为止。
一种可能的实施方式中,处理器61执行的指令中,还包括:
根据得到的所述当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、中心词汇对应的表示向量,以及当前次训练对应的分词语料库中每个词汇对应的表示向量,确定当前次训练对应的损失函数值;
按照使得所述当前次训练对应的损失函数值最小的原则,调整所述当前词汇集对应的多种校准后的特征向量,并更新当前次训练对应的语料库中每个词汇对应的表示向量,将下一次训练对应的下一个词汇集作为当前次训练对应的当前词汇集,执行所述根据得到的所述当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、中心词汇对应的表示向量,以及当前次训练对应的语料库中每个词汇对应的表示向量,确定当前次训练对应的损失函数值的步骤,直到调整完所有词汇集对应的多种校准后的特征向量为止。
一种可能的实施方式中,处理器61执行的指令中,还包括:
根据所有次训练对应的损失函数值,确定总损失函数值;
按照使得总损失函数值最小的原则,调整所述分词语料库中每个词汇分别对应的多种校准后的特征向量。
所述多种特征向量至少包括表征词汇语义的词汇语义特征向量、表征字语义的字语义特征向量和表征偏旁结构的偏旁特征向量。
一种可能的实施方式中,处理器61执行的指令中,根据得到的当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、中心词汇对应的表示向量,以及所述当前次训练对应的分词语料库中每个词汇对应的表示向量,确定所述当前次训练对应的损失函数值,包括:
针对所述当前次训练对应的当前词汇集中每种校准后的特征向量,确定该当前词汇集中的非中心词汇对应的该种校准后的特征向量的平均向量;
基于确定的该当前次训练对应的当前词汇集中非中心词汇对应的多种平均向量、中心词汇对应的表示向量,以及该当前次训练对应的语料库中每个词汇对应的表示向量,确定该当前次训练对应的损失函数值。
一种可能的实施方式中,处理器61执行的指令中,所述基于训练得到的所述校准后的特征向量,响应用户端的访问请求,包括:
获取所述用户端的访问请求,所述访问请求中携带有多个具有上下文关系的访问词汇;
从训练得到的所述校准后的特征向量中,分别确定与每个访问词汇对应的校准后的特征向量;
将确定的校准后的特征向量按照所述访问词汇的上下文关系输入到预先设置的请求识别模型中,识别所述用户端的请求意图,并将识别结果反馈给所述用户端。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述响应用户端请求的处理方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述响应用户端请求的处理方法,从而解决现有技术中在出行服务领域应用特征向量的应用准确度低的问题,基于针对用户端与出行服务平台之间的样本语料,生成初始特征向量,初始特征向量包括在会话条目中具有上下文关系的各词汇分别对应的多种特征向量,将初始特征向量按照对应词汇的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量,基于训练得到的校准后的特征向量,响应用户端的访问请求。这样,利用出行领域的样本语料确定针对出行领域的词汇的特征向量,得到特征向量表征的词汇含义与出行领域词汇的含义更贴近,从而在将得到的特征向量应用于出行领域中的用户请求响应时,可以提高响应的准确度,进而提高出行服务平台的服务质量。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (12)
1.一种响应用户端请求的处理装置,其特征在于,该装置包括:
获取模块,用于获取历史出行数据中的样本语料,所述样本语料包括在历史出行数据中用户端与出行服务平台之间的多条会话条目;
生成模块,用于基于所述获取模块获取的所述样本语料,生成初始特征向量;所述初始特征向量包括每个词汇分别对应的多种特征向量;
训练模块,用于将所述生成模块生成的所述初始特征向量按照对应词汇在会话条目中的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量;
响应模块,用于基于所述训练模块训练得到的所述校准后的特征向量,响应用户端的访问请求。
2.如权利要求1所述的响应用户端请求的处理装置,其特征在于,所述生成模块具体用于:
按照产生时间由远及近的顺序,对所述多条会话条目进行拼接处理;
从拼接处理后的所述多条会话条目中去除干扰条目;
对去除干扰条目的所述多条会话条目进行分词处理,得到分词语料库;
基于所述分词语料库,生成所述初始特征向量。
3.如权利要求2所述的响应用户端请求的处理装置,其特征在于,所述训练模块具体用于:
根据所述特征向量校准模型对应的目标词汇数目和所述分词语料库中各分词之间的上下文关系,生成多个词汇集;其中每个词汇集中包括的词汇数目等于所述目标词汇数目,且同一词汇集中的各个词汇之间具有上下文关系;
将每个词汇集中包含的各词汇对应的初始特征向量作为所述特征向量校准模型的输入特征,将相应词汇的词标识作为所述特征向量校准模型的输出特征,对所述特征向量校准模型进行训练,得到所述分词语料库中每个词汇分别对应的多种校准后的特征向量。
4.如权利要求3所述的响应用户端请求的处理装置,其特征在于,所述训练模块还用于根据以下步骤对所述特征向量校准模型进行训练:
从当前次训练对应的当前词汇集中确定中心词汇和与所述中心词汇相邻、且具有上下文关系的非中心词汇;
将所述当前词汇集中的中心词汇对应的初始特征向量、非中心词汇对应的初始特征向量作为所述特征向量校准模型的输入特征,将所述中心词汇的词标识作为所述特征向量校准模型的输出特征,对所述特征向量校准模型进行训练,得到所述当前词汇集中非中心词汇对应的多种校准后的特征向量;
在得到所述当前词汇集中非中心词汇对应的多种校准后的特征向量后,利用该多种校准后的特征向量,更新下一次训练对应的下一个词汇集中各词汇的初始特征向量,将下一个词汇集作为当前词汇集,执行所述从当前次训练对应的当前词汇集中确定中心词汇和与所述中心词汇相邻的且具有上下文关系的非中心词汇的步骤,直到得到所有词汇集中非中心词汇对应的多种校准后的特征向量为止。
5.如权利要求4所述的响应用户端请求的处理装置,其特征在于,所述装置还包括:调整模块,所述调整模块具体用于:
根据所述训练模块训练得到的所述当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、中心词汇对应的表示向量,以及当前次训练对应的分词语料库中每个词汇对应的表示向量,确定当前次训练对应的损失函数值;
按照使得所述当前次训练对应的损失函数值最小的原则,调整所述当前词汇集对应的多种校准后的特征向量,并更新当前次训练对应的语料库中每个词汇对应的表示向量,将下一次训练对应的下一个词汇集作为当前次训练对应的当前词汇集,执行所述根据得到的所述当前次训练对应的当前词汇集中非中心词汇对应的多种校准后的特征向量、中心词汇对应的表示向量,以及当前次训练对应的语料库中每个词汇对应的表示向量,确定当前次训练对应的损失函数值的步骤,直到调整完所有词汇集对应的多种校准后的特征向量为止。
6.如权利要求5所述的响应用户端请求的处理装置,其特征在于,所述调整模块还用于:
根据所有次训练对应的损失函数值,确定总损失函数值;
按照使得总损失函数值最小的原则,调整所述分词语料库中每个词汇分别对应的多种校准后的特征向量。
7.如权利要求1所述的响应用户端请求的处理装置,其特征在于,所述多种特征向量至少包括表征词汇语义的词汇语义特征向量、表征字语义的字语义特征向量和表征偏旁结构的偏旁特征向量。
8.如权利要求5所述的响应用户端请求的处理装置,其特征在于,所述调整模块具体用于:
针对所述当前次训练对应的当前词汇集中每种校准后的特征向量,确定该当前词汇集中的非中心词汇对应的该种校准后的特征向量的平均向量;
基于确定的该当前次训练对应的当前词汇集中非中心词汇对应的多种平均向量、中心词汇对应的表示向量,以及该当前次训练对应的语料库中每个词汇对应的表示向量,确定该当前次训练对应的损失函数值。
9.如权利要求1所述的响应用户端请求的处理装置,其特征在于,所述响应模块具体用于:
获取所述用户端的访问请求,所述访问请求中携带有多个具有上下文关系的访问词汇;
从训练得到的所述校准后的特征向量中,分别确定与每个访问词汇对应的校准后的特征向量;
将确定的校准后的特征向量按照所述访问词汇的上下文关系输入到预先设置的请求识别模型中,识别所述用户端的请求意图,并将识别结果反馈给所述用户端。
10.一种响应用户端请求的处理方法,其特征在于,该方法括:
获取历史出行数据中的样本语料,所述样本语料包括在历史出行数据中用户端与出行服务平台之间的多条会话条目;
基于所述样本语料,生成初始特征向量;所述初始特征向量包括每个词汇分别对应的多种特征向量;
将所述初始特征向量按照对应词汇在会话条目中的上下文关系输入到预先构建的特征向量校准模型中,训练得到每个词汇分别对应的多种校准后的特征向量;
基于训练得到的所述校准后的特征向量,响应用户端的访问请求。
11.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求10所述的方法的步骤。
12.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求10所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910300816.9A CN111858839B (zh) | 2019-04-15 | 2019-04-15 | 响应用户端请求的处理装置和处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910300816.9A CN111858839B (zh) | 2019-04-15 | 2019-04-15 | 响应用户端请求的处理装置和处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111858839A CN111858839A (zh) | 2020-10-30 |
CN111858839B true CN111858839B (zh) | 2023-12-01 |
Family
ID=72951226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910300816.9A Active CN111858839B (zh) | 2019-04-15 | 2019-04-15 | 响应用户端请求的处理装置和处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111858839B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013155619A1 (en) * | 2012-04-20 | 2013-10-24 | Sam Pasupalak | Conversational agent |
CN109522393A (zh) * | 2018-10-11 | 2019-03-26 | 平安科技(深圳)有限公司 | 智能问答方法、装置、计算机设备和存储介质 |
-
2019
- 2019-04-15 CN CN201910300816.9A patent/CN111858839B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013155619A1 (en) * | 2012-04-20 | 2013-10-24 | Sam Pasupalak | Conversational agent |
CN109522393A (zh) * | 2018-10-11 | 2019-03-26 | 平安科技(深圳)有限公司 | 智能问答方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
基于词向量的中文词汇蕴涵关系识别;张志昌;周慧霞;姚东任;鲁小勇;;计算机工程(02);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111858839A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804641B (zh) | 一种文本相似度的计算方法、装置、设备和存储介质 | |
CN108170859B (zh) | 语音查询的方法、装置、存储介质及终端设备 | |
US11093854B2 (en) | Emoji recommendation method and device thereof | |
CN106951484B (zh) | 图片检索方法及装置、计算机设备及计算机可读介质 | |
JP7266674B2 (ja) | 画像分類モデルの訓練方法、画像処理方法及び装置 | |
CN108628830B (zh) | 一种语义识别的方法和装置 | |
CN107491547A (zh) | 基于人工智能的搜索方法和装置 | |
CN110874528B (zh) | 文本相似度的获取方法及装置 | |
CN108304377B (zh) | 一种长尾词的提取方法及相关装置 | |
EP2940551A1 (en) | Method and device for implementing voice input | |
CN110162637B (zh) | 信息图谱构建方法、装置及设备 | |
CN115688760B (zh) | 一种智能化导诊方法、装置、设备及存储介质 | |
CN111461301A (zh) | 序列化数据处理方法和装置、文本处理方法和装置 | |
CN113837669B (zh) | 一种标签体系的评价指标构建方法和相关装置 | |
CN111274822A (zh) | 语义匹配方法、装置、设备及存储介质 | |
CN110941951A (zh) | 文本相似度计算方法、装置、介质及电子设备 | |
CN110276243A (zh) | 分数映射方法、人脸比对方法、装置、设备及存储介质 | |
CN113128209A (zh) | 用于生成词库的方法及装置 | |
CN111368066A (zh) | 获取对话摘要的方法、装置和计算机可读存储介质 | |
CN114239559B (zh) | 文本纠错和文本纠错模型的生成方法、装置、设备和介质 | |
CN113191261B (zh) | 图像类别的识别方法、装置和电子设备 | |
CN113239693A (zh) | 意图识别模型的训练方法、装置、设备及存储介质 | |
CN110929499B (zh) | 文本相似度获取方法、装置、介质及电子设备 | |
CN112580620A (zh) | 标志图片处理方法、装置、设备和介质 | |
CN112115715A (zh) | 自然语言文本处理方法、装置、存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TG01 | Patent term adjustment | ||
TG01 | Patent term adjustment |