CN114143279B - 交互记录的采样方法、装置以及存储介质 - Google Patents

交互记录的采样方法、装置以及存储介质 Download PDF

Info

Publication number
CN114143279B
CN114143279B CN202010833048.6A CN202010833048A CN114143279B CN 114143279 B CN114143279 B CN 114143279B CN 202010833048 A CN202010833048 A CN 202010833048A CN 114143279 B CN114143279 B CN 114143279B
Authority
CN
China
Prior art keywords
data
sampling
interaction record
target interaction
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010833048.6A
Other languages
English (en)
Other versions
CN114143279A (zh
Inventor
乔宏利
蒋宁
王洪斌
权圣
何朋
杨春勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Jindezhu Intelligent Technology Co.,Ltd.
Original Assignee
Beijing Finite Element Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Finite Element Technology Co Ltd filed Critical Beijing Finite Element Technology Co Ltd
Publication of CN114143279A publication Critical patent/CN114143279A/zh
Application granted granted Critical
Publication of CN114143279B publication Critical patent/CN114143279B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5166Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请公开了一种交互记录的采样方法、装置以及存储介质,用于对语音机器人交互系统产生的交互记录进行采样。其中,该方法包括:从客户端接收请求对交互记录进行采样的采样请求,其中采样请求包括与采样需求相关的至少一个采样参数;响应于采样请求,根据至少一个采样参数确定与采样需求相匹配的目标交互记录;以及将目标交互记录发送至客户端。

Description

交互记录的采样方法、装置以及存储介质
技术领域
本申请涉及语音机器人交互技术领域,特别是涉及一种交互记录的采样方法、装置以及存储介质。
背景技术
基于语音机器人外呼中心的技术实现,可以代替人工电话完成的电销、售前、售后、回访、提醒、催收、调研、客户关怀等等各种商业场景的语音相关任务。商用语音机器人程序及装置,一般根据其目标任务,配置了固定的或半固定的话术,来限定机器人说话的内容,这样使得任务目标明确,语音内容管理方便。在线的语音机器人服务,机器人和客户的对话过程也有录音记录。
为优化语音机器人的话术内容和话术配置方式,提高机器人完成相应任务的能力,开发和运营人员往往需要经常抽样观察线上语音机器人和用户的对话过程,从中发现典型的问题,来确定改进方向。但是,面对海量的语音机器人和客户对话录音,难以一一人工检视,为此需要一套软件系统来辅助执行录音样本的抽样。
针对上述的现有技术中存在的对于大量的语音机器人和客户的对话记录,难以进行采样调查的技术问题,目前尚未提出有效的解决方案。
发明内容
本公开的实施例提供了一种交互记录的采样方法、装置以及存储介质,以至少解决现有技术中存在的对于大量的语音机器人和客户的对话记录,难以进行采样调查的技术问题。
根据本公开实施例的一个方面,提供了一种交互记录的采样方法,用于对语音机器人交互系统产生的交互记录进行采样,包括:从客户端接收请求对交互记录进行采样的采样请求,其中采样请求包括与采样需求相关的至少一个采样参数;响应于采样请求,根据至少一个采样参数确定与采样需求相匹配的目标交互记录;以及将目标交互记录发送至客户端。
根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
根据本公开实施例的另一个方面,还提供了一种交互记录的采样装置,用于对语音机器人交互系统产生的交互记录进行采样,包括:参数接收模块,用于从客户端接收请求对交互记录进行采样的采样请求,其中采样请求包括与采样需求相关的至少一个采样参数;数据采样模块,用于响应于采样请求,根据至少一个采样参数确定与采样需求相匹配的目标交互记录;以及数据发送模块,用于将目标交互记录发送至客户端。
根据本公开实施例的另一个方面,还提供了一种交互记录的采样装置,用于对语音机器人交互系统产生的交互记录进行采样,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:从客户端接收请求对交互记录进行采样的采样请求,其中采样请求包括与采样需求相关的至少一个采样参数;响应于采样请求,根据至少一个采样参数确定与采样需求相匹配的目标交互记录;以及将目标交互记录发送至客户端。
在本公开实施例中,用户需要从大量的交互记录中进行抽样调查时,只需要在客户端的界面输入相应的采样参数,系统服务器即可根据采样参数确定对应的目标交互记录,并通过客户端反馈给客户。与现有技术相比,本方案在采样的过程中降低了人工抽样的时间成本,并且通过采样参数的选择,采样的标准和维度也更灵活可控。因此解决了现有技术中存在的对于大量的语音机器人和客户的对话记录,难以进行采样调查的技术问题。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;
图2是根据本公开实施例1所述的语音机器人交互系统的示意图;
图3是根据本公开实施例1的第一个方面所述的交互记录的采样方法的流程示意图;
图4是根据本公开实施例1所述的采样过程的示意图;
图5是根据本公开实施例2所述的交互记录的采样装置的示意图;以及
图6是根据本公开实施例3所述的交互记录的采样装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本实施例,还提供了一种交互记录的采样方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例所提供的方法实施例可以在服务器或者类似的计算设备中执行。图1示出了一种用于实现交互记录的采样方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器可用于存储应用软件的软件程序以及模块,如本公开实施例中的交互记录的采样方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的交互记录的采样方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(NetworkInterfaceController,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算设备中的部件的类型。
图2是根据本实施例所述的语音机器人交互系统的示意图。参照图2所示,该系统包括:系统服务器200、与所述系统服务器200通信的数据库服务器300、数据缓存服务器400以及多个客户端,例如客户端210。
其中,数据库服务器300的数据库中记录了机器人每次服务的所有数据和上下文信息。具体地,数据库包含一个机器人登记表,表中记录了,机器人ID,机器人配置ID,机器人服务类型,机器人呼叫类型,机器人上线时间,机器人服务状态,机器人拨打计数等字段。数据库还包含一个机器人话术配置表,表中记录了,机器人ID,话术ID,话术序号,话术内容文本,话术语音合成方式。其中话术语音合成方式,包括录音合成,和TTS模型合成等。数据库还包含一个会话记录表,表中记录了每一次会话的详情信息。具体的,表中包含机器人ID,客户ID,呼叫类型,接通时间,挂断时间,挂断处机器人的话术ID,用户挂断后对机器人的评分,客户语音内容ASR结果。其中,呼叫类型,包括主叫和被叫。
数据缓存服务器400用于缓存热查询视图数据,当采样系统客户端发来的请求,命中缓存时,可以直接读取缓存中的数据并返回。
客户端210可以是一个WEB网站,供用户按需求设置采样条件,采样条件例如包括:机器人服务类型,机器人呼叫类型,机器人话术语音合成方式,电话接通时间范围,电话拨打时长范围,会话评分范围,用户说话内容检索关键字、采样方式,顺序采样指标,顺序采样排序方式,采样条数等。
所述系统服务器200可以接收用户在客户端210输入的采样请求,然后从数据库服务器300或者数据缓存服务器400获取与该采样请求对应的目标交互记录。需要说明的是,系统中的系统服务器200、数据库服务器300、数据缓存服务器400以及客户端210均可适用上面所述的硬件结构。
在上述运行环境下,根据本实施例的第一个方面,提供了一种交互记录的采样方法,该方法由图2中所示的系统服务器200实现。图3示出了该方法的流程示意图,参考图3所示,该方法包括:
S302:从客户端接收请求对交互记录进行采样的采样请求,其中采样请求包括与采样需求相关的至少一个采样参数;
S304:响应于采样请求,根据至少一个采样参数确定与采样需求相匹配的目标交互记录;以及
S306:将目标交互记录发送至客户端。
正如背景技术中所述的,为优化语音机器人的话术内容和话术配置方式,提高机器人完成相应任务的能力,开发和运营人员往往需要经常抽样观察线上语音机器人和用户的对话过程,从中发现典型的问题,来确定改进方向。但是,面对海量的语音机器人和客户对话录音,难以一一人工检视,为此需要一套软件系统来辅助执行录音样本的抽样。
针对背景技术中存在的技术问题,本实施例技术方案在步骤S302中,系统服务器200首先从客户端210接收请求对交互记录进行采样的采样请求,其中采样请求包括与采样需求相关的至少一个采样参数。在一个具体实例中,例如用户的采样需求为:针对最近七天内,外呼型机器人,跟用户通话时间超过5分钟,用户说话内容中包含”是的”关键字,且用户对通话评分低于3分的机器人服务会话样本(对应于目标交互记录)进行抽样调查,采样条数为5。则用户可以在该系统的客户端210的操作界面输入与采样需求相关的至少一个采样参数,例如:至少一个采样参数包括以下:
机器人研发人员,在客户端,选择如上条件:
机器人呼叫类型:主叫
电话接通时间范围:七天之前To今天
电话拨打时长范围:>5min
用户说话查询关键字:“是的”
会话评分范围:<3
采样方式:顺序采样
顺序采样指标:电话接通时间
顺序采样排序方式:从大到小
采样条数:5
其中该客户端210例如可以是web网站形式,还可以是APP形式,此处不做具体限定。在用户输入完采样参数后,客户端210可以生成相应的采样请求,并将采样请求发送至系统服务器200。在这种情况下,系统服务器200可以接收请求对交互记录进行采样的采样请求。
进一步地,在步骤S304中,系统服务器200响应于采样请求,然后根据至少一个采样参数确定与采样需求相匹配的目标交互记录。即系统服务器200查询与该采样参数对应的目标交互记录。
最终,在步骤S306中,系统服务器200将目标交互记录发送至客户端210。从而用户可以通过客户端210查看所要采样的数据。
从而通过这种方式,用户需要从大量的交互记录中进行抽样调查时,只需要在客户端的界面输入相应的采样参数,系统服务器即可根据采样参数确定对应的目标交互记录,并通过客户端反馈给客户。与现有技术相比,本方案在采样的过程中降低了人工抽样的时间成本,并且通过采样参数的选择,采样的标准和维度也更灵活可控。因此解决了现有技术中存在的对于大量的语音机器人和客户的对话记录,难以进行采样调查的技术问题。
可选地,根据至少一个采样参数确定与采样需求相匹配的目标交互记录,包括:根据至少一个采样参数确定系统的数据缓存空间中是否存在已经缓存且有效的与目标交互记录对应的缓存数据;以及在缓存数据存在的情况下,从数据缓存空间中获取缓存数据,并对数据进行反序列化得到目标交互记录。
具体地,参考图4所示,在根据至少一个采样参数确定与采样需求相匹配的目标交互记录的操作中,系统服务器200首先根据至少一个采样参数(对应于图4中的视图条件)确定系统的数据缓存空间(数据缓存服务器400)中是否存在已经缓存且有效的与目标交互记录对应的缓存数据,即系统服务器200根据采样参数判断数据缓存服务器400是否缓存有该目标交互记录。在具体实现上,系统服务器200首先判断数据缓存服务器400是否有与该目标交互记录对应的缓存数据,然后在该缓存数据存在的情况下,还需要进一步判断该缓存数据是否有效(例如:是否过期)。然后,在判断该缓存数据存在的情况下,系统服务器200从数据缓存服务器400中获取缓存数据,并且引用计数+1。由于缓存数据中的数据都是二进制数值,因此还需要对获取到的缓存数据进行反序列化得到目标交互记录。
从而通过这种方式,从数据缓存中直接获取该目标交互记录,不需要重新进行查询,因此可以提升采样速度,并且节省计算资源。
可选地,至少一个采样参数包括数据内容参数、数据排序参数以及采样条件参数,并且在缓存数据不存在的情况下,方法包括:在系统的数据库中查询与数据内容参数对应的多个交互记录;根据数据排序参数对每一多个交互记录进行排序,确定多个交互记录序列;以及根据采样条件参数,从多个交互记录序列中确定目标交互记录。
具体地,至少一个采样参数包括数据内容参数、数据排序参数以及采样条件参数,例如上述的用户输入的采样参数中,机器人呼叫类型、电话接通时间范围、拨打时长范围、用户说话查询关键字、会话评分范围对应于数据内容参数,采样方式、顺序采样指标、顺序采样排序方式对应于数据排序参数,采样条数对应于采样条件参数。参考图4所示,在判断缓存数据不存在的情况下,系统服务器200可以首先在系统的数据库中(数据库服务器300)查询与数据内容参数对应的多个交互记录(对应于图4中的从数据库中查询)。进一步地,系统服务器200根据数据排序参数对每多个交互记录进行排序,确定多个交互记录序列(对应于图4中的构建视图)。在一个具体实例中,系统服务器200对每条数据(交互记录)生成一个唯一的ID值加入交互记录内。然后,根据排序参数对视图内的数据做排序,得到每个排序条件唯一ID序列。比如:A序列是根据“电话接通时间”字段值进行排序后,顺序读取每个记录的唯一ID得到的序列。B序列是根据“电话拨打时长”参数进行排序,C序列是根据“用户评分”参数进行排序。其中每个交互记录序列对应于图4中的视图数据。最终,系统服务器200根据采样条件参数,从多个交互记录序列中确定目标交互记录。例如:从A序列中选择5条记录作为该目标交互记录(对应于图4中的数据抽样),并反馈至客户端210(对应于样本返回)。从而通过这种方式,可以根据用户输入的采样参数,从数据库中获取相应的目标交互记录进行返回。
可选地,系统的数据库中存储有记录机器人话术的第一数据表和用户语音内容的第二数据表,并且在系统的数据库中查询与数据内容参数对应的多个交互记录,包括:从第一数据表中查询与采样条件参数对应的多个机器人话术以及从第二数据表中查询与采样条件参数对应的多个用户语音内容;以及根据数据排序参数对每一多个交互记录进行排序,确定多个交互记录序列,包括:根据数据排序参数对多个机器人话术以及多个用户语音内容进行排序,确定多个交互记录序列。
具体地,数据库服务器300的数据库中存储有记录机器人话术的第一数据表和用户语音内容的第二数据表,并且在系统的数据库中查询与数据内容参数对应的多个交互记录的操作中,系统服务器200首先从第一数据表中查询与采样条件参数对应的多个机器人话术以及从第二数据表中查询与采样条件参数对应的多个用户语音内容。在一个具体实例中,系统服务器200在第一数据表查找这个机器人的话术文本列表,在第二数据表中查找对应的用户语音内容。然后,把这个文本列表,跟该条会话记录中的“用户语音内容ASR结果”的语音ASR结果序列,交叉组合,每个文本增加说话人标记,组成对话过程序列。交叉组合过程中,如果发现客户说话ASR结果条数小于机器人话术条数,说明客户没等机器人展开所有话术就提前挂断了电话,需要将机器人话术多余的句子项从合并结果中删掉。
例如以R标记机器人,以C标记客户,得到的一个记录如下:
R:你好,请问你是李先生吗?
C:是的,你是谁?
R:你好,我是XXX有限公司,想了解一下最近您有没有计划XXX?
C:我不感兴趣。
用户ASR结果C标记的就两句,说明客户实际说了这两句就挂了电话,则将后边的机器人话术进行删除。
进一步地,在根据数据排序参数对每一多个交互记录进行排序,确定多个交互记录序列的操作中,系统服务器200根据数据排序参数对多个机器人话术以及多个用户语音内容进行排序,确定多个交互记录序列。
可选地,根据采样条件参数,从多个交互记录序列中确定目标交互记录之后,还包括:将目标交互记录进行序列化处理,并将序列化处理后的目标交互记录存储至数据缓存空间。
具体地,在根据采样条件参数,从多个交互记录序列中确定目标交互记录之后,系统服务器200还将查询到的目标交互记录进行序列化处理得到二进制数据块,然后将序列化处理后的目标交互记录存储至数据缓存空间,即将二进制数据块存储到数据缓存服务器400。从而,在对相同的采样需求进行采样时可以从数据缓存中获取相应的数据,不需要重新查询,节省时间以及计算资源。
可选地,根据至少一个采样参数确定与采样需求相匹配的目标交互记录,包括:对至少一个采样参数进行哈希计算,生成与至少一个采样参数对应的哈希值;以及根据哈希值,确定与采样需求相匹配的目标交互记录。
具体地,数据缓存服务器400中的缓存数据例如可以对应有哈希值。在根据至少一个采样参数确定与采样需求相匹配的目标交互记录的操作中,系统服务器200可以对至少一个采样参数进行哈希计算,生成与至少一个采样参数对应的哈希值,多个参数的哈希值可以组成一个哈希串。进一步地,系统服务器200根据哈希值,确定与采样需求相匹配的目标交互记录。通过哈希值可以对采样参数进行统一化处理,能够提高查询效率。
可选地,将序列化处理后的目标交互记录存储至数据缓存空间,还包括:确定序列化处理后的目标交互记录与哈希值的映射关系;以及根据映射关系,将序列化处理后的目标交互记录以及对应的哈希值存储至数据缓存空间。
具体地,在将序列化处理后的目标交互记录存储至数据缓存空间之后,系统服务器200确定序列化处理后的目标交互记录与哈希值的映射关系,然后根据映射关系,将序列化处理后的目标交互记录以及对应的哈希值存储至数据缓存服务器400。从而,通过查找哈希值可以便于从数据缓存服务器中查询到对应的缓存数据。
可选地,在将序列化处理后的目标交互记录存储至数据缓存空间之前,还包括:判断数据缓存空间是否已满;在数据缓存空间未满的情况下,将序列化处理后的目标交互记录存储至数据缓存空间;以及在数据缓存空间已满的情况下,根据数据缓存空间中数据的缓存时间将数据缓存空间中的历史数据进行删除,并将序列化处理后的目标交互记录存储至数据缓存空间。
具体地,在将序列化处理后的目标交互记录存储至数据缓存空间之前,系统服务器200首先判断数据缓存服务器400的缓存空间是否已满,例如:已有缓存条目数量<预设最大值N则表示空间未满。进一步地,系统服务器200数据缓存空间未满的情况下,将序列化处理后的目标交互记录存储至数据缓存空间(数据缓存服务器400)。在数据缓存空间已满的情况下,根据数据缓存空间中数据的缓存时间将数据缓存空间中的历史数据进行删除。例如:将N条记录先按照设入缓存的时间排序,取时间戳最小的N/2个,即最早写入缓存的一半记录。然后再把这N/2个最早记录按照引用计数排序,找出引用计数最小的删掉,然后将序列化处理后的目标交互记录存储至数据缓存空间,并记录写入时间,引用计数为1。
此外,参考图1所示,根据本实施例的第二个方面,提供了一种存储介质。所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行以上任意一项所述的方法。
需要补充说明的是:
数据库记录了机器人每次服务的所有数据和上下文信息。
具体的,数据库包含一个机器人登记表,表中记录了,机器人ID,机器人配置ID,机器人服务类型,机器人呼叫类型,机器人上线时间,机器人服务状态,机器人拨打计数等字段。
具体的,数据库包含一个机器人话术配置表,表中记录了,机器人ID,话术ID,话术序号,话术内容文本,话术语音合成方式。其中话术语音合成方式,包括录音合成,和TTS模型合成等
具体的,数据库包含一个会话记录表,表中记录了每一次会话的详情信息。具体的,表中包含机器人ID,客户ID,呼叫类型,接通时间,挂断时间,挂断处机器人的话术ID,用户挂断后对机器人的评分,客户语音内容ASR结果。其中,呼叫类型,包括主叫和被叫。
本发明包含一个数据缓存,用于缓存热查询视图数据,当采样系统客户端发来的请求,命中缓存时,可以直接读取缓存中的数据并返回。
本发明包含一个客户端程序,具体的,该客户端程序可以是一个WEB网站,供用户按需求设置采样条件,并获取满足条件的机器人会话数据。本系统可供客户端用户设定的采样条件,
包括:机器人服务类型,
机器人呼叫类型,
机器人话术语音合成方式,
电话接通时间范围,【电话接通的时刻记录】
电话拨打时长范围,【电话从接通到挂断的总计消耗时间】
会话评分范围,
用户说话内容检索关键字,
采样方式,【分为顺序采样和随机采样】
顺序采样指标,
顺序采样排序方式,
采样条数
具体的,用户可设置条件分为三类:
第一类:数据视图条件,可供服务端查询和形成数据视图。比如机器人服务类型,机器人呼叫类型,机器人话术语音合成方式,电话接通时间范围,电话拨打时长范围,会话评分范围,用户说话内容检索关键字等;
第二类:采样条件,包括采样方式,顺序采样指标,顺序采样排序方式,采样条数等。
第三类:关联条件,这些条件是可以关联到顺序采样指标的数据视图条件。包括:电话接通时间范围,电话拨打时长范围,会话评分范围等。
本发明包含一个服务端程序,可以根据用户请求参数,获得相应的数据视图,并按照用户指定的采样条件对机器人对话记录进行采样,并返回给客户端展示。
具体的,服务端程序包含一个查询条件生成模块,该生成模块,根据客户端发来请求中的视图条件部分,组织一个查询哈希,该哈希值对相同的视图条件具有一致性,对不同的视图查询条件具有唯一性。
具体的,服务端程序包含一个视图数据生成模块,该模块根据视图查询条件,到数据库中查找和拼接视图所需数据,对每条数据生成一个视图内唯一的ID值加入视图内。并且的,用每个关联条件,对视图内的数据做排序,得到每个关联条件的视图数据唯一ID序列。比如:A序列是对视图数据记录,根据“电话接通时间”字段值进行排序后,顺序读取每个记录的唯一ID得到的序列。B序列是根据”电话拨打时长”字段。C序列是根据“用户评分”字段。
具体的,服务端程序包含一个视图序列化/反序列化模块。序列化模块用于将从数据库得到的视图数据,以及该视图内关联条件字段排序序列,压缩存储为一个缓存记录数据块;反序列化模块用于将缓存数据块恢复成数据视图及其排序信息。
具体的,服务端程序包含一个缓存管理模块,该模块用于对缓存的数据查询,数据更新与淘汰管理,数据过期管理。
具体的,服务端程序包含一个数据抽样模块,该模块根据用户指定的抽样条件,从得到的数据视图中抽样出机器人会话记录样本。若用户指定随机抽样,则从视图数据中随机取出指定数量的记录;如果指定条件抽样,按指定顺序抽取指定数量的会话记录。
在一个具体实例中,参考图4所示,例如,机器人研发人员想调研一下最近七天内,外呼型机器人,跟用户通话时间超过5分钟,用户说话内容中包含”是的”关键字,且用户对通话评分低于3分的机器人服务会话样本。看最近时间的5条。
机器人研发人员,在客户端,选择如上条件:
机器人呼叫类型:主叫
电话接通时间范围:From2020-05-08ToToday
电话拨打时长范围:>5min
用户说话查询关键字:“是的”
会话评分范围:<3
采样方式:顺序采样
顺序采样指标:电话接通时间
顺序采样排序方式:从大到小
采样条数:5
然后点击发送请求。
服务端收到请求,解析了参数后:
1、首先,查询条件生成模块:按预设顺序组织各个字段,并将请求参数传入字段值,经过哈希后,得到该视图的查询哈希串。
2、然后用该哈希串调用缓存管理功能,查询是否目标视图数据有缓存。如果视图有缓存,则判断其是否在预设有效期:若缓存数据未过期,则读取缓存的视图,给该哈希串对应的缓存视图引用计数+1,然后:
3、用该缓存视图数据,调用序列化/反序列化模块的反序列化功能,恢复缓存数据视图,以及各个排序ID列表;然后:
4、从”电话接通时间”的排序表中,抽取前三个ID,用这三个ID直接在缓存数据视图中访问机器人对话记录,应答给客户端。
5、若第2步骤中,没有找到该缓存记录,转6
6、从数据库中构建视图:具体的:
6.1把数据库“机器人登记表”和“会话记录表”做表连接,找出所有满足所述机器人呼叫类型的所有会话记录;
6.2对每个会话记录,根据其机器人ID,去“机器人话术配置表”查找这个机器人的话术文本列表。把这个文本列表,跟该条会话记录中的“客户语音内容ASR结果”的语音ASR结果序列,交叉组合,每个文本增加说话人标记,组成对话过程序列。交叉组合过程中,如果发现客户说话ASR结果条数,小于机器人话术条数,说明客户没等机器人展开所有话术就提前挂断了电话,需要将机器人话术多余的句子项从合并结果中删掉。
例如以R标记机器人,以C标记客户,得到的一个记录如下:
R:你好,请问你是李先生吗?
C:是的,你是谁?
R:你好,我是XXX有限公司,想了解一下最近您有没有计划XXX?
C:我不感兴趣。
[用户ASR结果C标记的,就这两句,说明客户实际说了这两句就挂了电话。所以后边的机器人话术也都删掉了]
6.3如上构建了文本表示的机器人和客户的电话沟通过程。这一过程作为会话内容字段,加入该条视图记录中。
6.4构建视图的排序ID序列:首先对每条视图记录设置它在该视图结果中的唯一ID;然后分别按照电话接通时间、电话拨打时长、用户评分三个字段排序这些ID,得到三个ID列表,分别代表对视图记录在不同字段上的排序结果。
6.5对得到的查询数据视图(包括视图记录ID)以及三个有序ID列表,用序列化模块将它们一起序列化为一个二进制数据块。
6.6用1步骤得到的哈希串,以及6.4得到的序列化数据块,调用缓存管理模块做缓存更新,具体的:
6.6.1若缓存空间未满【已有缓存条目数量<预设最大值N】,则直接将哈希串索引的数据块存入缓存,将引用计数设置为1,并设置写入时间为当前时间;否则
6.6.2若缓存空间已满,将N条记录先按照设入缓存的时间排序,取时间戳最小的N/2个,即最早写入缓存的一半记录。然后再把这N/2个最早记录按照引用计数排序,找出引用计数最小的,删掉。将新得到的视图缓存到空出来的位置上,并记录写入时间,引用计数为1。
6.7数据视图数据、各个排序序列,作为返回值。
7、用6.7步骤返回的数据视图、各个序列作为输入,采样并返回机器人会话记录。本例中具体的:找到“电话拨打时长”字段对应的视图记录ID序列,取前5个ID;把这些ID顺序从数据视图中找到对应记录,即得到采样结果。返回给客户端。
8、若第2步骤中,找到视图缓存,但是视图缓存已经过期,则从缓存中删除该视图;同时执行6.1到6.5步骤重新从数据库生成视图,用1步骤的哈希码,和6.5的二进制视图数据块,更新到数据缓存,设置当前时间为该记录缓存设置时间,引用计数设置为1。最后执行第7步返回采样结果。
本申请可以应用成熟的MVC服务架构,提供了一套面向语音机器人科研人员和产品设计人员使用的在线对话记录采样系统。在线语音机器人调研,改进工作中所必须的实例样本采集。本系统可以将相关工作人员从繁重的人工筛选,抽样,收听对话录音等工作中解放出来;从它们最关注的采样维度设计了一套工具,方便了他们的工作,提高了他们的工作效率,从而支持更快的机器人BUG修复和迭代升级。
此外,本申请的系统可以基于C/S框架;采样需求人只需要界面操作即可,降低了人工抽样的时间成本;抽样的标准和维度也更灵活可控。本申请将对话采样计算,分为数据视图计算模块,和采样模块两个部分;两者互相独立设计,灵活性更好。比如采样模块的升级,更复杂的采样规则,都可以在视图模块不做任何修改的前提下独立完成,两者互相没有耦合。并且,本申请引入了缓存机制,尽量复用计算结果,提高系统性能。对缓存管理时,可以提出一种简单的LRU缓存替换算法实现。
从而根据本实施例,用户需要从大量的交互记录中进行抽样调查时,只需要在客户端的界面输入相应的采样参数,系统服务器即可根据采样参数确定对应的目标交互记录,并通过客户端反馈给客户。与现有技术相比,本方案在采样的过程中降低了人工抽样的时间成本,并且通过采样参数的选择,采样的标准和维度也更灵活可控。因此解决了现有技术中存在的对于大量的语音机器人和客户的对话记录,难以进行采样调查的技术问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
图5示出了根据本实施例面所述的交互记录的采样装置500,该装置500与根据实施例1的第一个方面所述的方法相对应。参考图5所示,该装置500包括:参数接收模块510,用于从客户端接收请求对交互记录进行采样的采样请求,其中采样请求包括与采样需求相关的至少一个采样参数;数据采样模块520,用于响应于采样请求,根据至少一个采样参数确定与采样需求相匹配的目标交互记录;以及数据发送模块530,用于将目标交互记录发送至客户端。
可选地,数据采样模块520,包括:缓存判断子模块,用于根据至少一个采样参数确定系统的数据缓存空间中是否存在已经缓存且有效的与目标交互记录对应的缓存数据;以及缓存数据查找子模块,用于在缓存数据存在的情况下,从数据缓存空间中获取缓存数据,并对数据进行反序列化得到目标交互记录。
可选地,至少一个采样参数包括数据内容参数、数据排序参数以及采样条件参数,并且在缓存数据不存在的情况下,装置500还包括:查询模块,用于在系统的数据库中查询与数据内容参数对应的多个交互记录;排序模块,用于根据数据排序参数对每一多个交互记录进行排序,确定多个交互记录序列;以及确定模块,用于根据采样条件参数,从多个交互记录序列中确定目标交互记录。
可选地,系统的数据库中存储有记录机器人话术的第一数据表和用户语音内容的第二数据表,并且查询模块,包括:查询子模块,用于从第一数据表中查询与采样条件参数对应的多个机器人话术以及从第二数据表中查询与采样条件参数对应的多个用户语音内容;以及排序模块:包括排序子模块,用于根据数据排序参数对每一多个交互记录进行排序,确定多个交互记录序列,包括:根据数据排序参数对多个机器人话术以及多个用户语音内容进行排序,确定多个交互记录序列。
可选地,根据采样条件参数,从多个交互记录序列中确定目标交互记录之后,装置500还包括:数据缓存模块,用于将目标交互记录进行序列化处理,并将序列化处理后的目标交互记录存储至数据缓存空间。
可选地,数据采样模块520,还包括:哈希值生成子模块,用于对至少一个采样参数进行哈希计算,生成与至少一个采样参数对应的哈希值;以及确定子模块,用于根据哈希值,确定与采样需求相匹配的目标交互记录。
可选地,数据缓存模块,包括:映射子模块,用于确定序列化处理后的目标交互记录与哈希值的映射关系;以及缓存子模块,用于根据映射关系,将序列化处理后的目标交互记录以及对应的哈希值存储至数据缓存空间。
可选地,缓存子模块还包括:判断单元,用于判断数据缓存空间是否已满;第一缓存单元,用于在数据缓存空间未满的情况下,将序列化处理后的目标交互记录存储至数据缓存空间;以及第二缓存单元,用于在数据缓存空间已满的情况下,根据数据缓存空间中数据的缓存时间将数据缓存空间中的历史数据进行删除,并将序列化处理后的目标交互记录存储至数据缓存空间。
从而根据本实施例,用户需要从大量的交互记录中进行抽样调查时,只需要在客户端的界面输入相应的采样参数,系统服务器即可根据采样参数确定对应的目标交互记录,并通过客户端反馈给客户。与现有技术相比,本方案在采样的过程中降低了人工抽样的时间成本,并且通过采样参数的选择,采样的标准和维度也更灵活可控。因此解决了现有技术中存在的对于大量的语音机器人和客户的对话记录,难以进行采样调查的技术问题。
实施例3
图6示出了根据本实施例所述的交互记录的采样装置600,该装置600与根据实施例1的第一个方面所述的方法相对应。参考图6所示,该装置600包括:处理器610;以及存储器620,与处理器610连接,用于为处理器610提供处理以下处理步骤的指令:从客户端接收请求对交互记录进行采样的采样请求,其中采样请求包括与采样需求相关的至少一个采样参数;响应于采样请求,根据至少一个采样参数确定与采样需求相匹配的目标交互记录;以及将目标交互记录发送至客户端。
可选地,根据至少一个采样参数确定与采样需求相匹配的目标交互记录,包括:根据至少一个采样参数确定系统的数据缓存空间中是否存在已经缓存且有效的与目标交互记录对应的缓存数据;以及在缓存数据存在的情况下,从数据缓存空间中获取缓存数据,并对数据进行反序列化得到目标交互记录。
可选地,至少一个采样参数包括数据内容参数、数据排序参数以及采样条件参数,并且在缓存数据不存在的情况下,存储器620还用于为处理器610提供处理以下处理步骤的指令:在系统的数据库中查询与数据内容参数对应的多个交互记录;根据数据排序参数对每一多个交互记录进行排序,确定多个交互记录序列;以及根据采样条件参数,从多个交互记录序列中确定目标交互记录。
可选地,系统的数据库中存储有记录机器人话术的第一数据表和用户语音内容的第二数据表,并且在系统的数据库中查询与数据内容参数对应的多个交互记录,包括:从第一数据表中查询与采样条件参数对应的多个机器人话术以及从第二数据表中查询与采样条件参数对应的多个用户语音内容;以及根据数据排序参数对每一多个交互记录进行排序,确定多个交互记录序列,包括:根据数据排序参数对多个机器人话术以及多个用户语音内容进行排序,确定多个交互记录序列。
可选地,存储器620还用于为处理器610提供处理以下处理步骤的指令:在根据采样条件参数,从多个交互记录序列中确定目标交互记录之后,将目标交互记录进行序列化处理,并将序列化处理后的目标交互记录存储至数据缓存空间。可选地,根据至少一个采样参数确定与采样需求相匹配的目标交互记录,包括:对至少一个采样参数进行哈希计算,生成与至少一个采样参数对应的哈希值;以及根据哈希值,确定与采样需求相匹配的目标交互记录。
可选地,存储器620还用于为处理器610提供处理以下处理步骤的指令:确定序列化处理后的目标交互记录与哈希值的映射关系;以及根据映射关系,将序列化处理后的目标交互记录以及对应的哈希值存储至数据缓存空间。
可选地,存储器620还用于为处理器610提供处理以下处理步骤的指令:在将序列化处理后的目标交互记录存储至数据缓存空间之前,判断数据缓存空间是否已满;在数据缓存空间未满的情况下,将序列化处理后的目标交互记录存储至数据缓存空间;以及在数据缓存空间已满的情况下,根据数据缓存空间中数据的缓存时间将数据缓存空间中的历史数据进行删除,并将序列化处理后的目标交互记录存储至数据缓存空间。
从而根据本实施例,用户需要从大量的交互记录中进行抽样调查时,只需要在客户端的界面输入相应的采样参数,系统服务器即可根据采样参数确定对应的目标交互记录,并通过客户端反馈给客户。与现有技术相比,本方案在采样的过程中降低了人工抽样的时间成本,并且通过采样参数的选择,采样的标准和维度也更灵活可控。因此解决了现有技术中存在的对于大量的语音机器人和客户的对话记录,难以进行采样调查的技术问题。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种交互记录的采样方法,用于对语音机器人交互系统产生的交互记录进行采样,其特征在于,包括:
从客户端接收请求对交互记录进行采样的采样请求,其中所述采样请求包括与采样需求相关的至少一个采样参数;
响应于所述采样请求,根据所述至少一个采样参数确定与所述采样需求相匹配的目标交互记录;
根据所述至少一个采样参数确定与所述采样需求相匹配的目标交互记录,包括:
根据所述至少一个采样参数确定所述系统的数据缓存空间中是否存在已经缓存且有效的与所述目标交互记录对应的缓存数据;以及
在所述缓存数据存在的情况下,从所述数据缓存空间中获取所述缓存数据,并对所述数据进行反序列化得到所述目标交互记录;
所述至少一个采样参数包括数据内容参数、数据排序参数以及采样条件参数,并且在所述缓存数据不存在的情况下,所述方法包括:
在所述系统的数据库中查询与所述数据内容参数对应的多个交互记录;
根据所述数据排序参数对每一所述多个交互记录进行排序,确定多个交互记录序列;以及
根据所述采样条件参数,从所述多个交互记录序列中确定所述目标交互记录;
所述系统的数据库中存储有记录机器人话术的第一数据表和用户语音内容的第二数据表,并且
在所述系统的数据库中查询与所述数据内容参数对应的多个交互记录,包括:
从所述第一数据表中查询与所述采样条件参数对应的多个机器人话术以及从所述第二数据表中查询与所述采样条件参数对应的多个用户语音内容;以及
根据所述数据排序参数对每一所述多个交互记录进行排序,确定多个交互记录序列,包括:根据所述数据排序参数对所述多个机器人话术以及所述多个用户语音内容进行排序,确定多个交互记录序列;
根据所述采样条件参数,从所述多个交互记录序列中确定所述目标交互记录之后,还包括:
将所述目标交互记录进行序列化处理,并将序列化处理后的所述目标交互记录存储至所述数据缓存空间;
在将序列化处理后的所述目标交互记录存储至所述数据缓存空间之前,还包括:
判断所述数据缓存空间是否已满;
在所述数据缓存空间未满的情况下,将序列化处理后的所述目标交互记录存储至所述数据缓存空间;以及
在所述数据缓存空间已满的情况下,根据所述数据缓存空间中数据的缓存时间将所述数据缓存空间中的历史数据进行删除,并将序列化处理后的所述目标交互记录存储至所述数据缓存空间;以及
将所述目标交互记录发送至所述客户端。
2.根据权利要求1所述的方法,其特征在于,根据所述至少一个采样参数确定与所述采样需求相匹配的目标交互记录,包括:
对所述至少一个采样参数进行哈希计算,生成与所述至少一个采样参数对应的哈希值;以及
根据所述哈希值,确定与所述采样需求相匹配的目标交互记录。
3.根据权利要求2所述的方法,其特征在于,将序列化处理后的所述目标交互记录存储至所述数据缓存空间,还包括:
确定序列化处理后的所述目标交互记录与所述哈希值的映射关系;以及
根据所述映射关系,将所述序列化处理后的所述目标交互记录以及对应的所述哈希值存储至所述数据缓存空间。
4.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至3中任意一项所述的方法。
5.一种交互记录的采样装置,用于对语音机器人交互系统产生的交互记录进行采样,其特征在于,包括:
参数接收模块,用于从客户端接收请求对交互记录进行采样的采样请求,其中所述采样请求包括与采样需求相关的至少一个采样参数;
数据采样模块,用于响应于所述采样请求,根据所述至少一个采样参数确定与所述采样需求相匹配的目标交互记录;
根据所述至少一个采样参数确定与所述采样需求相匹配的目标交互记录,包括:
根据所述至少一个采样参数确定所述系统的数据缓存空间中是否存在已经缓存且有效的与所述目标交互记录对应的缓存数据;以及
在所述缓存数据存在的情况下,从所述数据缓存空间中获取所述缓存数据,并对所述数据进行反序列化得到所述目标交互记录;
所述至少一个采样参数包括数据内容参数、数据排序参数以及采样条件参数,并且在所述缓存数据不存在的情况下,包括:
在所述系统的数据库中查询与所述数据内容参数对应的多个交互记录;
根据所述数据排序参数对每一所述多个交互记录进行排序,确定多个交互记录序列;以及
根据所述采样条件参数,从所述多个交互记录序列中确定所述目标交互记录;
所述系统的数据库中存储有记录机器人话术的第一数据表和用户语音内容的第二数据表,并且
在所述系统的数据库中查询与所述数据内容参数对应的多个交互记录,包括:
从所述第一数据表中查询与所述采样条件参数对应的多个机器人话术以及从所述第二数据表中查询与所述采样条件参数对应的多个用户语音内容;以及
根据所述数据排序参数对每一所述多个交互记录进行排序,确定多个交互记录序列,包括:根据所述数据排序参数对所述多个机器人话术以及所述多个用户语音内容进行排序,确定多个交互记录序列;
根据所述采样条件参数,从所述多个交互记录序列中确定所述目标交互记录之后,还包括:
将所述目标交互记录进行序列化处理,并将序列化处理后的所述目标交互记录存储至所述数据缓存空间;
在将序列化处理后的所述目标交互记录存储至所述数据缓存空间之前,还包括:
判断所述数据缓存空间是否已满;
在所述数据缓存空间未满的情况下,将序列化处理后的所述目标交互记录存储至所述数据缓存空间;以及
在所述数据缓存空间已满的情况下,根据所述数据缓存空间中数据的缓存时间将所述数据缓存空间中的历史数据进行删除,并将序列化处理后的所述目标交互记录存储至所述数据缓存空间;以及
数据发送模块,用于将所述目标交互记录发送至所述客户端。
CN202010833048.6A 2020-08-13 2020-08-18 交互记录的采样方法、装置以及存储介质 Active CN114143279B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020108136575 2020-08-13
CN202010813657 2020-08-13

Publications (2)

Publication Number Publication Date
CN114143279A CN114143279A (zh) 2022-03-04
CN114143279B true CN114143279B (zh) 2023-10-24

Family

ID=80438335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010833048.6A Active CN114143279B (zh) 2020-08-13 2020-08-18 交互记录的采样方法、装置以及存储介质

Country Status (1)

Country Link
CN (1) CN114143279B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106970936A (zh) * 2017-02-09 2017-07-21 阿里巴巴集团控股有限公司 数据处理方法及装置、数据查询方法及装置
CN107169796A (zh) * 2017-05-12 2017-09-15 深圳市浩天投资有限公司 一种用户行为数据的分析方法、系统及计算机可读存储介质
EP3306489A1 (en) * 2015-05-28 2018-04-11 Alibaba Group Holding Limited Interaction record query processing method and device
WO2018119587A1 (zh) * 2016-12-26 2018-07-05 深圳前海达闼云端智能科技有限公司 数据处理方法、装置、系统及信息采集设备
CN109857760A (zh) * 2018-12-22 2019-06-07 中国平安人寿保险股份有限公司 快速响应检索方法及装置、计算机装置及存储介质
CN110399468A (zh) * 2018-04-20 2019-11-01 北京搜狗科技发展有限公司 一种数据处理方法、装置和用于数据处理的装置
CN110753918A (zh) * 2017-04-12 2020-02-04 脸谱公司 用于对机器人进行基于意图的搜索的技术
CN110750529A (zh) * 2018-07-04 2020-02-04 百度在线网络技术(北京)有限公司 数据处理方法、装置、设备及存储介质
CN111159219A (zh) * 2019-12-31 2020-05-15 湖南亚信软件有限公司 一种数据管理方法、装置、服务器及存储介质
CN111526084A (zh) * 2020-04-29 2020-08-11 北京小米移动软件有限公司 信息处理方法、装置、设备及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3306489A1 (en) * 2015-05-28 2018-04-11 Alibaba Group Holding Limited Interaction record query processing method and device
WO2018119587A1 (zh) * 2016-12-26 2018-07-05 深圳前海达闼云端智能科技有限公司 数据处理方法、装置、系统及信息采集设备
CN106970936A (zh) * 2017-02-09 2017-07-21 阿里巴巴集团控股有限公司 数据处理方法及装置、数据查询方法及装置
CN110753918A (zh) * 2017-04-12 2020-02-04 脸谱公司 用于对机器人进行基于意图的搜索的技术
CN107169796A (zh) * 2017-05-12 2017-09-15 深圳市浩天投资有限公司 一种用户行为数据的分析方法、系统及计算机可读存储介质
CN110399468A (zh) * 2018-04-20 2019-11-01 北京搜狗科技发展有限公司 一种数据处理方法、装置和用于数据处理的装置
CN110750529A (zh) * 2018-07-04 2020-02-04 百度在线网络技术(北京)有限公司 数据处理方法、装置、设备及存储介质
CN109857760A (zh) * 2018-12-22 2019-06-07 中国平安人寿保险股份有限公司 快速响应检索方法及装置、计算机装置及存储介质
CN111159219A (zh) * 2019-12-31 2020-05-15 湖南亚信软件有限公司 一种数据管理方法、装置、服务器及存储介质
CN111526084A (zh) * 2020-04-29 2020-08-11 北京小米移动软件有限公司 信息处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN114143279A (zh) 2022-03-04

Similar Documents

Publication Publication Date Title
CN101431573B (zh) 通过人机交互技术实现自动客户服务的方法和设备
WO2020233034A1 (zh) 一种页面功能测试方法及相关装置
US20130103391A1 (en) Natural language processing for software commands
US20030043180A1 (en) Method and apparatus for providing user support through an intelligent help agent
CN103309998A (zh) 一种消息查询方法及装置、终端设备
CN101556669A (zh) 利用人机交互技术与用户进行个性化营销的方法和设备
CN110083789A (zh) 一种小程序页面获取方法、服务器、客户端及电子设备
CN111586126A (zh) 小程序预下载方法、装置、设备及存储介质
CN114726914A (zh) 一种跨服务商信息发送方法、装置和电子设备
CN114398188A (zh) 模型管理方法、模型管理服务、客户端及存储介质
CN105786941B (zh) 一种信息挖掘方法和装置
KR20110048675A (ko) 음성인식과 태깅을 이용한 콜센터 상담 방법 및 상담 시스템
EP3387556A1 (en) Providing automated hashtag suggestions to categorize communication
JP2000057226A (ja) 技術サービス用ネットワークシステム及び保守方法
CN114143279B (zh) 交互记录的采样方法、装置以及存储介质
CN110300222B (zh) 一种短信显示方法、系统、终端设备及计算机可读存储介质
WO2021012554A1 (zh) 区块链中数据字段的更新方法、装置、介质、电子设备
CN110892427B (zh) 用于检索数据包的方法和设备
CN114371969B (zh) 一种页面性能测试方法、装置、电子设备及存储介质
CN112615774B (zh) 即时通讯信息处理方法、装置、即时通讯系统及电子设备
CN114661289A (zh) 一种基于知识和数据驱动的微应用开发系统和方法
US9465876B2 (en) Managing content available for content prediction
CN110674386B (zh) 资源推荐方法、装置及存储介质
JP2018013819A (ja) ビジネスマッチング支援システムおよびビジネスマッチング支援方法
CN113765773B (zh) 一种沟通记录处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 226, 2nd Floor, No. 5 Guanghua Road, Zhangjiawan Town, Tongzhou District, Beijing, 101100

Patentee after: Beijing Zhongkejin Finite Element Technology Co.,Ltd.

Address before: 100082 27F, 23rd floor, block B, No. 1 Wangzhuang Road, Haidian District, Beijing - 2702 on the whole floor

Patentee before: Beijing finite element technology Co.,Ltd.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Room 226, 2nd Floor, No. 5 Guanghua Road, Zhangjiawan Town, Tongzhou District, Beijing, 101100

Patentee after: Beijing Zhongke Jindezhu Intelligent Technology Co.,Ltd.

Country or region after: China

Address before: Room 226, 2nd Floor, No. 5 Guanghua Road, Zhangjiawan Town, Tongzhou District, Beijing, 101100

Patentee before: Beijing Zhongkejin Finite Element Technology Co.,Ltd.

Country or region before: China