CN105812473B - 数据处理方法及装置 - Google Patents

数据处理方法及装置 Download PDF

Info

Publication number
CN105812473B
CN105812473B CN201610189207.7A CN201610189207A CN105812473B CN 105812473 B CN105812473 B CN 105812473B CN 201610189207 A CN201610189207 A CN 201610189207A CN 105812473 B CN105812473 B CN 105812473B
Authority
CN
China
Prior art keywords
server
corpus
question
label
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610189207.7A
Other languages
English (en)
Other versions
CN105812473A (zh
Inventor
谌畅
屈峰
应海量
赵学敏
江铃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Xiaoduo Technology Co Ltd
Original Assignee
Chengdu Xiaoduo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Xiaoduo Technology Co Ltd filed Critical Chengdu Xiaoduo Technology Co Ltd
Priority to CN201610189207.7A priority Critical patent/CN105812473B/zh
Publication of CN105812473A publication Critical patent/CN105812473A/zh
Application granted granted Critical
Publication of CN105812473B publication Critical patent/CN105812473B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明实施例提出了数据处理方法及装置,所述方法包括:服务器接收客户端输入的问题,判断添加标签后的语料库中是否存储有所述问题对应的答案;当判断出存储有所述问题对应的答案时,将所述答案返回给所述客户端;当没有存储有所述问题对应的答案时,所述服务器读取预置配置文件;所述服务器根据所述配置文件判断是否向人工平台发送处理指令,如果是,则所述服务器向人工平台发送处理指令,以使所述人工平台响应所述处理指令向所述客户端返回所述问题对应的答案;如果否,则所述服务器不处理所述问题。所述方法使得人工平台的客服工作人员的工作量被大大减少,且使得人工平台能够有更充足的时间回答客户端输入的问题,用户体验也进一步提升。

Description

数据处理方法及装置
技术领域
本发明涉及数据处理领域,具体而言,涉及一种数据处理方法及装置。
背景技术
随着互联网的普及和公众对电商模式认同感的提升,用户对客服支持服务需求呈稳定增长,现在通常是人工客服对用户提出的需求进行处理,客服人员需要处理大量的工作量,效率很低,用户的体验也不好。
发明内容
有鉴于此,本发明实施例的目的在于提供一种数据处理方法及装置。
第一方面,本发明实施例提供的一种数据处理方法,所述方法包括:所述服务器接收用户通过客户端输入的问题,判断添加标签后的语料库中是否存储有所述问题对应的答案,其中,所述添加标签后的语料库是所述服务器将对话语料库进行机器学习,并根据学习结果对每组对话语料添加至少一个标签后获得,其中所述每组对话语料包含一个问题以及所述问题对应的答案;当所述服务器判断出所述添加标签后的语料库中存储有所述问题对应的答案时,将所述答案返回给所述客户端;当所述服务器判断出所述添加标签后的语料库中没有存储有所述问题对应的答案时,所述服务器读取预置配置文件;所述服务器根据所述配置文件判断是否向人工平台发送处理指令,如果是,则所述服务器向人工平台发送处理指令,以使所述人工平台响应所述处理指令向所述客户端返回所述问题对应的答案;如果否,则所述服务器不处理所述问题。
第二方面,本发明实施例提供的一种数据处理装置,所述装置包括:判断模块,用于所述服务器接收用户通过客户端输入的问题,判断添加标签后的语料库中是否存储有所述问题对应的答案,其中,所述添加标签后的语料库是所述服务器将对话语料库进行机器学习,并根据学习结果对每组对话语料添加至少一个标签后获得,其中所述每组对话语料包含一个问题以及所述问题对应的答案;返回模块,用于当所述服务器判断出所述添加标签后的语料库中存储有所述问题对应的答案时,将所述答案返回给所述客户端;读取模块,用于当所述服务器判断出所述添加标签后的语料库中没有存储有所述问题对应的答案时,所述服务器读取预置配置文件;处理模块,用于所述服务器根据所述配置文件判断是否向人工平台发送处理指令,如果是,则所述服务器向人工平台发送处理指令,以使所述人工平台响应所述处理指令向所述客户端返回所述问题对应的答案;如果否,则所述服务器不处理所述问题。
与现有技术相比,本发明实施例提供的数据处理方法及装置,通过服务器预先建立添加标签后的语料库,使得客户端输入的问题能够部分被服务器直接处理,当语料库中的答案无法回答客户端输入的问题时,服务器才向人工平台发送处理指令,这样使得人工平台的客服工作人员的工作量被大大减少,并且只有服务器无法处理客户端输入的问题时,才由人工平台进行处理,使得人工平台能够有更充足的时间回答客户端输入的问题,用户体验也进一步提升。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施例提供的服务器与客户端进行交互的示意图。
图2是本发明实施例提供的服务器的方框示意图。
图3是本发明实施例提供的一种数据处理方法的流程图。
图4是本发明实施例提供的一种数据处理装置的功能模块示意图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
如图1所示,是本发明实施例提供的服务器200与客户端100进行交互的示意图。所述服务器200通过网络300与一个或多个客户端100进行通信连接,以进行数据通信或交互。所述服务器200可以是网络服务器、数据库服务器等。所述客户端100可以是个人电脑(personal computer,PC)、平板电脑、智能手机、个人数字助理(personal digitalassistant,PDA)等。
如图2所示,是所述服务器200的方框示意图。所述服务器200包括数据处理装置210、存储器220、存储控制器230、处理器240。
所述存储器220、存储控制器230、处理器240各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述数据处理装置210包括至少一个可以软件或固件(firmware)的形式存储于所述存储器中或固化在所述服务器200的操作系统(operating system,OS)中的软件功能模块。所述处理器240用于执行存储器220中存储的可执行模块,例如所述数据处理装置210包括的软件功能模块或计算机程序。
其中,存储器220可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器220用于存储程序,所述处理器240在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的服务器所执行的方法可以应用于处理器中,或者由处理器实现。
处理器240可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
图3示出了本发明一实施例提供的一种数据处理方法的流程图,请参阅图3,本实施例描述的是服务器的处理流程,所述方法包括:
步骤S301,所述服务器接收用户通过客户端输入的问题;
可以理解的,在服务器接收用户通过客户端输入的问题,服务器会预先收集大量的客服人员和用户的对话,并将所述对话语料进行机器学习,并根据学习结果对每组对话语料添加至少一个标签。但是机器学习的结果可能会出现不准确的情况,因此优选的,在步骤S301之前,还可以包括:
所述服务器接收测试终端返回的标签更新指令,所述标签更新指令中携带有所述对话语料的标识以及新的标签,所述服务器根据所述对话语料的标识,将与所述对话语料的标识对应的对话语料的标签更新为所述新的标签。
服务器可以通过不断的将对话语料的标签进行更新,然后将更新标签后的对话语料库再次进行机器学习,得到新的学习结果。可以理解的是,这个过程可以持续迭代进行,使得服务器预先建立的添加标签后的语料库的精度更高,进一步使得所述服务器将所述添加标签后的语料库中存储的所述客户端输入的问题对应的答案返回给所述客户端时,正确率更高。
步骤S302,所述服务器判断添加标签后的语料库中是否存储有所述问题对应的答案,其中,所述添加标签后的语料库是所述服务器将对话语料库进行机器学习,并根据学习结果对每组对话语料添加至少一个标签后获得,其中所述每组对话语料包含一个问题以及所述问题对应的答案;
优选的,所述服务器将对话语料库进行机器学习,包括:所述服务器将所述对话语料库中的对话语料按照对话主题进行分类后,为每组所述对话语料添加用于表征主题的第一标签。
例如,服务器收集对话语料库中,可能有对话1(“我身高160cm穿什么尺码合适呢?”,“穿M码比较合适。”),对话2(“体重45KG应该选择什么尺码呢?”,“选择M码较为合适。”),对话3(“身高160cm,体重45KG是不是选择M码呢”,“是的。”)。服务器通过机器学习,可以将上述三个对话分类为同一个主题,即上述三个对话都是围绕着询问衣服尺码的主题在进行提问和回答,因此服务器为上述三个对话都贴上同一个第一标签:“尺码”。
优选的,所述服务器将对话语料库进行机器学习,还包括:所述服务器统计相同第一标签的对话语料中的相同答案的比例,当所述比例大于第二预设阈值时,为所述相同答案对应的对话语料添加用于表征答案正确的第二标签。
例如,假设服务器贴了相同第一标签“尺码”的对话语料中包括了下列对话:对话1(“我身高160cm穿什么尺码合适呢?”,“M码。”),对话2(“体重45KG应该选择什么尺码呢?”,“M码。”),对话3(“身高160cm,体重45KG选择什么尺码”,“M码。”),对话4(“身高160cm选什么码?”,“L码。”)。通过统计,相同答案“M码”所占的比例为3/4,不同答案“L码”所占的比例为1/4,因此到第二预设阈值为1/2时,所述对话1,对话2以及对话3分别贴上第二标签“正确”。
优选的,所述服务器将对话语料库进行机器学习,还包括:所述服务器获取所述对话语料库中每组对话语料的业务场景,为每组所述对话语料添加用于表征所述对话所属业务场景的第三标签。
例如,假设服务器贴了相同第一标签“尺码”的对话语料中包括了下列对话:对话1(“我身高160cm穿什么尺码合适呢?”,“M码。”),对话2(“我的尺码不对需要更换尺码?”,“好的。”)。服务器经过机器训练,可以为所述对话1再贴上第三标签“售前”,为所述第二对话再贴上第三标签“售后”。
可以理解的是,所述服务器判断添加标签后的语料库中是否存储有所述问题对应的答案的实施方式可以有多种,可以遍历所述添加标签后的语料库,查询是否有所述问题,如果有则向客户端返回所述问题对应的答案,也可以是根据根据标签进行分类处理,比如将属于售后的问题,与所述贴了第三标签为“售后”的语料库中对话语料进行匹配,查询是否有所述问题,如果没有可以进一步的判断所述问题的主题,比如所述主题为“尺码”,则服务器将所述问题与语料库中贴了第一标签为“尺码”的对话语料进行匹配,查询是否有所述问题。可以理解的是,并不局限于所述实施方式。
当所述服务器判断出所述添加标签后的语料库中存储有所述问题对应的答案时,执行步骤S303,当所述服务器判断出所述添加标签后的语料库中没有存储有所述问题对应的答案时,执行步骤S304至步骤S307。
步骤S303,所述服务器将所述答案返回给所述客户端;
步骤S304,所述服务器读取预置配置文件;
其中,所述预置配置文件可以为xml格式的文件,或者其他数据格式的文件,所述预置配置文件实施方式可以有多种,并不局限于所述实施方法。所述预置配置文件中记载了服务器是否需要是否向人工平台发送处理指令的指示信息,可以理解的是,对于不同的用户需求,所述预置配置文件中还可以包括其它信息。
步骤S305,所述服务器根据所述配置文件判断是否向人工平台发送处理指令,如果是,执行步骤S306,如果否,执行步骤S307。
步骤S306,所述服务器向人工平台发送处理指令,以使所述人工平台响应所述处理指令向所述客户端返回所述问题对应的答案;
可以理解的,对于不同的用户可以配置不同的用户等级,对于不同的用户等级,可以设置不同的响应时间,这样能够精细化且有侧重地管理用户需求。因此,优选的,所述服务器向人工平台发送处理指令,所述处理指令中包括所述问题以及响应所述问题的时限,以使所述人工平台收到所述处理指令时能够在响应时限内向所述客户端返回所述问题对应的答案。
进一步的,对于有些售后问题涉及到理赔的时候,可能会需要与财务平台进行交互,因此,所述服务器向人工平台发送处理指令,所述处理指令中包括所述问题,以使所述人工平台收到所述处理指令时,判断所述问题中是否包含财务问题,当所述人工平台判断出所述问题中是否包含财务问题时,将所述问题发送到财务平台。
可以理解的是,在所述人工平台和财务平台之间还可以设置不同权限,通过层层审核,最终解决所述输入问题中包含的财务问题。
步骤S307,所述服务器不处理所述问题。
本发明实施例提供的数据处理方法,通过服务器预先建立添加标签后的语料库,使得客户端输入的问题能够部分被服务器直接处理,当语料库中的答案无法回答客户端输入的问题时,服务器才向人工平台发送处理指令,这样使得人工平台的客服工作人员的工作量被大大减少,并且只有服务器无法处理客户端输入的问题时,才由人工平台进行处理,使得人工平台能够有更充足的时间回答客户端输入的问题,用户体验也进一步提升。
请参阅图4,是本发明实施例提供的图2所示的数据处理装置210的功能模块示意图。所述信息处理装置210包括判断模块211、返回模块212、读取模块213、处理模块214。
所述判断模块211,用于所述服务器接收用户通过客户端输入的问题,判断添加标签后的语料库中是否存储有所述问题对应的答案,其中,所述添加标签后的语料库是所述服务器将对话语料库进行机器学习,并根据学习结果对每组对话语料添加至少一个标签后获得,其中所述每组对话语料包含一个问题以及所述问题对应的答案;
所述返回模块212,用于当所述服务器判断出所述添加标签后的语料库中存储有所述问题对应的答案时,将所述答案返回给所述客户端;
所述读取模块213,用于当所述服务器判断出所述添加标签后的语料库中没有存储有所述问题对应的答案时,所述服务器读取预置配置文件;
所述处理模块214,用于所述服务器根据所述配置文件判断是否向人工平台发送处理指令,如果是,则所述服务器向人工平台发送处理指令,以使所述人工平台响应所述处理指令向所述客户端返回所述问题对应的答案;如果否,则所述服务器不处理所述问题。
优选的,所述装置还包括更新模块215,所述更新模块215,用于所述服务器接收测试终端返回的标签更新指令,所述标签更新指令中携带有所述对话语料的标识以及新的标签,所述服务器根据所述对话语料的标识,将与所述对话语料的标识对应的对话语料的标签更新为所述新的标签。
优选的,所述处理模块214,具体用于所述服务器向人工平台发送处理指令,所述处理指令中包括所述问题以及响应所述问题的时限,以使所述人工平台收到所述处理指令时能够在响应时限内向所述客户端返回所述问题对应的答案。
优选的,所述处理模块214,具体用于所述服务器向人工平台发送处理指令,所述处理指令中包括所述问题,以使所述人工平台收到所述处理指令时,判断所述问题中是否包含财务问题,当所述人工平台判断出所述问题中是否包含财务问题时,将所述问题发送到财务平台。
以上各模块可以是由软件代码实现,此时,上述的各模块可存储于服务器的存储器内。以上各模块同样可以由硬件例如集成电路芯片实现。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例所提供的数据处理装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (8)

1.一种数据处理方法,其特征在于,所述方法包括:
服务器接收用户通过客户端输入的问题,判断添加标签后的语料库中是否存储有所述问题对应的答案,其中,所述添加标签后的语料库是所述服务器将对话语料库进行机器学习,并根据学习结果对每组对话语料添加至少一个标签后获得,其中所述每组对话语料包含一个问题以及所述问题对应的答案,所述至少一个标签包括第一标签、第二标签和第三标签,所述第二标签是所述服务器统计相同所述第一标签的对话语料中的相同答案的比例,当所述比例大于第二预设阈值时,为所述相同答案对应的对话语料添加的用于表征正确答案的标签;所述第三标签是所述服务器获取所述对话语料库中每组对话语料的业务场景,为每组所述对话语料添加用于表征所述对话所属业务场景的标签;
当所述服务器判断出所述添加标签后的语料库中存储有所述问题对应的答案时,将所述答案返回给所述客户端;
当所述服务器判断出所述添加标签后的语料库中没有存储有所述问题对应的答案时,所述服务器读取预置配置文件;
所述服务器根据所述配置文件判断是否向人工平台发送处理指令,如果是,则所述服务器向人工平台发送处理指令,以使所述人工平台响应所述处理指令向所述客户端返回所述问题对应的答案;如果否,则所述服务器不处理所述问题。
2.根据权利要求1所述的方法,其特征在于,在所述服务器接收用户通过客户端输入的问题之前,所述方法还包括:
所述服务器接收测试终端返回的标签更新指令,所述标签更新指令中携带有所述对话语料的标识以及新的标签,所述服务器根据所述对话语料的标识,将与所述对话语料的标识对应的对话语料的标签更新为所述新的标签。
3.根据权利要求1所述的方法,其特征在于,所述服务器将对话语料库进行机器学习,包括:
所述服务器将所述对话语料库中的对话语料按照对话主题进行分类后,为每组所述对话语料添加用于表征主题的所述第一标签。
4.根据权利要求1所述的方法,其特征在于,所述服务器向人工平台发送处理指令,以使所述人工平台响应所述处理指令向所述客户端返回所述问题对应的答案,具体包括:
所述服务器向人工平台发送处理指令,所述处理指令中包括所述问题以及响应所述问题的时限,以使所述人工平台收到所述处理指令时能够在响应时限内向所述客户端返回所述问题对应的答案。
5.根据权利要求1所述的方法,其特征在于,所述服务器向人工平台发送处理指令,以使所述人工平台响应所述处理指令向所述客户端返回所述问题对应的答案,具体包括:
所述服务器向人工平台发送处理指令,所述处理指令中包括所述问题,以使所述人工平台收到所述处理指令时,判断所述问题中是否包含财务问题,当所述人工平台判断出所述问题中是否包含财务问题时,将所述问题发送到财务平台。
6.一种数据处理装置,其特征在于,所述装置包括:
判断模块,用于服务器接收用户通过客户端输入的问题,判断添加标签后的语料库中是否存储有所述问题对应的答案,其中,所述添加标签后的语料库是所述服务器将对话语料库进行机器学习,并根据学习结果对每组对话语料添加至少一个标签后获得,其中所述每组对话语料包含一个问题以及所述问题对应的答案,所述至少一个标签包括第一标签、第二标签和第三标签,所述第二标签是所述服务器统计相同所述第一标签的对话语料中的相同答案的比例,当所述比例大于第二预设阈值时,为所述相同答案对应的对话语料添加的用于表征正确答案的标签;所述第三标签是所述服务器获取所述对话语料库中每组对话语料的业务场景,为每组所述对话语料添加用于表征所述对话所属业务场景的标签;
返回模块,用于当所述服务器判断出所述添加标签后的语料库中存储有所述问题对应的答案时,将所述答案返回给所述客户端;
读取模块,用于当所述服务器判断出所述添加标签后的语料库中没有存储有所述问题对应的答案时,所述服务器读取预置配置文件;
处理模块,用于所述服务器根据所述配置文件判断是否向人工平台发送处理指令,如果是,则所述服务器向人工平台发送处理指令,以使所述人工平台响应所述处理指令向所述客户端返回所述问题对应的答案;如果否,则所述服务器不处理所述问题。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括更新模块,所述更新模块,用于所述服务器接收测试终端返回的标签更新指令,所述标签更新指令中携带有所述对话语料的标识以及新的标签,所述服务器根据所述对话语料的标识,将与所述对话语料的标识对应的对话语料的标签更新为所述新的标签。
8.根据权利要求6所述的装置,其特征在于,所述处理模块,具体用于所述服务器向人工平台发送处理指令,所述处理指令中包括所述问题以及响应所述问题的时限,以使所述人工平台收到所述处理指令时能够在响应时限内向所述客户端返回所述问题对应的答案。
CN201610189207.7A 2016-03-29 2016-03-29 数据处理方法及装置 Active CN105812473B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610189207.7A CN105812473B (zh) 2016-03-29 2016-03-29 数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610189207.7A CN105812473B (zh) 2016-03-29 2016-03-29 数据处理方法及装置

Publications (2)

Publication Number Publication Date
CN105812473A CN105812473A (zh) 2016-07-27
CN105812473B true CN105812473B (zh) 2020-01-17

Family

ID=56455015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610189207.7A Active CN105812473B (zh) 2016-03-29 2016-03-29 数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN105812473B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830541A (zh) * 2018-04-18 2018-11-16 链家网(北京)科技有限公司 一种线上问题管理方法及管理系统
CN109241254B (zh) * 2018-08-06 2021-02-02 深圳市玖胜云智联科技有限公司 一种应用于机器人的语料采集方法及采集装置
CN109299320B (zh) * 2018-10-30 2020-09-25 上海智臻智能网络科技股份有限公司 一种信息交互方法、装置、计算机设备和存储介质
CN113535909B (zh) * 2020-04-20 2022-06-10 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备及存储介质
CN112231458B (zh) * 2020-10-23 2023-03-21 河北省讯飞人工智能研究院 一种对话语料库的扩容方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033950A (zh) * 2010-12-23 2011-04-27 哈尔滨工业大学 电子产品命名实体自动识别系统的构建方法及识别方法
CN102624675A (zh) * 2011-01-27 2012-08-01 腾讯科技(深圳)有限公司 自助式客服系统、方法
CN103761272A (zh) * 2014-01-08 2014-04-30 纳容众慧(北京)科技有限公司 互联网数据处理方法、装置及系统
CN104699708A (zh) * 2013-12-09 2015-06-10 中国移动通信集团北京有限公司 一种客服机器人的自学习方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9092740B2 (en) * 2012-11-08 2015-07-28 International Business Machines Corporation Concept noise reduction in deep question answering systems
CN104598445B (zh) * 2013-11-01 2019-05-10 腾讯科技(深圳)有限公司 自动问答系统和方法
US9659005B2 (en) * 2014-05-16 2017-05-23 Semantix Technologies Corporation System for semantic interpretation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033950A (zh) * 2010-12-23 2011-04-27 哈尔滨工业大学 电子产品命名实体自动识别系统的构建方法及识别方法
CN102624675A (zh) * 2011-01-27 2012-08-01 腾讯科技(深圳)有限公司 自助式客服系统、方法
CN104699708A (zh) * 2013-12-09 2015-06-10 中国移动通信集团北京有限公司 一种客服机器人的自学习方法及装置
CN103761272A (zh) * 2014-01-08 2014-04-30 纳容众慧(北京)科技有限公司 互联网数据处理方法、装置及系统

Also Published As

Publication number Publication date
CN105812473A (zh) 2016-07-27

Similar Documents

Publication Publication Date Title
CN105812473B (zh) 数据处理方法及装置
CN110352425B (zh) 区块链交易的认知监管合规性自动化
CN106951925B (zh) 数据处理方法、装置、服务器及系统
CN108885623B (zh) 基于知识图谱的语意分析系统及方法
CN108197177B (zh) 业务对象的监测方法、装置、存储介质和计算机设备
CN112860852A (zh) 信息分析方法及装置、电子设备和计算机可读存储介质
CN110399268A (zh) 一种异常数据检测的方法、装置及设备
CN110798567A (zh) 短信分类显示方法及装置、存储介质、电子设备
CN113032520A (zh) 信息分析方法及装置、电子设备和计算机可读存储介质
CN113641937A (zh) 一种评论自动回复方法、系统及存储介质
CN110059172B (zh) 基于自然语言理解的推荐答案的方法和装置
CN111126071A (zh) 提问文本数据的确定方法、装置和客服群的数据处理方法
CN111143404A (zh) 一种业务处理方法及装置
CN117611295A (zh) 一种基于用户需求的多商家电子商务推荐系统
CN112132690B (zh) 外汇产品信息的推送方法、装置、计算机设备及存储介质
CN113705250A (zh) 会话内容识别方法、装置、设备及计算机可读介质
CN112015870B (zh) 数据上传方法及装置
CN113205130A (zh) 一种数据审核方法、装置、电子设备及存储介质
KR102243275B1 (ko) 오프라인 오브젝트에 관한 콘텐츠 자동 생성 방법, 장치 및 컴퓨터 판독가능 저장 매체
CN117611272A (zh) 商品推荐方法、装置及电子设备
CN115983902B (zh) 基于用户实时事件的信息推送方法及系统
CN110336731B (zh) 一种群组中的用户匹配方法及设备
CN111753056A (zh) 信息推送方法和装置、计算设备、计算机可读存储介质
Eckstein et al. Towards extracting customer needs from incident tickets in it services
JP2016162163A (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 610000 Huayang Street, Tianfu New District, Chengdu City, Sichuan Province, No. 1, No. 2, No. 19 Building, Unit 2, 1903

Applicant after: Chengdu Xiaoduo Technology Co., Ltd.

Address before: 610000 846, southern section of Tianfu Avenue, Huayang street, Tianfu New District, Chengdu, Sichuan

Applicant before: CHENGDU XIAODUO TECH CO., LTD.

GR01 Patent grant
GR01 Patent grant