CN111539744A - 数据处理方法、装置、电子设备及存储介质 - Google Patents

数据处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111539744A
CN111539744A CN201910054772.6A CN201910054772A CN111539744A CN 111539744 A CN111539744 A CN 111539744A CN 201910054772 A CN201910054772 A CN 201910054772A CN 111539744 A CN111539744 A CN 111539744A
Authority
CN
China
Prior art keywords
keyword
keywords
service provider
service
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910054772.6A
Other languages
English (en)
Other versions
CN111539744B (zh
Inventor
卓皓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201910054772.6A priority Critical patent/CN111539744B/zh
Publication of CN111539744A publication Critical patent/CN111539744A/zh
Application granted granted Critical
Publication of CN111539744B publication Critical patent/CN111539744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q50/40

Abstract

本申请提供了一种数据处理方法、装置、电子设备及存储介质,涉及互联网技术领域,包括:获取服务提供方的第一语音内容以及第一文字内容;从第一语音内容以及第一文字内容中提取至少一个第一关键词;若至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,第一类关键词为表示服务提供方提供服务存在障碍的关键词;若属于第一类关键词的关键词未通过相对应的信息验证,则确定服务提供方存在过失;将判责结果发送给服务提供方。通过判责模型接收语音信息和文字信息,并直接根据语音信息和文字信息给出存在过失的用户的确定结果,与现有的人工判断相比,极大地提高了工作的效率。

Description

数据处理方法、装置、电子设备及存储介质
技术领域
本申请涉及互联网技术领域,具体而言,涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
近年来,随着移动通信技术的快速发展,大量基于智能终端的应用程序(Application,APP)涌现了出来。叫车类APP是其中很受大众欢迎的一类。随着使用叫车类APP的乘客和司机的逐渐增多,订单数量也逐渐增长,订单取消率也随之增加。因此打车平台需要对取消的订单进行确定是乘客方的责任还是司机方的责任,从而对有责方做出惩罚,以降低订单取消率。
用户在使用网约车时,在发起订单请求后,通常会通过打电话或在APP端内文字留言的方式与司机进行沟通。现有技术通常是依靠客服人员人工听取电话录音或阅读端内文字来对乘客或司机双方责任进行确定,效率低且成本较高。
发明内容
有鉴于此,本申请实施例的目的在于提供一种数据处理方法、装置、电子设备及存储介质,能够通过计算机对输入的语音内容以及文字内容进行处理并输出判责结果,从而改善现有技术在判责时存在效率低且成本较高的问题。
一方面,本申请实施例提供一种数据处理方法,包括:获取服务提供方的第一语音内容以及第一文字内容;从所述第一语音内容以及第一文字内容中提取至少一个第一关键词;若所述至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,所述第一类关键词为表示服务提供方提供服务存在障碍的关键词;若属于第一类关键词的关键词未通过相对应的信息验证,则确定所述服务提供方存在过失;将服务提供方存在过失的判责结果发送给所述服务提供方。
判责模型可以先将第一语音内容对应的语音转换成文本信息,然后对该文本信息连同第一文字内容对应的文本信息一起共同提取第一关键词。并判断被提取出的第一关键词中是否存在属于第一类关键词的关键词,若存在,对该属于第一类关键词的关键词进行相匹配的信息验证,来验证该关键词的真实性,若该关键词的真实性未通过信息验证,则确定订单的取消是由发出第一语音内容以及第一文字内容的服务提供方的过失造成;并将服务提供方存在过失的判责结果发送给所述服务提供方。通过判责模型接收语音信息和文字信息,并直接根据语音信息和文字信息给出存在过失的用户的判责结果,还可以将该判责结果发送给相应的用户,与现有的人工判断相比,极大地提高了工作的效率。
可选地,所述第一类关键词包括表征所述服务提供方距所述服务请求方距离过远的第一子关键词,所述若所述至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,包括:若所述至少一个第一关键词中存在所述第一子关键词,获取所述服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离;若所述距离未超过预设距离值,则确定所述第一子关键词未通过所述信息验证。
第一子关键词具体例如“远”,对于第一子关键词,可以获取司机对应的第一终端设备的位置以及乘客持有的第二终端设备的位置,然后获得两个位置之间的距离,并判断该距离是否超过了预设距离值,如果距离未超过预设距离值,则说明第一子关键词反映的信息并不真实,因此确定订单的取消是由司机(即服务提供方)的过失造成的。
可选地,所述第一类关键词包括表征所述服务提供方到达所述服务请求方位置时间过长的第二子关键词,所述若所述至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,包括:若所述至少一个第一关键词中存在所述第二子关键词,获取服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离,以及所述第一终端设备与第二终端设备之间的道路路况;根据所述距离以及道路路况获取预计出行时间;若所述预计出行时间未超过预设时间值,则确定所述第二子关键词未通过所述信息验证。
第二子关键词包括“时间长”,对于第二子关键词,可以获取服务提供方与服务请求方两个用户相距的距离以及两个用户之间的道路路况,并根据距离以及道路路况获取预计出行时间,然后判断预计出行时间是否超过预设时间值,若预计出行时间小于预设时间值,则说明第二子关键词反映的信息不真实,因此确定订单的取消是由司机(即服务提供方)的过失造成的。
可选地,所述第一类关键词包括表征所述服务提供方存在与计划冲突的事宜的第三子关键词,所述若所述至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,包括:若所述至少一个第一关键词中存在所述第三子关键词,获取服务提供方帐号中的接单信息;若在所述第三子关键词之后的第一时间段内,接单信息中依然存在接单记录,则确定所述第三子关键词未通过所述信息验证。
第三子关键词包括“临时有事”,可以获取服务提供方帐号中的接单信息,并判断在服务提供方表示自己“临时有事”之后的一段时间内是否依然还在接单,若接单记录显示服务提供方依然在接单,则说明第三子关键词反映的信息不真实,因此确定订单的取消是由司机(即服务提供方)的过失造成的。
可选地,在从所述第一语音内容以及第一文字内容中提取至少一个第一关键词之后,所述方法还包括:若所述至少一个第一关键词中存在属于第二类关键词的关键词,则确定服务提供方存在过失,并将服务提供方存在过失的判责结果发送给所述服务提供方,所述第二类关键词为表示服务提供方违反预设规则的关键词。
第二类关键词属于较为严重的违规行为所对应的关键词,因此若至少一个第一关键词中存在属于第二类关键词的关键词,可以直接确定是服务提供方的过失导致该订单被取消。
可选地,所述方法还包括:获取服务请求方的第二语音内容以及第二文字内容;从所述第二语音内容以及第二文字内容中提取至少一个第二关键词;若所述至少一个第二关键词中存在表征同意等待的关键词,对在该关键词之后的时间点的第一关键词进行查找;判断所述第一关键词中是否存在表征成单意向的关键词;若是,则确定所述服务提供方不存在过失。
判责模型还可以接收第二语音内容以及第二文字内容,并可以将语音内容对应的语音转换成文本信息,将该文本信息连同第二文字内容的文本信息共同提取第二关键词。然后判断第二关键词中是否存在表征同意等待的关键词,若存在,则从该关键词之后的时间点,在第一关键词中查找是否存在表征成单意向的关键词,例如“马上过去”、“尽快到达”等表征成单意向的关键词,若存在,表明司机有着强烈的成单意向,因此,即使后续订单被取消了,也可以确定司机(即服务提供方)不存在过失。
可选地,所述对在该关键词之后的时间点的来自所述第一信道的第一关键词进行查找之后,所述方法还包括:判断所述来自第一信道的第一关键词中是否存在表征拒绝意向的关键词;若是,则确定所述服务提供方存在过失;将服务提供方存在过失的判责结果发送给所述服务提供方。
若第二关键词中存在表征同意等待的关键词,则从该关键词之后的时间点,在第一关键词中查找是否存在表征拒绝意向的关键词,例如“时间太长”、“距离太远”,若存在,表明司机有明显地拒绝成单意向。因此,订单被取消会被确定是由司机(即服务提供方)的过失造成。
可选地,所述方法还包括:获取服务请求方的第二语音内容以及第二文字内容;从所述第二语音内容以及第二文字内容中提取至少一个第二关键词;若所述至少一个第二关键词中存在属于第三类关键词的关键词,则确定所述服务请求方存在过失,所述第三类关键词为表示所述服务请求方的不合理请求的关键词。
对于至少一个第二关键词,还需要判断其中是否有属于第三类关键词的关键词,第三类关键词可以是“再加个人”“增加人”等违规多带人的请求,若用户未在形成订单时提交正确的人数,在最终即将成行时临时与司机沟通需要多带人,从而造成该订单被取消的,被确定为是乘客(即服务请求方)的过失造成的。第三类关键词还可以是“下错单”、“便宜点”等不合理请求。
可选地,上述方法均可以由判责模型实现,该判责模型的训练方法包括:将历史语音内容、历史文字内容以及与所述历史语音内容、历史文字内容对应的历史过失确定结果作为样本,对所述判责模型进行训练,获得训练后的判责模型,其中,所述历史语音内容、历史文字内容作为输入量,所述历史过失确定结果作为输出量。
可以将历史语音内容、历史文字内容作为自变量,将历史过失确定结果作为因变量,输入到判责模型中,来进行判责模型的训练,以使该判责模型能够获得更加全面的第一类关键词、第二类关键词以及第三类关键词,从而对服务提供方或服务请求方的过失进行更加精确的确定。
另一方面,本申请实施例还提供一种数据处理装置,包括:第一内容输入模块,用于获取服务提供方的第一语音内容以及第一文字内容;第一关键词提取模块,用于从所述第一语音内容以及第一文字内容中提取至少一个第一关键词;信息验证模块,用于若所述至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,所述第一类关键词为表示服务提供方提供服务存在障碍的关键词;第一过失确定模块,用于若属于第一类关键词的关键词未通过相对应的信息验证,则确定所述服务提供方存在过失;结果发送模块,用于将服务提供方存在过失的判责结果发送给所述服务提供方。
判责模型可以先将第一语音内容对应的语音转换成文本信息,然后对该文本信息连同第一文字内容对应的文本信息一起共同提取第一关键词。并判断被提取出的第一关键词中是否存在属于第一类关键词的关键词,若存在,对该属于第一类关键词的关键词进行相匹配的信息验证,来验证该关键词的真实性,若该关键词的真实性未通过信息验证,则确定订单的取消是由发出第一语音内容以及第一文字内容的服务提供方的过失造成,并将服务提供方存在过失的判责结果发送给所述服务提供方。通过判责模型接收语音信息和文字信息,并直接根据语音信息和文字信息给出存在过失的用户的判责结果,并将该判责结果发送给用户确认,与现有的人工判断相比,极大地提高了工作的效率。
可选地,所述信息验证模块包括:距离子模块,用于若所述至少一个第一关键词中存在所述第一子关键词,获取所述服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离;第一子关键词验证子模块,用于若所述距离未超过预设距离值,则确定所述第一子关键词未通过所述信息验证。
第一子关键词具体例如“远”,对于第一子关键词,可以获取司机对应的第一终端设备的位置以及乘客持有的第二终端设备的位置,然后获得两个位置之间的距离,并判断该距离是否超过了预设距离值,如果距离未超过预设距离值,则说明第一子关键词反映的信息并不真实,因此确定订单的取消是由司机(即服务提供方)的过失造成的。
可选地,所述信息验证模块包括:路况子模块,用于若所述至少一个第一关键词中存在所述第二子关键词,获取服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离,以及所述第一终端设备与第二终端设备之间的道路路况;出行时间获取子模块,用于根据所述距离以及道路路况获取预计出行时间;第二子关键词验证子模块,用于若所述预计出行时间未超过预设时间值,则确定所述第二子关键词未通过所述信息验证。
第二子关键词包括“时间长”,对于第二子关键词,可以获取服务提供方与服务请求方两个用户相距的距离以及两个用户之间的道路路况,并根据距离以及道路路况获取预计出行时间,然后判断预计出行时间是否超过预设时间值,若预计出行时间小于预设时间值,则说明第二子关键词反映的信息不真实,因此确定订单的取消是由司机(即服务提供方)的过失造成的。
可选地,所述信息验证模块包括:接单信息子模块,用于若所述至少一个第一关键词中存在所述第三子关键词,获取服务提供方帐号中的接单信息;第三子关键词验证子模块,用于若在所述第三子关键词之后的第一时间段内,接单信息中依然存在接单记录,则确定所述第三子关键词未通过所述信息验证。
第三子关键词包括“临时有事”,可以获取服务提供方帐号中的接单信息,并判断在服务提供方表示自己“临时有事”之后的一段时间内是否依然还在接单,若接单记录显示服务提供方依然在接单,则说明第三子关键词反映的信息不真实,因此确定订单的取消是由司机(即服务提供方)的过失造成的。
可选地,所述装置还包括:关键词类型判断模块,用于若所述至少一个第一关键词中存在属于第二类关键词的关键词,则确定服务提供方存在过失,并将服务提供方存在过失的判责结果发送给所述服务提供方,所述第二类关键词为表示服务提供方违反预设规则的关键词。
第二类关键词属于较为严重的违规行为所对应的关键词,因此若至少一个第一关键词中存在属于第二类关键词的关键词,可以直接确定是服务提供方的过失导致该订单被取消。
可选地,所述装置还包括:第二内容输入模块,用于获取服务请求方的第二语音内容以及第二文字内容;第二关键词提取模块,用于从所述第二语音内容以及第二文字内容中提取至少一个第二关键词;第一关键词查找模块,用于若所述至少一个第二关键词中存在表征同意等待的关键词,对在该关键词之后的时间点的第一关键词进行查找;成单关键词判断模块,用于判断所述第一关键词中是否存在表征成单意向的关键词;无过失确定模块,用于确定所述服务提供方不存在过失。
判责模型还可以接收第二语音内容以及第二文字内容,并可以将语音内容对应的语音转换成文本信息,将该文本信息连同第二文字内容的文本信息共同提取第二关键词。然后判断第二关键词中是否存在表征同意等待的关键词,若存在,则从该关键词之后的时间点,在第一关键词中查找是否存在表征成单意向的关键词,例如“马上过去”、“尽快到达”等表征成单意向的关键词,若存在,表明司机有着强烈的成单意向,因此,即使后续订单被取消了,也可以确定司机(即服务提供方)不存在过失。
可选地,所述装置还包括:拒绝关键词判断模块,用于判断所述来自第一信道的第一关键词中是否存在表征拒绝意向的关键词;第二过失确定模块,用于确定所述服务提供方存在过失,并将服务提供方存在过失的判责结果发送给所述服务提供方。
若第二关键词中存在表征同意等待的关键词,则从该关键词之后的时间点,在第一关键词中查找是否存在表征拒绝意向的关键词,例如“时间太长”、“距离太远”,若存在,表明司机有明显地拒绝成单意向。因此,订单被取消会被确定是由司机(即服务提供方)的过失造成。
可选地,所述装置还包括:第二内容输入模块,用于获取服务请求方的第二语音内容以及第二文字内容;第二关键词提取模块,用于从所述第二语音内容以及第二文字内容中提取至少一个第二关键词;第三过失确定模块,用于若所述至少一个第二关键词中存在属于第三类关键词的关键词,则确定所述服务请求方存在过失,并将服务提供方存在过失的判责结果发送给所述服务提供方,所述第三类关键词为表示所述服务请求方的不合理请求的关键词。
对于至少一个第二关键词,还需要判断其中是否有属于第三类关键词的关键词,第三类关键词可以是“再加个人”“增加人”等违规多带人的请求,若用户未在形成订单时提交正确的人数,在最终即将成行时临时与司机沟通需要多带人,从而造成该订单被取消的,被确定为是乘客(即服务请求方)的过失造成的。第三类关键词还可以是“下错单”、“便宜点”等不合理请求。
可选地,所述装置还包括:模型训练模块,用于将历史语音内容、历史文字内容以及与所述历史语音内容、历史文字内容对应的历史过失确定结果作为样本,对判责模型进行训练,获得训练后的判责模型,其中,所述历史语音内容、历史文字内容作为输入量,所述历史过失确定结果作为输出量。
可以将历史语音内容、历史文字内容作为自变量,将历史过失确定结果作为因变量,输入到判责模型中,来进行判责模型的训练,以使该判责模型能够获得更加全面的第一类关键词、第二类关键词以及第三类关键词,从而对服务提供方或服务请求方的过失进行更加精确的确定。
另一方面,本申请实施例还提供一种电子设备,包括:处理器、存储介质和总线;存储介质存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行时执行如上述一方面提供的数据处理方法。
另一方面,本申请实施例还提供一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述一方面提供的数据处理方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的电子设备结构示意图;
图2示出了本申请实施例所提供的一种数据处理方法的流程示意图;
图3示出了图2中步骤S130的一种具体实施方式的流程示意图;
图4示出了图2中步骤S130的另一种具体实施方式的流程示意图;
图5示出了图2中步骤S130的又一种具体实施方式的流程示意图;
图6示出了本申请实施例所提供的一种数据处理方法的部分步骤的流程示意图;
图7示出了本申请实施例所提供的一种数据处理方法的部分步骤的流程示意图;
图8示出了本申请实施例所提供的一种数据处理方法的部分步骤的流程示意图;
图9示出了本申请实施例所提供的一种数据处理装置的示意性结构框图;
图10示出了本申请实施例所提供的数据处理系统的框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合数据处理方法,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。此外,本申请实施例中,“多个”是指两个或两个以上。
图1为本申请实施例提供的电子设备结构示意图。例如,处理器可以用于电子设备100上,并且用于执行本申请中的功能。
电子设备100可以是通用计算机或特殊用途的计算机,两者都可以用于实现本申请的数据处理方法。本申请尽管仅示出了一个计算机,但是为了方便起见,可以在多个类似平台上以分布式方式实现本申请描述的功能,以均衡处理负载。
例如,电子设备100可以包括连接到网络的网络端口110、用于执行程序指令的一个或多个处理器120、通信总线130和不同形式的存储介质140,例如,磁盘、ROM、或RAM,或其任意组合。示例性地,计算机平台还可以包括存储在ROM、RAM、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。电子设备100还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出(Input/Output,I/O)接口150。
为了便于说明,在电子设备100中仅描述了一个处理器。然而,应当注意,本申请中的电子设备100还可以包括多个处理器,因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如,若电子设备100的处理器执行步骤A和步骤B,则应该理解,步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如,第一处理器执行步骤A,第二处理器执行步骤B,或者第一处理器和第二处理器共同执行步骤A和B。
现有技术中,乘客在使用网约车时,在发起订单请求后,通常通过打电话或在APP段内文字聊天的方式与司机沟通,若乘客或司机欲取消正在进行中的订单,通常会在电话或APP中告知对方,因此,现有技术中通常依靠客服人员听取乘客与司机的通话录音或阅读文字聊天记录的方式来判断是由于双方哪一方的过失造成订单被取消。人工听取电话录音或阅读文字聊天记录的方式效率低且成本较高。
因此,本申请实施例提供了一种数据处理方法,从而改善现有技术中对用户的语音识别存在的识别准确率不高的问题。
请参见图2,图2示出了本申请实施例提供的数据处理方法,具体包括如下步骤:
步骤S110,获取服务提供方的第一语音内容以及第一文字内容。
服务提供方指的是提供服务或促成服务的提供的个人,例如,可以是网约车的驾驶员。第一语音内容为服务提供方与服务请求方进行沟通时被记录下的服务提供方的语音消息,具体可以是服务提供方与服务请求方进行电话沟通时服务提供方的通话录音,也可以是双方在沟通时服务提供方发送的音频消息,第一文字内容为服务提供方与服务请求方在沟通时,服务提供方发送的文本消息。服务请求方为请求服务或订购服务的个人,例如,可以是乘客。
具体地,第一语音内容与第一文字内容被输入到判责模型中,由判责模型根据第一语音内容与第一文字内容得到对应的确定结果。判责模型是基于HAN(层次attetntion)的模型,阈值具体可以为0.945。
判责模型具体可以通过如下方式获得:将历史语音内容、历史文字内容以及与历史语音内容、历史文字内容对应的历史过失确定结果作为样本,对判责模型进行训练,获得训练后的判责模型,其中,所述历史语音内容、历史文字内容作为输入量,所述历史过失确定结果作为输出量。
历史语音内容为一段时间内服务请求方与服务提供方沟通的音频信息,历史文字内容为一段时间内服务请求方与服务提供方沟通的文本信息,一段时间可以为三个月内,也可以为一个月内,一段时间的具体时长不应该理解为是对本申请的限制。历史过失确定结果具体可以是由客服人工地根据历史语音内容和历史文字内容所表达的含义来判断出的某订单的过失确定结果。
判责模型的训练,使该判责模型能够获得更加全面的第一类关键词、第二类关键词以及第三类关键词,从而对服务提供方或服务请求方的过失进行更加精确的确定。
步骤S120,从第一语音内容以及第一文字内容中提取至少一个第一关键词。
判责模型可以先将第一语音内容对应的语音转换成文本信息,然后对该文本信息连同第一文字内容对应的文本信息一起共同提取第一关键词。第一关键词可以是将上述文本信息分割后多个词语后,从多个词语中筛选获得的。具体地,可以将多个词语中的每个词语均与数据库中存储的词一一比对,查找出存储在数据库中的词语,并将其作为第一关键词。
步骤S130,若所述至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,所述第一类关键词为表示服务提供方提供服务存在障碍的关键词。
信息验证具体可以验证属于第一类关键词的关键词所反映的信息的真实性,由于关键词不同,信息验证的方式相应也会不同。若第一关键词中存在属于第一类关键词的关键词,对该关键词进行相匹配的信息验证,来验证该关键词的真实性。
步骤S140,若属于第一类关键词的关键词未通过相对应的信息验证,则确定所述服务提供方存在过失。
若该关键词的真实性未通过信息验证,则可以确定订单的取消是由发出第一语音内容以及第一文字内容的服务提供方的过失造成。
步骤S150,将服务提供方存在过失的判责结果发送给所述服务提供方。
服务器可以直接将判责结果发送给服务提供方,由服务提供方确认判责结果是否准确,若不准确,可以为服务提供方保留申诉的机会。
服务器也可以将判责结果连同处罚措施一同发送给服务提供方,例如,可以向服务提供方的终端设备发送警告提示信息,也可以扣除服务提供方的帐号的信用度。
在一些具体实施例中,也可以包括对服务请求方进行补偿的措施,例如,可以向服务请求方发送代金券补偿,也可以给服务请求方的终端设备提供免费搭乘网约车若干次数的补偿。
本申请实施例提供的数据处理方法具体可以用于对被取消的订单进行判断,被取消的订单的被取消应归责于谁。通过判责模型接收语音信息和文字信息,并直接根据语音信息和文字信息给出存在过失的用户的确定结果,还可以将该判责结果发送给相应的用户,与现有的人工判断相比,极大地提高了工作的效率。
可选地,在本申请实施例的一种具体实施方式中,在从第一语音内容以及第一文字内容中提取至少一个第一关键词之后,所述方法还包括:若所述至少一个第一关键词中存在属于第二类关键词的关键词,则确定服务提供方存在过失,将服务提供方存在过失的判责结果发送给所述服务提供方,所述第二类关键词为表示服务提供方违反预设规则的关键词。
第二类关键词属于较为严重的违规行为所对应的关键词,因此若至少一个第一关键词中存在属于第二类关键词的关键词,可以直接确定是服务提供方的过失导致该订单被取消。
第二类关键词包括服务提供方称因误操作而取消订单的关键词,如“看错”、“点错”、“忘记限号”等;还包括违背准时的关键词,如“早点出发”、“晚点出发”、“迟到”等;还包括诱导服务请求方取消订单的关键词,如“去不了/你取消吧”、“和别的单冲突了,您取消吧”等;还包括服务提供方欲诱导服务请求方线下提供服务的关键词,如“不走平台”、“现金”、“不打表”、“提供电话号码”等;还包括因走错路线而导致订单取消的关键词,如“开过头”、“多走”、“另外一边”等;还包括反映服务提供方驾驶的车辆与平台登记的车辆不符的关键词,如“换车”、“开这辆来接”。
可选地,请参见图3,在一种具体实施方式中,步骤S130具体包括如下步骤:
步骤S131,若至少一个第一关键词中存在第一子关键词,获取服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离。
第一子关键词为表征服务提供方距服务请求方距离过远的关键词,例如,具体可以为“远”、“太远”、“过远”等,判责模型在接收到第一子关键词后,可以验证距离过远的信息是否真实,具体地,可以先获得服务提供方的终端设备与服务请求方持有的终端设备之间的距离,然后在将该距离与预设距离值进行比较,判断该距离是否超过预设距离值。
步骤S132,若所述距离未超过预设距离值,则确定所述第一子关键词未通过所述信息验证。
预设距离值为衡量距离是否过远的一个具体值,超过预设距离值,可以认为距离过远成立;低于预设距离值,可以认为距离过远不成立。预设距离值可以是2.5公里。
如果距离未超过预设距离值,则说明第一子关键词反映的信息并不真实,因此确定订单的取消是由司机(即服务提供方)的过失造成的。
可选地,请参见图4,在另一种具体实施方式中,步骤S130具体包括如下步骤:
步骤S231,若所述至少一个第一关键词中存在所述第二子关键词,获取服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离,以及第一终端设备与第二终端设备之间的道路路况。
第二子关键词为表征服务提供方到达服务请求方位置的时间过长的关键词,具体可以为“时间长”、“太久”、“太堵”等,判责模型在接收到第二子关键词后,可以验证时间过长的信息是否真实。
步骤S232,根据所述距离以及道路路况获取预计出行时间。
具体地,判责模型可以获得服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离,以及第一终端设备与第二终端设备之间的道路路况,并且依据距离以及道路路况获得预计出行时间,然后将预计出行时间与预设时间值作比较,判断预计出行时间是否超过预设时间值。
道路路况可以是反映道路拥堵程度的指标,具体可以用单位面积内车辆的数量来表征。具体地,判责模型中可以存储单位面积内车辆的数量与该单位面积内的车辆行驶速度的对应关系,然后判责模型根据单位面积内车辆的数量获得车辆行驶速度,再根据第一终端设备与第二终端设备之间的距离与上述车辆行驶速度的比值便可以获得服务提供方的车辆的预计出行时间。
步骤S233,若所述预计出行时间未超过预设时间值,则确定所述第二子关键词未通过所述信息验证。
预设时间值为衡量时间是否过长的一个具体数值,若预计出行时间超过预设时间值,可以认为时间过长成立;若预计出行时间少于预设时间值,可以认为时间过长不成立。若预计出行时间小于预设时间值,则说明第二子关键词反映的信息不真实,因此确定订单的取消是由司机(即服务提供方)的过失造成的。
可选地,请参见图5,在又一种具体实施方式中,步骤S130具体包括如下步骤:
步骤S331,若所述至少一个第一关键词中存在所述第三子关键词,获取服务提供方帐号中的接单信息。
第三子关键词为表征服务提供方存在与计划冲突的事宜的关键词,例如“临时有事”、“突然有事”等。判责模型在接收到第三子关键词后,可以验证存在与计划冲突的事宜的信息是否真实。
步骤S332,若在所述第三子关键词之后的第一时间段内,接单信息中依然存在接单记录,则确定所述第三子关键词未通过所述信息验证。
第一时间段为服务提供方发出第三子关键词之后开始计时的一个时间段,该时间段的具体时间长度可以为半小时,也可以为一小时,具体时长不应该理解为是对本申请的限制。
具体地,判责模型可以获得服务提供方的接单信息,并且从接单信息中查找该服务提供方在发出第三子关键词之后的第一时间段内是否依然存在接单记录,若依然存在接单记录,则表明第三子关键词所反映的信息不真实,因此确定订单的取消是由司机(即服务提供方)的过失造成的。
可选地,请参见图6,本申请实施例提供的数据处理方法还可以包括如下步骤:
步骤S410,获取服务请求方的第二语音内容以及第二文字内容。
第二语音内容为服务提供方与服务请求方进行沟通时被记录下的服务请求方的语音消息,具体可以是服务提供方与服务请求方进行电话沟通时服务请求方的通话录音,也可以是双方在沟通时服务请求方发送的音频消息。第二文字内容为服务提供方与服务请求方在沟通时,服务请求方发送的文本消息。
第二语音内容与第二文字内容被输入到判责模型中,由判责模型根据第二语音内容与第二文字内容得到对应的确定结果。
步骤S420,从第二语音内容以及第二文字内容中提取至少一个第二关键词。
判责模型可以先将第二语音内容对应的语音转换成文本信息,然后对该文本信息连同第二文字内容对应的文本信息一起共同提取第二关键词。第二关键词可以是将上述文本信息分割后多个词语后,从多个词语中筛选获得的。具体地,可以将多个词语中的每个词语均与数据库中存储的词一一比对,查找出存储在数据库中的词语,并将其作为第二关键词。
步骤S430,若所述至少一个第二关键词中存在表征同意等待的关键词,对在该关键词之后的时间点的第一关键词进行查找。
表征同意等待的关键词为服务请求方在服务提供方表明履行服务存在障碍时,表明服务请求方愿意等待服务提供方克服障碍继续履行服务的关键词,例如,在服务提供方表明“路太远”、“车太堵”、“时间太长”等障碍时,服务请求方发出“可以等”、“再等等”等关键词。
当服务提供方表明同意等待的态度之后,服务提供方接下来的态度将对订单是否取消产生较大的影响。因此,可以查找表征同意等待的关键词之后的时间点中第一关键词中反映服务提供方态度的关键词。
步骤S440,判断第一关键词中是否存在表征成单意向的关键词,若是,执行步骤S450。
若第一关键词中存在表征成单意向的关键词,例如“马上过去”、“尽快到达”等,则表明服务提供方有着较强的成单意向,执行步骤S450。
步骤S450,确定所述服务提供方不存在过失。
因此,即使后续订单被取消了,也可以确定司机(即服务提供方)不存在过失。
请参见图7,可选地,在步骤S430之后,具体还可以包括如下步骤:
步骤S460,判断第一关键词中是否存在表征拒绝意向的关键词,若是,执行步骤S470。
若第一关键词中存在表征拒绝意向的关键词,如依然强调“太远”、“时间太长”、“太堵”,则表明服务提供方有着较强的拒绝意向,执行步骤S470。
步骤S470,确定所述服务提供方存在过失,将服务提供方存在过失的判责结果发送给所述服务提供方。
服务请求方有较大可能是感觉到服务提供方不愿意履行服务的意愿,从而取消订单,因此订单被取消会被确定是由司机(即服务提供方)的过失造成。
请参见图8,可选地,本申请实施例还可以包括如下步骤:
步骤S510,获取服务请求方的第二语音内容以及第二文字内容。
步骤S520,从第二语音内容以及第二文字内容中提取至少一个第二关键词。
步骤S510至步骤S520与图6示出的步骤S410至步骤S420对应相同,在此便不做赘述。
步骤S530,若所述至少一个第二关键词中存在属于第三类关键词的关键词,则确定所述服务请求方存在过失。
第三类关键词为表示服务请求方的不合理请求的关键词,第三类关键词可以是“再加个人”“增加人”等违规多带人的请求,若用户未在形成订单时提交正确的人数,在最终即将成行时临时与司机沟通需要多带人,从而造成该订单被取消的,被确定为是乘客(即服务请求方)的过失造成的。第三类关键词还可以是“下错单”、“便宜点”等刷单议价请求。
若所述至少一个第二关键词中存在属于第三类关键词的关键词,则确定所述服务请求方存在过失。
服务请求方存在过失时,服务器可以对服务请求方发送相应的处罚措施,如扣除服务请求方的信用度;服务器也可以不对服务请求方进行相应的处罚。
图9示出了数据处理装置的示意性结构框图,该数据处理装置实现的功能对应上述方法执行的步骤。该装置可以理解为执行数据处理方法的服务器,或服务器中的处理器,也可以理解为独立于上述服务器或处理器之外的在服务器控制下实现本申请功能的组件,如图所示,该数据处理装置900可以包括:
第一内容输入模块910,用于获取服务提供方的第一语音内容以及第一文字内容。
第一关键词提取模块920,用于从所述第一语音内容以及第一文字内容中提取至少一个第一关键词。
信息验证模块930,用于若所述至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,所述第一类关键词为表示服务提供方提供服务存在障碍的关键词。
第一过失确定模块940,用于若属于第一类关键词的关键词未通过相对应的信息验证,则确定所述服务提供方存在过失。
结果发送模块950,用于将服务提供方存在过失的判责结果发送给所述服务提供方。
在上述实施例的基础上,所述信息验证模块包括:距离子模块,用于若所述至少一个第一关键词中存在所述第一子关键词,获取所述服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离;第一子关键词验证子模块,用于若所述距离未超过预设距离值,则确定所述第一子关键词未通过所述信息验证。
在上述实施例的基础上,所述信息验证模块包括:路况子模块,用于若所述至少一个第一关键词中存在所述第二子关键词,获取服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离,以及所述第一终端设备与第二终端设备之间的道路路况;出行时间获取子模块,用于根据所述距离以及道路路况获取预计出行时间;第二子关键词验证子模块,用于若所述预计出行时间未超过预设时间值,则确定所述第二子关键词未通过所述信息验证。
在上述实施例的基础上,所述信息验证模块包括:接单信息子模块,用于若所述至少一个第一关键词中存在所述第三子关键词,获取服务提供方帐号中的接单信息;第三子关键词验证子模块,用于若在所述第三子关键词之后的第一时间段内,接单信息中依然存在接单记录,则确定所述第三子关键词未通过所述信息验证。
在上述实施例的基础上,所述装置还包括:关键词类型判断模块,用于若所述至少一个第一关键词中存在属于第二类关键词的关键词,则确定服务提供方存在过失,将服务提供方存在过失的判责结果发送给所述服务提供方,所述第二类关键词为表示服务提供方违反预设规则的关键词。
在上述实施例的基础上,所述装置还包括:第二内容输入模块,用于获取服务请求方的第二语音内容以及第二文字内容;第二关键词提取模块,用于从所述第二语音内容以及第二文字内容中提取至少一个第二关键词;第一关键词查找模块,用于若所述至少一个第二关键词中存在表征同意等待的关键词,对在该关键词之后的时间点的第一关键词进行查找;成单关键词判断模块,用于判断所述第一关键词中是否存在表征成单意向的关键词;无过失确定模块,用于确定所述服务提供方不存在过失。
在上述实施例的基础上,所述装置还包括:拒绝关键词判断模块,用于判断所述来自第一信道的第一关键词中是否存在表征拒绝意向的关键词;第二过失确定模块,用于确定所述服务提供方存在过失,将服务提供方存在过失的判责结果发送给所述服务提供方。
在上述实施例的基础上,所述装置还包括:第二内容输入模块,用于获取服务请求方的第二语音内容以及第二文字内容;第二关键词提取模块,用于从所述第二语音内容以及第二文字内容中提取至少一个第二关键词;第三过失确定模块,用于若所述至少一个第二关键词中存在属于第三类关键词的关键词,则确定所述服务请求方存在过失,所述第三类关键词为表示所述服务请求方的不合理请求的关键词。
在上述实施例的基础上,所述装置还包括:模型训练模块,用于将历史语音内容、历史文字内容以及与所述历史语音内容、历史文字内容对应的历史过失确定结果作为样本,对所述判责模型进行训练,获得训练后的判责模型,其中,所述历史语音内容、历史文字内容作为输入量,所述历史过失确定结果作为输出量。
上述模块可以经由有线连接或无线连接彼此连接或通信。有线连接可以包括金属线缆、光缆、混合线缆等,或其任意组合。无线连接可以包括通过LAN、WAN、蓝牙、ZigBee、或NFC等形式的连接,或其任意组合。两个或更多个模块可以组合为单个模块,并且任何一个模块可以分成两个或更多个单元。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
图10本发明实施例提供的数据处理系统的框图。例如,数据处理系统可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。数据处理系统可以包括服务器501、网络502、服务请求端503、服务提供端504和数据库505中的一种或多种,服务器501中可以包括执行指令操作的处理器。应当说明的是,服务器可以为本发明实施例提供的数据处理装置。
在一些实施例中,服务器501可以是单个服务器,也可以是服务器组。服务器组可以是集中式的,也可以是分布式的(例如,服务器501可以是分布式系统)。在一些实施例中,服务器501相对于终端,可以是本地的、也可以是远程的。例如,服务器501可以经由网络502访问存储在服务请求端503、服务提供端504、或数据库505、或其任意组合中的信息和/或数据。作为另一示例,服务器501可以直接连接到服务请求端503、服务提供端504和数据库505中至少一个,以访问存储的信息和/或数据。在一些实施例中,服务器501可以在云平台上实现;仅作为示例,云平台可以包括私有云、公有云、混合云、社区云(community cloud)、分布式云、跨云(inter-cloud)、多云(multi-cloud)等,或者它们的任意组合。在一些实施例中,服务器501可以在具有本申请中图1所示的一个或多个组件的电子设备100上实现。
在一些实施例中,服务器501可以包括处理器。处理器可以处理与服务请求有关的信息和/或数据,以执行本申请中描述的一个或多个功能。例如,处理器可以基于从服务请求端503获得的数据信息来进行数据处理。在一些实施例中,处理器可以包括一个或多个处理核(例如,单核处理器(S)或多核处理器(S))。仅作为举例,处理器可以包括中央处理单元(Central Processing Unit,CPU)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、专用指令集处理器(Application Specific Instruction-setProcessor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、简化指令集计算机(ReducedInstruction Set Computing,RISC)、或微处理器等,或其任意组合。
网络502可以用于信息和/或数据的交换。在一些实施例中,数据处理系统中的一个或多个组件(例如,服务器501,服务请求端503,服务提供端504和数据库505)可以向其他组件发送信息和/或数据。例如,服务器501可以经由网络502从服务请求端503获取服务请求。在一些实施例中,网络502可以是任何类型的有线或者无线网络,或者是他们的结合。仅作为示例,网络502可以包括有线网络、无线网络、光纤网络、远程通信网络、内联网、因特网、局域网(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、无线局域网(Wireless Local Area Networks,WLAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、公共电话交换网(Public Switched Telephone Network,PSTN)、蓝牙网络、ZigBee网络、或近场通信(Near Field Communication,NFC)网络等,或其任意组合。在一些实施例中,网络502可以包括一个或多个网络接入点。例如,网络502可以包括有线或无线网络接入点,例如基站和/或网络交换节点,数据处理系统的一个或多个组件可以通过该接入点连接到网络502以交换数据和/或信息。
在一些实施例中,服务请求端503的用户可以是除服务实际需求者之外的其他人。例如,服务请求端503的用户A可以使用服务请求端503来为服务实际需求者B发起服务请求(比如,用户A可以为自己的朋友B叫车),或者从服务器501接收服务信息或指令等。在一些实施例中,服务提供端504的用户可以是服务实际提供者,也可以是除服务实际提供者之外的其他人。例如,服务提供端504的用户C可以使用服务提供端504接收由服务实际提供者D提供服务的服务请求(比如用户C可以为自己雇用的司机D接单),和/或来自服务器501的信息或指令。在一些实施例中,“服务请求方”和“服务请求端”可以互换使用,“服务提供方”和“服务提供端”可以互换使用。
在一些实施例中,服务请求端503可以包括移动设备、平板计算机、膝上型计算机、或机动车辆中的内置设备等,或其任意组合。在一些实施例中,移动设备可以包括智能家居设备、可穿戴设备、智能移动设备、虚拟现实设备、或增强现实设备等,或其任意组合。在一些实施例中,智能家居设备可以包括智能照明设备、智能电器设备的控制设备、智能监控设备、智能电视、智能摄像机、或对讲机等,或其任意组合。在一些实施例中,可穿戴设备可包括智能手环、智能鞋带、智能眼镜、智能头盔、智能手表、智能服装、智能背包、智能配件等、或其任何组合。在一些实施例中,智能移动设备可以包括智能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏设备、导航设备、或销售点(point of sale,POS)设备等,或其任意组合。在一些实施例中,服务请求端503可以是具有用于定位服务请求方和/或服务请求端的位置的定位技术的设备。
在一些实施例中,服务提供端504可以是与服务请求端503类似或相同的设备。在一些实施例中,服务提供端504可以是具有定位技术的设备,用于定位服务提供方和/或服务提供端的位置。在一些实施例中,服务请求端503和/或服务提供端504可以与其他定位设备通信以确定服务请求方、服务请求端503、服务提供方、或服务提供端504、或其任意组合的位置。在一些实施例中,服务请求端503和/或服务提供端504可以将定位信息发送给服务器501。
数据库505可以存储数据和/或指令。在一些实施例中,数据库505可以存储从服务请求端503和/或服务提供端504获得的数据。在一些实施例中,数据库505可以存储在本申请中描述的示例性方法的数据和/或指令。在一些实施例中,数据库505可以包括大容量存储器、可移动存储器、易失性读写存储器、或只读存储器(Read-Only Memory,ROM)等,或其任意组合。作为举例,大容量存储器可以包括磁盘、光盘、固态驱动器等;可移动存储器可包括闪存驱动器、软盘、光盘、存储卡、zip磁盘、磁带等;易失性读写存储器可以包括随机存取存储器(Random Access Memory,RAM);RAM可以包括动态RAM(Dynamic Random AccessMemory,DRAM),双倍数据速率同步动态RAM(Double Date-Rate Synchronous RAM,DDRSDRAM);静态RAM(Static Random-Access Memory,SRAM),晶闸管RAM(Thyristor-BasedRandom Access Memory,T-RAM)和零电容器RAM(Zero-RAM)等。作为举例,ROM可以包括掩模ROM(Mask Read-Only Memory,MROM)、可编程ROM(Programmable Read-Only Memory,PROM)、可擦除可编程ROM(Programmable Erasable Read-only Memory,PEROM)、电可擦除可编程ROM(Electrically Erasable Programmable read only memory,EEPROM)、光盘ROM(CD-ROM)、以及数字通用磁盘ROM等。在一些实施例中,数据库505可以在云平台上实现。仅作为示例,云平台可以包括私有云、公有云、混合云、社区云、分布式云、跨云、多云或者其它类似的等,或其任意组合。
在一些实施例中,数据库505可以连接到网络502以与数据处理系统(例如,服务器501,服务请求端503,服务提供端504等)中的一个或多个组件通信。数据处理系统中的一个或多个组件可以经由网络502访问存储在数据库505中的数据或指令。在一些实施例中,数据库505可以直接连接到数据处理系统中的一个或多个组件(例如,服务器501,服务请求端503,服务提供端504等);或者,在一些实施例中,数据库505也可以是服务器501的一部分。
在一些实施例中,数据处理系统中的一个或多个组件(例如,服务器501,服务请求端503,服务提供端504等)可以具有访问数据库505的权限。在一些实施例中,当满足一定条件时,数据处理系统中的一个或多个组件可以读取和/或修改与服务请求方、服务提供方、或公众、或其任意组合有关的信息。例如,服务器501可以在接收服务请求之后读取和/或修改一个或多个用户的信息。作为另一示例,服务提供端504可以在从服务请求端503接收服务请求时访问与服务请求方有关的信息,但是服务提供端504可以不修改服务请求方的相关信息。
在一些实施例中,可以通过请求服务来实现数据处理系统中的一个或多个组件的信息交换。服务请求的对象可以是任何产品。在一些实施方案中,产品可以是有形产品或非物质产品。有形产品可包括食品、药品、商品、化学产品、电器、服装、汽车、房屋、或奢侈品等,或其任意组合。非物质产品可以包括服务产品、金融产品、知识产品、或互联网产品等,或其任意组合。互联网产品可以包括单独的主机产品、网络产品、移动互联网产品、商业主机产品、或嵌入式产品等,或其任意组合。互联网产品可以用在移动终端的软件、程序、或系统等,或者它们的任意组合中。移动终端可以包括平板电脑、笔记本电脑、移动电话、个人数字助理(Personal Digital Assistant,PDA)、智能手表、销售点(Point of sales,POS)设备、车载电脑、车载电视、或可穿戴设备等,或其任意组合。例如,互联网产品可以是计算机或移动电话中使用的任何软件和/或应用程序。软件和/或应用程序可以涉及社交、购物、运输、娱乐时间、学习、或投资等,或其任意组合。在一些实施例中,与运输有关的软件和/或应用程序可以包括旅行软件和/或应用程序、车辆调度软件和/或应用程序、绘图软件和/或应用程序等。在车辆调度软件和/或应用程序中,车辆可包括马、马车、人力车(例如,独轮车、自行车、三轮车等)、汽车(例如,出租车、公共汽车、私家车等)、火车、地铁、船只、飞机(例如,飞机、直升机、航天飞机、火箭、热气球等)等,或其任意组合。
另一方面,本申请实施例还提供一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述一方面提供的数据处理方法的步骤。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (20)

1.一种数据处理方法,其特征在于,包括:
获取服务提供方的第一语音内容以及第一文字内容;
从所述第一语音内容以及第一文字内容中提取至少一个第一关键词;
若所述至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,所述第一类关键词为表示服务提供方提供服务存在障碍的关键词;
若属于第一类关键词的关键词未通过相对应的信息验证,则确定所述服务提供方存在过失,并输出与所述服务提供方存在过失对应的服务关系维护操作。
2.根据权利要求1所述的方法,其特征在于,所述第一类关键词包括表征所述服务提供方距所述服务请求方距离过远的第一子关键词,所述若所述至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,包括:
若所述至少一个第一关键词中存在所述第一子关键词,获取所述服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离;
若所述距离未超过预设距离值,则确定所述第一子关键词未通过所述信息验证。
3.根据权利要求1所述的方法,其特征在于,所述第一类关键词包括表征所述服务提供方到达所述服务请求方位置时间过长的第二子关键词,所述若所述至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,包括:
若所述至少一个第一关键词中存在所述第二子关键词,获取服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离,以及所述第一终端设备与第二终端设备之间的道路路况;
根据所述距离以及道路路况获取预计出行时间;
若所述预计出行时间未超过预设时间值,则确定所述第二子关键词未通过所述信息验证。
4.根据权利要求1所述的方法,其特征在于,所述第一类关键词包括表征所述服务提供方存在与计划冲突的事宜的第三子关键词,所述若所述至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,包括:
若所述至少一个第一关键词中存在所述第三子关键词,获取服务提供方帐号中的接单信息;
若在所述第三子关键词之后的第一时间段内,接单信息中依然存在接单记录,则确定所述第三子关键词未通过所述信息验证。
5.根据权利要求1所述的方法,其特征在于,在从所述第一语音内容以及第一文字内容中提取至少一个第一关键词之后,所述方法还包括:
若所述至少一个第一关键词中存在属于第二类关键词的关键词,则确定服务提供方存在过失,并输出与所述服务提供方存在过失对应的服务关系维护操作,所述第二类关键词为表示服务提供方违反预设规则的关键词。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取服务请求方的第二语音内容以及第二文字内容;
从所述第二语音内容以及第二文字内容中提取至少一个第二关键词;
若所述至少一个第二关键词中存在表征同意等待的关键词,对在该关键词之后的时间点的第一关键词进行查找;
判断所述第一关键词中是否存在表征成单意向的关键词;
若是,则确定所述服务提供方不存在过失。
7.根据权利要求6所述的方法,其特征在于,所述对在该关键词之后的时间点的第一关键词进行查找之后,所述方法还包括:
判断所述第一关键词中是否存在表征拒绝意向的关键词;
若是,则确定所述服务提供方存在过失,并输出与所述服务提供方存在过失对应的服务关系维护操作。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取服务请求方的第二语音内容以及第二文字内容;
从所述第二语音内容以及第二文字内容中提取至少一个第二关键词;
若所述至少一个第二关键词中存在属于第三类关键词的关键词,则确定所述服务请求方存在过失,并输出与所述服务请求方存在过失对应的服务关系维护操作,所述第三类关键词为表示所述服务请求方的不合理请求的关键词。
9.根据权利要求1-8任一项所述的方法,其特征在于,权利要求1-8任一项所述的方法利用判责模型实现,所述判责模型的训练过程包括:
将历史语音内容、历史文字内容以及与所述历史语音内容、历史文字内容对应的历史过失确定结果作为样本,对所述判责模型进行训练,获得训练后的判责模型,其中,所述历史语音内容、历史文字内容作为输入量,所述历史过失确定结果作为输出量。
10.一种数据处理装置,其特征在于,所述装置包括:
第一内容输入模块,用于获取服务提供方的第一语音内容以及第一文字内容;
第一关键词提取模块,用于从所述第一语音内容以及第一文字内容中提取至少一个第一关键词;
信息验证模块,用于若所述至少一个第一关键词中存在属于第一类关键词的关键词,对属于第一类关键词的关键词执行相对应的信息验证,所述第一类关键词为表示服务提供方提供服务存在障碍的关键词;
第一过失确定模块,用于若属于第一类关键词的关键词未通过相对应的信息验证,则确定所述服务提供方存在过失,并输出与所述服务提供方存在过失对应的服务关系维护操作。
11.根据权利要求10所述的装置,其特征在于,所述信息验证模块包括:
距离子模块,用于若所述至少一个第一关键词中存在第一子关键词,获取所述服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离;
第一子关键词验证子模块,用于若所述距离未超过预设距离值,则确定所述第一子关键词未通过所述信息验证。
12.根据权利要求10所述的装置,其特征在于,所述信息验证模块包括:
路况子模块,用于若所述至少一个第一关键词中存在第二子关键词,获取服务提供方对应的第一终端设备与服务请求方对应的第二终端设备之间的距离,以及所述第一终端设备与第二终端设备之间的道路路况;
出行时间获取子模块,用于根据所述距离以及道路路况获取预计出行时间;
第二子关键词验证子模块,用于若所述预计出行时间未超过预设时间值,则确定所述第二子关键词未通过所述信息验证。
13.根据权利要求10所述的装置,其特征在于,所述信息验证模块包括:
接单信息子模块,用于若所述至少一个第一关键词中存在第三子关键词,获取服务提供方帐号中的接单信息;
第三子关键词验证子模块,用于若在所述第三子关键词之后的第一时间段内,接单信息中依然存在接单记录,则确定所述第三子关键词未通过所述信息验证。
14.根据权利要求10所述的装置,其特征在于,所述装置还包括:
关键词类型判断模块,用于若所述至少一个第一关键词中存在属于第二类关键词的关键词,则确定服务提供方存在过失,并输出与所述服务提供方存在过失对应的服务关系维护操作,所述第二类关键词为表示服务提供方违反预设规则的关键词。
15.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第二内容输入模块,用于获取服务请求方的第二语音内容以及第二文字内容;
第二关键词提取模块,用于从所述第二语音内容以及第二文字内容中提取至少一个第二关键词;
第一关键词查找模块,用于若所述至少一个第二关键词中存在表征同意等待的关键词,对在该关键词之后的时间点的第一关键词进行查找;
成单关键词判断模块,用于判断所述第一关键词中是否存在表征成单意向的关键词;
无过失确定模块,用于确定所述服务提供方不存在过失。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:
拒绝关键词判断模块,用于判断所述第一关键词中是否存在表征拒绝意向的关键词;
第二过失确定模块,用于确定所述服务提供方存在过失,并输出与所述服务提供方存在过失对应的服务关系维护操作。
17.根据权利要求10所述的装置,其特征在于,所述装置还包括:
第二内容输入模块,用于获取服务请求方的第二语音内容以及第二文字内容;
第二关键词提取模块,用于从所述第二语音内容以及第二文字内容中提取至少一个第二关键词;
第三过失确定模块,用于若所述至少一个第二关键词中存在属于第三类关键词的关键词,则确定所述服务请求方对应的服务请求方存在过失,并输出与所述服务请求方存在过失对应的服务关系维护操作,所述第三类关键词为表示所述服务请求方的不合理请求的关键词。
18.根据权利要求10所述的装置,其特征在于,所述装置还包括:
模型训练模块,用于将历史语音内容、历史文字内容以及与所述历史语音内容、历史文字内容对应的历史过失确定结果作为样本,对判责模型进行训练,获得训练后的判责模型,其中,所述历史语音内容、历史文字内容作为输入量,所述历史过失确定结果作为输出量。
19.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至9任一所述的数据处理方法的步骤。
20.一种存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至9任一所述的数据处理方法的步骤。
CN201910054772.6A 2019-01-21 2019-01-21 数据处理方法、装置、电子设备及存储介质 Active CN111539744B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910054772.6A CN111539744B (zh) 2019-01-21 2019-01-21 数据处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910054772.6A CN111539744B (zh) 2019-01-21 2019-01-21 数据处理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111539744A true CN111539744A (zh) 2020-08-14
CN111539744B CN111539744B (zh) 2023-08-29

Family

ID=71974759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910054772.6A Active CN111539744B (zh) 2019-01-21 2019-01-21 数据处理方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111539744B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113724735A (zh) * 2021-09-01 2021-11-30 广州博冠信息科技有限公司 语音流处理方法及装置、计算机可读存储介质、电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108076204A (zh) * 2017-11-30 2018-05-25 努比亚技术有限公司 一种呼叫处理的方法及终端
CN108664581A (zh) * 2018-05-04 2018-10-16 何永安 租车用户的责任判定方法、装置、服务器和存储介质
CN108805660A (zh) * 2018-05-24 2018-11-13 北京三快在线科技有限公司 订单处理方法、装置及服务器
WO2018205561A1 (en) * 2017-05-09 2018-11-15 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for processing an abnormal order
CN108959247A (zh) * 2018-06-19 2018-12-07 深圳市元征科技股份有限公司 一种数据处理方法、服务器及计算机可读介质
CN109065045A (zh) * 2018-08-30 2018-12-21 出门问问信息科技有限公司 语音识别方法、装置、电子设备及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018205561A1 (en) * 2017-05-09 2018-11-15 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for processing an abnormal order
CN108076204A (zh) * 2017-11-30 2018-05-25 努比亚技术有限公司 一种呼叫处理的方法及终端
CN108664581A (zh) * 2018-05-04 2018-10-16 何永安 租车用户的责任判定方法、装置、服务器和存储介质
CN108805660A (zh) * 2018-05-24 2018-11-13 北京三快在线科技有限公司 订单处理方法、装置及服务器
CN108959247A (zh) * 2018-06-19 2018-12-07 深圳市元征科技股份有限公司 一种数据处理方法、服务器及计算机可读介质
CN109065045A (zh) * 2018-08-30 2018-12-21 出门问问信息科技有限公司 语音识别方法、装置、电子设备及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张天天: "网约车合同问题研究 ——以网约私家车为视角", 《中国优秀硕士学位论文全文数据库 社会科学Ⅰ辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113724735A (zh) * 2021-09-01 2021-11-30 广州博冠信息科技有限公司 语音流处理方法及装置、计算机可读存储介质、电子设备

Also Published As

Publication number Publication date
CN111539744B (zh) 2023-08-29

Similar Documents

Publication Publication Date Title
JP6568240B2 (ja) 運輸サービスの料金を求める方法及びシステム
TWI638320B (zh) 推薦預計到達時間的系統、方法及非暫態電腦可讀儲存媒體
JP6535105B2 (ja) 相乗りのためのシステム及び方法
CN110678885B (zh) 用于运力调度的系统和方法
JP7080561B2 (ja) 情報提供装置および情報提供方法
CN111105251A (zh) 一种信息推送方法及装置
KR102636645B1 (ko) 통합 교통 서비스 제공 시스템 및 방법
CN110766506A (zh) 一种订单生成方法、装置、电子设备和存储介质
CN111860558A (zh) 行程异常检测方法、装置及电子设备
CN111367575A (zh) 一种用户行为预测方法、装置、电子设备及存储介质
CN110750709A (zh) 一种服务推荐方法及装置
CN111326147B (zh) 语音识别方法、装置、电子设备及存储介质
CN110766391B (zh) 一种服务订单支付方法、装置、电子设备及存储介质
CN111259119B (zh) 一种问题推荐方法及装置
CN111489214B (zh) 订单分配方法、条件设置方法、装置及电子设备
CN111104585B (zh) 一种问题推荐方法及装置
JP2023540731A (ja) オンライン予約車両情報処理方法、装置、機器、及びコンピュータ記憶媒体
CN111539744A (zh) 数据处理方法、装置、电子设备及存储介质
CN111353093A (zh) 问题推荐方法、装置、服务器及可读存储介质
CN111127126A (zh) 一种信息反馈方法及装置、计算机可读存储介质
CN111260423A (zh) 订单分配方法、装置、电子设备及计算机可读存储介质
CN111401030B (zh) 服务异常识别方法、装置、服务器及可读存储介质
CN111259229B (zh) 一种问题推荐方法及装置
CN111915043A (zh) 服务数据处理方法、装置、服务器及存储介质
CN110751304A (zh) 一种服务提供端的信息交互同步方法以及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant