WO2020077841A1 - 基于声纹识别的客服方法、装置、计算机设备及存储介质 - Google Patents

基于声纹识别的客服方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
WO2020077841A1
WO2020077841A1 PCT/CN2018/123559 CN2018123559W WO2020077841A1 WO 2020077841 A1 WO2020077841 A1 WO 2020077841A1 CN 2018123559 W CN2018123559 W CN 2018123559W WO 2020077841 A1 WO2020077841 A1 WO 2020077841A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
verified
voice
key information
historical
Prior art date
Application number
PCT/CN2018/123559
Other languages
English (en)
French (fr)
Inventor
冯智斌
安栋
刘继鹏
伍朗
魏斌斌
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2020077841A1 publication Critical patent/WO2020077841A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/06Decision making techniques; Pattern matching strategies

Definitions

  • the present application relates to the field of computer technology, and in particular, to a customer service method, device, computer equipment, and storage medium based on voiceprint recognition.
  • the telephone customer service system authenticates the user
  • the authentication method is implemented based on the identification number manually entered by the user and the relevant authentication password and other authentication methods.
  • the user After the user dials the customer service call on the mobile phone, the user needs to repeat the listening-button-listening operation frequently, which brings inconvenience to the user and affects the user's call efficiency.
  • the telephone customer service system is inefficient in prompting and guiding users to operate. Problems that could be easily solved by the original user need to be operated step by step in the telephone customer service system according to the redundant process, which takes more time. Solve the problem.
  • embodiments of the present application provide a customer service method, device, computer equipment, and storage medium based on voiceprint recognition, to solve the problem of low efficiency in solving user problems through a telephone customer service system.
  • an embodiment of the present application provides a customer service method based on voiceprint recognition, including:
  • the voice to be verified includes a user identification and at least one kind of real-time verification information
  • an embodiment of the present application provides a customer service device based on voiceprint recognition, including:
  • a to-be-verified voice acquisition module configured to acquire to-be-verified voice, the to-be-verified voice includes a user identification and at least one kind of real-time verification information;
  • a voiceprint feature extraction module to be verified used to extract voiceprint features to be verified from the voice to be verified;
  • a first verification result acquiring module configured to match the similarity between the voiceprint feature to be verified and the pre-registered standard voiceprint feature according to the user identification to obtain a first verification result
  • a second verification result acquiring module configured to verify the identity of the user based on at least one of the real-time verification information to obtain a second verification result
  • a historical key information obtaining module configured to obtain historical key information associated with the user identity according to the user identification if both the first verification result and the second verification result indicate that the verification is passed;
  • Prompt content acquisition module for obtaining prompt content according to the historical key information
  • the guide operation module is used to guide the user to operate according to the prompt content.
  • a computer device in a third aspect, includes a memory, a processor, and computer-readable instructions stored in the memory and executable on the processor.
  • the processor implements the computer-readable instructions as follows step:
  • the voice to be verified includes a user identification and at least one kind of real-time verification information
  • an embodiment of the present application provides a computer nonvolatile readable storage medium, including: computer readable instructions, which are used to execute the following steps when the computer readable instructions are executed:
  • the voice to be verified includes a user identification and at least one kind of real-time verification information
  • the first verification result is an identity verification based on each user's unique voiceprint feature, which can effectively verify the accuracy of the user's identity.
  • a second verification result is obtained, and the second verification result is based on real-time verification of the user's identity, Can guarantee the authenticity of the user's identity.
  • the user can improve the accuracy and authenticity of the user's identity through the first verification result and the second verification result.
  • the prompt content obtained based on the historical key information can guide the user to perform subsequent operations.
  • the method of guiding users is based on historical key information to guide users, which can quickly guide users to solve customer problems on the telephone customer service system, and significantly improve the efficiency of solving user problems through the telephone customer service system.
  • FIG. 1 is a flowchart of a customer service method based on voiceprint recognition in an embodiment of the present application
  • FIG. 2 is a schematic diagram of a customer service device based on voiceprint recognition in an embodiment of the present application
  • FIG. 3 is a schematic diagram of a computer device in an embodiment of the present application.
  • first, second, third, etc. may be used to describe the preset ranges and the like in the embodiments of the present application, these preset ranges should not be limited to these terms. These terms are only used to distinguish the preset ranges from each other.
  • the first preset range may also be called a second preset range, and similarly, the second preset range may also be called a first preset range.
  • the word “if” as used herein may be interpreted as “when” or “when” or “in response to determination” or “in response to detection”.
  • the phrases “if determined” or “if detected (statement or event stated)” can be interpreted as “when determined” or “in response to determination” or “when detected (statement or event stated) ) “Or” in response to detection (statement or event stated) ".
  • FIG. 1 shows a flowchart of a customer service method based on voiceprint recognition in this embodiment.
  • the customer service method based on voiceprint recognition can be applied to a telephone customer service system to implement the function of verifying the user's identity and guiding the user to quickly solve problems, and can be specifically applied to a telephone customer service system installed on a computer device.
  • the computer device is a device that can perform human-computer interaction with a user, including but not limited to computers, smart phones, and tablets.
  • the customer service method based on voiceprint recognition includes the following steps:
  • the voice to be verified includes a user identification and at least one kind of real-time verification information.
  • the voice to be verified is a voice issued by the user for user identity verification in the telephone customer service system.
  • User ID refers to the ID used to uniquely identify the user.
  • the real-time verification information refers to the verification information that the telephone customer service system requires the user to input by voice in a preset time. User identification and real-time verification information can improve the accuracy and authenticity of user identity verification, and can help the phone customer service system quickly confirm the user's identity.
  • the voiceprint features to be verified extracted from the voice to be verified may specifically be voiceprint features to be verified such as MFCC (Mel-frequency cepstral coefficients) or i-vector.
  • MFCC Mel-frequency cepstral coefficients
  • i-vector i-vector
  • S30 Match the similarity between the voiceprint feature to be verified and the pre-registered standard voiceprint feature according to the user identification to obtain the first verification result.
  • the similarity matching between the voiceprint feature extracted from the voice to be verified and the standard voiceprint feature registered in advance is performed to obtain a first verification result.
  • the verification result is an identity verification based on each user's unique voiceprint feature, which can effectively verify the accuracy of the user's identity.
  • the similarity matching between the voiceprint feature to be verified and the standard voiceprint feature may be to calculate the cosine similarity between the feature vector of the voiceprint feature to be verified and the feature vector of the standard voiceprint feature, and determine the voice to be verified according to the calculation result
  • the degree of similarity between the texture feature and the standard voiceprint feature, and the first verification result is obtained according to the similarity and the preset threshold.
  • the first verification result can effectively verify the accuracy of the user's identity.
  • S40 Verify the user's identity according to at least one kind of real-time verification information to obtain a second verification result.
  • the second verification result is based on real-time verification of the user's identity, which can ensure the authenticity of the user's identity.
  • the historical key information is obtained from the user's historical call record, which is the key information related to the customer service service content in the historical call record of the user, and the historical key information can be used to determine the type of problem that the user often needs to solve.
  • the user identity when both the first verification result and the second verification result indicate that the verification is passed, the user identity may be considered to be both accurate and true, and the history associated with the user identity may be obtained according to the user identity Key Information.
  • S60 Get prompt content based on historical key information.
  • the historical key information represents the key information related to the customer service service content in the historical call record, and then the prompt content related to the historical key information may be obtained through the preset mapping relationship according to the historical key information.
  • S70 Guide the user to operate according to the prompt content.
  • the method before step S20, before extracting the voiceprint feature to be verified from the voice to be verified, the method further includes the following steps:
  • the voice to be registered also includes a user ID, that is, the user of the voice to be registered can be judged by the user ID.
  • S22 Extract voiceprint features of the voice to be registered, and obtain standard voiceprint features associated with the user identification.
  • the standard voiceprint feature is a reference standard that is different from the voiceprint feature to be verified and used to judge whether the voiceprint feature and the to-be-verified feature belong to the same user.
  • the voiceprint features extracted from the voice to be registered may specifically be standard voiceprint features such as MFCC (Mel-frequency cepstral coefficients) or i-vector.
  • MFCC Mel-frequency cepstral coefficients
  • i-vector i-vector
  • the standard voiceprint features are stored in the database in the form of files, and the standard voiceprint features are registered.
  • steps S21-S23 by registering standard voiceprint features, different voiceprint features of each user are utilized to realize user identification based on voiceprint.
  • voiceprint recognition method is adopted in the telephone customer service system, only the voiceprint feature to be verified that has been successfully matched with the standard voiceprint feature for similarity is considered to belong to the same user as the voiceprint feature to be verified and the standard voiceprint feature.
  • the voiceprint identification verification method can effectively ensure the accuracy of the user's identity on the telephone customer service system.
  • the standard voiceprint features may be stored in the database in the form of files, and each standard voiceprint feature file corresponds to a user identification.
  • step S40 the user identity is verified according to at least one real-time verification information to obtain a second verification result, which specifically includes the following steps:
  • S41 Convert the voice to be verified into corresponding text to be verified, the text to be verified includes at least one kind of real-time verification information corresponding to the voice to be verified.
  • the meaning contained in the voice to be verified cannot be directly recognized, and the voice to be verified needs to be converted into the corresponding text to be verified.
  • the conversion process may use a voice-to-text interface.
  • the converted text to be verified also includes at least one kind of real-time verification information corresponding to the voice to be verified for real-time verification.
  • S42 Match the real-time verification information in the text to be verified with the standard verification text generated within a preset time to obtain the real-time matching similarity.
  • the standard verification text is a reference standard used to judge whether the text to be verified belongs to the same user.
  • the telephone customer service system requires the user to input “lean refinement” within 10s, then the user needs to enter “lean refinement” as required.
  • the user matches the inputted text to be verified with the "learning improvement" of the standard verification text to obtain the real-time matching similarity.
  • the real-time matching similarity reflects whether the user has completed the effective verification of real-time verification information within a preset time period, and the user identity is verified according to the real-time matching similarity to obtain the second verification result, which can effectively guarantee The authenticity of the user's identity.
  • steps S41-S43 a method of verifying real-time verification information is adopted.
  • This method can effectively avoid the situation of using non-users such as user recording for real-time telephone customer service, and can effectively guarantee the authenticity of the user's identity.
  • step S50 before obtaining historical key information associated with the user identity according to the user identification, the method further includes the following steps:
  • S51 Search for the historical recording according to the user identification, and use the voice-to-text interface to convert the historical recording to the corresponding text to obtain the historical call record;
  • each user ID corresponds to the user's historical recording in the telephone customer service system, and the language recording is processed on the found historical recording to obtain the corresponding historical call record, which exists in the form of text It is convenient for computer equipment to directly process data.
  • S52 Search for a preset key information table, match historical call records with the preset key information table based on semantics, obtain historical key information associated with the user's identity, and store the historical key information in the database;
  • obtaining historical key information associated with the user's identity according to the user's identity includes:
  • the key information table stores keywords related to customer service content.
  • historical key information can be obtained from the historical call record based on the open source semantic analysis interface and the key information table. Specifically, it can first perform semantic analysis on the historical call records to determine the actual content that the user wants to express, and then match it with the key information table to obtain historical key information related to the content of customer service. Based on semantics, the historical call records are matched with the preset key information table, and the user's historical call records can be briefly expressed in the form of historical key information, which helps to improve storage performance and data processing efficiency.
  • the prompt content is obtained according to the historical key information, and the user is guided to operate according to the prompt content, specifically including the following steps:
  • S61 Divide the historical key information according to the content of customer service, and obtain at least one prompt content
  • the historical key information is obtained from the user's historical call record, which is the key information related to the customer service service content in the user's historical call record.
  • the historical key information is divided according to the customer service service content, and the user can be clearly At least one prompt content required.
  • S71 Determine the priority of each prompt content according to historical key information
  • S72 Determine the prompt sequence of the prompt content according to the priority, and prompt the user according to the prompt sequence to guide the user to operate.
  • the priority may be determined according to the number of occurrences of historical key information and the weight of the prompt content corresponding to each historical key information. With the priority, the prompt order of the prompt content can be determined, and the user can be prompted according to the prompt order to guide the user to operate. It enables users to greatly improve processing efficiency and quickly solve problems when using the telephone customer service system.
  • the first verification result is an identity verification based on each user's unique voiceprint feature, which can effectively verify the accuracy of the user's identity.
  • a second verification result is obtained, and the second verification result is based on real-time verification of the user's identity Can guarantee the authenticity of the user's identity.
  • the user can improve the accuracy and authenticity of the user's identity through the first verification result and the second verification result.
  • the prompt content obtained based on the historical key information can guide the user to perform subsequent operations.
  • the method of guiding users is based on historical key information to guide users, which can quickly guide users to solve customer problems on the telephone customer service system, and significantly improve the efficiency of solving user problems through the telephone customer service system.
  • embodiments of the present application further provide device embodiments that implement the steps and methods in the above method embodiments.
  • FIG. 2 shows a functional block diagram of a customer service device based on voiceprint recognition in a one-to-one correspondence with the customer service method based on voiceprint recognition in the embodiment.
  • the customer service device based on voiceprint recognition includes a voice acquisition module 10 to be verified, a voiceprint feature extraction module 20 to be verified, a first verification result acquisition module 30, a second verification result acquisition module 40, and historical key information
  • the acquisition module 50, the prompt content acquisition module 60, and the guidance operation module 70 includes a voice acquisition module 10 to be verified, a voiceprint feature extraction module 20 to be verified, a first verification result acquisition module 30, a second verification result acquisition module 40, and historical key information
  • the acquisition module 50, the prompt content acquisition module 60, and the guidance operation module 70 includes a voice acquisition module 10 to be verified, a voiceprint feature extraction module 20 to be verified, a first verification result acquisition module 30, a second verification result acquisition module 40, and historical key information
  • the acquisition module 50, the prompt content acquisition module 60, and the guidance operation module 70 includes a voiceprint
  • the voice acquisition module 10 to be verified the voiceprint feature extraction module 20 to be verified, the first verification result acquisition module 30, the second verification result acquisition module 40, the historical key information acquisition module 50, the prompt content acquisition module 60, and the guidance operation module
  • the implementation function of 70 corresponds one-to-one with the steps corresponding to the customer service method based on voiceprint recognition in the embodiment. To avoid redundant description, this embodiment will not elaborate one by one.
  • the to-be-verified voice acquisition module 10 is configured to acquire to-be-verified voice, which includes a user identification and at least one kind of real-time verification information.
  • the voiceprint feature extraction module 20 to be verified is used to extract the voiceprint feature to be verified from the voice to be verified.
  • the first verification result obtaining module 30 is configured to match the similarity between the voiceprint feature to be verified and the pre-registered standard voiceprint feature according to the user identification to obtain a first verification result.
  • the second verification result obtaining module 40 is configured to verify the identity of the user based on at least one kind of real-time verification information to obtain a second verification result.
  • the historical key information obtaining module 50 is configured to obtain historical key information associated with the user identity according to the user identification if both the first verification result and the second verification result indicate that the verification is passed.
  • the prompt content obtaining module 60 is used for obtaining prompt content according to historical key information.
  • the guidance operation module 70 is used to guide the user to operate according to the prompt content.
  • the customer service device based on voiceprint recognition further includes a voice acquisition unit to be registered, a standard voiceprint feature acquisition unit, and a registration unit.
  • the voice to-be-registered obtaining unit is used to obtain voice to be registered, and the voice to be registered includes a user identifier.
  • the standard voiceprint feature acquisition unit is used to extract the voiceprint features of the voice to be registered to obtain the standard voiceprint features associated with the user identification.
  • the registration unit is used to store the standard voiceprint features in the form of files in the database according to the user identification, and register the standard voiceprint features.
  • the second verification result acquisition module 40 includes a to-be-verified text acquisition unit, a real-time matching similarity acquisition unit, and a second verification result acquisition unit.
  • the text-to-be-verified unit is used to convert the voice to be verified into corresponding text to be verified, and the text to be verified includes at least one kind of real-time verification information corresponding to the voice to be verified.
  • the real-time matching similarity acquisition unit is used to match the real-time verification information in the text to be verified with the standard verification text generated within a preset time to acquire the real-time matching similarity.
  • the second verification result obtaining unit is used for verifying the user identity according to the real-time matching similarity to obtain the second verification result.
  • the customer service device based on voiceprint recognition further includes a historical call record acquisition unit and a historical key information storage unit.
  • the historical call record obtaining unit is used to search for a historical recording according to a user's identification, and uses a voice-to-text interface to convert the historical recording into a corresponding text to obtain a historical call record.
  • the historical key information storage unit is used to find a preset key information table, match historical call records with the preset key information table based on semantics, obtain historical key information associated with the user's identity, and store the historical key information in Database.
  • obtaining historical key information associated with the user's identity according to the user's identity includes:
  • the prompt content obtaining module 60 includes a prompt content obtaining unit, which is used to divide the historical key information according to the customer service service content to obtain at least one prompt content.
  • the guidance operation module 70 includes a priority determination unit and a guidance operation unit.
  • the priority determination unit is used to determine the priority of each prompt content according to historical key information.
  • the guidance operation unit is used to determine the presentation order of the presentation content according to the priority, and present the content to the user according to the presentation order, and guide the user to operate.
  • each unit in this embodiment can execute the customer service method based on voiceprint recognition shown in the embodiment, for parts not described in detail in this embodiment, reference may be made to the relevant description of the customer service method based on voiceprint recognition in the embodiment.
  • the first verification result is an identity verification based on each user's unique voiceprint feature, which can effectively verify the accuracy of the user's identity.
  • a second verification result is obtained, and the second verification result is based on real-time verification of the user's identity Can guarantee the authenticity of the user's identity.
  • the user can improve the accuracy and authenticity of the user's identity through the first verification result and the second verification result.
  • the prompt content obtained based on the historical key information can guide the user to perform subsequent operations.
  • the method of guiding users is based on historical key information to guide users, which can quickly guide users to solve customer problems on the telephone customer service system, and significantly improve the efficiency of solving user problems through the telephone customer service system.
  • This embodiment provides a computer non-volatile readable storage medium.
  • the computer non-volatile readable storage medium stores computer readable instructions.
  • the computer readable instructions When executed by a processor, it is based on the voiceprint in the embodiment.
  • the identified customer service methods are not repeated here in order to avoid duplication.
  • the computer-readable instructions when executed by the processor, the functions of the modules / units in the customer service device based on voiceprint recognition in the embodiment are implemented. To avoid repetition, they are not described here one by one.
  • FIG. 3 is a schematic diagram of a computer device provided by an embodiment of the present application.
  • the computer device 80 of this embodiment includes: a processor 81, a memory 82, and computer-readable instructions 83 stored in the memory 82 and executable on the processor 81.
  • the computer-readable instructions 83 are processed When the device 81 is executed, the customer service method based on voiceprint recognition in the embodiment is implemented. In order to avoid repetition, details are not repeated here.
  • the computer-readable instructions are executed by the processor 81, the functions of each model / unit in the customer service device based on voiceprint recognition in the embodiment are implemented. To avoid repetition, they are not described here one by one.
  • the computer device 80 may be a computing device such as a desktop computer, a notebook, a palmtop computer, and a cloud server.
  • Computer equipment may include, but is not limited to, a processor 81 and a memory 82.
  • FIG. 3 is only an example of the computer device 80, and does not constitute a limitation on the computer device 80, and may include more or less components than those illustrated, or a combination of certain components, or different components.
  • computer equipment may also include input and output devices, network access devices, buses, and so on.
  • the so-called processor 81 may be a central processing unit (Central Processing Unit, CPU), or other general-purpose processors, digital signal processors (Digital Signal Processor, DSP), application specific integrated circuits (Application Specific Integrated Circuit, ASIC), Field-programmable gate array (Field-Programmable Gate Array, FPGA) or other programmable logic devices, discrete gate or transistor logic devices, discrete hardware components, etc.
  • the general-purpose processor may be a microprocessor or the processor may be any conventional processor or the like.
  • the memory 82 may be an internal storage unit of the computer device 80, such as a hard disk or a memory of the computer device 80.
  • the memory 82 may also be an external storage device of the computer device 80, such as a plug-in hard disk equipped on the computer device 80, a smart memory card (Smart Media (SMC), a secure digital (SD) card, and a flash memory card (Flash Card) etc.
  • the memory 82 may also include both the internal storage unit of the computer device 80 and the external storage device.
  • the memory 82 is used to store computer readable instructions and other programs and data required by the computer device.
  • the memory 82 may also be used to temporarily store data that has been or will be output.

Abstract

一种基于声纹识别的客服方法、装置、计算机设备及存储介质。该方法包括获取待验证语音,待验证语音包括用户标识和至少一种实时验证信息(S10);从待验证语音中提取待验证声纹特征(S20);根据用户标识将待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果(S30);根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果(S40);若第一验证结果和第二验证结果均表明验证通过,则根据用户标识获取与用户身份相关联的历史关键信息(S50);根据历史关键信息得到提示内容(S60);根据提示内容引导用户进行操作(S70)。采用该方法能够让用户在使用电话客服系统时大幅度提高处理效率,快速解决问题。

Description

基于声纹识别的客服方法、装置、计算机设备及存储介质
本申请以2018年10月18日提交的申请号为201811214527.9,名称为“基于声纹识别的客服方法、装置、计算机设备及存储介质”的中国发明专利申请为基础,并要求其优先权。
【技术领域】
本申请涉及计算机技术领域,尤其涉及一种基于声纹识别的客服方法、装置、计算机设备及存储介质。
【背景技术】
目前电话客服系统在对用户进行身份验证时,采用的是根据用户手动输入的身份证号以及相关的验证密码等验证方式实现身份验证。用户在用手机拨通客服电话后需要频繁地重复听-按键-听的操作,给用户带来了不便,影响用户的通话效率。另外,电话客服系统在提示、引导用户进行操作的过程中效率较低,原本用户很容易就能解决的问题需要在电话客服系统按照冗余的流程一步步地操作,需要花费较多的时间才能解决问题。
【发明内容】
有鉴于此,本申请实施例提供了一种基于声纹识别的客服方法、装置、计算机设备及存储介质,用以解决通过电话客服系统解决用户问题时效率过低的问题。
第一方面,本申请实施例提供了一种基于声纹识别的客服方法,包括:
获取待验证语音,所述待验证语音包括用户标识和至少一种实时验证信息;
从所述待验证语音中提取待验证声纹特征;
根据所述用户标识将所述待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果;
根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果;
若所述第一验证结果和所述第二验证结果均表明验证通过,则根据所述用户标识获取与所述用户身份相关联的历史关键信息;
根据所述历史关键信息得到提示内容;
根据所述提示内容引导用户进行操作。
第二方面,本申请实施例提供了一种基于声纹识别的客服装置,包括:
待验证语音获取模块,用于获取待验证语音,所述待验证语音包括用户标识和至少一种实时验证信息;
待验证声纹特征提取模块,用于从所述待验证语音中提取待验证声纹特征;
第一验证结果获取模块,用于根据所述用户标识将所述待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果;
第二验证结果获取模块,用于根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果;
历史关键信息获取模块,用于若所述第一验证结果和所述第二验证结果均表明验证通过,则根据所述用户标识获取与所述用户身份相关联的历史关键信息;
提示内容获取模块,用于根据所述历史关键信息得到提示内容;
引导操作模块,用于根据所述提示内容引导用户进行操作。
第三方面,一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:
获取待验证语音,所述待验证语音包括用户标识和至少一种实时验证信息;
从所述待验证语音中提取待验证声纹特征;
根据所述用户标识将所述待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果;
根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果;
若所述第一验证结果和所述第二验证结果均表明验证通过,则根据所述用户标识获取与所述用户身份相关联的历史关键信息;
根据所述历史关键信息得到提示内容;
根据所述提示内容引导用户进行操作。
第四方面,本申请实施例提供了一种计算机非易失性可读存储介质,包括:计算机可读指令,当所述计算机可读指令被运行时,用以执行如下步骤:
获取待验证语音,所述待验证语音包括用户标识和至少一种实时验证信息;
从所述待验证语音中提取待验证声纹特征;
根据所述用户标识将所述待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得 到第一验证结果;
根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果;
若所述第一验证结果和所述第二验证结果均表明验证通过,则根据所述用户标识获取与所述用户身份相关联的历史关键信息;
根据所述历史关键信息得到提示内容;
根据所述提示内容引导用户进行操作。
上述技术方案中的一个技术方案具有如下有益效果:
本申请实施例中,通过获取待验证语音,根据待验证语音中包括的用户标识,将从待验证语音中提取的待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果,该第一验证结果是基于每个用户独一无二的声纹特征进行的身份验证,能够有效验证用户身份的准确性。另外,根据待验证语音中包括的至少一种实时验证信息,并根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果,该第二验证结果是基于对用户身份的实时验证,能够保证用户身份的真实性。用户通过第一验证结果和第二验证结果能够提高用户身份的准确性和真实性。在验证用户身份后,根据历史关键信息得到的提示内容,能够引导用户进行后续的操作。该引导用户的方式是基于历史关键信息对用户进行引导的,能够快速地引导用户在电话客服系统上解决客户的问题,显著提高通过电话客服系统解决用户问题的效率。
【附图说明】
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本申请一实施例中基于声纹识别的客服方法的一流程图;
图2是本申请一实施例中基于声纹识别的客服装置的一示意图;
图3是本申请一实施例中计算机设备的一示意图。
【具体实施方式】
为了更好的理解本申请的技术方案,下面结合附图对本申请实施例进行详细描述。
应当明确,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于 本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本申请实施例中可能采用术语第一、第二、第三等来描述预设范围等,但这些预设范围不应限于这些术语。这些术语仅用来将预设范围彼此区分开。例如,在不脱离本申请实施例范围的情况下,第一预设范围也可以被称为第二预设范围,类似地,第二预设范围也可以被称为第一预设范围。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
图1示出本实施例中基于声纹识别的客服方法的一流程图。该基于声纹识别的客服方法可应用在电话客服系统中,用于实现验证用户身份,引导用户快速解决问题的功能,具体可应用在安装在计算机设备上的电话客服系统中。其中,该计算机设备是可与用户进行人机交互的设备,包括但不限于电脑、智能手机和平板等设备。如图1所示,该基于声纹识别的客服方法包括如下步骤:
S10:获取待验证语音,待验证语音包括用户标识和至少一种实时验证信息。
其中,待验证语音是用户发出的用于在电话客服系统中进行用户身份验证的语音。用户标识是指用于唯一识别用户身份的标识。实时验证信息是指在预设时间内电话客服系统要求用户通过语音方式输入的验证信息。用户标识和实时验证信息可以提高用户身份验证的准确性和真实性,能够帮助电话客服系统快速确认用户身份。
S20:从待验证语音中提取待验证声纹特征。
在一实施例中,从待验证语音中提取的待验证声纹特征具体可以是MFCC(Mel-frequency cepstral coefficients,梅尔频率倒谱系数)或i-vector等的待验证声纹特征。
S30:根据用户标识将待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到 第一验证结果。
在一实施例中,根据待验证语音中包括的用户标识,将从待验证语音中提取的待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果,该第一验证结果是基于每个用户独一无二的声纹特征进行的身份验证,能够有效验证用户身份的准确性。具体地,待验证声纹特征和标准声纹特征进行相似度匹配可以是将待验证声纹特征的特征向量与标准声纹特征的特征向量作余弦相似度的计算,根据计算结果判断待验证声纹特征和标准声纹特征之间的相似程度,根据该相似程度与预设阈值得到第一验证结果。第一验证结果能够有效验证用户身份的准确性。
S40:根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果。
在一实施例中,通过至少一种实时验证信息判断用户输入的语音是否与电话客服系统要求验证的信息相同,对用户身份进行验证,得到第二验证结果。该第二验证结果是基于对用户身份的实时验证,能够保证用户身份的真实性。
S50:若第一验证结果和第二验证结果均表明验证通过,则根据用户标识获取与用户身份相关联的历史关键信息。
其中,历史关键信息是从用户的历史通话记录得到的,是代表用户在历史通话记录中的与客服服务内容相关的关键信息,能够通过该历史关键信息判断用户经常需要解决的问题类型。
在一实施例中,当第一验证结果和第二验证结果均表明验证通过时,则可以认为该用户身份是既准确又真实的,此时就可以根据用户标识获取与用户身份相关联的历史关键信息。
S60:根据历史关键信息得到提示内容。
在一实施例中,历史关键信息代表历史通话记录中的与客服服务内容相关的关键信息,则可以根据历史关键信息通过预设的映射关系得到与历史关键信息相关的提示内容。
S70:根据提示内容引导用户进行操作。
在一实施例中,在步骤S20之前,在从待验证语音中提取待验证声纹特征之前,还包括如下步骤:
S21:获取待注册语音,待注册语音包括用户标识。
其中,该待注册语音也包括用户标识,即通过用户标识可以判断待注册语音的用户。
S22:提取待注册语音的声纹特征,得到与用户标识相关联的标准声纹特征。
其中,标准声纹特征是区别于待验证声纹特征,用于判断与待验证声纹特征是否属于同一用户的参考标准。
在一实施例中,在待注册语音中提取的声纹特征具体可以是MFCC(Mel-frequency cepstral  coefficients,梅尔频率倒谱系数)或i-vector等的标准声纹特征。该标准声纹特征与用户标识相关联,能够基于用户标识准确地判断与待验证声纹特征是否属于同一用户。
S23:根据用户标识,将标准声纹特征以文件的形式存储在数据库中,注册标准声纹特征。
步骤S21-S23中,通过注册标准声纹特征,利用了每个用户不同的声纹特征以实现基于声纹的用户身份识别。在电话客服系统中采用该声纹识别方法时,与标准声纹特征进行相似度匹配成功的待验证声纹特征才认为待验证声纹特征与标准声纹特征是属于同一个用户。该声纹识别验证方式在电话客服系统上能够有效保证用户身份的准确性。
可以理解地,标准声纹特征可以是以文件的形式存储在数据库中,每个标准声纹特征的文件对应一个用户标识。
在一实施例中,步骤S40中,根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果,具体包括如下步骤:
S41:将待验证语音转换为相对应的待验证文本,待验证文本包括与待验证语音相对应的至少一种实时验证信息。
可以理解地,待验证语音所包含的含义是无法直接识别的,需要将待验证语音转换为相对应的待验证文本,转换的过程可以采用语音转文本接口。同样地,转换得到的待验证文本也包括与待验证语音相对应的至少一种实时验证信息,用于进行实时验证。
S42:将待验证文本中的实时验证信息与在预设时间内生成的标准校验文本进行匹配,获取实时匹配相似度。
其中,标准校验文本是用于判断与待验证文本是否属于同一用户的参考标准。
在一实施例中,电话客服系统要求用户在10s内输入“精益求精”,则用户需要按要求输入“精益求精”。用户将输入的待验证文本与标准校验文本的“精益求精”进行匹配,获取实时匹配相似度。
S43:根据实时匹配相似度对用户身份进行验证,得到第二验证结果。
在一实施例中,实时匹配相似度反映的是用户在预设时间段内是否完成了实时验证信息的有效验证,根据实时匹配相似度对用户身份进行验证,得到第二验证结果,能够有效保证用户身份的真实性。
步骤S41-S43中,采用了通过验证实时验证信息的方式,该方式能够有效避免利用用户录音等非用户实时进行电话客服的情况,能够有效保证用户身份的真实性。
在一实施例中,在步骤S50中,在根据用户标识获取与用户身份相关联的历史关键信 息之前,还包括如下步骤:
S51:根据用户标识查找历史录音,采用语音转文本接口将历史录音转换为相对应的文本,得到历史通话记录;
在一实施例中,每个用户标识对应有该用户在电话客服系统的历史录音,对查找到的历史录音进行语言转文本的处理,得到对应的历史通话记录,以文本形式存在的历史通话记录便于计算机设备直接进行数据处理。
S52:查找预设的关键信息表,基于语义将历史通话记录与预设的关键信息表进行匹配,得到与用户身份相关联的历史关键信息,并将历史关键信息存储在数据库中;
在一实施例中,根据用户标识获取与用户身份相关联的历史关键信息,包括:
根据用户标识查询数据库,在数据库中获取与用户身份相关联的历史关键信息。
其中,关键信息表存储的是与客服服务内容相关的关键词。
在一实施例中,考虑实际通话内容的多样性(但都是指向某些客服服务内容),可以基于开源的语义分析接口,结合关键信息表在历史通话记录中得到历史关键信息。具体可以是先对历史通话记录进行语义分析,确定用户想表达的实际内容,再与关键信息表进行匹配,得到与客服服务内容相关的历史关键信息。基于语义将历史通话记录与预设的关键信息表进行匹配,可以将用户的历史通话记录采用历史关键信息的形式进行简要表示,有助于提高存储的性能以及数据处理的效率。
在一实施例中,步骤S60和S70中,根据历史关键信息得到提示内容,根据提示内容引导用户进行操作,具体包括如下步骤:
S61:将历史关键信息按客服服务内容进行划分,得到至少一个提示内容;
可以理解地,历史关键信息是从用户的历史通话记录得到的,是代表用户在历史通话记录中的与客服服务内容相关的关键信息,将历史关键信息按客服服务内容进行划分,可以明确得到用户所需的至少一个提示内容。
S71:根据历史关键信息确定每个提示内容的优先级;
S72:根据优先级确定提示内容的提示次序,并按提示次序向用户提示内容,引导用户进行操作。
步骤S71-S72中,优先级可以根据历史关键信息出现的次数以及每个历史关键信息所对应的提示内容的权重决定。有了优先级即可确定提示内容的提示次序,并按提示次序向用户提示内容,引导用户进行操作。能够让用户在使用电话客服系统时大幅度提高处理效率,快速解决问题。
本申请实施例的技术方案具有以下有益效果:
本申请实施例中,通过获取待验证语音,根据待验证语音中包括的用户标识,将从待验证语音中提取的待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果,该第一验证结果是基于每个用户独一无二的声纹特征进行的身份验证,能够有效验证用户身份的准确性。另外,根据待验证语音中包括的至少一种实时验证信息,并根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果,该第二验证结果是基于对用户身份的实时验证,能够保证用户身份的真实性。用户通过第一验证结果和第二验证结果能够提高用户身份的准确性和真实性。在验证用户身份后,根据历史关键信息得到的提示内容,能够引导用户进行后续的操作。该引导用户的方式是基于历史关键信息对用户进行引导的,能够快速地引导用户在电话客服系统上解决客户的问题,显著提高通过电话客服系统解决用户问题的效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
基于实施例中所提供的基于声纹识别的客服方法,本申请实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。
图2示出与实施例中基于声纹识别的客服方法一一对应的基于声纹识别的客服装置的原理框图。如图2所示,该基于声纹识别的客服装置包括待验证语音获取模块10、待验证声纹特征提取模块20、第一验证结果获取模块30、第二验证结果获取模块40、历史关键信息获取模块50、提示内容获取模块60和引导操作模块70。其中,待验证语音获取模块10、待验证声纹特征提取模块20、第一验证结果获取模块30、第二验证结果获取模块40、历史关键信息获取模块50、提示内容获取模块60和引导操作模块70的实现功能与实施例中基于声纹识别的客服方法对应的步骤一一对应,为避免赘述,本实施例不一一详述。
待验证语音获取模块10,用于获取待验证语音,待验证语音包括用户标识和至少一种实时验证信息。
待验证声纹特征提取模块20,用于从待验证语音中提取待验证声纹特征。
第一验证结果获取模块30,用于根据用户标识将待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果。
第二验证结果获取模块40,用于根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果。
历史关键信息获取模块50,用于若第一验证结果和第二验证结果均表明验证通过,则根据用户标识获取与用户身份相关联的历史关键信息。
提示内容获取模块60,用于根据历史关键信息得到提示内容。
引导操作模块70,用于根据提示内容引导用户进行操作。
可选地,基于声纹识别的客服装置还包括待注册语音获取单元、标准声纹特征获取单元和注册单元。
待注册语音获取单元,用于获取待注册语音,待注册语音包括用户标识。
标准声纹特征获取单元,用于提取待注册语音的声纹特征,得到与用户标识相关联的标准声纹特征。
注册单元,用于根据用户标识,将标准声纹特征以文件的形式存储在数据库中,注册标准声纹特征。
可选地,第二验证结果获取模块40包括待验证文本获取单元、实时匹配相似度获取单元和第二验证结果获取单元。
待验证文本获取单元,用于将待验证语音转换为相对应的待验证文本,待验证文本包括与待验证语音相对应的至少一种实时验证信息。
实时匹配相似度获取单元,用于将待验证文本中的实时验证信息与在预设时间内生成的标准校验文本进行匹配,获取实时匹配相似度。
第二验证结果获取单元,用于根据实时匹配相似度对用户身份进行验证,得到第二验证结果。
可选地,基于声纹识别的客服装置还包括历史通话记录获取单元和历史关键信息存储单元。
历史通话记录获取单元,用于根据用户标识查找历史录音,采用语音转文本接口将历史录音转换为相对应的文本,得到历史通话记录。
历史关键信息存储单元,用于查找预设的关键信息表,基于语义将历史通话记录与预设的关键信息表进行匹配,得到与用户身份相关联的历史关键信息,并将历史关键信息存储在数据库中。
可选地,根据用户标识获取与用户身份相关联的历史关键信息,包括:
根据用户标识查询数据库,在数据库中获取与用户身份相关联的历史关键信息。
可选地,提示内容获取模块60包括提示内容获取单元,用于将历史关键信息按客服服务内容进行划分,得到至少一个提示内容。
可选地,引导操作模块70包括优先级确定单元和引导操作单元。
优先级确定单元,用于根据历史关键信息确定每个提示内容的优先级。
引导操作单元,用于根据优先级确定提示内容的提示次序,并按提示次序向用户提示内容,引导用户进行操作。
由于本实施例中的各单元能够执行实施例中所示的基于声纹识别的客服方法,本实施例未详细描述的部分,可参考对实施例中基于声纹识别的客服方法的相关说明。
本申请实施例的技术方案具有以下有益效果:
本申请实施例中,通过获取待验证语音,根据待验证语音中包括的用户标识,将从待验证语音中提取的待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果,该第一验证结果是基于每个用户独一无二的声纹特征进行的身份验证,能够有效验证用户身份的准确性。另外,根据待验证语音中包括的至少一种实时验证信息,并根据至少一种实时验证信息对用户身份进行验证,得到第二验证结果,该第二验证结果是基于对用户身份的实时验证,能够保证用户身份的真实性。用户通过第一验证结果和第二验证结果能够提高用户身份的准确性和真实性。在验证用户身份后,根据历史关键信息得到的提示内容,能够引导用户进行后续的操作。该引导用户的方式是基于历史关键信息对用户进行引导的,能够快速地引导用户在电话客服系统上解决客户的问题,显著提高通过电话客服系统解决用户问题的效率。
本实施例提供一计算机非易失性可读存储介质,该计算机非易失性可读存储介质上存储有计算机可读指令,该计算机可读指令被处理器执行时实现实施例中基于声纹识别的客服方法,为避免重复,此处不一一赘述。或者,该计算机可读指令被处理器执行时实现实施例中基于声纹识别的客服装置中各模块/单元的功能,为避免重复,此处不一一赘述。
图3是本申请一实施例提供的计算机设备的示意图。如图3所示,该实施例的计算机设备80包括:处理器81、存储器82以及存储在存储器82中并可在处理器81上运行的计算机可读指令83,该计算机可读指令83被处理器81执行时实现实施例中的基于声纹识别的客服方法,为避免重复,此处不一一赘述。或者,该计算机可读指令被处理器81执行时实现实施例中基于声纹识别的客服装置中各模型/单元的功能,为避免重复,此处不一一赘述。
计算机设备80可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可包括,但不仅限于,处理器81、存储器82。本领域技术人员可以理解,图3仅仅是计算机设备80的示例,并不构成对计算机设备80的限定,可以包括比图示更多 或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器81可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器82可以是计算机设备80的内部存储单元,例如计算机设备80的硬盘或内存。存储器82也可以是计算机设备80的外部存储设备,例如计算机设备80上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器82还可以既包括计算机设备80的内部存储单元也包括外部存储设备。存储器82用于存储计算机可读指令以及计算机设备所需的其他程序和数据。存储器82还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (20)

  1. 一种基于声纹识别的客服方法,其特征在于,所述方法包括:
    获取待验证语音,所述待验证语音包括用户标识和至少一种实时验证信息;
    从所述待验证语音中提取待验证声纹特征;
    根据所述用户标识将所述待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果;
    根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果;
    若所述第一验证结果和所述第二验证结果均表明验证通过,则根据所述用户标识获取与所述用户身份相关联的历史关键信息;
    根据所述历史关键信息得到提示内容;
    根据所述提示内容引导用户进行操作。
  2. 根据权利要求1所述的方法,其特征在于,在所述从所述待验证语音中提取待验证声纹特征之前,所述方法还包括:
    获取待注册语音,所述待注册语音包括所述用户标识;
    提取所述待注册语音的声纹特征,得到与所述用户标识相关联的标准声纹特征;
    根据所述用户标识,将所述标准声纹特征以文件的形式存储在数据库中,注册所述标准声纹特征。
  3. 根据权利要求1所述的方法,其特征在于,所述根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果,包括:
    将所述待验证语音转换为相对应的待验证文本,所述待验证文本包括与所述待验证语音相对应的至少一种所述实时验证信息;
    将所述待验证文本中的所述实时验证信息与在预设时间内生成的标准校验文本进行匹配,获取实时匹配相似度;
    根据所述实时匹配相似度对所述用户身份进行验证,得到所述第二验证结果。
  4. 根据权利要求1所述的方法,其特征在于,在所述根据所述用户标识获取与所述用户身份相关联的历史关键信息之前,所述方法还包括:
    根据所述用户标识查找历史录音,采用语音转文本接口将所述历史录音转换为相对应的文本,得到历史通话记录;
    查找预设的关键信息表,基于语义将所述历史通话记录与预设的关键信息表进行匹配,得 到与所述用户身份相关联的所述历史关键信息,并将所述历史关键信息存储在数据库中;
    所述根据所述用户标识获取与所述用户身份相关联的历史关键信息,包括:
    根据所述用户标识查询数据库,在所述数据库中获取与所述用户身份相关联的历史关键信息。
  5. 根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述历史关键信息得到提示内容,所述根据所述提示内容引导用户进行操作,包括:
    将所述历史关键信息按客服服务内容进行划分,得到至少一个提示内容;
    根据所述历史关键信息确定每个所述提示内容的优先级;
    根据所述优先级确定所述提示内容的提示次序,并按所述提示次序向用户提示所述提示内容,引导用户进行操作。
  6. 一种基于声纹识别的客服装置,其特征在于,所述装置包括:
    待验证语音获取模块,用于获取待验证语音,所述待验证语音包括用户标识和至少一种实时验证信息;
    待验证声纹特征提取模块,用于从所述待验证语音中提取待验证声纹特征;
    第一验证结果获取模块,用于根据所述用户标识将所述待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果;
    第二验证结果获取模块,用于根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果;
    历史关键信息获取模块,用于若所述第一验证结果和所述第二验证结果均表明验证通过,则根据所述用户标识获取与所述用户身份相关联的历史关键信息;
    提示内容获取模块,用于根据所述历史关键信息得到提示内容;
    引导操作模块,用于根据所述提示内容引导用户进行操作。
  7. 根据权利要求6所述的装置,其特征在于,所述基于声纹识别的客服装置,还包括:
    待注册语音获取单元,用于获取待注册语音,所述待注册语音包括所述用户标识;
    标准声纹特征获取单元,用于提取所述待注册语音的声纹特征,得到与所述用户标识相关联的标准声纹特征;
    注册单元,用于根据所述用户标识,将所述标准声纹特征以文件的形式存储在数据库中,注册所述标准声纹特征。
  8. 根据权利要求6所述的装置,其特征在于,所述第二验证结果获取模块,包括:
    待验证文本获取单元,用于将所述待验证语音转换为相对应的待验证文本,所述待验证文 本包括与所述待验证语音相对应的至少一种所述实时验证信息;
    实时匹配相似度获取单元,用于将所述待验证文本中的所述实时验证信息与在预设时间内生成的标准校验文本进行匹配,获取实时匹配相似度;
    第二验证结果获取单元,用于根据所述实时匹配相似度对所述用户身份进行验证,得到所述第二验证结果。
  9. 根据权利要求6所述的装置,其特征在于,所述装置还包括:
    历史通话记录获取单元,用于根据所述用户标识查找历史录音,采用语音转文本接口将所述历史录音转换为相对应的文本,得到历史通话记录;
    历史关键信息存储单元,用于根据所述用户标识查询数据库,在所述数据库中获取与所述用户身份相关联的历史关键信息。
  10. 根据权利要求6至9任一项所述的装置,其特征在于,所述提示内容获取模块60包括:
    提示内容获取单元,用于将所述历史关键信息按客服服务内容进行划分,得到至少一个提示内容;
    所述引导操作模块70包括,
    优先级确定单元,用于根据所述历史关键信息确定每个所述提示内容的优先级;
    引导操作单元,用于根据所述优先级确定所述提示内容的提示次序,并按所述提示次序向用户提示所述提示内容,引导用户进行操作。
  11. 一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如下步骤:
    获取待验证语音,所述待验证语音包括用户标识和至少一种实时验证信息;
    从所述待验证语音中提取待验证声纹特征;
    根据所述用户标识将所述待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果;
    根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果;
    若所述第一验证结果和所述第二验证结果均表明验证通过,则根据所述用户标识获取与所述用户身份相关联的历史关键信息;
    根据所述历史关键信息得到提示内容;
    根据所述提示内容引导用户进行操作。
  12. 根据权利要求11所述的计算机设备,其特征在于,所述处理器执行所述计算机可读 指令时还实现如下步骤:
    获取待注册语音,所述待注册语音包括所述用户标识;
    提取所述待注册语音的声纹特征,得到与所述用户标识相关联的标准声纹特征;
    根据所述用户标识,将所述标准声纹特征以文件的形式存储在数据库中,注册所述标准声纹特征。
  13. 根据权利要求11所述的计算机设备,其特征在于,所述处理器执行所述计算机可读指令时还实现如下步骤:
    将所述待验证语音转换为相对应的待验证文本,所述待验证文本包括与所述待验证语音相对应的至少一种所述实时验证信息;
    将所述待验证文本中的所述实时验证信息与在预设时间内生成的标准校验文本进行匹配,获取实时匹配相似度;
    根据所述实时匹配相似度对所述用户身份进行验证,得到所述第二验证结果。
  14. 根据权利要求11所述的计算机设备,其特征在于,所述处理器执行所述计算机可读指令时还实现如下步骤:
    根据所述用户标识查找历史录音,采用语音转文本接口将所述历史录音转换为相对应的文本,得到历史通话记录;
    查找预设的关键信息表,基于语义将所述历史通话记录与预设的关键信息表进行匹配,得到与所述用户身份相关联的所述历史关键信息,并将所述历史关键信息存储在数据库中;
    所述根据所述用户标识获取与所述用户身份相关联的历史关键信息,包括:
    根据所述用户标识查询数据库,在所述数据库中获取与所述用户身份相关联的历史关键信息。
  15. 根据权利要求11至14任一项所述的计算机设备,其特征在于,所述处理器执行所述计算机可读指令时还实现如下步骤:
    将所述历史关键信息按客服服务内容进行划分,得到至少一个提示内容;
    根据所述历史关键信息确定每个所述提示内容的优先级;
    根据所述优先级确定所述提示内容的提示次序,并按所述提示次序向用户提示所述提示内容,引导用户进行操作。
  16. 一种计算机非易失性可读存储介质,所述计算机非易失性可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现如下步骤:
    获取待验证语音,所述待验证语音包括用户标识和至少一种实时验证信息;
    从所述待验证语音中提取待验证声纹特征;
    根据所述用户标识将所述待验证声纹特征和预先注册的标准声纹特征进行相似度匹配,得到第一验证结果;
    根据至少一种所述实时验证信息对用户身份进行验证,得到第二验证结果;
    若所述第一验证结果和所述第二验证结果均表明验证通过,则根据所述用户标识获取与所述用户身份相关联的历史关键信息;
    根据所述历史关键信息得到提示内容;
    根据所述提示内容引导用户进行操作。
  17. 根据权利要求16所述的计算机非易失性可读存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器还实现如下步骤:
    获取待注册语音,所述待注册语音包括所述用户标识;
    提取所述待注册语音的声纹特征,得到与所述用户标识相关联的标准声纹特征;
    根据所述用户标识,将所述标准声纹特征以文件的形式存储在数据库中,注册所述标准声纹特征。
  18. 根据权利要求16所述的计算机非易失性可读存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器还实现如下步骤:
    将所述待验证语音转换为相对应的待验证文本,所述待验证文本包括与所述待验证语音相对应的至少一种所述实时验证信息;
    将所述待验证文本中的所述实时验证信息与在预设时间内生成的标准校验文本进行匹配,获取实时匹配相似度;
    根据所述实时匹配相似度对所述用户身份进行验证,得到所述第二验证结果。
  19. 根据权利要求16所述的计算机非易失性可读存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器还实现如下步骤:
    根据所述用户标识查找历史录音,采用语音转文本接口将所述历史录音转换为相对应的文本,得到历史通话记录;
    查找预设的关键信息表,基于语义将所述历史通话记录与预设的关键信息表进行匹配,得到与所述用户身份相关联的所述历史关键信息,并将所述历史关键信息存储在数据库中;
    所述根据所述用户标识获取与所述用户身份相关联的历史关键信息,包括:
    根据所述用户标识查询数据库,在所述数据库中获取与所述用户身份相关联的历史关键信息。
  20. 根据权利要求16至19任一项所述的计算机非易失性可读存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器还实现如下步骤:将所述历史关键信息按客服服务内容进行划分,得到至少一个提示内容;
    根据所述历史关键信息确定每个所述提示内容的优先级;
    根据所述优先级确定所述提示内容的提示次序,并按所述提示次序向用户提示所述提示内容,引导用户进行操作。
PCT/CN2018/123559 2018-10-18 2018-12-25 基于声纹识别的客服方法、装置、计算机设备及存储介质 WO2020077841A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201811214527.9 2018-10-18
CN201811214527.9A CN109147797B (zh) 2018-10-18 2018-10-18 基于声纹识别的客服方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
WO2020077841A1 true WO2020077841A1 (zh) 2020-04-23

Family

ID=64808324

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/123559 WO2020077841A1 (zh) 2018-10-18 2018-12-25 基于声纹识别的客服方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN109147797B (zh)
WO (1) WO2020077841A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112634909A (zh) * 2020-12-15 2021-04-09 北京百度网讯科技有限公司 声音信号处理的方法、装置、设备、计算机可读存储介质

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110047490A (zh) * 2019-03-12 2019-07-23 平安科技(深圳)有限公司 声纹识别方法、装置、设备以及计算机可读存储介质
CN110099047B (zh) * 2019-04-12 2021-09-07 平安科技(深圳)有限公司 注册信息处理方法、装置、计算机设备和存储介质
CN110166634A (zh) * 2019-06-06 2019-08-23 深圳前海微众银行股份有限公司 用户身份辅助识别方法、装置、设备及可读存储介质
CN110111796B (zh) * 2019-06-24 2021-09-17 秒针信息技术有限公司 识别身份的方法及装置
CN112580007B (zh) * 2019-09-29 2023-01-10 北京安云世纪科技有限公司 一种验证方法及装置
CN111105783A (zh) * 2019-12-06 2020-05-05 中国人民解放军61623部队 一种基于人工智能的综合客服系统
CN111312257A (zh) * 2019-12-16 2020-06-19 五八有限公司 一种多账号的识别方法、装置、电子设备及存储介质
CN111161745A (zh) * 2019-12-26 2020-05-15 珠海格力电器股份有限公司 一种智能设备的唤醒方法、装置、设备及介质
CN111192587A (zh) * 2019-12-27 2020-05-22 拉克诺德(深圳)科技有限公司 语音数据匹配方法、装置、计算机设备及存储介质
CN111243605A (zh) * 2020-01-13 2020-06-05 北京三快在线科技有限公司 业务处理方法、装置、设备及存储介质
CN111586019A (zh) * 2020-04-30 2020-08-25 中国银行股份有限公司 身份认证方法、装置及服务设备
CN111711523B (zh) * 2020-05-22 2022-10-04 平安科技(深圳)有限公司 事项办理权限授权方法、装置、计算机设备及存储介质
CN112738344B (zh) * 2020-12-28 2022-12-09 北京三快在线科技有限公司 一种识别用户身份的方法、装置、存储介质及电子设备
CN112802479A (zh) * 2021-01-07 2021-05-14 北京小米松果电子有限公司 语音验证方法、装置以及存储介质
CN113098850A (zh) * 2021-03-24 2021-07-09 北京嘀嘀无限科技发展有限公司 一种语音验证方法、装置和电子设备
CN113241080A (zh) * 2021-06-10 2021-08-10 思必驰科技股份有限公司 自动注册声纹识别方法和装置
CN113676527A (zh) * 2021-08-10 2021-11-19 未鲲(上海)科技服务有限公司 信息推送方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105185379A (zh) * 2015-06-17 2015-12-23 百度在线网络技术(北京)有限公司 声纹认证方法和装置
CN105810200A (zh) * 2016-02-04 2016-07-27 深圳前海勇艺达机器人有限公司 基于声纹识别的人机对话装置及其方法
CN106302339A (zh) * 2015-05-25 2017-01-04 腾讯科技(深圳)有限公司 登录验证方法和装置、登录方法和装置
CN106506524A (zh) * 2016-11-30 2017-03-15 百度在线网络技术(北京)有限公司 用于验证用户的方法和装置
CN108062354A (zh) * 2017-11-22 2018-05-22 上海博泰悦臻电子设备制造有限公司 信息推荐方法、系统、存储介质、电子设备及车辆
CN108305633A (zh) * 2018-01-16 2018-07-20 平安科技(深圳)有限公司 语音验证方法、装置、计算机设备和计算机可读存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413100A (zh) * 2010-09-25 2012-04-11 盛乐信息技术(上海)有限公司 声纹密码图片提示的声纹认证系统及其实现方法
CN102708867A (zh) * 2012-05-30 2012-10-03 北京正鹰科技有限责任公司 一种基于声纹和语音的防录音假冒身份识别方法及系统
CN104658533A (zh) * 2013-11-20 2015-05-27 中兴通讯股份有限公司 一种终端解锁的方法、装置及终端
CN106648082A (zh) * 2016-12-09 2017-05-10 厦门快商通科技股份有限公司 一种模拟真人互动的智能服务设备及方法
CN108319829B (zh) * 2017-01-11 2022-05-06 中兴通讯股份有限公司 一种声纹验证方法和装置
CN107068154A (zh) * 2017-03-13 2017-08-18 平安科技(深圳)有限公司 基于声纹识别的身份验证的方法及系统
CN107221331A (zh) * 2017-06-05 2017-09-29 深圳市讯联智付网络有限公司 一种基于声纹的身份识别方法和设备
CN107330706A (zh) * 2017-06-06 2017-11-07 上海航动科技有限公司 一种基于人工智能的电营客服系统及商业运营模式
CN107331400A (zh) * 2017-08-25 2017-11-07 百度在线网络技术(北京)有限公司 一种声纹识别性能提升方法、装置、终端及存储介质
CN107995360B (zh) * 2017-11-27 2020-08-25 Oppo广东移动通信有限公司 通话处理方法及相关产品
CN107977557A (zh) * 2017-11-30 2018-05-01 广州势必可赢网络科技有限公司 一种基于声纹识别的电子合同签署服务认证协议及服务器

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106302339A (zh) * 2015-05-25 2017-01-04 腾讯科技(深圳)有限公司 登录验证方法和装置、登录方法和装置
CN105185379A (zh) * 2015-06-17 2015-12-23 百度在线网络技术(北京)有限公司 声纹认证方法和装置
CN105810200A (zh) * 2016-02-04 2016-07-27 深圳前海勇艺达机器人有限公司 基于声纹识别的人机对话装置及其方法
CN106506524A (zh) * 2016-11-30 2017-03-15 百度在线网络技术(北京)有限公司 用于验证用户的方法和装置
CN108062354A (zh) * 2017-11-22 2018-05-22 上海博泰悦臻电子设备制造有限公司 信息推荐方法、系统、存储介质、电子设备及车辆
CN108305633A (zh) * 2018-01-16 2018-07-20 平安科技(深圳)有限公司 语音验证方法、装置、计算机设备和计算机可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112634909A (zh) * 2020-12-15 2021-04-09 北京百度网讯科技有限公司 声音信号处理的方法、装置、设备、计算机可读存储介质

Also Published As

Publication number Publication date
CN109147797A (zh) 2019-01-04
CN109147797B (zh) 2024-05-07

Similar Documents

Publication Publication Date Title
WO2020077841A1 (zh) 基于声纹识别的客服方法、装置、计算机设备及存储介质
WO2019085575A1 (zh) 一种声纹认证方法、账号注册方法及装置
KR102458805B1 (ko) 장치에 대한 다중 사용자 인증
WO2019184217A1 (zh) 热点事件分类方法、装置及存储介质
WO2021000408A1 (zh) 面试评分方法、装置、设备及存储介质
CN107481720B (zh) 一种显式声纹识别方法及装置
WO2017197953A1 (zh) 基于声纹的身份识别方法及装置
US9454957B1 (en) Named entity resolution in spoken language processing
WO2018149209A1 (zh) 语音识别方法、电子设备以及计算机存储介质
US8972260B2 (en) Speech recognition using multiple language models
CN110060674B (zh) 表格管理方法、装置、终端和存储介质
WO2020147256A1 (zh) 会议内容区分方法、装置、计算机设备及存储介质
CN109947971B (zh) 图像检索方法、装置、电子设备及存储介质
TWI536183B (zh) 語言歧義消除系統及方法
WO2021135603A1 (zh) 意图识别方法、服务器及存储介质
WO2020034538A1 (zh) 音频关键字质检方法、装置、计算机设备及存储介质
CN113177850A (zh) 一种保险的多方身份认证的方法及装置
WO2020037921A1 (zh) 表情图片提示方法、装置、计算机设备及存储介质
WO2020233381A1 (zh) 基于语音识别的服务请求方法、装置及计算机设备
TWI579828B (zh) 語音辨識裝置及方法
US11062700B1 (en) Query answering with controlled access knowledge graph
WO2020140609A1 (zh) 一种语音识别方法、设备及计算机可读存储介质
CN107424612A (zh) 处理方法、装置和机器可读介质
JP4143541B2 (ja) 動作モデルを使用して非煩雑的に話者を検証するための方法及びシステム
TW201409462A (zh) 語意辨識方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18937094

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18937094

Country of ref document: EP

Kind code of ref document: A1