CN113593553A - 语音识别方法、装置、语音管理服务器以及存储介质 - Google Patents

语音识别方法、装置、语音管理服务器以及存储介质 Download PDF

Info

Publication number
CN113593553A
CN113593553A CN202110788586.2A CN202110788586A CN113593553A CN 113593553 A CN113593553 A CN 113593553A CN 202110788586 A CN202110788586 A CN 202110788586A CN 113593553 A CN113593553 A CN 113593553A
Authority
CN
China
Prior art keywords
information
employee
risk
analysis result
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110788586.2A
Other languages
English (en)
Other versions
CN113593553B (zh
Inventor
姚武
杨建培
夏虹
孙雪华
肖力坚
林裕伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Mingyuan Yunke E Commerce Co ltd
Original Assignee
Shenzhen Mingyuan Yunke E Commerce Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Mingyuan Yunke E Commerce Co ltd filed Critical Shenzhen Mingyuan Yunke E Commerce Co ltd
Priority to CN202110788586.2A priority Critical patent/CN113593553B/zh
Publication of CN113593553A publication Critical patent/CN113593553A/zh
Application granted granted Critical
Publication of CN113593553B publication Critical patent/CN113593553B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种语音识别方法,用于语音管理服务器,所述方法包括以下步骤:对目标语音信息中的员工语音信息进行文本转换,以获得员工文本信息,所述目标语音信息是发送端发送;对所述员工文本信息进行风险分析,以获风险分析结果;在所述风险分析结果为所述员工文本信息包括风险信息时,基于所述发送端的设备信息和所述风险分析结果,获得第一分析结果。本发明还公开一种语音识别装置、语音管理服务器以及计算机可读存储介质。利用本发明的语音识别方法,不需要核查人员手动操作,听录制的员工语音信息,提高了核查速度,使得核查效率较高。

Description

语音识别方法、装置、语音管理服务器以及存储介质
技术领域
本发明涉及数据核查技术领域,特别涉及一种语音识别方法、装置、语音管理服务器以及计算机可读存储介质。
背景技术
目前,在商品或服务的销售环节,需要员工(通常为顾问或咨询师)与客户对话沟通,以获取客户的需求。
相关技术中,利用移动终端(例如,手机和平板电脑等)录制员工与客户的沟通会话,由核查人员手动操作,听录制的沟通会话,以确定员工是否对客户说了风险信息(例如虚假承诺和虚假商品信息)。
但是,采用现有的会话分析方法,对风险信息进行核查时,核查速度慢,核查效率低。
发明内容
本发明的主要目的是提供一种语音识别方法、装置、语音管理服务器以及计算机可读存储介质,旨在解决现有技术中采用现有的会话分析方法,对风险信息进行核查时,核查速度慢,核查效率低的技术问题。
为实现上述目的,本发明提出一种语音识别方法,用于语音管理服务器,所述方法包括以下步骤:
对目标语音信息中的员工语音信息进行文本转换,以获得员工文本信息,所述目标语音信息是发送端发送;
对所述员工文本信息进行风险分析,以获风险分析结果;
在所述风险分析结果为所述员工文本信息包括风险信息时,基于所述发送端的设备信息和所述风险分析结果,获得第一分析结果。
可选的,所述在所述风险分析结果为所述员工文本信息包括风险信息时,基于所述发送端的设备信息和所述风险分析结果,获得第一分析结果的步骤,包括:
在所述风险分析结果为所述员工文本信息包括风险信息时,获取所述员工文本信息中的目标风险信息;
基于所述发送端的设备信息、所述风险分析结果和所述目标风险信息,获得第一分析结果。
可选的,所述对所述员工文本信息进行风险分析,以获风险分析结果的步骤,包括:
利用第一语义分析模型,确定所述员工文本信息与预设风险信息的风险相似度;
基于所述风险相似度,获得所述风险分析结果,其中,在所述风险相似度大于预设风险相似度阈值时,所述风险分析结果为所述员工文本信息包括风险信息。
可选的,所述对所述员工文本信息进行风险分析,以获风险分析结果的步骤,包括:
在所述员工文本信息中查找目标风险关键词;
若在所述员工文本信息中查找到所述目标风险关键词,则获得所述员工文本信息包括风险信息的风险分析结果。
可选的,所述获得员工文本信息的步骤之后,所述方法还包括:
对所述员工文本信息进行输出完整度分析,以获输出完整度;
在所述输出完整度低于预设完整度阈值时,获取所述员工文本信息的缺失输出信息;
基于所述设备信息、所述缺失输出信息和所述输出完整度,获得第二分析结果。
可选的,所述对所述员工文本信息进行输出完整度分析,以获输出完整度的步骤,包括:
利用第二语义分析模型,确定所述员工文本信息与预设标准输出信息的输出相似度;
基于所述输出相似度,获得所述输出完整度。
可选的,所述对所述员工文本信息进行输出完整度分析,以获输出完整度的步骤,包括:
确定目标输出关键词在所述员工文本信息中的输出命中率;
基于所述输出命中率,获得输出完整度。
此外,为实现上述目的,本发明还提出了一种语音识别装置,用于语音管理服务器,所述装置包括:
转换模块,用于对目标语音信息中的员工语音信息进行文本转换,以获得员工文本信息,所述目标语音信息是发送端发送;
分析模块,用于对所述员工文本信息进行风险分析,以获风险分析结果;
获得模块,用于在所述风险分析结果为所述员工文本信息包括风险信息时,基于所述发送端的设备信息和所述风险分析结果,获得第一分析结果。
此外,为实现上述目的,本发明还提出了一种语音管理服务器,所述语音管理服务器包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行语音识别程序,所述语音识别程序被所述处理器执行时实现如上述任一项所述的语音识别方法的步骤。
此外,为实现上述目的,本发明还提出了一种计算机可读存储介质,所述计算机可读存储介质上存储有语音识别程序,所述语音识别程序被处理器执行时实现如上述任一项所述的语音识别方法的步骤。
本发明技术方案提出了一种语音识别方法,用于语音管理服务器,所述方法包括以下步骤:对目标语音信息中的员工语音信息进行文本转换,以获得员工文本信息,所述目标语音信息是发送端发送;对所述员工文本信息进行风险分析,以获风险分析结果;在所述风险分析结果为所述员工文本信息包括风险信息时,基于所述发送端的设备信息和所述风险分析结果,获得第一分析结果。
由于,现有的分析方法中,由核查人员手动操作,听录制的员工语音信息,以确定员工是否对客户说了风险信息,使得核查速度慢,核查效率低。而本发明的语音识别方法中,语音管理服务器自动对员工语音信息进行分析,以获得最后的第一分析结果,不需要核查人员手动操作,听录制的员工语音信息,提高了核查速度,使得核查效率较高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明实施例方案涉及的硬件运行环境的语音管理服务器结构示意图;
图2为本发明语音识别方法第一实施例的流程示意图;
图3为本发明的实施例的语音识别装置的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的语音管理服务器结构示意图。
通常,语音管理服务器包括:至少一个处理器301、存储器302以及存储在所述存储器上并可在所述处理器上运行的语音识别程序,所述语音识别程序配置为实现如前所述的语音识别方法的步骤。
处理器301可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器301可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(CentralProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器301可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。处理器301还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关语音识别方法操作,使得语音识别方法模型可以自主训练学习,提高效率和准确度。
存储器302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器302还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器302中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器301所执行以实现本申请中方法实施例提供的语音识别方法。
在一些实施例中,终端还可选包括有:通信接口303和至少一个外围设备。处理器301、存储器302和通信接口303之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与通信接口303相连。具体地,外围设备包括:射频电路304、显示屏305和电源306中的至少一种。
通信接口303可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器301和存储器302。在一些实施例中,处理器301、存储器302和通信接口303被集成在同一芯片或电路板上;在一些其他实施例中,处理器301、存储器302和通信接口303中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路304用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路304通过电磁信号与通信网络以及其他通信设备进行通信。射频电路304将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路304包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路304可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路304还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏305用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏305是触摸显示屏时,显示屏305还具有采集在显示屏305的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器301进行处理。此时,显示屏305还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏305可以为一个,电子设备的前面板;在另一些实施例中,显示屏305可以为至少两个,分别设置在电子设备的不同表面或呈折叠设计;在再一些实施例中,显示屏305可以是柔性显示屏,设置在电子设备的弯曲表面上或折叠面上。甚至,显示屏305还可以设置成非矩形的不规则图形,也即异形屏。显示屏305可以采用LCD(LiquidCrystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
电源306用于为电子设备中的各个组件进行供电。电源306可以是交流电、直流电、一次性电池或可充电电池。当电源306包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。本领域技术人员可以理解,图1中示出的结构并不构成对语音管理服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有语音识别程序,所述语音识别程序被处理器执行时实现如上文所述的语音识别方法的步骤。因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。确定为示例,程序指令可被部署为在一个语音管理服务器上执行,或者在位于一个地点的多个语音管理服务器上执行,又或者,在分布在多个地点且通过通信网络互连的多个语音管理服务器备上执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的计算机可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
基于上述硬件结构,提出本发明语音识别方法的实施例。
参照图2,图2为本发明语音识别方法第一实施例的流程示意图,所述方法用于语音管理服务器,所述方法包括以下步骤:
步骤S11:对目标语音信息中的员工语音信息进行文本转换,以获得员工文本信息,所述目标语音信息是发送端发送。
需要说明的是,本发明的执行主体是语音管理服务器,语音管理服务器安装有语音识别程序,语音管理服务器的结构参照上述描述,此处不再赘述;语音管理服务器执行语音识别程序时,实现本发明的语音识别方法的步骤。
目标语音信息通常由发送端录制,并发送至语音管理服务器;发送端可以是移动终端,例如平板电脑或手机,发送端也可以是智能工牌。
在一些实施例中,智能工牌具有PCBA板(经SMT上件或DIP插件的印制电路板),PCBA板上的硅麦阵列采用T型,上排1个硅麦是针对员工(例如置业顾问,销售咨询师等)的声音进行录制,下排3个硅麦是针对客户的声音进行录制,通过4个硅麦来定位声源的位置,以区分发音者为客户还是员工;通常,智能工牌佩戴于员工身上,所以员工与客户的位置势必不同,即可以利用多个硅麦阵列的方式,进行声源定位,以确定发音者。
同时,智能工牌分别对不同的声源进行录音,将同一个声源对应的录音作为一个录音文件,即:客户录音为一个语音信息,员工录音为一个语音信息,员工语音信息与客户语音信息是分开的。在一些实施例中,在PCBA板还可以对客户语音信息和员工语音信息进行降噪处理,并将处理后的客户语音信息和员工语音信息存储,并发送至语音管理服务器,由语音管理服务器直接取出对应的员工语音信息。可以理解的是,所述目标语音信息包括智能工牌发送的员工语音信息和客户语音信息。
通常,一个智能工牌属于一个员工,一个智能工牌对应的目标语音信息中携带有智能工牌的设备ID等(员工语音信息和客户语音信息均携带),也即,一个智能工牌通过该设备ID对应一个员工。换而言之,对于一个发送端,目标语音信息通过该发送端的设备信息与发送端对应的员工绑定。
在该实施例中,员工语音信息和客户语音信息是分开的,语音管理服务器直接取出员工语音信息即可,不需要语音管理服务器从混合的语音信息中提取员工语音信息,大大提高了语音识别的识别效率。
可以理解的是,在本发明中,对员工语音信息进行识别,可以是利用声学模型进行识别,例如HMM声学模型,也可以是利用语言模型进行识别,例如N-Gram语言模型,本发明不做具体限制。
步骤S12:对所述员工文本信息进行风险分析,以获风险分析结果。
需要说明的是,员工语音信息可能包括风险信息(例如,虚假承诺和夸大说辞等),使得员工语音信息对应的员工文本信息也会包括风险信息,需要对员工文本信息进行风险分析,以获得风险分析结果,风险分析结果为所述员工文本信息包括风险信息,或所述员工文本信息不包括风险信息。
具体的,所述对所述员工文本信息进行风险分析,以获风险分析结果的步骤,包括:利用第一语义分析模型,确定所述员工文本信息与预设风险信息的风险相似度;基于所述风险相似度,获得所述风险分析结果,其中,在所述风险相似度大于预设风险相似度阈值时,所述风险分析结果为所述员工文本信息包括风险信息;或,
在所述员工文本信息中查找目标风险关键词;若在所述员工文本信息中查找到所述目标风险关键词,则获得所述员工文本信息包括风险信息的风险分析结果。
需要说明的是,第一语义分析模型用于对员工文本信息进行语义分析,以确定员工文本信息是否包括风险信息;具体的,风险信息(例如虚假承诺)会具有固定的表达方式和搭配方式,利用携带预设风险信息的训练样本对语义分析模型进行训练,以获得训练后的第一语义分析模型,将员工文本信息输入第一语义分析模型之后,输出的即为员工文本信息与所述预设风险信息的风险相似度,风险相似度表示员工文本信息包括风险信息的可能性。
具体应用中,通过设定预设风险相似度阈值,来确定员工文本信息是否包括风险信息,其中,预设风险相似度阈值,可以是用户基于需求设定的,本发明不做限制。可以理解的是,风险相似度越大,表示员工文本信息与预设风险信息的相似度越大,员工文本信息包括风险信息的可能性也就越大。
另外,风险信息(例如虚假承诺)会具有一些固定的词汇,例如,最保值等关键词,可以对采集的大数据进行分析,确定出风险信息对应的目标风险关键词,然后在员工文本信息中查找目标风险关键词,若是找到了目标风险关键词,即表示员工文本信息包括风险信息,若是没找到了目标风险关键词,即表示员工文本信息不包括风险信息。
通常,具体应用中,可以结合中查找目标风险关键词和利用第一语义分析模型进行分析两种方式,基于两种方式共同的结果,确定员工文本信息是否包括风险信息。例如,当未找到目标风险关键词,员工文本信息与所述预设风险信息的风险相似度低于预设风险相似度阈值时,确定员工文本信息不包括风险信息。
具体的,风险分析结果为员工文本信息包括风险信息时,风险分析结果还可以包括员工文本信息中风险信息与预设风险信息的相似度,或风险分析结果可以包括员工文本信息中找到的目标风险关键词。
步骤S13:在所述风险分析结果为所述员工文本信息包括风险信息时,基于所述发送端的设备信息和所述风险分析结果,获得第一分析结果。
需要说明的是,获得的风险分析结果为所述员工文本信息包括风险信息时,需要确定该员工文本信息对应的员工是谁,通过发送端的设备信息确定与之绑定的员工,并基于该设备信息和风险分析结果,获得第一分析结果,第一分析结果包括员工文本信息与预设风险信息的风险相似度,或员工文本信息中找到的目标风险关键词,第一分析结果还包括发送端的设备信息,第一分析结果还可以包括发送端对应的员工,以便于基于第一分析结果直接确定风险信息对应的员工。
进一步的,所述在所述风险分析结果为所述员工文本信息包括风险信息时,基于所述发送端的设备信息和所述风险分析结果,获得第一分析结果的步骤,包括:在所述风险分析结果为所述员工文本信息包括风险信息时,获取所述员工文本信息中的目标风险信息;基于所述发送端的设备信息、所述风险分析结果和所述目标风险信息,获得第一分析结果。
需要说明的是,目标风险信息可以是第一分析结果包括员工文本信息与预设风险信息的风险相似度,以及员工文本信息中与预设风险信息的风险相似度超过预设风险相似度阈值的文本信息(例如,员工文本信息包括10句文本信息,其中只有一句文本与预设风险信息的风险相似度超过预设风险相似度阈值,该句文本即为目标风险信息中的一部分信息,同时该句文本与与预设风险信息的风险相似度也是目标风险信息中的一部分信息),或目标风险信息可以是员工文本信息中找到的目标风险关键词。
本发明技术方案提出了一种语音识别方法,用于语音管理服务器,所述方法包括以下步骤:对目标语音信息中的员工语音信息进行文本转换,以获得员工文本信息,所述目标语音信息是发送端发送;对所述员工文本信息进行风险分析,以获风险分析结果;在所述风险分析结果为所述员工文本信息包括风险信息时,基于所述发送端的设备信息和所述风险分析结果,获得第一分析结果。
由于,现有的分析方法中,由核查人员手动操作,听录制的员工语音信息,以确定员工是否对客户说了风险信息,使得核查速度慢,核查效率低。而本发明的语音识别方法中,语音管理服务器自动对员工语音信息进行分析,以获得最后的第一分析结果,不需要核查人员手动操作,听录制的员工语音信息,提高了核查速度,使得核查效率较高。
进一步的,所述获得员工文本信息的步骤之后,所述方法还包括:对所述员工文本信息进行输出完整度分析,以获输出完整度;在所述输出完整度低于预设完整度阈值时,获取所述员工文本信息的缺失输出信息;基于所述设备信息、所述缺失输出信息和所述输出完整度,获得第二分析结果。
需要说明的是,还可以对员工文本信息进行完整度分析,以确定员工是否将重要输出信息全部告知与客户,例如,在员工为置业顾问时,需要确定员工在销售过程中是否将房屋的全部重要输出信息告知于客户;当员工在销售过程中将全部重要输出信息告知给客户,则员工文本信息的输出完整度极高,当员工在销售过程中将小部分重要输出信息告知给客户,则员工文本信息的输出完整度较低。
具体的,所述对所述员工文本信息进行输出完整度分析,以获输出完整度的步骤,包括:利用第二语义分析模型,确定所述员工文本信息与预设标准输出信息的输出相似度;基于所述输出相似度,获得所述输出完整度;或,
确定目标输出关键词在所述员工文本信息中的输出命中率;基于所述输出命中率,获得输出完整度。
需要说明的是,基于上文同样的发明构思,第二语义分析模型用于对员工文本信息进行语义分析,以确定员工文本信息是否包括预设标准输出信息;具体的,预设标准输出信息(房屋的尺寸描述)会具有固定的表达方式和搭配方式,利用携带预设标准输出信息的训练样本的语义分析模型进行训练,以获得训练后的第二语义分析模型,将员工文本信息输入第二语义分析模型之后,输出的即为员工文本信息与所述预设标准输出信息的输出相似度,输出相似度表示员工文本信息包括预设标准输出信息的可能性。
同时,重要输出信息会具有一些固定的词汇,例如,房屋面积为110平方米或房屋大小为110平方米,可以对采集的大数据进行分析,确定出重要输出信息对应的目标输出关键词,然后确定目标输出关键词在所述员工文本信息中的输出命中率,若是输出命中率较高,即表示员工文本信息中包括大部分重要输出信息,也即员工告知客户大部分重要输出信息,若是输出命中率较低,即表示员工文本信息包括小部分重要输出信息,也即员工告知客户小部分重要输出信息。
具体应用中,可以设置输出相似度阈值,当输出相似度低于输出相似度阈值时,对应的输出完整度低于预设完整度阈值,即输出相似度与输出完整度具有映射关系,输出相似度阈值与预设完整度阈值也具有该映射关系。同理,可以设置输出命中率阈值,当输出命中率低于输出命中率阈值时,对应的输出完整度低于预设完整度阈值,即输出命中率与输出完整度具有映射关系,输出命中率阈值与预设完整度阈值也具有该映射关系。
在一些实施例中,可以结合输出命中率分析和利用第二语义分析模型进行分析两种方式,基于两种方式共同的结果,确定员工文本信息包括重要输出信息的情况。例如,当输出相似度高于输出相似度阈值(表现为输出完整度高于预设完整度阈值),输出命中率高于命中率阈值时(表现为输出完整度高于预设完整度阈值),确定员工文本信息包括较多重要输出信息,此时员工文本信息可以是合格的,不需要进行后续处理。
当员工文本信息的输出完整度低于预设完整度阈值时,表现为员工文本信息包括较少的重要输出信息,例如缺少绿化面积的语义表达,员工文本信息不合格,需要获取到缺失输出信息;其中,缺失输出信息可以为员工文本信息中与预设标准输出信息不重合的部分(例如缺少的绿化面积的语义表达),可能是员工文本信息并不包括某种固定表达所对应的重要输出信息;缺失输出信息还可以为目标输出关键词在所述员工文本信息中未命中的目标输出关键词。
可以理解的是,第二分析结果与第一分析结果具有相似的结构,在所述输出完整度低于预设完整度阈值时,需要确定该员工文本信息对应的员工是谁,通过发送端的设备信息确定与之绑定的员工,并基于该设备信息、所述缺失输出信息和所述输出完整度,获得第一分析结果,第一分析结果包括员工文本信息与预设标准输出信息的输出相似度,或目标输出关键词在所述员工文本信息中的输出命中率,第二分析结果还可以包括缺失输出信息;第二分析结果还包括发送端的设备信息,第二分析结果还可以包括发送端对应的员工,以便于基于第一分析结果直接确定风险信息对应的员工。
由于,现有的分析方法中,由核查人员手动操作,听录制的员工语音信息,以确定员工是否告知了重要输出信息,使得核查速度慢,核查效率低。在该实施例中,语音管理服务器自动对员工语音信息进行分析,以获得最后的第二分析结果,不需要核查人员手动操作,听录制的员工语音信息,提高了核查速度,使得核查效率较高。
参照图3,图3为本发明的实施例的语音识别装置的结构框图,所述装置用于语音管理服务器,基于与前述实施例相同的发明构思,所述装置包括:
转换模块10,用于对目标语音信息中的员工语音信息进行文本转换,以获得员工文本信息,所述目标语音信息是发送端发送;
分析模块20,用于对所述员工文本信息进行风险分析,以获风险分析结果;
获得模块30,用于在所述风险分析结果为所述员工文本信息包括风险信息时,基于所述发送端的设备信息和所述风险分析结果,获得第一分析结果。
需要说明的是,由于本实施例的装置所执行的步骤与前述方法实施例的步骤相同,其具体的实施方式以及可以达到的技术效果都可参照前述实施例,这里不再赘述。
以上所述仅为本发明的可选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (10)

1.一种语音识别方法,其特征在于,用于语音管理服务器,所述方法包括以下步骤:
对目标语音信息中的员工语音信息进行文本转换,以获得员工文本信息,所述目标语音信息是发送端发送;
对所述员工文本信息进行风险分析,以获风险分析结果;
在所述风险分析结果为所述员工文本信息包括风险信息时,基于所述发送端的设备信息和所述风险分析结果,获得第一分析结果。
2.如权利要求1所述的方法,其特征在于,所述在所述风险分析结果为所述员工文本信息包括风险信息时,基于所述发送端的设备信息和所述风险分析结果,获得第一分析结果的步骤,包括:
在所述风险分析结果为所述员工文本信息包括风险信息时,获取所述员工文本信息中的目标风险信息;
基于所述发送端的设备信息、所述风险分析结果和所述目标风险信息,获得第一分析结果。
3.如权利要求2所述的方法,其特征在于,所述对所述员工文本信息进行风险分析,以获风险分析结果的步骤,包括:
利用第一语义分析模型,确定所述员工文本信息与预设风险信息的风险相似度;
基于所述风险相似度,获得所述风险分析结果,其中,在所述风险相似度大于预设风险相似度阈值时,所述风险分析结果为所述员工文本信息包括风险信息。
4.如权利要求2所述的方法,其特征在于,所述对所述员工文本信息进行风险分析,以获风险分析结果的步骤,包括:
在所述员工文本信息中查找目标风险关键词;
若在所述员工文本信息中查找到所述目标风险关键词,则获得所述员工文本信息包括风险信息的风险分析结果。
5.如权利要求3或4所述的方法,其特征在于,所述获得员工文本信息的步骤之后,所述方法还包括:
对所述员工文本信息进行输出完整度分析,以获输出完整度;
在所述输出完整度低于预设完整度阈值时,获取所述员工文本信息的缺失输出信息;
基于所述设备信息、所述缺失输出信息和所述输出完整度,获得第二分析结果。
6.如权利要求5所述的方法,其特征在于,所述对所述员工文本信息进行输出完整度分析,以获输出完整度的步骤,包括:
利用第二语义分析模型,确定所述员工文本信息与预设标准输出信息的输出相似度;
基于所述输出相似度,获得所述输出完整度。
7.如权利要求5所述的方法,其特征在于,所述对所述员工文本信息进行输出完整度分析,以获输出完整度的步骤,包括:
确定目标输出关键词在所述员工文本信息中的输出命中率;
基于所述输出命中率,获得输出完整度。
8.一种语音识别装置,其特征在于,用于语音管理服务器,所述装置包括:
转换模块,用于对目标语音信息中的员工语音信息进行文本转换,以获得员工文本信息,所述目标语音信息是发送端发送;
分析模块,用于对所述员工文本信息进行风险分析,以获风险分析结果;
获得模块,用于在所述风险分析结果为所述员工文本信息包括风险信息时,基于所述发送端的设备信息和所述风险分析结果,获得第一分析结果。
9.一种语音管理服务器,其特征在于,所述语音管理服务器包括:存储器、处理器及存储在所述存储器上并在所述处理器上运行语音识别程序,所述语音识别程序被所述处理器执行时实现如权利要求1至7中任一项所述的语音识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有语音识别程序,所述语音识别程序被处理器执行时实现如权利要求1至7中任一项所述的语音识别方法的步骤。
CN202110788586.2A 2021-07-12 2021-07-12 语音识别方法、装置、语音管理服务器以及存储介质 Active CN113593553B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110788586.2A CN113593553B (zh) 2021-07-12 2021-07-12 语音识别方法、装置、语音管理服务器以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110788586.2A CN113593553B (zh) 2021-07-12 2021-07-12 语音识别方法、装置、语音管理服务器以及存储介质

Publications (2)

Publication Number Publication Date
CN113593553A true CN113593553A (zh) 2021-11-02
CN113593553B CN113593553B (zh) 2022-05-24

Family

ID=78247539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110788586.2A Active CN113593553B (zh) 2021-07-12 2021-07-12 语音识别方法、装置、语音管理服务器以及存储介质

Country Status (1)

Country Link
CN (1) CN113593553B (zh)

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2999646A1 (en) * 2017-04-05 2018-10-05 Teleperformance Se Context sensitive rule-based alerts for fraud monitoring
CN109086276A (zh) * 2018-08-27 2018-12-25 Oppo广东移动通信有限公司 数据翻译方法、装置、终端及存储介质
CN110176252A (zh) * 2019-05-08 2019-08-27 江西尚通科技发展股份有限公司 基于风险管控模式的智能语音质检方法及系统
CN110310663A (zh) * 2019-05-16 2019-10-08 平安科技(深圳)有限公司 违规话术检测方法、装置、设备及计算机可读存储介质
CN110519470A (zh) * 2019-08-22 2019-11-29 徐菲 一种语音处理方法、服务器和语音接入装置
CN110597964A (zh) * 2019-09-27 2019-12-20 神州数码融信软件有限公司 一种双录质检语义分析方法、装置及双录质检系统
CN110839112A (zh) * 2019-11-18 2020-02-25 广东电网有限责任公司佛山供电局 一种问题语音的检测方法和装置
CN111402866A (zh) * 2020-03-23 2020-07-10 北京声智科技有限公司 语义识别方法、装置及电子设备
CN111698374A (zh) * 2020-06-28 2020-09-22 中国银行股份有限公司 一种客服语音处理方法及装置
CN111797632A (zh) * 2019-04-04 2020-10-20 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN111917924A (zh) * 2020-07-29 2020-11-10 上海博泰悦臻电子设备制造有限公司 客服语音质检方法及相关设备
CN111984779A (zh) * 2020-09-10 2020-11-24 支付宝(杭州)信息技术有限公司 一种对话文本分析方法、装置、设备和可读介质
CN112183114A (zh) * 2020-08-10 2021-01-05 招联消费金融有限公司 模型训练、语义完整性识别方法和装置
CN112468658A (zh) * 2020-11-20 2021-03-09 平安普惠企业管理有限公司 语音质量检测方法、装置、计算机设备及存储介质
CN112671985A (zh) * 2020-12-22 2021-04-16 平安普惠企业管理有限公司 基于深度学习的坐席质检方法、装置、设备及存储介质
CN112714217A (zh) * 2019-10-25 2021-04-27 中兴通讯股份有限公司 话务质检方法、装置、存储介质及服务器
CN112804400A (zh) * 2020-12-31 2021-05-14 中国工商银行股份有限公司 客服呼叫语音质检方法、装置、电子设备及存储介质

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2999646A1 (en) * 2017-04-05 2018-10-05 Teleperformance Se Context sensitive rule-based alerts for fraud monitoring
CN109086276A (zh) * 2018-08-27 2018-12-25 Oppo广东移动通信有限公司 数据翻译方法、装置、终端及存储介质
CN111797632A (zh) * 2019-04-04 2020-10-20 北京猎户星空科技有限公司 信息处理方法、装置及电子设备
CN110176252A (zh) * 2019-05-08 2019-08-27 江西尚通科技发展股份有限公司 基于风险管控模式的智能语音质检方法及系统
CN110310663A (zh) * 2019-05-16 2019-10-08 平安科技(深圳)有限公司 违规话术检测方法、装置、设备及计算机可读存储介质
CN110519470A (zh) * 2019-08-22 2019-11-29 徐菲 一种语音处理方法、服务器和语音接入装置
CN110597964A (zh) * 2019-09-27 2019-12-20 神州数码融信软件有限公司 一种双录质检语义分析方法、装置及双录质检系统
CN112714217A (zh) * 2019-10-25 2021-04-27 中兴通讯股份有限公司 话务质检方法、装置、存储介质及服务器
CN110839112A (zh) * 2019-11-18 2020-02-25 广东电网有限责任公司佛山供电局 一种问题语音的检测方法和装置
CN111402866A (zh) * 2020-03-23 2020-07-10 北京声智科技有限公司 语义识别方法、装置及电子设备
CN111698374A (zh) * 2020-06-28 2020-09-22 中国银行股份有限公司 一种客服语音处理方法及装置
CN111917924A (zh) * 2020-07-29 2020-11-10 上海博泰悦臻电子设备制造有限公司 客服语音质检方法及相关设备
CN112183114A (zh) * 2020-08-10 2021-01-05 招联消费金融有限公司 模型训练、语义完整性识别方法和装置
CN111984779A (zh) * 2020-09-10 2020-11-24 支付宝(杭州)信息技术有限公司 一种对话文本分析方法、装置、设备和可读介质
CN112468658A (zh) * 2020-11-20 2021-03-09 平安普惠企业管理有限公司 语音质量检测方法、装置、计算机设备及存储介质
CN112671985A (zh) * 2020-12-22 2021-04-16 平安普惠企业管理有限公司 基于深度学习的坐席质检方法、装置、设备及存储介质
CN112804400A (zh) * 2020-12-31 2021-05-14 中国工商银行股份有限公司 客服呼叫语音质检方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
冯继东: "智能语音分析系统在呼叫中心的推广及其应用", 《电子世界》 *

Also Published As

Publication number Publication date
CN113593553B (zh) 2022-05-24

Similar Documents

Publication Publication Date Title
WO2021022992A1 (zh) 对话生成模型的训练方法、对话生成方法、装置及介质
EP3444811B1 (en) Speech recognition method and device
CN111683317B (zh) 一种应用于耳机的提示方法、装置、终端及存储介质
WO2021184837A1 (zh) 诈骗电话的识别方法、装置、存储介质及终端
CN109040444B (zh) 一种通话录音方法、终端及计算机可读存储介质
CN106228047B (zh) 一种应用程序图标处理方法及终端设备
CN113157240A (zh) 语音处理方法、装置、设备、存储介质及计算机程序产品
CN113012683A (zh) 语音识别方法及装置、设备、计算机可读存储介质
CN113593553B (zh) 语音识别方法、装置、语音管理服务器以及存储介质
CN107895573B (zh) 用于识别信息的方法及装置
CN112509567B (zh) 语音数据处理的方法、装置、设备、存储介质及程序产品
CN111723783B (zh) 一种内容识别方法和相关装置
CN113538048B (zh) 需求信息获得方法、装置、终端设备以及存储介质
CN108491471A (zh) 一种文本信息的处理方法、移动终端
CN114333017A (zh) 一种动态拾音方法、装置、电子设备及存储介质
CN112306560B (zh) 用于唤醒电子设备的方法和装置
CN113610427A (zh) 事件预警指标获得方法、装置、终端设备以及存储介质
CN108093124B (zh) 一种音频定位方法、装置及移动终端
CN113593552A (zh) 需求信息统计方法、装置、终端设备以及存储介质
US20240096347A1 (en) Method and apparatus for determining speech similarity, and program product
CN117012202B (zh) 语音通道识别方法、装置、存储介质及电子设备
CN114360535B (zh) 语音对话的生成方法、装置、电子设备及存储介质
CN111968686B (zh) 录音方法、装置和电子设备
US20230106550A1 (en) Method of processing speech, electronic device, and storage medium
CN111126081B (zh) 全球通用语言终端及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant