CN116708637A - 一种录音管理方法、系统、电子设备及存储介质 - Google Patents
一种录音管理方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116708637A CN116708637A CN202310523806.8A CN202310523806A CN116708637A CN 116708637 A CN116708637 A CN 116708637A CN 202310523806 A CN202310523806 A CN 202310523806A CN 116708637 A CN116708637 A CN 116708637A
- Authority
- CN
- China
- Prior art keywords
- information
- content
- recording
- preset
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007726 management method Methods 0.000 title claims abstract description 31
- 238000004891 communication Methods 0.000 claims abstract description 45
- 238000004458 analytical method Methods 0.000 claims abstract description 18
- 238000000034 method Methods 0.000 claims description 35
- 238000004590 computer program Methods 0.000 claims description 12
- 230000009467 reduction Effects 0.000 claims description 6
- 230000003321 amplification Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 239000003086 colorant Substances 0.000 claims description 5
- 238000007906 compression Methods 0.000 claims description 5
- 230000006835 compression Effects 0.000 claims description 5
- 238000009499 grossing Methods 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- 238000006722 reduction reaction Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 3
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 230000008569 process Effects 0.000 description 10
- 238000012360 testing method Methods 0.000 description 8
- 238000012790 confirmation Methods 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000010485 coping Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/64—Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
- H04M1/65—Recording arrangements for recording a message from the calling party
- H04M1/656—Recording arrangements for recording a message from the calling party for recording conversations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/565—Conversion or adaptation of application format or content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/04—Protocols for data compression, e.g. ROHC
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Multimedia (AREA)
- Educational Administration (AREA)
- Human Computer Interaction (AREA)
- Game Theory and Decision Science (AREA)
- Acoustics & Sound (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请涉及一种录音管理方法、系统、电子设备及存储介质,其包括对通讯号码进行识别并根据预设识别规则获取录音权限;获取通话结束信号,根据拨号设备型号识别相应的录音存储路径,根据录音存储路径将录音内容从拨号设备内存处上传至云平台;对录音内容语音识别,获得文字通话信息;对文字通话信息进行语义分析,确认是否存在目标内容,确认存在目标内容则触发生成预制表单;生成预制表单后触发抢单程序将预制表单发送至若干跟单员终端进行抢单。本申请具有增强业务员与跟单员之间信息流通及时性且共享效率佳,减少服务因信息流通慢而拖沓的情况,提高对客户的服务质量的效果。
Description
技术领域
本申请涉及录音处理的技术领域,尤其是涉及一种录音管理方法、系统、电子设备及存储介质。
背景技术
目前,企业进行业务开展往往是利用电话营销来吸引新顾客和联系老客户,以确定他们的满意程度或能否接受订单。许多客户也通常是通过手机通讯的方式来确认商品购买意向和服务。
然而现有客户的意向信息依旧依赖业务员人为去总结登记,才能将意向订单转给相应部门去接手跟单,该种方式使得业务员与跟单员之间信息流通不及时且共享性效率差,容易出现拖沓,从而影响客户服务质量,针对上述问题,目前尚未提出有效的解决方案。
发明内容
本申请目的是提供一种录音管理方法、系统、电子设备及存储介质,具有信息流通及时且共享效率佳的特点。
第一方面,本申请提供一种录音管理方法,采用如下的技术方案:
一种录音管理方法,包括:
对即将连通通讯的通讯号码进行识别并根据预设识别规则获取录音权限;
获取通话结束信号,根据拨号设备型号识别相应的录音存储路径,根据录音存储路径将录音内容从拨号设备内存处上传至云平台;
对录音内容语音识别,获得文字通话信息;
对文字通话信息进行语义分析,确认是否存在目标内容,确认存在目标内容则触发生成预制表单;
生成预制表单后触发抢单程序将预制表单发送至若干跟单员终端进行抢单;
获取其中一跟单员终端抢单成功后发送的员工信息码,绑定所述员工信息码关联上录音内容。
通过采用上述技术方案,对业务员与客户通话的录音内容进行语音识别成为文字通话信息,并对文字通话信息进行语义分析,确认是否存在有目标内容,进而生成预制表单,再触发抢单程序发送至跟若干单员处抢单,提高客源公平性,也提供了员工跟单的积极性,同时,也极大增强了业务员与跟单员之间信息流通及时性且共享效率佳,减少服务因信息流通慢而拖沓的情况,提高了对客户的服务质量。
可选的,所述对拨号中的通讯号码根据预设识别规则获取录音权限的步骤,包括:
将通讯号码进行识别,确认通讯号码是否关联客户标签;
若通讯号码关联客户标签,则自动获得通话录音权限;
若通讯号码没有关联客户标签,则获取当前时间与预设时间进行比较,当当前时间处于预设时间内,则发送通话录音权限请求。
通过采用上述技术方案,若通讯号码关联有客户标签,则可以自动获得通话录音权限,能够有效提高业务员的操作效率;若通讯号码没有关联客户标签,会获取当前时间跟预设时间进行比较,预设时间可默认设置为上班时间,也可以由业务员自定义设定,当当前时间处于预设时间内,系统则发送通话录音权限请求,业务员可根据实际情况确认是否录音,该设置能够让本申请不影响业务员正常使用通讯设备,保证业务员自身的隐私性。
可选的,所述上传至云平台的步骤之前,还包括:
识别录音内容位于预设时间范围内的空白频段,对将空白频段进行删除;
对录音内容进行降噪放大平滑处理,并对录音内容进行统一格式转换并压缩后上传。
通过采用上述技术方案,对录音上传前进行预处理能够有效提高上传效率,也能够减少录音占用存储空间情况,另外,也可以有利于语音识别准确度的提高。
可选的,所述对录音内容语音识别,获得文字通话信息的步骤,包括:
对录音内容根据预设切片规则进行切片,获得若干切片内容,并对若干切片内容根据时间顺序进行排序;
对若干切片内容根据可改进语音识别模型进行语音识别,获得切片化的文字通话信息;
其中,对若干切片内容的初步语音识别的精准度进行分值化;
未达到预设分值的切片内容根据可改进语音识别模型进行语音识别获得文字通话信息为预测文字信息,并对预测文字信息赋予标记;
将标记的预测文字信息与时间排序在后且精准度达到预设分值的文字通话信息进行比较,获得可改进语音识别模型中的语言模型误差参数;
当标记次数达到预设次数,则可对发生更新模型需求至开发者终端。
通过采用上述技术方案,能够给开发者针对不同客户提供不同的测试样本标签,同时还能预选出相应的真实样本标签,给开发者更新模型提供了极大的便利,进而有利于在更新模型后针对性对客户的声音进行语音识别,提高语音识别的精准度。
可选的,所述对录音内容根据预设切片规则进行切片,获得若干切片内容的步骤之后,还包括:
对切片内容进行音色识别,根据不同的音色识别出每个切片内容的所属身份分类,并对切片内容赋予身份标签信息,所述身份标签信息包括客户以及业务员;
其中,所述对预测文字信息赋予标记的步骤中,进一步为对所述身份标签信息为客户的预测文字信息赋予标记。
通过采用上述技术方案,设置身份标签能够有利于区分客户以及业务员的切片内容,进而能够针对性对客户的录音内容进行抽取测试样本标签,实现专门对客户进行可改进语音识别模型的更新,同时,排除掉将业务员的切片内容作为测试样本标签,有效避免重大误差,也可以有效减少运算量。
可选的,所述对切片内容进行音色识别,根据不同的音色识别出每个切片内容的所属身份分类,并对切片内容赋予身份标签信息之后,还包括:
对所属身份分类为客户的若干切片内容进行数量统计;
对未达到预设分值且所属身份分类为客户的若干切片内容数量进行统计,计算出未到预设分值相比较于整体切片内容数量的占比值;
当占比值大于预设占比阈值时,则触发对所述身份标签信息为客户的预测文字信息赋予标记。
通过采用上述技术方案,设置的预设占比阈值能够给可改进语音识别模型增加一定的容错率,当占比值小于预设占比阈值,则无需进行标记操作,表明了准确率在识别的容错范围内,保证了准确率的同时能够进一步提高识别的运行效率。
可选的,所述将标记的预测文字信息与时间排序在后且精准度达到预设分值的文字通话信息进行比较,获得可改进语音识别模型中的语言模型误差参数的步骤,包括:
将标记的预测文字信息与时间排序在后且精准度达到预设分值的文字通话信息进行关联度匹配;
筛选出关联度达到预设匹配值的若干文字通话信息,将时间顺序靠后文字通话信息作为真实样本标签;
将标记的预测文字信息以及相关的切片内容与真实样本标签进行比较,记录可改进语音识别模型中的语言模型误差参数。
通过采用上述技术方案,将预测文字信息跟时间排序在后且精准度达到预设分值的文字通话信息进行关联度匹配,筛选出匹配度高达预设匹配值的文字通话信息,然后才将时间顺序靠后文字通话信息作为真实样本标签,设置匹配值能够保证真实样本标签的准确率,选取时间顺序靠后文字通话信息是较为准确的命中该切片内容为业务员最后做出的确认,保证真实样本标签的准确率。
第二方面,本申请提供一种录音管理系统,采用如下的技术方案:
一种录音管理系统,包括:
权限获取模块:用于对即将连通通讯的通讯号码进行识别并根据预设识别规则获取录音权限;
录音上传模块:用于获取通话结束信号,根据拨号设备型号识别相应的录音存储路径,根据录音存储路径将录音内容从拨号设备内存处上传至云平台;
语音识别模块:用于对录音内容语音识别,获得文字通话信息;
语义分析模块:用于对文字通话信息进行语义分析,确认是否存在目标内容,确认存在目标内容则触发生成预制表单;
生成抢单模块:用于生成预制表单后触发抢单程序将预制表单发送至若干跟单员终端进行抢单;
信息关联模型:用于获取其中一跟单员终端抢单成功后发送的员工信息码,绑定所述员工信息码关联上录音内容。
第三方面,本申请提供一种电子设备,采用如下技术方案:
一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种录音管理方法的步骤。
第四方面,本申请是提供一种计算机存储介质,如下技术方案:
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述一种录音管理方法的步骤。
综上所述,本申请包括以下至少一种有益技术效果:
对业务员与客户通话的录音内容进行语音识别成为文字通话信息,并对文字通话信息进行语义分析,确认是否存在有目标内容,进而生成预制表单,再触发抢单程序发送至跟若干单员处抢单,提高客源公平性,也提供了员工跟单的积极性,同时,也极大增强了业务员与跟单员之间信息流通及时性且共享效率佳,减少服务因信息流通慢而拖沓的情况,提高了对客户的服务质量。
附图说明
图1是本申请其中一实施例中一种录音管理方法的流程示意图。
图2是本申请另一实施例中步骤S1的具体步骤流程示意图。
图3是本申请另一实施例中步骤S2上传至云平台之前增设的步骤流程示意图。
图4是本申请另一实施例中步骤S3的具体步骤流程示意图。
图5是本申请另一实施例中步骤S30获得若干切片内容之后增设的步骤流程示意图。
图6是本申请另一实施例中步骤S300之后增设的步骤流程示意图。
图7是本申请另一实施例中步骤S34的具体步骤流程示意图。
图8是本申请其中一实施例的一种录音系统的结构示意图。
图9是本申请其中一实施例中电子设备的原理框图。
图中,1、权限获取模块;2、录音上传模块;3、语音识别模块;4、语义分析模块;5、生成抢单模块;6、信息关联模型。
具体实施方式
以下结合附图1-9对本申请作进一步详细说明。
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图1-9及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的一种录音管理方法,用于实现业务员与跟单员之间的信息流通性,增加跟单员的跟进单子的及时性。
参照图1,本申请中一个实施例公开的一种录音管理方法,包括:
S1、对即将连通通讯的通讯号码进行识别并根据预设识别规则获取录音权限。
其中,通讯设备可为业务员的手机,业务员可通过下载APP,绑定业务员的手机号即通讯号码于系统账号中,系统存储有以往业务来往的客户信息。业务员可主动拨打给客户,也可接收来自客户的电话,在业务员手机通讯即将连通时,识别主动拨打或者是拨过来的通讯号码,并按照预设识别规则获取录音权限。
图2为本申请公开中步骤S1的一种可选实现方式流程图,参照图2,步骤S1具体包括以下步骤:
S10、将通讯号码进行识别,确认通讯号码是否关联客户标签。
S11、若通讯号码关联客户标签,则自动获得通话录音权限。
S11、若通讯号码没有关联客户标签,则获取当前时间与预设时间进行比较,当当前时间处于预设时间内,则发送通话录音权限请求。
其中,通讯号码若为客户,则该通讯号码关联有客户标签,业务员可在系统内预先设置为系统内登记的所有客户进行,自动同意授权通话录音权限,因此,当通讯号码识别关联有客户标签时,就会自动获得通话录音权限;若通讯号码没有关联客户标签,为了保证业务员自身的隐私性,会获取当前时间跟预设时间进行比较,预设时间默认设置为上班时间,也可以由业务员自定义设定,当当前时间处于预设时间内,系统则发送通话录音权限请求,业务员可根据实际情况确认是否录音,若当前时间不处于预设时间,则通话一般为业务员私人通话,因此,业务员可自主进行通话录音,在系统上选择性进行上传通话录音。
S2、获取通话结束信号,根据拨号设备型号识别相应的录音存储路径,根据录音存储路径将录音内容从拨号设备内存处上传至云平台。
其中,在业务员手机下载系统后,系统可在获得权限后自动识别业务员手机机型,根据不同手机机型即拨号设备型号,系统内部预设有相应的录音储存路径,系统也可通过在业务员进行信息录入时,通过登记的手机机型自动匹配到相应录音存储路径。在当通话结束,系统获取通话结束信号,即可根据拨号设备型号识别相应的录音存储路径,然后根据录音存储路径将录音内容从拨号设备内存处上传至云平台中。在另一实施例中,上传录音内容成功后,系统自动将该录音内容于拨号设备中进行删除,尽量降低业务员手机端的内存空间。
进一步的,参照图3,在步骤S2上传至云平台之前,还增设了步骤S020、S021:
S020、识别录音内容位于预设时间范围内的空白频段,对将空白频段进行删除。
S021、对录音内容进行降噪放大平滑处理,并对录音内容进行统一格式转换并压缩后上传。
其中,在将录音上传至云平台前,可对录音内容进行识别,将通话过程中长时间无人响应或者无对话的空白频段进行识别,设置预设时间范围是为了减少对答过程中合理停顿的误删。将空白频段删除后,在对录音内容音频进行降噪放大平滑处理,然后对录音内容进行统一的格式转换并进行压缩后上传。上述操作均可通过FFmpeg实现,FFmpeg提供了多种过滤器,“anlmdn”为降噪过滤器,可以去除背景噪音和杂音;“volume”过滤器可以按比例增加或减少音频的音量。
S3、对录音内容语音识别,获得文字通话信息。
具体的,在对录音内容上传后,可对录音内容进行语音识别,在本实施例中,语音识别的声学建模和语言建模可采用门控循环单元 (Gated Recurrent Unit, GRU),GRU具有结构更简单,参数数量更少,训练速度更快,在有限数据情况下具有良好的泛化性能的优点。
S4、对文字通话信息进行语义分析,确认是否存在目标内容,确认存在目标内容则触发生成预制表单。
在语音识别获得文字通话信息后,可对文字通话信息进行语义分析,确认是否存在有目标内容。具体的,业务员需要进行统一的话术培训,专门用来应对签单时,向客户再次发起确认,例如:在一句话内容全面涉及到货品名称、数量、金额等内容。因此,当存在签单时,可重点识别属于业务员的文字通话信息,确认是否存在有目标内容,若存在,则触发生成预制表单。该预制表单可将目标内容里头的信息填入表格内,其中,客户名称可根据通讯号码所属公司填入预制表单内。
S5、生成预制表单后触发抢单程序将预制表单发送至若干跟单员终端进行抢单。
具体的,生成预制表单后,可触发抢单程序,抢单程序中会对预制表单进行价值评估,进而评估出预制表单的等级,将预制表单发送至若干相应等级后续跟单的跟单员终端中,此设置可保证客户服务质量,尽量避免跟单员业务不熟练导致客户流失的情况。同时,设置抢单的形式可保证客源分配的平等性,提高员工的积极性,有利于企业管理。
S6、获取其中一跟单员终端抢单成功后发送的员工信息码,绑定员工信息码关联上录音内容。
在其中一跟单员抢单成功后,系统接收该员工信息码并将该员工关联上录音内容,以便于跟单员随时了解前期信息,更有利于跟单员后续的沟通。
进一步的,图4为本申请公开中步骤S3的一种可选实现方式流程图,参照图4,步骤S3具体包括以下步骤:
S30、对录音内容根据预设切片规则进行切片,获得若干切片内容,并对若干切片内容根据时间进行排序。
具体的,设置的预设切片规则可选用端点检测特征和或频谱特征和或能量特征进行识别切片。在对录音内容切成若干的切片内容后,对按照时间顺序对切片内容进行排序。
S31、对若干切片内容进行根据可改进语音识别模型进行语音识别,获得切片化的文字通话信息。
具体的,先对若干切片内容根据可改进语音识别模型进行语音识别,获得切片化的文字通话信息。在本实施例中,设置的可改进语音识别模型在未发生更新模型时为统一基础识别模型,例如GRU神经网络模型,然后在与客户交流过程中,根据客户的口音等问题,针对性进行改进模型,不同客户的可改进语音识别模型均不同,每个通讯号码关联一个可改进语音识别模型。
S32、其中,对若干切片内容的初步语音识别的精准度进行分值化。
具体的,精准度可通过识别反应平均时间特征进行评估,在对切片内容精准度进行分值化后,可有利于筛选出测试样本标签。
S33、未达到预设分值的切片内容根据可改进语音识别模型进行语音识别获得文字通话信息为预测文字信息,并对预测文字信息赋予标记。
S34、将标记的预测文字信息与时间排序在后且精准度达到预设分值的文字通话信息进行比较,获得可改进语音识别模型中的语言模型误差参数。
具体的,业务员在通话过程中对听不清的对话需要反复进行确认,因此,将最后一次精准度达到预设分值的文字通话信息进行比较,标记的预测文字信息作为测试样本标签,而最后一次精准度达到预设分值的文字通话信作为一个真实样本标签,即可获得得可改进语音识别模型中语言模型的误差参数。
若未存在符合时间排序在后且精准度达到预设分值的文字通话信息,则直接将标记的预测文字信息以及相关的切片内容进行存储即可,等需要更新模型时再发送给开发者终端。
S35、当标记次数达到预设次数,则可对发生更新模型需求至开发者终端。
具体的,当标记次数达到预设次数,即测试样本标签数量达到一定值时,即可触发更新模型需求到开发者终端,进行针对性的模型更新。
以上步骤有利于针对性对不同客户的声音进行语音识别,进而能够提高语音识别的精准度。
进一步的,参照图5,在步骤S30获得若干切片内容之后,还增设了步骤S300、S301:
S300、对切片内容进行音色识别,根据不同的音色识别出每个切片内容的所属身份分类,并对切片内容赋予身份标签信息,身份标签信息包括客户以及业务员。
具体的,每个声音均由基频和一系列谐波组成,而人们喉咙、口腔、鼻腔等声道的不同形状和大小会影响这些谐波的分布和强度,可根据频谱包络和或共振峰位置实现音色识别。其中,会预先对业务员进行信息补录时也对音色进行录取,从而分别出客户以及业务员的身份标签信息。
S301、其中,对步骤S33中的预测文字信息赋予标记步骤,进一步为对身份标签信息为客户的预测文字信息赋予标记。
该设置能够针对性对客户的录音内容进行抽取测试样本标签,进而能够专门对客户进行可改进语音识别模型的更新,排除掉将业务员的切片内容作为测试样本标签,有效避免重大误差,也可以有效减少运算量。
进一步的,参照图6,在步骤S300之后,还增设了步骤S3000、S3001 、S3002:
S3000、对所属身份分类为客户的若干切片内容进行数量统计。
S3001、对未达到预设分值且所属身份分类为客户的若干切片内容数量进行统计,计算出未到预设分值相比较于整体切片内容数量的占比值。
S3002、当占比值大于或者等于预设占比阈值时,则触发对身份标签信息为客户的预测文字信息赋予标记。
以上步骤中,设置的预设占比阈值能够给可改进语音识别模型增加一定的容错率,当占比值小于预设占比阈值,则无需进行标记操作,表明了准确率在识别的容错范围内,保证了准确率的同时能够进一步提高识别的运行效率。
图7为本申请公开中步骤S34的一种可选实现方式流程图,参照图7,步骤S34具体包括以下步骤:
S340、将标记的预测文字信息与时间排序在后且精准度达到预设分值的文字通话信息进行关联度匹配。
S341、筛选出关联度达到预设匹配值的若干文字通话信息,将时间顺序靠后文字通话信息作为真实样本标签。
S342、将标记的预测文字信息以及相关的切片内容与真实样本标签进行比较,记录可改进语音识别模型中的语言模型误差参数。
具体的,将预测文字信息跟时间排序在后且精准度达到预设分值的文字通话信息进行关联度匹配,筛选出匹配度高达预设匹配值的文字通话信息,然后才将时间顺序靠后文字通话信息作为真实样本标签,设置匹配值能够保证真实样本标签的准确率,选取时间顺序靠后文字通话信息是较为准确的命中该切片内容为业务员最后做出的确认,保证真实样本标签的准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本申请实施例还提供一种录音管理系统,该录音管理系统与实施例中录音管理方法一一对应。参照图8,该录音管理系统包括:权限获取模块1、录音上传模块2、语音识别模块3、语义分析模块4、生成抢单模块5以及信息关联模型6。各功能模块详细说明如下:
权限获取模块1:用于对即将连通通讯的通讯号码进行识别并根据预设识别规则获取录音权限;
录音上传模块2:用于获取通话结束信号,根据拨号设备型号识别相应的录音存储路径,根据录音存储路径将录音内容从拨号设备内存处上传至云平台;
语音识别模块3:用于对录音内容语音识别,获得文字通话信息;
语义分析模块4:用于对文字通话信息进行语义分析,确认是否存在目标内容,确认存在目标内容则触发生成预制表单;
生成抢单模块5:用于生成预制表单后触发抢单程序将预制表单发送至若干跟单员终端进行抢单;
信息关联模型6:用于获取其中一跟单员终端抢单成功后发送的员工信息码,绑定员工信息码关联上录音内容。
其中,系统可通过权限获取模块1对即将连通通讯的通讯号码进行识别并根据预设识别规则获取录音权限,并在获取通话结束信号后,根据拨号设备型号识别相应的录音存储路径,根据录音存储路径将录音内容从拨号设备内存处利用录音上传模块2上传至云平台,再利用语音识别模块3对录音内容语音识别,获得文字通话信息,并利用语义分析模块4对文字通话信息进行语义分析,确认是否存在目标内容,确认存在目标内容则触发生成预制表单,进而再要利用生成抢单模块5生成预制表单后触发抢单程序将预制表单发送至若干跟单员终端进行抢单,最后再利用信息关联模型6获取其中一跟单员终端抢单成功后发送的员工信息码,绑定员工信息码关联上录音内容。
关于录音管理系统的具体限定可参见上下文中对录音管理方法的限定,在此不再赘述。上述录音管理系统中的各模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于电子设备中的处理器中,也可以以软件形式存储于电子设备的存储器中,以便于处理器调用执行以上各模块对应的操作。
本实施例中,提供了一种电子设备,该电子设备是计算机。参照图9,该电子设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的数据库用于存储检测数据表。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种录音管理方法。
在一个实施例中,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
S1、对即将连通通讯的通讯号码进行识别并根据预设识别规则获取录音权限。
步骤S1具体包括以下步骤:
S10、将通讯号码进行识别,确认通讯号码是否关联客户标签。
S11、若通讯号码关联客户标签,则自动获得通话录音权限。
S11、若通讯号码没有关联客户标签,则获取当前时间与预设时间进行比较,当当前时间处于预设时间内,则发送通话录音权限请求。
S2、获取通话结束信号,根据拨号设备型号识别相应的录音存储路径,根据录音存储路径将录音内容从拨号设备内存处上传至云平台。
在步骤S2上传至云平台之前,还增设了步骤S020、S021:
S020、识别录音内容位于预设时间范围内的空白频段,对将空白频段进行删除。
S021、对录音内容进行降噪放大平滑处理,并对录音内容进行统一格式转换并压缩后上传。
S3、对录音内容语音识别,获得文字通话信息。
S4、对文字通话信息进行语义分析,确认是否存在目标内容,确认存在目标内容则触发生成预制表单。
S5、生成预制表单后触发抢单程序将预制表单发送至若干跟单员终端进行抢单。
S6、获取其中一跟单员终端抢单成功后发送的员工信息码,绑定员工信息码关联上录音内容。
步骤S4具体包括以下步骤:
S30、对录音内容根据预设切片规则进行切片,获得若干切片内容,并对若干切片内容根据时间进行排序。
S31、对若干切片内容进行根据可改进语音识别模型进行语音识别,获得切片化的文字通话信息。
S32、其中,对若干切片内容的初步语音识别的精准度进行分值化。
S33、未达到预设分值的切片内容根据可改进语音识别模型进行语音识别获得文字通话信息为预测文字信息,并对预测文字信息赋予标记。
S34、将标记的预测文字信息与时间排序在后且精准度达到预设分值的文字通话信息进行比较,获得可改进语音识别模型中的语言模型误差参数。
S35、当标记次数达到预设次数,则可对发生更新模型需求至开发者终端。
在步骤S30获得若干切片内容之后,还增设了步骤S300、S301:
S300、对切片内容进行音色识别,根据不同的音色识别出每个切片内容的所属身份分类,并对切片内容赋予身份标签信息,身份标签信息包括客户以及业务员。
S301、其中,对步骤S33中的预测文字信息赋予标记步骤,进一步为对身份标签信息为客户的预测文字信息赋予标记。
在步骤S300之后,还增设了步骤S3000、S3001 、S3002:
S3000、对所属身份分类为客户的若干切片内容进行数量统计。
S3001、对未达到预设分值且所属身份分类为客户的若干切片内容数量进行统计,计算出未到预设分值相比较于整体切片内容数量的占比值。
S3002、当占比值大于或者等于预设占比阈值时,则触发对身份标签信息为客户的预测文字信息赋予标记。
步骤S34具体包括以下步骤:
S340、将标记的预测文字信息与时间排序在后且精准度达到预设分值的文字通话信息进行关联度匹配。
S341、筛选出关联度达到预设匹配值的若干文字通话信息,将时间顺序靠后文字通话信息作为真实样本标签。
S342、将标记的预测文字信息以及相关的切片内容与真实样本标签进行比较,记录可改进语音识别模型中的语言模型误差参数。
本申请实施例还公开一种计算机可读存储介质,存储有能够被处理器加载并执行的计算机程序,该计算机程序被处理器执行时实现上述任一种录音管理方法的步骤,且能达到相同的效果。
其中,计算机可读存储介质例如包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,本说明书(包括摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或者具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
Claims (10)
1.一种录音管理方法,其特征在于,包括:
对即将连通通讯的通讯号码进行识别并根据预设识别规则获取录音权限;
获取通话结束信号,根据拨号设备型号识别相应的录音存储路径,根据录音存储路径将录音内容从拨号设备内存处上传至云平台;
对录音内容语音识别,获得文字通话信息;
对文字通话信息进行语义分析,确认是否存在目标内容,确认存在目标内容则触发生成预制表单;
生成预制表单后触发抢单程序将预制表单发送至若干跟单员终端进行抢单;
获取其中一跟单员终端抢单成功后发送的员工信息码,绑定所述员工信息码关联上录音内容。
2.根据权利要求1所述的方法,其特征在于,所述对拨号中的通讯号码根据预设识别规则获取录音权限的步骤,包括:
将通讯号码进行识别,确认通讯号码是否关联客户标签;
若通讯号码关联客户标签,则自动获得通话录音权限;
若通讯号码没有关联客户标签,则获取当前时间与预设时间进行比较,当当前时间处于预设时间内,则发送通话录音权限请求。
3.根据权利要求1所述的方法,其特征在于,所述上传至云平台的步骤之前,还包括:
识别录音内容位于预设时间范围内的空白频段,对将空白频段进行删除;
对录音内容进行降噪放大平滑处理,并对录音内容进行统一格式转换并压缩后上传。
4.根据权利要求1所述的方法,其特征在于,所述对录音内容语音识别,获得文字通话信息的步骤,包括:
对录音内容根据预设切片规则进行切片,获得若干切片内容,并对若干切片内容根据时间顺序进行排序;
对若干切片内容根据可改进语音识别模型进行语音识别,获得切片化的文字通话信息;
其中,对若干切片内容的初步语音识别的精准度进行分值化;
未达到预设分值的切片内容根据可改进语音识别模型进行语音识别获得文字通话信息为预测文字信息,并对预测文字信息赋予标记;
将标记的预测文字信息与时间排序在后且精准度达到预设分值的文字通话信息进行比较,获得可改进语音识别模型中的语言模型误差参数;
当标记次数达到预设次数,则可对发生更新模型需求至开发者终端。
5.根据权利要求4所述的方法,其特征在于,所述对录音内容根据预设切片规则进行切片,获得若干切片内容的步骤之后,还包括:
对切片内容进行音色识别,根据不同的音色识别出每个切片内容的所属身份分类,并对切片内容赋予身份标签信息,所述身份标签信息包括客户以及业务员;
其中,所述对预测文字信息赋予标记的步骤中,进一步为对所述身份标签信息为客户的预测文字信息赋予标记。
6.根据权利要求5所述的方法,其特征在于,所述对切片内容进行音色识别,根据不同的音色识别出每个切片内容的所属身份分类,并对切片内容赋予身份标签信息之后,还包括:
对所属身份分类为客户的若干切片内容进行数量统计;
对未达到预设分值且所属身份分类为客户的若干切片内容数量进行统计,计算出未到预设分值相比较于整体切片内容数量的占比值;
当占比值大于预设占比阈值时,则触发对所述身份标签信息为客户的预测文字信息赋予标记。
7.根据权利要求4所述的方法,其特征在于,所述将标记的预测文字信息与时间排序在后且精准度达到预设分值的文字通话信息进行比较,获得可改进语音识别模型中的语言模型误差参数的步骤,包括:
将标记的预测文字信息与时间排序在后且精准度达到预设分值的文字通话信息进行关联度匹配;
筛选出关联度达到预设匹配值的若干文字通话信息,将时间顺序靠后文字通话信息作为真实样本标签;
将标记的预测文字信息以及相关的切片内容与真实样本标签进行比较,记录可改进语音识别模型中的语言模型误差参数。
8.一种录音管理系统,其特征在于,包括:
权限获取模块(1):用于对即将连通通讯的通讯号码进行识别并根据预设识别规则获取录音权限;
录音上传模块(2):用于获取通话结束信号,根据拨号设备型号识别相应的录音存储路径,根据录音存储路径将录音内容从拨号设备内存处上传至云平台;
语音识别模块(3):用于对录音内容语音识别,获得文字通话信息;
语义分析模块(4):用于对文字通话信息进行语义分析,确认是否存在目标内容,确认存在目标内容则触发生成预制表单;
生成抢单模块(5):用于生成预制表单后触发抢单程序将预制表单发送至若干跟单员终端进行抢单;
信息关联模型(6):用于获取其中一跟单员终端抢单成功后发送的员工信息码,绑定所述员工信息码关联上录音内容。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1至7中任一种录音管理方法的计算机程序。
10.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1至7中任一种录音管理方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310523806.8A CN116708637B (zh) | 2023-05-09 | 2023-05-09 | 一种录音管理方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310523806.8A CN116708637B (zh) | 2023-05-09 | 2023-05-09 | 一种录音管理方法、系统、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116708637A true CN116708637A (zh) | 2023-09-05 |
CN116708637B CN116708637B (zh) | 2024-02-13 |
Family
ID=87822959
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310523806.8A Active CN116708637B (zh) | 2023-05-09 | 2023-05-09 | 一种录音管理方法、系统、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116708637B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116884437A (zh) * | 2023-09-07 | 2023-10-13 | 北京惠朗时代科技有限公司 | 基于人工智能的语音识别处理器 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050105381A (ko) * | 2004-04-30 | 2005-11-04 | 주식회사 부뜰정보시스템 | 개인용 텔레마케팅/전화상담 시스템 및 방법 |
CN109783338A (zh) * | 2019-01-02 | 2019-05-21 | 深圳壹账通智能科技有限公司 | 基于业务信息的录制处理方法、装置和计算机设备 |
CN110708430A (zh) * | 2019-10-18 | 2020-01-17 | 北京珠穆朗玛移动通信有限公司 | 一种通话管理方法、通信终端及存储介质 |
CN110990545A (zh) * | 2019-11-28 | 2020-04-10 | 重庆锐云科技有限公司 | 一种人工智能电话拓客营销管理系统、方法 |
CN112235470A (zh) * | 2020-09-16 | 2021-01-15 | 重庆锐云科技有限公司 | 基于语音识别的来电客户跟进方法、装置及设备 |
CN113743983A (zh) * | 2021-08-09 | 2021-12-03 | 太逗科技集团有限公司 | 一种基于安卓应用的电销管理方法、装置、设备、介质 |
WO2022071826A1 (ru) * | 2020-09-30 | 2022-04-07 | Общество С Ограниченной Ответственностью "Колл Инсайт" | Система и способ автоматизации обработки голосовых обращений |
CN115529384A (zh) * | 2021-06-25 | 2022-12-27 | 深圳市口袋网络科技有限公司 | 一种通话录音方法、装置、电子设备及存储介质 |
-
2023
- 2023-05-09 CN CN202310523806.8A patent/CN116708637B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050105381A (ko) * | 2004-04-30 | 2005-11-04 | 주식회사 부뜰정보시스템 | 개인용 텔레마케팅/전화상담 시스템 및 방법 |
CN109783338A (zh) * | 2019-01-02 | 2019-05-21 | 深圳壹账通智能科技有限公司 | 基于业务信息的录制处理方法、装置和计算机设备 |
CN110708430A (zh) * | 2019-10-18 | 2020-01-17 | 北京珠穆朗玛移动通信有限公司 | 一种通话管理方法、通信终端及存储介质 |
CN110990545A (zh) * | 2019-11-28 | 2020-04-10 | 重庆锐云科技有限公司 | 一种人工智能电话拓客营销管理系统、方法 |
CN112235470A (zh) * | 2020-09-16 | 2021-01-15 | 重庆锐云科技有限公司 | 基于语音识别的来电客户跟进方法、装置及设备 |
WO2022071826A1 (ru) * | 2020-09-30 | 2022-04-07 | Общество С Ограниченной Ответственностью "Колл Инсайт" | Система и способ автоматизации обработки голосовых обращений |
CN115529384A (zh) * | 2021-06-25 | 2022-12-27 | 深圳市口袋网络科技有限公司 | 一种通话录音方法、装置、电子设备及存储介质 |
CN113743983A (zh) * | 2021-08-09 | 2021-12-03 | 太逗科技集团有限公司 | 一种基于安卓应用的电销管理方法、装置、设备、介质 |
Non-Patent Citations (1)
Title |
---|
庞晓磊: "《电销客服系统的设计与实现》", 北京交通大学硕士专业学位论文, pages 11 - 57 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116884437A (zh) * | 2023-09-07 | 2023-10-13 | 北京惠朗时代科技有限公司 | 基于人工智能的语音识别处理器 |
CN116884437B (zh) * | 2023-09-07 | 2023-11-17 | 北京惠朗时代科技有限公司 | 基于人工智能的语音识别处理器 |
Also Published As
Publication number | Publication date |
---|---|
CN116708637B (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109618068B (zh) | 一种基于人工智能的语音业务推送方法、装置与系统 | |
CN116708637B (zh) | 一种录音管理方法、系统、电子设备及存储介质 | |
US8219404B2 (en) | Method and apparatus for recognizing a speaker in lawful interception systems | |
US20170111504A1 (en) | Evaluation of voice communications | |
CN106874134B (zh) | 工单类型的处理方法、装置及系统 | |
CN107222865A (zh) | 基于可疑行为识别的通讯诈骗实时检测方法和系统 | |
CN111640436B (zh) | 向坐席提供通话对象的动态客户画像的方法 | |
CN111192060A (zh) | 一种基于电力it服务全渠道自助应答实现方法 | |
CN111260102A (zh) | 一种用户满意度预测方法、装置、电子设备及存储介质 | |
CN110378712A (zh) | 一种投诉处理方法及装置 | |
CN111724908A (zh) | 基于机器人流程自动化rpa的疫情排查方法和装置 | |
CN105810205A (zh) | 一种语音处理方法及装置 | |
CN112925888A (zh) | 一种问答响应及小样本文本匹配模型的训练方法和装置 | |
CN110246503A (zh) | 黑名单声纹库构建方法、装置、计算机设备和存储介质 | |
CN113408846A (zh) | 一种基于ai人工智能的电话营销管理方法及系统 | |
CN112235470B (zh) | 基于语音识别的来电客户跟进方法、装置及设备 | |
CN110827829A (zh) | 一种基于语音识别的客流分析方法和系统 | |
CN112562644A (zh) | 基于人声分离的客服服务质检方法、系统、设备及介质 | |
CN109410934A (zh) | 一种基于声纹特征的多人声音分离方法、系统及智能终端 | |
CN111010484A (zh) | 一种通话录音自动质检方法 | |
CN111723205A (zh) | 会议纪要处理方法、装置及会议纪要处理设备 | |
CN117172795A (zh) | 一种智能化的技术服务费的在线咨询系统 | |
CN114710592B (zh) | 一种基于人工智能的呼叫系统及方法 | |
CN113573029A (zh) | 一种基于iot的多方音视频交互方法及系统 | |
JP7237381B1 (ja) | プログラム、情報処理システム及び情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |