CN113327593B - 用于语料获取的装置及方法、电子设备、可读存储介质 - Google Patents

用于语料获取的装置及方法、电子设备、可读存储介质 Download PDF

Info

Publication number
CN113327593B
CN113327593B CN202110570401.0A CN202110570401A CN113327593B CN 113327593 B CN113327593 B CN 113327593B CN 202110570401 A CN202110570401 A CN 202110570401A CN 113327593 B CN113327593 B CN 113327593B
Authority
CN
China
Prior art keywords
corpus
qualified
user information
data
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110570401.0A
Other languages
English (en)
Other versions
CN113327593A (zh
Inventor
徐世超
梁志婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Minglue Artificial Intelligence Group Co Ltd
Original Assignee
Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Minglue Artificial Intelligence Group Co Ltd filed Critical Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority to CN202110570401.0A priority Critical patent/CN113327593B/zh
Publication of CN113327593A publication Critical patent/CN113327593A/zh
Application granted granted Critical
Publication of CN113327593B publication Critical patent/CN113327593B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/64Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/65Clustering; Classification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及语音识别技术领域,公开一种用于语料获取的装置,包括:身份管理模块获取用户信息,话术调取模块根据用户信息分配话术数据给用户信息对应的用户终端,语料获取模块在分配话术数据后,获取用户终端反馈的语料,存储模块存储用户终端反馈的语料。这样,分配话术数据给用户信息对应的用户终端,能够实现为不同的用户分配其熟悉的话术数据,便于用户针对更熟悉的话术数据进行语料反馈,使得反馈的语料不易出错,且反馈的效率更高,提高了语料获取的效率及准确性,从而使得语料获取的效果更好。本申请还公开一种用于语料获取的方法、电子设备、可读存储介质。

Description

用于语料获取的装置及方法、电子设备、可读存储介质
技术领域
本申请涉及语音识别技术领域,例如涉及一种用于语料获取的装置及方法、电子设备、可读存储介质。
背景技术
目前,人们运用模型来解决问题越来越常见,但是使用模型前需要大量的数据进行模型训练,在训练特定话术的语音模型时,需要提供大量的话术语料数据。不同的用户对不同的话术数据的熟悉程度不同,因此用户在对不熟悉的话术数据进行语料反馈时,容易出错且效率低。
在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:现有技术中语料获取时没有为用户分配对应的话术数据,导致语料获取的效果不好。
发明内容
为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
本公开实施例提供了一种用于语料获取的装置及方法、电子设备、可读存储介质,以提高语料获取的效果。
在一些实施例中,用于语料获取的装置包括:身份管理模块,被配置为获取用户信息;话术调取模块,被配置为根据所述用户信息分配话术数据给所述用户信息对应的用户终端;语料获取模块,被配置为在分配话术数据后,获取所述用户终端反馈的语料;存储模块,被配置为存储所述语料。
在一些实施例中,用于语料获取的方法包括:获取用户信息;根据所述用户信息分配话术数据给所述用户信息对应的用户终端;在分配话术数据后,获取所述用户终端反馈的语料;存储所述语料。
在一些实施例中,电子设备包括:处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行上述的用于语料获取的方法。
在一些实施例中,可读存储介质,存储有可执行指令,所述可执行指令在运行时执行上述用于语料获取的方法。
本公开实施例提供了用于语料获取的装置及方法、电子设备、可读存储介质,可以实现以下技术效果:通过身份管理模块获取用户信息,话术调取模块根据用户信息分配话术数据给用户信息对应的用户终端,语料获取模块在分配话术数据后,获取用户终端反馈的语料,存储模块存储用户终端反馈的语料。这样,分配话术数据给用户信息对应的用户终端,能够实现为不同的用户分配其熟悉的话术数据,便于用户针对更熟悉的话术数据进行语料反馈,使得反馈的语料不易出错,且反馈的效率更高,提高了语料获取的效率及准确性,从而使得语料获取的效果更好。
以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
图1是本公开实施例提供的一个用于语料获取的装置的示意图;
图2是本公开实施例提供的一个用于语料获取的方法的示意图;
图3是本公开实施例提供的一个电子设备的示意图。
具体实施方式
为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
除非另有说明,术语“多个”表示两个或两个以上。
本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。
术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。
结合图1所示,本公开实施例提供一种用于语料获取的装置,包括身份管理模块101、话术调取模块102、语料获取模块103和存储模块104。身份管理模块101,被配置为获取用户信息;话术调取模块102,被配置为根据用户信息分配话术数据给用户信息对应的用户终端;语料获取模块103,被配置为在分配话术数据后,获取用户终端反馈的语料;存储模块104,被配置为存储用户终端反馈的语料。
采用本公开实施例提供的用于语料获取的装置,通过身份管理模块获取用户信息,话术调取模块根据用户信息分配话术数据给用户信息对应的用户终端,语料获取模块在分配话术数据后,获取用户终端反馈的语料,存储模块存储用户终端反馈的语料。这样,分配话术数据给用户信息对应的用户终端,能够实现为不同的用户分配其熟悉的话术数据,便于用户针对更熟悉的话术数据进行语料反馈,使得反馈的语料不易出错,且反馈的效率更高,提高了语料获取的效率及准确性,从而使得语料获取的效果更好。
可选地,用户终端反馈的语料为用户通过用户终端根据话术数据进行录音的音频文件。可选地,用户终端包括智能手机、平板、录音设备等。
可选地,身份管理模块被配置为获取用户输入的用户信息。可选的,用户信息包括:用户的姓名、部门、工作岗位等。
可选地,身份管理模块被配置为在预设的用户信息数据库中获取用户信息,用户信息数据库中存储有用户信息。
可选地,身份管理模块被配置为获取更改信息,根据更改信息调整用户信息数据库中的用户信息。在一些实施例中,根据更改信息调整用户信息数据库中的用户信息,包括:增加或减少用户信息数据库中的用户的姓名、部门、工作岗位等。
可选地,话术调取模块被配置为:在预设的话术数据库中匹配出用户信息对应的话术数据;话术数据库中存储有用户信息与话术数据之间的对应关系。话术调取模块被配置为将用户信息对应的话术数据发送给对应的用户终端,使得不同身份的用户在自己的用户终端查看到的匹配自己身份信息的话术数据,从而便于更准确的获取用户通过用户终端反馈的语料,提高了语料获取的效果。
在一些实施例中,话术数据为根据培训需求、业务需求、活动需求等进行设计的。话术数据库中存储的用户信息“投诉接待”对应的话术数据为“您好,请问有什么可以帮您”等;用户信息“门店迎宾”对应的话术数据为“欢迎光临”等迎宾类话术;用户信息“门店导购”对应的话术数据为“请随意挑选”等导购类话术、门店最新活动类话术等。
可选地,用于语料获取的装置还包括话术调整模块。话术调整模块被配置为获取调整信息,根据调整信息调整话术数据库中的话术数据。
可选地,话术调整模块被配置为获取用户输入的调整信息。可选地,调整信息包括:增加话术数据库中的话术数据、减少话术数据库中的话术数据,或,更改话术数据库中的话术数据与用户信息之间的对应关系。这样,可以根据用户的需求对话术数据进行调整,删掉过时的话术数据,增加新的话术数据,使分配的话术数据与用户信息更加匹配,从而获取反馈的语料不易出错,且反馈的效率更高,提高了语料获取的效率及准确性,使得语料获取的效果更好。
可选地,用于语料获取的装置还包括任务管理模块。任务管理模块被配置为获取用户信息对应的任务信息并发送任务信息给用户信息对应的用户终端。
可选地,任务信息包括语料获取量、语料获取完成时间等。例如:用户信息“门店导购”对应的任务信息为“在24小时内反馈10条语料”。则将“在24小时内反馈10条语料”的任务信息发送给该用户信息对应的用户终端。
可选地,语料获取模块被配置为:在分配话术数据后,根据任务信息获取用户终端反馈的语料。
在一些实施例中,用户信息“门店导购”对应的任务信息“在2小时内反馈2条语料”以及对应的话术数据“欢迎光临,请随意挑选”,语料获取模块在2个小时内获取用户终端反馈的2条语料“欢迎光临,请随意挑选”。
可选地,用于语料获取的装置还包括录音要求模块,录音要求模块被配置为在预设的录音要求数据库中匹配出话术数据对应的录音要求,录音要求数据库中存储有话术数据与录音要求之间的对应关系;发送录音要求给话术数据对应的用户终端。
在一些实施例中,用户信息“门店导购”对应的话术数据“欢迎光临,请随意挑选”,录音要求模块在预设的录音要求数据库中匹配出“欢迎光临,请随意挑选”对应的录音要求为“请在2秒至4秒间完成”,并将该录音要求“请在2秒至4秒间完成”发送给用户终端,以提示用户根据录音要求进行录音。
在企业进行语料收集的过程中,通过将用户信息对应的话术数据和任务信息等发送给对应的用户终端,便于员工根据用户终端获取匹配自己身份信息的任务信息和话术数据进行语料反馈,使得获取员工通过用户终端反馈的语料准确度更高,提高了获取语料的效果。同时,便于员工根据话术数据进行语料反馈来学习话术数据,并且便于企业通过语料反馈的情况统计员工的学习情况,并且用户通过用户终端进行语料反馈,在智能设备技术领域里实现了人机协同。
可选地,用于语料获取的装置还包括语料质检模块。语料质检模块被配置为对用户终端反馈的语料进行时长质检,将时长达标的语料确定为合格语料,将合格语料存储到存储模块中;对用户终端反馈的语料进行文本质检,获得语料文本质检结果。
可选地,用于语料获取的装置还包括提示信息模块,语料质检模块被配置为将时长不达标的语料确定为不合格语料,将不合格语料删除,并发送预设的提示信息给提示信息模块;提示信息模块被配置为接收语料质检模块发送的提示信息,并发送提示信息给对应的用户终端。
可选地,时长达标的语料包括时长在设定范围内的语料。例如,将时长在10秒至20秒之间的语料确定为合格语料。在一些实施例中,语料质检模块对用户终端反馈的语料“欢迎光临,请随意挑选”进行时长质检,该语料的时长为15秒,则该语料为合格语料。在一些实施例中,语料质检模块对用户终端反馈的语料“欢迎光临,请随意挑选”进行时长质检,该语料的时长为5秒,则该语料为不合格语料,将该不合格语料删除,并发送预设的提示信息“请重新录制”给提示信息模块;提示信息模块接收语料质检模块发送的“请重新录制”,并发送“请重新录制”给对应的用户终端。
可选地,将合格语料存储到存储模块中,包括:对合格语料进行用户信息标注,将带有用户信息标注的合格语料存储到存储模块。
在一些实施例中,将带有用户信息标注的合格语料存储到服务器。
可选地,语料质检模块被配置为对合格语料进行文本质检。
可选地,语料质检模块被配置为将合格语料转为语料文本;计算语料文本与对应的话术数据之间的相似度,将相似度确定为语料文本质检结果。
可选地,语料质检模块被配置为将合格语料转为语料文本;提取语料文本的关键词确定为第一关键词;提取语料文本对应的话术数据的关键词确定为第二关键词;计算第一关键词与第二关键词之间的重合度,将重合度确定为语料文本质检结果。
可选地,将合格语料转为语料文本,包括:通过ASR(Automatic SpeechRecognition,自动语音识别技术)将合格语料转为语料文本。
在一些实施例中,将获取的合格语料通过ASR技术转为语料文本“欢迎光临,随意挑选”,对应的话术数据“欢迎光临,请随意挑选”,计算语料文本“欢迎光临,随意挑选”与话术数据“欢迎光临,请随意挑选”之间的相似度,将该相似度确定为语料文本质检结果。
在一些实施例中,将获取的合格语料通过ASR技术转为语料文本“欢迎光临,随意挑选”,对应的话术数据“欢迎光临,请随意挑选”,提取语料文本“欢迎光临,随意挑选”对应的关键词“欢迎”,将“欢迎”确定为第一关键词,提取语料文本对应的话术数据“欢迎光临,请随意挑选”的关键词“欢迎”,将“欢迎”确定为第二关键词,第一关键词“欢迎”与第二关键词“欢迎”之间的重合度为100%,将重合度100%确定为语料文本质检结果。
可选地,语料质检模块还被配置为对用户终端反馈的语料进行语料质检。可选地,语料质检模块对用户终端反馈的语料进行分类和内容筛选,并通过质检团队进行语料质检。以保证语音质量。
可选地,用于语料获取的装置还包括任务结算模块。任务结算模块被配置为获取合格语料的数量,根据合格语料的数量和文本质检结果对语料进行评分。可选地,任务结算模块被配置为在进行评分后,根据评分发放奖励。这样,根据合格语料的数量和文本质检结果对语料进行评分,可以便于公司根据评分对员工进行奖励,以提升员工进行语料反馈的积极性,并且提高员工进行语料反馈的质量。
可选地,根据合格语料的数量和文本质检结果对语料进行评分,包括:通过公式(A*1/N+B*1/N……C*1/N)*N/E获得语料评分;其中,A为第一条合格语料文本与合格语料对应的话术数据之间的相似度;B为第二条合格语料文本与合格语料对应的话术数据之间的相似度;C为第N条合格语料文本与合格语料对应的话术数据之间的相似度;N为合格语料的数量;E为任务信息对应的语料获取量。
在一些实施例中,根据合格语料的数量和文本质检结果对语料进行评分,任务信息为在5小时内反馈3条语料,在5小时内语料获取模块获取到2条合格语料,第一条合格语料文本与合格语料对应的话术数据之间的相似度为80%,第二条合格语料文本与合格语料对应的话术数据之间的相似度为100%,对上述语料进行评分为(80%*1/2+100%*1/2)*2/3=0.6,则该语料的评分为0.6分。
在一些实施例中,在连锁美妆店的各门店要进行妇女节促销活动的情况下,需要各门店拥有不同身份信息的服务人员预先学习促销活动内容、促销活动的相关话术。通过话术调整模块,在话术数据库中的增加妇女节促销活动的导购类话术、迎宾类话术、商品促销话术等话术数据,并为新增的话术数据分配对应的用户信息。话术调取模块根据用户信息分别发放统一的进店欢迎词、导购商品介绍词、促销活动介绍词等话术数据给用户信息对应的用户终端,通过语料获取模块获取用户终端反馈的用户通过用户终端根据话术数据进行录音的音频文件,语料质检模块对用户终端反馈的音频文件进行时长质检,将时长达标的音频文件确定为合格语料,将合格语料存储到存储模块中,对用户终端反馈的音频文件进行文本质检,获得音频文件文本质检结果。通过任务结算模块根据合格语料的数量和文本质检结果对用户终端反馈的音频文件进行评分,根据评分对用户发放奖励。
在一些实施例中,通过身份管理模块获取用户信息为门店导购。话术调取模块根据门店导购,在预设的话术数据库中匹配出门店导购对应的话术数据包括“欢迎光临,请随意挑选”,“先生,我们这边也上了一些新款,我来帮您介绍”等。任务管理模块获取门店导购对应的任务信息,例如:在2小时内反馈2条语料。将“在2小时内反馈2条语料”的任务信息发送给门店导购对应的用户终端,语料获取模块,获取用户终端反馈的门店导购根据“欢迎光临,请随意挑选”和“先生,我们这边也上了一些新款,我来帮您介绍”的2条音频文件。语料质检模块对用户终端反馈的2条语料进行时长质检;在2条语料均为合格语料的情况下,将2条合格语料通过ASR(Automatic Speech Recognition,自动语音识别技术)转换成语料文本,获得第一条语料文本“欢迎光临,请随意挑选”和第二条语料文本“先生,我们这边也上了一些新款,我来帮您介绍”。将2条语料文本分别与对应的话术数据“欢迎光临,请随意挑选”和“先生,我们这边也上了一些新款,我来帮您介绍”计算相似度,获得第一条语料文本质检结果和第二条语料文本质检结果。
这样,通过身份管理模块获取用户信息,话术调取模块根据用户信息分配话术数据给用户信息对应的用户终端,语料获取模块在分配话术数据后,获取用户终端反馈的语料,存储模块存储用户终端反馈的语料。这样,分配话术数据给用户信息对应的用户终端,能够实现为不同的用户分配其熟悉的话术数据,便于用户针对更熟悉的话术数据进行语料反馈,使得反馈的语料不易出错,且反馈的效率更高,提高了语料获取的效率及准确性,从而使得语料获取的效果更好。
根据图2所示,本公开实施例提供一种用于语料获取的方法,包括:
步骤S201,获取用户信息;
步骤S202,根据用户信息分配话术数据给用户信息对应的用户终端;
步骤S203,在分配话术数据后,获取用户终端反馈的语料;
步骤S204,存储用户终端反馈的语料。
采用本公开实施例提供用于语料获取的方法,通过获取用户信息,根据用户信息分配话术数据给用户信息对应的用户终端,在分配话术数据后,获取用户终端反馈的语料,存储用户终端反馈的语料。这样,分配话术数据给用户信息对应的用户终端,能够实现为不同的用户分配其熟悉的话术数据,便于用户针对更熟悉的话术数据进行语料反馈,使得反馈的语料不易出错,且反馈的效率更高,提高了语料获取的效率及准确性,从而使得语料获取的效果更好。
可选地,获取用户信息,包括:获取用户输入的用户信息。可选的,用户信息包括:用户的姓名、部门、工作岗位等。
可选地,获取用户信息,包括:在预设的用户信息数据库中获取用户信息,用户信息数据库中存储用户信息。
可选地,根据用户信息分配话术数据给用户信息对应的用户终端,包括:在预设的话术数据库中匹配出用户信息对应的话术数据;话术数据库中存储有用户信息与话术数据之间的对应关系。
可选地,用于语料获取的方法,还包括:获取调整信息,根据调整信息调整话术数据库中的话术数据。
可选地,用于语料获取的方法,还包括:获取用户信息对应的任务信息并发送任务信息给用户信息对应的用户终端。
可选地,任务信息包括语料获取量、语料获取完成时间等。
可选地,在分配话术数据后,获取用户终端反馈的语料,包括:在分配话术数据后,根据任务信息获取用户终端反馈的语料。
可选地,用于语料获取的方法,还包括:对用户反馈的语料进行时长质检,将时长达标的语料确定为合格语料,将合格语料进行存储;对用户反馈的语料进行文本质检,获得语料文本质检结果。
可选地,对用户反馈的语料进行文本质检,包括:对合格语料进行文本质检。
可选地,对合格语料进行文本质检,获得语料文本质检结果,包括:将合格语料转为语料文本;计算语料文本与对应话术数据之间的相似度,将相似度确定为语料文本质检结果。
可选地,用于语料获取的方法,还包括:获取合格语料的数量,根据合格语料的数量和文本质检结果对语料进行评分。
在一些实施例中,在大型连锁门店企业,或者其他拥有大量员工的企业,为了保证服务质量,会给予员工大量的培训,在晨会、晚会通过用户终端下发预设话术数据让员工进行学习,从而达到培训员工的目的。同时企业在生产语音类产品时,可能会需要到大量的语音数据来进行语音类模型的训练。本公开实施例提供的用户语料获取的方法,根据用户信息分配话术数据给用户信息对应用户终端,通过用户终端的企业微信、钉钉等客户端向员工展示话术数据,员工根据接收到的话术数据通过佩戴录音设备或者手机录音进行语料反馈。获取反馈的语料,对反馈的语料进行时长质检和文本质检,将语料文本质检结果大于或等于设定阈值的合格语料确定为高质量的语音数据,用于进行语音处理模型训练。
结合图3所示,本公开实施例提供一种电子设备,包括处理器(processor)300和存储有程序指令的存储器(memory)301。可选地,该电子设备还可以包括通信接口(Communication Interface)302和总线303。其中,处理器300、通信接口302、存储器301可以通过总线303完成相互间的通信。通信接口302可以用于信息传输。处理器300可以调用存储器301中的程序指令,以执行上述实施例的用于语料获取的方法。
此外,上述的存储器301中的程序指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。
存储器301作为一种可读存储介质,可用于存储软件程序、可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器300通过运行存储在存储器301中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述实施例中用于语料获取的方法。
存储器301可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器301可以包括高速随机存取存储器,还可以包括非易失性存储器。
采用本公开实施例提供的电子设备,通过获取用户信息,根据用户信息分配话术数据给用户信息对应的用户终端,在分配话术数据后,获取用户终端反馈的语料,存储用户终端反馈的语料。这样,分配话术数据给用户信息对应的用户终端,能够实现为不同的用户分配其熟悉的话术数据,便于用户针对更熟悉的话术数据进行语料反馈,使得反馈的语料不易出错,且反馈的效率更高,提高了语料获取的效率及准确性,从而使得语料获取的效果更好。
可选地,电子设备为智能手机、平板等。
本公开实施例提供了一种可读存储介质,存储有可执行指令,可执行指令设置为执行上述用于语料获取的方法。
本公开实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述用于语料获取的方法。
上述的可读存储介质可以是暂态可读存储介质,也可以是非暂态可读存储介质。
本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且,本申请中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地,如在本申请中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本申请中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个…”限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

Claims (9)

1.一种用于语料获取的装置,其特征在于,包括:
身份管理模块,被配置为获取用户信息;所述用户信息为工作岗位;
话术调取模块,被配置为根据所述用户信息分配话术数据给所述用户信息对应的用户终端;
语料获取模块,被配置为在分配话术数据后,获取所述用户终端反馈的语料;
存储模块,被配置为存储所述语料;
任务结算模块,被配置为获取合格语料的数量,根据所述数量和文本质检结果对所述语料进行评分;根据合格语料的数量和文本质检结果对语料进行评分,包括:通过公式(A*1/N+B*1/N……C*1/N)*N/E获得语料评分;其中,A为第一条合格语料文本与合格语料对应的话术数据之间的相似度;B为第二条合格语料文本与合格语料对应的话术数据之间的相似度;C为第N条合格语料文本与合格语料对应的话术数据之间的相似度;N为合格语料的数量;E为任务信息对应的语料获取量。
2.根据权利要求1所述的装置,其特征在于,话术调取模块,被配置为:
在预设的话术数据库中匹配出所述用户信息对应的话术数据;所述话术数据库中存储有用户信息与话术数据之间的对应关系。
3.根据权利要求2所述的装置,其特征在于,所述装置还包括:
话术调整模块,被配置为获取调整信息,根据所述调整信息调整所述话术数据库中的话术数据。
4.根据权利要求1所述的装置,其特征在于,所述装置还包括:
任务管理模块,被配置为获取所述用户信息对应的任务信息并发送所述任务信息给所述用户信息对应的用户终端。
5.根据权利要求1至4任一项所述的装置,其特征在于,所述装置还包括:
语料质检模块,被配置为对所述用户终端反馈的语料进行时长质检,将时长达标的语料确定为合格语料,将所述合格语料存储到所述存储模块中;对所述用户终端反馈的语料进行文本质检,获得语料文本质检结果。
6.一种用于语料获取的方法,其特征在于,包括:
获取用户信息;所述用户信息为工作岗位;
根据所述用户信息分配话术数据给所述用户信息对应的用户终端;
在分配话术数据后,获取所述用户终端反馈的语料;
存储所述语料;
获取合格语料的数量,根据所述数量和文本质检结果对所述语料进行评分;
根据合格语料的数量和文本质检结果对语料进行评分,包括:通过公式(A*1/N+B*1/N……C*1/N)*N/E获得语料评分;其中,A为第一条合格语料文本与合格语料对应的话术数据之间的相似度;B为第二条合格语料文本与合格语料对应的话术数据之间的相似度;C为第N条合格语料文本与合格语料对应的话术数据之间的相似度;N为合格语料的数量;E为任务信息对应的语料获取量。
7.根据权利要求6所述的方法,其特征在于,根据所述用户信息分配话术数据给所述用户信息对应的用户终端,包括:
在预设的话术数据库中匹配出所述用户信息对应的话术数据;所述话术数据库中存储有用户信息与话术数据之间的对应关系。
8.一种电子设备,其特征在于,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在执行所述程序指令时,执行如权利要求6至7任一项所述的用于语料获取的方法。
9.一种可读存储介质,存储有可执行指令,其特征在于,所述可执行指令在运行时执行如权利要求6至7任一项所述的用于语料获取的方法。
CN202110570401.0A 2021-05-25 2021-05-25 用于语料获取的装置及方法、电子设备、可读存储介质 Active CN113327593B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110570401.0A CN113327593B (zh) 2021-05-25 2021-05-25 用于语料获取的装置及方法、电子设备、可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110570401.0A CN113327593B (zh) 2021-05-25 2021-05-25 用于语料获取的装置及方法、电子设备、可读存储介质

Publications (2)

Publication Number Publication Date
CN113327593A CN113327593A (zh) 2021-08-31
CN113327593B true CN113327593B (zh) 2024-04-30

Family

ID=77416696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110570401.0A Active CN113327593B (zh) 2021-05-25 2021-05-25 用于语料获取的装置及方法、电子设备、可读存储介质

Country Status (1)

Country Link
CN (1) CN113327593B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105162892A (zh) * 2015-10-15 2015-12-16 戚克明 话术练习处理方法、装置及系统,话术练习监督方法
CN108735209A (zh) * 2018-04-28 2018-11-02 广东美的制冷设备有限公司 唤醒词绑定方法、智能设备及存储介质
CN108764671A (zh) * 2018-05-16 2018-11-06 山东师范大学 一种基于自建语料库的创造能力评测方法和装置
CN109150700A (zh) * 2018-09-06 2019-01-04 北京云测信息技术有限公司 一种数据采集的方法及装置
CN110347863A (zh) * 2019-06-28 2019-10-18 腾讯科技(深圳)有限公司 话术推荐方法和装置及存储介质
CN110675863A (zh) * 2018-07-03 2020-01-10 上海智臻智能网络科技股份有限公司 语音语料生成方法及装置、语音识别方法及装置
CN110728133A (zh) * 2019-12-19 2020-01-24 北京海天瑞声科技股份有限公司 个性语料获取方法及个性语料获取装置
CN110858819A (zh) * 2019-08-16 2020-03-03 杭州智芯科微电子科技有限公司 基于微信小程序的语料收集方法、装置和计算机设备
CN112233690A (zh) * 2020-12-21 2021-01-15 北京远鉴信息技术有限公司 双录方法、装置、终端及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105162892A (zh) * 2015-10-15 2015-12-16 戚克明 话术练习处理方法、装置及系统,话术练习监督方法
CN108735209A (zh) * 2018-04-28 2018-11-02 广东美的制冷设备有限公司 唤醒词绑定方法、智能设备及存储介质
CN108764671A (zh) * 2018-05-16 2018-11-06 山东师范大学 一种基于自建语料库的创造能力评测方法和装置
CN110675863A (zh) * 2018-07-03 2020-01-10 上海智臻智能网络科技股份有限公司 语音语料生成方法及装置、语音识别方法及装置
CN109150700A (zh) * 2018-09-06 2019-01-04 北京云测信息技术有限公司 一种数据采集的方法及装置
CN110347863A (zh) * 2019-06-28 2019-10-18 腾讯科技(深圳)有限公司 话术推荐方法和装置及存储介质
CN110858819A (zh) * 2019-08-16 2020-03-03 杭州智芯科微电子科技有限公司 基于微信小程序的语料收集方法、装置和计算机设备
CN110728133A (zh) * 2019-12-19 2020-01-24 北京海天瑞声科技股份有限公司 个性语料获取方法及个性语料获取装置
CN112233690A (zh) * 2020-12-21 2021-01-15 北京远鉴信息技术有限公司 双录方法、装置、终端及存储介质

Also Published As

Publication number Publication date
CN113327593A (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
CN107807960B (zh) 智能客服方法、电子装置及计算机可读存储介质
EP3451328A1 (en) Method and apparatus for verifying information
US7415409B2 (en) Method to train the language model of a speech recognition system to convert and index voicemails on a search engine
US20200349920A1 (en) Organizational-based language model generation
CN104850546A (zh) 移动媒介信息的展示方法和系统
CN110809095A (zh) 语音外呼的方法和装置
US20170060841A1 (en) Text Extraction
CN104915359A (zh) 主题标签推荐方法及装置
CN111353065A (zh) 语音档案存储方法、装置、设备以及计算机可读存储介质
US20160171093A1 (en) Email mining system
CN103177039A (zh) 一种数据处理方法及装置
CN110650250A (zh) 语音对话的处理方法、系统、设备和存储介质
CN113378583A (zh) 对话回复方法及装置、对话模型训练方法及装置、存储介质
CN112328905A (zh) 线上营销内容推送方法、装置、计算机设备及存储介质
CN108876438A (zh) 一种智能化手机广告推送方法
CN111737443A (zh) 答案文本的处理方法和装置、关键文本的确定方法
CN113641838A (zh) 用于数据标注的装置及方法、电子设备、可读存储介质
CN113327593B (zh) 用于语料获取的装置及方法、电子设备、可读存储介质
CN109145092B (zh) 一种数据库更新、智能问答管理方法、装置及其设备
CN108549722B (zh) 多平台数据发布方法、系统及介质
CN104240107A (zh) 社群数据筛选系统及其方法
WO2021051874A1 (zh) 一种信息推送方法和相关装置
CN114242047A (zh) 一种语音处理方法、装置、电子设备及存储介质
CN113641908B (zh) 课程推送方法、装置、服务器和计算机存储介质
CN110931014A (zh) 基于正则匹配规则的语音识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant