CN116484809A - 基于人工智能的文本处理方法及装置 - Google Patents

基于人工智能的文本处理方法及装置 Download PDF

Info

Publication number
CN116484809A
CN116484809A CN202310472264.6A CN202310472264A CN116484809A CN 116484809 A CN116484809 A CN 116484809A CN 202310472264 A CN202310472264 A CN 202310472264A CN 116484809 A CN116484809 A CN 116484809A
Authority
CN
China
Prior art keywords
text
correction
processing
initial
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310472264.6A
Other languages
English (en)
Inventor
侯昶宇
王俊
王晓锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202310472264.6A priority Critical patent/CN116484809A/zh
Publication of CN116484809A publication Critical patent/CN116484809A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种基于人工智能的文本处理方法及装置,涉及信息处理技术领域及人工智能领域、医疗服务领域,主要目的在于解决对语音转译文本校正处理的准确性较低的问题。主要包括获取待处理的初始文本,并对所述初始文本进行去重处理得到去重处理后的初始文本,所述初始文本为客服坐席的通话记录转译文本;基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本;对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果。主要用于处理客服坐席的通话语音转译文本。

Description

基于人工智能的文本处理方法及装置
技术领域
本发明涉及一种信息处理领域及人工智能领域、医疗服务领域,特别是涉及一种基于人工智能的文本处理方法及装置。
背景技术
语音识别技术(Automatic Speech Recognition)是一个多学科交叉的领域,与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连,其目的是将人的语音转换为文本。目前的语音识别技术受现有软件、硬件的发展状况的限制,如词汇表大小、语音复杂性、说话人数、硬件设备等,无法直接生成为人们所使用的文本,而是需要在语音转译到文本之后,对转译文本进行数据纠错和修改等处理,以得到能够供下游业务所使用的文本。
现有对于转译文本进行处理的方法,是通过模型对转译文本中单个字词的置信度进行打分,对置信度低于阈值的字词修改内容的调整,但该方法只能在错误类型比较单一的场景下应用,当面临复杂的语音识别场景,例如,保险客服坐席的语音识别场景等,该方法仅能够对同音词的错误进行纠正处理,而无法解决字词重复、字词丢失等问题,导致纠正处理后的转译文本的准确性仍然较低,进而影响下游任务,例如,在保险客服坐席的话术导航构建的应用场景下,纠正后的文本准确性较低将无法满足保险客服坐席的话术导航信息的构建。
发明内容
有鉴于此,本发明提供一种基于人工智能的文本处理方法及装置,主要目的在于现有对语音转译文本校正处理的准确性较低的问题。
依据本发明一个方面,提供了一种基于人工智能的文本处理方法,包括:
获取待处理的初始文本,并对所述初始文本进行去重处理得到去重处理后的初始文本,所述初始文本为客服坐席的通话记录转译文本;
基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本;
对所述目标文本进行文本分类处理,对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果。
进一步地,所述已完成训练的文本校正网络模型包括校正分类网络、语言生成网络,所述基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本包括:
利用所述校正分类网络对所述去重处理后的初始文本中每个字词进行校正分类预测处理,确定每个所述字词的校正类型;
基于所述字词的校正类型,利用所述语言生成网络对所述字词进行校正处理,得到所述初始文本的目标文本。
进一步地,所述校正类型至少包括待增加类型、待删除类型、待修正类型、保持类型中的一个,所述基于所述字词的校正类型,利用所述语言生成网络对所述字词进行校正处理,得到所述初始文本的目标文本包括:
若所述校正类型为所述待增加类型,则对所述字词的上文或下文位置进行第一掩蔽处理,则利用所述语言生成网络对第一掩蔽处理位置的内容进行预测处理,并将预测处理结果更新至所述第一掩蔽处理位置;
若所述校正类型为所述待修正类型,则对所述字词的位置进行第二掩蔽处理,并利用所述语言生成网络对第二掩蔽处理位置的内容进行预测处理,并将预测处理结果更新至所述第二掩蔽处理位置;
若所述校正类型为所述待删除类型,则对所述校正类型所对应的字词进行删除处理。
进一步地,所述对所述初始文本进行去重处理得到去重处理后的初始文本包括:
利用正则规则对所述初始文本进行标点去除处理;
基于不同字词长度的词袋模型分别对标点去除处理后的初始文本进行去重处理;
利用正则规则对所述去重处理的结果进行标点恢复处理,得到去重处理后的初始文本。
进一步地,所述基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本之前,所述方法还包括:
获取训练样本集,并构建包括校正分类网络、语言生成网络的初始文本校正网络模型,所述训练样本集包括对一段字词序列中的不同字词分别进行校正类型标记的多个训练样本,以及对一段字词序列中的同一字词标记有不同校正类型的多个训练样本;
基于所述训练样本集对所述初始文本校正网络模型进行训练,得到已完成训练的文本校正网络模型。
进一步地,所述基于所述训练样本集对所述初始文本校正网络模型进行训练,得到已完成训练的文本校正网络模型包括:
利用所述初始文本校正网络模型的校正分类网络对所述训练样本中的每个字词进行校正分类预测处理,得到标记有预测校正类型的训练样本;
利用所述初始文本校正网络模型的语言生成网络对所述标记有预测校正类型的训练样本进行掩蔽处理,并对掩蔽处理的位置进行预测处理,得到所述训练样本的校正处理结果;
基于所述训练样本的校正处理结果及与所述训练样本对应的正样本确定损失函数,以基于所述损失函数完成对所述初始文本校正网络模型的训练。
进一步地,所述文本分类结果至少包括一种通话业务类型的拆分文本,所述对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果之后,所述方法还包括:
调取与所述通话业务类型对应的文本信息提取模型,所述文本信息提取模型为基于对应所述通话业务类型的信息提取训练样本集训练得到的;
基于所述文本信息提取模型对所述拆分文本进行文本信息提取,得到与所述通话业务类型对应的话术导航信息。
依据本发明另一个方面,提供了一种基于人工智能的文本处理装置,包括:
获取模块,用于获取待处理的初始文本,并对所述初始文本进行去重处理得到去重处理后的初始文本,所述初始文本为客服坐席的通话记录转译文本;
校正处理模块,用于基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本;
分类处理模块,用于对所述目标文本进行文本分类处理,对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果。
进一步地,所述校正处理模块包括:
第一处理单元,用于利用所述校正分类网络对所述去重处理后的初始文本中每个字词进行校正分类预测处理,确定每个所述字词的校正类型;
第二处理单元,用于基于所述字词的校正类型,利用所述语言生成网络对所述字词进行校正处理,得到所述初始文本的目标文本。
进一步地,在具体应用场景中,所述第二处理单元具体用于若所述校正类型为所述待增加类型,则对所述字词的上文或下文位置进行第一掩蔽处理,则利用所述语言生成网络对第一掩蔽处理位置的内容进行预测处理,并将预测处理结果更新至所述第一掩蔽处理位置;若所述校正类型为所述待修正类型,则对所述字词的位置进行第二掩蔽处理,并利用所述语言生成网络对第二掩蔽处理位置的内容进行预测处理,并将预测处理结果更新至所述第二掩蔽处理位置;若所述校正类型为所述待删除类型,则对所述校正类型所对应的字词进行删除处理。
进一步地,所述获取模块包括:
第三处理单元,用于利用正则规则对所述初始文本进行标点去除处理;
第四处理单元,用于基于不同字词长度的词袋模型分别对标点去除处理后的初始文本进行去重处理;
第五处理单元,用于利用正则规则对所述去重处理的结果进行标点恢复处理,得到去重处理后的初始文本。
进一步地,所述装置还包括:
构建模块,用于获取训练样本集,并构建包括校正分类网络、语言生成网络的初始文本校正网络模型,所述训练样本集包括对一段字词序列中的不同字词分别进行校正类型标记的多个训练样本,以及对一段字词序列中的同一字词标记有不同校正类型的多个训练样本;
训练模块,用于基于所述训练样本集对所述初始文本校正网络模型进行训练,得到已完成训练的文本校正网络模型。
进一步地,所述训练模块包括:
第六处理单元,用于利用所述初始文本校正网络模型的校正分类网络对所述训练样本中的每个字词进行校正分类预测处理,得到标记有预测校正类型的训练样本;
第七处理单元,用于利用所述初始文本校正网络模型的语言生成网络对所述标记有预测校正类型的训练样本进行掩蔽处理,并对掩蔽处理的位置进行预测处理,得到所述训练样本的校正处理结果;
训练单元,用于基于所述训练样本的校正处理结果及与所述训练样本对应的正样本确定损失函数,以基于所述损失函数完成对所述初始文本校正网络模型的训练。
进一步地,所述装置还包括:
调取模块,用于调取与所述通话业务类型对应的文本信息提取模型,所述文本信息提取模型为基于对应所述通话业务类型的信息提取训练样本集训练得到的;
提取模块,用于基于所述文本信息提取模型对所述拆分文本进行文本信息提取,得到与所述通话业务类型对应的话术导航信息。
根据本发明的又一方面,提供了一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述基于人工智能的文本处理方法对应的操作。
根据本发明的再一方面,提供了一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述基于人工智能的文本处理方法对应的操作。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明提供了一种基于人工智能的文本处理方法及装置,首先获取待处理的初始文本,并对所述初始文本进行去重处理得到去重处理后的初始文本,所述初始文本为客服坐席的通话记录转译文本;基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本;对所述目标文本进行文本分类处理,对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果。与现有技术相比,本发明实施例通过对初始文本进行校正分类预测处理,并对需要进行不同类型校正的字词进行校正处理,能够实现对文本中多种校正类型的字词的全面校正,大大增加了字词校正的校正类型范围,使文本校正更为全面,从而有效提升文本校正的准确性。此外,基于校正处理后的目标文本进行保险客服坐席话术导航信息的构建,也能够有效保证信息构建的准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种基于人工智能的文本处理方法流程图;
图2示出了本发明实施例提供的另一种基于人工智能的文本处理方法流程图;
图3示出了本发明实施例提供的又一种基于人工智能的文本处理方法流程图;
图4示出了本发明实施例提供的一种基于人工智能的文本处理装置组成框图;
图5示出了本发明实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(AI:Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
针对现有对于转译文本进行处理的方法,是通过模型对转译文本中单个字词的置信度进行打分,对置信度低于阈值的字词修改内容的调整,但该方法只能在错误类型比较单一的场景下应用,当面临复杂的语音识别场景,例如,保险客服坐席的语音识别场景等,该方法仅能够对同音词的错误进行纠正处理,而无法解决字词重复、字词丢失等问题,导致处理后的转译文本的准确率仍然较低。本发明实施例提供了一种基于人工智能的文本处理方法,如图1所示,以该方法应用于服务器等计算机设备为例进行说明,其中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN:Content Delivery Network)、以及大数据和人工智能平台等基础云计算服务的云服务器,如智能医疗系统、数字医疗平台等。该方法包括:
101、获取待处理的初始文本,并对所述初始文本进行去重处理得到去重处理后的初始文本。
本发明实施例中,初始文本为客服坐席的通话记录转译文本。客服坐席可以为保险客服坐席,也可以为医疗咨询服务客服坐席,本发明实施例不做具体限定。在保险客服坐席的应用场景下,通话记录为保险客服坐席人员与来电沟通保险业务的客户的通话录音,保险客服坐席可以为任一保险行业的保险客服坐席,如车险客服坐席、财产保险客服坐席、寿险客服坐席等,本发明实施例不做具体限定。通话记录转译文本为基于语音识别策略对通话录音进行语音识别得到的文本。由于客服坐席人员的经验水平参差不齐,为了使不同经验水平及应对能力客服坐席人员都能够准确的解答客户的咨询问题及服务需求,需要在客服坐席人员与客户沟通过程中,基于话术导航信息对保险客服坐席人员进行话术导航,而保险客服坐席人员与来电沟通客户的通话录音转译文本可以作为生成或提取话术导航信息的数据基础,因此,需要获取保险客服坐席的通话记录转译文本。在得到初始文本之后,由于保险客服坐席通话内容中包含大量的保险领域专有名词,如险种名称、保险条款专有名词等,以及大量的数字信息,如报价、身份信息核验、记录联系方式等,导致基于语音识别策略直接转译得到的初始文本中包含大量的字词重复、字词丢失、文字转录错误等错误情况,因此,需要针对初始文本中不同的错误情况进行校正处理,以得到准确的通话记录文本内容。具体地,首先针对初始文本中明显重复的字词进行去重处理,例如“恩,对的,恩对的”去重处理后得到“恩,对的”。
此外,在医疗咨询服务客服坐席的应用场景下,通话记录为医疗咨询服务客服坐席人员与来电沟通医疗咨询服务业务的客户的通话录音。医疗咨询服务客服坐席可以为任一关于医疗咨询的客服坐席,如预约问诊咨询客服坐席、线上问诊导航咨询客服坐席等。
102、基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本。
本发明实施例中,在得到去重处理后的初始文本之后,利用已完成训练的文本校正网络模型对去重处理后的初始文本中的每个字词进行校正分类预测,以确定每个字词需要处理的校正类型,进而针对不同的校正类型进行校正处理,例如,分类预测到当前字词的前面需要插入文字,则根据上下文预测需要插入的文字,并将预测结果插入到此字词的前面,以完成对当前字词的校正处理,从而得到完成字词校正处理的初始文本,即目标文本。
需要说明的是,针对初始文本中每个字词需要校正的类型进行预测,并基于校正类型有针对性的进行校正处理,能够更加准确、全面的识别出初始文本中需要进行校正的内容,同时,保证校正处理的精准度,从而实现对初始文本的全面、准确的校正。
103、对所述目标文本进行文本分类处理,对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果。
本发明实施例中,由于客服坐席人员与来电沟通保险业务的客户的通话内容存在包含多种通话服务类型的情况,例如,客户来电的初始意图为投诉,但在险客服坐席人员的解释及建议下,客户对另一险种进行了咨询,即此次通话内容中包含了客诉服务及产品咨询服务两个服务类型。因此,在得到目标文本之后,基于文本分类预测模型对目标文本中的每个字词序列进行校正分类预测处理,以确定每个字词序列所对应的通话服务类型,以便于后续话术导航信息的构建。其中,文本分类预测模型为基于对应不同通话服务类型的历史通话记录文本构件的训练样本集训练得到的,其基础模型可以为基于门控循环单元(GRU:Gated Recurrent Unit)的序列编码器,也可以为其他能够用于文本分类预测的网络模型,本发明实施例不做具体限定。
需要说明的是,基于文本分类结果进行话术导航信息构建,可以基于文本分类结果进行信息提取,以得到能够用于话术导航的信息;也可以基于文本分类结果构建用于训练话术生成模型的训练样本,以得到能够应用于保险客服坐席话术导航的话术生成模型。由于目标文本是对初始文本进行去重处理及全面校正处理后的文本,具有较高的准确性,因此,基于目标文本进行文本分类及话术导航信息构建,能够有效保证话术导航信息的准确性。
在一个本发明实施例中,为了进一步说明及限定,如图2所示,步骤所述基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本包括:
201、利用所述校正分类网络对所述去重处理后的初始文本中每个字词进行校正分类预测处理,确定每个所述字词的校正类型。
202、基于所述字词的校正类型,利用所述语言生成网络对所述字词进行校正处理,得到所述初始文本的目标文本。
本发明实施例中,已完成训练的文本校正网络模型包括校正分类网络、语言生成网络。由于现有的文本纠错方法对文本中各个字词进行打分的方式,较难发现文本中的字词缺失、以及多余字词的存在,因此,采用分类预测的方式,基于校正分类网络对文本中每个字词的校正类型进行预测,即预测当前字词是否需要校正处理,若需要校正,需要进行何种类型的校正处理,以实现对初始文本中全部待校正字词的识别。并对待校正字词进行校正处理。例如,分类预测后的初始文本中包括校正类型为保持类型的字词、待删除类型的字词、待增加类型的字词,则不对保持类型的字词做任何处理;对待删除类型的字词进行删除处理;对待增加类型的字词,根据待增加字词的位置,如当前字词的前面或后面,利用语言生成网络对该位置的内容进行预测,并将预测得到的字词插入到对应位置,以完成对当前字词的校正处理。
需要说明的是,通过对文本找那个不同校正类型的字词进行分类预测,能够识别出文本中存在错误的内容,避免仅对已存在的字词打分而导致无法识别到字词缺失、存在多余字词的情况,大大提升错误内容识别的全面性,同时,有针对性的对不同校正类型进行内容预测及生成,能够保证校正处理的准确性,从而有效保证得到的目标文本的准确性。
在一个本发明实施例中,为了进一步说明及限定,步骤所述基于所述字词的校正类型,利用所述语言生成网络对所述字词进行校正处理,得到所述初始文本的目标文本包括:
若所述校正类型为所述待增加类型,则对所述字词的上文或下文位置进行第一掩蔽处理,则利用所述语言生成网络对第一掩蔽处理位置的内容进行预测处理,并将预测处理结果更新至所述第一掩蔽处理位置。
若所述校正类型为所述待修正类型,则对所述字词的位置进行第二掩蔽处理,并利用所述语言生成网络对第二掩蔽处理位置的内容进行预测处理,并将预测处理结果更新至所述第二掩蔽处理位置。
若所述校正类型为所述待删除类型,则对所述校正类型所对应的字词进行删除处理。
本发明实施例中,校正类型至少包括待增加类型、待删除类型、待修正类型、保持类型中的一个。在确定去重处理后的初始文本中每个字词所对应的校正类型之后,若校正类型为待增加类型,表明需要对当前字词的上下文位置的内容进行预测,则将此位置(第一掩蔽处理位置)用[MASK]替换,进而利用语言预测网络对第一掩蔽处理位置的内容进行预测处理,生成预测字词,即预测处理结果,并将第一掩蔽处理位置上的[MASK]替换为预测字词,以完成对第一掩蔽处理位置的校正处理。若校正类型为所述待修正类型,表明当前字词存在错误,需要对当前字词所在位置的内容进行重新预测,则将此位置(第二掩蔽处理位置)用[MASK]替换,进而利用语言预测网络对第掩蔽处理位置的内容进行预测处理,并将第一掩蔽处理位置上的[MASK]替换为预测得到的字词,以完成对第二掩蔽处理位置的校正处理。
在一个本发明实施例中,为了进一步说明及限定,步骤所述对所述初始文本进行去重处理得到去重处理后的初始文本包括:
利用正则规则对所述初始文本进行标点去除处理;
基于不同字词长度的词袋模型分别对标点去除处理后的初始文本进行去重处理;
利用正则规则对所述去重处理的结果进行标点恢复处理,得到去重处理后的初始文本。
本发明实施例中,由于保险客服坐席的工作环境、客户通话环境及设备等原因,通话记录中往往会存在环境噪声、回音等干扰内容,从而导致初始文本中存在大量重复的无效信息,因此,先基于正则规则对初始文本中的标点符号进行去除,再基于不同字词长度的词袋模型(n-gram)对初始文本进行多轮循环的文本去除处理。例如,基于2-gram模型对去除标点后的初始文本中的字词序列,按照2个字词长度进行分组划分得到多个第一分组,并对第一分组进行去重;进而基于3-gram模型对去除标点后的初始文本中的字词序列,按照3个字词长度进行分组划分得到多个第二分组,并对第一分组进行去重,以此类推,并在去重完成之后,基于正则规则向去重处理的结果中添加标点符号,以得到去重处理后的初始文本。其中,词袋模型的字词长度定义,及去重处理的循环处理次数可以根据具体应用需求自定义,本发明实施例不做具体限定。
在一个本发明实施例中,为了进一步说明及限定,如图3所示,步骤所述基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本之前,所述方法还包括:
301、获取训练样本集,并构建包括校正分类网络、语言生成网络的初始文本校正网络模型。
302、基于所述训练样本集对所述初始文本校正网络模型进行训练,得到已完成训练的文本校正网络模型。
本发明实施例中,初始文本校正网络模型的基础模型为预训练语言模型(Macbert:MLM as correction BERT),Macbert模型是基于BERT模型进行改进的掩码策略,实现对数据的动态掩蔽。对初始文本校正网络模型的预训练过程采用n-gram mask,首先按比例掩蔽1~4gram,如,1~4gram依次按照40%,30%,20%,10%的比例,本发明实施例不做具体限定,然后按照BERT训练的方式做掩蔽语言模型(MLM:Masked Language Model)的训练。其中,训练样本集为基于历史保险客服坐席通话内容文本和/或保险专有名词词典构建的。该训练样本集包括对一段字词序列中的不同字词分别进行校正类型标记的多个训练样本,以及对一段字词序列中的同一字词标记有不同校正类型的多个训练样本。由于每个训练样本中仅包含对一个字词的校正类型标记或对同一字词不同校正类型的标记,每次训练过程模型都只针对一处问题进行校正处理,从而大大降低模型的训练难度。
在一个本发明实施例中,为了进一步说明及限定,步骤所述基于所述训练样本集对所述初始文本校正网络模型进行训练,得到已完成训练的文本校正网络模型包括:
利用所述初始文本校正网络模型的校正分类网络对所述训练样本中的每个字词进行校正分类预测处理,得到标记有预测校正类型的训练样本。
利用所述初始文本校正网络模型的语言生成网络对所述标记有预测校正类型的训练样本进行掩蔽处理,并对掩蔽处理的位置进行预测处理,得到所述训练样本的校正处理结果。
基于所述训练样本的校正处理结果及与所述训练样本对应的正样本确定损失函数,以基于所述损失函数完成对所述初始文本校正网络模型的训练。
本发明实施例中,采样微调训练任务对模型进行训练,首先根据错误的样本字词序列(句子),给出改动最小的情况下的正确句子,并给出每个字词应属于待增加类型、待删除类型、待修正类型、保持类型四个校正类型中的哪一类型。进而对待增加类型、待修正类型进行掩蔽处理,进而基于语言生成网络对掩蔽处理的位置进行预测处理,将处理结果对掩蔽处理位置进行更新,以完成一次训练。其中,正样本为训练样本对应的正确的标准句子,可以基于训练样本的校正处理结果与标准句子的交叉熵函数构建损失函数,本发明实施例不做具体限定。
需要说明的是,文本校正网络模型的训练及应用过程,迭代循环对句子进行修改,不限于一次完成全部的修改,并且在涉及到对同一字词存在多种校正类型时,不对校正类型的处理的先后顺序进行限定,例如,当一个字词同时涉及加字和修改的时候,无论先进行哪种校正类型的修改都可以,只要在每次修改时更加接近于标准句子即可。此外,由于文本校正网络模型对句子的修改是迭代循环的,针对同一句子的训练过程,可以选择仅在第一次训练时进行标记,不对后续训练中的错误内容进行标记,从而简化标记难度。
在一个本发明实施例中,为了进一步说明及限定,步骤所述对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果之后,所述方法还包括:
调取与所述通话业务类型对应的文本信息提取模型,所述文本信息提取模型为基于对应所述通话业务类型的信息提取训练样本集训练得到的。
基于所述文本信息提取模型对所述拆分文本进行文本信息提取,得到与所述通话业务类型对应的话术导航信息。
本发明实施例中,文本分类结果至少包括一种通话业务类型的拆分文本。通过信息提取的方式构建保险客服坐席的话术导航信息。为了更为准确的进行信息提取,基于与不同通话服务类型对应的信息提取模型对同一通话服务类型的字词序列进行信息提取,以得到对应通话服务类型的话术导航信息。信息提取模型可以为预训练模块(GPT:Generative Pre-training),也可以为命名实体识别模型(NER:Name EntityRecognition),本发明实施例不做具体限定。其中,信息提取模型为基于保险领域专有名词实体训练样本集训练得到的。
本发明提供了一种基于人工智能的文本处理方法,首先获取待处理的初始文本,并对所述初始文本进行去重处理得到去重处理后的初始文本,所述初始文本为客服坐席的通话记录转译文本;基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本;对所述目标文本进行文本分类处理,对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果。与现有技术相比,本发明实施例通过对初始文本进行校正分类预测处理,并对需要进行不同类型校正的字词进行校正处理,能够实现对文本中多种校正类型的字词的全面校正,大大增加了字词校正的校正类型范围,使文本校正更为全面,从而有效提升文本校正的准确性。此外,基于校正处理后的目标文本进行保险客服坐席话术导航信息的构建,也能够有效保证信息构建的准确性。
进一步的,作为对上述图1所示方法的实现,本发明实施例提供了一种基于人工智能的文本处理装置,如图4所示,该装置包括:
获取模块41,用于获取待处理的初始文本,并对所述初始文本进行去重处理得到去重处理后的初始文本,所述初始文本为客服坐席的通话记录转译文本;
校正处理模块42,用于基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本;
分类处理模块43,用于对所述目标文本进行文本分类处理,对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果。
进一步地,所述校正处理模块42包括:
第一处理单元,用于利用所述校正分类网络对所述去重处理后的初始文本中每个字词进行校正分类预测处理,确定每个所述字词的校正类型;
第二处理单元,用于基于所述字词的校正类型,利用所述语言生成网络对所述字词进行校正处理,得到所述初始文本的目标文本。
进一步地,在具体应用场景中,所述第二处理单元具体用于若所述校正类型为所述待增加类型,则对所述字词的上文或下文位置进行第一掩蔽处理,则利用所述语言生成网络对第一掩蔽处理位置的内容进行预测处理,并将预测处理结果更新至所述第一掩蔽处理位置;若所述校正类型为所述待修正类型,则对所述字词的位置进行第二掩蔽处理,并利用所述语言生成网络对第二掩蔽处理位置的内容进行预测处理,并将预测处理结果更新至所述第二掩蔽处理位置;若所述校正类型为所述待删除类型,则对所述校正类型所对应的字词进行删除处理。
进一步地,所述获取模块包括:
第三处理单元,用于利用正则规则对所述初始文本进行标点去除处理;
第四处理单元,用于基于不同字词长度的词袋模型分别对标点去除处理后的初始文本进行去重处理;
第五处理单元,用于利用正则规则对所述去重处理的结果进行标点恢复处理,得到去重处理后的初始文本。
进一步地,所述装置还包括:
构建模块,用于获取训练样本集,并构建包括校正分类网络、语言生成网络的初始文本校正网络模型,所述训练样本集包括对一段字词序列中的不同字词分别进行校正类型标记的多个训练样本,以及对一段字词序列中的同一字词标记有不同校正类型的多个训练样本;
训练模块,用于基于所述训练样本集对所述初始文本校正网络模型进行训练,得到已完成训练的文本校正网络模型。
进一步地,所述训练模块包括:
第六处理单元,用于利用所述初始文本校正网络模型的校正分类网络对所述训练样本中的每个字词进行校正分类预测处理,得到标记有预测校正类型的训练样本;
第七处理单元,用于利用所述初始文本校正网络模型的语言生成网络对所述标记有预测校正类型的训练样本进行掩蔽处理,并对掩蔽处理的位置进行预测处理,得到所述训练样本的校正处理结果;
训练单元,用于基于所述训练样本的校正处理结果及与所述训练样本对应的正样本确定损失函数,以基于所述损失函数完成对所述初始文本校正网络模型的训练。
进一步地,所述装置还包括:
调取模块,用于调取与所述通话业务类型对应的文本信息提取模型,所述文本信息提取模型为基于对应所述通话业务类型的信息提取训练样本集训练得到的;
提取模块,用于基于所述文本信息提取模型对所述拆分文本进行文本信息提取,得到与所述通话业务类型对应的话术导航信息。
本发明提供了一种基于人工智能的文本处理装置,首先获取待处理的初始文本,并对所述初始文本进行去重处理得到去重处理后的初始文本,所述初始文本为客服坐席的通话记录转译文本;基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本;对所述目标文本进行文本分类处理,对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果。与现有技术相比,本发明实施例通过对初始文本进行校正分类预测处理,并对需要进行不同类型校正的字词进行校正处理,能够实现对文本中多种校正类型的字词的全面校正,大大增加了字词校正的校正类型范围,使文本校正更为全面,从而有效提升文本校正的准确性。此外,基于校正处理后的目标文本进行保险客服坐席话术导航信息的构建,也能够有效保证信息构建的准确性。
根据本发明的又一方面,提供了一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述基于人工智能的文本处理方法对应的操作。
根据本发明的再一方面,提供了一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述基于人工智能的文本处理方法对应的操作。
根据本发明一个实施例提供了一种存储介质,所述存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于人工智能的文本处理方法。
图5示出了根据本发明一个实施例提供的一种计算机设备的结构示意图,本发明具体实施例并不对计算机设备的具体实现做限定。
如图5所示,该计算机设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器502,用于执行程序510,具体可以执行上述基于人工智能的文本处理方法实施例中的相关步骤。
具体地,程序510可以包括程序码,该程序码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行以下操作:
获取待处理的初始文本,并对所述初始文本进行去重处理得到去重处理后的初始文本,所述初始文本为客服坐席的通话记录转译文本;
基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本;
对所述目标文本进行文本分类处理,对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (10)

1.一种基于人工智能的文本处理方法,其特征在于,包括:
获取待处理的初始文本,并对所述初始文本进行去重处理得到去重处理后的初始文本,所述初始文本为客服坐席的通话记录转译文本;
基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本;
对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果。
2.根据权利要求1所述的方法,其特征在于,所述已完成训练的文本校正网络模型包括校正分类网络、语言生成网络,所述基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本包括:
利用所述校正分类网络对所述去重处理后的初始文本中每个字词进行校正分类预测处理,确定每个所述字词的校正类型;
基于所述字词的校正类型,利用所述语言生成网络对所述字词进行校正处理,得到所述初始文本的目标文本。
3.根据权利要求2所述的方法,其特征在于,所述校正类型至少包括待增加类型、待删除类型、待修正类型、保持类型中的一个,所述基于所述字词的校正类型,利用所述语言生成网络对所述字词进行校正处理,得到所述初始文本的目标文本包括:
若所述校正类型为所述待增加类型,则对所述字词的上文或下文位置进行第一掩蔽处理,则利用所述语言生成网络对第一掩蔽处理位置的内容进行预测处理,并将预测处理结果更新至所述第一掩蔽处理位置;
若所述校正类型为所述待修正类型,则对所述字词的位置进行第二掩蔽处理,并利用所述语言生成网络对第二掩蔽处理位置的内容进行预测处理,并将预测处理结果更新至所述第二掩蔽处理位置;
若所述校正类型为所述待删除类型,则对所述校正类型所对应的字词进行删除处理。
4.根据权利要求1所述的方法,其特征在于,所述对所述初始文本进行去重处理得到去重处理后的初始文本包括:
利用正则规则对所述初始文本进行标点去除处理;
基于不同字词长度的词袋模型分别对标点去除处理后的初始文本进行去重处理;
利用正则规则对所述去重处理的结果进行标点恢复处理,得到去重处理后的初始文本。
5.根据权利要求1所述的方法,其特征在于,所述基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本之前,所述方法还包括:
获取训练样本集,并构建包括校正分类网络、语言生成网络的初始文本校正网络模型,所述训练样本集包括对一段字词序列中的不同字词分别进行校正类型标记的多个训练样本,以及对一段字词序列中的同一字词标记有不同校正类型的多个训练样本;
基于所述训练样本集对所述初始文本校正网络模型进行训练,得到已完成训练的文本校正网络模型。
6.根据权利要求5所述的方法,其特征在于,所述基于所述训练样本集对所述初始文本校正网络模型进行训练,得到已完成训练的文本校正网络模型包括:
利用所述初始文本校正网络模型的校正分类网络对所述训练样本中的每个字词进行校正分类预测处理,得到标记有预测校正类型的训练样本;
利用所述初始文本校正网络模型的语言生成网络对所述标记有预测校正类型的训练样本进行掩蔽处理,并对掩蔽处理的位置进行预测处理,得到所述训练样本的校正处理结果;
基于所述训练样本的校正处理结果及与所述训练样本对应的正样本确定损失函数,以基于所述损失函数完成对所述初始文本校正网络模型的训练。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述文本分类结果至少包括一种通话业务类型的拆分文本,所述对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果之后,所述方法还包括:
调取与所述通话业务类型对应的文本信息提取模型,所述文本信息提取模型为基于对应所述通话业务类型的信息提取训练样本集训练得到的;
基于所述文本信息提取模型对所述拆分文本进行文本信息提取,得到与所述通话业务类型对应的话术导航信息。
8.一种基于人工智能的文本处理装置,其特征在于,包括:
获取模块,用于获取待处理的初始文本,并对所述初始文本进行去重处理得到去重处理后的初始文本,所述初始文本为客服坐席的通话记录转译文本;
校正处理模块,用于基于已完成训练的文本校正网络模型对所述去重处理后的初始文本依次进行校正分类预测处理、校正处理,得到所述初始文本的目标文本;
分类处理模块,用于对所述目标文本进行文本分类处理,对所述目标文本进行文本分类处理,以得到用于客服坐席话术导航信息构建的文本分类结果。
9.一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的基于人工智能的文本处理方法对应的操作。
10.一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的基于人工智能的文本处理方法对应的操作。
CN202310472264.6A 2023-04-23 2023-04-23 基于人工智能的文本处理方法及装置 Pending CN116484809A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310472264.6A CN116484809A (zh) 2023-04-23 2023-04-23 基于人工智能的文本处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310472264.6A CN116484809A (zh) 2023-04-23 2023-04-23 基于人工智能的文本处理方法及装置

Publications (1)

Publication Number Publication Date
CN116484809A true CN116484809A (zh) 2023-07-25

Family

ID=87215388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310472264.6A Pending CN116484809A (zh) 2023-04-23 2023-04-23 基于人工智能的文本处理方法及装置

Country Status (1)

Country Link
CN (1) CN116484809A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117221447A (zh) * 2023-08-10 2023-12-12 国网浙江省电力有限公司杭州供电公司 一种基于ai技术的线上电话交流辅助支撑系统
CN117221447B (zh) * 2023-08-10 2024-05-14 国网浙江省电力有限公司杭州供电公司 一种基于ai技术的线上电话交流辅助支撑系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117221447A (zh) * 2023-08-10 2023-12-12 国网浙江省电力有限公司杭州供电公司 一种基于ai技术的线上电话交流辅助支撑系统
CN117221447B (zh) * 2023-08-10 2024-05-14 国网浙江省电力有限公司杭州供电公司 一种基于ai技术的线上电话交流辅助支撑系统

Similar Documents

Publication Publication Date Title
US10672391B2 (en) Improving automatic speech recognition of multilingual named entities
CN110276071B (zh) 一种文本匹配方法、装置、计算机设备及存储介质
CN110134949B (zh) 一种基于教师监督的文本标注方法和设备
CN106570180B (zh) 基于人工智能的语音搜索方法及装置
CN110276023B (zh) Poi变迁事件发现方法、装置、计算设备和介质
US11031009B2 (en) Method for creating a knowledge base of components and their problems from short text utterances
JP7335300B2 (ja) 知識事前訓練モデルの訓練方法、装置及び電子機器
WO2014117553A1 (en) Method and system of adding punctuation and establishing language model
CN112528637B (zh) 文本处理模型训练方法、装置、计算机设备和存储介质
US20120010873A1 (en) Sentence translation apparatus and method
KR100911834B1 (ko) 번역 시스템에서 오류 보정 패턴을 이용한 번역 오류 수정 방법 및 장치
EP3732629A1 (en) Training sequence generation neural networks using quality scores
JP6778655B2 (ja) 単語連接識別モデル学習装置、単語連接検出装置、方法、及びプログラム
CN111881297A (zh) 语音识别文本的校正方法及装置
CN113626598A (zh) 视频文本生成方法、装置、设备及存储介质
CN112447172B (zh) 一种语音识别文本的质量提升方法和装置
CN117480505A (zh) 多语言语法错误校正
CN108268443B (zh) 确定话题点转移以及获取回复文本的方法、装置
JP2023002730A (ja) テキスト誤り訂正とテキスト誤り訂正モデルの生成方法、装置、機器及び媒体
CN116484809A (zh) 基于人工智能的文本处理方法及装置
CN115964997A (zh) 选择题的混淆选项生成方法及装置、电子设备、存储介质
CN114492396A (zh) 用于汽车专有名词的文本错误纠正方法及可读存储介质
KR20010075848A (ko) 정규표현과 확률적 문맥정보를 이용한 문장범위 인식 장치및 그 방법
JP5911931B2 (ja) 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体
CN112101019A (zh) 一种基于词性标注和组块分析的需求模板符合性检查优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination