CN117592468B - 基于人工智能的文本处理方法、装置、设备及存储介质 - Google Patents
基于人工智能的文本处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117592468B CN117592468B CN202410078244.5A CN202410078244A CN117592468B CN 117592468 B CN117592468 B CN 117592468B CN 202410078244 A CN202410078244 A CN 202410078244A CN 117592468 B CN117592468 B CN 117592468B
- Authority
- CN
- China
- Prior art keywords
- text
- evaluation
- processing
- character
- typesetting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 44
- 238000003672 processing method Methods 0.000 title abstract description 27
- 238000011156 evaluation Methods 0.000 claims abstract description 346
- 238000012545 processing Methods 0.000 claims abstract description 234
- 238000000034 method Methods 0.000 claims abstract description 48
- 238000004590 computer program Methods 0.000 claims abstract description 12
- 238000007499 fusion processing Methods 0.000 claims abstract description 9
- 238000013210 evaluation model Methods 0.000 claims description 68
- 230000006870 function Effects 0.000 claims description 63
- 238000012549 training Methods 0.000 claims description 54
- 238000000605 extraction Methods 0.000 claims description 47
- 230000015654 memory Effects 0.000 claims description 25
- 238000012854 evaluation process Methods 0.000 claims description 22
- 230000004913 activation Effects 0.000 claims description 21
- 238000010606 normalization Methods 0.000 claims description 19
- 238000013507 mapping Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 17
- 230000008447 perception Effects 0.000 claims description 12
- 230000004927 fusion Effects 0.000 claims description 11
- 230000001902 propagating effect Effects 0.000 claims 1
- 238000009877 rendering Methods 0.000 abstract description 64
- 238000013441 quality evaluation Methods 0.000 abstract description 11
- 238000010586 diagram Methods 0.000 description 14
- 238000007726 management method Methods 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 5
- 238000007728 cost analysis Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000011511 automated evaluation Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000001303 quality assessment method Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 230000001617 migratory effect Effects 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003020 moisturizing effect Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本申请提供了一种基于人工智能的文本处理方法、装置、电子设备、计算机程序产品及计算机可读存储介质;本申请可应用于人工智能领域和大模型领域,该方法包括:获取第一整合文本,其中,第一整合文本是对第一原始文本进行修正处理得到的;对第一整合文本以及第一原始文本进行拼接处理,得到拼接文本;对拼接文本进行多维度评估处理,得到对应每个维度的评估结果,其中,多维度评估处理包括以下至少两种:语义评估处理、语法评估处理、以及排版评估处理;对至少两个维度的评估结果进行融合处理,得到第一整合文本的修正评估结果。通过本申请,能够同时提高文本润色质量评估的准确度和评估效率。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种基于人工智能的文本处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。
相关技术中提供文本自动润色功能,用于对文本进行语法纠偏以及文本补全,从而实现文本的修正,但是润色效果难以量化表征,传统自动化评估方案需要给定润色文本和参考答案,通过对比两者的字面重叠程度进行评估,该方案依赖参考答案,无法真实客观地反应真实的润色效果。相关技术中传统自动化评估方案虽然使用模型进行评估,提高了评估速度,但评估准确度低。
发明内容
本申请实施例提供一种基于人工智能的文本处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够同时提高文本润色质量评估的准确度和评估效率。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种基于人工智能的文本处理方法,所述方法包括:
获取第一整合文本,其中,所述第一整合文本是对第一原始文本进行修正处理得到的;
对所述第一整合文本以及所述第一原始文本进行拼接处理,得到拼接文本;
对所述拼接文本进行多维度评估处理,得到对应每个所述维度的评估结果,其中,所述多维度评估处理包括以下至少两种:语义评估处理、语法评估处理、以及排版评估处理;
对至少两个所述维度的评估结果进行融合处理,得到所述第一整合文本的修正评估结果。
本申请实施例提供一种基于人工智能的文本处理装置,包括:
获取模块,用于获取第一整合文本,其中,所述第一整合文本是对第一原始文本进行修正处理得到的;
拼接模块,用于对所述第一整合文本以及所述第一原始文本进行拼接处理,得到拼接文本;
评估模块,用于对所述拼接文本进行多维度评估处理,得到对应每个所述维度的评估结果,其中,所述多维度评估处理包括以下至少两种:语义评估处理、语法评估处理、以及排版评估处理;
融合模块,用于对至少两个所述维度的评估结果进行融合处理,得到所述第一整合文本的修正评估结果。
在上述方案中,所述拼接模块,还用于获取拼接模版,基于所述拼接模版,对所述第一原始文本和所述第一整合文本进行拼接处理,得到所述拼接文本。
在上述方案中,所述评估模块,还用于对所述拼接文本表示进行排版特征提取处理,得到对应所述拼接文本的排版特征,对所述排版特征进行排版映射处理,得到所述排版评估结果。
在上述方案中,所述评估模块,还用于针对每个所述字符执行以下处理:对所述字符进行词表示处理,得到所述字符的词表示,基于所述字符所属的语句,对所述字符进行语句表示处理,得到所述字符的语句表示,其中,所述语句来源于所述拼接文本,基于所述字符在所述拼接文本的位置,对所述字符进行位置表示处理,得到所述字符的位置表示,将对应所述字符的所述词表示、所述语句表示以及所述位置表示进行融合处理,得到对应所述字符的文本表示。
在上述方案中,所述评估模块,还用于对所述拼接文本表示中的每个字符表示执行以下处理:当所述字符表示对应的字符是所述拼接文本的第一个字符时,对所述字符表示进行排版特征提取处理,得到所述字符的字符排版特征,当所述字符表示对应的字符不是所述拼接文本的第一个字符时,对所述字符表示以及所述拼接文本中排序在所述字符之前的在前字符进行排版特征提取处理,得到所述字符的字符排版特征,将所述拼接文本中最后一个字符的字符排版特征作为所述拼接文本的排版特征。
在上述方案中,所述评估模块,还用于对所述排版特征进行多层感知处理,得到对应所述拼接文本的预测分数值,基于激活函数,对所述预测分数值进行归一化处理,得到排版评估分数,并将所述排版评估分数作为所述排版评估结果。
在上述方案中,至少两个所述维度的评估结果包括语义评估结果、所述融合模块,还用于获取与评估需求适配的权重组合,所述权重组合包括对应所述语义评估结果的第一权重、对应所述语法评估结果的第二权重以及对应所述排版评估结果的第三权重,基于所述权重组合对所述语义评估结果、所述语法评估结果以及所述排版评估结果进行加权求和处理,得到所述第一整合文本的修正评估结果。
在上述方案中,所述评估模块,还用于获取第二整合文本,其中,所述第二整合文本是对第二原始文本进行修正处理得到的,对所述第二整合文本以及所述第二原始文本进行拼接处理,得到拼接文本样本,将所述拼接文本样本在预训练模型中进行正向传播处理,得到所述拼接文本样本在目标维度的预测评估结果,其中,所述目标维度来源于所述多维度,获取所述拼接文本样本在所述目标维度的真实评估结果,基于所述预测评估结果和所述目标维度的真实评估结果,确定损失函数,基于所述损失函数对所述预训练模型进行更新处理,得到评估模型,其中,所述评估模型用于对所述拼接文本执行所述目标维度的评估处理。
在上述方案中,所述评估模块,还用于当所述第二原始文本与所述第二整合文本在所述目标维度为正样本关系时,将数值一确定为所述拼接文本样本在所述目标维度的真实评估结果,当所述第二原始文本与所述第二整合文本在所述目标维度为负样本关系时,将数值零确定为所述拼接文本样本在所述目标维度的真实评估结果。
在上述方案中,所述评估模块,还用于调用所述预训练模型对所述拼接文本样本执行以下操作:对所述拼接文本样本中的每个样本字符进行文本表示处理,得到每个所述样本字符的样本文本表示,并将多个所述样本字符的样本文本表示拼接为拼接文本样本表示,对所述拼接文本样本表示进行对应所述目标维度的特征提取处理,得到在所述目标维度的文本样本特征,对所述文本样本特征进行多层感知处理,得到对应所述拼接文本样本在所述目标维度的样本预测分数值,基于激活函数,对所述样本预测分数值进行归一化处理,得到样本评估分数,其中,所述文本样本评估分数的取值范围为不小于0且不大于1,以所述样本评估分数作为所述拼接文本样本在所述目标维度的预测评估结果。
本申请实施例提供一种电子设备,所述电子设备包括:
存储器,用于存储计算机可执行指令;
处理器,用于执行所述存储器中存储的计算机可执行指令时,实现本申请实施例提供的基于人工智能的文本处理方法。
本申请实施例提供一种计算机可读存储介质,存储有计算机可执行指令,用于被处理器执行时实现本申请实施例提供的基于人工智能的文本处理方法。
本申请实施例提供一种计算机程序产品,包括计算机可执行指令,所述计算机可执行指令被处理器执行时,实现本申请实施例提供的基于人工智能的文本处理方法。
本申请实施例具有以下有益效果:
通过获取对第一原始文本进行修正处理得到的第一整合文本,对第一整合文本以及第一原始文本进行拼接处理,得到拼接文本,将第一整合文本与第一原始文本作为一个整体输入,从而可以提高数据处理效率,对拼接文本进行多维度评估处理,得到对应每个维度的评估结果,多维度评估处理包括以下至少两种:语义评估处理、语法评估处理、以及排版评估处理,从而可以提供多种评估维度以适应不同的评估需求对至少两个维度的评估结果进行融合处理,得到第一整合文本的修正评估结果,通过多个维度的评估结果的融合可以提高文本修正质量评估的评估准确率。
附图说明
图1是本申请实施例提供的基于人工智能的文本处理系统的架构示意图;
图2是本申请实施例提供的服务器的结构示意图;
图3A是本申请实施例提供的基于人工智能的文本处理方法的流程示意图;
图3B是本申请实施例提供的基于人工智能的文本处理方法的一种可选的流程示意图一;
图3C是本申请实施例提供的基于人工智能的文本处理方法的一种可选的流程示意图二;
图3D是本申请实施例提供的基于人工智能的文本处理方法的一种可选的流程示意图三;
图4是本申请实施例提供的评估模型训练方法的流程示意图;
图5A是本申请实施例提供的语义和语法维度润色的文本润色界面示意图;
图5B是本申请实施例提供的语义、语法以及排版维度润色的文本润色界面示意图;
图6是本申请实施例提供的文本润色评估方案的整体架构图;
图7是本申请实施例提供的评估模型的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
本申请实施例中,术语“模块”或“单元”是指有预定功能的计算机程序或计算机程序的一部分,并与其他相关部分一起工作以实现预定目标,并且可以通过使用软件、硬件(如处理电路或存储器)或其组合来全部或部分实现。同样的,一个处理器(或多个处理器或存储器)可以用来实现一个或多个模块或单元。此外,每个模块或单元都可以是包含该模块或单元功能的整体模块或单元的一部分。
除非另有定义,本申请实施例所使用的所有的技术和科学术语与所属技术领域的技术人员通常理解的含义相同。本申请实施例中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)大型语言模型(Large Language Model,LLM):是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿到迁移的参数,帮助它们学习语言数据中的复杂模式。
2)文本润色:文本润色是指在不改变原意的前提下,对输入的原始文本进行修正错误(例如拼写错误、语法错误),并使表达更流程,排版更清晰等润色操作。
3)预训练模型(Pre-training model,PTM):也称基石模型、大模型,指具有大参量的深度神经网络(Deep neural network,DNN),在海量未标记的数据上对其进行训练,利用大参量DNN的函数近似能力使PTM在数据上提取共性特征,经微调(fine tune)、参数高效微调(Parameter-Efficient Fine-Tuning,PEFT)、提示调整(prompt-tuning)等技术,适用于下游任务。因此,预训练模型可以在小样本(Few-shot)或零样本(Zero-shot)场景下达到理想效果。
4)自然语言处理(Nature Language processing,NLP):是计算机科学领域与人工智能领域中的重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理涉及自然语言,即人们日常使用的语言,与语言学研究密切。人工智能领域模型训练的重要技术,预训练模型,即是从NLP领域的大型语言模型(LargeLanguage Model,LLM)发展而来。经过微调,大型语言模型可以广泛应用于下游任务。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
相关技术对于文本润色质量评估提出了如下方案:
传统自动化评估:给定润色文本和参考答案,通过对比两者的字面重叠程度,计算双语评估替补指标(Bilingual Evaluation Understudy,BLEU)和面向召回率评价指标(Recall-Oriented Understudy for Gisting Evaluation,Rouge)等来进行评估。
申请人在实施本申请实施例时发现相关技术存在以下缺陷:
传统自动化评估:这种方法耗时短,成本低,但是效果差。因为这些指标的计算严重依赖参考答案,但是文本润色是没有标准答案的,如果只根据其中一条(或几条)参考答案进行指标计算,不能客观反映真实的润色效果。
本申请实施例提供的基于人工智能的文本处理方法涉及人工智能领域的自然语言处理技术和大模型领域的预训练模型技术,具体通过如下实施例进行说明。
本申请实施例提供一种基于人工智能的文本处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够同时提高文本润色质量评估的准确度和评估效率。
下面说明本申请实施例提供的电子设备的示例性应用,本申请实施例提供的设备可以实施为笔记本电脑、平板电脑,台式计算机、机顶盒、移动设备(例如,移动电话,便携式音乐播放器,个人数字助理,专用消息设备,便携式游戏设备)、智能手机、智能音箱、智能手表、智能电视、车载终端等各种类型的用户终端,也可以实施为服务器。下面,将说明电子设备实施为服务器时的示例性应用。
参见图1,图1是本申请实施例提供的基于人工智能的文本处理系统100的架构示意图,为实现支撑一个基于人工智能的文本处理应用,终端400通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。
终端400用于获取文本处理请求,例如,用户终端400通过终端400的图形界面410生成文本处理请求,服务器200用于基于文本处理请求,获取第一整合文本,其中,第一整合文本是对第一原始文本进行修正处理得到的,对第一整合文本以及第一原始文本进行拼接处理,得到拼接文本,对拼接文本进行多维度评估处理,得到对应每个维度的评估结果,其中,多维度评估处理包括以下至少两种:语义评估处理、语法评估处理、以及排版评估处理,对至少两个维度的评估结果进行融合处理,得到第一整合文本的修正评估结果,并将修正评估结果反馈至终端400。
在一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载终端等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
参见图2,图2是本申请实施例提供的服务器200的结构示意图,图2所示的服务器200包括:至少一个处理器210、存储器250、至少一个网络接口220和用户接口230。终端200中的各个组件通过总线系统240耦合在一起。可理解,总线系统240用于实现这些组件之间的连接通信。总线系统240除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统240。
处理器210可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(Digital Signal Processor,DSP),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口230包括使得能够呈现媒体内容的一个或多个输出装置231,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口230还包括一个或多个输入装置232,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器250可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器250可选地包括在物理位置上远离处理器210的一个或多个存储设备。
存储器250包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(Random Access Memory,RAM)。本申请实施例描述的存储器250旨在包括任意适合类型的存储器。
在一些实施例中,存储器250能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统251,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块252,用于经由一个或多个(有线或无线)网络接口220到达其他电子设备,示例性的网络接口220包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(Universal Serial Bus,USB)等;
在一些实施例中,本申请实施例提供的装置可以采用软件方式实现,图2示出了存储在存储器250中的基于人工智能的文本处理装置253,其可以是程序和插件等形式的软件,包括以下软件模块:获取模块2531和拼接模块2532、评估模块2533和融合模块2534,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
在一些实施例中,终端或服务器可以通过运行各种计算机可执行指令或计算机程序来实现本申请实施例提供的基于人工智能的文本处理方法。举例来说,计算机可执行指令可以是微程序级的命令、机器指令或软件指令。计算机程序可以是操作系统中的原生程序或软件模块;可以是本地(Native)应用程序(APPlication,APP),即需要在操作系统中安装才能运行的程序,如即时通信APP;也可以是可以嵌入至任意APP中的小程序,即只需要下载到浏览器环境中就可以运行的程序。总而言之,上述的计算机可执行指令可以是任意形式的指令,上述计算机程序可以是任意形式的应用程序、模块或插件。
将结合本申请实施例提供的服务器的示例性应用和实施,说明本申请实施例提供的基于人工智能的文本处理方法。
需要说明的是,下文中的文本处理的示例中,是以文本润色为例说明的,本领域技术人员根据对下文的理解,可以将本申请实施例提供的基于人工智能的文本处理方法应用于包括其他文本处理的评估。
参见图3A,图3A是本申请实施例提供的基于人工智能的文本处理方法的流程示意图,将结合图3A示出的步骤101至步骤104进行说明。
在步骤101中,获取第一整合文本。
作为示例,第一整合文本是对第一原始文本进行修正处理得到的。用户构造第一原始文本,以第一原始文本为输入,使用文本处理模型对第一原始文本进行文本处理操作用于对文本进行润色(修正),在本申请实施例中,文本处理操作可以为文本润色操作,文本处理模型可以为相关技术中常用的文本润色模型。
在步骤102中,对第一整合文本以及第一原始文本进行拼接处理,得到拼接文本。
参见图3B,图3B是本申请实施例提供的基于人工智能的文本处理方法的一种可选的流程示意图一。在一些实施例中,图3A中的步骤102可以通过图3B中示出的步骤1021和步骤1022实现,下面进行详细说明。
在步骤1021中,获取拼接模版。
作为示例,拼接模板可以根据需要进行设置。例如,对于第一原始文本“待会去502开会”和第一整合文本“一会儿到502开会”,拼接模板为“输入文本:XXXXX 润色文本:YYYYY”,其中,XXXXX为第一原始文本的文本内容“待会去502开会”,YYYYY对应第一整合文本的文本内容“一会儿到502开会”,代表形式分隔符,可以为硬回车、软回车等,本申请在此不作限制。
在步骤1022中,基于拼接模版,对第一原始文本和第一整合文本进行拼接处理,得到拼接文本。
作为示例,基于拼接模版“输入文本:XXXXX 润色文本:YYYYY”,对第一原始文本“待会去502开会”和第一整合文本“一会儿到502开会”进行拼接处理,得到拼接文本“输入文本:待会去502开会 润色文本:一会儿到502开会”。
通过设置拼接模板,将第一原始文本和第一整合文本拼接为一个整体,作为拼接文本进行后续的评估处理,使评估模型在一次评估处理中只需进行一次特征提取处理,提高了文本处理质量评估的评估速度。
继续参见图3A,在步骤103中,对拼接文本进行多维度评估处理,得到对应每个维度的评估结果。
作为示例,多维度评估处理包括以下至少两种:语义评估处理、语法评估处理、以及排版评估处理,语义评估处理是指从第一整合文本与第一原始文本的文本语义是否一致进行评估,例如,是否对第一原始文本的内容进行了修改、新增或删除;语法评估处理是指对第一整合文本的表述是否准确进行评估,例如第一整合文本中是否存在错别字或语法错误;排版评估处理是指对第一整合文本的排版是否合理进行评估,例如,第一整合文本中是否存在不合理的分段、换行等排版格式问题。这三种评估处理角度是模拟人工评估过程中的三个评估角度,在实际应用中,可以根据需要引入其他评估处理角度对文本处理质量进行评估,本申请在此不作限制。
参见图3C,图3C是本申请实施例提供的基于人工智能的文本处理方法的一种可选的流程示意图二。在一些实施例中,图3A中的步骤103中的排版评估处理可以通过图3C中示出的步骤1031至步骤1033实现,下面进行详细说明。
在步骤1031中,对拼接文本中每个字符进行文本表示处理,得到每个字符的文本表示,并将多个字符的文本表示拼接为拼接文本表示。
在一些实施例中,步骤1031中的对拼接文本中每个字符进行文本表示处理,得到每个字符的文本表示可以通过以下方式实现:针对每个字符执行以下处理:对字符进行词表示处理,得到字符的词表示,基于字符所属的语句,对字符进行语句表示处理,得到字符的语句表示,其中,语句来源于拼接文本,基于字符在拼接文本的位置,对字符进行位置表示处理,得到字符的位置表示,将对应字符的词表示、语句表示以及位置表示进行融合处理,得到对应字符的文本表示。
作为示例,对于拼接文本“输入文本:待会去502开会 润色文本:一会儿到502开会”,先对拼接文本进行形式处理,得到拼接文本形式[CLS]输入文本:待会去502开会 润色文本:一会儿到502开会[EOS],其中,[CLS]为文本起始符,[EOS]为文本结束符,对拼接文本形式中的每个字符进行词表示处理,得到字符的词表示,例如,对于输入文本中的字符5与润色文本中的字符5的词表示相同;对每个字符根据其语句来源,得到对应的语句表示,例如,对于输入文本中的字符5,其语句表示为0,对于润色文本中的字符5,其语句表示为1;基于每个字符在拼接文本中的位置,对对应字符进行位置表示处理,得到对应字符的位置表示,例如,对于输入文本中的字符5,其位置为第8,位置表示为08,对于润色文本中的字符5,其位置为第23,位置表示则为23,还可以根据每个字符在其语句来源中的位置进行位置表示,例如,对于输入文本中的字符5,其位置为第8,位置表示为08,对于润色文本中的字符5,其位置为第9,位置表示则为09。
通过根据字符、字符的语句来源以及字符在拼接文本中的位置,确定每个字符的文本表示,对每个字符的信息进行准确表达,以确保后续特征提取处理得到的特征中的信息准确且丰富,进而保证后续评估处理的准确性。
在步骤1032中,对拼接文本表示进行排版特征提取处理,得到对应拼接文本的排版特征。
在一些实施例中,步骤1032可以通过以下方式实现:对拼接文本表示中的每个字符表示执行以下处理:当字符表示对应的字符是拼接文本的第一个字符时,对字符表示进行排版特征提取处理,得到字符的字符排版特征;当字符表示对应的字符不是拼接文本的第一个字符时,对字符表示以及拼接文本中排序在字符之前的在前字符进行排版特征提取处理,得到字符的字符排版特征;将拼接文本中最后一个字符的字符排版特征作为拼接文本的排版特征。
作为示例,以[CLS]输入文本:待会去502开会 润色文本:一会儿到502开会[EOS]为例,对于字符“输”,只对字符“输”进行排版特征提取处理,其字符排版特征只为“输”的字符排版特征;对于字符“入”,则对字符“入”和字符“输”进行排版特征提取处理,得到字符“入”的字符排版特征,以此类推,对应最后一个字符(即对应[EOS]位置的字符)“会”,对“会”的字符表示以及拼接文本中排序在“会”之前的在前字符进行排版特征提取处理,得到字符“会”的字符排版特征,将字符“会”的字符排版特征作为拼接文本的排版特征。其中,对拼接文本表示进行排版特征提取处理,得到对应拼接文本的排版特征,是通过调用排版评估模型实现的。
通过对每个字符进行排版特征提取处理,以包含所有字符的字符排版特征的最后一个字符的字符排版特征作为拼接文本的排版特征,保证排版特征的信息准确且丰富,以保证后续评估处理的准确性。
在步骤1033中,对排版特征进行排版映射处理,得到排版评估结果。
在一些实施例中,步骤1033可以通过以下方式实现:对排版特征进行多层感知处理,得到对应拼接文本的预测分数值,基于激活函数,对预测分数值进行归一化处理,得到排版评估分数,并将排版评估分数作为排版评估结果。
作为示例,调用排版评估模型中的排版打分网络对排版特征进行排版映射处理,其中,排版打分网络包括第一多层感知机(Multi-Layer Perceptron,MLP)和第一归一化层,使用第一多层感知机对排版特征进行多层感知处理,得到对应拼接文本的预测排版分数值,该预测排版分数值为一个实数,实数不易于对评估结果进行表征,因此通过第一归一化层中的激活函数,如Sigmoid激活函数,将预测排版分数值映射为一个取值范围为[0,1]的排版评估分数,作为拼接文本的排版评估结果。
通过调用多层感知机和激活函数对排版特征进行排版映射处理,得到取值范围为[0,1]的排版评估结果,以对拼接文本的排版质量进行表征,一方面能够对文本处理的排版质量进行评估,另一方面能够结合其他评估角度对文本处理质量进行评估,提高文本处理评估的评估准确度。
通过对拼接文本中每个字符进行文本表示处理,得到每个字符的文本表示,并将多个字符的文本表示拼接为拼接文本表示,将字符的词表示、语句表示和位置表示进行融合,丰富每个字符的文本表示的信息,进而丰富拼接文本表示中的隐层信息,对拼接文本表示进行排版特征提取处理,得到对应拼接文本的排版特征,对排版特征进行排版映射处理,得到排版评估结果,保证用于表征拼接文本的排版质量的特征中蕴含丰富的信息,进而提高对文本处理质量评估的评估准确度。
在一些实施例中,步骤103中的语义评估处理可以通过以下方式实现:对拼接文本中每个字符进行文本表示处理,得到每个字符的文本表示,并将多个字符的文本表示拼接为拼接文本表示,调用语义评估模型,对拼接文本表示进行语义特征提取处理,得到对应拼接文本的语义特征,调用语义评估模型中的语义打分网络对语义特征进行语义映射处理,其中,语义评估模型中的语义打分网络对语义特征进行语义映射处理,其中,语义打分网络包括第二多层感知机和第二归一化层,使用第二多层感知机对语义特征进行第一多层感知处理,得到对应拼接文本的预测语义分数值,该预测语义分数值为一个实数,通过第二归一化层中的激活函数,将预测语义分数值映射为一个取值范围为[0,1]的语义评估分数,作为拼接文本的语义评估结果。
在一些实施例中,步骤103中的语法评估处理可以通过以下方式实现:对拼接文本中每个字符进行文本表示处理,得到每个字符的文本表示,并将多个字符的文本表示拼接为拼接文本表示,调用语法评估模型,对拼接文本表示进行语法特征提取处理,得到对应拼接文本的语法特征,调用语法评估模型中的语法打分网络对语法特征进行语法映射处理,其中,语法打分网络包括第二多层感知机和第二归一化层,使用第二多层感知机对语法特征进行第二多层感知处理,得到对应拼接文本的预测语法分数值,该预测语法分数值为一个实数,通过第二归一化层中的激活函数,将预测语法分数值映射为一个取值范围为[0,1]的语法评估分数,作为拼接文本的语法评估结果。
继续参照图3A,在步骤104中,对至少两个维度的评估结果进行融合处理,得到第一整合文本的修正评估结果。
参见图3D,图3D是本申请实施例提供的基于人工智能的文本处理方法的一种可选的流程示意图三。在一些实施例中,图3A中的步骤104可以通过图3D中示出的步骤1041和步骤1042实现,下面进行详细说明。
在步骤1041中,获取与评估需求适配的权重组合,权重组合包括对应语义评估结果的第一权重、对应语法评估结果的第二权重以及对应排版评估结果的第三权重。
作为示例,设置与评估需求适配的权重组合,例如,评估需要根据语义、语法以及排版三个角度进行,则设定对应语义评估结果的第一权重、对应语法评估结果的第二权重以及对应排版评估结果的第三权重,其中,第一权重、第二权重以及第三权重之和为1,各权重大小可以根据实际需要进行设置,如,实际评估对语义的要求最高,则第一权重的数值为各权重中最大的数值。另外,语义评估结果和语法评估结果可以通过相关技术得到,也可以上述步骤103中的方法得到,此处不再赘述。
在步骤1042中,基于权重组合对语义评估结果、语法评估结果以及排版评估结果进行加权求和处理,得到第一整合文本的修正评估结果。
作为示例,语义评估结果为0.7,语法评估结果为0.99,排版评估结果为0.99,调用分数融合模块对排版分数、语义分数以及语法分数进行加权求和处理,得到第一整合文本的修正评估结果,其中,修正评估结果=第一权重×语义评估结果+第二权重×语法评估结果+第三权重×排版评估结果=0.35×0.7+0.35×0.99+0.3×0.99=0.89,其中,第一权重+第二权重+第三权重=0.35+0.35+0.3=1。
通过根据实际需要设置对应的权重,结合至少两个评估角度的评估结果,进行有权相加处理,得到对应第一整合文本的修正评估角度,一方面能够根据实际需要对文本处理质量进行评估,以为后续的最优文本处理结果的筛选提供准确依据,另一方面,模拟人工评估对文本处理质量进行评估,提高文本处理质量评估的准确度。
参见图4,图4是本申请实施例提供的评估模型训练方法的流程示意图。在一些实施例中,在执行步骤103之前,还可以执行图4所示的步骤201至步骤205,下面进行详细说明。
在步骤201中,获取第二整合文本。
作为示例,第二整合文本是对第二原始文本进行修正处理得到的,此步骤与上述步骤101相同,此处不再赘述。
在步骤202中,对第二整合文本以及第二原始文本进行拼接处理,得到拼接文本样本。
作为示例,此步骤与上述步骤102相同,此处不再赘述。
在步骤203中,将拼接文本样本在预训练模型中进行正向传播处理,得到拼接文本样本在目标维度的预测评估结果。
在一些实施例中,步骤203可以通过以下方式实现:调用预训练模型对拼接文本样本执行以下操作:对拼接文本样本中的每个样本字符进行文本表示处理,得到每个样本字符的样本文本表示,并将多个样本字符的样本文本表示拼接为拼接文本样本表示,对拼接文本样本表示进行对应所述目标维度的特征提取处理,得到在目标维度的文本样本特征,对文本样本特征进行多层感知处理,得到对应拼接文本样本在目标维度的样本预测分数值,基于激活函数,对样本预测分数值进行归一化处理,得到样本评估分数,其中,文本样本评估分数的取值范围为不小于0且不大于1,以样本评估分数作为拼接文本样本在目标维度的预测评估结果。
作为示例,目标维度来源于多维度,此处文本表示处理、特征提取处理、多层感知处理以及归一化处理与上述步骤103相同,只是使用的评估模型为预训练模型,此处不再赘述。
通过调用预训练模型对拼接文本样本,基于目标维度进行文本表示处理、特征提取处理、多层感知处理以及归一化处理,使预训练模型获取对应目标维度的评估知识与能力,以应用于后续的文本处理质量评估任务,提高文本你处理质量的评估速度。
在步骤204中,获取拼接文本样本在目标维度的真实评估结果。
在一些实施例中,步骤204可以通过以下方式实现:当第二原始文本与第二整合文本在目标维度为正样本关系时,将数值一确定为拼接文本样本在目标维度的真实评估结果;当第二原始文本与第二整合文本在目标维度为负样本关系时,将数值零确定为拼接文本样本在目标维度的真实评估结果。
作为示例,当第二原始文本与第二整合文本在目标维度为正样本关系时,将1确定为拼接文本样本在目标维度的真实评估结果;当第二原始文本与第二整合文本在目标维度为负样本关系时,将0确定为拼接文本样本在目标维度的真实评估结果。
通过设置正样本与负样本的目标维度的真实评估结果,在模型训练过程中作为调参依据,以对评估模型进行调参处理,提高评估模型的评估准确度,从而提高文本处理质量的评估准确度。
在步骤205中,基于预测评估结果和目标维度的真实评估结果,确定损失函数,基于损失函数对预训练模型进行更新处理,得到评估模型。
作为示例,评估模型用于对拼接文本执行目标维度的评估处理。例如,当目标维度为排版评估处理时,基于预测排版评估结果和真实排版评估结果,确定排版损失函数,基于排版损失函数,对预训练模型进行更新处理,例如对预训练模型中的语言模型网络、多层感知机的参数进行调参更新处理,得到排版评估模型。
作为示例,目标维度为排版维度时,则采集对应排版评估的正样本与负样本,作为排版评估训练样本,将排版评估训练样本中的第二原始文本与对应的第二整合文本进行拼接处理,得到排版评估拼接文本样本,对排版评估拼接文本样本中的每个样本字符进行文本表示处理,得到每个样本字符的样本文本表示,并将多个样本字符的样本文本表示拼接为排版评估拼接文本样本表示,调用第一预训练模型对排版评估拼接文本样本表示进行排版特征提取处理,得到在排版维度的文本样本排版特征,对文本样本排版特征进行多层感知处理,得到对应排版评估拼接文本样本在排版维度的样本预测排版分数值,基于激活函数,对样本预测排版分数值进行归一化处理,得到样本排版评估分数,以样本排版评估分数作为排版评估拼接文本样本在排版维度的预测排版评估结果,根据排版评估训练样本的正负样本属性,确定排版评估拼接文本样本在排版维度的真实排版评估结果,基于预测排版评估结果和真实排版评估结果,确定排版损失函数,基于排版损失函数对第一预训练模型进行更新处理,得到排版评估模型。
作为示例,目标维度为语义维度时,则采集对应语义评估的正样本与负样本,作为语义评估训练样本,将语义评估训练样本中的第二原始文本与对应的第二整合文本进行拼接处理,得到语义评估拼接文本样本,对语义评估拼接文本样本中的每个样本字符进行文本表示处理,得到每个样本字符的样本文本表示,并将多个样本字符的样本文本表示拼接为语义评估拼接文本样本表示,调用第二预训练模型对语义评估拼接文本样本表示进行语义特征提取处理,得到在语义维度的文本样本语义特征,对文本样本语义特征进行多层感知处理,得到对应语义评估拼接文本样本在语义维度的样本预测语义分数值,基于激活函数,对样本预测语义分数值进行归一化处理,得到样本语义评估分数,以样本语义评估分数作为语义评估拼接文本样本在语义维度的预测语义评估结果,根据语义评估训练样本的正负样本属性,确定语义评估拼接文本样本在语义维度的真实语义评估结果,基于预测语义评估结果和真实语义评估结果,确定语义损失函数,基于语义损失函数对第二预训练模型进行更新处理,得到语义评估模型。
作为示例,目标维度为语法维度时,则采集对应语法评估的正样本与负样本,作为语法评估训练样本,将语法评估训练样本中的第二原始文本与对应的第二整合文本进行拼接处理,得到语法评估拼接文本样本,对语法评估拼接文本样本中的每个样本字符进行文本表示处理,得到每个样本字符的样本文本表示,并将多个样本字符的样本文本表示拼接为语法评估拼接文本样本表示,调用第三预训练模型对语法评估拼接文本样本表示进行语法特征提取处理,得到在语法维度的文本样本语法特征,对文本样本语法特征进行多层感知处理,得到对应语法评估拼接文本样本在语法维度的样本预测语法分数值,基于激活函数,对样本预测语法分数值进行归一化处理,得到样本语法评估分数,以样本语法评估分数作为语法评估拼接文本样本在语法维度的预测语法评估结果,根据语法评估训练样本的正负样本属性,确定语法评估拼接文本样本在语法维度的真实语法评估结果,基于预测语法评估结果和真实语法评估结果,确定语法损失函数,基于语法损失函数对第三预训练模型进行更新处理,得到语法评估模型。
通过采集正样本与负样本,对预训练模型进行预训练处理,得到能够适用于目标维度的评估模型,以应用于文本处理质量评估任务中,提高文本处理质量评估的评估速度与准确性。
下面,将说明本申请实施例在一个实际的文本润色应用场景中的示例性应用。
参见图5A,图5A是本申请实施例提供的语义和语法维度润色的文本润色界面示意图。在文本润色应用的产品侧,用户在输入法的输入框中输入原始文本中,调用优化表达功能,输入法的推荐界面显示对应原始文本的润色文本,用户点击“使用”功能项,即可将输入框中的原始文本替换为润色文本。文本润色功能可以对原始文本的语义和语法进行润色,如图5A所示,用户在输入框中输入原始文本a“对了就是那个你今天吃了饭了吗我本来还是想说诶明天约你吃饭的”,用户调用优化表达功能,输入法的推荐界面显示对应原始文本a的润色文本A“对了,你今天吃饭了吗?我本来还想明天约你吃饭。”,用户点击“使用”功能项,即可将输入框中的原始文本a替换为润色文本A,用户点击发送功能项,即可将润色文本A作为即时消息发出。此外,文本润色功能还可以对原始文本的语义、语法以及排版进行润色。参见图5B,图5B是本申请实施例提供的语义、语法以及排版维度润色的文本润色界面示意图,如图5B所示,用户在输入框中输入原始文本b“下午管理会:近期门店管理情况(产品、业绩、团队)问题点,优化点个人工作情况汇报(总结和计划) 6月成本分析及物料管家续费讨论”,用户调用优化表达功能,输入法的推荐界面显示对应原始文本b的润色文本B“下午管理会:
1.近期门店管理情况(产品、业绩、团队)的问题点、优化点。
2.个人工作情况汇报(总结和计划)。
3.讨论6月的成本分析和物料管家续费。”用户点击“使用”功能项,即可将输入框中的内容,即原始文本b,替换为润色文本B,若用户需要对润色文本B进行调整,则可以在输入框中调整润色文本B,当用户点击发送功能项,即可将输入框中的润色文本作为即时消息发送。
参见图6,图6是本申请实施例提供的文本润色评估方案的整体架构图。如图6所示,获取原始文本“下午管理会:近期门店管理情况(产品、业绩、团队)问题点,优化点 个人工作情况汇报(总结和计划) 6月成本分析及物料管家续费讨论”和润色文本“下午管理会:
1.近期门店管理情况(产品、业绩)的问题点、优化点。
2.个人工作情况汇报(总结和计划)。
3.讨论6月的成本分析和物料管家续费”,将原始文本和润色文本输入文本润色质量评估架构中,文本润色质量评估架构中包括排版评估模型、语义评估模型、语法评估模型以及分数融合模块,三个评估模型对应人工评估中的排版角度、语义角度以及语法角度三个评估角度,每个评估模型会输出一个数值在0-1之间的得分,具体参见表1。
表1 评估角度分析表
继续参见图6,排版评估模型从排版角度对原始文本和润色文本进行打分评估,得到排版分数0.99,语义评估模型从语义角度对原始文本和润色文本进行打分评估,得到语义分数0.7(原始文本中的“产品、业绩、团队”在润色文本中只有“产品、业绩”,遗漏了“团队”,所以语义角度的打分较低,为0.7),语法评估模型从语法角度对原始文本和润色文本进行打分评估,得到语法分数0.99,分数融合模块对排版分数、语义分数以及语法分数进行有权重的相加,得到评估分数0.89,其中,评估分数=第一权重×语义分数+第二权重×语法分数+第三权重×排版分数=0.35×0.7+0.35×0.99+0.3×0.99=0.89,其中,第一权重+第二权重+第三权重=0.35+0.35+0.3=1,第一权重、第二权重以及第三权重的数值可以根据实际需要进行设置,例如实际应用场景中对语法的准确度要求更高,可以相应提高第三权重。
参见图7,图7是本申请实施例提供的评估模型的结构示意图。排版评估模型、语义评估模型以及语法评估模型的结构相同,均为基于大型语言模型的句子分类模型,以上三个模型统称为评估模型。评估模型的结构如图7所示,评估模型中包括用于进行特征提取的语言模型以及用于打分的打分网络,在打分过程中,原始输入为输入文本(即第一原始文本)和润色文本(即第一整合文本),将输入文本和润色文本拼接为单个整合文本(即拼接文本)“输入文本:xxxxx 润色文本:xxxxxx”,将整合文本输入评估模型的语言模型中,语言模型对整合文本进行特征提取处理,得到对应目标维度的整体特征,将整体特征输入打分网络,打分网络中的多层感知器和激活函数对整体特征进行打分,得到最终评分0.9,其中,整体特征的类型取决于评估模型的类型,例如,当使用排版评估模型对整合文本进行特征提取处理时,排版评估模型中的语言模型对整合文本进行特征提取处理,得到的整体特征为排版特征,将整体特征输入排版评估模型中的排版打分网络,排版打分网络中的多层感知机和激活函数对排版特征进行排版映射处理,得到最终排版评分(即排版评估结果);当使用语义评估模型对整合文本进行特征提取处理时,语义评估模型中的语言模型对整合文本进行语义特征提取处理,得到的整体特征为语义特征,将语义特征输入语义评估模型中的语义打分网络,语义打分网络中的多层感知机和激活函数对语义特征进行语义映射处理,得到最终语义评分(即语义评估结果);当使用语法评估模型对整合文本进行语法特征提取处理时,语法评估模型中的语法语言模型对整合文本进行语法特征提取处理,得到的整体特征为语法特征,将语法特征输入语法评估模型中的语法打分网络,语法打分网络中的多层感知机和激活函数对语法特征进行语法映射处理,得到最终语法评分(即语法评估结果)。下面以单个评估模型为例,对该过程进行详细说明。
输入语言模型的整合文本的输入格式,具体参见表2。
表2 整合文本的输入格式示例表
每个评估模型的模型计算包括下面2个环节:
(1)句子级特征抽取:将原始的输入文本和对应的润色文本拼接为整合文本,将整合文本输入语言模型,其中,如图7所示,语言模型为前文所述的大语言模型,语言模型首先将整合文本处理为整合文本表示,语言模型再对整合文本表示进行特征提取处理,得到对应整合文本的整合特征H,整合特征H为语言模型在句末(End of Sequence,EOS)标签符(即[EOS]标签)位置的最后一层输出:
H = LLM(INPUT TEXT REWRITE TEXT)
其中,INPU TEXT为输入文本的内容,REWRITE TEXT为润色文本的内容,LLM(INPUTTEXT REWRITE TEXT)为语言模型以输入文本和润色文本拼接得到的整合文本为输入,经过特征提取处理得到的最后一层输出。
例如:输入文本为“待会去502开会”,润色文本为“一会儿到502开会”,将输入文本和润色文本拼接为整合文本“输入文本:待会去502开会 润色文本:一会儿到502开会”,将整合文本输入评估模型的语言模型中,语言模型首先对整合文本进行分词操作,将整合文本分割为一个个词元或字符,并在文本的起始处和结束出生成相应的特殊标记,如[CLS]和[EOS],例如,对于整合文本“输入文本:待会去502开会 润色文本:一会儿到502开会”,其分词结果的形式为[CLS]输入文本:待会去502开会 润色文本:一会儿到502开会[EOS]。
语言模型对整合文本的分词结果进行特征提取处理,其中,对整合文本中的每个字符进行特征提取时,只能结合在该字符及其之前的字符得到该字符的特征,最终,以整合文本的最后一个字符的特征,即对应[EOS]符号位置的字符为整合文本的整合特征H,输出对应整合文本的整合特征H:
H = LLM(输入文本:待会去502开会 润色文本:一会儿到502开会)
(2)打分模块:基于打分网络中的多层感知机(MLP,Multi-Layer Perceptron)对整合特征H进行映射处理,输出为评估实数,激活函数,例如Sigmoid函数,对评估实数进行处理,输出0-1之间的数值,作为对应整合特征的评估分数,以实现对整合文本的整合特征进行打分:
评估分数 = Sigmoid(MLP(H))
其中,MLP(H)为多层感知机输出的评估实数。
在模型训练过程中,需要对语义评估模型、语法评估模型以及排版评估模型分别进行训练。首先,针对不同的评估模型,分别收集对应的正样本和负样本。对应语义评估模型的样本,具体参见表3。
表3 语义评估模型的样本示例表
对应语法评估模型的样本,具体参见表4。
表4 语法评估模型的样本示例表
对应排版评估模型的样本,具体参见表5。
表5 排版评估模型的样本示例表
训练集中正样本的真实评估分数(即目标维度的真实评估结果)为1,负样本的真实评估分数为0。在收集足够的训练数据后(每类至少1万条),就可以进行模型训练。对应一个评估模型,其训练过程如下:
首先,根据对应关系,将正样本或负样本中的原始文本和对应的润色文本进行拼接,得到样本整合文本(即拼接文本样本)其中,样本整合文本包括正样本整合文本和负样本整合文本,输入到预训练模型中进行处理,得到预测分数。例如,输入文本x:“输入文本:待会去502开会 润色文本:一会儿到502开会”,对文本x进行分词操作,将文本x分割为一个个单独的词元或字符,并在文本开头和结尾添加特殊标记,分别[CLS]和[EOS],其中,[CLS]表示文本首位,[EOS]表示文本结束,得到分词结果:[CLS]输入文本:待会去502开会润色文本:一会儿到502开会[EOS],对分词结果中的各个字符进行文本表示,得到对应文本x的文本表示,对该文本表示进行特征提取处理,得到对应文本x的目标维度特征,调用打分网络中的多层感知器和激活函数对目标维度特征进行映射处理,即获得输出y:预测评估分数(即预测评估结果)。然后,基于预测评估分数和真实评估分数计算损失函数,基于损失函数对预训练模型和多层感知器的参数进行更新,得到评估模型。其中,当预测评估分数为预测排版评估分数,则基于预测排版评估分数和真实排版评估分数计算排版损失函数,基于排版损失函数对排版预训练模型和排版多层感知器的参数进行更新,得到排版评估模型;当预测评估分数为预测语义评估分数,则基于预测语义评估分数和真实语义评估分数计算语义损失函数,基于语义损失函数对语义预训练模型和语义多层感知器的参数进行更新,得到语义评估模型;当预测评估分数为预测语法评估分数,则基于预测语法评估分数和真实语法评估分数计算语法损失函数,基于语法损失函数对语法预训练模型和语法多层感知器的参数进行更新,得到语法评估模型。
最后,从正负样本中抽取10%作为测试集,使用测试集对每个评估模型进行模型测试,若测试准确率在90%以上,认为该评估模型训练完成。
可以理解的是,在本申请实施例中,涉及到用户信息等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
下面继续说明本申请实施例提供的基于人工智能的文本处理装置253的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器250的基于人工智能的文本处理装置253中的软件模块可以包括:
获取模块2531,用于获取第一整合文本,其中,第一整合文本是对第一原始文本进行修正处理得到的。拼接模块2532,用于对第一整合文本以及第一原始文本进行拼接处理,得到拼接文本。评估模块2533,用于对拼接文本进行多维度评估处理,得到对应每个维度的评估结果,其中,多维度评估处理包括以下至少两种:语义评估处理、语法评估处理、以及排版评估处理。融合模块2534,用于对至少两个维度的评估结果进行融合处理,得到第一整合文本的修正评估结果。
在一些实施例中,拼接模块2532,还用于获取拼接模版,基于拼接模版,对第一原始文本和第一整合文本进行拼接处理,得到拼接文本。
在一些实施例中,评估模块2533,还用于对拼接文本表示进行排版特征提取处理,得到对应拼接文本的排版特征,对排版特征进行排版映射处理,得到排版评估结果。
在一些实施例中,评估模块2533,还用于针对每个字符执行以下处理:对字符进行词表示处理,得到字符的词表示,基于字符所属的语句,对字符进行语句表示处理,得到字符的语句表示,其中,语句来源于拼接文,基于字符在拼接文本的位置,对字符进行位置表示处理,得到字符的位置表示,将对应字符的词表示、语句表示以及位置表示进行融合处理,得到对应字符的文本表示。
在一些实施例中,评估模块2533,还用于对拼接文本表示中的每个字符表示执行以下处理:当字符表示对应的字符是拼接文本的第一个字符时,对字符表示进行排版特征提取处理,得到字符的字符排版特征,当字符表示对应的字符不是拼接文本的第一个字符时,对字符表示以及拼接文本中排序在字符之前的在前字符进行排版特征提取处理,得到字符的字符排版特征,将拼接文本中最后一个字符的字符排版特征作为拼接文本的排版特征。
在一些实施例中,评估模块2533,还用于对排版特征进行多层感知处理,得到对应拼接文本的预测分数值,基于激活函数,对预测分数值进行归一化处理,得到排版评估分数,并将排版评估分数作为排版评估结果。
在一些实施例中,至少两个所述维度的评估结果包括语义评估结果、语法评估结果以及排版评估结果,融合模块2534,还用于获取与评估需求适配的权重组合,权重组合包括对应语义评估结果的第一权重、对应语法评估结果的第二权重以及对应排版评估结果的第三权重,基于权重组合对语义评估结果、语法评估结果以及排版评估结果进行加权求和处理,得到第一整合文本的修正评估结果。
在一些实施例中,评估模块2533,还用于获取第二整合文本,其中,第二整合文本是对第二原始文本进行修正处理得到的,对第二整合文本以及第二原始文本进行拼接处理,得到拼接文本样本,将拼接文本样本在预训练模型中进行正向传播处理,得到拼接文本样本在目标维度的预测评估结果,其中,目标维度来源于多维度,获取拼接文本样本在目标维度的真实评估结果,基于预测评估结果和目标维度的真实评估结果,确定损失函数,基于损失函数对预训练模型进行更新处理,得到评估模型,其中,评估模型用于对拼接文本执行目标维度的评估处理。
在一些实施例中,评估模块2533,还用于当第二原始文本与第二整合文本在目标维度为正样本关系时,将数值一确定为拼接文本样本在目标维度的真实评估结果,当第二原始文本与第二整合文本在目标维度为负样本关系时,将数值零确定为拼接文本样本在目标维度的真实评估结果。
在一些实施例中,评估模块2533,还用于调用预训练模型对拼接文本样本执行以下操作:对拼接文本样本中的每个样本字符进行文本表示处理,得到每个样本字符的样本文本表示,并将多个样本字符的样本文本表示拼接为拼接文本样本表示,对拼接文本样本表示进行对应所述目标维度的特征提取处理,得到在目标维度的文本样本特征,对文本样本特征进行多层感知处理,得到对应拼接文本样本在目标维度的样本预测分数值,基于激活函数,对样本预测分数值进行归一化处理,得到样本评估分数,其中,文本样本评估分数的取值范围为不小于0且不大于1,以样本评估分数作为拼接文本样本在目标维度的预测评估结果。
本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机可执行指令,该计算机可执行指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机可执行指令,处理器执行该计算机可执行指令,使得该电子设备执行本申请实施例上述的基于人工智能的文本处理方法。
本申请实施例提供一种存储有计算机可执行指令的计算机可读存储介质,其中存储有计算机可执行指令,当计算机可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的基于人工智能的文本处理方法,例如,如图3A示出的基于人工智能的文本处理方法。
在一些实施例中,计算机可读存储介质可以是RAM、ROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,计算机可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,计算机可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(Hyper TextMarkup Language,HTML)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,计算机可执行指令可被部署为在一个电子设备上执行,或者在位于一个地点的多个电子设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个电子设备上执行。
综上所述,通过本申请实施例,对应语义、语法、排版三个人工评估角度,设置对应的评估模型,使本申请实施例提供的基于人工智能的文本处理方法的评估效果与人工评估的评估效果的准确率接近,同时使用语言模型进行自动化评估,评估速度相比人工评估实现大幅提升,通过本申请实施例提供的基于人工智能的文本处理方法,可以快速发现文本润色模型的缺陷,科学指引后续的迭代方向。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (11)
1.一种基于人工智能的文本处理方法,其特征在于,所述方法包括:
获取第一整合文本,其中,所述第一整合文本是对第一原始文本进行修正处理得到的;
对所述第一整合文本以及所述第一原始文本进行拼接处理,得到拼接文本;
对所述拼接文本中每个字符进行文本表示处理,得到每个所述字符的文本表示,并将多个所述字符的文本表示拼接为拼接文本表示;
对所述拼接文本表示中的每个字符表示执行以下处理:当所述字符表示对应的字符是所述拼接文本的第一个字符时,对所述字符表示进行排版特征提取处理,得到所述字符的字符排版特征,当所述字符表示对应的字符不是所述拼接文本的第一个字符时,对所述字符表示以及所述拼接文本中排序在所述字符之前的在前字符进行排版特征提取处理,得到所述字符的字符排版特征,将所述拼接文本中最后一个字符的字符排版特征作为所述拼接文本的排版特征;
对所述排版特征进行排版映射处理,得到对应排版评估处理的评估结果;
对所述拼接文本进行语义评估处理以及语法评估处理中至少之一,得到对应的评估结果;
获取与评估需求适配的权重组合,所述权重组合包括对应所述排版评估处理的评估结果的第三权重、以及以下至少之一:对应所述语义评估处理的评估结果的第一权重、对应所述语法评估处理的评估结果的第二权重;
基于所述权重组合对至少两个评估结果进行加权求和处理,得到所述第一整合文本的修正评估结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一整合文本以及所述第一原始文本进行拼接处理,得到拼接文本,包括:
获取拼接模版;
基于所述拼接模版,对所述第一原始文本和所述第一整合文本进行拼接处理,得到所述拼接文本。
3.根据权利要求1所述的方法,其特征在于,所述对所述拼接文本中每个字符进行文本表示处理,得到每个所述字符的文本表示,包括:
针对每个所述字符执行以下处理:
对所述字符进行词表示处理,得到所述字符的词表示;
基于所述字符所属的语句,对所述字符进行语句表示处理,得到所述字符的语句表示,其中,所述语句来源于所述拼接文本;
基于所述字符在所述拼接文本的位置,对所述字符进行位置表示处理,得到所述字符的位置表示;
将对应所述字符的所述词表示、所述语句表示以及所述位置表示进行融合处理,得到对应所述字符的文本表示。
4.根据权利要求1所述的方法,其特征在于,所述对所述排版特征进行排版映射处理,得到对应排版评估处理的评估结果,包括:
对所述排版特征进行多层感知处理,得到对应所述拼接文本的预测分数值;
基于激活函数,对所述预测分数值进行归一化处理,得到排版评估分数,并将所述排版评估分数作为对应排版评估处理的评估结果。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第二整合文本,其中,所述第二整合文本是对第二原始文本进行修正处理得到的;
对所述第二整合文本以及所述第二原始文本进行拼接处理,得到拼接文本样本;
将所述拼接文本样本在预训练模型中进行正向传播处理,得到所述拼接文本样本在目标维度的预测评估结果,其中,所述目标维度来源于所述排版评估处理、所述语义评估处理以及所述语法评估处理;
获取所述拼接文本样本在所述目标维度的真实评估结果;
基于所述预测评估结果和所述目标维度的真实评估结果,确定损失函数,基于所述损失函数对所述预训练模型进行更新处理,得到评估模型,其中,所述评估模型用于对所述拼接文本执行所述目标维度的评估处理。
6.根据权利要求5所述的方法,其特征在于,所述获取所述拼接文本样本在所述目标维度的真实评估结果,包括:
当所述第二原始文本与所述第二整合文本在所述目标维度为正样本关系时,将数值一确定为所述拼接文本样本在所述目标维度的真实评估结果;
当所述第二原始文本与所述第二整合文本在所述目标维度为负样本关系时,将数值零确定为所述拼接文本样本在所述目标维度的真实评估结果。
7.根据权利要求5所述的方法,其特征在于,所述将所述拼接文本样本在预训练模型中进行正向传播处理,得到所述拼接文本样本在所述目标维度的预测评估结果,包括:
调用所述预训练模型对所述拼接文本样本执行以下操作:
对所述拼接文本样本中的每个样本字符进行文本表示处理,得到每个所述样本字符的样本文本表示,并将多个所述样本字符的样本文本表示拼接为拼接文本样本表示;
对所述拼接文本样本表示进行对应所述目标维度的特征提取处理,得到在所述目标维度的文本样本特征;
对所述文本样本特征进行多层感知处理,得到对应所述拼接文本样本在所述目标维度的样本预测分数值;
基于激活函数,对所述样本预测分数值进行归一化处理,得到样本评估分数,其中,所述文本样本评估分数的取值范围为不小于0且不大于1;
以所述样本评估分数作为所述拼接文本样本在所述目标维度的预测评估结果。
8.一种基于人工智能的文本处理装置,其特征在于,所述装置包括:
获取模块,用于获取第一整合文本,其中,所述第一整合文本是对第一原始文本进行修正处理得到的;
拼接模块,用于对所述第一整合文本以及所述第一原始文本进行拼接处理,得到拼接文本;
评估模块,用于对所述拼接文本中每个字符进行文本表示处理,得到每个所述字符的文本表示,并将多个所述字符的文本表示拼接为拼接文本表示;对所述拼接文本表示中的每个字符表示执行以下处理:当所述字符表示对应的字符是所述拼接文本的第一个字符时,对所述字符表示进行排版特征提取处理,得到所述字符的字符排版特征,当所述字符表示对应的字符不是所述拼接文本的第一个字符时,对所述字符表示以及所述拼接文本中排序在所述字符之前的在前字符进行排版特征提取处理,得到所述字符的字符排版特征,将所述拼接文本中最后一个字符的字符排版特征作为所述拼接文本的排版特征;对所述排版特征进行排版映射处理,得到对应排版评估处理的评估结果;对所述拼接文本进行语义评估处理以及语法评估处理中至少之一,得到对应的评估结果;
融合模块,用于获取与评估需求适配的权重组合,所述权重组合包括对应所述排版评估处理的评估结果的第三权重、以及以下至少之一:对应所述语义评估处理的评估结果的第一权重、对应所述语法评估处理的评估结果的第二权重;
所述融合模块,还基于所述权重组合对至少两个评估结果进行加权求和处理,得到所述第一整合文本的修正评估结果。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储计算机可执行指令;
处理器,用于执行所述存储器中存储的计算机可执行指令时,实现权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令被处理器执行时实现权利要求1至7任一项所述的方法。
11.一种计算机程序产品,包括计算机可执行指令,其特征在于,所述计算机可执行指令被处理器执行时实现权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410078244.5A CN117592468B (zh) | 2024-01-19 | 2024-01-19 | 基于人工智能的文本处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410078244.5A CN117592468B (zh) | 2024-01-19 | 2024-01-19 | 基于人工智能的文本处理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117592468A CN117592468A (zh) | 2024-02-23 |
CN117592468B true CN117592468B (zh) | 2024-05-03 |
Family
ID=89912011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410078244.5A Active CN117592468B (zh) | 2024-01-19 | 2024-01-19 | 基于人工智能的文本处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117592468B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488931A (zh) * | 2020-04-10 | 2020-08-04 | 腾讯科技(深圳)有限公司 | 文章质量评估方法、文章推荐方法及其对应的装置 |
CN116484842A (zh) * | 2022-01-14 | 2023-07-25 | 珠海金山办公软件有限公司 | 语句纠错的方法及装置、电子设备、存储介质 |
CN116629238A (zh) * | 2023-05-24 | 2023-08-22 | 平安科技(深圳)有限公司 | 文本增强质量评估方法、电子设备、存储介质 |
-
2024
- 2024-01-19 CN CN202410078244.5A patent/CN117592468B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488931A (zh) * | 2020-04-10 | 2020-08-04 | 腾讯科技(深圳)有限公司 | 文章质量评估方法、文章推荐方法及其对应的装置 |
CN116484842A (zh) * | 2022-01-14 | 2023-07-25 | 珠海金山办公软件有限公司 | 语句纠错的方法及装置、电子设备、存储介质 |
CN116629238A (zh) * | 2023-05-24 | 2023-08-22 | 平安科技(深圳)有限公司 | 文本增强质量评估方法、电子设备、存储介质 |
Non-Patent Citations (1)
Title |
---|
张庆宗 等.新编应用语言学导论.武汉大学出版社,2019,250-253. * |
Also Published As
Publication number | Publication date |
---|---|
CN117592468A (zh) | 2024-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7122341B2 (ja) | 翻訳品質を評価するための方法と装置 | |
García et al. | LearningML: a tool to foster computational thinking skills through practical artificial intelligence projects | |
Kenny | Human and machine translation | |
CN112199086B (zh) | 自动编程控制系统、方法、装置、电子设备及存储介质 | |
CN116700839B (zh) | 一种任务处理方法、装置、设备、存储介质及程序产品 | |
CN116756340A (zh) | 一种试题自动生成方法、系统及设备 | |
CN118296118A (zh) | 建筑标准知识问答模型构建方法、计算机程序产品、存储介质及电子设备 | |
Yuxiu | Application of translation technology based on AI in translation teaching | |
Kolluru et al. | Adaptive learning systems: Harnessing AI for customized educational experiences | |
CN113836894A (zh) | 多维度英语作文评分方法、装置及可读存储介质 | |
CN117786077A (zh) | 基于大语言模型的牲畜知识问答方法及装置 | |
KR20200058621A (ko) | 8품사 및 문장 내 사용역할로 성분을 구분하는 단순도해법을 이용한 영어문장 학습 서비스 제공 방법 | |
CN117093460A (zh) | 评估方法、装置、电子设备及计算机可读存储介质 | |
CN117592468B (zh) | 基于人工智能的文本处理方法、装置、设备及存储介质 | |
Tian | Application and analysis of artificial intelligence graphic element algorithm in digital media art design | |
CN114330285B (zh) | 语料处理方法、装置、电子设备及计算机可读存储介质 | |
CN116681088A (zh) | 一种基于大模型的翻译系统、方法及储存介质 | |
CN116069850A (zh) | 课堂活动课件制作方法、装置、存储介质以及电子设备 | |
CN114331932A (zh) | 目标图像生成方法和装置、计算设备以及计算机存储介质 | |
Liu et al. | An NLP-empowered virtual course assistant for online teaching and learning | |
CN111913563A (zh) | 一种基于半监督学习的人机交互方法及装置 | |
Leidner et al. | Language-Model Assisted Learning How to Program? | |
CN118070925B (zh) | 模型训练方法、装置、电子设备、存储介质及程序产品 | |
CN116453702B (zh) | 孤独症行为特征集的数据处理方法、设备、系统及介质 | |
Liu | A practical investigation of cultivating students’ art innovation ability based on word vector model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |