CN115188014B - 落地页处理方法、模型训练方法、装置及电子设备 - Google Patents
落地页处理方法、模型训练方法、装置及电子设备 Download PDFInfo
- Publication number
- CN115188014B CN115188014B CN202210712809.1A CN202210712809A CN115188014B CN 115188014 B CN115188014 B CN 115188014B CN 202210712809 A CN202210712809 A CN 202210712809A CN 115188014 B CN115188014 B CN 115188014B
- Authority
- CN
- China
- Prior art keywords
- information
- landing page
- document information
- sample
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 95
- 238000012549 training Methods 0.000 title claims abstract description 67
- 238000003672 processing method Methods 0.000 title claims abstract description 25
- 238000012545 processing Methods 0.000 claims description 86
- 230000008569 process Effects 0.000 claims description 50
- 230000002159 abnormal effect Effects 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 22
- 238000012795 verification Methods 0.000 claims description 21
- 238000012937 correction Methods 0.000 claims description 19
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 10
- 230000000452 restraining effect Effects 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 abstract description 2
- 238000004590 computer program Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 238000012550 audit Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Machine Translation (AREA)
Abstract
本公开提供了一种落地页处理方法、模型训练方法、装置及电子设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、NLP等技术领域。具体实现方案为:提取落地页的特征信息;基于所述特征信息,生成与所述落地页匹配的第一文案信息;在所述落地页上添加第一组件,所述第一组件用于展示所述第一文案信息。本公开可以提高落地页展示文案信息的效率。
Description
技术领域
本公开涉及计算机视觉、深度学习、自然语言处理(Natural LanguageProcessing,NLP)等人工智能技术领域,尤其涉及一种落地页处理方法、模型训练方法、装置及电子设备。
背景技术
落地页是向用户展示信息的页面,目前在一些落地页上可以展示一些文案信息,但目前的文案信息往往在落地页生成之前人工手动编辑的。
发明内容
本公开提供了一种落地页处理方法、模型训练方法、装置及电子设备。
根据本公开的一方面,提供了一种落地页处理方法,包括:
提取落地页的特征信息;
基于所述特征信息,生成与所述落地页匹配的第一文案信息;
在所述落地页上添加第一组件,所述第一组件用于展示所述第一文案信息。
根据本公开的另一方面,提供了一种模型训练方法,包括:
获取第一训练样本,所述第一训练样本包括落地页样本,以及所述落地页样本的文案样本;
将所述落地页样本输入到第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,所述文案信息预测处理包括:提取所述落地页样本的特征信息,并基于所述特征信息,生成所述预测文案信息;
基于所述文案样本和所述预测文案信息,更新所述第一模型的模型参数。
根据本公开的另一方面,提供了一种落地页处理装置,包括:
提取模块,用于提取落地页的特征信息;
第一生成模块,用于基于所述特征信息,生成与所述落地页匹配的第一文案信息;
第一添加模块,用于在所述落地页上添加第一组件,所述第一组件用于展示所述第一文案信息。
根据本公开的另一方面,提供了一种模型训练装置,包括:
第一获取模块,用于获取第一训练样本,所述第一训练样本包括落地页样本,以及所述落地页样本的文案样本;
预测模块,用于将所述落地页样本输入到第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,所述文案信息预测处理包括:提取所述落地页样本的特征信息,并基于所述特征信息,生成所述预测文案信息;
更新模块,用于基于所述文案样本和所述预测文案信息,更新所述第一模型的模型参数。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开提供的落地页处理方法,或者,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开提供的模型训练方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开提供的落地页处理方法,或者,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开提供的模型训练方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开提供的落地页处理方法,或者,所述计算机程序在被处理器执行时实现本公开提供的模型训练方法。
本公开中,由于直接基于落地页的特征信息,生成与落地页匹配的第一文案信息,并在落地页上添加用于展示第一文案信息的第一组件,从而可以提高落地页展示文案信息的效率。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开提供的一种落地页处理方法的流程图;
图2是本公开提供的一种落地页的示意图;
图3是本公开提供的一种模型训练方法的流程图;
图4是本公开提供的一种落地页处理方法的示意图;
图5a至图5c是本公开提供的落地页处理装置的结构图;
图6a至图6b是本公开提供的模型训练装置的结构图;
图7是用来实现本公开实施例的一种电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
请参见图1,图1是本公开提供的一种落地页处理方法的流程图,如图1所示,包括以下步骤:
步骤S101、提取落地页的特征信息。
其中,上述落地页可以广告落地页,也可以是展示其他多媒体信息的落地页,如企业的宣传多媒体信息。
上述提取落地页的特征信息可以是提取落地页的文本和图像中至少一项特征信息。例如:采用光学字符识别(Optical Character Recognition,OCR)提取落地页的文本特征信息。
步骤S102、基于所述特征信息,生成与所述落地页匹配的第一文案信息。
上述基于所述特征信息,生成与所述落地页匹配的第一文案信息可以是,在特征信息中提取第一文案信息,或者在特征信息中提取关键字,再基于该关键字生成第一文案信息,或者,通过文本生成模型基于上述特征信息预测上述第一文案信息。
本公开上述与落地页匹配的第一文案信息可以包括:与落地页匹配的文本文案信息,如该文本文案信息中的文本内容与落地页对应的产品、商家等匹配;或者,本公开上述与落地页匹配的第一文案信息可以包括:与落地页匹配的多媒体文案信息,该多媒体文案信息可以包括文本和图像,该多媒体文案信息中的文本内容与落地页对应的产品、商家等匹配,或者该多媒体文案信息中的图像内容与落地页对应的产品、商家等匹配。
在一些实施方式中,上述第一文案信息可以是营销文案信息。
步骤S103、在所述落地页上添加第一组件,所述第一组件用于展示所述第一文案信息。
上述第一组件可以是弹窗或者引导浮层,其中,引导浮层也可以称作引导蒙版。
上述在所述落地页上添加第一组件可以是,在落地页的预设位置上添加第一组件,如图2所示,在落地页的首部位置上添加第一组件201。
本公开中,在所述落地页上添加第一组件可以是,在落地页上叠加第一组件,这样不需要修改落地页原本布局,以降低落地页展示文案信息的复杂度。
上述第一组件用于展示所述第一文案信息可以是,在该组件显示第一文案信息,如图2所示,在第一组件201上显示包括“免费领取3套装修方案”文本的第一文案信息。
本公开中,在上述步骤中基于落地页的特征信息,生成与落地页匹配的第一文案信息,并在落地页上添加用于展示第一文案信息的第一组件。这样可以实现基于落地页的特征信息,在落地页上添加用于展示文案信息的组件,从而可以提高落地页展示文案信息的效率。
需要说明的是,本公开上述落地页处理方法由执行电子设备,即上述方法包括的所有步骤由该电子设备执行,该电子设备可以是服务器、计算机、手机等电子设备。
在一个实施例中,图1所示的实施例中的步骤S102,包括:
基于所述特征信息,生成与所述落地页匹配的候选文案信息;
对所述候选文案信息执行目标处理,得到所述第一文案信息;其中,所述目标处理包括如下至少一项:
修正处理、校验处理和审核处理。
上述基于所述特征信息,生成与所述落地页匹配的候选文案信息可以是,通过文本生成模型或者注意力算法生成与落地页匹配的候选文案信息。
上述修正处理可以是对候选文案信息中的信息内容进行修正,以得到更加精准的文案信息;上述校验处理对候选文案信息中的信息内容进行校验,以避免第一文案信息存在异常的信息内容;上述审核处理可以是对候选文案信息中的信息内容进行风控机审,以避免第一文案信息存在有风险的信息内容。
需要说明的是,该实施例在包括修正处理、校验处理和审核处理中的多项处理时,这多项处理的执行顺序可以不作限定,例如:可以是先进行修正处理,再执行校验处理,最后执行审核处理,又例如:可以是先进行校验处理,再执行修正处理,又例如:可以是先进行审核处理,再执行修正处理,最后执行审核处理。
该实施方式中,对候选文案信息执行了上述修正处理、校验处理和审核处理中至少一项的目标处理,通过修正处理可以得到更加精准的文案信息,通过校验处理可以避免第一文案信息存在异常的信息内容,通过审核处理可以避免第一文案信息存在有风险的信息内容,进而该实施方式,可以使得第一文案信息的文案效果更好。
需要说明的是,在本公开一些实施例中,也可以直接将上述候选文案信息作为上述第一文案信息,即不进行上述目标处理。
在一个实施例中,所述特征信息包括:文本信息,所述基于所述特征信息,生成与所述落地页匹配的候选文案信息,包括:
对所述文本信息进行向量编码,得到编码向量;
对所述编码向量进行注意力运算,得到注意力特征向量;
对所述注意力特征向量进行向量解码,得到所述候选文案信息。
其中,上述对所述文本信息进行向量编码,得到编码向量可以是,采用预先训练的编码模型或者文本生成模型中的编码模块,对所述文本信息进行向量编码,得到编码向量。
上述对所述编码向量进行注意力运算,得到注意力特征向量可以是,采用预先训练的注意力模型或者文本生成模型中的注意力模块或者注意力算法,对所述编码向量进行注意力运算,得到注意力特征向量。
上述对所述注意力特征向量进行向量解码,得到所述候选文案信息可以是,采用预先训练的解码模型或者文本生成模型中的解码模块,对所述注意力特征向量进行向量解码,得到所述候选文案信息。
该实施例中,由于对编码向量进行注意力运算,得到注意力特征向量,这样利用了注意力机制的特性,以提高第一文案信息的通顺性。
在一个实施例中,所述基于所述特征信息,生成与所述落地页匹配的候选文案信息,包括:
通过文本生成模型,基于所述特征信息生成与所述落地页匹配的候选文案信息;
其中,所述特征信息为将所述落地页作为所述文本生成模型的输入而提取的特征信息。
其中,上述文本生成模型可以是自然语言处理(Natural Language Processing,NLP)模型,如文心(ERNIE-GEN)模型,对此不作限定,在一些实施方式,上述文本生成模型也可以是注意力模型(attention model)等。
上述文本生成模型为预先训练好的用于生成候选文案信息的模型。
该实施例中,可以是将上述落地页作为上述文本生成模型,从而该文本生成模型提取上述特征信息,并基于该特征信息预测到上述候选文案信息。
该实施例中,由于通过文本生成模型生成候选文案信息,从而可以提高候选文案信息的生成效率。
在一个实施例中,上述修正处理包括如下至少一项:
对所述候选文案信息进行切字处理,得到切字结果,在所述切字结果存在叠字的情况下,对所述叠字进行过滤处理;
对所述候选文案信息进行切词处理,得到切词结果,在所述切词结果存在叠词的情况下,对所述叠词进行过滤处理;
对所述候选文案信息进行时间信息识别,得到时间信息识别结果,在所述时间信息识别结果存在与当前时间不匹配的异常时间信息的情况下,去除所述异常时间信息;
在所述候选文案信息长度超过预设长度的情况下,对所述候选文案信息进行精简处理;
在所述候选文案信息存在异常片段的情况下,去除所述异常片段,所述异常片段中重复字占比超过预设比例。
上述对叠字进行过滤处理可以是,删除叠字中的重复内容,如对于叠字“取取”则删除其中一个“取”。
上述对叠词进行过滤处理可以是,删除叠词中的重复内容,如对于叠字“预约预约”则删除其中一个“预约”。
上述与当前时间不匹配的异常时间信息可以是,与当前年份或者月份不匹配的异常时间信息,如当前是20X2年,则1999年则是异常时间信息,如当前是5月份,则1、2月份是异常时间信息。需要说明的是,在一些文案信息如果没有时间信息,则不需要执行时间信息处理。
上述候选文案信息长度超过预设长度可以理解为,上述候选文案信息长度过长,从而需要对该候选文案信息进行精简处理,该精简处理可以是提取该候选文案信息中的关键或者核心信息内容,达到精简的效果。
上述候选文案信息存在异常片段可以是,根据候选文案信息标点符号切片段,片段如果字面重复占比超过预设比例(例如:80%、50%等比例),去除所述异常片段。
该实施例中,由于执行上述至少一项修正处理,从而可以使得第一文案信息更加通顺、准确、简洁。
需要说明的是,该实施例中,对上述多项处理的执行顺序不作限定。
在一个实施例中,所述校验处理包括如下至少一项:
识别所述候选文案信息中的核心词,对所述核心词进行验证,其中,在所述落地页中包括所述核心词的情况下,所述核心词验证通过,在所述落地页中不包括所述核心词的情况下,所述核心词验证不通过,所述第一文案信息中的核心词为验证通过的核心词;
识别所述候选文案信息中的品牌信息,对所述品牌信息进行验证,其中,在所述品牌信息与所述落地页关联的品牌匹配的情况下,所述品牌信息验证通过,在所述品牌信息与所述落地页关联的品牌不匹配的情况下,所述品牌信息验证不通过,所述第一文案信息中的品牌信息为验证通过的品牌信息;
识别所述候选文案信息中的地域信息,对所述地域信息进行验证,其中,在所述落地页中包括所述地域信息的情况下,所述地域信息验证通过,在所述落地页中不包括所述地域信息的情况下,所述地域信息验证不通过,所述第一文案信息中的地域信息为验证通过的地域信息。
上述识别所述候选文案信息中的核心词可以是,通过专门的核心词识别模型识别核心词。
该实施例中,对于验证不通过的核心词、品牌信息和地域信息执行删除操作,以保证第一文案信息中的核心词、品牌信息和地域信息为验证通过的信息。
需要说明的是,该实施例中,在候选文案信息不包括品牌信息的情况下不执行品牌信息的验证,在不包括地域信息的情况下不执行地域信息的验证。
该实施方式中,由于执行上述至少一项校验处理,从而可以提高第一文案信息的准确性。
需要说明的是,该实施例中,对上述多项处理的执行顺序不作限定。
在一个实施例中,上述基于所述特征信息,生成与所述落地页匹配的候选文案信息包括:
基于所述特征信息,生成与所述落地页匹配的多个候选文案信息;
所述对所述候选文案信息执行目标处理,得到所述第一文案信息,包括:
对所述多个候选文案信息中的第一候选文案信息执行目标处理,得到所述第一文案信息;
在所述落地页上添加所述第一组件之后,还包括:
获取所述落地页的转化率;
在所述转化率满足预设调整条件的情况下,对所述多个候选文案信息中的第二候选文案信息执行所述目标处理,得到第二文案信息;
在所述落地页上添加第二组件,所述第二组件用于展示所述第二文案信息。
上述多个候选文案信息可以是上述文本生成模型输出的多个候选文案信息。
上述第一文案信息可以是在上述多个候选文案信息中随机选择,或者可以按照预设选择策略选择的,如优先选择长度最短的候选文案信息,或者优先选择长度适中的候选文案信息。
上述第二文案信息可以是在上述多个候选文案信息中随机选择,或者可以按照预设选择策略选择的,按照长度越短越优先选择的策略选择第二文案信息。
上述获取所述落地页的转化率可以是,统计在添加上述第一组件后一段时间上述落地页的转化率。
上述在转化率满足预设调整条件可以是,转化率低于预设转化率阈值,即在转化率低的情况下,调整落地页的文案信息。
该实施例中,在所述落地页上添加第二组件的情况下,可以删除或者保留上述第一组件。
该实施例中,由于在转化率满足预设调整条件的情况下,调整落地页的文案信息,这样可以实现灵活调整落地页的文案信息,从而有利于提高落地页的转化率。
在一个实施例中,上述落地页显示的第一组件或者第二组件还可以链接到用户信息录入页面,即在落地页显示后,若接收到针对上述第一组件或者第二组件的点击操作,则输出用户信息录入页面,以提高落地页的转化率。例如:显示如图2显示的页面内容202,该页面内容202用于录入用户信息。这样通过上述第一组件或者第二组件可以提高落地页的转化率。
本公开中,由于基于落地页特征信息,生成与落地页匹配的第一文案信息,并在落地页上添加用于展示第一文案信息的第一组件,这样可以实现基于落地页的特征信息,在落地页上添加用于展示文案信息的组件,从而可以提高落地页展示文案信息的效率。
请参见图3,图3是本公开提供的一种模型训练方法的流程图,如图3所示,包括以下步骤:
步骤S301、获取第一训练样本,所述第一训练样本包括落地页样本,以及所述落地页样本的文案样本。
上述第一训练样本可以包括某一特定时间段内收集的多个落地页对应的训练样本,每个落地页样本对应一个落地页,落地页样本的文案样本可以是包括OCR技术识别的页面图片文案,也可以是包括解析营销转化组件客户自提的文案,也可以包括落地页对应的客户自提的文本内容等。
步骤S302、将所述落地页样本输入到第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,所述文案信息预测处理包括:提取所述落地页样本的特征信息,并基于所述特征信息,生成所述预测文案信息。
上述第一模型可以是初始模型,也可以是经过预训练得到的模型,该模型为文本生成模型,如文心(ERNIE-GEN)模型,注意力模型(attention model)等。
其中,上述文案信息预测处理可以参见本公开提供的落地页处理方法实施例的相应说明,此处不作赘述。
步骤S303、基于所述文案样本和所述预测文案信息,更新所述第一模型的模型参数。
上述基于所述文案样本和所述预测文案信息,更新所述第一模型的模型参数可以是,依据文案样本和预测文案信息之间的差异更新所述第一模型的模型参数,直到第一模型收敛。
更新后的第一模型为用于生成落地页的文案信息的模型,如本公开提供的落地页处理方法实施例的文本生成模型。
本实施例中,通过上述步骤更新所述第一模型的模型参数,从而可以得到生成落地页的文案信息的模型,通过该模型可以提高落地页展示文案信息的效率。
另外,本申请实施例中,上述第一模型可以为ERNIE-GEN,这样依托ERNIE-GEN的算法,可以保证了文案信息通顺度高、业务一致、突出核心卖点的优势。
在一个实施例中,在图3所示的实施例的基础上,还包括:
获取第二训练样本,所述第二训练样本包括:无监督文本数据和文案数据;
基于所述第二训练样本对第二模型进行文本识别训练,得到所述第一模型。
上述无监督文本数据可以是多种类型的文本数据。
上述第二模型可以是预训练模型,具体是与第一模型为同一个模型,只是第一模型和第二模型采用不同的训练数据进行训练。
该实施例中,由于基于无监督文本数据和文案数据对第二模型进行文本识别训练,这样可以提高第一模型的文本识别效果。
在一个实施例中,所述落地页样本包括:第一落地页样本和第二落地页样本;
所述第一落地页样本的文案样本包括:所述第一落地页样本上显示的文案信息,或者,在目标文案信息插入通配字符得到的文案信息,所述目标文案信息为所述第一落地页样本上显示的文案信息;
所述第二落地页样本的文案样本包括:所述第二落地页样本关联的标题信息。
上述在第一落地页样本上显示的文案信息插入通配字符得到的文案信息可以理解为,在落地页上显示的文案信息插入通配字符,得到该落地页的文案样本。
上述通配字符可以是搜索的广告创意包含关键词通配字符,该关键词通配字符为落地页高转化率的关键词。
上述第二落地页样本关联的标题信息可以是,落地页的创意前卡标题。
该实施例中,通过插入通配字符得到的文案信息可以提高训练样本的质量,而通过落地页样本关联的标题信息可以得到更多训练样本,进而提高模型的文案信息预测效果。
在一个实施例中,所述将所述落地页样本输入到第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,包括:
将所述落地页样本和预设业务短语输入到第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,其中,所述预设业务短语用于对所述第一模型生成的预测文案信息进行约束。
上述预设业务短语可以是用户预先设定的业务短语。
上述预设业务短语用于对所述第一模型生成的预测文案信息进行约束可以是,约束输出的预测文案信息与业务短语的相关性,且由于通过在输入增加预设业务短语,这样方便模型理解和生成业务相关的预测文案信息,进而提高模型的文案信息预测效果。
需要说明的是,本公开提供的模型训练方法可以与本公开提供的落地页处理方法进行结合,例如:如图4所示,首先采用无监督文本数据和文案数据对第二模型进行训练,得到第一模型,再基于业务短语、落地页样本和文案信息对第一模型进行训练,得到用于生成候选文案信息的文本生成模型,之后通过该文本生成模型生成候选文案信息,再对候选文案信修正处理、校验处理和审核处理,最终得到用于在落地页上展示的文案信息。
需要说明的是,本实施例中,是以文本生成模型为ERNIE-GEN模型进行举例说明,该模型包括变压器编码(transformer encoder)、注意力(attention)和变压器解码(transformer decoder),且图4中的X1至X8分别表示不同的字。
请参见图5a,图5a是本公开提供的一种落地页处理装置,如图5a所示,落地页处理装置500包括:
提取模块501,用于提取落地页的特征信息;
第一生成模块502,用于基于所述特征信息,生成与所述落地页匹配的第一文案信息;
第一添加模块503,用于在所述落地页上添加第一组件,所述第一组件用于展示所述第一文案信息。
可选的,如图5b所示,所述第一生成模块502,包括:
生成单元5021,用于基于所述特征信息,生成与所述落地页匹配的候选文案信息;
处理单元5022,用于对所述候选文案信息执行目标处理,得到所述第一文案信息;其中,所述目标处理包括如下至少一项:
修正处理、校验处理和审核处理。
可选的,所述特征信息包括:文本信息,所述生成单元5021用于对所述文本信息进行向量编码,得到编码向量;对所述编码向量进行注意力运算,得到注意力特征向量;以及对所述注意力特征向量进行向量解码,得到所述候选文案信息。
可选的,所述生成单元5021用于通过文本生成模型,基于所述特征信息生成与所述落地页匹配的候选文案信息;
其中,所述特征信息为将所述落地页作为所述文本生成模型的输入而提取的特征信息。
可选的,所述修正处理包括如下至少一项:
对所述候选文案信息进行切字处理,得到切字结果,在所述切字结果存在叠字的情况下,对所述叠字进行过滤处理;
对所述候选文案信息进行切词处理,得到切词结果,在所述切词结果存在叠词的情况下,对所述叠词进行过滤处理;
对所述候选文案信息进行时间信息识别,得到时间信息识别结果,在所述时间信息识别结果存在与当前时间不匹配的异常时间信息的情况下,去除所述异常时间信息;
在所述候选文案信息长度超过预设长度的情况下,对所述候选文案信息进行精简处理;
在所述候选文案信息存在异常片段的情况下,去除所述异常片段,所述异常片段中重复字占比超过预设比例。
可选的,所述校验处理包括如下至少一项:
识别所述候选文案信息中的核心词,对所述核心词进行验证,其中,在所述落地页中包括所述核心词的情况下,所述核心词验证通过,在所述落地页中不包括所述核心词的情况下,所述核心词验证不通过,所述第一文案信息中的核心词为验证通过的核心词;
识别所述候选文案信息中的品牌信息,对所述品牌信息进行验证,其中,在所述品牌信息与所述落地页关联的品牌匹配的情况下,所述品牌信息验证通过,在所述品牌信息与所述落地页关联的品牌不匹配的情况下,所述品牌信息验证不通过,所述第一文案信息中的品牌信息为验证通过的品牌信息;
识别所述候选文案信息中的地域信息,对所述地域信息进行验证,其中,在所述落地页中包括所述地域信息的情况下,所述地域信息验证通过,在所述落地页中不包括所述地域信息的情况下,所述地域信息验证不通过,所述第一文案信息中的地域信息为验证通过的地域信息。
可选的,所述生成单元5021用于基于所述特征信息,生成与所述落地页匹配的多个候选文案信息;
所述处理单元5022用于对所述多个候选文案信息中的第一候选文案信息执行目标处理,得到所述第一文案信息;
如图5c所示,所述装置还包括:
获取模块504,用于获取所述落地页的转化率;
第二生成模块505,用于在所述转化率满足预设调整条件的情况下,对所述多个候选文案信息中的第二候选文案信息执行所述目标处理,得到第二文案信息;
第二添加模块506,用于在所述落地页上添加第二组件,所述第二组件用于展示所述第二文案信息。
本公开提供的落地页处理装置能够实现本公开提供的落地页处理方法实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
请参见图6a,图6a是本公开提供的一种模型训练装置,如图6a所示,模型训练装置600包括:
第一获取模块601,用于获取第一训练样本,所述第一训练样本包括落地页样本,以及所述落地页样本的文案样本;
预测模块602,用于将所述落地页样本输入到第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,所述文案信息预测处理包括:提取所述落地页样本的特征信息,并基于所述特征信息,生成所述预测文案信息;
更新模块603,用于基于所述文案样本和所述预测文案信息,更新所述第一模型的模型参数。
可选的,如图6b所示,还包括:
第二获取模块604,用于获取第二训练样本,所述第二训练样本包括:无监督文本数据和文案数据;
训练模块605,用于基于所述第二训练样本对第二模型进行文本识别训练,得到所述第一模型。
可选的,所述落地页样本包括:第一落地页样本和第二落地页样本;
所述第一落地页样本的文案样本包括:所述第一落地页样本上显示的文案信息,或者,在目标文案信息插入通配字符得到的文案信息,所述目标文案信息为所述第一落地页样本上显示的文案信息;
所述第二落地页样本的文案样本包括:所述第二落地页样本关联的标题信息。
可选的,所述预测模块602用于将所述落地页样本和预设业务短语输入到第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,其中,所述预设业务短语用于对所述第一模型生成的预测文案信息进行约束。
本公开提供的模型训练装置能够实现本公开提供的模型训练方法实现的各个过程,并达到相同的技术效果,为避免重复,这里不再赘述。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
其中,上述电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开提供落地页处理方法或者模型训练方法。
上述可读存储介质存储有计算机指令,其中,所述计算机指令用于使所述计算机执行本公开提供的落地页处理方法或者模型训练方法。
上述计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开提供的落地页处理方法或者模型训练方法。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如落地页处理方法或者模型训练方法。例如,在一些实施例中,落地页处理方法或者模型训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的落地页处理方法或者模型训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行落地页处理方法或者模型训练方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (18)
1.一种落地页处理方法,包括:
提取落地页的特征信息;
基于所述特征信息,生成与所述落地页匹配的第一文案信息;
在所述落地页上添加第一组件,所述第一组件用于展示所述第一文案信息,所述第一组件还链接到用户信息录入页面;
其中,所述基于所述特征信息,生成与所述落地页匹配的第一文案信息,包括:
通过第一模型,基于所述特征信息,生成与所述落地页匹配的多个候选文案信息,所述第一模型的训练过程包括:将落地页样本和预设业务短语输入到所述第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,其中,所述预设业务短语用于对所述第一模型生成的预测文案信息进行约束,所述约束为约束输出的预测文案信息与所述预设业务短语的相关性;
对所述多个候选文案信息中的第一候选文案信息执行目标处理,得到所述第一文案信息,所述第一文案信息包括文本和图像;其中,所述目标处理包括如下至少一项:修正处理、校验处理和审核处理;
在所述落地页上添加所述第一组件之后,还包括:
获取所述落地页的转化率;
在所述转化率满足预设调整条件的情况下,对所述多个候选文案信息中的第二候选文案信息执行所述目标处理,得到第二文案信息;
在所述落地页上添加第二组件,并保留所述第一组件,所述第二组件用于展示所述第二文案信息,所述第二组件还链接到用户信息录入页面。
2.根据权利要求1所述的方法,其中,所述特征信息包括:文本信息,所述基于所述特征信息,生成与所述落地页匹配的候选文案信息,包括:
对所述文本信息进行向量编码,得到编码向量;
对所述编码向量进行注意力运算,得到注意力特征向量;
对所述注意力特征向量进行向量解码,得到所述候选文案信息。
3.根据权利要求1所述的方法,其中,所述基于所述特征信息,生成与所述落地页匹配的候选文案信息,包括:
通过文本生成模型,基于所述特征信息生成与所述落地页匹配的候选文案信息;
其中,所述特征信息为将所述落地页作为所述文本生成模型的输入而提取的特征信息。
4.根据权利要求1至3中任一项所述的方法,其中,所述修正处理包括如下至少一项:
对所述候选文案信息进行切字处理,得到切字结果,在所述切字结果存在叠字的情况下,对所述叠字进行过滤处理;
对所述候选文案信息进行切词处理,得到切词结果,在所述切词结果存在叠词的情况下,对所述叠词进行过滤处理;
对所述候选文案信息进行时间信息识别,得到时间信息识别结果,在所述时间信息识别结果存在与当前时间不匹配的异常时间信息的情况下,去除所述异常时间信息;
在所述候选文案信息长度超过预设长度的情况下,对所述候选文案信息进行精简处理;
在所述候选文案信息存在异常片段的情况下,去除所述异常片段,所述异常片段中重复字占比超过预设比例。
5.根据权利要求1至3中任一项所述的方法,其中,所述校验处理包括如下至少一项:
识别所述候选文案信息中的核心词,对所述核心词进行验证,其中,在所述落地页中包括所述核心词的情况下,所述核心词验证通过,在所述落地页中不包括所述核心词的情况下,所述核心词验证不通过,所述第一文案信息中的核心词为验证通过的核心词;
识别所述候选文案信息中的品牌信息,对所述品牌信息进行验证,其中,在所述品牌信息与所述落地页关联的品牌匹配的情况下,所述品牌信息验证通过,在所述品牌信息与所述落地页关联的品牌不匹配的情况下,所述品牌信息验证不通过,所述第一文案信息中的品牌信息为验证通过的品牌信息;
识别所述候选文案信息中的地域信息,对所述地域信息进行验证,其中,在所述落地页中包括所述地域信息的情况下,所述地域信息验证通过,在所述落地页中不包括所述地域信息的情况下,所述地域信息验证不通过,所述第一文案信息中的地域信息为验证通过的地域信息。
6.一种模型训练方法,包括:
获取第一训练样本,所述第一训练样本包括落地页样本,以及所述落地页样本的文案样本;
将所述落地页样本输入到第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,所述文案信息预测处理包括:提取所述落地页样本的特征信息,并基于所述特征信息,生成所述预测文案信息;
基于所述文案样本和所述预测文案信息,更新所述第一模型的模型参数,所述第一模型用于基于落地页的特征信息,生成与所述落地页匹配的多个候选文案信息,所述多个候选文案信息用于在所述落地页添加用于展示第一文案信息的第一组件后,在所述落地页的转化率满足预设调整条件的情况下,在所述落地页上添加第二组件,并保留所述第一组件,所述第二组件用于展示第二文案信息,所述第一组件和第二组件还链接到用户信息录入页面,所述第一文案信息为对所述多个候选文案信息中的第一候选文案信息执行目标处理得到的第一文案信息,所述第一文案信息包括文本和图像,所述第二文案信息为对所述多个候选文案信息中的第二候选文案信息执行所述目标处理得到的第二文案信息;其中,所述目标处理包括如下至少一项:修正处理、校验处理和审核处理;
其中,所述将所述落地页样本输入到第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,包括:
将所述落地页样本和预设业务短语输入到第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,其中,所述预设业务短语用于对所述第一模型生成的预测文案信息进行约束,所述约束为约束输出的预测文案信息与所述预设业务短语的相关性。
7.根据权利要求6所述的方法,还包括:
获取第二训练样本,所述第二训练样本包括:无监督文本数据和文案数据;
基于所述第二训练样本对第二模型进行文本识别训练,得到所述第一模型。
8.根据权利要求6所述的方法,其中,所述落地页样本包括:第一落地页样本和第二落地页样本;
所述第一落地页样本的文案样本包括:所述第一落地页样本上显示的文案信息,或者,在目标文案信息插入通配字符得到的文案信息,所述目标文案信息为所述第一落地页样本上显示的文案信息;
所述第二落地页样本的文案样本包括:所述第二落地页样本关联的标题信息。
9.一种落地页处理装置,包括:
提取模块,用于提取落地页的特征信息;
第一生成模块,用于基于所述特征信息,生成与所述落地页匹配的第一文案信息;
第一添加模块,用于在所述落地页上添加第一组件,所述第一组件用于展示所述第一文案信息,所述第一组件还链接到用户信息录入页面;
其中,所述第一生成模块,包括:
生成单元,用于通过第一模型,基于所述特征信息,生成与所述落地页匹配的多个候选文案信息,所述第一模型的训练过程包括:将落地页样本和预设业务短语输入到所述第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,其中,所述预设业务短语用于对所述第一模型生成的预测文案信息进行约束,所述约束为约束输出的预测文案信息与所述预设业务短语的相关性;
处理单元,用于对所述多个候选文案信息中的第一候选文案信息执行目标处理,得到所述第一文案信息,所述第一文案信息包括文本和图像;其中,所述目标处理包括如下至少一项:修正处理、校验处理和审核处理;
所述装置还包括:
获取模块,用于获取所述落地页的转化率;
第二生成模块,用于在所述转化率满足预设调整条件的情况下,对所述多个候选文案信息中的第二候选文案信息执行所述目标处理,得到第二文案信息;
第二添加模块,用于在所述落地页上添加第二组件,并保留所述第一组件,所述第二组件用于展示所述第二文案信息,所述第二组件还链接到用户信息录入页面。
10.根据权利要求9所述的装置,其中,所述特征信息包括:文本信息,所述生成单元用于对所述文本信息进行向量编码,得到编码向量;对所述编码向量进行注意力运算,得到注意力特征向量;以及对所述注意力特征向量进行向量解码,得到所述候选文案信息。
11.根据权利要求9所述的装置,其中,所述生成单元用于通过文本生成模型,基于所述特征信息生成与所述落地页匹配的候选文案信息;
其中,所述特征信息为将所述落地页作为所述文本生成模型的输入而提取的特征信息。
12.根据权利要求9至11中任一项所述的装置,其中,所述修正处理包括如下至少一项:
对所述候选文案信息进行切字处理,得到切字结果,在所述切字结果存在叠字的情况下,对所述叠字进行过滤处理;
对所述候选文案信息进行切词处理,得到切词结果,在所述切词结果存在叠词的情况下,对所述叠词进行过滤处理;
对所述候选文案信息进行时间信息识别,得到时间信息识别结果,在所述时间信息识别结果存在与当前时间不匹配的异常时间信息的情况下,去除所述异常时间信息;
在所述候选文案信息长度超过预设长度的情况下,对所述候选文案信息进行精简处理;
在所述候选文案信息存在异常片段的情况下,去除所述异常片段,所述异常片段中重复字占比超过预设比例。
13.根据权利要求9至11中任一项所述的装置,其中,所述校验处理包括如下至少一项:
识别所述候选文案信息中的核心词,对所述核心词进行验证,其中,在所述落地页中包括所述核心词的情况下,所述核心词验证通过,在所述落地页中不包括所述核心词的情况下,所述核心词验证不通过,所述第一文案信息中的核心词为验证通过的核心词;
识别所述候选文案信息中的品牌信息,对所述品牌信息进行验证,其中,在所述品牌信息与所述落地页关联的品牌匹配的情况下,所述品牌信息验证通过,在所述品牌信息与所述落地页关联的品牌不匹配的情况下,所述品牌信息验证不通过,所述第一文案信息中的品牌信息为验证通过的品牌信息;
识别所述候选文案信息中的地域信息,对所述地域信息进行验证,其中,在所述落地页中包括所述地域信息的情况下,所述地域信息验证通过,在所述落地页中不包括所述地域信息的情况下,所述地域信息验证不通过,所述第一文案信息中的地域信息为验证通过的地域信息。
14.一种模型训练装置,包括:
第一获取模块,用于获取第一训练样本,所述第一训练样本包括落地页样本,以及所述落地页样本的文案样本;
预测模块,用于将所述落地页样本输入到第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,所述文案信息预测处理包括:提取所述落地页样本的特征信息,并基于所述特征信息,生成所述预测文案信息;
更新模块,用于基于所述文案样本和所述预测文案信息,更新所述第一模型的模型参数,所述第一模型用于基于落地页的特征信息,生成与所述落地页匹配的多个候选文案信息,所述多个候选文案信息用于在所述落地页添加用于展示第一文案信息的第一组件后,在所述落地页的转化率满足预设调整条件的情况下,在所述落地页上添加第二组件,并保留所述第一组件,所述第二组件用于展示第二文案信息,所述第一组件和第二组件还链接到用户信息录入页面,所述第一文案信息为对所述多个候选文案信息中的第一候选文案信息执行目标处理得到的第一文案信息,所述第一文案信息包括文本和图像,所述第二文案信息为对所述多个候选文案信息中的第二候选文案信息执行所述目标处理得到的第二文案信息;其中,所述目标处理包括如下至少一项:修正处理、校验处理和审核处理;
其中,所述预测模块用于将所述落地页样本和预设业务短语输入到第一模型进行文案信息预测处理,得到所述落地页样本的预测文案信息,其中,所述预设业务短语用于对所述第一模型生成的预测文案信息进行约束,所述约束为约束输出的预测文案信息与所述预设业务短语的相关性。
15.根据权利要求14所述的装置,还包括:
第二获取模块,用于获取第二训练样本,所述第二训练样本包括:无监督文本数据和文案数据;
训练模块,用于基于所述第二训练样本对第二模型进行文本识别训练,得到所述第一模型。
16.根据权利要求14所述的装置,其中,所述落地页样本包括:第一落地页样本和第二落地页样本;
所述第一落地页样本的文案样本包括:所述第一落地页样本上显示的文案信息,或者,在目标文案信息插入通配字符得到的文案信息,所述目标文案信息为所述第一落地页样本上显示的文案信息;
所述第二落地页样本的文案样本包括:所述第二落地页样本关联的标题信息。
17. 一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法,或者,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求6-8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-5中任一项所述的方法,或者,所述计算机指令用于使所述计算机执行根据权利要求6-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210712809.1A CN115188014B (zh) | 2022-06-22 | 2022-06-22 | 落地页处理方法、模型训练方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210712809.1A CN115188014B (zh) | 2022-06-22 | 2022-06-22 | 落地页处理方法、模型训练方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115188014A CN115188014A (zh) | 2022-10-14 |
CN115188014B true CN115188014B (zh) | 2023-11-14 |
Family
ID=83515045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210712809.1A Active CN115188014B (zh) | 2022-06-22 | 2022-06-22 | 落地页处理方法、模型训练方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115188014B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522015A (zh) * | 2018-08-27 | 2019-03-26 | 重庆富民银行股份有限公司 | 银行业务引导页面生成系统 |
CN112487826A (zh) * | 2020-11-30 | 2021-03-12 | 北京百度网讯科技有限公司 | 信息抽取方法、抽取模型训练方法、装置以及电子设备 |
CN113656733A (zh) * | 2021-08-17 | 2021-11-16 | 北京百度网讯科技有限公司 | 一种落地页生成方法、装置、电子设备及存储介质 |
CN114547492A (zh) * | 2022-02-18 | 2022-05-27 | 北京百度网讯科技有限公司 | 生成模型的训练方法、文案生成方法、装置、设备和介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111625635B (zh) * | 2020-05-27 | 2023-09-29 | 北京百度网讯科技有限公司 | 问答处理方法、装置、设备及存储介质 |
-
2022
- 2022-06-22 CN CN202210712809.1A patent/CN115188014B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522015A (zh) * | 2018-08-27 | 2019-03-26 | 重庆富民银行股份有限公司 | 银行业务引导页面生成系统 |
CN112487826A (zh) * | 2020-11-30 | 2021-03-12 | 北京百度网讯科技有限公司 | 信息抽取方法、抽取模型训练方法、装置以及电子设备 |
CN113656733A (zh) * | 2021-08-17 | 2021-11-16 | 北京百度网讯科技有限公司 | 一种落地页生成方法、装置、电子设备及存储介质 |
CN114547492A (zh) * | 2022-02-18 | 2022-05-27 | 北京百度网讯科技有限公司 | 生成模型的训练方法、文案生成方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115188014A (zh) | 2022-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113807098A (zh) | 模型训练方法和装置、电子设备以及存储介质 | |
CN112597753A (zh) | 文本纠错处理方法、装置、电子设备和存储介质 | |
CN113407610B (zh) | 信息抽取方法、装置、电子设备和可读存储介质 | |
CN115982376A (zh) | 基于文本、多模数据和知识训练模型的方法和装置 | |
CN113053367A (zh) | 语音识别方法、语音识别的模型训练方法以及装置 | |
CN113657395A (zh) | 文本识别方法、视觉特征提取模型的训练方法及装置 | |
CN114218889A (zh) | 文档处理及文档模型的训练方法、装置、设备和存储介质 | |
CN114861637A (zh) | 拼写纠错模型生成方法和装置、拼写纠错方法和装置 | |
CN107766498A (zh) | 用于生成信息的方法和装置 | |
CN114564971A (zh) | 深度学习模型的训练方法、文本数据处理方法和装置 | |
CN113361523A (zh) | 文本确定方法、装置、电子设备和计算机可读存储介质 | |
CN110852057A (zh) | 一种计算文本相似度的方法和装置 | |
CN115952854B (zh) | 文本脱敏模型的训练方法、文本脱敏方法及应用 | |
CN115188014B (zh) | 落地页处理方法、模型训练方法、装置及电子设备 | |
CN114880520B (zh) | 视频标题生成方法、装置、电子设备和介质 | |
CN114118049B (zh) | 信息获取方法、装置、电子设备及存储介质 | |
CN115496734A (zh) | 视频内容的质量评价方法、网络训练方法和装置 | |
CN115565186A (zh) | 文字识别模型的训练方法、装置、电子设备和存储介质 | |
CN113361522B (zh) | 用于确定字符序列的方法、装置和电子设备 | |
CN115481599A (zh) | 文档的处理方法、装置、电子设备和存储介质 | |
CN115631502A (zh) | 文字识别方法、装置、模型训练方法、电子设备及介质 | |
CN110895655A (zh) | 提取文本核心短语的方法和装置 | |
CN115359323A (zh) | 图像的文本信息生成方法和深度学习模型的训练方法 | |
CN114398952A (zh) | 训练文本生成方法、装置、电子设备及存储介质 | |
CN114841175A (zh) | 机器翻译方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |