CN112231605A - 信息展示的方法和装置 - Google Patents

信息展示的方法和装置 Download PDF

Info

Publication number
CN112231605A
CN112231605A CN202011073268.XA CN202011073268A CN112231605A CN 112231605 A CN112231605 A CN 112231605A CN 202011073268 A CN202011073268 A CN 202011073268A CN 112231605 A CN112231605 A CN 112231605A
Authority
CN
China
Prior art keywords
data
display
expression
text data
display text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202011073268.XA
Other languages
English (en)
Inventor
朱静雅
欧阳欣
何正球
周会
林振飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN202011073268.XA priority Critical patent/CN112231605A/zh
Publication of CN112231605A publication Critical patent/CN112231605A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种信息展示的方法和装置,属于计算机应用技术领域。所述方法包括:获取存储的各展示对象的至少一个展示文本数据;基于获取的每个展示文本数据和经过训练的表情插入模型,分别确定每个展示文本数据对应的插入表情数据后的展示文本数据;将存储的所述各展示对象的至少一个展示文本数据,分别更新为对应的插入表情数据后的展示文本数据;当接收到信息展示请求时,确定待展示的目标展示对象,基于所述目标展示对象的插入表情数据后的展示文本数据,对所述信息展示请求进行反馈。采用本申请,就不需要人工在展示文本数据中插入表情数据了,节省了大量的人力物力,同时也节省了时间。

Description

信息展示的方法和装置
技术领域
本申请涉及计算机应用技术领域,特别涉及一种信息展示的方法和装置。
背景技术
随着互联网的发展,人们在网上聊天或者观看一些讯息越来越便捷,一些应用程序也开始向用户推送一些展示文本数据,例如,内容介绍语、广告推荐语等。在推送展示文本数据的过程中,相关人员发现插入了表情数据的展示文本数据的点击率明显比较高,但大部分的展示文本数据是没有插入表情数据的,且人工插入表情数据的情况需要大量的人力物力,耗费时间较长。
发明内容
本申请实施例提供了一种信息展示的方法,能够解决现有技术中人工对展示文本数据添加表情时需要大量的人力物力,且耗费时间较长的问题。所述技术方案如下:
第一方面,提供了一种信息展示的方法,所述方法包括:
获取存储的各展示对象的至少一个展示文本数据;
基于获取的每个展示文本数据和经过训练的表情插入模型,分别确定每个展示文本数据对应的插入表情数据后的展示文本数据;
将存储的所述各展示对象的至少一个展示文本数据,分别更新为对应的插入表情数据后的展示文本数据;
当接收到信息展示请求时,确定待展示的目标展示对象,基于所述目标展示对象的插入表情数据后的展示文本数据,对所述信息展示请求进行反馈。
在一种可能的设计中,所述基于获取的每个展示文本数据和经过训练的表情插入模型,分别确定每个展示文本数据对应的插入表情数据后的展示文本数据,包括:
对于每个展示文本数据,对所述展示文本数据进行分词处理得到多个词语数据,将所述多个词语数据,按照在所述展示文本数据中的排列顺序,输入到经过训练的表情插入模型中,得到所述展示文本数据对应的插入表情数据后的展示文本数据。
在一种可能的设计中,其特征在于,所述获取各展示对象的至少一个展示文本数据之前,还包括:
获取样本输入数据和基准输出数据,其中,所述样本输入数据为样本展示文本数据,所述基准输出数据是插入有表情数据的样本展示文本数据;
对所述样本输入数据进行分词处理得到多个样本词语数据;
将所述多个样本词语数据,按照在所述样本输入数据中的排列顺序,输入到初始的表情插入模型中,得到所述样本输入数据对应的实际输出数据;
基于所述实际输出数据和所述基准输出数据,对所述初始的表情插入模型进行训练,得到所述经过训练的表情插入模型。
在一种可能的设计中,所述获取样本输入数据和基准输出数据,包括:
获取存储的各展示对象的评论数据;
在所述各展示对象的评论数据中,获取插入有表情数据的评论数据,作为基准输出数据;
在所述基准输出数据中去除表情数据,得到所述样本输入数据。
在一种可能的设计中,所述获取样本输入数据和基准输出数据,包括:
获取存储的各展示对象的评论数据;
在所述各展示对象的评论数据中,获取未插入有表情数据的评论数据,作为样本输入数据;
对所述样本输入数据进行分词处理得到多个样本词语数据;
按照在所述样本输入数据中的排列顺序,显示所述多个样本词语数据,并在相邻的样本词语数据之间显示插入位;
当检测到对应目标插入位的选择指令时,获取输入的表情数据,将输入的表情数据插入到所述样本输入数据的所述目标插入位,得到所述基准输出数据。
在一种可能的设计中,所述获取各展示对象的至少一个展示文本数据,包括:
获取各展示对象的至少一个未插入有表情数据的评论数据,作为展示文本数据。
在一种可能的设计中,所述信息展示请求中携带有目标位置;
所述确定待展示的目标展示对象,包括:
基于所述目标位置和各展示对象的位置,确定与所述目标位置满足预设接近条件的目标展示对象。
第二方面,提供一种信息展示的装置,所述装置包括:
获取模块,用于获取存储的各展示对象的至少一个展示文本数据;
确定模块,用于基于获取的每个展示文本数据和经过训练的表情插入模型,分别确定每个展示文本数据对应的插入表情数据后的展示文本数据;
更新模块,用于将存储的所述各展示对象的至少一个展示文本数据,分别更新为对应的插入表情数据后的展示文本数据;
展示模块,用于当接收到信息展示请求时,确定待展示的目标展示对象,基于所述目标展示对象的插入表情数据后的展示文本数据,对所述信息展示请求进行反馈。
在一种可能的设计中,所述确定模块,用于:
对于每个展示文本数据,对所述展示文本数据进行分词处理得到多个词语数据,将所述多个词语数据,按照在所述展示文本数据中的排列顺序,输入到经过训练的表情插入模型中,得到所述展示文本数据对应的插入表情数据后的展示文本数据。
在一种可能的设计中,所述确定模块,还用于:
获取样本输入数据和基准输出数据,其中,所述样本输入数据为样本展示文本数据,所述基准输出数据是插入有表情数据的样本展示文本数据;
对所述样本输入数据进行分词处理得到多个样本词语数据;
将所述多个样本词语数据,按照在所述样本输入数据中的排列顺序,输入到初始的表情插入模型中,得到所述样本输入数据对应的实际输出数据;
基于所述实际输出数据和所述基准输出数据,对所述初始的表情插入模型进行训练,得到所述经过训练的表情插入模型。
在一种可能的设计中,所述确定模块,用于:
获取存储的各展示对象的评论数据;
在所述各展示对象的评论数据中,获取插入有表情数据的评论数据,作为基准输出数据;
在所述基准输出数据中去除表情数据,得到所述样本输入数据。
在一种可能的设计中,所述确定模块,用于:
获取存储的各展示对象的评论数据;
在所述各展示对象的评论数据中,获取未插入有表情数据的评论数据,作为样本输入数据;
对所述样本输入数据进行分词处理得到多个样本词语数据;
按照在所述样本输入数据中的排列顺序,显示所述多个样本词语数据,并在相邻的样本词语数据之间显示插入位;
当检测到对应目标插入位的选择指令时,获取输入的表情数据,将输入的表情数据插入到所述样本输入数据的所述目标插入位,得到所述基准输出数据。
在一种可能的设计中,所述获取模块,用于:
获取各展示对象的至少一个未插入有表情数据的评论数据,作为展示文本数据。
在一种可能的设计中,所述信息展示请求中携带有目标位置;
所述展示模块,用于:
基于所述目标位置和各展示对象的位置,确定与所述目标位置满足预设接近条件的目标展示对象。
第三方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,存储器中存储有至少一条指令,指令由处理器加载并执行以实现信息展示的方法所执行的操作。
第四方面,提供了一种计算机可读存储介质,存储介质中存储有至少一条指令,指令由处理器加载并执行以实现信息展示的方法所执行的操作。
在本申请实施例中,基于经过训练的表情插入模型,确定展示文本数据对应的插入表情数据后的展示文本数据,然后将存储在数据库内的展示文本数据,更新为插入表情数据后的展示文本数据,当接收到用户终端发送的信息展示请求时,确定出待展示的目标展示对象,然后基于插入表情数据后的展示文本数据,对该信息展示请求进行反馈。这样,可以通过计算机自动在展示文本数据中添加表情数据,不需要人工操作,节省了大量的人力物力,同时也节省了时间。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种信息展示的方法流程图;
图2是本申请实施例提供的一种信息展示的方法流程图;
图3是本申请实施例提供的一种表情插入模型的结构示意图图;
图4是本申请实施例提供的一种信息展示的装置的结构示意图;
图5是本申请实施例提供的一种服务器的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本申请实施例提供了一种信息展示的方法,该方法可以由计算机设备实现。计算机设备可以是服务器或服务器集群。
服务器可以是某个需要进行展示文本数据推送的应用程序的后台服务器,例如,餐饮应用程序、购物应用程序、音乐应用程序等。服务器可以包括处理器、存储器、天线等。处理器可以用于读取指令和对数据进行处理,例如,对展示文本数据进行分词处理、词语数据在表情插入模型中进行的处理、对表情插入模型进行训练时的相应处理,等等。存储器可以存储信息展示过程需要预先存储的数据或信息展示过程中产生的中间数据或最终数据,例如,存储的各展示对象的至少一个展示文本数据、表情插入模型进行训练时的数据、在为展示文本数据插入表情数据的处理过程中产生的中间数据、插入表情数据后的展示文本数据,等等。天线可以用于接收和发送信号,例如,对信息展示请求的信号的接收,对信息展示请求进行反馈时发送的信号,等等。
图1是本申请实施例提供的一种信息展示的方法的流程图。参见图1,该实施例包括:
101、获取存储的各展示对象的至少一个展示文本数据。
其中,展示对象是在应用程序中需要对用户展示的主体,如餐饮应用程序中的商家或餐品、购物应用程序中的商家或商品、音乐应用程序中的歌曲音频或专辑,又如上述各种应用程序中的某控件,等等。展示文本数据可以是应用程序中向用户展示的文本数据,可以是对展示对象进行说明的文本数据,也可以是对用户进行操作指示的文本数据,如餐饮应用程序中对商家的说明或广告、各种应用程序中对控件的说明等。本申请实施例以餐饮应用程序中展示对象为商家展示文本数据为广告为例进行方案的说明,其他情况与之类似本申请实施例不再赘述。
在实施中,周期性的对应用程序中用户对展示对象发表的文本数据进行筛选,得到展示文本数据,然后将筛选出的展示文本数据存储到数据库内。需要获取展示文本数据时,可以从数据库内,直接调取相应的展示文本数据。或者,技术人员可以对展示对象撰写相应的展示文本数据,然后将其存储到数据库。需要获取展示文本数据时,可以从数据库内,直接调取里面相应的展示文本数据。
可选的,可以获取各展示对象的至少一个未插入有表情数据的评论数据,作为展示文本数据。
在实施中,技术人员可以设置处理周期,周期性的对应用程序中各个商家内新增的用户发表的评论数据进行筛选,可以根据评论数据对应的打分信息、发表评论数据的用户的信誉状况、评论数据的字数、是否有黑词、情感分析结果等,确定出评论数据。这些评论数据中,有一部分本身就包含表情数据,但是一般情况下大部分评论数据是未插入有表情数据的。获取其中未插入有表情数据的评论数据,来作为各展示对象的展示文本数据。这里,评论数据可以是用户发表的完整评论数据的其中一部分,也可以是全部。当完整评论数据字数较多,超过规定字数时,可以将完整评论数据进行分段处理,根据每段文本数据的字数和情感分析结果等,确定出最优的一段文本数据作为展示文本数据。
102、基于获取的每个展示文本数据和经过训练的表情插入模型,分别确定每个展示文本数据对应的插入表情数据后的展示文本数据。
在实施中,技术人员可以预先对表情插入模型进行训练,然后将获取到的展示文本数据输入到表情插入模型中,可以得到输出的插入表情数据后的展示文本数据。
可选的,为了使展示文本数据内插入对应的符合文字情感的表情,可以将展示文本数据进行分词处理,再输入到表情插入模型中,相应的处理可以如下:对于每个展示文本数据,对展示文本数据进行分词处理得到多个词语数据,将多个词语数据,按照在展示文本数据中的排列顺序,输入到经过训练的表情插入模型中,得到展示文本数据对应的插入表情数据后的展示文本数据。
其中,词语数据可以是词语的代码信息。
在实施中,可以预先建立词语库,在词语库中存储大量的词语。服务器在获取到展示文本数据后,可以在词语库中查找展示文本数据包括的词语。首先,查找展示文本数据的第一个字是否为词语库中的词语,如果不是,则确定展示文本数据中的前两个字,在词语库中查找是否包含这前两个字组成的词语,依此类推,直到在词语库中查找到展示文本数据的前N个字组成的词语,将该词语确定为展示文本数据的分词得到的第一个词语。然后,继续由第N+1个字开始重复上述过程,直到展示文本数据的最后一个字。这样,可以按顺序确定展示文本数据中包括的所有词语,即得到了展示文本数据分词的所有词语和词语的排列顺序。最后将相应的词语数据按照排列顺序输入到表情插入模型中,从而得到插入表情数据后的展示文本数据。这里插入的表情数据可以是插入到任意两个词语之间,或者第一个词语之前,或者最后一个词语之后。例如,展示文本数据为“这家牛肉火锅,下次可以再来”,进行分词可以得到词语“这家”、“牛肉”、“火锅”、“,”、“下次”、“可以”、“再来”,然后将相应的词语向量数据按照其在展示文本数据中的排列顺序,输入到表情插入模型中,可以得到插入表情数据后的文字展示数据,即“[馋]”、“这家”、“牛肉”、“火锅”、“,”、“下次”、“可以”、“再来”,其中,“[馋]”代表馋的表情数据。可以理解的是,每个展示文本数据对应的表情数据可以是一个,也可以是多个。
上述表情插入模型可以为seq2seq+attention模型,编码器和解码器均为RNN(Recurrent Neural Network,循环神经网络)结构,其中的单元可以是LSTM(Long Short-Term Memory,长短期记忆网络),也可以是GRU(Gated Recurrent Unit networks,门控循环单元网络)。该模型可以包括Word embedding(词向量)模块、LSTM/GRU模块、Coverage-attention模块、Context gate(上下文门)模块和Softmax模块等。
103、将存储的各展示对象的至少一个展示文本数据,分别更新为对应的插入表情数据后的展示文本数据。
在实施中,对于数据库中存储的任一展示对象的任一展示文本数据,在经过上述处理后得到插入表情数据后的展示文本数据时,可以将该展示对象的插入表情数据后的展示文本数据存入数据库,替换该展示对象的相应的展示文本数据,后续需要调用该展示对象的展示文本数据时,就会调用到添加表情数据后的展示文本数据。
例如,对于某商家,之前已经在商家的评论数据中选取出了若干条广告推荐语,存储在数据库中,这些广告推荐语不包含表情数据,当生成了相应的插入表情数据的广告推荐语时,将它们存储到数据库内,替换掉相应的不包含表情数据的广告推荐语。
104、当接收到信息展示请求时,确定待展示的目标展示对象,基于目标展示对象的插入表情数据后的展示文本数据,对信息展示请求进行反馈。
在实施中,某应用程序的首页可以为对象展示页面,用户在终端上点击应用程序的图标运行该应用程序时,或者在应用程序的对象展示页面内进行刷新时,都会向服务器发送信息展示请求。服务器接收到信息展示请求,并根据其中携带的相关信息(如位置、账户标识等)确定出要给该用户推荐的一个或多个目标展示对象,如商家、商品等。然后可以在数据库内调取目标展示对象对应的插入表情数据后的展示文本数据,反馈给用户终端进行显示,此时用户可以在应用程序对象展示页面内看到目标展示对象以及对应的插入表情数据后的展示文本数据。进一步,用户点击目标点击对象则可以进入目标展示对象的详情页面,用户可以在详情页面中进行相应的浏览和操作。
在数据库内调取目标展示对象对应的插入表情数据后的展示文本数据时,可以全部调取,也可以只调取其中一部分。技术人员可以对这些插入表情数据后的展示文本数据进行优选设置,对其进行筛选然后再调取。例如,可以将一个商家中的两个插入表情数据后的展示文本数据分别发送给1000个终端,判断哪一个展示文本数据的点击量更高,则会将其判断为更优选择,为其设置更高的展示概率,另一个展示文本数据则会设置较低的展示概率,在后续对该商家进行展示时,会基于展示概率选择一个展示文本数据反馈给终端进行展示。
可选的,信息展示请求中携带有目标位置,则在确定待展示的目标展示对象时,处理过程可以如下:基于目标位置和各展示对象的位置,确定与目标位置满足预设接近条件的目标展示对象。
在实施中,技术人员可以预先设置终端与展示对象的接近条件,当服务器接收到用户终端发送的信息展示请求时,提取信息展示请求中携带的终端的目标位置,在各展示对象中,判断出与目标位置的距离满足预设接近条件的展示对象,将其作为目标展示对象。该接近条件可以是展示对象与终端的距离小于距离阈值,或者也可以是按照展示对象与终端之间距离由近至远排名,排在预设名次之内,等等。例如,技术人员预设的判断条件为展示对象为距离用户目标位置10公里以内的商家,则可以根据用户对应的目标位置确定出目标展示对象,然后可以将目标展示对象对应的插入表情数据后的展示文本数据反馈给用户终端。
相应的,对于与目标位置满足预设接近条件的展示对象,也可以再进行筛选作为目标展示对象。例如,基于终端登录的账户标识确定账户的历史操作数据,确定用户的偏好信息(如日餐、牛排等),然后在与终端满足接近条件的展示对象中选择与偏好信息匹配的展示对象作为目标展示对象。又例如,还可以考虑展示对象的评分或信誉等级等信息,在与终端满足接近条件的展示对象中选择评分或信誉等级超过阈值的展示对象作为目标展示对象。
下面对上述表情插入模型的处理过程进行详细说明,以展示文本数据是“这家牛肉火锅,下次可以再来”为例,如图2所示,其相应的处理过程可以如下:
获取了展示文本数据之后,对其进行分词处理,然后将词语数据按照其在样本输入数据中的排列顺序,输入到表情插入模型中,在编码器中,Word embedding模块对所有的词语数据进行处理,根据词典将每个词语数据转化为相应的向量数据,然后再将向量数据输入到LSTM/GRU模块中,LSTM/GRU模块中包含的每个方格是一个LSTM/GRU单元,后一个单元对数据的处理要依靠本身输入的向量数据与前一个LSTM/GRU单元的处理结果。如图2所示,“这家”对应的向量数据在LSTM/GRU单元进行处理后,一方面输入到下一个Coverage-attention模块进行下一步的加权处理,另一方面向右输入到第二个LSTM/GRU单元中,第二个LSTM/GRU单元根据其输出和“牛肉”对应的向量数据再进行处理,因此最后一个LSTM/GRU单元生成的数据对应的是展示文本数据中所有词语数据的处理结果。将最后一个LSTM/GRU单元处理完成的数据一方面输入到Coverage-attention模块进行加权处理,另一方面将其输入到译码器内的LSTM/GRU模块中。对输入到Coverage-attention模块的向量数据进行加权处理,然后将这些加权后的向量数据的加权和,输入到译码器内的LSTM/GRU模块中。
译码器下方的“<s>”代表开始字符,它输入到Word embedding模块中生成相应的向量数据,然后输入到Context gate模块。Context gate模块可以控制输入的词向量是否需要输入到下一个LSTM/GRU模块中进行使用。Context gate模块控制将开始字符对应的向量数据输入到LSTM/GRU模块中,然后LSTM/GRU模块对其进行处理,此时LSTM/GRU模块的第一个单元对左方编码器的两种输出和开始字符对应的向量数据进行处理,得到输出,将其输入到Softmax模块中,将LSTM/GRU模块输出的向量根据词典,转化为对应的文本数据输出,即输出“[馋]”。一方面,输出“[馋]”的Softmax单元将这一结果反馈给Coverage-attention模块,Coverage-attention模块可以记录展示文本数据中的哪些词语数据已经被生成,从而调节加权值,以免再生成同样的词语数据发生重复。然后编码器根据新的加权值进行又一轮的处理,将结果输入到译码器的LSTM/GRU模块的第一单元中,再向右输入到LSTM/GRU模块的第二单元中。另一方面,输出“[馋]”的Softmax单元,又将其输出反馈给Word embedding模块,生成“[馋]”相应的向量数据,然后再将其输入到Context gate模块,然后Context gate模块可以控制开始字符对应的向量数据和[馋]对应的向量数据是否传输给LSTM/GRU模块,然后LSTM/GRU模块的第二单元可以对两方输入进行处理,再将输出的向量数据输入到Softmax模块中,生成“这家”对应的文本数据,然后“这家”对应的文本数据再反馈到Word embedding模块中,重复上述过程,直到生成终止字符“</s>”才停止运行,最终生成“[馋]”、“这家”、“牛肉”、“火锅”、“,”、“下次”、“可以”、“再来”对应的文本数据,即插入有表情数据的展示文本数据。
在获取存储的各展示对象的至少一个展示文本数据之前,技术人员要预先对表情插入模型进行训练,才能将展示文本数据输入到训练好的模型中,得到插入表情数据后的展示文本数据。参见图3,相应的的模型训练过程可以如下:
301、获取样本输入数据和基准输出数据。
其中,样本输入数据为样本展示文本数据,基准输出数据是插入有表情数据的样本展示文本数据。
对于样本输入数据和基准输出数据的获取,可以有多种方式,下面给出了两种可行的方式。
方式一,可以基于已有的添加了表情数据的评论数据确定样本输入数据和基准输出数据,相应的处理可以如下:获取存储的各展示对象的评论数据,在各展示对象的评论数据中,获取插入有表情数据的评论数据,作为基准输出数据,在基准输出数据中去除表情数据,得到样本输入数据。
在实施中,对存储的各展示对象的评论数据,从中确定出插入有表情数据的评论数据,然后根据用户评价情况、字数要求、是否有黑词、情感分析结果等进行筛选,将筛选出的评论数据作为基准输出数据,然后将其中的表情数据去除,去除了表情数据的评论数据,可以作为样本输入数据。例如,筛选出的插入有表情数据的评论数据是“这家酸笋一定要吃,大赞[强]”,则可以将其对应的数据直接作为基准输出数据,然后将其中的表情数据去除,得到“这家酸笋一定要吃,大赞”,将其对应数据作为样本输入数据。
方式二,对于样本输入数据和基准输出数据的获取,也可以通过人工加表情的方法获取,相应的过程可以如下:获取存储的各展示对象的评论数据,在各展示对象的评论数据中,获取未插入有表情数据的评论数据,作为样本输入数据,对样本输入数据进行分词处理得到多个样本词语数据,按照在样本输入数据中的排列顺序,显示多个样本词语数据,并在相邻的样本词语数据之间显示插入位,当检测到对应目标插入位的选择指令时,获取输入的表情数据,将输入的表情数据插入到样本输入数据的目标插入位,得到基准输出数据。
在实施中,对存储的各展示对象的评论数据,从中选择出未插入有表情数据的评论数据,然后再根据用户评价情况、字数要求、是否有黑词、情感分析结果等进行筛选,将得到的筛选后的评论数据作为样本输入数据。然后对此样本输入数据进行分词处理,将其分成多个样本词语数据。在技术人员想要获取该样本输入数据对应的基准输出数据时,将该样本输入数据对应的多个样本词语数据,按照其在样本输入数据中的排列顺序,显示在技术人员的终端上,且每个相邻词语数据之间显示出插入位。技术人员可以根据样本输入数据的语义以及情感分析等,决定在哪个插入位处插入表情数据,该插入位即为目标插入位。技术人员可以点击目标插入位的图标,可以触发显示出表情选择窗口,表情选择窗口内设置有多个表情图标,技术人员可以点击相应表情图标,可以触发关闭表情选择窗口,且将该表情显示在目标插入位处,从而得到插入有表情数据的评论数据,将此作为基准输出数据。
302、对样本输入数据进行分词处理得到多个样本词语数据。
分词处理的过程可以参见本申请实施例前面的内容,此处不再累述。
303、将多个样本词语数据,按照在样本输入数据中的排列顺序,输入到初始的表情插入模型中,得到样本输入数据对应的实际输出数据。
在实施中,将样本输入数据进行分词处理,划分为多个词语数据之后,将多个词语数据,按照其在样本输入数据中的排列顺序,输入到初始的表情插入模型中进行处理,得到的输出的文本数据就是实际输出数据。
304、基于实际输出数据和基准输出数据,对初始的表情插入模型进行训练,得到经过训练的表情插入模型。
在实施中,在得到实时输出数据之后,将其与预先获取到的基准输出数据输入到训练函数中,得到表情插入模型中待调整的参数的调整值,基于调整值对表情插入模型的参数进行调整,就可以得到训练过的表情插入模型。
多次重复上述201-204的训练处理过程,对表情插入模型进行参数调整,直到实际输出数据与对应的基准输出数据基本一致,就可以得到经过训练的表情插入模型。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
在本申请实施例中,基于经过训练的表情插入模型,确定展示文本数据对应的插入表情数据后的展示文本数据,然后将存储在数据库内的展示文本数据,更新为插入表情数据后的展示文本数据,当接收到用户终端发送的信息展示请求时,确定出待展示的目标展示对象,然后基于插入表情数据后的展示文本数据,对该信息展示请求进行反馈。这样,可以通过计算机自动在展示文本数据中添加表情数据,不需要人工操作,节省了大量的人力物力,同时也节省了时间。
本申请实施例提供了一种信息展示的装置,该装置可以是上述实施例中的计算机设备,如图4所示,所述装置包括:
获取模块410,用于获取存储的各展示对象的至少一个展示文本数据;
确定模块420,用于基于获取的每个展示文本数据和经过训练的表情插入模型,分别确定每个展示文本数据对应的插入表情数据后的展示文本数据;
更新模块430,用于将存储的所述各展示对象的至少一个展示文本数据,分别更新为对应的插入表情数据后的展示文本数据;
展示模块440,用于当接收到信息展示请求时,确定待展示的目标展示对象,基于所述目标展示对象的插入表情数据后的展示文本数据,对所述信息展示请求进行反馈。
在一种可能的设计中,所述确定模块420,用于:
对于每个展示文本数据,对所述展示文本数据进行分词处理得到多个词语数据,将所述多个词语数据,按照在所述展示文本数据中的排列顺序,输入到经过训练的表情插入模型中,得到所述展示文本数据对应的插入表情数据后的展示文本数据。
在一种可能的设计中,所述确定模块420,还用于:
获取样本输入数据和基准输出数据,其中,所述样本输入数据为样本展示文本数据,所述基准输出数据是插入有表情数据的样本展示文本数据;
对所述样本输入数据进行分词处理得到多个样本词语数据;
将所述多个样本词语数据,按照在所述样本输入数据中的排列顺序,输入到初始的表情插入模型中,得到所述样本输入数据对应的实际输出数据;
基于所述实际输出数据和所述基准输出数据,对所述初始的表情插入模型进行训练,得到所述经过训练的表情插入模型。
在一种可能的设计中,所述确定模块420,用于:
获取存储的各展示对象的评论数据;
在所述各展示对象的评论数据中,获取插入有表情数据的评论数据,作为基准输出数据;
在所述基准输出数据中去除表情数据,得到所述样本输入数据。
在一种可能的设计中,所述确定模块420,用于:
获取存储的各展示对象的评论数据;
在所述各展示对象的评论数据中,获取未插入有表情数据的评论数据,作为样本输入数据;
对所述样本输入数据进行分词处理得到多个样本词语数据;
按照在所述样本输入数据中的排列顺序,显示所述多个样本词语数据,并在相邻的样本词语数据之间显示插入位;
当检测到对应目标插入位的选择指令时,获取输入的表情数据,将输入的表情数据插入到所述样本输入数据的所述目标插入位,得到所述基准输出数据。
在一种可能的设计中,所述获取模块410,用于:
获取各展示对象的至少一个未插入有表情数据的评论数据,作为展示文本数据。
在一种可能的设计中,所述信息展示请求中携带有目标位置;
所述展示模块440,用于:
基于所述目标位置和各展示对象的位置,确定与所述目标位置满足预设接近条件的目标展示对象。
在本申请实施例中,基于经过训练的表情插入模型,确定展示文本数据对应的插入表情数据后的展示文本数据,然后将存储在数据库内的展示文本数据,更新为插入表情数据后的展示文本数据,当接收到用户终端发送的信息展示请求时,确定出待展示的目标展示对象,然后基于插入表情数据后的展示文本数据,对该信息展示请求进行反馈。这样,可以通过计算机自动在展示文本数据中添加表情数据,不需要人工操作,节省了大量的人力物力,同时也节省了时间。
需要说明的是:上述实施例提供的信息展示的装置在信息展示时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的信息展示的装置与信息展示的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图5是本申请实施例提供的一种服务器的结构示意图,该服务器500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processingunits,CPU)501和一个或一个以上的存储器502,其中,所述存储器502中存储有至少一条指令,所述至少一条指令由所述处理器501加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,例如包括指令的存储器,上述指令可由终端中的处理器执行以完成上述实施例中信息展示的方法。该计算机可读存储介质可以是非暂态的。例如,所述计算机可读存储介质可以是ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随机存取存储器)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种信息展示的方法,其特征在于,所述方法包括:
获取存储的各展示对象的至少一个展示文本数据;
基于获取的每个展示文本数据和经过训练的表情插入模型,分别确定每个展示文本数据对应的插入表情数据后的展示文本数据;
将存储的所述各展示对象的至少一个展示文本数据,分别更新为对应的插入表情数据后的展示文本数据;
当接收到信息展示请求时,确定待展示的目标展示对象,基于所述目标展示对象的插入表情数据后的展示文本数据,对所述信息展示请求进行反馈。
2.根据权利要求1所述的方法,其特征在于,所述基于获取的每个展示文本数据和经过训练的表情插入模型,分别确定每个展示文本数据对应的插入表情数据后的展示文本数据,包括:
对于每个展示文本数据,对所述展示文本数据进行分词处理得到多个词语数据,将所述多个词语数据,按照在所述展示文本数据中的排列顺序,输入到经过训练的表情插入模型中,得到所述展示文本数据对应的插入表情数据后的展示文本数据。
3.根据权利要求2所述的方法,其特征在于,所述获取各展示对象的至少一个展示文本数据之前,还包括:
获取样本输入数据和基准输出数据,其中,所述样本输入数据为样本展示文本数据,所述基准输出数据是插入有表情数据的样本展示文本数据;
对所述样本输入数据进行分词处理得到多个样本词语数据;
将所述多个样本词语数据,按照在所述样本输入数据中的排列顺序,输入到初始的表情插入模型中,得到所述样本输入数据对应的实际输出数据;
基于所述实际输出数据和所述基准输出数据,对所述初始的表情插入模型进行训练,得到所述经过训练的表情插入模型。
4.根据权利要求3所述的方法,其特征在于,所述获取样本输入数据和基准输出数据,包括:
获取存储的各展示对象的评论数据;
在所述各展示对象的评论数据中,获取插入有表情数据的评论数据,作为基准输出数据;
在所述基准输出数据中去除表情数据,得到所述样本输入数据。
5.根据权利要求3所述的方法,其特征在于,所述获取样本输入数据和基准输出数据,包括:
获取存储的各展示对象的评论数据;
在所述各展示对象的评论数据中,获取未插入有表情数据的评论数据,作为样本输入数据;
对所述样本输入数据进行分词处理得到多个样本词语数据;
按照在所述样本输入数据中的排列顺序,显示所述多个样本词语数据,并在相邻的样本词语数据之间显示插入位;
当检测到对应目标插入位的选择指令时,获取输入的表情数据,将输入的表情数据插入到所述样本输入数据的所述目标插入位,得到所述基准输出数据。
6.根据权利要求1所述的方法,其特征在于,所述获取各展示对象的至少一个展示文本数据,包括:
获取各展示对象的至少一个未插入有表情数据的评论数据,作为展示文本数据。
7.根据权利要求1所述的方法,其特征在于,所述信息展示请求中携带有目标位置;
所述确定待展示的目标展示对象,包括:
基于所述目标位置和各展示对象的位置,确定与所述目标位置满足预设接近条件的目标展示对象。
8.一种信息展示的装置,其特征在于,所述装置包括:
获取模块,用于获取存储的各展示对象的至少一个展示文本数据;
确定模块,用于基于获取的每个展示文本数据和经过训练的表情插入模型,分别确定每个展示文本数据对应的插入表情数据后的展示文本数据;
更新模块,用于将存储的所述各展示对象的至少一个展示文本数据,分别更新为对应的插入表情数据后的展示文本数据;
展示模块,用于当接收到信息展示请求时,确定待展示的目标展示对象,基于所述目标展示对象的插入表情数据后的展示文本数据,对所述信息展示请求进行反馈。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至权利要求7任一项所述的信息展示的方法所执行的操作。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至权利要求7任一项所述的信息展示的方法所执行的操作。
CN202011073268.XA 2020-10-09 2020-10-09 信息展示的方法和装置 Withdrawn CN112231605A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011073268.XA CN112231605A (zh) 2020-10-09 2020-10-09 信息展示的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011073268.XA CN112231605A (zh) 2020-10-09 2020-10-09 信息展示的方法和装置

Publications (1)

Publication Number Publication Date
CN112231605A true CN112231605A (zh) 2021-01-15

Family

ID=74120102

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011073268.XA Withdrawn CN112231605A (zh) 2020-10-09 2020-10-09 信息展示的方法和装置

Country Status (1)

Country Link
CN (1) CN112231605A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113127628A (zh) * 2021-04-23 2021-07-16 北京达佳互联信息技术有限公司 用于生成评论的方法、装置、设备及计算机可读存储介质
CN113342179A (zh) * 2021-05-26 2021-09-03 北京百度网讯科技有限公司 输入文本的处理方法、装置、电子设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102955830A (zh) * 2011-08-31 2013-03-06 腾讯科技(深圳)有限公司 表情搜索开放平台、表情搜索方法及系统
CN104063427A (zh) * 2014-06-06 2014-09-24 北京搜狗科技发展有限公司 一种基于语义理解的表情输入方法和装置
US20170118145A1 (en) * 2015-10-21 2017-04-27 Futurefly Ltd. Method of using emoji to control and enrich 3d chat environments
CN107450746A (zh) * 2017-08-18 2017-12-08 联想(北京)有限公司 一种表情符号的插入方法、装置和电子设备
CN108322800A (zh) * 2017-01-18 2018-07-24 阿里巴巴集团控股有限公司 字幕信息处理方法及装置
US20180348890A1 (en) * 2017-06-05 2018-12-06 Facebook, Inc. Systems and methods for multilingual emoji search
CN109034203A (zh) * 2018-06-29 2018-12-18 北京百度网讯科技有限公司 表情推荐模型的训练、表情推荐方法、装置、设备及介质
CN111460177A (zh) * 2020-03-27 2020-07-28 北京奇艺世纪科技有限公司 影视类表情搜索方法、装置、存储介质、计算机设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102955830A (zh) * 2011-08-31 2013-03-06 腾讯科技(深圳)有限公司 表情搜索开放平台、表情搜索方法及系统
CN104063427A (zh) * 2014-06-06 2014-09-24 北京搜狗科技发展有限公司 一种基于语义理解的表情输入方法和装置
CN104933113A (zh) * 2014-06-06 2015-09-23 北京搜狗科技发展有限公司 一种基于语义理解的表情输入方法和装置
US20170118145A1 (en) * 2015-10-21 2017-04-27 Futurefly Ltd. Method of using emoji to control and enrich 3d chat environments
CN108322800A (zh) * 2017-01-18 2018-07-24 阿里巴巴集团控股有限公司 字幕信息处理方法及装置
US20180348890A1 (en) * 2017-06-05 2018-12-06 Facebook, Inc. Systems and methods for multilingual emoji search
CN107450746A (zh) * 2017-08-18 2017-12-08 联想(北京)有限公司 一种表情符号的插入方法、装置和电子设备
CN109034203A (zh) * 2018-06-29 2018-12-18 北京百度网讯科技有限公司 表情推荐模型的训练、表情推荐方法、装置、设备及介质
CN111460177A (zh) * 2020-03-27 2020-07-28 北京奇艺世纪科技有限公司 影视类表情搜索方法、装置、存储介质、计算机设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113127628A (zh) * 2021-04-23 2021-07-16 北京达佳互联信息技术有限公司 用于生成评论的方法、装置、设备及计算机可读存储介质
CN113127628B (zh) * 2021-04-23 2024-03-19 北京达佳互联信息技术有限公司 用于生成评论的方法、装置、设备及计算机可读存储介质
CN113342179A (zh) * 2021-05-26 2021-09-03 北京百度网讯科技有限公司 输入文本的处理方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN108304379B (zh) 一种文章识别方法、装置及存储介质
CN109063104A (zh) 推荐信息的刷新方法、装置、存储介质和终端设备
CN112231605A (zh) 信息展示的方法和装置
CN116501960B (zh) 内容检索方法、装置、设备及介质
CN112926308A (zh) 匹配正文的方法、装置、设备、存储介质以及程序产品
CN112052297A (zh) 信息生成方法、装置、电子设备和计算机可读介质
CN109409419B (zh) 用于处理数据的方法和装置
CN117708428A (zh) 推荐信息预测方法、装置以及电子设备
US20220222432A1 (en) Recommending theme patterns of a document
EP4307136A1 (en) Sorting method and apparatus for search results, and electronic device and storage medium
CN114035729B (zh) 电子投票方法及装置、终端设备
CN112989174A (zh) 信息推荐方法及装置、介质和设备
CN113722577B (zh) 反馈信息的处理方法、装置、设备以及存储介质
CN113870998A (zh) 问诊方法、装置、电子设备和存储介质
CN110766488A (zh) 一种自动确定主题场景的方法和装置
CN113536103B (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN113627198A (zh) 一种基于历史问答数据的参考回答生成方法、系统、装置和计算机设备
CN109584012B (zh) 用于生成物品推送信息的方法和装置
CN113395537A (zh) 用于推荐直播间的方法和装置
CN112651413A (zh) 低俗图的集成学习分类方法、装置、设备及存储介质
CN111737288A (zh) 搜索控制方法、装置、终端设备、服务器及存储介质
CN106484710B (zh) 动态数据处理方法和装置、信息显示方法和装置
CN112906399B (zh) 确定情绪状态的方法、装置、设备和存储介质
CN116010712B (zh) 一种表单推荐方法、装置、电子设备及存储介质
CN116070175B (zh) 一种文案生成方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210115

WW01 Invention patent application withdrawn after publication