CN112825015A - 数据对象、表情包的生成方法、计算机设备、存储介质 - Google Patents

数据对象、表情包的生成方法、计算机设备、存储介质 Download PDF

Info

Publication number
CN112825015A
CN112825015A CN201911144553.3A CN201911144553A CN112825015A CN 112825015 A CN112825015 A CN 112825015A CN 201911144553 A CN201911144553 A CN 201911144553A CN 112825015 A CN112825015 A CN 112825015A
Authority
CN
China
Prior art keywords
data object
text information
generating
information
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911144553.3A
Other languages
English (en)
Inventor
裴唯一
郭山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201911144553.3A priority Critical patent/CN112825015A/zh
Priority to PCT/CN2020/129989 priority patent/WO2021098754A1/zh
Publication of CN112825015A publication Critical patent/CN112825015A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例公开了一种数据对象、表情包的生成方法、计算机设备、存储介质。所述方法通过获取输入的文字信息,基于文字信息确定触发生成数据对象,进一步结合文字信息和预设图片生成数据对象,由于数据对象的生成结合了输入的文字信息和图片,从而使得生成的数据对象符合当前的文字信息所构成的语言环境,更符合实际的应用需求。当预设图片包括随机图片时,可以使得生成的数据对象在符合当前语言环境的同时,更加多样化。

Description

数据对象、表情包的生成方法、计算机设备、存储介质
技术领域
本申请涉及数据处理技术领域,具体涉及一种数据对象的生成方法、一种表情包的生成方法、一种计算机设备、一种计算机可读存储介质。
背景技术
随着网络技术的发展以及移动终端的普及,越来越多的人们开始使用即时通讯工具,表情包作为活跃聊天氛围的重要来源,越来越多的被使用。
早期的表情包是单一的表情图片,并且由即时通讯工具于线下制备,提供给用户选择,随着网络语境的复杂化,开始流行图片加文字的表情包,用户需要下载网络端的表情包数据库到终端本地,在需要使用表情包时,通过点击按钮触发展示多个表情包,通过翻阅展示页面,选取所需的表情包,过程较为复杂,由于数据库内表情包的数量有限,未必能选取到符合当前语境的表情包。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的数据对象的生成方法、表情包的生成方法以及计算机设备、计算机可读存储介质。
依据本申请的一个方面,提供了一种数据对象的生成方法,包括:
获取输入的文字信息;
确定所述文字信息触发生成数据对象;
根据所述文字信息和预设图片生成数据对象,并提供所述数据对象。
可选的,所述确定所述文字信息触发生成数据对象包括:
检测所述文字信息中是否包括与所述数据对象关联的关键内容;
当所述文字信息中包括预设内容时,确定所述文字信息触发生成数据对象。
可选的,所述根据所述文字信息和预设图片生成数据对象包括:
提取所述文字信息和预设图片分别对应的特征数据;
根据所述文字信息和预设图片分别对应的特征数据,生成所述数据对象。
可选的,所述根据所述文字信息和预设图片分别对应的特征数据,生成所述数据对象包括:
合并所述特征数据,作为数据对象对应的特征数据;
解析所述特征数据,得到所述数据对象。
可选的,所述根据所述文字信息和预设图片生成数据对象包括:
将所述文字信息和预设图片输入神经网络模型,得到所述数据对象。
可选的,在所述将所述文字信息和预设图片输入神经网络模型,得到所述数据对象之前,所述方法还包括:
根据文字信息样本和图片样本以及对应标记的数据对象样本,训练用于根据文字信息和图片生成数据对象的神经网络模型。
可选的,所述神经网络模型包括至少一个,所述神经网络模型具有对应的标识信息,在所述将所述文字信息和预设图片输入神经网络模型,得到所述数据对象之前,所述方法还包括:
根据对所述标识信息的选择操作确定选用的至少一个神经网络模型。
可选的,所述方法还包括:
采用预先标记的数据对象判断所生成的神经网络模型是否达到要求;
若未达到要求,则继续训练所述神经网络模型。
可选的,所述方法还包括:
检测对所提供的数据对象的用户选择使用的操作,若不存在用户选择使用的操作,则将所提供的数据对象作为负样本,对所述神经网络模型进行修正。
可选的,所述数据对象包括表情包,所述提供所述数据对象包括:
在聊天界面上增加所述表情包的显示元素。
可选的,在所述根据所述文字信息和预设图片生成数据对象之前,所述方法还包括:
获取输入文字信息的用户的特征信息,所述预设图片根据所述用户的特征信息确定。
可选的,在所述根据所述文字信息和预设图片生成数据对象之前,所述方法还包括:
根据所述文字信息确定待生成的数据对象的类别,所述预设图片从所述数据对象的类别对应的数据库中获取。
依据本申请的另一个方面,提供了一种表情包的生成方法,包括:
获取输入的聊天信息;
确定所述聊天信息中包括与表情包关联的关键内容;
根据所述聊天信息和随机图片生成表情包;
在聊天界面上增加所述表情包的显示元素。
依据本申请的另一个方面,提供了一种数据对象的生成方法,包括:
监控针对数据对象的触发条件;
根据触发条件对应的输入信息生成数据对象;
提供所述数据对象。
依据本申请的另一个方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述一个或多个的方法。
依据本申请的另一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述一个或多个的方法。
本申请创新提出了一种数据对象的生成方法,通过获取输入的文字信息,基于文字信息确定触发生成数据对象,进一步结合文字信息和预设图片生成数据对象,由于数据对象的生成结合了输入的文字信息和图片,从而使得生成的数据对象符合当前的文字信息所构成的语言环境,更符合实际的应用需求。
当预设图片包括随机图片时,可以使得生成的数据对象在符合当前语言环境的同时,更加多样化。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本申请的一个示例中数据对象生成过程示意图;
图2示出了根据本申请实施例一的一种数据对象的生成方法实施例的流程图;
图3示出了根据本申请实施例二的一种数据对象的生成方法实施例的流程图;
图4示出了根据本申请实施例三的一种表情包的生成方法实施例的流程图;
图5示出了根据本申请实施例四的一种图片处理方法实施例的流程图;
图6示出了根据本申请的一个示例的数据对象生成示意图;
图7示出了根据本申请的一个示例的神经网络模型预测示意图;
图8示出了根据本申请的一个示例的表情包生成流程图
图9示出了根据本申请实施例五的一种图片处理装置实施例的结构框图;
图10示出了根据本申请实施例六的一种图片处理装置实施例的结构框图;
图11示出了根据本申请实施例七的一种数据处理装置实施例的结构框图;
图12示出了可被用于实现本公开中所述的各个实施例的示例性系统。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为使本领域技术人员更好地理解本申请,以下对本申请涉及的概念进行说明:
针对表情包种类不全不符合用户所需以及查找麻烦等各种问题,提出了对符合用户意图的表情包的生成需求,有鉴于此,本申请提供了一种数据对象的生成方案。数据对象基于网络存在,可以有各种形式,比如图片、视频、文字、商品等都可以视为数据对象,本申请的数据对象的生成方法,可以适用于不同的应用场景。
不同的应用场景具有相应的文字信息的输入方式,比如在即时通讯工具的聊天界面提交聊天内容作为文字信息,或者通过界面点击操作或选择操作提交的选项信息,对应该选项的内容可以视为文字信息。
通过分析文字信息可以确认该文字信息是否触发了数据对象的生成,具体的触发规则可以根据实际需求设定,比如检测到文字信息中包括预设内容,以聊天场景为例,若用户输入的聊天内容中包括开心两个字,则触发与开心相关的表情包的生成。
数据对象具体根据文字信息和预设图片生成,例如根据文字信息和预设图片合成数据对象,还可以加入视频、音频等。其中,预设图片可以包括一个或多个。
具体的生成方式可以采用特征数据实现。在自然语言处理和计算机视觉中,要想让机器识别文字和图片等数据形式,则需要将文字和图片表示成可被机器理解的形式,即对文字和图片进行特征提取,采用特征数据来表示文字和图片。特征数据可以包括文字和图片在一个或多个维度上的特征,具体可以采用向量的表达形式,也即是把数据向量化。例如内容元素对应某个数据种类的个数、像素个数、位置坐标等等。本申请实施例中,特征数据用于表征文字信息和图片,构建高维度的特征数据可以更准确地进行表征。
可以通过合并文字信息和图片分别对应的特征数据生成数据对象,合并的方式可以根据实际需要选择,例如,直接串联组合文字信息和图片分别对应的特征数据,得到维数更多的特征向量,或者对相同维度的特征数据进行叠加,得到新的特征向量。根据组合得到的特征向量可以采用图像解码器进行解码处理,得到对应的数据对象。
本申请实施例可以采用神经网络模型实现,通过构建文本编码器、图像编码器、图像解码器,通过文本编码器得到文字信息的特征数据,通过图像编码器得到图片的特征数据,进一步根据文字信息和图片分别对应的特征数据,生成数据对象。
由此可见,本申请创新提出了一种数据对象的生成方法,由于数据对象的生成结合了输入的文字信息和图片,从而使得生成的数据对象符合当前的文字信息所构成的语言环境,更符合实际的应用需求。
神经网络是一种非常强大的机器学习算法,神经网络模型可以被视为一个包含了许多参数的数学模型,而这个数学模型是由若干个函数相互嵌套代入而得到的。神经网络模型相对于其他模型具有自学功能强大、联想存储、高速寻找优化解的能力,为数据预测、数据推导、方案解决提供了强大的支撑,具有较大的实际应用价值。
神经网络模型可以训练得到,收集文字信息样本和图片样本,并对应样本标记数据对象样本,根据该文字信息样本、图片样本、数据对象样本进行神经网络模型的训练,便可得到基于文字信息和图片预测数据对象的模型。
本申请实施例中,可以训练多个神经网络模型,在进行预测之前,可以提供多个神经网络模型的标识信息供选择神经网络模型,根据对标识信息的选择确定选用其中一个或多个神经网络模型,基于选用的神经网络模型进行数据对象的预测。
神经网络模型可以经过多轮迭代训练得到,在每轮训练完成时,可以采用预先标记的数据对象判断当前生成的神经网络模型是否达到要求,例如将一组对应的文字信息样本、图片样本输入神经网络模型,判别输出的数据对象与该样本原本对应的数据对象之间的差异,若差异大于设定范围,则可以认为模型训练未达到要求,继续进入下一轮的训练。
神经网络模型的标识信息可以通过识别图片样本获得,比如,针对两个神经网络模型预置不同的数据对象样本,通过分析数据对象样本,发现一批样本中多为夸张的表情包,另一批样本中多为正常的表情包,对一个神经网络模型标记为夸张的表情包预测模型,对另一个神经网络模型标记为正常的表情包预测模型。
本申请实施例中,预设图片可以是随机图片,可以从图片数据库中随机抽取,或是根据设定规则从图片数据库抽取或是通过网络访问获取。以表情包为例,为使获得的表情包尽量丰富多样,预设图片可以包括随机图片。
本申请实施例中,还可以根据针对数据对象的使用情况对神经网络模型进行优化,在提供生成的数据对象之后,对客户端的操作进行监控,若某个数据对象未被选取使用,则说明该数据对象的生成并不符合需求,可以将该数据对象添加至模型训练的负样本,可以立即进入或是在累计到多个新增的负样本之后,触发进入对神经网络模型的重新训练,以实现根据实际使用效果对神经网络模型的修正。
数据对象可以进一步提供给客户端进行展示,或是提供给系统端使用。例如,在聊天的应用场景下,可以在聊天界面上增加表情包的显示元素,也即是将表情包通过弹窗等显示方式显示在聊天界面上。
图1示出了根据本申请的一个示例中数据对象生成过程示意图。张三和李四聊天过程中,如左侧终端界面中,张三输入聊天文字“真棒”,从数据库中获取随机图片,将该聊天文字和随机图片输入神经网络模型,得到“真棒”和点赞手势图片结合的表情包图片。该表情包图片提供给李四作为表情包选择,如右侧终端界面中,李四回复的信息为该表情包图片,符合当下聊天语境。
参照图2,示出了根据本申请实施例一的一种数据对象的生成方法实施例的流程图,该方法具体可以包括以下步骤:
步骤101,获取输入的文字信息。
步骤102,确定所述文字信息触发生成数据对象。
步骤103,根据所述文字信息和预设图片生成数据对象,并提供所述数据对象。
本申请创新提出了一种数据对象的生成方法,通过获取输入的文字信息,基于文字信息确定触发生成数据对象,进一步结合文字信息和预设图片生成数据对象,由于数据对象的生成结合了输入的文字信息和图片,从而使得生成的数据对象符合当前的文字信息所构成的语言环境,更符合实际的应用需求。
当预设图片包括随机图片时,可以使得生成的数据对象在符合当前语言环境的同时,更加多样化。
在本申请的一种可选的实施例中,确定文字信息触发生成数据对象时,可以检测文字信息中是否包括与数据对象关联的关键内容,当文字信息中包括预设内容时,确定文字信息触发生成数据对象。
在本申请的一种可选的实施例中,根据文字信息和预设图片生成数据对象时,可以提取文字信息和预设图片分别对应的特征数据,根据文字信息和预设图片分别对应的特征数据,生成数据对象。
其中,根据文字信息和预设图片分别对应的特征数据,生成数据对象可以具体包括:合并特征数据,作为数据对象对应的特征数据,解析特征数据,得到数据对象。
在本申请的一种可选的实施例中,数据对象可以包括表情包,相应的,提供数据对象也即是在聊天界面上增加表情包的显示元素。
参照图3,示出了根据本申请实施例二的一种数据对象的生成方法实施例的流程图,该方法具体可以包括以下步骤:
步骤201,根据文字信息样本和图片样本以及对应标记的数据对象样本,训练用于根据文字信息和图片生成数据对象的神经网络模型。
在本申请的一种可选实施例中,还可以采用预先标记的数据对象判断所生成的神经网络模型是否达到要求;若未达到要求,则继续训练神经网络模型。
步骤202,获取输入的文字信息。
步骤203,确定所述文字信息触发生成数据对象。
需要说明的是模型的训练在模型的使用之前完成即可,例如,可以在确定文字信息触发生成数据对象时,才完成模型的训练。
步骤204,根据对所述标识信息的选择操作确定选用的至少一个神经网络模型。
神经网络模型包括至少一个,并且神经网络模型具有对应的标识信息,可以提供多个神经网络的标识信息给客户端,并根据客户端选择的标识信息确定选用的神经网络模型。
步骤205,将所述文字信息和预设图片输入神经网络模型,得到所述数据对象。
步骤206,提供所述数据对象。
步骤207,检测对所提供的数据对象的用户选择使用的操作,若不存在用户选择使用的操作,则将所提供的数据对象作为负样本,对所述神经网络模型进行修正。
本申请实施例中,还可以根据针对数据对象的使用情况对神经网络模型进行优化,若某个数据对象未被选取使用,则说明该数据对象的生成并不符合需求,可以以该表情包为负样本,触发进入对神经网络模型的重新训练。
一个可选的示例中,预设图片可以基于输入文字信息的用户确定,通过识别用户的特征信息,进一步确定与特征信息关联的图片作为预设图片。特征信息可以是用户的软件环境信息,例如用户年龄、职业、地域、软件使用偏好等。
另一个可选的示例中,预设图片可以根据文字信息确定,预先对大量的图片标记对应的类别,根据文字信息确定待生成的数据对象的类别后,进一步从该类别下的图片库中选取图片作为预设图片。例如,对图片划分开心、搞笑、悲伤、可爱等类别,根据“听到一个笑话”确定类别为搞笑,则可以从搞笑的类别下选取图片作为预设图片。其中图片的标记可以通过对图片的识别实现,具体划分的类别可以根据实际需要设置,本申请对此并不做限制。
本申请创新提出了一种数据对象的生成方法,通过获取输入的文字信息,基于文字信息确定触发生成数据对象,进一步结合文字信息和预设图片生成数据对象,由于数据对象的生成结合了输入的文字信息和图片,从而使得生成的数据对象符合当前的文字信息所构成的语言环境,更符合实际的应用需求。
当预设图片包括随机图片时,可以使得生成的数据对象在符合当前语言环境的同时,更加多样化。
参照图4,示出了根据本申请实施例三的一种表情包的生成方法实施例的流程图,该方法具体可以包括以下步骤:
步骤301,获取输入的聊天信息。
步骤302,确定所述聊天信息中包括与表情包关联的关键内容。
步骤303,根据所述聊天信息和随机图片生成表情包。
步骤304,在聊天界面上增加所述表情包的显示元素。
本申请创新提出了一种表情包的生成方法,通过获取输入的文字信息,基于文字信息确定触发生成表情包,进一步结合文字信息和预设图片生成数据对象,由于表情包的生成结合了输入的文字信息和图片,从而使得生成的表情包符合当前的文字信息所构成的语言环境,更符合实际的应用需求。
当预设图片包括随机图片时,可以使得生成的表情包在符合当前语言环境的同时,更加多样化。
参照图5,示出了根据本申请实施例四的一种图片处理方法实施例的流程图,该方法具体可以包括以下步骤:
步骤401,监控针对数据对象的触发条件。
触发条件可以是对内容的判断,比如输入的文字信息满足设定要求,例如包括设定关键字,也可以是对操作的判断,例如针对数据对象的某个触发控件的停留时间超出阈值。触发条件的设定可以根据实际需求确定,本申请对此并不做限制。
步骤402,根据触发条件对应的输入信息生成数据对象。
输入信息可以是文字、图片甚至是视频或是指令数据等。
步骤403,提供所述数据对象。
本申请创新提出了一种数据对象的生成方法,通过监控针对数据对象的触发条件确定触发数据对象的生成过程,进一步结合输入的信息生成数据对象,由于数据对象的生成结合了输入信息,从而使得生成的数据对象符合当前的输入信息所构成的应用环境,更符合实际的应用需求。
为使本领域技术人员更好地理解本申请,以下通过具体的示例对本申请的一种图片处理方法进行说明。
图6示出了根据本申请的一个示例的数据对象生成示意图。如图所示,在聊天中输入文字,比如“真棒”,进入文本编码器得到对应的特征向量,同时,至少一个随机图片进入图像编码器得到对应的特征向量,两个特征向量进行组合,并将组合向量输入图像解码器,从而得到对应的表情包。如图为一个点赞手势并配以文字“真棒!!!”的形式
图7示出了根据本申请的一个示例的神经网络模型预测示意图。如图所示,收集文字信息样本和图片样本,以文字信息包括“真棒”为例,将“真棒”输入文本编码器得到文字信息对应的特征向量,将随机图片输入图像编码器得到图片对应的特征向量,对两个特征向量进行组合得到组合向量。对组合向量采用图像解码器进行解码,得到对应的表情包结果,将该表情包结果与预置的表情包样本进行比对,判别该表情包结果是否达到要求,若未达到要求,则判别器会输入一个损失函数表征本次模型训练结果未达到要求。损失函数用于表征模型拟合效果,例如损失函数越小则说明模型拟合效果越好。
图8示出了根据本申请的一个示例的表情包生成流程图。如图所示,用户输入聊天内容后,根据聊天内容判断是否触发表情包的生成,具体通过提取表情关键词,若存在表情关键词,则进一步通过表情生成器也即是神经网络模型生成表情包,并在app端显示。进一步监测用户是否使用该表情包,若未使用,则根据该表情包对神经网络模型进行迭代优化。
参照图9,示出了根据本申请实施例五的一种数据对象的生成装置实施例的结构框图,具体可以包括:
文字信息获取模块501,用于获取输入的文字信息;
触发确定模块502,用于确定所述文字信息触发生成数据对象;
数据对象生成模块503,用于根据所述文字信息和预设图片生成数据对象;
数据对象提供模块504,用于提供所述数据对象。
本申请的一种可选实施例中,所述触发确定模块包括:
关键内容检测子模块,用于检测所述文字信息中是否包括与所述数据对象关联的关键内容;
预设内容确定子模块,用于当所述文字信息中包括预设内容时,确定所述文字信息触发生成数据对象。
本申请的一种可选实施例中,所述数据对象生成模块包括:
特征数据提取子模块,用于提取所述文字信息和预设图片分别对应的特征数据;
信息结合子模块,用于根据所述文字信息和预设图片分别对应的特征数据,生成所述数据对象。
本申请的一种可选实施例中,所述信息结合子模块,具体用于合并所述特征数据,作为数据对象对应的特征数据;解析所述特征数据,得到所述数据对象。
本申请的一种可选实施例中,所述数据对象生成模块,具体用于将所述文字信息和预设图片输入神经网络模型,得到所述数据对象。
本申请的一种可选实施例中,所述装置还包括:
模型训练模块,用于在所述将所述文字信息和预设图片输入神经网络模型,得到所述数据对象之前,根据文字信息样本和图片样本以及对应标记的数据对象样本,训练用于根据文字信息和图片生成数据对象的神经网络模型。
本申请的一种可选实施例中,所述神经网络模型包括至少一个,所述神经网络模型具有对应的标识信息,所述装置还包括:
模型确定模块,用于在所述将所述文字信息和预设图片输入神经网络模型,得到所述数据对象之前,根据对所述标识信息的选择操作确定选用的至少一个神经网络模型。
本申请的一种可选实施例中,所述装置还包括:
模型判断模块,用于采用预先标记的数据对象判断所生成的神经网络模型是否达到要求,若未达到要求,则继续训练所述神经网络模型。
本申请的一种可选实施例中,所述装置还包括:
模型修正模块,用于检测对所提供的数据对象的选择操作,若不存在选择操作,则将所提供的数据对象作为负样本,对所述神经网络模型进行修正。
本申请的一种可选实施例中,所述数据对象包括表情包,所述数据对象提供模块,具体用于在聊天界面上增加所述表情包的显示元素。
本申请的一种可选实施例中,所述数据对象生成模块,具体用于获取输入文字信息的用户的特征信息,所述预设图片根据所述用户的特征信息确定。
本申请的一种可选实施例中,所述数据对象生成模块,具体用于根据所述文字信息确定待生成的数据对象的类别,所述预设图片从所述数据对象的类别对应的数据库中获取。
本申请创新提出了一种数据对象的生成方法,通过获取输入的文字信息,基于文字信息确定触发生成数据对象,进一步结合文字信息和预设图片生成数据对象,由于数据对象的生成结合了输入的文字信息和图片,从而使得生成的数据对象符合当前的文字信息所构成的语言环境,更符合实际的应用需求。
当预设图片包括随机图片时,可以使得生成的数据对象在符合当前语言环境的同时,更加多样化。
参照图10,示出了根据本申请实施例六的一种表情包的生成装置实施例的结构框图,具体可以包括:
聊天信息获取模块601,用于获取输入的聊天信息;
关键内容确定模块602,用于确定所述聊天信息中包括与表情包关联的关键内容;
数据对象生成模块603,用于根据所述聊天信息和随机图片生成表情包;
显示元素增加模块604,用于在聊天界面上增加所述表情包的显示元素。
本申请创新提出了一种表情包的生成方法,通过获取输入的文字信息,基于文字信息确定触发生成表情包,进一步结合文字信息和预设图片生成表情包,由于表情包的生成结合了输入的文字信息和图片,从而使得生成的表情包符合当前的文字信息所构成的语言环境,更符合实际的应用需求。
当预设图片包括随机图片时,可以使得生成的表情包在符合当前语言环境的同时,更加多样化。
参照图11,示出了根据本申请实施例七的一种数据对象的生成装置实施例的结构框图,具体可以包括:
监控模块701,用于监控针对数据对象的触发条件;
数据对象生成模块702,用于根据触发条件对应的输入信息生成数据对象;
数据对象提供模块703,用于提供所述数据对象。
本申请创新提出了一种数据对象的生成方法,通过获取输入的文字信息,基于文字信息确定触发生成数据对象,进一步结合文字信息和预设图片生成数据对象,由于数据对象的生成结合了输入的文字信息和图片,从而使得生成的数据对象符合当前的文字信息所构成的语言环境,更符合实际的应用需求。
当预设图片包括随机图片时,可以使得生成的数据对象在符合当前语言环境的同时,更加多样化。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的系统。图12示意性地示出了可被用于实现本公开中所述的各个实施例的示例性系统(或装置)800。
对于一个实施例,图12示出了示例性系统800,该系统具有一个或多个处理器802、被耦合到(一个或多个)处理器802中的至少一个的系统控制模块(芯片组)804、被耦合到系统控制模块804的系统存储器806、被耦合到系统控制模块804的非易失性存储器(NVM)/存储设备808、被耦合到系统控制模块804的一个或多个输入/输出设备810,以及被耦合到系统控制模块806的网络接口812。
处理器802可包括一个或多个单核或多核处理器,处理器802可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,系统800能够作为本申请实施例中所述的浏览器。
在一些实施例中,系统800可包括具有指令的一个或多个计算机可读介质(例如,系统存储器806或NVM/存储设备808)以及与该一个或多个计算机可读介质相合并被配置为执行指令以实现模块从而执行本公开中所述的动作的一个或多个处理器802。
对于一个实施例,系统控制模块804可包括任意适当的接口控制器,以向(一个或多个)处理器802中的至少一个和/或与系统控制模块804通信的任意适当的设备或组件提供任意适当的接口。
系统控制模块804可包括存储器控制器模块,以向系统存储器806提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
系统存储器806可被用于例如为系统800加载和存储数据和/或指令。对于一个实施例,系统存储器806可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,系统存储器806可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,系统控制模块804可包括一个或多个输入/输出控制器,以向NVM/存储设备808及(一个或多个)输入/输出设备810提供接口。
例如,NVM/存储设备808可被用于存储数据和/或指令。NVM/存储设备808可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备808可包括在物理上作为系统800被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,NVM/存储设备808可通过网络经由(一个或多个)输入/输出设备810进行访问。
(一个或多个)输入/输出设备810可为系统800提供接口以与任意其他适当的设备通信,输入/输出设备810可以包括通信组件、音频组件、传感器组件等。网络接口812可为系统800提供接口以通过一个或多个网络通信,系统800可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi、2G、3G、4G或5G,或它们的组合进行无线通信。
对于一个实施例,(一个或多个)处理器802中的至少一个可与系统控制模块804的一个或多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器802中的至少一个可与系统控制模块804的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器802中的至少一个可与系统控制模块804的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器802中的至少一个可与系统控制模块804的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,系统800可以但不限于是:浏览器、工作站、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中,系统800可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,系统800包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
其中,如果显示器包括触摸面板,显示屏可以被实现为触屏显示器,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在终端设备时,可以使得该终端设备执行本申请实施例中各方法步骤的指令(instructions)。
在一个示例中提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如本申请实施例的方法。
在一个示例中还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请实施例的一个或多个的方法。
本申请提供的示例1包括一种数据对象的生成方法,包括:
获取输入的文字信息;
确定所述文字信息触发生成数据对象;
根据所述文字信息和预设图片生成数据对象,并提供所述数据对象。
示例2、包括示例1所述的方法,所述确定所述文字信息触发生成数据对象包括:
检测所述文字信息中是否包括与所述数据对象关联的关键内容;
当所述文字信息中包括预设内容时,确定所述文字信息触发生成数据对象。
示例3、包括示例1所述的方法,所述根据所述文字信息和预设图片生成数据对象包括:
提取所述文字信息和预设图片分别对应的特征数据;
根据所述文字信息和预设图片分别对应的特征数据,生成所述数据对象。
示例4、包括示例3所述的方法,所述根据所述文字信息和预设图片分别对应的特征数据,生成所述数据对象包括:
合并所述特征数据,作为数据对象对应的特征数据;
解析所述特征数据,得到所述数据对象。
示例5、包括示例1所述的方法,所述根据所述文字信息和预设图片生成数据对象包括:
将所述文字信息和预设图片输入神经网络模型,得到所述数据对象。
示例6、包括示例5所述的方法,在所述将所述文字信息和预设图片输入神经网络模型,得到所述数据对象之前,所述方法还包括:
根据文字信息样本和图片样本以及对应标记的数据对象样本,训练用于根据文字信息和图片生成数据对象的神经网络模型。
示例7、包括示例5所述的方法,所述神经网络模型包括至少一个,所述神经网络模型具有对应的标识信息,在所述将所述文字信息和预设图片输入神经网络模型,得到所述数据对象之前,所述方法还包括:
根据对所述标识信息的选择操作确定选用的至少一个神经网络模型。
示例8、包括示例5所述的方法,所述方法还包括:
采用预先标记的数据对象判断所生成的神经网络模型是否达到要求;
若未达到要求,则继续训练所述神经网络模型。
示例9、包括示例5所述的方法,所述方法还包括:
检测对所提供的数据对象的用户选择使用的操作,若不存在用户选择使用的操作,则将所提供的数据对象作为负样本,对所述神经网络模型进行修正。
示例10、包括示例1所述的方法,所述数据对象包括表情包,所述提供所述数据对象包括:
在聊天界面上增加所述表情包的显示元素。
示例11、包括示例1所述的方法,在所述根据所述文字信息和预设图片生成数据对象之前,所述方法还包括:
获取输入文字信息的用户的特征信息,所述预设图片根据所述用户的特征信息确定。
示例12、包括示例1所述的方法,在所述根据所述文字信息和预设图片生成数据对象之前,所述方法还包括:
根据所述文字信息确定待生成的数据对象的类别,所述预设图片从所述数据对象的类别对应的数据库中获取。
示例13包括一种表情包的生成方法,包括:
获取输入的聊天信息;
确定所述聊天信息中包括与表情包关联的关键内容;
根据所述聊天信息和随机图片生成表情包;
在聊天界面上增加所述表情包的显示元素。
示例14包括一种数据对象的生成方法,包括:
监控针对数据对象的触发条件;
根据触发条件对应的输入信息生成数据对象;
提供所述数据对象。
示例15包括一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如示例1-14一个或多个的方法。
示例16包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如示例1-14一个或多个的方法
虽然某些实施例是以说明和描述为目的的,各种各样的替代、和/或、等效的实施方案、或计算来达到同样的目的实施例示出和描述的实现,不脱离本申请的实施范围。本申请旨在覆盖本文讨论的实施例的任何修改或变化。因此,显然本文描述的实施例仅由权利要求和它们的等同物来限定。

Claims (16)

1.一种数据对象的生成方法,其特征在于,包括:
获取输入的文字信息;
确定所述文字信息触发生成数据对象;
根据所述文字信息和预设图片生成数据对象,并提供所述数据对象。
2.根据权利要求1所述的方法,其特征在于,所述确定所述文字信息触发生成数据对象包括:
检测所述文字信息中是否包括与所述数据对象关联的关键内容;
当所述文字信息中包括预设内容时,确定所述文字信息触发生成数据对象。
3.根据权利要求1所述的方法,其特征在于,所述根据所述文字信息和预设图片生成数据对象包括:
提取所述文字信息和预设图片分别对应的特征数据;
根据所述文字信息和预设图片分别对应的特征数据,生成所述数据对象。
4.根据权利要求3所述的方法,其特征在于,所述根据所述文字信息和预设图片分别对应的特征数据,生成所述数据对象包括:
合并所述特征数据,作为数据对象对应的特征数据;
解析所述特征数据,得到所述数据对象。
5.根据权利要求1所述的方法,其特征在于,所述根据所述文字信息和预设图片生成数据对象包括:
将所述文字信息和预设图片输入神经网络模型,得到所述数据对象。
6.根据权利要求5所述的方法,其特征在于,在所述将所述文字信息和预设图片输入神经网络模型,得到所述数据对象之前,所述方法还包括:
根据文字信息样本和图片样本以及对应标记的数据对象样本,训练用于根据文字信息和图片生成数据对象的神经网络模型。
7.根据权利要求5所述的方法,其特征在于,所述神经网络模型包括至少一个,所述神经网络模型具有对应的标识信息,在所述将所述文字信息和预设图片输入神经网络模型,得到所述数据对象之前,所述方法还包括:
根据对所述标识信息的选择操作确定选用的至少一个神经网络模型。
8.根据权利要求5所述的方法,其特征在于,所述方法还包括:
采用预先标记的数据对象判断所生成的神经网络模型是否达到要求;
若未达到要求,则继续训练所述神经网络模型。
9.根据权利要求5所述的方法,其特征在于,所述方法还包括:
检测对所提供的数据对象的用户选择使用的操作,若不存在用户选择使用的操作,则将所提供的数据对象作为负样本,对所述神经网络模型进行修正。
10.根据权利要求1所述的方法,其特征在于,所述数据对象包括表情包,所述提供所述数据对象包括:
在聊天界面上增加所述表情包的显示元素。
11.根据权利要求1所述的方法,其特征在于,在所述根据所述文字信息和预设图片生成数据对象之前,所述方法还包括:
获取输入文字信息的用户的特征信息,所述预设图片根据所述用户的特征信息确定。
12.根据权利要求1所述的方法,其特征在于,在所述根据所述文字信息和预设图片生成数据对象之前,所述方法还包括:
根据所述文字信息确定待生成的数据对象的类别,所述预设图片从所述数据对象的类别对应的数据库中获取。
13.一种表情包的生成方法,其特征在于,包括:
获取输入的聊天信息;
确定所述聊天信息中包括与表情包关联的关键内容;
根据所述聊天信息和随机图片生成表情包;
在聊天界面上增加所述表情包的显示元素。
14.一种数据对象的生成方法,其特征在于,包括:
监控针对数据对象的触发条件;
根据触发条件对应的输入信息生成数据对象;
提供所述数据对象。
15.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-14一个或多个的方法。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-14一个或多个的方法。
CN201911144553.3A 2019-11-20 2019-11-20 数据对象、表情包的生成方法、计算机设备、存储介质 Pending CN112825015A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201911144553.3A CN112825015A (zh) 2019-11-20 2019-11-20 数据对象、表情包的生成方法、计算机设备、存储介质
PCT/CN2020/129989 WO2021098754A1 (zh) 2019-11-20 2020-11-19 数据对象、表情包的生成方法、计算机设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911144553.3A CN112825015A (zh) 2019-11-20 2019-11-20 数据对象、表情包的生成方法、计算机设备、存储介质

Publications (1)

Publication Number Publication Date
CN112825015A true CN112825015A (zh) 2021-05-21

Family

ID=75907128

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911144553.3A Pending CN112825015A (zh) 2019-11-20 2019-11-20 数据对象、表情包的生成方法、计算机设备、存储介质

Country Status (2)

Country Link
CN (1) CN112825015A (zh)
WO (1) WO2021098754A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11797153B1 (en) 2022-08-08 2023-10-24 Sony Group Corporation Text-enhanced emoji icons

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977928A (zh) * 2017-12-21 2018-05-01 广东欧珀移动通信有限公司 表情生成方法、装置、终端及存储介质
CN108932066A (zh) * 2018-06-13 2018-12-04 北京百度网讯科技有限公司 输入法获取表情包的方法、装置、设备和计算机存储介质
CN109147010A (zh) * 2018-08-22 2019-01-04 广东工业大学 带属性人脸图像生成方法、装置、系统及可读存储介质
CN109189985A (zh) * 2018-08-17 2019-01-11 北京达佳互联信息技术有限公司 文本风格处理方法、装置、电子设备及存储介质
CN109240580A (zh) * 2018-06-29 2019-01-18 无锡天脉聚源传媒科技有限公司 一种基于语义分析的图片输入方法、系统、装置和存储器
US20190132264A1 (en) * 2017-10-30 2019-05-02 International Business Machines Corporation Generation of a chatbot interface for an application programming interface
CN109831572A (zh) * 2018-12-14 2019-05-31 深圳壹账通智能科技有限公司 聊天图片控制方法、装置、计算机设备及存储介质
CN110221710A (zh) * 2019-05-29 2019-09-10 北京金山安全软件有限公司 一种键盘输入方法、装置、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180268439A1 (en) * 2017-03-16 2018-09-20 International Business Machines Corporation Dynamically generating and delivering sequences of personalized multimedia content
CN109741423A (zh) * 2018-12-28 2019-05-10 北京奇艺世纪科技有限公司 表情包生成方法及系统
CN110442248A (zh) * 2019-06-20 2019-11-12 上海萌家网络科技有限公司 一种输入法及输入系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190132264A1 (en) * 2017-10-30 2019-05-02 International Business Machines Corporation Generation of a chatbot interface for an application programming interface
CN107977928A (zh) * 2017-12-21 2018-05-01 广东欧珀移动通信有限公司 表情生成方法、装置、终端及存储介质
CN108932066A (zh) * 2018-06-13 2018-12-04 北京百度网讯科技有限公司 输入法获取表情包的方法、装置、设备和计算机存储介质
CN109240580A (zh) * 2018-06-29 2019-01-18 无锡天脉聚源传媒科技有限公司 一种基于语义分析的图片输入方法、系统、装置和存储器
CN109189985A (zh) * 2018-08-17 2019-01-11 北京达佳互联信息技术有限公司 文本风格处理方法、装置、电子设备及存储介质
CN109147010A (zh) * 2018-08-22 2019-01-04 广东工业大学 带属性人脸图像生成方法、装置、系统及可读存储介质
CN109831572A (zh) * 2018-12-14 2019-05-31 深圳壹账通智能科技有限公司 聊天图片控制方法、装置、计算机设备及存储介质
CN110221710A (zh) * 2019-05-29 2019-09-10 北京金山安全软件有限公司 一种键盘输入方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2021098754A1 (zh) 2021-05-27

Similar Documents

Publication Publication Date Title
EP3686772B1 (en) On-device classification of fingertip motion patterns into gestures in real-time
CN106484266B (zh) 一种文本处理方法及装置
CN113344901B (zh) 涂胶缺陷检测方法、装置、存储介质及电子设备
US10218937B2 (en) Video calling method and apparatus
CN110321845B (zh) 一种从视频中提取表情包的方法、装置及电子设备
CN110298212B (zh) 模型训练方法、情绪识别方法、表情显示方法及相关设备
CN113254815B (zh) 文档处理、页面处理方法及设备
US8555156B2 (en) Inferring that a message has been read
CN110175223A (zh) 一种实现问题生成的方法及装置
CN110597965B (zh) 文章的情感极性分析方法、装置、电子设备及存储介质
WO2019233365A1 (zh) 一种数据处理方法、装置、电子设备和可读介质
CN111488186A (zh) 数据处理方法、装置、电子设备及计算机存储介质
CN113037925B (zh) 信息处理方法、信息处理装置、电子设备和可读存储介质
CN113869063A (zh) 数据推荐方法、装置、电子设备及存储介质
CN112825015A (zh) 数据对象、表情包的生成方法、计算机设备、存储介质
US20170091760A1 (en) Device and method for currency conversion
US20190149878A1 (en) Determining and correlating visual context on a user device with user behavior using digital content on the user device
CN116910368A (zh) 内容处理方法、装置、设备和存储介质
CN108287817B (zh) 一种信息处理方法及设备
CN105893402A (zh) 用于终端设备的信息展现方法和终端设备
CN113342684A (zh) 一种网页的测试方法、装置及设备
CN114297017A (zh) 异常处理方法、装置、电子设备和存储介质
CN114154464A (zh) 结构图片还原方法、装置、电子设备、介质及程序产品
CN114154467A (zh) 结构图片还原方法、装置、电子设备、介质及程序产品
CN113515701A (zh) 信息推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination