CN111383302A

CN111383302A - 一种图像配文方法及装置、终端和计算机可读存储介质

Info

Publication number: CN111383302A
Application number: CN201811646848.6A
Authority: CN
Inventors: 陈瑞
Original assignee: ZTE Corp
Current assignee: ZTE Corp
Priority date: 2018-12-29
Filing date: 2018-12-29
Publication date: 2020-07-07

Abstract

本申请涉及一种图像配文方法、图像配文装置、终端和计算机可读存储介质。图像配文方法，包括：识别待配文图像的第一图像信息；根据第一图像信息，匹配与第一图像信息相对应的文本信息；根据文本信息，展示文本。通过自动识别待配文图像的第一图像信息，并根据第一图像信息匹配与待配文图像相对应的文本信息，实现了对图像的自动配文，有效地简化了图像配文的过程，并且降低配文过程的耗时，使得用户为图像配文更加简单便捷，有效地提升了配文功能的体验感。

Description

一种图像配文方法及装置、终端和计算机可读存储介质

技术领域

本申请涉及图像处理领域，尤其涉及一种图像配文方法、图像配文装置、终端和计算机可读存储介质。

背景技术

目前，随着互联网的发展，在一些软件中，一张图片会匹配一段文字，图文结合的方式去表达一种意境、态度、心情等等。比如图片分享软件，给图片配上一句歌词、名句等，锁屏壁纸上配上鸡汤文字。

在相关技术中，软件为图片配文主要通过以下三种方法：第一种，由用户人工输入一段话，给图片配词；第二种，软件提供一些精美语句工用户选择；第三种，由内容服务平台的“小编”在后台人工做好图文编辑；这也就是说，以上三种为图片配文的方法都是通过人工看图，根据自己的理解或感觉完成图片和文字的编辑。但通过人工方法为图片配文，使得为图片配文的过程复杂，耗时也较长，并且在用户未图片配文时，由于用户对配文过程的不熟悉，而使得用户操作不便，降低了用户对配文功能的体验感。

发明内容

为了解决上述技术问题或者至少部分地解决上述技术问题，本申请提供了一种图像配文方法、图像配文装置、终端和计算机可读存储介质。

第一方面，本申请提供了一种图像配文方法，包括：识别待配文图像的第一图像信息；根据第一图像信息，匹配与第一图像信息相对应的文本信息；根据文本信息，展示文本。

可选地，图像配文方法还包括：通过卷积神经网络建立第一算法；识别预设图像，并获取预设图像的第一标签；根据第一算法、预设图像和第一标签，训练出图像识别模型；根据图像识别模型，识别待配文图像的第一图像信息。

可选地，在根据第一算法、预设图像和第一标签，训练出图像识别模型之后，图像配文方法还包括：根据图像识别模型，识别验证图像的第二图像信息；判断第二图像信息与验证图像的第二标签是否匹配；在第二图像信息与第二标签相匹配的情况下，根据图像识别模型，识别待配文图像的第一图像信息；在第二图像信息与第二标签不匹配的情况下，调整图像识别模型，并再次根据图像识别模型，识别验证图像的第二图像信息。

可选地，第一图像信息包括：待配文图像所包含的景物信息；和/或待配文图像所体现的情感信息。

第二方面，本申请提供了一种图像配文装置，包括存储器、处理器、存储在存储器上并可在处理器上运行的计算机指令，处理器执行计算机指令时实现：识别待配文图像的第一图像信息；根据第一图像信息，匹配与第一图像信息相对应的文本信息；根据文本信息，展示文本。

可选地，处理器执行计算机指令时还实现：通过卷积神经网络建立第一算法；识别预设图像，并获取预设图像的第一标签；根据第一算法、预设图像和第一标签，训练出图像识别模型；根据图像识别模型，识别待配文图像的第一图像信息。

可选地，处理器执行计算机指令时还实现：根据图像识别模型，识别验证图像的第二图像信息；判断第二图像信息与验证图像的第二标签是否匹配；在第二图像信息与第二标签相匹配的情况下，根据图像识别模型，识别待配文图像的第一图像信息；在第二图像信息与第二标签不匹配的情况下，调整图像识别模型，并再次根据图像识别模型，识别验证图像的第二图像信息。

第三方面，本申请提供了一种终端，包括如第二方面所述的图像配文装置。

第四方面，本申请提供了一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令被处理器执行时实现如第一方面所述的图像配文方法的步骤。

本申请实施例提供的上述技术方案与现有技术相比具有如下优点：

本申请实施例提供的该方法，通过自动识别待配文图像的第一图像信息，并根据第一图像信息匹配与待配文图像相对应的文本信息，实现了对图像的自动配文，有效地简化了图像配文的过程，并且降低配文过程的耗时，使得用户为图像配文更加简单便捷，有效地提升了配文功能的体验感。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一个实施例提供的一种图像配文方法的流程图；

图2为本申请另一个实施例提供的一种图像配文方法的流程图；

图3为本申请再一实施例提供的一种图像配文方法的流程图；

图4是本发明一个实施例提供的移动终端的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

现在将参考附图描述实现本发明各个实施例的移动终端。在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明，其本身并没有特定的意义。因此，“模块”与“部件”可以混合地使用。

图1为本申请实施例提供一种图像配文方法的流程图，图像配文方法包括：

步骤102，识别待配文图像的第一图像信息；

步骤104，根据第一图像信息，匹配与第一图像信息相对应的文本信息；

步骤106，根据文本信息，展示文本。

在该实施例中，通过自动识别待配文图像的第一图像信息，并根据第一图像信息匹配与待配文图像相对应的文本信息，实现了对图像的自动配文，有效地简化了图像配文的过程，并且降低配文过程的耗时，使得用户为图像配文更加简单便捷，有效地提升了配文功能的体验感。

可选地，匹配与第一图像信息相对应的文本信息时，可根据第一图像信息在配词库中搜索与其相匹配的文本信息，配词库可通过收集大量的精美诗句、典语、歌词、流行语录等文字，给每一个语句做有一个情感标签和多个物体标签，形成一个文案词库。

图2为本申请实施例提供一种图像配文方法的流程图，图像配文方法包括：

步骤202，通过卷积神经网络建立第一算法；

步骤204，识别预设图像，并获取预设图像的第一标签；

步骤206，根据第一算法、预设图像和第一标签，训练出图像识别模型；

步骤208，根据图像识别模型，识别待配文图像的第一图像信息；

步骤210，根据第一图像信息，匹配与第一图像信息相对应的文本信息；

步骤212，根据文本信息，展示文本。

在该实施例中，通过卷积神经网络(CNN，Convolutional Neural Network)建立第一算法，并通过识别大量的预设图像，实现深度自学习，进而训练得到图像识别模型，在通过图像识别模型识别待配文图像。CNN适合做图片分类，通过卷积来模拟特征区分，并且通过卷积的权值共享及池化，来降低神经网络参数的数量级，再通过传统神经网络完成分类任务。深度学习框架平台可以基于现有的自学习平台。

CNN是非全连接的神经网络，且同一层中某些神经元之间共享连接的权重和偏移，CNN结构包括如下几层：

输入层：用于数据的输入；

卷积层：使用卷积核进行特征提取和特征映射；

激励层：由于卷积也是一种线性运算，因此需要增加非线性映射；

池化层：进行下采样，对特征图稀疏处理，减少数据运算量；

全连接层：通常在CNN的尾部进行重新拟合，减少特征信息的损失；

输出层：用于输出结果。

图3为本申请实施例提供一种图像配文方法的流程图，图像配文方法包括：

步骤302，通过卷积神经网络建立第一算法；

步骤304，识别预设图像，并获取预设图像的第一标签；

步骤306，根据第一算法、预设图像和第一标签，训练出图像识别模型；

步骤308，根据图像识别模型，识别验证图像的第二图像信息；

步骤310，判断第二图像信息与验证图像的第二标签是否匹配；

步骤312，在第二图像信息与第二标签相匹配的情况下，根据图像识别模型，识别待配文图像的第一图像信息；

步骤314，根据第一图像信息，匹配与第一图像信息相对应的文本信息；

步骤316，根据文本信息，展示文本；

步骤318，在第二图像信息与第二标签不匹配的情况下，调整图像识别模型，并再次根据图像识别模型，识别验证图像的第二图像信息。

在该实施例中，根据图像识别模型，识别验证图像的第二图像信息，再将识别出的第二图像信息和预设图像的图像信息(第二标签)进行比对，进而判断根据图像识别模型所识别出的图像信息是否正确，如果识别出的图像信息出现偏差，则对图像识别模型进行调整。

在本发明的一个实施例中，本申请提供了一种图像配文装置，包括存储器、处理器、存储在存储器上并可在处理器上运行的计算机指令，处理器执行计算机指令时实现：识别待配文图像的第一图像信息；根据第一图像信息，匹配与第一图像信息相对应的文本信息；根据文本信息，展示文本。

在该实施例中，通过卷积神经网络(CNN，Convolutional Neural Network)建立第一算法，并通过识别大量的预设图像，实现深度自学习，进而训练得到图像识别模型，在通过图像识别模型识别待配文图像。CNN适合做图片分类，通过卷积来模拟特征区分，并且通过卷积的权值共享及池化，来降低神经网络参数的数量级，再通过传统神经网络完成分类任务。

在本发明的一个实施例中，本申请提供了一种终端，包括如上述任一实施例所述的图像配文装置。

终端包括移动终端和固定终端，移动终端可以以各种形式来实施。例如，本发明中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面，假设终端是移动终端。然而，本领域技术人员将理解的是，除了特别用于移动目的的元件之外，根据本发明的实施方式的构造也能够应用于固定类型的终端。

图4是本发明一个实施例提供的移动终端的结构示意图。图4所示的移动终端400包括：至少一个处理器401、存储器402、至少一个网络接口404和其他用户接口403。移动终端400中的各个组件通过总线系统405耦合在一起。可理解，总线系统405用于实现这些组件之间的连接通信。总线系统405除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图4中将各种总线都标为总线系统405。

其中，用户接口403可以包括显示器、键盘或者点击设备(例如，鼠标，轨迹球(trackball)、触感板或者触摸屏等。

可以理解，本发明实施例中的存储器402可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(Read-OnlyMemory，ROM)、可编程只读存储器(ProgrammableROM，PROM)、可擦除可编程只读存储器(ErasablePROM，EPROM)、电可擦除可编程只读存储器(ElectricallyEPROM，EEPROM)或闪存。易失性存储器可以是随机存取存储器(RandomAccessMemory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用，例如静态随机存取存储器(StaticRAM，SRAM)、动态随机存取存储器(DynamicRAM，DRAM)、同步动态随机存取存储器(SynchronousDRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(DoubleDataRateSDRAM，DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM，ESDRAM)、同步连接动态随机存取存储器(SynchlinkDRAM，SLDRAM)和直接内存总线随机存取存储器(DirectRambusRAM，DRRAM)。本文描述的存储器402旨在包括但不限于这些和任意其它适合类型的存储器。

在一些实施方式中，存储器402存储了如下的元素，可执行单元或者数据结构，或者他们的子集，或者他们的扩展集：操作系统4021和应用程序4022。

其中，操作系统4021，包含各种系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务。应用程序4022，包含各种应用程序，例如媒体播放器(MediaPlayer)、浏览器(Browser)等，用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序4022中。

在本发明实施例中，通过调用存储器402存储的程序或指令，具体的，可以是应用程序4022中存储的程序或指令，处理器401用于执行各方法实施例所提供的方法步骤，例如包括：识别待配文图像的第一图像信息；根据第一图像信息，匹配与第一图像信息相对应的文本信息；根据文本信息，展示文本。

上述本发明实施例揭示的方法可以应用于处理器401中，或者由处理器401实现。处理器401可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器401中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器401可以是通用处理器、数字信号处理器(DigitalSignalProcessor，DSP)、专用集成电路(ApplicationSpecific IntegratedCircuit，ASIC)、现成可编程门阵列(FieldProgrammableGateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器402，处理器401读取存储器402中的信息，结合其硬件完成上述方法的步骤。

在本发明的一个实施例中，本申请提供了一种计算机可读存储介质，其上存储有计算机指令，所述计算机指令被处理器执行时实现各方法实施例所提供的方法步骤，例如包括：识别待配文图像的第一图像信息；根据第一图像信息，匹配与第一图像信息相对应的文本信息；根据文本信息，展示文本。

可以理解的是，本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(ApplicationSpecificIntegratedCircuits，ASIC)、数字信号处理器(DigitalSignalProcessing，DSP)、数字信号处理设备(DSPDevice，DSPD)、可编程逻辑设备(ProgrammableLogicDevice，PLD)、现场可编程门阵列(Field-ProgrammableGateArray，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现，可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明各个实施例所述的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法或者实施例的某些部分所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种图像配文方法，其特征在于，包括：

识别待配文图像的第一图像信息；

根据所述第一图像信息，匹配与所述第一图像信息相对应的文本信息；

根据所述文本信息，展示文本。

2.根据权利要求1所述的图像配文方法，其特征在于，还包括：

通过卷积神经网络建立第一算法；

识别预设图像，并获取所述预设图像的第一标签；

根据所述第一算法、所述预设图像和所述第一标签，训练出图像识别模型；

根据所述图像识别模型，识别所述待配文图像的第一图像信息。

3.根据权利要求2所述的图像配文方法，其特征在于，在所述根据所述第一算法、所述预设图像和所述第一标签，训练出图像识别模型之后，所述图像配文方法还包括：

根据所述图像识别模型，识别验证图像的第二图像信息；

判断所述第二图像信息与所述验证图像的第二标签是否匹配；

在所述第二图像信息与所述第二标签相匹配的情况下，根据所述图像识别模型，识别所述待配文图像的第一图像信息；

在所述第二图像信息与所述第二标签不匹配的情况下，调整所述图像识别模型，并再次根据所述图像识别模型，识别验证图像的第二图像信息。

4.根据权利要求1至3中任一项所述的图像配文方法，其特征在于，所述第一图像信息包括：

所述待配文图像所包含的景物信息；和/或

所述待配文图像所体现的情感信息。

5.一种图像配文装置，其特征在于，包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的计算机指令，所述处理器执行所述计算机指令时实现：

识别待配文图像的第一图像信息；

根据所述文本信息，展示文本。

6.根据权利要求5所述的图像配文装置，其特征在于，所述处理器执行所述计算机指令时还实现：

通过卷积神经网络建立第一算法；

识别预设图像，并获取所述预设图像的第一标签；

7.根据权利要求5所述的图像配文装置，其特征在于，所述处理器执行所述计算机指令时还实现：

根据所述图像识别模型，识别验证图像的第二图像信息；

8.根据权利要求5至7中任一项所述的图像配文装置，其特征在于，所述第一图像信息包括：

所述待配文图像所包含的景物信息；和/或

所述待配文图像所体现的情感信息。

9.一种终端，其特征在于，包括如权利要求5至8中任一项所述的图像配文装置。

10.一种计算机可读存储介质，其上存储有计算机指令，其特征在于，所述计算机指令被处理器执行时实现如权利要求1至4中任一项所述的图像配文方法的步骤。