CN114140797A

CN114140797A - 图像处理方法、智能终端及存储介质

Info

Publication number: CN114140797A
Application number: CN202111456320.4A
Authority: CN
Inventors: 王�琦
Original assignee: Shenzhen Transsion Holdings Co Ltd
Current assignee: Shenzhen Transsion Holdings Co Ltd
Priority date: 2021-12-01
Filing date: 2021-12-01
Publication date: 2022-03-04

Abstract

本申请公开了一种图像处理方法，该方法包括：获取待检测的第一图像，若所述第一图像中包含文本信息，从所述第一图像中提取文本信息和图像信息；对提取的文本信息和图像信息进行检测，以确定所述第一图像中是否存在预设内容。本申请还公开了一种智能终端和存储介质。通过同时检测图片中的图像信息和文字信息是否包含预设内容，从而提高对违规图像的识别准确率。

Description

图像处理方法、智能终端及存储介质

技术领域

本申请涉及图像识别技术领域，具体涉及一种图像处理方法、智能终端及存储介质。

背景技术

随着信息时代的发展和社交软件的普及，全球各地越来越多的人通过网络发表言论，为营造一个安全、纯净的网络环境，往往需要对网络用户上传/发表的信息进行审核，确保用户上传/发表的内容中不存在违规内容才能公开。特别是用户上传/发表的图片，需要对图片中是否包含违规内容进行检测。

在构思及实现本申请过程中，发明人发现至少存在如下问题：

一些对图片中是否存在违规内容的审核，大多依赖于人工审核，而通过模型检测实现自动审核的方式，只对图片中的图像信息进行审核，而忽略了图片中包含的文字信息的违规，例如申请号为202010100735.7的专利公开的图像检测方法，旨在通过对模型训练的改进，提高模型对图像信息的识别精度；以及申请号为202010330417.X的专利公开的图像审核方法，旨在通过对特征匹配的改进，提高对图像信息的识别精度，使训练后的模型能够识别图像中存在嵌套或经过缩放的违规特征。上述两者都只关注于图片信息是否包含违规内容，但是却忽略了图片信息中包含的文字信息的违规，若通过添加文字和/或水印的形式对图像信息进行部分遮挡，则会影响对图像信息的检测，从而影响对违规图片的审核结果。

前面的叙述在于提供一般的背景信息，并不一定构成现有技术。

发明内容

针对上述技术问题，本申请提供一种图像处理方法、智能终端及存储介质，旨在解决上述对图片中是否存在违规内容进行审核时，只关注于图片中的图像信息中是否存在违规内容而忽略了图片中包含的文字信息是否存在违规的技术问题，使图片的审核结果更加准确。

为解决上述技术问题，本申请提供一种图像处理方法，可应用于智能终端，包括：

获取待检测的第一图像，若所述第一图像中包含文本信息，从所述第一图像中提取文本信息和图像信息；

对提取的文本信息和图像信息进行检测，以确定所述第一图像中是否存在预设内容。

可选地，所述预设内容包括以下至少一种：

违规内容和/或信息；

非法内容和/或信息；

不符合预设规定的内容和/或信息；

禁止传播内容和/或信息。

可选地，所述对提取的文本信息和图像信息进行检测，以确定所述第一图像中是否存在预设内容的步骤，包括：

将提取的文本信息和图像信息输入预设的目标检测模型中，可选地，所述目标检测模型是基于样本数据集对预设待训练的基础检测模型进行迭代训练得到的，可选地，所述目标模型包括文本检测模型和/或图像检测模型；

利用所述目标检测模型中的文本检测模型对所述文本信息进行检测，确定所述文本信息中存在预设内容的第一概率；

利用所述目标检测模型中的图像检测模型对所述图像信息进行检测，确定所述图像信息中存在预设内容的第二概率；

根据所述第一概率和所述第二概率，确定所述第一图像中是否存在预设内容。

可选地，所述将提取的文本信息和图像信息输入预设的目标检测模型中的步骤之前，还包括：

获取样本数据集并构建待训练的基础检测模型，可选地，所述样本数据集包括多分类样本数据和/或所述多分类样本数据的标签信息；

利用所述样本数据集中的多分类样本数据和所述多分类样本数据的标签信息，对所述基础检测模型进行迭代训练，得到目标检测模型。

可选地，所述目标检测模型包括多分类文本特征库，所述多分类文本特征库包括至少一个不同语言类型的文本特征库，所述利用所述目标检测模型中的文本检测模型对所述文本信息进行检测，确定所述文本信息中存在预设内容的第一概率的步骤，包括：

对所述文本信息进行检测，以确定所述文本信息的语言类型；

根据所述文本信息的语言类型，从所述目标检测模型的多分类文本特征库中确定目标文本特征库；

将所述文本信息与所述目标文本特征库进行匹配，根据匹配结果确定所述文本信息中存在预设内容的第一概率。

可选地，所述目标检测模型包括多分类图像特征库，所述多分类图像特征库包括至少一个不同族群的图像特征库，所述利用所述目标检测模型中的图像检测模型对所述图像信息进行检测，确定所述图像信息中存在预设内容的第二概率的步骤，包括：

对所述图像信息进行检测，以确定所述图像信息对应的目标族群；

根据所述目标族群从所述目标检测模型的多分类图像特征库中确定目标图像特征库，并从所述图像信息中提取目标特征；

将所述目标特征与所述图像特征库进行匹配，根据匹配结果确定所述图像信息中存在预设内容的第二概率。

可选地，所述对提取的文本信息和图像信息进行检测，以确定所述第一图像中是否存在预设内容的步骤之前，还包括：

从所述图像信息中确定所述文本信息所在的目标区域；

对所述目标区域进行像素填充和/或邻域增强处理，得到第一检测图像；

对所述第一检测图像和所述文本信息进行滤波处理，以对所述图像信息和所述文本信息进行增强。

可选地，所述对所述目标区域进行像素填充和/或邻域增强处理，得到第一检测图像的步骤，包括：

从所述图像信息中确定所述目标区域中的目标像素点的邻域，并获取所述目标像素点的邻域的像素值；

根据所述目标像素点的邻域的像素值，对所述目标像素点进行像素填充和/ 或邻域增强处理，得到第一检测图像。

可选地，所述对提取的文本信息和图像信息进行检测，以确定所述第一图像中是否存在预设内容的步骤之后，包括：

若所述第一图像中存在预设内容，获取所述第一图像的校验信息；

根据所述校验信息判定所述第一图像是否为违规图像，和/或输出判定结果。

本申请还提供一种智能终端，包括：存储器、处理器，其中，所述存储器上存储有图像处理程序，所述图像处理程序被所述处理器执行时实现如上任一所述图像处理方法的步骤。

本申请还提供一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上任一所述图像处理方法的步骤。

如上所述，本申请的图像处理方法，应用于智能终端，通过获取待检测的第一图像，若所述第一图像中包含文本信息，从所述第一图像中提取文本信息和图像信息；对提取的文本信息和图像信息进行检测，以确定所述第一图像中是否存在预设内容。通过上述方式，可以同时检测图片中的图像信息和文字信息是否包含预设内容，从而提高对违规图像的识别准确率。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。为了更清楚地说明本申请实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为实现本申请各个实施例的一种智能终端的硬件结构示意图；

图2为本申请实施例提供的一种通信网络系统架构图；

图3是根据第一实施例示出的图像处理方法的流程示意图。

图4至图6是根据第一实施例示出的图像处理方法中对图片的检测流程示意图；

图7至图9是根据第一实施例示出的图像处理方法中人工审核的界面示意图；

图10是根据第一实施例示出的图像处理方法中根据判定结果输出并显示提示信息的界面示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。通过上述附图，已示出本申请明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围，而是通过参考特定实施例为本领域技术人员说明本申请的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素，此外，本申请不同实施例中具有同样命名的部件、特征、要素可能具有相同含义，也可能具有不同含义，其具体含义需以其在该具体实施例中的解释或者进一步结合该具体实施例中上下文进行确定。

应当理解，尽管在本文可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本文范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语"如果"可以被解释成为"在……时"或"当……时"或"响应于确定"。再者，如同在本文中所使用的，单数形式“一”、“一个”和“该”旨在也包括复数形式，除非上下文中有相反的指示。应当进一步理解，术语“包含”、“包括”表明存在所述的特征、步骤、操作、元件、组件、项目、种类、和/或组，但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。本申请使用的术语“或”、“和/或”、“包括以下至少一个”等可被解释为包括性的，或意味着任一个或任何组合。例如，“包括以下至少一个：A、B、C”意味着“以下任一个： A；B；C；A和B；A和C；B和C；A和B和C”，再如，“A、B或C”或者“A、 B和/或C”意味着“以下任一个：A；B；C；A和B；A和C；B和C；A和B和 C”。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时，才会出现该定义的例外。

应该理解的是，虽然本申请实施例中的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

取决于语境，如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

需要说明的是，在本文中，采用了诸如S11、S12等步骤代号，其目的是为了更清楚简要地表述相应内容，不构成顺序上的实质性限制，本领域技术人员在具体实施时，可能会先执行S12后执行S11等，但这些均应在本申请的保护范围之内。

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或者“单元”的后缀仅为了有利于本申请的说明，其本身没有特定的意义。因此，“模块”、“部件”或者“单元”可以混合地使用。

智能终端可以以各种形式来实施。例如，本申请中描述的智能终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant，PDA)、便捷式媒体播放器(Portable Media Player，PMP)、导航装置、可穿戴设备、智能手环、计步器等智能终端，以及诸如数字TV、台式计算机等固定终端。

后续描述中将以智能终端为例进行说明，本领域技术人员将理解的是，除了特别用于移动目的的元件之外，根据本申请的实施方式的构造也能够应用于固定类型的终端。

请参阅图1，其为实现本申请各个实施例的一种智能终端的硬件结构示意图，该智能终端100可以包括：RF(Radio Frequency，射频)单元101、WiFi 模块102、音频输出单元103、A/V(音频/视频)输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、处理器110、以及电源111等部件。本领域技术人员可以理解，图1中示出的智能终端结构并不构成对智能终端的限定，智能终端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图1对智能终端的各个部件进行具体的介绍：

射频单元101可用于收发信息或通话过程中，信号的接收和发送，具体的，将基站的下行信息接收后，给处理器110处理；另外，将上行的数据发送给基站。通常，射频单元101包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元101还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于GSM(Global System of Mobile communication，全球移动通讯系统)、GPRS (General Packet Radio Service，通用分组无线服务)、CDMA2000(CodeDivision Multiple Access 2000，码分多址2000)、WCDMA(Wideband Code DivisionMultiple Access,宽带码分多址)、TD-SCDMA(Time Division-Synchronous CodeDivision Multiple Access，时分同步码分多址)、FDD-LTE(Frequency DivisionDuplexing-Long Term Evolution，频分双工长期演进)、TDD-LTE(Time DivisionDuplexing-Long Term Evolution，分时双工长期演进)和第五代(5th Generation， 5G)移动通信系统等。

WiFi属于短距离无线传输技术，智能终端通过WiFi模块102可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图1示出了WiFi模块102，但是可以理解的是，其并不属于智能终端的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

音频输出单元103可以在智能终端100处于呼叫信号接收模式、通话模式、记录模式、语音识别模式、广播接收模式等等模式下时，将射频单元101或WiFi 模块102接收的或者在存储器109中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元103还可以提供与智能终端100执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元 103可以包括扬声器、蜂鸣器等等。

A/V输入单元104用于接收音频或视频信号。A/V输入单元104可以包括图形处理器(Graphics Processing Unit，GPU)1041和麦克风1042，图形处理器 1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元106 上。经图形处理器1041处理后的图像帧可以存储在存储器109(或其它存储介质)中或者经由射频单元101或WiFi模块102进行发送。麦克风1042可以在电话通话模式、记录模式、语音识别模式等等运行模式中经由麦克风1042接收声音(音频数据)，并且能够将这样的声音处理为音频数据。处理后的音频(语音)数据可以在电话通话模式的情况下转换为可经由射频单元101发送到移动通信基站的格式输出。麦克风1042可以实施各种类型的噪声消除(或抑制)算法以消除(或抑制)在接收和发送音频信号的过程中产生的噪声或者干扰。

智能终端100还包括至少一种传感器105，比如光传感器、运动传感器以及其他传感器。可选地，光传感器包括环境光传感器及接近传感器，可选地，环境光传感器可根据环境光线的明暗来调节显示面板1061的亮度，接近传感器可在智能终端100移动到耳边时，关闭显示面板1061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

显示单元106用于显示由用户输入的信息或提供给用户的信息。显示单元 106可包括显示面板1061，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板 1061。

用户输入单元107可用于接收输入的数字或字符信息，以及产生与智能终端的用户设置以及功能控制有关的键信号输入。可选地，用户输入单元107可包括触控面板1071以及其他输入设备1072。触控面板1071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1071上或在触控面板1071附近的操作)，并根据预先设定的程式驱动相应的连接装置。触控面板1071可包括触摸检测装置和触摸控制器两个部分。可选地，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器110，并能接收处理器110发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1071。除了触控面板1071，用户输入单元107还可以包括其他输入设备1072。可选地，其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种，具体此处不做限定。

可选地，触控面板1071可覆盖显示面板1061，当触控面板1071检测到在其上或附近的触摸操作后，传送给处理器110以确定触摸事件的类型，随后处理器110根据触摸事件的类型在显示面板1061上提供相应的视觉输出。虽然在图1中，触控面板1071与显示面板1061是作为两个独立的部件来实现智能终端的输入和输出功能，但是在某些实施例中，可以将触控面板1071与显示面板 1061集成而实现智能终端的输入和输出功能，具体此处不做限定。

接口单元108用作至少一个外部装置与智能终端100连接可以通过的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器) 端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元108可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到智能终端100内的一个或多个元件或者可以用于在智能终端100和外部装置之间传输数据。

存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序区和存储数据区，可选地，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器109可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器110是智能终端的控制中心，利用各种接口和线路连接整个智能终端的各个部分，通过运行或执行存储在存储器109内的软件程序和/或模块，以及调用存储在存储器109内的数据，执行智能终端的各种功能和处理数据，从而对智能终端进行整体监控。处理器110可包括一个或多个处理单元；优选的，处理器110可集成应用处理器和调制解调处理器，可选地，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器110中。

智能终端100还可以包括给各个部件供电的电源111(比如电池)，优选的，电源111可以通过电源管理系统与处理器110逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管图1未示出，智能终端100还可以包括蓝牙模块等，在此不再赘述。

为了便于理解本申请实施例，下面对本申请的智能终端所基于的通信网络系统进行描述。

请参阅图2，图2为本申请实施例提供的一种通信网络系统架构图，该通信网络系统为通用移动通信技术的LTE系统，该LTE系统包括依次通讯连接的 UE(User Equipment，用户设备)201，E-UTRAN(Evolved UMTS Terrestrial Radio Access Network，演进式UMTS陆地无线接入网)202，EPC(Evolved Packet Core，演进式分组核心网)203和运营商的IP业务204。

可选地，UE201可以是上述终端100，此处不再赘述。

E-UTRAN202包括eNodeB2021和其它eNodeB2022等。可选地，eNodeB2021 可以通过回程(backhaul)(例如X2接口)与其它eNodeB2022连接，eNodeB2021 连接到EPC203，eNodeB2021可以提供UE201到EPC203的接入。

EPC203可以包括MME(Mobility Management Entity，移动性管理实体) 2031，HSS(Home Subscriber Server，归属用户服务器)2032，其它MME2033， SGW(Serving GateWay，服务网关)2034，PGW(PDN Gate Way，分组数据网络网关)2035和PCRF(Policy andCharging Rules Function，政策和资费功能实体)2036等。可选地，MME2031是处理UE201和EPC203之间信令的控制节点，提供承载和连接管理。HSS2032用于提供一些寄存器来管理诸如归属位置寄存器(图中未示)之类的功能，并且保存有一些有关服务特征、数据速率等用户专用的信息。所有用户数据都可以通过SGW2034进行发送，PGW2035 可以提供UE 201的IP地址分配以及其它功能，PCRF2036是业务数据流和IP 承载资源的策略与计费控制策略决策点，它为策略与计费执行功能单元(图中未示)选择及提供可用的策略和计费控制决策。

IP业务204可以包括因特网、内联网、IMS(IP Multimedia Subsystem，IP 多媒体子系统)或其它IP业务等。

虽然上述以LTE系统为例进行了介绍，但本领域技术人员应当知晓，本申请不仅仅适用于LTE系统，也可以适用于其他无线通信系统，例如GSM、 CDMA2000、WCDMA、TD-SCDMA及未来新的网络系统(5G)等，此处不做限定。

基于上述智能终端硬件结构以及通信网络系统，提出本申请各个实施例。

第一实施例

本实施例提出一种图像处理方法，所述图像处理方法包括以下步骤：

步骤S11，获取待检测的第一图像，若所述第一图像中包含文本信息，从所述第一图像中提取文本信息和图像信息；

本申请实施例中的图像处理方法，应用于手机、平板电脑等智能终端，用于检测终端接收和/或发送的图片中是否包含预设内容，该预设内容包括以下至少一种：违规内容和/或信息、非法内容和/或信息、不符合预设规定的内容和/ 或信息、禁止传播的内容和/或信息等，以下统称为违规内容。可选地，该违规内容可以是图片内容的违规，也可以是文字内容的违规，因此，第一图像中的违规内容包括图片的图像信息的违规，和/或图片中包含的文字信息的违规。在检测第一图像中是否存在违规内容时，可选地，首先获取待检测的第一图像，并初步判断第一图像中是否包含文本信息，当检测到文本信息时，从第一图像中提取出文本信息和图像信息。可选地，提取的文本信息是第一图像中包含的文字内容，提取的图像信息是第一图像中包含的图像内容。

步骤S20，对提取的文本信息和图像信息进行检测，以确定所述第一图像中是否存在预设内容。

可选地，对提取出的文本信息和图像信息进行检测，进而确定第一图像中是否存在预设内容。可知地，待检测的第一图像由于压缩等原因，可能导致图像的边缘轮廓不清晰，以及文本信息中的文字模糊等，因此，在检测预设内容之前，可以对提取的信息进行增强，从而使待检测的信息更加清晰，增强待检测信息的特征性。对第一图像中是否存在文本信息的检测和提取、对图像信息的提取，以及对图像信息和文本信息的检测，并不存在严格的顺序限制，例如，可以先检测文本信息是否存在，不存在文本信息时，仅提取并检测图像信息即可；和/或，当存在文本信息时，可以先提取图像信息和文本信息，然后再对提取的文本信息和图像进行检测，从而确定第一图像中是否存在预设内容。在对提取的文本信息和图像进行检测时，可以是同时进行，也可以是先后进行，同样没有严格的顺序限制。可选地，还可以先提取并检测图像信息，然后再检测文本信息是否存在，具体可以根据实际需要进行灵活设置，在此不作限定。

可选地，从第一图像中提取的文本信息也可以是图像，将第一图像中文字内容对应的文本信息以图像的形式提取出来，然后对提取的文本信息和图像信息进行增强，在对文本信息进行检测时，从增强后的文本信息对应的图像中，利用如OCR(Optical CharacterRecognition，光学字符识别)等识别技术从经过增强处理的文本信息中提取出文字内容，提取出的文字内容与经过增强处理的图像信息，即为可以用于检测是否存在预设内容的信息。可选地，对提取的文本信息和图像信息进行增强的方法，可以是高通滤波处理对文本信息和图像信息进行锐化，以增强图像的边缘信息，还可以是点运算算法，对文本信息和图像信息进行灰度级校正、灰度变换和直方图修正等，扩展文本信息和图像信息的对比度，还可以是邻域增强算法，对图像进行平滑或锐化，当然，还可以是其他方式，或上述方式的任意组合，其目的在于使图像更加清晰，和/或使图像的特征信息更加突出，从而有利于对图像内容的检测。

可选地，对得到的增强后的文本信息和图像信息进行检测，从而确定第一图像中是否存在预设内容。可知地，待检测的信息中包括第一图像的文字内容和图像内容，当第一图像的文字内容和图像内容均不存在预设内容时，则第一图像中不存在违规内容；当第一图像的文字内容和图像内容中的至少一个存在预设内容时，则第一图像中就存在违规内容。若第一图像中不包含文本信息时，则直接对第一图像进行检测，或者，对第一图像进行增强处理后，再进行检测，进而确定第一图像的图像内容是否存在预设内容。以下以第一图像中包含文本信息为例进行说明。

可选地，步骤S20的细化，包括：

步骤A1，将提取的文本信息和图像信息输入预设的目标检测模型中，可选地，所述目标检测模型是基于样本数据集对预设待训练的基础检测模型进行迭代训练得到的，可选地，所述目标模型包括文本检测模型和/或图像检测模型；

步骤A2，利用所述目标检测模型中的文本检测模型对所述文本信息进行检测，确定所述文本信息中存在预设内容的第一概率；

步骤A3，利用所述目标检测模型中的图像检测模型对所述图像信息进行检测，确定所述图像信息中存在预设内容的第二概率；

步骤A4，根据所述第一概率和所述第二概率，确定所述第一图像中是否存在预设内容。

需要说明的是，上述步骤A2和步骤A3的执行顺序，可以为以下任一种：

先执行步骤A2，再执行步骤A3；

先执行步骤A3，再执行步骤A2；

同时执行步骤A2和A3。

在检测第一图像中是否存在预设内容时，首先将提取的文本信息和图像信息输入至目标检测模型中，可选地，该目标检测模型是基于样本数据集对初始的检测模型进行迭代训练得到的，经过预训练的目标检测模型包括文本检测模型，用于检测第一图像中包含的文字内容，目标检测模型还包括图像检测模型，用于检测第一图像中包含的图像内容。

对于包含文本信息的第一图像，被检测的文本信息为第一图像中的文字内容，被检测的图像信息为第一图像中的图像内容，在对提取的文本信息和图像信息进行检测时，是将提取的信息输入至经过预训练的目标检测模型中进行检测的。利用目标检测模型中的文本检测模型，对提取的文本检测信息进行检测，确定第一图像的文本信息中存在预设内容的概率，利用目标检测模型中的图像检测模型，对提取的图像信息进行检测，确定第一图像的图像信息中存在预设内容的概率。可选地，目标检测模型包括特征库，该特征库中包括有正常图像的特征，以及违规图像的违规特征，在检测时，是通过对待检测的信息进行特征提取，并将提取的特征与特征库进行匹配的，可以得到提取的特征与特征库里的特征的匹配度或匹配概率，根据匹配度或匹配概率确定存在预设内容的概率。目标检测模型的检测结果例如，如果第一图像中存在预设内容，则检测结果为：“图像中存在违规内容，图像/文字违规，违规概率0.9/0.95”，或者“图像中存在违规内容，图像违规，违规概率0.9”，或者“图像中存在违规内容，文字违规，违规概率0.95”，如果第一图像中不存在预设内容，则检测结果为图像中不存在违规内容，不违规概率0.95。根据目标检测信息中，第一图像的图像信息和/或文本信息中存在预设内容的概率大于预设概率阈值，则判定为第一图像中存在违规内容，否则，第一图像则不存在违规内容。

可选地，参照图4至图6，图4至图6是本实施例中利用目标检测模型进行违规图像检测的流程示意图，可选地，目标检测模型中的文本检测模型可以进行文本检测和文字识别，文本检测用于检测图片中是否包含文字，文字识别用于别图片中包含的文字内容，利用目标检测模型对提取的文本信息和图像信息进行检测时，可以先检测图片中是否包含文字内容，再进行图像信息和文本信息的检测，也可以先进行图像信息的检测，再进行文本检测和文字识别，在此不作具体限定。在对图像信息和文本信息进行检测时，可以对文本信息和图像信息同时进行检测；也可以先对图像信息进行检测，如果检测到图像信息中存在预设内容的概率大于预设概率阈值，则确定第一图像中存在违规内容，且图像信息中存在预设内容的概率即为第一图像中存在违规内容的概率，可以不再对文本信息进行检测，从而减少计算量。当图像信息中不存在预设内容时，再对文本信息进行检测，若文本信息中存在预设内容的概率大于预设概率阈值，则确定第一图像中存在违规内容，且文本信息中存在预设内容的概率即为第一图像中存在违规内容的概率，否则，第一图像中则不存在违规内容；可知地，上述方式也可以是先对文本信息进行检测，根据对文本信息的检测结果确定是否需要对图像信息进行检测，在此不做具体限定。

可选地，若对第一图像中的文本信息和图像信息同时进行检测，则根据检测结果可以取文本信息和图像信息中违规概率的较大值作为第一图像的违规概率，也可以是对文本信息和图像信息的违规概率进行加权平均等计算，得到第一图像的违规概率，在此不作具体限定。

可选地，在一实施方式中，可以如图4所示，图4为本实施例中对正常图像的检测流程示意图，在图4中，首先对待检测图片(正常图片)进行文本检测，确定图片中是否包含文本内容，若不包含，则将待检测图像输入至图像检测模型中，根据返回结果确定图片中的图像信息是否存在预设的违规内容，和/ 或，存在违规内容的概率。图4中对正常图片进行检测后返回的结果为正常，该图片为正常图片的概率为0.9，最终检测结果为图片正常。

可选地，在一实施方式中，还可以先对图像信息进行检，当图像信息存在违规内容且违规概率大于设定阈值时，则不再检测文本信息，以减少计算量，提高检测效率。可选地，参照图5，图5为本实施例中对图像内容违规的图片的检测流程示意图，在图5中，将待检测图片(图像内容违规的图片)输入至图像检测模型中，得到返回的检测结果为图像信息存在违规内容，且违规概率为 0.9，当违规概率大于设定概率阈值时，可以对存在违规内容的图片进行人工兜底审核。

可选地，在一实施方式中，可以在对图像信息进行检测后，再进行文本检测，确定待检测图像中是否存在文本信息。如图6所示，图6为本实施例中对文字内容违规的图片的检测流程示意图，在图6中，将待检测图片(文字内容违规的图片)输入至图像检测模型中，得到对图像信息的检测结果，可选地，返回结果为图像信息正常，正常的概率为0.9，然后利用文本检测模型对待检测图片进行文本检测，确定待检测图片中是否存在文本信息，当检测到文本信息时，利用文本检测模型对待检测图片中的文本信息进行文字识别，得到对应的文本信息的检测结果，在图6中，返回的文本信息的检测结果为图片中的文字内容，以及文字内容违规的概率。当文字内容违规的概率大于设定的概率阈值时，可以对待检测图像进行人工兜底审核。

需要说明的是，图4至图6中的概率0.9和0.95等，仅用于示例性说明，并不构成限定，且图4至图6所示的检测流程，也仅用于对本实施例进行示例性说明，本实施例中的检测流程并不限于此，由于图像信息的检测与文本信息的检测过程相对独立，因此，在实际应用时，可以根据实际需要对检测过程进行灵活设置。

步骤S12之后，还包括：

步骤S21，若所述第一图像中存在预设内容，获取所述第一图像的校验信息；

步骤S22，根据所述校验信息判定所述第一图像是否为违规图像，和/或输出判定结果。

可选地，在确定第一图像是否存在预设内容后，对于存在违规内容的图像进行人工兜底审核，根据人工审核结果生成校验信息，根据获取的校验信息对第一图像进行判定，从而确定第一图像是否为违规图像，和/或输出判定结果。可选地，在进行人工兜底审核时，审核人员根据第一图像存在预设内容的概率，对某个概率区间的图像进行兜底审核，例如，设置概率阈值为0.5，当提取的图像和文字检测信息中存在预设内容的概率大于0.5时，则认为第一图像中存在违规内容，对于违规概率大于0.8的图像，直接判定为违规图像，对于概率在(0.5， 0.8)区间内的图像，则输出至人工审核界面，审核人员可以参考目标检测模型的检测结果，即第一图像存在预设内容的概率对第一图像进行判定，例如，如图7至9所示，图7至图9是一种实施方式中智能手机人工审核界面的示意图，审核人员可以通过点击审核界面预设的“是”和“否”按钮，触发相应的判定指令，根据判定指令生成对第一图像的校验信息，从而对第一图像进行判定，如果检测到审核人员点击了“是”，则将第一图像判定为违规图像，和/或，如果检测到审核人员点击了“否”，则将第一图像判定为合规图像，和/或输出最终的判定结果，判定结果例如“违规图像”或者“合规图像”。可知地，根据不同的应用场景，第一图像中存在预设内容的概率阈值是可调整的，不同的应用场景和/或不同类型的违规内容可以设置不同的概率阈值。

可选地，当判定结果为“违规图像”时，在图片上传者的终端上输出并显示提示信息，如图10所示，图10中是在上传者上传图片的终端上输出并显示提示信息的提示界面示意图，在图10中，上传者通过手机上传违规图像，当对图片的判定结果为“违规图像”时，在上传者手机上输出提示信息，提示上传者图片存在违规内容，禁止上传。在一实施方式中，提示界面中设有“取消发送”按钮，上传者可以通过点击该按钮取消对图片的发送和上传，同时退出提示和/或图片发送界面。

可以理解的是，由于图片内容繁杂，且形式多样，图片发表/上传者，通过对图片进行嵌套、缩放图片中的某些特征信息等手段，以及图文结合的暗讽性图片，可以对图像检测模型造成“欺骗”，使得模型检测结果的准确率下降。对于对图片进行嵌套和/或对特征信息进行缩放的图像，可以通过增加样本数据库和/或改进模型训练方法，提升模型的检测准确率，但是对于图文结合的暗讽形式的图片，还需要结合图像内容和文字内容，识别其中隐含的意义，这不仅要依赖于对图片中文字内容的检测，还需要结合图像内容形成的语境，对文字内容的语义进行深入理解，而通过人工兜底审核，能够与检测模型相互弥补，提升对违规图像的判定准确率。可选地，根据判定结果，确定第一图像的特征是违规特征还是合规特征，并将提取的第一图像的特征添加到目标检测模型的特征库中，以对目标检测模型的特征库进行补充，提高目标检测模型的检测准确性。

在本实施例中，通过获取待检测的第一图像，若所述第一图像中包含文本信息，从所述第一图像中提取文本信息和图像信息；对提取的文本信息和图像信息进行检测，以确定所述第一图像中是否存在预设内容。对第一图像中的图像信息和文本信息进行检测，同时检测图片中的图像信息和文字信息是否包含预设内容，若存在预设内容的第一图像，则获取第一图像的校验信息，对预设内容进行人工兜底审核，提高了对违规图像的判定准确率。

基于上述一实施例，提出本申请图像处理方法的第二实施例，本实施例是对第一实施例中，步骤S12的细化，包括：

步骤B1，从所述图像信息中确定所述文本信息所在的目标区域；

步骤B2，对所述目标区域进行像素填充和/或邻域增强处理，得到第一检测图像；

步骤B3，对所述第一检测图像和所述文本信息进行滤波处理，以对所述图像信息和所述文本信息进行增强。

基于上述实施例，在对提取的文本信息和图像信息进行检测之前，首先对提取的文本信息和图像信息进行增强，原因在于，文本信息的存在可能会对图像信息的特征造成部分破坏，从而影响对图像信息的检测准确性，并且，提取的文本信息可能存在模糊、字迹缺损等，影响对文字内容的识别，因此，通过对提取的文本信息和图像信息进行增强，从而消除文本信息和图像信息相互之间的影响。

在本实施例中，主要是对提取的图像信息进行增强，提取的图像信息中，被文本信息遮挡的区域可能会影响对图像信息的检测，或者是对图像信息的特征提取，在一种可能的情况下，图片发表/上传者，可能会通过在违规图片中添加文字和/或水印等，影响对图片的检测结果。因此，需要对图像信息中，被文本信息遮挡的区域进行填充和邻域增强处理，使得图像信息的特征信息被还原，然后对经过填充和邻域增强处理和提取的文本信息进行滤波处理，以增强文本信息和图像信息的对比度、边缘信息等，得到最终可用于检测的文本信息和图像信息。

可选地，步骤B2的细化，包括：

步骤B21，从所述图像信息中确定所述目标区域中的目标像素点的邻域，并获取所述目标像素点的邻域的像素值；

步骤B22，根据所述目标像素点的邻域的像素值，对所述目标像素点进行像素填充和/或邻域增强处理，得到第一检测图像。

在对图像信息进行像素填充和/或邻域增强处理时，首先从目标区域的边界开始，确定目标区域内的一个像素点，并确定该像素点在图像信息中的邻域，并获取邻域内的像素点的像素值，根据获取的像素值对目标区域内的像素点进行像素填充，然后按照该方式逐一对目标区域内的像素点进行像素填充，直到完成对目标区域中所有像素点的像素填充。在进行像素填充时，可以将邻域内像素点的像素值的平均值作为目标区域内像素点的像素值，也可以将邻域内像素点的像素值的加权平均值作为目标区域内像素点的像素值，在此不做具体限定。可选地，还可以根据填充像素值后的目标区域内的像素点的像素值，对目标区域进行邻域增强处理，平滑图像在目标区域的噪声，使目标区域与图像信息之间的边缘平滑，进而对图像信息的特征信息进行还原，消除第一图像中，文本信息和图像信息在检测时的相互影响。

在本实施例中，通过对提取的文本信息和图像信息进行增强，从而消除文本信息与图像信息在检测中的相互影响，能够有效提高对包含文本信息的图像的识别准确率。

基于上述第一和/或第二实施例，提出本申请图像处理方法的第三实施例，本实施例是上述第一实施例中，步骤A1之前的步骤，包括：

步骤C1，获取样本数据集并构建待训练的基础检测模型，可选地，所述样本数据集包括多分类样本数据和/或所述多分类样本数据的标签信息；

步骤C2，利用所述样本数据集中的多分类样本数据和所述多分类样本数据标签信息，对所述基础检测模型进行迭代训练，得到目标检测模型。

基于上述实施例，本实施例是上述第一实施例中步骤A1之前的步骤，在利用目标检测模型进行检测时，要对目标检测模型进行预训练。可选地，首先获取样本数据集，该样本数据集包括多分类样本数据和/或多分类样本数据的标签信息，该标签信息表征了多分类样本数据中的图像是合规图像还是违规图像，以及多分类样本数据中的违规图像所涉及的预设的违规内容，预设的违规内容包括文字违规、图像违规，可选地，图像违规还包括色情违规、暴力血型违规、特殊着装违规等不同类型的违规。为确保检测模型的适用性和检测准确性，需要利用多种分类的样本数据对搭建的基础模型模型进行训练，得到多分类的特征数据，多分类样本数据中包括样本图像和样本文本。可选地，样本图像按照不同的分类标准，可以分为包含文本信息的图像和不含文本信息的图像，也可以分为正常图像和违规图像，还可以按照地区划分为非洲、亚洲和欧洲等不同族群的图像。样本文本按照不同国家和/或地区的语言类型，分为不同语言类型的文本，经过训练得到的文本特征包括包含预设违规内容的关键词，以及与所述关键词含义相近或语义有关联的文本信息。

利用多分类的样本数据对搭建的基础检测模型进行迭代训练，得到用于对第一图像进行检测的目标检测模型。可选地，搭建的基础检测模型包括但不限于基于深度学习的神经网络模型。

基于上述步骤C1-C2，上述第一实施例中，步骤A2的细化，包括：

步骤A21，对所述文本信息进行检测，以确定所述文本信息的语言类型；

步骤A22，根据所述文本信息的语言类型，从所述目标检测模型的多分类文本特征库中确定目标文本特征库；

步骤A23，将所述文本信息与所述目标文本特征库进行匹配，根据匹配结果确定所述文本信息中存在预设内容的第一概率。

从第一图像中提取的可用于检测的信息包括图像信息和文本信息，基于上述经过预训练得到的目标检测模型，利用目标检测模型中的文本检测模型，确定文本信息中存在预设内容的概率时，首先对提取的文本信息进行文字识别，根据识别出的文字内容(或者字符串)确定文本信息的语言类型，根据文本信息的语言类型选取不同的文本特征库与识别的文字内容进行匹配。可选地，在对文本检测模型进行训练时，根据不同的语言类型对基础文本检测模型进行训练，得到多个对应不同语言类型的文本特征库，即多分类文本特征库。可选地，不同的语言类型包括中文、英文、非洲地区多个语系的语言等被多数人作为母语或使用较为广泛的语言，具体可以根据实际的应用场景对样本文本进行调整，或者还可以对同一类语言进行细分，例如，中文中不同地区的方言，以及非洲不同国家或地区的不同语系的语言等。根据提取的文本信息的语言类型从多分类文本特征库中确定目标文本特征库，并将该文本信息与目标文本特征库中的文本特征进行匹配，根据文本信息与目标文本特征库中的文本特征的匹配结果，确定第一图像的文本信息中存在预设违规内容的概率，可选地，第一图像中的文本信息存在预设内容的第一概率，可以是文本信息与目标文本特征库中的特征匹配的概率，在此不作具体限定。

可选地，上述第一实施例中，步骤A3的细化，包括：

步骤A31，对所述图像信息进行检测，以确定所述图像信息对应的目标族群；

步骤A32，根据所述目标族群从所述目标检测模型的多分类图像特征库中确定目标图像特征库，并从所述图像信息中提取目标特征；

步骤A33，将所述目标特征与所述目标图像特征库进行匹配，根据匹配结果确定所述图像信息中存在预设内容的第二概率。

基于上述经过预训练得到的目标检测模型，利用目标检测模型中的图像检测模型，确定提取的图像信息中存在预设内容的概率时，首先确定第一图像的图像信息对应的目标族群，该目标族群表征了包含人物图像的图像中对应的人物所具有的特征。对于包含人物图像的图像信息，由于不同国家或地区的人物的特征差别较大，如欧洲和非洲地区，所以具有的特征差异性也较大，需要进行不同的特征提取和匹配处理，而对于不包含人物图像的图像信息，则差别不大，因此，在利用多分类样本图像对基础图像检测模型进行训练后，对得到的人物图像特征库按照不同族群进行划分，将不包含人物图像的物体图像单独划分为物体图像特征库，从而得到图像检测模型的多分类图像特征库。根据提取的图像信息对应的目标族群，从多分类图像特征库中确定目标图像特征库，若在图像信息中未检测到族群信息，则将多分类图像特征库中的物体图像特征库作为目标图像特征库。然后从目标图像中提取特征，并将提取的与目标图像特征库中的特征进行匹配，根据匹配结果确定第一图像的图像信息中存在预设内容的概率，可选地，第一图像中的图像信息存在预设内容的第二概率，可以是图像信息与目标图像特征库中的特征匹配的概率，在此不作具体限定。

上述根据匹配结果确定第一图像中存在预设内容的概率时，可以将文本信息中存在预设内容的概率和图像信息中存在预设内容的概率的均值，或两者中的较小/较大值作为第一图像中存在预设内容的概率，在此不做具体限定。当初始图像中存在预设内容的概率大于预设概率阈值时，则确定初始图像中存在预设内容。

在本实施例中，通过利用多分类样本数据对搭建的基础检测模型进行训练，得到目标检测模型，提高了目标检测模型的适用性，利用得到的目标检测模型对初始图像进行检测时，可以提高对违规图像的检测准确率。

本申请实施例还提供一种智能终端，智能终端包括存储器、处理器，存储器上存储有图像处理程序，图像处理程序被处理器执行时实现上述任一实施例中的图像处理方法的步骤。

本申请实施例还提供一种计算机可读存储介质，存储介质上存储有图像处理程序，图像处理程序被处理器执行时实现上述任一实施例中的图像处理方法的步骤。

在本申请提供的智能终端和计算机可读存储介质的实施例中，可以包含任一上述图像处理方法实施例的全部技术特征，说明书拓展和解释内容与上述方法的各实施例基本相同，在此不做再赘述。

本申请实施例还提供一种计算机程序产品，计算机程序产品包括计算机程序代码，当计算机程序代码在计算机上运行时，使得计算机执行如上各种可能的实施方式中的方法。

本申请实施例还提供一种芯片，包括存储器和处理器，存储器用于存储计算机程序，处理器用于从存储器中调用并运行计算机程序，使得安装有芯片的设备执行如上各种可能的实施方式中的方法。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

在本申请中，对于相同或相似的术语概念、技术方案和/或应用场景描述，一般只在第一次出现时进行详细描述，后面再重复出现时，为了简洁，一般未再重复阐述，在理解本申请技术方案等内容时，对于在后未详细描述的相同或相似的术语概念、技术方案和/或应用场景描述等，可以参考其之前的相关详细描述。

在本申请中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本申请技术方案的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本申请记载的范围。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，被控终端，或者网络设备等)执行本申请每个实施例的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种图像处理方法，其特征在于，包括以下步骤：

S11、获取待检测的第一图像，若所述第一图像中包含文本信息，从所述第一图像中提取文本信息和图像信息；

S12、对提取的文本信息和图像信息进行检测，以确定所述第一图像中是否存在预设内容。

2.如权利要求1所述方法，其特征在于，所述预设内容包括以下至少一种：

违规内容和/或信息；

非法内容和/或信息；

不符合预设规定的内容和/或信息；

禁止传播内容和/或信息。

3.如权利要求1所述方法，其特征在于，所述步骤S12包括：

将提取的文本信息和图像信息输入预设的目标检测模型中；

4.如权利要求3所述的方法，其特征在于，所述将提取的文本信息和图像信息输入预设的目标检测模型中的步骤之前，还包括：

获取样本数据集并构建待训练的基础检测模型；

5.如权利要求4所述的方法，其特征在于，所述目标检测模型包括多分类文本特征库，所述多分类文本特征库包括至少一个不同语言类型的文本特征库，所述利用所述目标检测模型中的文本检测模型对所述文本信息进行检测，确定所述文本信息中存在预设内容的第一概率的步骤，包括：

6.如权利要求4所述的方法，其特征在于，所述目标检测模型包括多分类图像特征库，所述多分类图像特征库包括至少一个不同族群的图像特征库，所述利用所述目标检测模型中的图像检测模型对所述图像信息进行检测，确定所述图像信息中存在预设内容的第二概率的步骤，包括：

将所述目标特征与所述目标图像特征库进行匹配，根据匹配结果确定所述图像信息中存在预设内容的第二概率。

7.如权利要求1至6中任一项所述的方法，其特征在于，所述步骤S12之前，还包括：

从所述图像信息中确定所述文本信息所在的目标区域；

8.如权利要求1至6中任一项所述的方法，其特征在于，所述步骤S12之后，还包括：

9.一种智能终端，其特征在于，所述智能终端包括：存储器、处理器，其中，所述存储器上存储有图像处理程序，所述图像处理程序被所述处理器执行时实现如权利要求1至8中任一项所述的图像处理方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的图像处理方法的步骤。