CN113537230B - 一种消息发布方式的有效性确定方法及装置、电子设备 - Google Patents

一种消息发布方式的有效性确定方法及装置、电子设备 Download PDF

Info

Publication number
CN113537230B
CN113537230B CN202111075853.8A CN202111075853A CN113537230B CN 113537230 B CN113537230 B CN 113537230B CN 202111075853 A CN202111075853 A CN 202111075853A CN 113537230 B CN113537230 B CN 113537230B
Authority
CN
China
Prior art keywords
pattern
message
image
label image
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111075853.8A
Other languages
English (en)
Other versions
CN113537230A (zh
Inventor
高佳妮
何小坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Century TAL Education Technology Co Ltd
Original Assignee
Beijing Century TAL Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Century TAL Education Technology Co Ltd filed Critical Beijing Century TAL Education Technology Co Ltd
Priority to CN202111075853.8A priority Critical patent/CN113537230B/zh
Publication of CN113537230A publication Critical patent/CN113537230A/zh
Application granted granted Critical
Publication of CN113537230B publication Critical patent/CN113537230B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本公开提供一种消息发布方式的有效性确定方法及装置、电子设备,所述方法包括接收公众平台的消息图像,从所述消息图像提取有效消息,若有效消息含有指示可编辑操作的目标字段,基于目标字段的位置从消息图像分离出标签图像,当标签图像含有形状图案,判断形状图案是否为访问受限形状图案,若形状图案为所述访问受限形状图案,确定消息发布方式无效,否则,确定消息发布方式有效。本公开方法可以在整个鉴定图片过程中,没有人工参与图片鉴定工作,从而减少人工成本。

Description

一种消息发布方式的有效性确定方法及装置、电子设备
技术领域
本发明涉及图像处理领域,尤其涉及一种消息发布方式的有效性确定方法及装置、电子设备。
背景技术
在人们日常生活中,经常使用微信、微博等社交平台进行远程实时沟通和消息分享,因此,这些社交平台的活跃用户数量庞大,很多商家选择社交平台进行活动推广。
举例来说,在商家进行活动推广时,要求社交平台用户按照规定的方式将相关活动文案分享到朋友圈页面,然后截图发送给商家后台,从而获取奖励。
发明内容
根据本公开的一方面,提供了一种消息发布方式的有效性确定方法,包括:
接收公众平台的消息图像;
从所述消息图像提取有效消息;
若所述有效消息含有指示可编辑操作的目标字段,基于所述目标字段的位置从所述消息图像分离出标签图像;
当所述标签图像含有形状图案,判断所述形状图案是否为访问受限形状图案;
若所述形状图案为所述访问受限形状图案,确定所述消息发布方式无效,否则,确定所述消息发布方式有效。
根据本公开的另一方面,提供了一种消息发布方式的有效性确定装置,其特征在于,
接收模块,用于接收公众平台的消息图像;
第一提取模块,用于从所述消息图像提取有效消息;
第二提取模块,用于若所述有效消息含有指示可编辑操作的目标字段,基于所述目标字段的位置从所述消息图像分离出标签图像;
判断模块,用于当所述标签图像含有形状图案,判断所述形状图案是否为访问受限形状图案;
确认模块,用于若所述形状图案为所述访问受限形状图案,确定所述消息发布方式无效,否则,确定所述消息发布方式有效。
根据本公开的另一方面,提供了一种电子设备,包括:
处理器;以及,
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行本公开实施例的所述方法。
根据本公开的另一方面,提供了一种非瞬时计算机可读存储介质,所述非瞬时计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行本公开实施例的所述方法。
本申请实施例中提供的一个或多个技术方案,从消息图像提取有效消息后,基于公众平台发布的消息的标签信息特点,先确定有效消息是否含有目标字段。如果含有目标字段,则可以基于目标字段的位置从消息图像分离出标签图像,如果标签图像含有形状图案,但形状图案不是访问受限形状图案,那么说明用户设备在公众平台发布受众受到限制的消息,消息发布行为无效,消息难以以用户设备为节点迅速扩散。如果标签图像含有形状图案,且形状图案为访问受限形状图案,说明用户设备在公众平台发布受众没有限制的消息,消息发布行为有效,消息可以以用户设备为节点迅速扩散。由此可见,商家后台可以基于本公开方法准确鉴定用户设备上传的图片有效性,并以鉴定结果为依据,决定是否对用户进行激励,因此,在整个图片鉴定过程中,没有人工参与图片鉴定工作,从而减少人工成本。
附图说明
在下面结合附图对于示例性实施例的描述中,本公开的更多细节、特征和优点被公开,在附图中:
图1示出了本公开示例性实施例方法的示例应用场景图;
图2示出了本公开示例性的一种方法的流程示意图;
图3示出了本公开示例性的实施例的朋友圈界面的示意图;
图4示出了本公开示例性的实施例的淘宝评论界面的示意图;
图5示出了图3所示的朋友圈图像截取的标签图像的示意图;
图6示出了本公开示例性实施例的标签图像的一种滤波流程图;
图7示出了本公开示例性的标签图像转换过程示意图;
图8示出了本公开示例性实施例标注图案边界框的二值化图像的结构示意图;
图9示出了本公开示例性实施例标签图像的第一种滤波流程示意图;
图10示出了本公开示例性实施例文字图案的第二种滤波流程示意图;
图11示出了本公开示例性实施例的另一种方法的流程示意图;
图12示出了本公开示例性实施例的二值化图像在滤波过程的变化示意图;
图13示出了根据本公开示例性实施例的消息发布方式的有效性确定装置的示意性框图;
图14示出了根据本公开示例性实施例的芯片的示意性框图;
图15示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。以下参照附图描述本公开的方案。
在介绍本公开实施例之前首先对本公开实施例中涉及到的相关名词作如下释义:
卷积循环神经网络(Convolutional Recurrent Neural Network,缩写为CRNN)是一种解决基于图像的序列识别问题,特别是场景文字识别问题的网络结构,主要用于端到端地对不定长的文本序列进行识别,不用先对单个文字进行切割,而是将文本识别转化为时序依赖的序列学习问题,从而达到基于图像的序列识别的目的。
数学形态学是一门建立在格论和拓扑学基础之上的图像分析学科,是数学形态学图像处理的基本理论。
腐蚀类似领域被蚕食,将图像中的高亮区域或白色部分进行缩减细化,其运行结果图比原图的高亮区域更小,其主要用于形态学中除去图像的某些部分,利用Matlab中的imerode函数实现图像腐蚀。考虑两幅图像A,B。定义腐蚀运算为:erosion(A,B) = {a|(a+b)∈A, a∈A,b∈B}。
灰度图,又称灰阶图,是用灰度表示的图像。将把白色与黑色之间按对数关系分为若干等级,称为灰度。灰度分为256阶。
二值化,是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。
外接矩形框:是指与外接矩形框内物体相邻的最小矩形。
垂直投影:是指二维图像按列向x轴方向投影,投影结果可以看成是一维图像。
水平投影:是指将指二维图像按列向x轴方向投影,投影结果可以看成是一维图像。
光学字符识别(Optical Character Recognition,缩写为OCR)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
本公开示例性实施例提供一种消息发布方式的有效性确定方法,其可以用于鉴定用户设备上传的公众平台的消息图像是否有效,以决定是否向用户发放奖励。此处公众平台可以为微信朋友圈、微博,还包括各种社交平台的评论区等,只要可以将信息展示给其他用户的网络平台均可以称为公众平台。
图1示出了本公开示例性实施例方法的示例应用场景图。如图1所示,本公开示例性实施例的应用场景包括用户设备110和服务器120。用户设备110与服务器120之间可以通过通信网络通信。
如图1所示,上述用户设备110可以是具有显示功能的智能终端,包括但不仅限于台式电脑、笔记本电脑、智能手机、照相机等具有显示界面的功能。该用户设备110可以通过通信网络远程访问服务器120,从而登录服务器120上的公众平台。登录方式可以选择网页登录和客户端登录两种方式。公众平台可以包括微信、微博、美团、淘宝、快手、今日头条等各种相关客户端。
上述服务器120可以是微信平台提供的服务器120,也可以商户自己搭建的服务器120,该服务器120搭载有商户自己开发的网站。这些服务器120为一个服务器,也可以为多个服务器构成的服务器集群。服务器120与网络管理中心130通信。从通信方式来说,通信网络可以分为无线通信网络,也可以为有线通信网络;从通信范围来说,通信网络可以为局域通信网络,也可以为广域通信网络。例如:用户设备110可以通过通信网络登陆网络管理中心130访问服务器120上的网站。
举例来说,商家为了推广某种商品,在其微信公众号发布了该商品的推广文案,并设定微信账号按照其推广商品的活动文案,将其分享至朋友圈。当微信账号在微信朋友圈分享活动文案后,用户可以操控手机自带的截图功能截取消息图像,将消息图像通过微信公众号的聊天界面导入微信公众号的服务器,使得服务器对消息图像进行消息发布方式的有效性审核,根据审核结果决定是否向用户发放奖励,如积分或其它变相奖励。
发明人发现,用户在参与推广活动的时候,消息有可能存在两种无效发布方式。第一种无效发布方式是:冒用他人在微信朋友圈发布的活动文案图像上传至服务器,从而获取积分。第二种无效发布方式是:将活动文案分享至微信朋友圈,但是设置了访问权限,如不给谁看、私密、部分可见等,这两种无效发布方式并不能有效推广活动。为了降低这两种行为的发生率,商家只能从服务器中调取图像,花费大量人工成本逐张审核图像是否满足奖励条件。
针对上述问题,本公开示例性实施例提供一种消息发布方式的有效性确定方法,其可以由服务器或应用于服务器的芯片执行。图2示出了本公开示例性的一种方法的流程示意图。如图2所示,本公开示例性的方法包括:
步骤201:服务器接收公众平台的消息图像。用户设备可以将所采集的消息图像通过通信网络上传至服务器。消息图像可以是截图,也可以是拍摄的静态图像或动态图像。
在实际应用中,用户需要通过智能手机在微信朋友圈查找需要上传至服务器的消息,智能手机可以响应用户针对微信朋友圈的操作,在其屏幕上显示微信朋友圈界面。如果微信朋友圈界面上的朋友圈内容内不包含需要上传至服务器的消息(将包含上传至服务器的消息定义为消息图像),智能手机可以响应用户滑动屏幕或通过按键等操作,调节其屏幕上所显示的朋友圈内容。
当朋友圈内容包含消息图像,智能手机在用户的操作下,可以启动截图功能,将消息图像截图保存。如果智能手机带有录屏功能,智能手机还可以在用户的操作下,启动录屏功能,将录屏所生成的图像作为消息图像进行保存。
在另一种示例中,当朋友圈内容包含消息图像,一些用户还可能通过相机等具有图像采集功能的设备,拍摄智能手机所显示的消息图像(可以为动态图像或者静态图像)。
当朋友圈内容包含需要上传至服务器的消息(定义为消息图像),用户可以将消息图像上传至服务器。服务器可以接收的消息图像格式包括但不仅限于jpg格式、png格式、bmp格式、gif格式、mp4格式、WMV格式、AVI格式、rmvb格式、mv格式等,此处不再一一列举。
上述服务器所接受的消息图像可以是原始图像,也可以是经过调整的消息图像。此处调整的消息图像可以为尺寸经过调整的消息图像。调整尺寸后的图像长度可以为1080、900、720等,调整方式可以是等比例缩放,也可以是截取。当采用缩放方式调整尺寸时候,不会出现裁剪所需消息的问题。
在一种示例中,可以在消息图像导入服务器的情况下,对消息图像进行尺寸检测。当服务器发现消息图像的尺寸不符合要求时,服务器通知智能手机上传任务失败,智能手机可以在用户的操作下,将消息图像缩放或截取至所需尺寸,然后重新将消息图像上传至服务器。智能手机还可以将消息图像导入服务器,但用户未通知服务器启动消息行为确定策略前,自动生成具有截图或缩放功能的框,用户可以调节框的尺寸自定义的调节消息图像的尺寸,然后将调整尺寸后的消息图像上传支付服务器。
在另一种示例中,如果消息图像为动态图像,则服务器可以限制动态图像的时长,如智能手机消息图像导入服务器的情况下,对消息图像进行时长进行检测。若发现其时长超过预设时长,如60s、30s、5min等,则可以通知智能手机上传任务失败,智能手机可以在用户的操作下,对消息图像的时长进行调节。
在又一种示例中,如果服务器接收到消息图像的尺寸没有提前进行调整,在服务器接收到消息图像后,可以根据预设的尺寸调整消息图像的宽度,调整方式包括缩放、截图等。截图需保证消息所在部位保留。若消息图像为动态图像,可以从动态图像中选择其中一帧质量较好的图像进行后续处理。
步骤202:服务器从消息图像提取有效消息。该有效消息是服务器需要确定其发布形为是否有效的消息。若服务器确定有效消息不含有指示可编辑操作的目标字段,执行步骤203,当服务器确定有效消息含有指示可编辑操作的目标字段,则执行步骤204。
在实际应用中,可以基于自然语言处理技术提取消息图像的有效消息,例如:文字识别模型如OCR技术,该OCR技术可以基于神经网络模型获得有效有效消息。如CRNN模型等。服务器可以使用CRNN模型识别消息图像,获得识别结果。识别结果可以包括识别内容和位置信息,识别内容可以为文字内容,位置信息可以为文字内容的位置。此处的文字可以为广义上的文字,包括文字和阿拉伯数字等。
当服务器确定识别结果含有与预设消息匹配的信息时,确定该信息为有效消息。例如:服务器对朋友圈截图进行识别,获得消息识别结果。消息识别结果的识别内容含有多条消息,服务器确定其中一条消息含有商家要求的文案字段(即预设消息),则可以确定该条消息为有效消息。又例如:服务器对淘宝商品评论区的评论消息进行识别,获得消息识别结果,服务器确定其中一条消息含有商家要求的文案字段(即预设消息),则可以确定该条消息为有效消息。
发明人对公众平台发布的消息进行图像分析发现,公众平台发布的消息附带有一些标签,如发布时间、地理位置、点赞次数、浏览次数、可编辑的按钮等。可编辑按钮可能以文本或图案形式出现。服务器可以借由用户账号在公众平台发布的消息附带的可编辑按钮识别该条消息发布方式是否有效。基于此,基于用户账号在公众平台发布消息附带的标签特征,服务器可以判断有效消息是否含有指示可编辑操作的目标字段。可编辑操作可以是指:当有效消息含有该目标字段,说明该条有效消息可以被发布该条有效消息的公众平台的用户账号编辑。此时可以证明该条有效消息为该用户账号在某个公众平台发布。
示例性的,图3示出了本公开示例性的实施例的朋友圈界面的示意图。如图3所示,当微信账号在微信朋友圈发布朋友圈消息后,可以在微信朋友圈界面300看到该微信账号发布的如图3所示的朋友圈消息301。对于该条朋友圈消息来说,朋友圈消息301所附带的标签含有“删除”字段。如果该微信账号发布该条朋友圈消息301时,还设置了朋友圈消息301的访问受限条件,如设置“私密”、“部分可见”或者“不给谁看”等访问受限条件,则发布朋友圈消息301的时候,还会自动生成访问受限标签。基于此,如果该微信账号的持有人看到智能手机所显示的该条朋友圈消息不含有“删除”字段,说明发布朋友圈消息的微信账号并非通过智能手机上传消息图像的用户所有,该朋友圈消息无效,属于前文述及的第一种无效发布方式,执行步骤203。如果该微信账号的持有人可以看到智能手机所显示的该条朋友圈消息含有“删除”字段,则说明该条朋友圈消息可以被发布该条消息的微信账号删除,发布朋友圈消息的微信账号是通过智能手机上传消息图像的用户所有,不属于第一种无效发布方式。并且,不未确定朋友圈消息301是否含有访问受限形状图案,此时执行步骤204。应理解,除微信朋友圈可以设置消息的访问受限条件,还可能存在其它可能的公众平台可以设置消息的访问受限条件,此处不再枚举。
示例性的,图4示出了本公开示例性的实施例的淘宝评论界面的示意图。如图4所示,当淘宝账号在淘宝商品的评论区发布评论消息400后,该评论消息400的指示可编辑操作的目标字段可以包括“追评”、“免打扰”等,没有评论消息访问受限的标识。也就是说,对于淘宝这类公众平台来说,其目前可能存在的无效发布方式为第一种无效发布方式,不存在第二种无效发布方式。基于此,如果服务器确定图4所示的评论消息没有附带“追评”和/或“免打扰”字段,说明发布评论消息的淘宝账号并非通过智能手机上传消息图像的用户所有,因此,服务器确认消息发布方式无效,是第一种无效发布方式,该消息图像没有被服务器审核通过;如果服务器确定图4所示的评论消息附带有“追评”和/或“免打扰”字段,则说明淘宝账号可以进一步对淘宝商品进行评价,发布评论消息的淘宝账号是通过智能手机上传消息图像的用户所有,不属于第一种无效发布方式。而且,由于评论消息可能存在的无效发布方式为第一种无效发布方式,不存在第二种无效发布方式,因此,服务器可以直接确定评论消息400的消息发布方式有效,可以执行步骤207。
步骤203:服务器确认消息发布方式无效。当服务器确定消息发布方式为第一种无效消息发布,说明消息发布者通过账号登录公众平台后,获取其它微信账号发布的消息图像,存在假冒消息发布的行为,因此,该消息图像未被服务器审核通过,服务器不会向用户发放激励(如奖励积分或发放优惠券等)。
当公众平台可以设置消息的访问受限条件时,如果确定消息的发布方式不属于第一种无效发布方式,那么还需要确定消息是否存在访问受限问题,以确定消息的发布方式是否存在第二种无效发布方式。基于此,上述方法还包括步骤204:服务器基于目标字段的位置从消息图像分离出有效消息的标签图像。
在实际应用中,鉴于不同公众平台发布的消息附带的标签内容分布方式有可能存在差异,为了增加服务器的兼容性,服务器从消息图像分离出标签图像可以包括:服务器基于消息图像的消息发布平台确定有效消息的标签分布策略,服务器基于标签分布策略和目标字段的位置从消息图像提取标签图像。
上述目标字段的位置可以为标签图像所含有的标签提供位置参考,使得服务器可以基于该目标字段从消息图像分离出标签图像。该标签图像可以含有目标字段,也可以不含有目标字段。如果标签图像含有目标字段,该目标字段可以与形状图案位于同一行,也可以不位于同一行。
示例性的,上述标签图像可以含有用于指示目标字段的文字图案,也可以不含有用于指示目标字段的文字图案。以图4为例,对于朋友圈消息401来说,其“删除”字段、时间标签还有其它标签均在同一行,因此,当服务器分析出消息发布平台为微信朋友圈,可以获得朋友圈的标签分布策略,然后以目标字段为位置定位,从消息图像提取“删除”字段所在行图像,或者与“删除”字段在同一行的图像作为标签图像。
图5示出了图3所示的朋友圈图像截取的标签图像的示意图。如图5所示,在标签图像500中,标签图像含有形状图案501和文字图案502。形状图案501可以包含访问受限形状图案和隐藏点赞、评论功能的展开功能形状图案。文字图案502不仅包含“删除”字段的文字图案,还含有“8小时前”、“XXX网校”这种非目标字段的文字图案。
为了确定消息的发布方式是否属于第二种无效发布方式,服务器可以在标签图像查找形状图案。当服务器确定标签图像含有形状图案,执行步骤205。当服务器确定标签图像不含有形状图案,执行步骤207。
步骤205:服务器判断形状图案是否为访问受限形状图案。当服务器若确定形状图案为访问受限形状图案,执行步骤206,否则执行步骤207。
在实际应用中,由于标签图像含有形状图案的情况下,形状图案可能不是访问受限形状图案,如地理位置图案,分享来源的标识图案等。因此,服务器不能毫无疑义的确定形状图案为访问受限图案。基于此,可以通过分析形状图案的形状尺寸、像素密度是否符合受限形状图案的预设要求。例如:可以分析形状图案的高宽比确定形状图案的尺寸,可以通过计算形状图案的像素密度确定形状图案的形状。如果发现形状图像的尺寸和形状均满足受限形状图案的预设要求,则说明形状图案为访问受限形状图案,否则说明不是访问受限形状图案。应理解,此处消息访问受限是一种广义的访问受限,其可以是指部分人可以访问该条消息,也可以是消息仅自己可见。
步骤206:服务器确认消息发布方式无效。当服务器确认消息发布方式无效,说明消息发布者通过账号登录公众平台后,获取自己账号发布的消息图像,上传到服务器,不存在假冒消息发布行为,但是在发布消息时,设置消息访问受限条件,导致消息无法最大化被他人获知,活动推广力度不够,因此,智能手机上传的消息图像未被服务器审核通过,服务器不会向用户发放激励(如奖励积分或发放优惠券等)。
步骤207:服务器确认消息发布方式有效。当服务器确认消息发布方式有效,说明消息发布者通过账号登录公众平台后,获取自己账号发布的消息图像,上传到服务器,不存在假冒消息发布行为,并且在发布消息时,也未设置消息访问受限条件,或者设置访问方式为公开,使得消息最大化被他人获知,活动推广力度最大,因此,智能手机上传的消息图像被服务器审核通过,服务器可以向用户发放激励(如奖励积分或发放优惠券等)。
示例性的,对于朋友圈消息来说,服务器不仅从消息图像中截取到“删除”字段的标签图像,还从标签图像分离出访问受限形状标识,说明该条朋友圈是用户账号发布,但访问受限,访问受限的方式要么是仅自己可见,要么是部分人可见,因此,该条朋友圈消息无效。如果服务器从消息图像中截取到“删除”字段的标签图像,没有从标签图像分离出访问受限形状标识,说明该条朋友圈为用户账号发布,且任何人均可访问,因此,该条朋友圈消息无效。
由上可见,本公开示例性的实施例从消息图像提取有效消息后,基于公众平台发布的消息的标签信息特点,先确定有效消息是否含有目标字段。如果含有目标字段,则可以基于目标字段的位置从消息图像分离出标签图像,如果标签图像含有形状图案,且形状图案是访问受限形状图案,那么说明用户设备在公众平台发布的消息受到访问限制,因此,消息难以以用户设备为节点迅速扩散,消息发布行为无效。如果标签图像含有形状图案,且形状图案不为访问受限形状图案,说明用户设备在公众平台发布的消息没有访问限制,消息发布行为有效,消息可以以用户设备为节点迅速扩散。由此可见,商家后台可以基于本公开方法准确鉴定用户设备上传的图片有效性,并以鉴定结果为依据,决定是否对用户进行激励。因此,在整个图片鉴定过程中,没有人工参与图片鉴定工作,从而减少人工成本。
作为一种可能的实现方式,如果标签图像含有文字图案,服务器可以基于数学形态学对标签图像进行滤波处理。其中,该文字图案可以包含目标字段的文本图案,也可以是其它字段的文本图像,或者既包含目标字段又包含文本图案的文字图案,可以参考图5相关描述。
图6示出了本公开示例性实施例的标签图像的滤波流程图。如图6所示,当标签图像含有文字图案,服务器从消息图像分离出标签图像后,服务器判断形状图案是否为访问受限形状图案前,上述方法包括:
步骤601:服务器确定标签图像含有的各个图案边界框。该图案边界框可以包括第一边界框,该第一边界框为文字图案的边界框,在标签图像含有形状图案时,还可以含有第二边界框,第二边界框可以为形状图案的边界框。
步骤602:服务器基于图案边界框删除标签图像含有的文字图案。在实际应用中,服务器可以先基于图案边界框从标签图像查找文字图案,然后将文字图案所在的图案边界框内的区域设置为标签图像的背景色,从而达到删除文字图案的目的。
步骤603:当服务器确定标签图像在图案边界框内含有非文字图案时,确认标签图像含有形状图案。
在一些可选方式中,每个图案的边界框可以为最小外接边界框,服务器可以采用垂直投影法和水平投影方法相结合的方式确定每个图案的边界框。基于此,服务器确定标签图像含有的各个图案边界框可以包括:服务器采用垂直投影法确定每个图案的左右边界,服务器采用水平投影法确定每个图案的上下边界,接着服务器基于每个图案的左右边界和上下边界,确定每个图案边界框。
在实际应用中,可以直接基于标签图像的颜色对应的灰阶值进行水平投影和垂直投影,也可以对标签图像进行二值化处理,将标签图像处理为二值化图像,接着以二值化图像确定每个图案的边界框。
图7示出了本公开示例性的标签图像转换过程示意图。如图7所示,可以将标签图像701转换为灰度图像,再将灰度图像转换为二值化图像702。二值化图像702的背景色为黑色,其灰阶值为0,前景色为白色,其灰阶值为255。如果二值化图像702的背景色为白色,前景色为黑色,可以将二值化图像702进行反相处理,使得前景色和背景色的颜色互换。
以图7所示的二值化图像702为例,以二值化图像的左下角为坐标原点,图7的横向方向为x轴,竖直方向为y轴建立坐标系。可以认为是x轴所在方向为二值化图像的像素行方向,y轴所在方向为二值化图像702的像素列方向。将二值化图像702垂直投影至x轴,可以得到x轴上x点对应的像素个数,也就是x轴对应的坐标值;将二值化图像702水平投影至y轴,得到y轴上y点对应的像素个数,也就是y轴对应的坐标值;。
如图7所示,由于二值化图像702中每个图案颜色为白色,因此,二值化图像702垂直投影所形成的所有x轴坐标值可以形成一条曲线图像(定义为第一曲线)。通过对第一曲线进行分析可以发现,沿着二值化图像702的水平方向上有的位置白色像素点数量大于0,有的位置白色像素点数量等于0。如果白色像素点数量大于0的像素靠近左侧存在多列白色像素点等于0的相邻像素,则该白色像素点数量大于0的像素与其相邻的左侧像素所在像素列为某个图案的左边界;如果白色像素点数量大于0的像素靠近右侧存在多列白色像素点等于0的相邻像素,则该白色像素点数量大于0的像素与其相邻的右侧像素所在像素列为某个图案的右边界。
如图7所示,二值化图像702水平投影所形成的所有y轴坐标值也可以形成一条曲线图像(定义为第二曲线)。通过对第二曲线进行分析可以发现,沿着二值化图像702的竖直方向上有的位置白色像素点数量大于0,有的位置白色像素点数量等于0。如果白色像素点数量大于0的像素靠近下侧存在多行白色像素点等于0的相邻像素,则该白色像素点数量大于0的像素与其相邻的下侧像素所在像素列为某个图案的下边界;如果白色像素点数量大于0的像素靠近上侧存在多行白色像素点等于0的相邻像素,则该白色像素点数量大于0的像素与其相邻的上侧像素所在像素行为某个图案的上边界。
经过对二值化图像的水平投影和垂直投影后,可以获得各个图案的上下边界和左右边界,然后基于每个图案的上下边界和左右边界,可以获得对应的图案边界框。图8示出了本公开示例性实施例标注图案边界框的二值化图像的结构示意图。如图8所示,二值化图像800中每个图案均被一个边界框801包围,且与该边界框外接。应理解,如果二值化图像的背景色为白色,前景色为黑色,在进行二值化垂直投影时,可以计算每列像素中黑色像素的数量,作为x轴坐标值,对二值化图像进行水平投影时,可以计算每列像素中黑色像素的数量,作为y轴坐标值。
在一种可选方式中,服务器可以基于数学形态学做差分滤除标签图像中粒度较细的部分,差分是指根据各个形态学位置的边界框与标签图像重叠,确定所需滤除的途安。换句话说,服务器可以基于数学形态学方式对标签图像进行滤波,并将滤波结果和图案边界框(形态学位置)进行重叠,确定标签图像所需去除的图案。
图9示出了本公开示例性实施例标签图像的第一种滤波流程示意图。如图9所示,服务器基于图案边界框删除标签图像含有的文字图案,包括:
步骤901:服务器对标签图像进行腐蚀操作,获得腐蚀图像,此处标签图像可以为转换为二值化图像的标签图像,也可以是原始的标签图像。基于形状图案和文字图案的粒度差异,该腐蚀操作的腐蚀核尺寸小于访问受限形状图案的最大粒度尺寸,可以滤除小于该最大粒度尺寸的像素。由于文字图案的粒度比较细,当腐蚀操作的腐蚀核尺寸小于访问受限形状图案的最大粒度尺寸,理论上来说,可以将文字图案完全滤除。
示例性的,该腐蚀核的尺寸大于或等于预设文字图案的粒度尺寸且小于最大粒度尺寸的一半。此处预设文字图案的粒度尺寸可以是经过大数据统计得到的一般字体粒度尺寸,也可以是自定义的粒度尺寸。最大粒度尺寸也可以是经过大数据统计得到的一般形状粒度尺寸,或者自定义的粒度尺寸。为了降低形状图案被误删的可能性,可以控制腐蚀核的尺寸小于最大粒度尺寸的一半。例如:该腐蚀核的尺寸可以比文字的笔画宽度大,但小于形状图像的高度的二分之一。此时,服务器可以利用该腐蚀核滤除标签图像上的文字图案。
步骤902:服务器判断腐蚀图像位于图案边界框内的区域是否存在图案。当服务器确定腐蚀图像位于图案边界框内的区域不存在图案,说明标签图像位于该图案边界框的区域内的图案为文本图案,可以执行步骤903;如果服务器确定腐蚀图像位于图案边界框内的区域存在图案,理论上来说,标签图像位于该图案边界框的区域内的图案为非文本图案,可以执行步骤904。
步骤903:服务器删除标签图像位于图案边界框内的图案。按照步骤901~步骤903的方式,理论上可以将标签图像所含有的大部分文字图案去除。
步骤904:服务器确定标签图像位于该图案边界框的区域内的图案为非文字图案。但是如果标签图像所含有的文字图案存在笔画复杂、笔画粘连或者文字图案畸变的问题,导致个别文字图案存在像素粒度变粗,甚至与形状图案的粒度相当,因此,采用腐蚀方法和边界框结合的方式虽然有可能难以将文字图案去除干净。此时,可以将其它文字图案删除方式作为替代方式,或者将其它文字图案删除方式作为进一步删除文字图案的方案。
由上可知,服务器可以基于腐蚀细粒度像素和边界框相结合的方式进行文字图案删除,在进行细粒度像素腐蚀时,可以滤除细粒度的文字,这里的文字不仅包含非阿拉伯数字,也包含阿拉伯数字,具有良好的形状滤波效果。
在一种可选方式中,可以结合有效消息和图案边界框,确定图案边界框内的图案是否为文字图案,然后根据实际情况删除文字图案。当采用OCR技术提取有效消息,该有效消息可以包括识别内容和位置信息。该识别内容为消息图像内的图案内容,位置信息则为对应图案位置。
图10示出了本公开示例性实施例文字图案的第二种滤波流程示意图。如图10所示,服务器基于图案边界框删除标签图像含有的文字图案,包括:
步骤1001:服务器基于位置信息确定图案位置位于图案边界框内的情况下,判断标签图像位于图案边界框内的图案是否是文字编码形成的图案。此处标签图像可以为转换为二值化图像的标签图像,也可以是原始的标签图像。
在实际应用中,位置信息可以包含多个图案位置,这种图案位置只是粗略指示消息图像上图案位置。为了准确定位标签图像的图案位置,服务器可以从位置信息获取标签图像的图案位置,然后以图案边界框为单位,判断每个图案位置是否位于该图案边界框内。
如果图案位置位于图案边界框内,为了避免OCR技术将形状图案识别为数字图案的问题发生,可以判断标签图像位于该图案边界框内的图案是否为文字编码形成的图案。此处的文字编码可以包括中文编码、外语编码、数字编码等。如果是文字编码方式是文字编码方式,则服务器确定标签图像位于图案边界框内的图案为文字编码形成的图案,此时执行步骤步骤1002。如果不是文字编码雄称的图案,则服务器确定标签图像位于图案边界框内的图案可能为非文字图案,此时执行步骤1003。应理解,如果服务器确定腐蚀图像位于图案边界框内的区域存在图案,执行步骤1001,那么此处的文字编码可以不含有数字编码,因此,数字编码形成的阿拉伯数字属于细粒度图案,服务器在腐蚀标签图像时,很容易腐蚀细粒度的阿拉伯数字,因此,按照步骤902和步骤903所述,可以通过第一种滤波方式滤除阿拉伯数字。
例如:中文编码范围可以在0x4E00~0x29FA5之间,而形状图案几乎没有可能被识别的汉字,因此,当图案位置位于图案边界框内,如果标签图像位于该图案边界框内的图案编码为汉字编码,说明标签图像位于该图案边界框内的图案为文字图案,可以执行步骤1002,否则执行步骤1003。
步骤1002:服务器删除标签图像位于图案边界框内的图案。当服务器确定标签图像位于图案边界框内的图案为文字编码形成的图案时,说明这种图案为文字图案,因此,删除标签图像位于该图案边界框内的图案实质为,因此删除标签图像位于该图案边界框内的文字图案。
步骤1003:服务器确认该标签图像位于图案边界框内的图案为非文字图案。
如果服务器确定腐蚀图像位于图案边界框内的区域存在图案,则还可以执行步骤1001~步骤1003,以验证标签图像位于该图案边界框内的图案是否为文字图案,同时还可以防止个别文字粒度变粗所产生的腐蚀遗漏(无法通过腐蚀方式滤除的文字像素)问题。另外,当服务器确定腐蚀图像位于图案边界框内的区域存在图案时,标签图像含有粒度大于预设尺度的图案。如果腐蚀核的尺寸等于最大粒度尺寸的一半,那么腐蚀图像并未将腐蚀掉标签图像中粒度大于最大粒度尺寸的一半的像素,因此,步骤1001中的标签图像含有粒度大于预设尺度的图案,该预设尺寸大于或等于预设文字图案的尺寸且小于或等于所述访问受限形状图案的最大粒度尺寸的一半。
为了清楚描述本公开示例性实施例的消息发布方式的有效性确定方法,下面以朋友圈消息为例,说明消息发布方式的有效性的确定过程。
图11示出了本公开示例性实施例的另一种方法的流程示意图。如图11所示,本公开示例性实施例的方法可以确定朋友圈消息的有效性。该方法包括:
步骤1101:服务器接收微信公众号上传的朋友圈截图。此时可以将朋友圈截图等比例缩放至固定尺寸。如朋友圈截图尺寸为1487×2105,可以对该朋友圈截图进行等比例缩放,缩放后的朋友圈截图尺寸为763×1080。
步骤1102:服务器使用文字识别模型CRNN对朋友圈截图进行识别,获得识别结果。识别结果包括识别内容和位置信息,识别结果可以为文字内容。识别内容可以为文字内容,位置信息可以为文字内容的位置。
步骤1103:服务器基于识别内容确定朋友圈截图含有商家要求的字段的情况下,从朋友圈截图提取含有商家要求的字段的朋友圈有效消息。
以图4为例,将图4所示的朋友圈界面作为朋友圈截图使用,若检测到朋友圈界面含有的一条朋友圈消息包含“《Scratch少儿编程一学就会》”字段,可以将该条朋友圈消息定义目标消息,认为朋友圈截图含有商家要求的字段,服务器可以从朋友圈界面提取第一条朋友圈消息401作为朋友圈有效消息。
步骤1104:服务器判断朋友圈有效消息是否存在“删除”字段。如果不存在“删除”字段,执行步骤1105,如果存在“删除”字段,执行步骤1106。
步骤1105:服务器确定消息发布方式无效。
步骤1106:服务器基于“删除”字段的位置从朋友圈截图截“删除”字段所在行的图像作为标签图像。该标签图像如图7中的701所示。
本公开示例性实施例在步骤1106之后,可以基于形态学的方法,设计形状滤波器检测标签图像是否含有非所有人可见的标识形状图案(下文称作目标图案),如私密或部分人可见的图案。服务器主要利用形态学差分和步骤1103的位置信息(如字体位置)实现形状滤波器功能。
上述形状滤波器的主要包括两种滤波方式。第一种滤波方式是基于形态学方式去做差分滤除粒度较细图案,此处的差分是根据各个形态学位置的边界框重叠去做,可以参考图9所示的步骤901~步骤903。第二种滤波方式采用位置信息滤除第一种滤波方式获得的图像残留的痕迹,可以参考图10所示的步骤1001和步骤1002。当形状滤波器输出的图像后,可以判断该图像是否存在符合代表“非所有人可见”的形状。
示例性的,服务器执行上述步骤1106后,上述朋友圈消息的有效性确定方法还包括:
步骤1107:服务器将标签图像转换为二值化图像。例如图7所示的标签图像701可以转换为二值化图像702。此处二值化图像的前景色可以为白色,背景色可以为黑色,如果二值化图像的背景色为白色,前景色为黑色,可以将二值化图像进行反相。
步骤1108:服务器采用第一种滤波方式对二值化图像进行滤波处理,获得第一滤波图像。
步骤1109:服务器采用第二种滤波方式对第一滤波图像进行滤波处理,获得第二滤波图像。
步骤1110:服务器判断第二滤波图像内是否存在符合目标图案的形状要求的图案,如果存在,执行步骤1111,否则执行步骤1112。
例如:可以将第二滤波图像所存在的图案的宽高比,像素密度等与目标图案的高宽比、像素密度进行比对,如果符合条件,说明第二滤波图像含有目标图案,也就是该朋友圈消息并没有对所有人可见,执行步骤1111,如果不符合条件,则说明该朋友圈消息没有对所有人可见,执行步骤1112。
步骤1111:服务器确认消息发布方式无效。
步骤1112:服务器确认消息发布方式有效。
图12示出了本公开示例性实施例的二值化图像在滤波过程的变化示意图。如图12所示,服务器采用形状滤波器对二值化图像进行滤波的过程可以包括:
第一步,对二值化图像1201采用形态学上的进行腐蚀处理,获得腐蚀图像1202。整个过程为逐渐去除图案边界的过程。例如:可以选择尺寸为3的腐蚀核对二值化图像1201进行腐蚀处理,得到腐蚀图像1202。通过对比腐蚀图像1202和二值化图像1201可以看出,二值化图像1201所含有的图案中粒度比较细的字迹被消除,服务器最终所需确定的目标图案也有部分退化,但仍然存在。同时,二值化图像中还存在一些因为笔画粘连等原因造成的粒度比较粗的字迹,经过腐蚀处理后,还存在残余的痕迹。例如在腐蚀图像中几乎找不到“校”、“删除”等字迹,但是其仍然残留有痕迹。
第二步,服务器采用水平投影和垂直投影相结合的投影方式在二值化图像1201上生成每个图案的最小外接矩形框。将每个图案带有最小外接矩形框的二值化图像定义为标定二值化图像1203。生成方式可以参考前文相关描述。
第三步,服务器判断腐蚀图像位于每个最小外接矩形框内的区域是否存在白点。如果不存在白点,说明二值化图像在该最小外接矩形框内的图案为细粒度图案,极有可能是文字图案,不可能是目标图案,可以将二值化图像在该最小外接矩形框内的区域设置为背景色;如果存在白点,则可以获得第一次滤波图像1204;需要确定二值化图像在该最小外接矩形框内的图案是形状图案还是因为某些原因导致的粗粒度文字图案,因此,可以执行第四步。
第四步,服务器根据步骤1102所获得的位置信息确定二值化图像1201的图案位置1205,判断第一次滤波图像1204内存在图案的最小外接矩形框是否存在图案位置,如果存在图案位置,由于在CRNN模型识别时,形状图案一般不会被识别为汉语,因此,根据计算机中汉字编码范围0x4E00~0x29FA5,判断该第一次滤波图像1204位于最小外接矩形框内的图案是否存在0x4E00~0x29FA5之间的编码,如果是,则说明第一次滤波图像1204位于最小外接矩形框内的图案为文字图案,是目标图案,可以删除第一次滤波图像1204位于最小外接矩形框内的图案,或者将第一次滤波图像1204位于最小外接矩形框内的颜色设置为背景色,从而获得第二次滤波图像1206。最后判断第二次滤波图像1206上的图案是否符合朋友圈访问受限的图案标识。
上述主要从服务器的角度对本公开实施例提供的方案进行了介绍。可以理解的是,服务器为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本公开能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
本公开实施例可以根据上述方法示例对服务器进行功能单元的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本公开实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,本公开示例性实施例提供一种消息发布方式的有效性确定装置,该消息发布方式的有效性确定装置可以为服务器或应用于服务器的芯片。图13示出了根据本公开示例性实施例的图像处理装置的功能模块示意性框图。如图13所示,该消息发布方式的有效性确定装置1300包括:
接收模块1301,用于接收公众平台的消息图像;
第一提取模块1302,用于从所述消息图像提取有效消息;
第二提取模块1303,用于若所述有效消息含有指示可编辑操作的目标字段,基于所述目标字段的位置从所述消息图像分离出标签图像;
判断模块1304,用于当所述标签图像含有形状图案,判断所述形状图案是否为访问受限形状图案;
确认模块1305,用于若所述形状图案为所述访问受限形状图案,确定所述消息发布方式无效,否则,确定所述消息发布方式有效。
图14示出了根据本公开示例性实施例的芯片的示意性框图。如图14所示,该芯片1400包括一个或两个以上(包括两个)处理器1401和通信接口1402。通信接口1402可以支持服务器执行本公开实施例的方法中的数据收发步骤,处理器1401可以支持服务器执行本公开实施例的方法中的数据处理步骤。
可选的,如图14所示,该芯片1400还包括存储器1403,存储器1403可以包括只读存储器和随机存取存储器,并向处理器提供操作指令和数据。存储器的一部分还可以包括非易失性随机存取存储器(non-volatile random access memory,NVRAM)。
在一些实施方式中,如图14所示,处理器1401通过调用存储器存储的操作指令(该操作指令可存储在操作系统中),执行相应的操作。处理器1401控制终端设备中任一个的处理操作,处理器还可以称为中央处理单元(central processing unit,CPU)。存储器903可以包括只读存储器和随机存取存储器,并向处理器2201提供指令和数据。存储器903的一部分还可以包括NVRAM。例如应用中存储器、通信接口以及存储器通过总线系统耦合在一起,其中总线系统除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图14中将各种总线都标为总线系统1404。
上述本公开实施例揭示的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(digital signal processing,DSP)、ASIC、现成可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本公开实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本公开实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
本公开示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序,所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本公开实施例的方法。
本公开示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。
本公开示例性实施例还提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。
参考图15,现将描述可以作为本公开的服务器或客户端的电子设备的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图15所示,电子设备1500包括计算单元1501,其可以根据存储在只读存储器(ROM)1502中的计算机程序或者从存储单元1508加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 1503中,还可存储设备1500操作所需的各种程序和数据。计算单元1501、ROM 1502以及RAM 1503通过总线1504彼此相连。输入/输出(I/O)接口1505也连接至总线1504。
电子设备1500中的多个部件连接至I/O接口1505,包括:输入单元1506、输出单元1507、存储单元1508以及通信单元1509。输入单元1506可以是能向电子设备1500输入信息的任何类型的设备,输入单元1506可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元1507可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元1504可以包括但不限于磁盘、光盘。通信单元1509允许电子设备1500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元1501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1501执行上文所描述的各个方法和处理。例如,在一些实施例中,本公开实施例的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1508。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1502和/或通信单元1509而被载入和/或安装到电子设备1500上。在一些实施例中,计算单元1501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行本公开实施例的方法。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
如本公开使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机程序或指令。在计算机上加载和执行所述计算机程序或指令时,全部或部分地执行本公开实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、终端、用户设备或者其它可编程装置。所述计算机程序或指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机程序或指令可以从一个网站站点、计算机、服务器或数据中心通过有线或无线方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是集成一个或多个可用介质的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,例如,软盘、硬盘、磁带;也可以是光介质,例如,数字视频光盘(digital video disc,DVD);还可以是半导体介质,例如,固态硬盘(solid state drive,SSD)。
尽管结合具体特征及其实施例对本公开进行了描述,显而易见的,在不脱离本公开的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本公开的示例性说明,且视为已覆盖本公开范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样,倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内,则本公开也意图包括这些改动和变型在内。

Claims (11)

1.一种消息发布方式的有效性确定方法,其特征在于,所述方法包括:
接收公众平台的消息图像;
从所述消息图像提取有效消息;
若所述有效消息含有指示可编辑操作的目标字段,基于所述目标字段的位置从所述消息图像分离出所述有效消息的标签图像;
当确定所述标签图像含有形状图案,判断所述形状图案是否为访问受限形状图案;
当所述形状图案的形状尺寸和像素密度符合受限形状图案的预设要求的情况下,确定所述形状图案为所述访问受限形状图案,确认所述消息发布方式无效,否则,确认所述消息发布方式有效;
若所述标签图像含有文字图案,所述从所述消息图像分离出标签图像后,所述判断所述形状图案是否为访问受限形状图案前,所述方法包括:
确定所述标签图像含有的各个图案边界框;
基于所述图案边界框删除所述标签图像含有的文字图案;
当确定所述标签图像在图案边界框内含有非文字图案时,确认所述标签图像含有所述形状图案。
2.根据权利要求1所述的方法,其特征在于,每个所述图案的边界框为最小外接边界框,所述确定所述标签图像含有的各个图案边界框,包括:
采用垂直投影法确定每个图案的左右边界;
采用水平投影法确定每个图案的上下边界;
基于每个所述图案的所述左右边界和所述上下边界,获得每个所述图案边界框。
3.根据权利要求1所述的方法,其特征在于,所述基于所述图案边界框删除所述标签图像含有的文字图案,包括:
对所述标签图像进行腐蚀操作,获得腐蚀图像,所述腐蚀操作的腐蚀核尺寸小于所述访问受限形状图案的最大粒度尺寸;
当确定所述腐蚀图像位于所述图案边界框内的区域不存在图案,删除所述标签图像位于所述图案边界框内的图案。
4.根据权利要求3所述的方法,其特征在于,所述腐蚀核的尺寸大于或等于预设文字图案的粒度尺寸且小于所述最大粒度尺寸的一半。
5.根据权利要求1~4任一项所述的方法,其特征在于,所述有效消息包括识别内容和位置信息,所述基于所述图案边界框删除所述标签图像含有的文字图案,包括:
基于所述位置信息确定图案位置位于所述图案边界框内的情况下,判断所述标签图像位于所述图案边界框内的图案是否是文字编码形成的图案;
当确定所述标签图像位于所述图案边界框内的图案为文字编码形成的图案,删除所述标签图像位于所述图案边界框内的图案。
6.根据权利要求1~4任一项所述的方法,其特征在于,所述从所述消息图像分离出标签图像,包括:
基于所述消息图像的消息发布平台确定所述有效消息的标签分布策略;
基于所述标签分布策略和所述目标字段的位置从所述消息图像提取所述标签图像。
7.根据权利要求1~4任一项所述的方法,其特征在于,所述标签图像含有目标字段,所述目标字段与所述形状图案位于同一行。
8.根据权利要求1~4任一项所述的方法,其特征在于,所述从所述消息图像分离出标签图像后,所述方法还包括:
当确定所述标签图像不含有形状图案,确定所述消息发布方式有效。
9.一种消息发布方式的有效性确定装置,其特征在于,
接收模块,用于接收公众平台的消息图像;
第一提取模块,用于从所述消息图像提取有效消息;
第二提取模块,用于若所述有效消息含有指示可编辑操作的目标字段,基于所述目标字段的位置从所述消息图像分离出所述有效消息的标签图像;
第一确认模块,用于确定所述标签图像含有的各个图案边界框,基于所述图案边界框删除所述标签图像含有的文字图案,当确定所述标签图像在图案边界框内含有非文字图案时,确认所述标签图像含有形状图案;
判断模块,用于当确定所述标签图像含有形状图案,判断所述形状图案的形状尺寸和像素密度是否符合受限形状图案的预设要求,以确定所述形状图案是否为访问受限形状图案;
第二确认模块,用于当确定所述形状图案为所述访问受限形状图案,确认所述消息发布方式无效,否则,确认所述消息发布方式有效。
10.一种电子设备,其特征在于,包括:
处理器;以及,
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行权利要求1~8中任一项所述的方法。
11.一种非瞬时计算机可读存储介质,其特征在于,所述非瞬时计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1~8中任一项所述的方法。
CN202111075853.8A 2021-09-14 2021-09-14 一种消息发布方式的有效性确定方法及装置、电子设备 Active CN113537230B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111075853.8A CN113537230B (zh) 2021-09-14 2021-09-14 一种消息发布方式的有效性确定方法及装置、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111075853.8A CN113537230B (zh) 2021-09-14 2021-09-14 一种消息发布方式的有效性确定方法及装置、电子设备

Publications (2)

Publication Number Publication Date
CN113537230A CN113537230A (zh) 2021-10-22
CN113537230B true CN113537230B (zh) 2021-12-21

Family

ID=78092554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111075853.8A Active CN113537230B (zh) 2021-09-14 2021-09-14 一种消息发布方式的有效性确定方法及装置、电子设备

Country Status (1)

Country Link
CN (1) CN113537230B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114237479A (zh) * 2021-12-08 2022-03-25 阿波罗智联(北京)科技有限公司 一种应用程序的控制方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013003210A2 (en) * 2011-06-30 2013-01-03 Microsoft Corporation Shared electronic incentives and coupons leveraging social connections and shepherding
CN105335532A (zh) * 2015-12-17 2016-02-17 深圳市开复移动互联网有限公司 一种基于微信的自媒体传播平台及方法
CN107508744A (zh) * 2017-08-10 2017-12-22 北京本邦科技股份有限公司 一种基于微信电子红包的网址推广方法及系统
CN107563791A (zh) * 2017-07-31 2018-01-09 广州点升信息技术有限公司 基于免费福利的营销方法
CN110533478A (zh) * 2019-09-03 2019-12-03 上海盛昌文化传播有限公司 向用户提供广告服务的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013003210A2 (en) * 2011-06-30 2013-01-03 Microsoft Corporation Shared electronic incentives and coupons leveraging social connections and shepherding
CN105335532A (zh) * 2015-12-17 2016-02-17 深圳市开复移动互联网有限公司 一种基于微信的自媒体传播平台及方法
CN107563791A (zh) * 2017-07-31 2018-01-09 广州点升信息技术有限公司 基于免费福利的营销方法
CN107508744A (zh) * 2017-08-10 2017-12-22 北京本邦科技股份有限公司 一种基于微信电子红包的网址推广方法及系统
CN110533478A (zh) * 2019-09-03 2019-12-03 上海盛昌文化传播有限公司 向用户提供广告服务的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《公众号配置朋友圈截图OCR识别回复》;编程菌;《https://baijiahao.baidu.com/s?id=1710688291710838396&wfr=spider&for=pc》;20210912;全文 *

Also Published As

Publication number Publication date
CN113537230A (zh) 2021-10-22

Similar Documents

Publication Publication Date Title
EP3437019B1 (en) Optical character recognition in structured documents
WO2022161286A1 (zh) 图像检测方法、模型训练方法、设备、介质及程序产品
US9436883B2 (en) Collaborative text detection and recognition
JP2019505872A (ja) 動的な効果を有する2次元コード画像を生成するための方法および装置
CA3052248C (en) Detecting orientation of textual documents on a live camera feed
CA3018437C (en) Optical character recognition utilizing hashed templates
US11704925B2 (en) Systems and methods for digitized document image data spillage recovery
CN112101386B (zh) 文本检测方法、装置、计算机设备和存储介质
CN107203764B (zh) 长微博图片识别方法和装置
CN110795714A (zh) 一种身份验证方法、装置、计算机设备及存储介质
CN113537230B (zh) 一种消息发布方式的有效性确定方法及装置、电子设备
CA3062788C (en) Detecting font size in a digital image
CN115240203A (zh) 业务数据处理方法、装置、设备及存储介质
US11887392B2 (en) Systems and methods for digitized document image text contouring
WO2022103564A1 (en) Fraud detection via automated handwriting clustering
US11410278B2 (en) Automatic artifact removal in a digital image
CN115019324A (zh) 文本扫描的交互方法、装置、计算机设备和存储介质
CN111274447A (zh) 基于视频的目标表情生成方法、装置、介质、电子设备
CN115223022A (zh) 一种图像处理方法、装置、存储介质及设备
CN114140805A (zh) 图像处理方法、装置、电子设备及存储介质
WO2023246193A1 (zh) 一种图像清晰度确定方法、装置、设备及存储介质
CN111898602B (zh) 一种图像中的凭证号码区域识别方法、装置及设备
CN116502292A (zh) 客户端进行截屏监控的方法、计算机设备、计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant