CN106127116A - 一种图片类型识别的方法和装置 - Google Patents
一种图片类型识别的方法和装置 Download PDFInfo
- Publication number
- CN106127116A CN106127116A CN201610429025.2A CN201610429025A CN106127116A CN 106127116 A CN106127116 A CN 106127116A CN 201610429025 A CN201610429025 A CN 201610429025A CN 106127116 A CN106127116 A CN 106127116A
- Authority
- CN
- China
- Prior art keywords
- text
- height
- adjacent region
- candidate
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/758—Involving statistics of pixels or of feature values, e.g. histogram matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种图片类型识别的方法和装置,用以提高图片中信息的传播量。该方法包括:对发布的图片进行二值化,并逐行扫描二值化后的图片,确定每行像素的行像素值之和;将所述图片中行像素值之和大于第一预设值的像素行确定为候选文本行,并对所有相邻的候选文本行进行连接,形成对应的候选文本行相邻区;根据每个所述候选文本行相邻区的高度,将高度在第一预设范围内的候选文本行相邻区确定为有效文本行相邻区;若所述有效文本行相邻区的高度满足设定条件,识别所述图片为文本长图。这样,可提醒用户针对信息的类型确定发布信息的方式,用以减少对流量的耗费,提高发布内容被阅读的几率,进一步扩大信息的传播量。
Description
技术领域
本发明涉及社交应用技术领域,特别涉及一种图片类型识别的方法和装置。
背景技术
随着互联网技术的发展,一些社交应用也日益被广泛使用。用户可通过社交应用发布一些文章,例如博文、评论等。这些文章通过互联网的传播,可使得更多的用户能够获得所需信息。
其中,用户通过社交应用发布文字较多的文章时,会转换成对应的图片来进行发布,例如:用户发表文字较多的博文时,通常会用长微博类工具撰写长文,然后生成文本长图来发布内容。用于这类长图图片占用存储空间较大,在非WIFI环境下移动终端查看文本图片会耗费较多流量。另外,文本长图加载较慢也会影响用户的阅读体验。若用户采用微博头条文章产品来发布文字较多的博文时,则不会耗费较多流量,也不会影响用户的阅读速度。
可见,对发布文本长图的用户进行提醒,可及时更改发表文字较多的文章的方式,提高发布内容被阅读的几率,进一步扩大信息的传播量。
发明内容
本发明提供一种图片类型识别的方法和装置,用以提高图片中信息的传播量。
本发明提供一种图片类型识别的方法,该方法包括:
对发布的图片进行二值化,并逐行扫描二值化后的图片,确定每行像素的行像素值之和;
将所述图片中行像素值之和大于第一预设值的像素行确定为候选文本行,并对所有相邻的候选文本行进行连接,形成对应的候选文本行相邻区;
根据每个所述候选文本行相邻区的高度,将高度在第一预设范围内的候选文本行相邻区确定为有效文本行相邻区;
若所述有效文本行相邻区的高度满足设定条件,识别所述图片为文本长图。
本发明一实施例中,所述若所述有效文本行相邻区的高度满足设定条件,识别所述图片为文本长图包括:
将所述图片中每个有效文本行相邻区的高度进行累加,得到行高和;
若所述行高和与所述图片的高度的比值大于第二预设值,确定所述图片为候选文本长图;
从所述候选文本长图中识别出文本长图。
本发明一实施例中,所述若所述有效文本行相邻区的高度满足设定条件,识别所述图片为文本长图包括:
根据每个有效文本行相邻区的高度,确定基准高度;
确定每个有效文本行相邻区的高度与所述基准高度之间的相对差值;
将每个相对差值与第三预设值进行比较,获得所述相对差值大于所述第三预设值的第一个数,以及所述相对差值小于或等于所述第三预设值的第二个数;
若所述第一个数与第二个数的比值小于第四预设值时,确定所述图片为候选文本长图;
从所述候选文本长图中识别出文本长图。
本发明一实施例中,所述根据每个有效文本行相邻区的高度,确定基准高度包括:
对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择一个有效文本行相邻区的高度为基准行高;或,
对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择至少两个有效文本行相邻区的高度进行平均值运算,将运算后的平均值确定为基准高度。
本发明一实施例中,所述从所述候选文本长图中识别出文本长图包括:
对所述候选文本长图进行逐列扫描,确定每列像素的列像素值之和;
将每列的列像素值之和与第五预设值进行比较;
若各列像素值之和均大于等于所述第五预设值,确定所述候选文本长图为文本长图。
本发明提供一种图片类型识别的装置,该装置包括:
扫描处理单元,用于对发布的图片进行二值化,并逐行扫描二值化后的图片,确定每行像素的行像素值之和;
连接单元,用于将所述图片中行像素值之和大于第一预设值的像素行确定为候选文本行,并对所有相邻的候选文本行进行连接,形成对应的候选文本行相邻区;
确定单元,用于根据每个所述候选文本行相邻区的高度,将高度在第一预设范围内的候选文本行相邻区确定为有效文本行相邻区;
识别单元,用于若所述有效文本行相邻区的高度满足设定条件,识别所述图片为文本长图。
本发明一实施例中,所述识别单元,具体用于将所述图片中每个有效文本行相邻区的高度进行累加,得到行高和,若所述行高和与所述图片的高度的比值大于第二预设值,确定所述图片为候选文本长图,从所述候选文本长图中识别出文本长图。
本发明一实施例中,所述识别单元,具体用于根据每个有效文本行相邻区的高度,确定基准高度,确定每个有效文本行相邻区的高度与所述基准高度之间的相对差值,将每个相对差值与第三预设值进行比较,获得所述相对差值大于所述第三预设值的第一个数,以及所述相对差值小于或等于所述第三预设值的第二个数,若所述第一个数与第二个数的比值小于第四预设值时,确定所述图片为候选文本长图,从所述候选文本长图中识别出文本长图。
本发明一实施例中,所述识别单元,具体用于对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择一个有效文本行相邻区的高度为基准高度;或,对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择至少两个有效文本行相邻区的高度进行平均值运算,将运算后的平均值确定为基准高度。
本发明一实施例中,所述识别单元,还用于对所述候选文本长图进行逐列扫描,确定每列像素的列像素值之和,将每列的列像素值之和与第五预设值进行比较,若各列像素值之和大于等于所述第五预设值,确定所述候选文本长图为文本长图。
本发明实施例的一些有益效果可以包括:
可见,根据发布的图片中每行的行像素值之后,确定图片中的有效文本行相邻区,并当有效文本行相邻区的高度满足设定条件,可确定图片为文本长图,从而,可提醒用户发布的是文本长图,这样用户可及时更改发表文字较多的文章的方式,或者进行降频处理,减少对流量的耗费,提高发布内容被阅读的几率,进一步扩大信息的传播量。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是根据一示例性实施例示出的图片类型识别的流程图;
图2是根据一示例性实施例一示出的图片类型识别的流程图;
图3是根据一示例性实施例二示出的图片类型识别的流程图;
图4是根据一示例性实施例示出的图片类型识别的装置的结构图;
图5是根据一示例性实施例三示出的图片类型识别的装置结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本公开实施例提供的技术方案,根据发布的图片中每行的行像素值之后,确定图片中的有效文本行相邻区,并当有效文本行相邻区的高度满足设定条件,可确定图片为文本长图,从而,可提醒用户针对信息的类型确定发布信息的方式,用以减少对流量的耗费,提高发布内容被阅读的几率,进一步扩大信息的传播量。
图1是根据一示例性实施例示出的图片类型识别的流程图。图片类型识别的过程如图1所示,包括:
步骤101:对发布的图片进行二值化,并逐行扫描二值化后的图片,确定每行像素的行像素值之和。
用户在通过社交应用发布信息时,可将信息转换为图片进行发布,例如:发布文字较多的博文时,采用长微博类工具撰写长文,然后生成文本长图来发布信息。或者,将一些表格,评论转换成对应的图片进行发布。这样,发布的信息采用的图片形式
可将发布的图片进行二值化,从而形成有像素点组成的二值化后的图片。具体可采用大津算法将图片进行二值化分割,背景像素值为0,前景像素值为1。
然后,逐行扫描二值化后的图片,将二值化后的图片每行像素值分别进行累加,得到每行像素的行像素值之和。
步骤102:将图片中行像素值之和大于第一预设值的像素行确定为候选文本行,并对所有相邻的候选文本行进行连接,形成对应的候选文本行相邻区。
确定了每行像素的行像素值之和后,可逐一将每行像素的行像素值之和与第一预设值进行比较,若当前行像素值之和大于第一预设值,则可将当前像素行确定为候选文本行,即将图片中行像素值之和大于第一预设值的像素行确定为候选文本行。这里,第一预设值可根据图片宽度值进行确定,例如第一预设值为图片宽度值的5%,或者第一预设值为图片宽度值的8%。当然,还可以是其他值,可根据应用环境还确定。
确定了候选文本行后,可将所有相邻的候选文本行进行连接,形成对应的候选文本行相邻区。
例如:发布的图片进行二值化后形成的图片中,包括了100行,其中,第1行至第20行,第25行至30行,第33行、第42行,第51行至第80行,以及第82行至第100行都是候选文本行。那么对所有相邻的候选文本行进行连接,形成的对应的候选文本行相邻区包括:第一候选文本行相邻区、第二候选文本行相邻区、第三候选文本行相邻区,以及第四候选文本行相邻区。其中,第一候选文本行相邻区包括:第1行至第20行的候选文本行;第二候选文本行相邻区包括:第25行至第30行的候选文本行;第三候选文本行相邻区包括:第51行至第80行的候选文本行;第四候选文本行相邻区包括:第82行至第100行的候选文本行。而第33行、第42行不与其他的候选文本行连接,从而不能形成对应的候选文本行相邻区。
步骤103:根据每个候选文本行相邻区的高度,将高度在第一预设范围内的候选文本行相邻区确定为有效文本行相邻区。
这里,可将每个候选文本行相邻区的高度与第一预设范围进行比较,若当前候选文本行相邻区的高度在第一预设范围内,确定当前候选文本行相邻区为候选文本行相邻区。而候选文本行相邻区中的每个候选文本行为有效文本行。
第一预设范围可设定为10行像素高度至40行像素高度,如上例,将每个候选文本行相邻区的高度与第一预设范围进行比较时,由于第一候选文本行相邻区的高度是20行像素高度,在第一预设范围内,从而可确定第一候选文本行相邻区为有效文本行相邻区;而第二候选文本行相邻区的高度是5行像素高度,不在第一预设范围内,从而可确定第二候选文本行相邻区不是有效文本行相邻区;第三候选文本行相邻区的高度是29行像素高度,在第一预设范围内,从而可确定第三候选文本行相邻区为有效文本行相邻区;第四候选文本行相邻区的高度是18行像素高度,在第一预设范围内,从而可确定第四候选文本行相邻区为有效文本行相邻区。因此,该发布的图片中,包括第1-20行、第51-80行,以及第82-100行形成的有效文本行相邻区
步骤104:若有效文本行相邻区的高度满足设定条件,识别图片为文本长图。
确定了图片中的有效文本行相邻区,还可以继续根据有效文本行相邻区的高度,来进一步判读图片是否为文本长图。
其中,可将图片中每个有效文本行相邻区的高度进行累加,得到行高和;然后,若行高和与图片的高度的比值大于第二预设值,确定图片为候选文本长图;从而,可从候选文本长图中识别出文本长图。
例如:第二预设值为0.35、0.4,或0.5中任一值,则可得到图片中全部的有效文本行相邻区的高度累加后的行高和,如上述,在100行的二值化的图片中,有效文本行相邻区的高度为20+30+19=69行像素的高度,这样,行高和与图片的高度的比值为0.69,大于第二预设值,确定图片为候选文本长图,从而,可从候选文本长图中识别出文本长图。
当然,本发明不限于此,还可以根据有效文本行相邻区的高度之间的差值,来判断图片是否为文本长图,具体可包括:根据每个有效文本行相邻区的高度,确定基准高度;确定每个有效文本行相邻区的高度与基准高度之间的相对差值;将每个相对差值与第三预设值进行比较,获得相对差值大于第三预设值的第一个数,以及相对差值小于或等于第三预设值的第二个数;若第一个数与第二个数的比值小于第四预设值时,确定图片为候选文本长图;从候选文本长图中识别出文本长图。
而根据每个有效文本行相邻区的高度,确定基准高度了包括:对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择一个有效文本行相邻区的高度为基准行高;或,对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择至少两个有效文本行相邻区的高度进行平均值运算,将运算后的平均值确定为基准高度。
例如:二值化后的图片包括100行,对第1-20行,第22-35行,第36-48行,第51-80行,以及第82-100行,根据有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择一个有效文本行相邻区的高度为基准行高,例如将第82-100行形成的有效文本行相邻区的高度19行像素高度确定为基准高度,然后,将第1-20行形成的有效文本行相邻区的高度,第22-35行形成的有效文本行相邻区的高度,第36-48行形成的有效文本行相邻区的高度,以及第51--80行形成的有效文本行相邻区的高度与19行像素高度进行相对差值的运算,并统计相对差值大于第三预设值的第一个数,以及相对差值小于或等于第三预设值的第二个数,例如:第一个数为1,而第二个数为3,第四预设值为0.5,这样,第一个数与第二个数的比值为0.33,小于第四预设值,从而,可确定图片为候选文本长图;从候选文本长图中识别出为文本长图。
这里,从候选文本长图中识别出为文本长图可包括:直接将候选文本长图识别为文本长图。
可见,本发明实施例中,根据发布的图片中每行的行像素值之后,确定图片中的有效文本行相邻区的高度,并当有效文本行相邻区的高度满足设定条件,可确定图片为文本长图,从而可根据图片的类型,可采用对应的降低流量耗费的处理,例如:向用户发送文本长图的提醒信息,这样用户可及时更改发表文字较多的文章的方式,或者在推荐数据流中对图片进行降频展现,减少对流量的耗费,提高发布内容被阅读的几率,进一步扩大信息的传播量。
因此,识别图片为文本长图之后,还包括:向发布终端发送文本长图的提醒信息。或者,在推荐数据流中对图片进行降频展现。或者,既向发布终端发送文本长图的提醒信息,又在推荐数据流中对图片进行降频展现。
在上述步骤104中,确定图片为候选文本长图,可直接将候选文本长图识别为文本长图。但是由于与表格类,评论类信息对应的图片可能也有有效文本行相邻区,且有效文本行相邻区的高度也满足设定条件,因此,为进一步识别文本长图的准确率,则将候选文本长图识别为文本长图可包括:对候选文本长图进行逐列扫描,确定每列像素的列像素值之和;将每列的列像素值之和与第五预设值进行比较;若各列像素值之和均大于等于第五预设值,确定候选文本长图为文本长图。
其中,第五预设值可根据应用场景确定,例如,图片高度值的1%或0.5%这样的较少值,由于没有列像素值之和小于第五预设值,即各列像素值之和均大于等于所述第五预设值,这样可以排除空白列,从而,可提高排除与表格类,评论类信息对应的图片的几率,提高了识别文本长图的准确率。
下面将操作流程集合到具体实施例中,举例说明本公开实施例提供的方法。
实施例一,图2是根据一示例性实施例一示出的图片类型识别的流程图,参见图2,本实施例中图片类型识别的过程包括:
步骤201:对发布的图片进行二值化,并逐行扫描二值化后的图片,确定每行像素的行像素值之和,将图片中行像素值之和大于第一预设值的像素行确定为候选文本行,并对所有相邻的候选文本行进行连接,形成对应的候选文本行相邻区。
同样,可采用大津算法将图片进行二值化分割,背景像素值为0,前景像素值为1。然后,逐行扫描二值化后的图片,将二值化后的图片每行像素值分别进行累加,得到每行像素的行像素值之和。
将图片中行像素值之和大于第一预设值的像素行确定为候选文本行;对所有相邻的候选文本行进行连接,形成候选文本行相邻区;
步骤202:根据每个候选文本行相邻区的高度,将高度在第一预设范围内的候选文本行相邻区确定为有效文本行相邻区。
将每个候选文本行相邻区的高度与第一预设范围进行比较;若当前候选文本行相邻区的高度在第一预设范围内,确定当前候选文本行相邻区为有效文本行相邻区。
步骤203:将图片中每个有效文本行相邻区的高度进行累加,得到行高和。
这里,可得到图片中全部的有效文本行相邻区的高度累加后的行高和。
步骤204:判断行高和与图片的高度的比值是否大于第二预设值?若是,执行步骤205,否则,流程结束。
第二预设值为0.35、0.4,或0.5中任一值。若行高和与图片的高度的比值为0.6,则大于第二预设值,执行步骤205。行高和与图片的高度的比值为0.2,则小于第二预设值,流程结束。
步骤205:确定图片为候选文本长图。
由于行高和与图片的高度的比值大于第二预设值,因此,可确定图片为候选文本长图。
步骤206:从候选文本长图中识别出文本长图。
这里,可直接将候选文本长图识别为文本长图。或者,还可对候选文本长图进行逐列扫描,确定每列像素的列像素值之和;将每列的列像素值之和与第五预设值进行比较;若各列像素值之和均大于等于第五预设值,确定候选文本长图为文本长图。从而,可提高排除与表格类,评论类信息对应的图片的几率,提高了识别文本长图的准确率。
步骤207:向发布终端发送文本长图的提醒信息。
当然,识别出图片为文本长图,则可通过向终端发送文本长图的提醒信息,来提示用户更改发表文字较多的文章的方式,从而提高发布内容被阅读的几率,进一步扩大信息的传播量。
可见,本实施中,根据发布的图片中每行的行像素值之后,确定图片中的有效文本行相邻区,并当有效文本行相邻区的高度满足设定条件,可确定图片为文本长图,从而,可提醒用户发布的是文本长图,这样用户可及时更改发表文字较多的文章的方式,减少对流量的耗费,提高发布内容被阅读的几率,进一步扩大信息的传播量。
实施例二,图3是根据一示例性实施例二示出的图片类型识别的流程图。参见图3,本实施例中图片类型识别的过程包括:
步骤301:对发布的图片进行二值化,并逐行扫描二值化后的图片,确定每行像素的行像素值之和,将图片中行像素值之和大于第一预设值的像素行确定为候选文本行,并对所有相邻的候选文本行进行连接,形成对应的候选文本行相邻区。
同样,可采用大津算法将图片进行二值化分割,背景像素值为0,前景像素值为1。然后,逐行扫描二值化后的图片,将二值化后的图片每行像素值分别进行累加,得到每行像素的行像素值之和。将图片中行像素值之和大于第一预设值的像素行确定为候选文本行;对所有相邻的候选文本行进行连接,形成候选文本行相邻区
步骤302:根据每个候选文本行相邻区的高度,将高度在第一预设范围内的候选文本行相邻区确定为有效文本行相邻区。
这里,将每个候选文本行相邻区的高度与第一预设范围进行比较;若当前候选文本行相邻区的高度在第一预设范围内,确定当前候选文本行相邻区为有效候选文本行相邻区。
步骤303:根据每个有效文本行相邻区的高度,确定基准高度。
这里,对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择一个有效文本行相邻区的高度为基准行高;或,对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择至少两个有效文本行相邻区的高度进行平均值运算,将运算后的平均值确定为基准行高。
步骤304:确定每个有效文本行相邻区的高度与基准高度之间的相对差值。
这里,进行差值运算,得到每个有效文本行相邻区的高度与基准高度之间的相对差值。
步骤305:将每个相对差值与第三预设值进行比较,获得相对差值大于第三预设值的第一个数,以及相对差值小于或等于第三预设值的第二个数。
可进行统计,得到第一个数与第二个数。第三预设值可根据具体应用环境进行设定。
步骤306:判断第一个数与第二个数的比值是否小于第四预设值?若是,执行步骤307,否则,流程结束。
第四预设值比较小,例如:0.1、0.2、0.3等等。第一个数与第二个数的比值比第四预设值小,则表明绝大部分的有效文本行的行高是标准的。
步骤307:确定图片为候选文本长图。
由于第一个数与第二个数的比值比第四预设值小,可确定图片为候选文本长图。
步骤308:从候选文本长图中识别出文本长图。
同样,可直接将候选文本长图识别为文本长图。或者,对候选文本长图进行逐列扫描,确定每列像素的列像素值之和;将每列的列像素值之和与第五预设值进行比较;若各列像素值之和均大于等于第五预设值,确定候选文本长图为文本长图。
步骤309:向发布终端发送文本长图的提醒信息,以及在推荐数据流中对图片进行降频展现。
这里,即可以提示用户更改发表文字较多的文章的方式,又可以进行降频处理,从而,减少对流量的耗费,并且可提高发布内容被阅读的几率,进一步扩大信息的传播量。
可见,本实施中,根据发布的图片中每行的行像素值之后,确定图片中的有效文本行相邻区,并当有效文本行相邻区的高度满足设定条件,可确定图片为文本长图,从而,可提醒用户发布的是文本长图,这样用户可及时更改发表文字较多的文章的方式,并可进行降频处理,从而,减少对流量的耗费,提高发布内容被阅读的几率,进一步扩大信息的传播量。
下述为本公开装置实施例,可以用于执行本公开方法实施例。
根据上述图片类型识别的过程,可构建一种图片类型识别的装置,如图4所示,该装置包括:包括:扫描处理单元410、连接单元420、确定单元430以及识别单元440,其中,
扫描处理单元410,用于对发布的图片进行二值化,并逐行扫描二值化后的图片,确定每行像素的行像素值之和。
连接单元420,用于将图片中行像素值之和大于第一预设值的像素行确定为候选文本行,并对所有相邻的候选文本行进行连接,形成对应的候选文本行相邻区。
确定单元430,用于根据每个候选文本行相邻区的高度,将高度在第一预设范围内的候选文本行相邻区确定为有效文本行相邻区。
识别单元440,用于若有效文本行的行高满足设定条件,识别图片为文本长图。
本发明实施例中,识别单元440,具体用于将图片中每个有效文本行相邻区的高度进行累加,得到行高和,若行高和与图片的高度的比值大于第二预设值,确定图片为候选文本长图,从候选文本长图中识别出文本长图。
本发明另一实施例中,识别单元440,具体用于根据每个有效文本行相邻区的高度,确定基准高度,确定每个有效文本行相邻区的高度与基准高度之间的相对差值,将每个相对差值与第三预设值进行比较,获得相对差值大于第三预设值的第一个数,以及相对差值小于或等于第三预设值的第二个数,若第一个数与第二个数的比值小于第四预设值时,确定图片为候选文本长图,从候选文本长图中识别出文本长图。
本发明实施例中,识别单元440,具体用于对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择一个有效文本行相邻区的高度为基准行高;或,对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择至少两个有效文本行相邻区的高度进行平均值运算,将运算后的平均值确定为基准行高。
本发明实施例中,识别单元440,还用于对候选文本长图进行逐列扫描,确定每列像素的列像素值之和,将每列的列像素值之和与第五预设值进行比较,若各列像素值之和均大于等于第五预设值,确定候选文本长图为文本长图。
本发明实施例中,装置还包括:提醒单元,用于向发布终端发送文本长图的提醒信息。
本发明实施例中,装置还包括:降频处理单元,用于在推荐数据流中对图片进行降频展现。
可见,根据发布的图片中每行的行像素值之后,确定图片中的有效文本行相邻区,并当有效文本行相邻区的高度满足设定条件,可确定图片为文本长图,从而,可提醒用户发布的是文本长图,这样用户可及时更改发表文字较多的文章的方式,或者进行降频处理,减少对流量的耗费,提高发布内容被阅读的几率,进一步扩大信息的传播量。
下面举例说明本公开实施例提供的装置。
实施例三,图5是根据一示例性实施例三示出的图片类型识别的装置结构图,参见图5,本实施例中,该装置包括:包括:扫描处理单元410、连接单元420、确定单元430以及识别单元440,还包括提醒单元450以及降频处理单元460。
具体地,扫描处理单元410对发布的图片进行二值化,并逐行扫描二值化后的图片,确定每行像素的行像素值之和。
连接单元450将图片中行像素值之和大于第一预设值的像素行确定为候选文本行,并对所有相邻的候选文本行进行连接,形成对应的候选文本行相邻区。这样,确定单元430根据每个候选文本行相邻区的高度,将高度在第一预设范围内的候选文本行相邻区确定为有效文本行相邻区。
从而,识别单元440可将图片中每个有效文本行相邻区的高度进行累加,得到行高和。当然,若确定单元440确定行高和与图片的高度的比值大于第二预设值时,确定图片为候选文本长图。并且,识别单元440可直接将候选文本长图识别为文本长图。或者,对候选文本长图进行逐列扫描,确定每列像素的列像素值之和;将每列的列像素值之和与第五预设值进行比较;若各列像素值之和均大于等于第五预设值,确定候选文本长图为文本长图。
而提醒单元450可向发布终端发送文本长图的提醒信息。同时,降频处理单元460在推荐数据流中对图片进行降频展现。从而,即可以提示用户更改发表文字较多的文章的方式,又可以进行降频处理,减少对流量的耗费,并且可提高发布内容被阅读的几率,进一步扩大信息的传播量。
可见,本实施中,根据发布的图片中每行的行像素值之后,确定图片中的有效文本行相邻区,并当有效文本行相邻区的高度满足设定条件,可确定图片为文本长图,从而,可提醒用户发布的是文本长图,这样用户可及时更改发表文字较多的文章的方式,并可进行降频处理,从而,减少对流量的耗费,提高发布内容被阅读的几率,进一步扩大信息的传播量。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种图片类型识别的方法,其特征在于,包括:
对发布的图片进行二值化,并逐行扫描二值化后的图片,确定每行像素的行像素值之和;
将所述图片中行像素值之和大于第一预设值的像素行确定为候选文本行,并对所有相邻的候选文本行进行连接,形成对应的候选文本行相邻区;
根据每个所述候选文本行相邻区的高度,将高度在第一预设范围内的候选文本行相邻区确定为有效文本行相邻区;
若所述有效文本行相邻区的高度满足设定条件,识别所述图片为文本长图。
2.如权利要求1所述的方法,其特征在于,所述若所述有效文本行相邻区的高度满足设定条件,识别所述图片为文本长图包括:
将所述图片中每个有效文本行相邻区的高度进行累加,得到行高和;
若所述行高和与所述图片的高度的比值大于第二预设值,确定所述图片为候选文本长图;
从所述候选文本长图中识别出文本长图。
3.如权利要求1所述的方法,其特征在于,所述若所述有效文本行相邻区的高度满足设定条件,识别所述图片为文本长图包括:
根据每个有效文本行相邻区的高度,确定基准高度;
确定每个有效文本行相邻区的高度与所述基准行高度之间的相对差值;
将每个相对差值与第三预设值进行比较,获得所述相对差值大于所述第三预设值的第一个数,以及所述相对差值小于或等于所述第三预设值的第二个数;
若所述第一个数与第二个数的比值小于第四预设值时,确定所述图片为候选文本长图;
从所述候选文本长图中识别出文本长图。
4.如权利要求3所述的方法,其特征在于,所述根据每个有效文本行相邻区的高度,确定基准高度包括:
对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择一个有效文本行相邻区的高度为基准高度;或,
对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择至少两个有效文本行相邻区的高度进行平均值运算,将运算后的平均值确定为基准高度。
5.如权利要求2或3所述的方法,其特征在于,所述从所述候选文本长图中识别出文本长图包括:
对所述候选文本长图进行逐列扫描,确定每列像素的列像素值之和;
将每列的列像素值之和与第五预设值进行比较;
若各列像素值之和均大于等于所述第五预设值,确定所述候选文本长图为文本长图。
6.一种图片类型识别装置,其特征在于,包括:
扫描处理单元,用于对发布的图片进行二值化,并逐行扫描二值化后的图片,确定每行像素的行像素值之和;
连接单元,用于将所述图片中行像素值之和大于第一预设值的像素行确定为候选文本行,并对所有相邻的候选文本行进行连接,形成对应的候选文本行相邻区;
确定单元,用于根据每个所述候选文本行相邻区的高度,将高度在第一预设范围内的候选文本行相邻区确定为有效文本行相邻区;
识别单元,用于若所述有效文本行相邻区的高度满足设定条件,识别所述图片为文本长图。
7.如权利要求6所述的装置,其特征在于,
所述识别单元,具体用于将所述图片中每个有效文本行相邻区的高度进行累加,得到行高和,若所述行高和与所述图片的高度的比值大于第二预设值,确定所述图片为候选文本长图,从所述候选文本长图中识别出文本长图。
8.如权利要求6所述的装置,其特征在于,
所述识别单元,具体用于根据每个有效文本行相邻区的高度,确定基准高度,确定每个有效文本行相邻区的高度与所述基准高度之间的相对差值,将每个相对差值与第三预设值进行比较,获得所述相对差值大于所述第三预设值的第一个数,以及所述相对差值小于或等于所述第三预设值的第二个数,若所述第一个数与第二个数的比值小于第四预设值时,确定所述图片为候选文本长图,从所述候选文本长图中识别出文本长图。
9.如权利要求8所述的装置,其特征在于,
所述识别单元,具体用于对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择一个有效文本行相邻区的高度为基准高度;或,对各有效文本行相邻区的高度进行排序,从排在中间的有效文本行相邻区的高度中选择至少两个有效文本行相邻区的高度进行平均值运算,将运算后的平均值确定为基准高度。
10.如权利要求7或8所述的装置,其特征在于,
所述识别单元,还用于对所述候选文本长图进行逐列扫描,确定每列像素的列像素值之和,将每列的列像素值之和与第五预设值进行比较,若各列像素值之和均大于等于所述第五预设值,确定所述候选文本长图为文本长图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610429025.2A CN106127116B (zh) | 2016-06-16 | 2016-06-16 | 一种图片类型识别的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610429025.2A CN106127116B (zh) | 2016-06-16 | 2016-06-16 | 一种图片类型识别的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106127116A true CN106127116A (zh) | 2016-11-16 |
CN106127116B CN106127116B (zh) | 2019-05-28 |
Family
ID=57470764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610429025.2A Active CN106127116B (zh) | 2016-06-16 | 2016-06-16 | 一种图片类型识别的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106127116B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447973A (zh) * | 2018-10-31 | 2019-03-08 | 腾讯科技(深圳)有限公司 | 一种结肠息肉图像的处理方法和装置及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1941961A (zh) * | 2006-10-13 | 2007-04-04 | 康佳集团股份有限公司 | 一种嵌入式终端中的图片处理方法 |
CN101578597A (zh) * | 2007-01-15 | 2009-11-11 | 微软公司 | 转换文本 |
CN101789131A (zh) * | 2009-01-21 | 2010-07-28 | 施昊 | 可输入图表的网络编辑器及网络信息输入编辑系统 |
JP2011118832A (ja) * | 2009-12-07 | 2011-06-16 | Toyota Central R&D Labs Inc | 画像特徴抽出装置、画像処理装置、及びプログラム |
CN102184265A (zh) * | 2011-06-17 | 2011-09-14 | 上海高清数字科技产业有限公司 | 电子报纸数据转换方法 |
CN102929912A (zh) * | 2012-09-10 | 2013-02-13 | 新浪网技术(中国)有限公司 | 生成微博图片的方法及系统 |
KR20150018039A (ko) * | 2013-08-08 | 2015-02-23 | 주식회사 인프라웨어 | 온라인 상에서의 이미지를 이용한 인증방법 및 장치 |
-
2016
- 2016-06-16 CN CN201610429025.2A patent/CN106127116B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1941961A (zh) * | 2006-10-13 | 2007-04-04 | 康佳集团股份有限公司 | 一种嵌入式终端中的图片处理方法 |
CN101578597A (zh) * | 2007-01-15 | 2009-11-11 | 微软公司 | 转换文本 |
CN101789131A (zh) * | 2009-01-21 | 2010-07-28 | 施昊 | 可输入图表的网络编辑器及网络信息输入编辑系统 |
JP2011118832A (ja) * | 2009-12-07 | 2011-06-16 | Toyota Central R&D Labs Inc | 画像特徴抽出装置、画像処理装置、及びプログラム |
CN102184265A (zh) * | 2011-06-17 | 2011-09-14 | 上海高清数字科技产业有限公司 | 电子报纸数据转换方法 |
CN102929912A (zh) * | 2012-09-10 | 2013-02-13 | 新浪网技术(中国)有限公司 | 生成微博图片的方法及系统 |
KR20150018039A (ko) * | 2013-08-08 | 2015-02-23 | 주식회사 인프라웨어 | 온라인 상에서의 이미지를 이용한 인증방법 및 장치 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447973A (zh) * | 2018-10-31 | 2019-03-08 | 腾讯科技(深圳)有限公司 | 一种结肠息肉图像的处理方法和装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106127116B (zh) | 2019-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2843529B1 (en) | Method for providing information based on contents and electronic device thereof | |
RU2645276C2 (ru) | Создание вариаций при преобразовании данных в потребляемый контент | |
US9208216B2 (en) | Transforming data into consumable content | |
US10489839B2 (en) | Information presentation method and information presentation apparatus | |
US11269950B2 (en) | Analysis for framework assessment | |
KR102248823B1 (ko) | 데이터 시각화 서비스 시스템, 방법 및 어플리케이션 | |
CN105786207A (zh) | 信息输入方法和装置 | |
JP2021120867A (ja) | 融合関係ネットワークの構築方法、融合関係ネットワークの構築装置、電子デバイス、記憶媒体及びプログラム | |
CN112764857A (zh) | 信息处理方法、装置及电子设备 | |
CN113553123B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN105260459A (zh) | 搜索方法和装置 | |
CN106127116A (zh) | 一种图片类型识别的方法和装置 | |
US20160026613A1 (en) | Processing image to identify object for insertion into document | |
CN104281562A (zh) | 一种电子文档的处理方法及装置 | |
CN109408647B (zh) | 用于处理信息的方法和装置 | |
CN111817944A (zh) | 图片分享的方法、装置及电子设备 | |
CN112256175B (zh) | 文字显示方法、装置、电子设备及计算机可读存储介质 | |
CN114742013A (zh) | 在线文档展示方法、装置和电子设备 | |
CN111063036B (zh) | 基于路径规划的三维文字排布方法、介质、设备及系统 | |
CN111797591B (zh) | 版面恢复方法、装置和电子设备 | |
CN112492381B (zh) | 信息显示方法、装置及电子设备 | |
KR102028553B1 (ko) | 콘텐츠 표시 형태의 싱크 방법 및 컴퓨터 판독가능 기록매체 | |
JP6586857B2 (ja) | 情報処理装置及び情報処理プログラム | |
Brosch et al. | Content generation for 3D video/TV | |
CN117436428A (zh) | 文档页面的展示方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230412 Address after: Room 501-502, 5/F, Sina Headquarters Scientific Research Building, Block N-1 and N-2, Zhongguancun Software Park, Dongbei Wangxi Road, Haidian District, Beijing, 100193 Patentee after: Sina Technology (China) Co.,Ltd. Address before: 100080, International Building, No. 58 West Fourth Ring Road, Haidian District, Beijing, 20 floor Patentee before: Sina.com Technology (China) Co.,Ltd. |
|
TR01 | Transfer of patent right |