CN112131376A - 一种审核方法及装置 - Google Patents
一种审核方法及装置 Download PDFInfo
- Publication number
- CN112131376A CN112131376A CN201910550202.6A CN201910550202A CN112131376A CN 112131376 A CN112131376 A CN 112131376A CN 201910550202 A CN201910550202 A CN 201910550202A CN 112131376 A CN112131376 A CN 112131376A
- Authority
- CN
- China
- Prior art keywords
- information
- picture
- article
- module
- picture information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 53
- 238000013441 quality evaluation Methods 0.000 claims abstract description 11
- 230000010365 information processing Effects 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000003912 environmental pollution Methods 0.000 abstract description 4
- 238000012550 audit Methods 0.000 description 18
- 238000012795 verification Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000003086 colorant Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种审核方法及装置,包括获取待审核的文章信息;对所述文章信息进行算法处理,获得该文章的质量评价信息并标注显示。本发明一种审核方法结构简化、加工方便、生产效率提高、产品收率提高。电子化的审核方式,能够减少纸质化办公所带来的环境污染。
Description
技术领域
本发明实施例涉及互联网技术领域,具体涉及一种审核方法及装置。
背景技术
随着互联网技术的快速发展,人们对信息的关注方式也发生了改变。人们可以通过各种终端浏览各种各样的信息,文字信息、图片信息、视频信息等。但这些信息中往往也存在大量的不良文字、图片信息,这就需要对这些不良信息进行过滤。
在现有技术中,该类审核大多为单纯的人工审核,这样会给审核带来以下多种问题:大量的文字内容使得审核人员无从着手、审核标准因人而异,给安全播控带来风险、低成本高效率的要求并不能共同实现,效率的降低会直接影响文章的时效性。
发明内容
为此,本发明实施例提供一种审核方法及装置,以解决现有技术中由于审核内容较多而导致的审核效率低及人工审核标准不一而导致的播控风险问题。
为了实现上述目的,本发明实施例提供如下技术方案:
根据本发明实施例的第一方面提供一种审核方法,包括:
获取待审核的文章信息;
对所述文章信息进行算法处理,获得该文章的质量评价信息并标注显示。
进一步地,所述文章信息包括文字信息;当审核文字信息时,将所述文字信息与预先存储的类黑词进行比对算法处理,若所述文字信息包括类黑词,则将所述类黑词进行标注显示;
若所述文字信息不包括类黑词,则将所述文章信息保存至待分配库。
进一步地,当待审核的文章信息为图片信息时,包括:
将所述图片信息进行图像算法处理;
对处理后的图片信息按照预设要求进行判断;若所述图片信息符合要求,则将所述文章信息保存至待分配库;若所述图片信息不符合要求,则对所述图片信息不符合要求的相应部分进行标注显示。
进一步地,所述方法还包括获取所述图片信息的存储路径信息;若所述路
径信息为该图片的预设路径信息,则将所述文章信息保存至待分配库。
进一步地,算法处理包括如下步骤:
对所述图片信息进行图像预处理;
对预处理后的图片信息进行特征提取;
对所述特征信息进行分析判断,若符合预设要求,则将所述所述图片信息所在的文章信息保存至待分配库;若不符合预设要求,则对所述图片信息不符合要求的相应部分进行标注显示。
进一步地,所述特征包括文字信息特征和图像信息特征。
本发明的另一方面还提供一种审核装置,其特征在于,包括:获取模块、处理模块;其中,所述获取模块用于获取待审核的文章信息;所述处理模块用于对所述文章信息进行算法处理,获得该文章的质量评价信息并标注显示。
进一步地,所述处理模块包括文字处理模块;其中,所述文字处理模块包括文字信息比对模块、存储模块;所述文字信息比对模块用于当审核文字信息时,将所述文字信息与预先存储的类黑词进行比对算法处理,若所述文字信息包括类黑词,则将所述类黑词进行标注显示;所述存储模块用于若所述文字信息不包括类黑词,则将所述文章信息保存至待分配库。
进一步地,所述处理模块包括图片信息处理模块;所述图片信息处理模块包括预处理模块、判断模块;所述预处理模块用于将所述图片信息进行图像算法处理;所述判断模块用于对处理后的图片信息按照预设要求进行判断;若所述图片信息符合要求,则将所述文章信息保存至待分配库;若所述图片信息不符合要求,则对所述图片信息不符合要求的相应部分进行标注显示。
进一步地,所述装置还包括路径信息处理模块,用于获取所述图片信息的存储路径信息;若所述路径信息为该图片的预设路径信息,则将所述文章信息保存至待分配库。
本发明实施例具有如下优点:
本发明提供的一种审核方法,利用计算机技术,通过对获取的待审核文章采用算法处理,大大简化了审核流程,使得审核结构简化、提高文章审核效率。电子化的审核方式,能够减少纸质化办公所带来的环境污染。
进一步地,本发明对待审核的文章中的文字信息和图片信息,使用计算机技术分别采用特定的算法,对待审核文章进行审核,不用人工逐字逐句去审核或者逐个图片进行审核,大大提高了审核的效率,且采用标注方式对不符合审核标准的文字或图片进行标注,查看方便,效率高。
进一步地,本发明对图片的来源和存储路径进行分析,便于查出不符合要求的图片信息,提高了审核的自动化程度,提高了审核效率。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。
图1为本发明实施例1提供的一种审核方法流程框图;
图2为本发明实施例2提供的一种审核方法的优选实现方式的流程框图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1为本发明实施例1提供的一种审核方法流程框图,包括:
获取待审核的文章信息;
对所述文章信息进行算法处理,获得该文章的质量评价信息并标注显示。
上述文章信息可以是广告信息,可以是海报宣传信息,还可以是各种终端上推送的阅读信息等。
上述文章信息可以是文字信息,也可以是图像信息。上述文章的质量评价信息可以是文字评价信息,例如,敏感词、类黑词、黑词,等等。也可以是采用不同颜色标注表示不同程度的评价信息等。标注显示可以采用气泡形式标注、方框形式标注等等。
当上述文章信息为文字信息时,执行如下操作步骤:
获取待审核的文字信息;
将所述文字信息与预先存储的类黑词、黑词或敏感词等词语进行比对算法处理;
判断进行算法处理后的文字信息中是否包括黑词、类黑词、敏感词;
若所述文字信息不包括类黑词、敏感词、黑词,则将所述文章保存至待分配库;若所述文字信息包括黑词、敏感词、类黑词,则将其进行标注。
上述比对算法属于计算机技术领域的现有技术,在此不做赘述。
当待审核的文章信息为图片信息时,则进行如下操作步骤:
将所述图片信息进行图像算法处理;
对处理后的图片信息按照预设要求进行判断;
若所述图片信息符合要求,则将所述文章信息保存至待分配库;若所述图片信息不符合要求,则对所述图片信息不符合要求的相应部分进行标注显示。
具体的,将所述图片信息进行图像算法处理包括如下步骤:
对所述图片信息进行图像预处理;
对预处理后的图片信息进行特征提取;
对所述特征信息进行分析判断,若符合预设要求,则将所述所述图片信息所在的文章信息保存至待分配库;若不符合预设要求,则对所述图片信息不符合要求的相应部分进行标注显示。
上述特征包括文字信息特征和图像信息特征。
本发明可选实施方式还包括,获取所述图片信息的存储路径信息;若所述路径信息为该图片的预设路径信息,则将所述文章信息保存至待分配库。
具体的,从图片来源进行检测,检测图片路径是否正确,若存在路径不正确的图片,系统会建议审核员将文章进行不通过处理,结束审核流程。若图片路径全部正确,下一步进行内容审核,其中含有图片内容审核、敏感词、审核类黑词检测。
上述不符合预设的要求可理解为,当文字信息属于黑词、敏感词时,则采用气泡或方框等不同标注形式将该文字信息进行标注,标注可采用不同的颜色。当图像信息中包括敏感图片信息、涉黄信息、血腥的图片信息时,则将该图像信息进行标注显示。
参见图2是本发明实施例2提供的一种审核方法的优选的实施方式流程框图,包括:
先对采集的待审核文章中的类黑词进行获取;
将类黑词与预先存储的黑词进行对比检测,判断类黑词是否属于黑词;若属于黑词,则检测不通过;若不属于,则检测通过;
获取文章中的图片信息内容的下载路径,若图片路径正确,则对图片中的内容进行提取;其中,所述图片内容包括文字内容和图像内容;
分别采用对比算法对图片中的文字信息进行处理、采用图像处理算法对图片中的图像信息进行处理,若其中任何一个不符合预设的要求,则检测都不通过,都可将对应的信息进行标注显示。
上述其中任何一个不符合预设的要求可理解为,当文字信息属于黑词、敏感词时,则采用气泡或方框等不同标注形式将该文字信息进行标注,标注可采用不同的颜色。当图像信息中包括敏感图片信息、涉黄信息或、血腥的图片信息时,则将该图像信息进行标注显示。
本发明提供的一种审核方法,利用计算机技术,通过对获取的待审核文章采用算法处理,大大简化了审核流程,使得审核结构简化、提高文章审核效率。电子化的审核方式,能够减少纸质化办公所带来的环境污染。
进一步地,本发明对待审核的文章中的文字信息和图片信息,使用计算机技术分别采用特定的算法,对待审核文章进行审核,不用人工逐字逐句去审核或者逐个图片进行审核,大大提高了审核的效率,且采用标注方式对不符合审核标准的文字或图片进行标注,查看方便,效率高。
进一步地,本发明对图片的来源和存储路径进行分析,便于查出不符合要求的图片信息,提高了审核的自动化程度,提高了审核效率。
本发明的另一方面还提供一种审核装置,包括,获取模块、处理模块;其中,所述获取模块用于获取待审核的文章信息;所述处理模块用于对所述文章信息进行算法处理,获得该文章的质量评价信息并标注显示。
进一步地,所述处理模块包括文字处理模块;其中,所述文字处理模块包括文字信息比对模块、存储模块;所述文字信息比对模块用于当审核文字信息时,将所述文字信息与预先存储的类黑词进行比对算法处理,若所述文字信息包括类黑词,则将所述类黑词进行标注显示;所述存储模块用于若所述文字信息不包括类黑词,则将所述文章信息保存至待分配库。
进一步地,所述处理模块包括图片信息处理模块;所述图片信息处理模块包括预处理模块、判断模块;所述预处理模块用于将所述图片信息进行图像算法处理;所述判断模块用于对处理后的图片信息按照预设要求进行判断;若所述图片信息符合要求,则将所述文章信息保存至待分配库;若所述图片信息不符合要求,则对所述图片信息不符合要求的相应部分进行标注显示。
进一步地,所述装置还包括路径信息处理模块,用于获取所述图片信息的存储路径信息;若所述路径信息为该图片的预设路径信息,则将所述文章信息保存至待分配库。
本发明提供的一种审核装置,该装置利用计算机技术,通过处理模块对由获取模块获取的待审核文章采用算法处理,大大简化了审核流程,使得审核结构简化、提高文章审核效率。电子化的审核方式,能够减少纸质化办公所带来的环境污染。
进一步地,本发明该处理模块包括文字处理模块和图片信息处理模块,采用文字处理模块对待审核的文章中的文字信息进行算法处理,采用图片信息处理模块对文章中的图片信息进行处理,即本发明使用计算机技术分别采用特定的算法,对待审核文章进行审核,不用人工逐字逐句去审核或者逐个图片进行审核,大大提高了审核的效率,且采用标注方式对不符合审核标准的文字或图片进行标注,查看方便,效率高。
进一步地,本发明所述装置还包括路径信息处理模块,该模块对图片的来源和存储路径进行分析,便于查出不符合要求的图片信息,提高了审核的自动化程度,提高了审核效率。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (10)
1.一种审核方法,包括:
获取待审核的文章信息;
对所述文章信息进行算法处理,获得该文章的质量评价信息并标注显示。
2.根据权利要求1所述的方法,其特征在于,所述文章信息包括文字信息;当审核文字信息时,将所述文字信息与预先存储的类黑词进行比对算法处理,若所述文字信息包括类黑词,则将所述类黑词进行标注显示;
若所述文字信息不包括类黑词,则将所述文章信息保存至待分配库。
3.根据权利要求1所述的方法,其特征在于,所述文章信息包括图片信息;当待审核的文章信息为图片信息时,包括:
将所述图片信息进行图像算法处理;
对处理后的图片信息按照预设要求进行判断;若所述图片信息符合要求,则将所述文章信息保存至待分配库;若所述图片信息不符合要求,则对所述图片信息不符合要求的相应部分进行标注显示。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括获取所述图片信息的存储路径信息;若所述路径信息为该图片的预设路径信息,则将所述文章信息保存至待分配库。
5.根据权利要求3所述的方法,其特征在于,将所述图片信息进行图像算法处理包括如下步骤:
对所述图片信息进行图像预处理;
对预处理后的图片信息进行特征信息提取;
对所述特征信息进行分析判断,若符合预设要求,则将所述所述图片信息所在的文章信息保存至待分配库;若不符合预设要求,则对所述图片信息不符合要求的相应部分进行标注显示。
6.根据权利要求5所述的方法,其特征在于,所述特征信息包括文字信息特征和图像信息特征。
7.一种审核装置,其特征在于,包括,获取模块、处理模块;其中,所述获取模块用于获取待审核的文章信息;所述处理模块用于对所述文章信息进行算法处理,获得该文章的质量评价信息并标注显示。
8.根据权利要求7所述的装置,其特征在于,所述处理模块包括文字处理模块;其中,所述文字处理模块包括文字信息比对模块、存储模块;所述文字信息比对模块用于当审核文字信息时,将所述文字信息与预先存储的类黑词进行比对算法处理,若所述文字信息包括类黑词,则将所述类黑词进行标注显示;所述存储模块用于若所述文字信息不包括类黑词,则将所述文章信息保存至待分配库。
9.根据权利要求7所述的装置,其特征在于,所述处理模块包括图片信息处理模块;所述图片信息处理模块包括预处理模块、判断模块;所述预处理模块用于将所述图片信息进行图像算法处理;所述判断模块用于对处理后的图片信息按照预设要求进行判断;若所述图片信息符合要求,则将所述文章信息保存至待分配库;若所述图片信息不符合要求,则对所述图片信息不符合要求的相应部分进行标注显示。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括路径信息处理模块,用于获取所述图片信息的存储路径信息;若所述路径信息为该图片的预设路径信息,则将所述文章信息保存至待分配库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910550202.6A CN112131376A (zh) | 2019-06-24 | 2019-06-24 | 一种审核方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910550202.6A CN112131376A (zh) | 2019-06-24 | 2019-06-24 | 一种审核方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112131376A true CN112131376A (zh) | 2020-12-25 |
Family
ID=73849051
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910550202.6A Pending CN112131376A (zh) | 2019-06-24 | 2019-06-24 | 一种审核方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112131376A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902675A (zh) * | 2011-07-26 | 2013-01-30 | 腾讯科技(深圳)有限公司 | 图片内容审核方法和装置 |
CN105654057A (zh) * | 2015-12-31 | 2016-06-08 | 中国建设银行股份有限公司 | 基于图片内容的图片审核系统及图片审核方法 |
CN107832765A (zh) * | 2017-09-13 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 对包括文字内容和图像内容的图片识别 |
CN107977423A (zh) * | 2017-11-27 | 2018-05-01 | 厦门二五八网络科技集团股份有限公司 | 基于含有违法词的互联网文章自动过滤处理方法及系统 |
CN109446837A (zh) * | 2018-10-12 | 2019-03-08 | 深圳前海微众银行股份有限公司 | 基于敏感信息的文本审核方法、设备及可读存储介质 |
-
2019
- 2019-06-24 CN CN201910550202.6A patent/CN112131376A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902675A (zh) * | 2011-07-26 | 2013-01-30 | 腾讯科技(深圳)有限公司 | 图片内容审核方法和装置 |
CN105654057A (zh) * | 2015-12-31 | 2016-06-08 | 中国建设银行股份有限公司 | 基于图片内容的图片审核系统及图片审核方法 |
CN107832765A (zh) * | 2017-09-13 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 对包括文字内容和图像内容的图片识别 |
CN107977423A (zh) * | 2017-11-27 | 2018-05-01 | 厦门二五八网络科技集团股份有限公司 | 基于含有违法词的互联网文章自动过滤处理方法及系统 |
CN109446837A (zh) * | 2018-10-12 | 2019-03-08 | 深圳前海微众银行股份有限公司 | 基于敏感信息的文本审核方法、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107016387B (zh) | 一种识别标签的方法及装置 | |
CN111460183B (zh) | 多媒体文件生成方法和装置、存储介质、电子设备 | |
US7403657B2 (en) | Method and apparatus for character string search in image | |
CA2917256C (en) | Screenshot-based e-commerce | |
TW201413602A (zh) | 基於行動終端的標誌識別處理方法和系統 | |
CN103530594A (zh) | 一种提供增强现实的方法、系统及终端 | |
KR102002024B1 (ko) | 객체 라벨링 처리 방법 및 객체 관리 서버 | |
US9177199B2 (en) | Semantic magazine pages | |
CN110874534B (zh) | 数据处理方法和数据处理装置 | |
CN111241330B (zh) | 一种商品图片的审核方法、装置 | |
CN112131376A (zh) | 一种审核方法及装置 | |
CN110633251B (zh) | 一种文件转换方法及设备 | |
CN113762235A (zh) | 检测页面叠加区域的方法和装置 | |
CN111797830A (zh) | 票据图像快速红章检测方法、系统、装置 | |
CN114461835A (zh) | 图片处理方法及装置、计算机可读存储介质和电子设备 | |
CN114254138A (zh) | 多媒体资源分类方法、装置、电子设备和存储介质 | |
CN114418951A (zh) | 一种焊盘检测方法、装置、计算机设备及存储介质 | |
CN114090630A (zh) | 基于分布式微服务集群商品数据整合方法 | |
CN113343663A (zh) | 一种票据结构化方法及装置 | |
CN115129914A (zh) | 图文数据处理方法、装置、电子设备及计算机存储介质 | |
CN111062377A (zh) | 一种题号检测方法、系统、存储介质及电子设备 | |
CN111950356A (zh) | 印章文本定位方法、装置及电子设备 | |
CN112015999A (zh) | 风险提示方法、信息提示方法、计算机设备、存储介质 | |
CN111708902A (zh) | 一种多媒体数据采集方法 | |
CN113474786A (zh) | 电子签购单识别方法、装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |