CN110222523A - 检测方法、装置、系统及计算机可读存储介质 - Google Patents

检测方法、装置、系统及计算机可读存储介质 Download PDF

Info

Publication number
CN110222523A
CN110222523A CN201910562232.9A CN201910562232A CN110222523A CN 110222523 A CN110222523 A CN 110222523A CN 201910562232 A CN201910562232 A CN 201910562232A CN 110222523 A CN110222523 A CN 110222523A
Authority
CN
China
Prior art keywords
testing data
server
data
text
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910562232.9A
Other languages
English (en)
Other versions
CN110222523B (zh
Inventor
刘冬
李燕爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinhuanet Beijing Technology Co ltd
Original Assignee
Xinhuanet Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinhuanet Beijing Technology Co ltd filed Critical Xinhuanet Beijing Technology Co ltd
Priority to CN201910562232.9A priority Critical patent/CN110222523B/zh
Publication of CN110222523A publication Critical patent/CN110222523A/zh
Application granted granted Critical
Publication of CN110222523B publication Critical patent/CN110222523B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/604Tools and structures for managing or administering access control systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请实施例提供了一种检测方法、装置、系统及计算机可读存储介质,该方法包括:接收待测数据,并确定待测数据的数据类型;若待测数据的数据类型为文本或图像,根据文本或图像进行数据安全性检测,确定待测数据的安全信息;若待测数据的数据类型为视频,对视频进行关键帧提取以及语音识别,并根据提取到的关键帧图像和语音识别出的文本信息进行数据安全性检测,确定待测数据的安全信息。该方法实现了对待测数据的实时检测,或者对已经发布的待测数据的检测,大幅度降低了对待测数据进行安全检测的实施难度,提升了安全检测的工作效率。

Description

检测方法、装置、系统及计算机可读存储介质
技术领域
本申请涉及计算机技术领域,具体而言,本申请涉及一种检测方法、装置、系统及计算机可读存储介质。
背景技术
互联网的快速发展给人们带来更多选择和便利的同时,也带来了许多潜在的不安全因素。比如对于媒体工作者而言,在创作发布内容时,包括文字、图片、视频等内容,如何有效规避一些敏感词、敏感人物图片、敏感事件和内容,如何智能、快速的找到问题出处,为媒体工作者提供一个更高效的工作环境;另外纸媒、传媒机构等的已发布服务器,有大量的已发布稿源数据,由于特殊原因,以前安全的内容,现在可能就是有问题的,如何在大量的数据里找出问题稿源,给出问题稿源的位置、问题,解决传媒机构的难题。
发明内容
本申请针对现有的方式的缺点,提出一种检测方法、装置、设备及计算机可读存储介质,用以解决如何实现对待测数据进行实时检测,或者对已经发布的待测数据进行检测的问题。
第一方面,本申请提供了一种检测方法,应用于第一服务器,包括:
接收待测数据,并确定待测数据的数据类型;
若待测数据的数据类型为文本或图像,根据文本或图像进行数据安全性检测,确定待测数据的安全信息;
若待测数据的数据类型为视频,对视频进行关键帧提取以及语音识别,并根据提取到的关键帧图像和语音识别出的文本信息进行数据安全性检测,确定待测数据的安全信息。
第二方面,本申请提供了一种检测方法,应用于浏览器插件,包括:
根据预定的路径,确定待测数据,所述的路径包括待测数据所在网页对应的网址;
发送待测数据给第一服务器,以用于第一服务器对待测数据进行数据安全性检测。
第三方面,本申请提供了一种检测方法,应用于第二服务器,包括:
通过预设的检测模块对第二服务器的目录进行遍历,确定目录对应的待测数据,第二服务器为流媒体发布服务器,目录包括待测数据对应的储存地址;
发送待测数据给第一服务器,以用于第一服务器检测待测数据的安全性。
第四方面,本申请提供了一种检测装置,应用于第一服务器,其特征在于,包括:
第一处理模块,用于接收待测数据,并确定待测数据的数据类型;
第二处理模块,用于若待测数据的数据类型为文本或图像,根据文本或图像进行数据安全性检测,确定待测数据的安全信息;
第三处理模块,用于若待测数据的数据类型为视频,对视频进行关键帧提取以及语音识别,并根据提取到的关键帧图像和语音识别出的文本信息进行数据安全性检测,确定待测数据的安全信息。
第五方面,本申请提供了一种检测装置,应用于浏览器插件,其特征在于,包括:
第四处理模块,用于根据预定的路径,确定待测数据,所述预定的路径包括待测数据所在网页对应的网址;
第五处理模块,用于发送待测数据给第一服务器,以用于第一服务器对待测数据进行数据安全性检测。
第六方面,本申请提供了一种检测装置,应用于第二服务器,其特征在于,包括:
第六处理模块,用于通过预设的检测模块对第二服务器的目录进行遍历,确定目录对应的待测第一数据,第二服务器为流媒体发布服务器,目录包括待测第一数据对应的储存地址;
第七处理模块,用于发送待测数据给第一服务器,以用于第一服务器检测待测数据的安全性。
第七方面,本申请提供了一种检测系统,其特征在于,包括:第一服务器和SaaS服务器;
第一服务器,用于接收待测数据,并确定待测数据的数据类型;若待测数据的数据类型为文本或图像,根据文本或图像进行数据安全性检测,确定待测数据的安全信息;若待测数据的数据类型为视频,对视频进行关键帧提取以及语音识别,并根据提取到的关键帧图像和语音识别出的文本信息进行数据安全性检测,确定待测数据的安全信息;
SaaS服务器,用于更新文本敏感信息库,得到文本敏感信息库的最新版本;将文本敏感信息库的最新版本发送给第一服务器。
第八方面,本申请提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被用于执行本申请第一方面、第二方面和第三方面的检测方法。
本申请实施例提供的技术方案,至少具有如下有益效果:
接收待测数据,并确定待测数据的数据类型;若待测数据的数据类型为文本或图像,根据文本或图像进行数据安全性检测,确定待测数据的安全信息;若待测数据的数据类型为视频,对视频进行关键帧提取以及语音识别,并根据提取到的关键帧图像和语音识别出的文本信息进行数据安全性检测,确定待测数据的安全信息;如此,实现了将待测数据分类为文本、图像和视频,对文本、图像和视频进行实时检测,或者对已经发布的文本、图像和视频进行检测,确定文本、图像和视频的安全信息,大幅度降低了对待测数据进行安全检测的实施难度,提升了安全检测的工作效率。
本申请附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种检测方法的流程示意图;
图2为本申请实施例提供的一种检测系统的结构示意图;
图3为本申请实施例提供的另一种检测方法的流程示意图;
图4为本申请实施例提供的局域网内基于浏览器插件的数据安全检测的结构示意图;
图5为本申请实施例提供的又一种检测方法的流程示意图;
图6为本申请实施例提供的局域网内对服务器发布区的数据安全检测的结构示意图;
图7为本申请实施例提供的公网上对服务器发布区的数据安全检测的结构示意图;
图8为本申请实施例提供的又一种检测方法的流程示意图;
图9为本申请实施例提供的又一种检测方法的流程示意图;
图10本申请实施例提供的一种检测装置的结构示意图;
图11为本申请实施例提供的另一种检测装置的结构示意图;
图12为本申请实施例提供的又一种检测装置的结构示意图;
图13为本申请实施例提供的一种检测系统的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
实施例一
本申请实施例中提供了一种检测方法,应用于第一服务器,该方法的流程示意图如图1所示,该方法包括:
S101,接收待测数据,并确定待测数据的数据类型。
S102,若待测数据的数据类型为文本或图像,根据文本或图像进行数据安全性检测,确定待测数据的安全信息。
S103,若待测数据的数据类型为视频,对视频进行关键帧提取以及语音识别,并根据提取到的关键帧图像和语音识别出的文本信息进行数据安全性检测,确定待测数据的安全信息。
本申请实施例中,接收待测数据,并确定待测数据的数据类型;若待测数据的数据类型为文本或图像,根据文本或图像进行数据安全性检测,确定待测数据的安全信息;若待测数据的数据类型为视频,对视频进行关键帧提取以及语音识别,并根据提取到的关键帧图像和语音识别出的文本信息进行数据安全性检测,确定待测数据的安全信息;如此,实现了将待测数据分类为文本、图像和视频,对文本、图像和视频进行实时检测,或者对已经发布的文本、图像和视频进行检测,确定文本、图像和视频的安全信息,大幅度降低了对待测数据进行安全检测的实施难度,提升了安全检测的工作效率。
可选地,第一服务器为图2中所示的安全设备101,图2中包括安全设备(内容安全检测设备)101和云端SaaS服务器110,安全设备101可以为刀片式服务器或者塔式服务器。安全设备101包含内容安全算法程序102、文本审核检测模块103、图像审核检测模块104、视频关键帧提取模块105、视频语音识别文本模块106、文本敏感(词)信息库107、图像深度学习训练库108和爬虫程序109。安全设备101收到转发来的内容,如果是文本,则提交到文本检测模块103和文本敏感信息库107进行安全检查,后经由内容安全算法程序102判断是否安全;如果是图像,则提交到图像审核检测模块104后经由内容安全算法程序102判断是否安全;如果是视频,则先通过视频关键帧提取模块105、视频语音识别文本模块106后,将提取的关键帧图像和和文本转发到图像审核检测模块104和文本审核检测模块103去判断视频是否安全。图像审核检测模块104是图像深度学习训练库108所确定的图像检测模型,并通过云端SaaS服务器110更新,文本敏感信息库107也是通过部署在SaaS服务器110上的敏感信息库的更新服务进行更新。
可选地,在确定待测数据的安全信息之后,该方法还包括:
当检测到待测数据存在不安全的数据,发送检测结果给相应终端,以使得检测结果在终端上以浏览器插件弹出的方式进行显示。
可选地,根据文本或图像进行数据安全性检测,确定待测数据的安全信息,包括:
当待测数据为文本,根据文本、预置的文本敏感信息库和预设的安全算法,进行文本安全性检测;
当待测数据为图像,根据图像、通过图像深度学习训练库所确定的图像检测模型,进行图像安全性检测。
可选地,按照预定的频率,从SaaS(Software-as-a-Service,软件即服务)服务器获取文本敏感信息库的最新版本号;将第一服务器的文本敏感信息库的本地版本号与最新版本号进行比较,当本地版本号不是最新版本号,则将本地版本号对应的本地版本更新为最新版本号对应的最新版本。
本申请实施例中提供了另一种检测方法,应用于浏览器插件,该方法的流程示意图如图3所示,该方法包括:
S201,根据预定的路径,确定待测数据,预定的路径包括待测数据所在网页对应的网址。
S202,发送待测数据给第一服务器,以用于第一服务器对待测数据进行数据安全性检测。
可选地,在发送待测数据给第一服务器之后,该方法还包括:
接收第一服务器发送的检测结果,将检测结果以弹出独立于主页面的子页面方式进行显示。
可选地,浏览器插件、第一服务器分别为图4所示的局域网208中的浏览器插件204、内容安全检查设备207,局域网208中包括中心平台管理CMS/VMS后台服务器201、终端202和内容安全检查设备207。终端202包括浏览器或者基于浏览器的内容编辑器203,浏览器插件204、内容发布按钮205和内容编辑区206。用来过滤预定的路径,拦截内容(待测数据)转给内容安全检查设备207,当内容编辑区206内的内容编辑完成后,点击内容发布按钮205提交按钮后通过网址HTTP请求提交到CMS/VMS后台服务器201时(图3中步骤①),通过浏览器插件204判断请求路径是不是需要检测,如果是,则将要发布的内容转发给内容安全检查设备207(图3中步骤②),通过内容安全检查设备207的检测,内容安全检查设备207判断内容是否安全,返回检测结果(图3中步骤③),当内容不安全时,浏览器插件204弹出提示提醒用户。预定的路径是指网址、网址链接或者网站,预定的路径对应的网页包括文本、图像和视频中的至少一种。
本申请实施例中提供了又一种检测方法,应用于第二服务器,该方法的流程示意图如图5所示,该方法包括:
S301,通过预设的检测模块对第二服务器的目录进行遍历,确定目录对应的待测数据,第二服务器为流媒体发布服务器,目录包括待测数据对应的储存地址。
S302,发送待测数据给第一服务器,以用于第一服务器检测待测数据的安全性。
可选地,预设的检测模块为shell脚本程序或者爬虫程序。
可选地,第二服务器、第一服务器分别为图6所示的局域网305中的WEB/流媒体发布服务器302、内容安全检测设备304,局域网305中包括媒体发稿系统CMS/VMS301、WEB/流媒体发布服务器302、数据收集脚本程序(shell程序)303和内容安全检测设备304。WEB/流媒体发布服务器302用于存储媒体发稿系统CMS/VMS301发布的稿件(待测数据),当需要对已发布内容(待测数据)进行内容安全检测时,303数据收集脚本程序(shell程序),对WEB/流媒体发布服务器302目录进行遍历,并把待测数据发送到内容安全检测设备304,记录有问题的数据,最后给出检测报告。
可选地,第一服务器为图7中所示的内容安全检测设备403,图7中包括WEB/流媒体发布服务器401、互联网公网402、内容安全检测设备403和爬虫程序404。互联网上WEB/流媒体发布服务器401存储有大量的数据,爬虫程序404通过互联网公网402,对WEB/流媒体发布服务器401进行数据收集,内容安全检测设备403对收集的数据(待测数据)进行检测,给出检测报告。
本申请实施例中提供了又一种检测方法,该方法的流程示意图如图8所示,该方法包括:
S401,浏览器插件拦截检查预定的路径。
可选地,在内容(待测数据)创作时,提供一个安装在浏览器或者基于浏览器的编辑器插件(浏览器插件)。
S402,判断预定的路径是否符合检查规则,当符合检查规则时,转到步骤S403处理,当不符合检查规则时,转到步骤S411处理。
S403,浏览器插件发送待测数据给内容安全检测设备。
可选地,内容安全检测设备为第一服务器。
S404,内容安全检测设备分析判断数据类型,如果数据类型是视频时,转到步骤S405处理,如果数据类型是文本时,转到步骤S406处理,如果数据类型是图像时,转到步骤S407处理。
S405,内容安全检测设备对视频进行语音识别,将语音识别出的文本转到步骤S406处理;对视频进行关键帧提取,提取到关键帧图像,将关键帧图像转到步骤S407处理。
S406,内容安全检测设备进行文本检测。
S407,内容安全检测设备进行图像检测。
S408,判断文本、图像和视频是否安全,当文本、图像和视频为安全时,转到步骤S411处理;当文本、图像和视频中至少有一项为不安全时,转到步骤S409处理。
S409,内容安全检测设备发送待测数据的安全信息给浏览器插件。
可选地,待测数据的安全信息包括待测数据是安全的数据和待测数据是不安全的数据。
S410,浏览器插件弹出提示提醒用户待测数据中有不安全的数据。
S411,流程结束。
本申请实施例中提供了又一种检测方法,该方法的流程示意图如图9所示,该方法包括:
S501,通过shell脚本程序或者爬虫程序,对WEB/流媒体发布服务器的目录进行遍历,确定目录对应的待测数据。
可选地,WEB/流媒体发布服务器为第二服务器。WEB/流媒体发布服务器上安装shell脚本,对WEB/流媒体发布服务器的目录下的数据进行收集;利用爬虫程序抓取公网上一些页面或数据,然后遍历该页面或该数据下的文本、图片及视频。
S502,WEB/流媒体发布服务器将待测数据发送给内容安全检测设备。
可选地,内容安全检测设备为第一服务器。
S503,内容安全检测设备对待测数据进行安全检测。
可选地,执行步骤S404,S405,S406,S407。
S504,判断文本、图像和视频是否安全,当文本、图像和视频为安全时,转到步骤S506处理;当文本、图像和视频中至少有一项为不安全时,转到步骤S505处理。
S505,内容安全检测设备记录待测数据中有安全问题的数据。
S506,内容安全检测设备输出待测数据的安全性检测报告。
应用本申请实施例,至少具有如下有益效果:
实现了将待测数据分类为文本、图像和视频,对文本、图像和视频进行实时检测,或者对已经发布的文本、图像和视频进行检测,确定文本、图像和视频的安全信息,大幅度降低了对待测数据进行安全检测的实施难度,提升了安全检测的工作效率。
实施例二
基于相同的发明构思,本申请实施例还提供了一种检测装置,应用于第一服务器,该装置的结构示意图如图10所示,检测装置60,包括第一处理模块601、第二处理模块602和第三处理模块603。
第一处理模块601,用于接收待测数据,并确定待测数据的数据类型;
第二处理模块602,用于若待测数据的数据类型为文本或图像,根据文本或图像进行数据安全性检测,确定待测数据的安全信息;
第三处理模块603,用于若待测数据的数据类型为视频,对视频进行关键帧提取以及语音识别,并根据提取到的关键帧图像和语音识别出的文本信息进行数据安全性检测,确定待测数据的安全信息。
可选地,第一处理模块601,具体用于当检测到待测数据存在不安全的数据,发送检测结果给相应终端,以使得检测结果在终端上以浏览器插件弹出的方式进行显示。
可选地,第二处理模块602,具体用于当待测数据为文本,根据文本、预置的文本敏感信息库和预设的安全算法,进行文本安全性检测;当待测数据为图像,根据图像、通过图像深度学习训练库所确定的图像检测模型,进行图像安全性检测。
可选地,第一处理模块601,具体用于按照预定的频率,从软件即服务SaaS服务器获取文本敏感信息库的最新版本号;将第一服务器的文本敏感信息库的本地版本号与最新版本号进行比较,当本地版本号不是最新版本号,则将本地版本号对应的本地版本更新为最新版本号对应的最新版本。
基于相同的发明构思,本申请实施例还提供了另一种检测装置,应用于浏览器插件,该装置的结构示意图如图11所示,检测装置70,包括第四处理模块701和第五处理模块702。
第四处理模块701,用于根据预定的路径,确定待测数据,所述预定的路径包括待测数据所在网页对应的网址;
第五处理模块702,用于发送待测数据给第一服务器,以用于第一服务器对待测数据进行数据安全性检测。
可选地,第五处理模块702,具体用于接收第一服务器发送的检测结果,将检测结果以弹出独立于主页面的子页面方式进行显示。
基于相同的发明构思,本申请实施例还提供了又一种检测装置,应用于第二服务器,该装置的结构示意图如图12所示,检测装置80,包括第六处理模块801和第七处理模块802。
第六处理模块801,用于通过预设的检测模块对第二服务器的目录进行遍历,确定目录对应的待测第一数据,第二服务器为流媒体发布服务器,目录包括待测第一数据对应的储存地址;
第七处理模块802,用于发送待测数据给第一服务器,以用于第一服务器检测待测数据的安全性。
应用本申请实施例,至少具有如下有益效果:
实现了将待测数据分类为文本、图像和视频,对文本、图像和视频进行实时检测,或者对已经发布的文本、图像和视频进行检测,确定文本、图像和视频的安全信息,大幅度降低了对待测数据进行安全检测的实施难度,提升了安全检测的工作效率。
本申请实施例提供的检测装置中未详述的内容,可参照上述实施例一提供的检测方法,本申请实施例提供的检测装置能够达到的有益效果与上述实施例一提供的检测方法相同,在此不再赘述。
实施例三
基于相同的发明构思,本申请实施例还提供了一种检测系统,该检测系统的结构示意图如图13所示,检测系统90,包括第一服务器901和SaaS服务器902。
第一服务器901,用于接收待测数据,并确定待测数据的数据类型;若待测数据的数据类型为文本或图像,根据文本或图像进行数据安全性检测,确定待测数据的安全信息;若待测数据的数据类型为视频,对视频进行关键帧提取以及语音识别,并根据提取到的关键帧图像和语音识别出的文本信息进行数据安全性检测,确定待测数据的安全信息;
SaaS服务器902,用于更新文本敏感信息库,得到文本敏感信息库的最新版本;将文本敏感信息库的最新版本发送给第一服务器。
应用本申请实施例,至少具有如下有益效果:
实现了将待测数据分类为文本、图像和视频,对文本、图像和视频进行实时检测,或者对已经发布的文本、图像和视频进行检测,确定文本、图像和视频的安全信息,大幅度降低了对待测数据进行安全检测的实施难度,提升了安全检测的工作效率。
实施例四
基于相同的发明构思,本申请实施例还提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序用于被处理器执行时实现本申请实施例一中任意一个实施例或任意一种检测方法的步骤。
本申请实施例提供的计算机可读存储介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(RandomAccess Memory,随即存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读存储介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
应用本申请实施例,至少具有如下有益效果:
实现了将待测数据分类为文本、图像和视频,对文本、图像和视频进行实时检测,或者对已经发布的文本、图像和视频进行检测,确定文本、图像和视频的安全信息,大幅度降低了对待测数据进行安全检测的实施难度,提升了安全检测的工作效率。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本申请公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本申请中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本申请中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本申请中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (12)

1.一种检测方法,应用于第一服务器,其特征在于,包括:
接收待测数据,并确定所述待测数据的数据类型;
若所述待测数据的数据类型为文本或图像,根据所述文本或图像进行数据安全性检测,确定所述待测数据的安全信息;
若所述待测数据的数据类型为视频,对所述视频进行关键帧提取以及语音识别,并根据提取到的关键帧图像和语音识别出的文本信息进行数据安全性检测,确定所述待测数据的安全信息。
2.根据权利要求1所述的方法,其特征在于,在所述确定所述待测数据的安全信息之后,该方法还包括:
当检测到所述待测数据存在不安全的数据,发送检测结果给相应终端,以使得所述检测结果在所述终端上以浏览器插件弹出的方式进行显示。
3.根据权利要求1所述的方法,其特征在于,所述根据所述文本或图像进行数据安全性检测,确定所述待测数据的安全信息,包括:
当所述待测数据为文本,根据所述文本、预置的文本敏感信息库和预设的安全算法,进行文本安全性检测;
当所述待测数据为图像,根据所述图像、通过图像深度学习训练库所确定的图像检测模型,进行图像安全性检测。
4.根据权利要求3所述的方法,其特征在于,该方法还包括:
按照预定的频率,从软件即服务SaaS服务器获取文本敏感信息库的最新版本号;
将所述第一服务器的文本敏感信息库的本地版本号与所述最新版本号进行比较,当所述本地版本号不是所述最新版本号,则将所述本地版本号对应的本地版本更新为所述最新版本号对应的最新版本。
5.一种检测方法,应用于浏览器插件,其特征在于,包括:
根据预定的路径,确定所述待测数据,所述预定的路径包括所述待测数据所在网页对应的网址;
发送所述待测数据给第一服务器,以用于所述第一服务器对所述待测数据进行数据安全性检测。
6.根据权利要求5所述的方法,其特征在于,在所述发送待测数据给第一服务器之后,该方法还包括:
接收所述第一服务器发送的检测结果,将所述检测结果以弹出独立于主页面的子页面方式进行显示。
7.一种检测方法,应用于第二服务器,其特征在于,包括:
通过预设的检测模块对所述第二服务器的目录进行遍历,确定所述目录对应的待测数据,所述第二服务器为流媒体发布服务器,所述目录包括所述待测数据对应的储存地址;
发送所述待测数据给第一服务器,以用于所述第一服务器检测所述待测数据的安全性。
8.一种检测装置,应用于第一服务器,其特征在于,包括:
第一处理模块,用于接收待测数据,并确定所述待测数据的数据类型;
第二处理模块,用于若所述待测数据的数据类型为文本或图像,根据所述文本或图像进行数据安全性检测,确定所述待测数据的安全信息;
第三处理模块,用于若所述待测数据的数据类型为视频,对所述视频进行关键帧提取以及语音识别,并根据提取到的关键帧图像和语音识别出的文本信息进行数据安全性检测,确定所述待测数据的安全信息。
9.一种检测装置,应用于浏览器插件,其特征在于,包括:
第四处理模块,用于根据预定的路径,确定所述待测数据,所述预定的路径包括所述待测数据所在网页对应的网址;
第五处理模块,用于发送所述待测数据给第一服务器,以用于所述第一服务器对所述待测数据进行数据安全性检测。
10.一种检测装置,应用于第二服务器,其特征在于,包括:
第六处理模块,用于通过预设的检测模块对所述第二服务器的目录进行遍历,确定所述目录对应的待测第一数据,所述第二服务器为流媒体发布服务器,所述目录包括所述待测第一数据对应的储存地址;
第七处理模块,用于发送所述待测数据给第一服务器,以用于所述第一服务器检测所述待测数据的安全性。
11.一种检测系统,其特征在于,包括:第一服务器和SaaS服务器;
所述第一服务器,用于接收待测数据,并确定所述待测数据的数据类型;若所述待测数据的数据类型为文本或图像,根据所述文本或图像进行数据安全性检测,确定所述待测数据的安全信息;若所述待测数据的数据类型为视频,对所述视频进行关键帧提取以及语音识别,并根据提取到的关键帧图像和语音识别出的文本信息进行数据安全性检测,确定所述待测数据的安全信息;
所述SaaS服务器,用于更新文本敏感信息库,得到文本敏感信息库的最新版本;将所述文本敏感信息库的最新版本发送给所述第一服务器。
12.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序用于被处理器执行时实现如权利要求1-7中任一项所述的检测方法。
CN201910562232.9A 2019-06-26 2019-06-26 检测方法、装置、系统及计算机可读存储介质 Active CN110222523B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910562232.9A CN110222523B (zh) 2019-06-26 2019-06-26 检测方法、装置、系统及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910562232.9A CN110222523B (zh) 2019-06-26 2019-06-26 检测方法、装置、系统及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110222523A true CN110222523A (zh) 2019-09-10
CN110222523B CN110222523B (zh) 2021-10-15

Family

ID=67815086

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910562232.9A Active CN110222523B (zh) 2019-06-26 2019-06-26 检测方法、装置、系统及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110222523B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347990A (zh) * 2020-11-30 2021-02-09 重庆空间视创科技有限公司 基于多模态智能审稿系统及方法
CN113849760A (zh) * 2021-12-02 2021-12-28 云账户技术(天津)有限公司 敏感信息风险评估方法、系统和存储介质
CN114676330A (zh) * 2022-03-30 2022-06-28 南京厚建软件有限责任公司 一种互联网平台互动数据统一回收的方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101470897A (zh) * 2007-12-26 2009-07-01 中国科学院自动化研究所 基于音视频融合策略的敏感影片检测方法
CN104079559A (zh) * 2014-06-05 2014-10-01 腾讯科技(深圳)有限公司 一种网址安全性检测方法、装置及服务器
CN106454492A (zh) * 2016-10-12 2017-02-22 武汉斗鱼网络科技有限公司 一种基于延时传送的直播色情内容审核系统及方法
CN107291737A (zh) * 2016-04-01 2017-10-24 腾讯科技(深圳)有限公司 敏感图像识别方法及装置
CN107659538A (zh) * 2016-07-25 2018-02-02 北京优朋普乐科技有限公司 一种视频处理的方法及设备
CN108197465A (zh) * 2017-11-28 2018-06-22 中国科学院声学研究所 一种网址检测方法及装置
CN108595422A (zh) * 2018-04-13 2018-09-28 卓望信息技术(北京)有限公司 一种过滤不良彩信的方法
CN108829488A (zh) * 2018-06-28 2018-11-16 腾讯音乐娱乐科技(深圳)有限公司 生成Web可交互页面的方法、装置及存储介质
CN108920954A (zh) * 2018-06-28 2018-11-30 中国科学院软件研究所 一种恶意代码自动化检测平台及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101470897A (zh) * 2007-12-26 2009-07-01 中国科学院自动化研究所 基于音视频融合策略的敏感影片检测方法
CN104079559A (zh) * 2014-06-05 2014-10-01 腾讯科技(深圳)有限公司 一种网址安全性检测方法、装置及服务器
CN107291737A (zh) * 2016-04-01 2017-10-24 腾讯科技(深圳)有限公司 敏感图像识别方法及装置
CN107659538A (zh) * 2016-07-25 2018-02-02 北京优朋普乐科技有限公司 一种视频处理的方法及设备
CN106454492A (zh) * 2016-10-12 2017-02-22 武汉斗鱼网络科技有限公司 一种基于延时传送的直播色情内容审核系统及方法
CN108197465A (zh) * 2017-11-28 2018-06-22 中国科学院声学研究所 一种网址检测方法及装置
CN108595422A (zh) * 2018-04-13 2018-09-28 卓望信息技术(北京)有限公司 一种过滤不良彩信的方法
CN108829488A (zh) * 2018-06-28 2018-11-16 腾讯音乐娱乐科技(深圳)有限公司 生成Web可交互页面的方法、装置及存储介质
CN108920954A (zh) * 2018-06-28 2018-11-30 中国科学院软件研究所 一种恶意代码自动化检测平台及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347990A (zh) * 2020-11-30 2021-02-09 重庆空间视创科技有限公司 基于多模态智能审稿系统及方法
CN112347990B (zh) * 2020-11-30 2024-02-02 重庆空间视创科技有限公司 基于多模态智能审稿系统及方法
CN113849760A (zh) * 2021-12-02 2021-12-28 云账户技术(天津)有限公司 敏感信息风险评估方法、系统和存储介质
CN114676330A (zh) * 2022-03-30 2022-06-28 南京厚建软件有限责任公司 一种互联网平台互动数据统一回收的方法
CN114676330B (zh) * 2022-03-30 2023-12-08 南京厚建软件有限责任公司 一种互联网平台互动数据统一回收的方法

Also Published As

Publication number Publication date
CN110222523B (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
CN106104570B (zh) 检测和提取图像文档组件来创建流文档
CN110222523A (zh) 检测方法、装置、系统及计算机可读存储介质
CN104102687B (zh) 加密网络隧道内的Web业务的标识和分类的方法和系统
Li et al. Block: a black-box approach for detection of state violation attacks towards web applications
CN107918733A (zh) 检测网页的恶意元素的系统和方法
US11336673B2 (en) Systems and methods for third party risk assessment
CN110209796A (zh) 一种敏感词检测过滤方法、装置与电子设备
CN106779278A (zh) 资产信息的评价系统及其信息的处理方法和装置
CN107085549B (zh) 故障信息生成的方法和装置
CN108985064A (zh) 一种识别恶意文档的方法及装置
CN103870752B (zh) 一种用于检测Flash XSS漏洞的方法、装置与设备
CN107147640A (zh) 识别网络爬虫的方法及系统
Robinson et al. An evidence based earthquake detector using Twitter
CN114491518A (zh) 一种越权访问的检测方法、装置、系统及介质
KR20200048562A (ko) 보안 로그 전처리 장치 및 방법
CN111131236A (zh) 一种web指纹检测装置、方法、设备及介质
CN108804501B (zh) 一种检测有效信息的方法及装置
Itria et al. Identification of critical situations via event processing and event trust analysis
CN107085684A (zh) 程序特征的检测方法和装置
CN103581321B (zh) 一种refer链的创建方法、装置及安全检测方法和客户端
CN107368399A (zh) 一种线上网页监控方法及系统
CN107944289A (zh) 一种浏览器指纹检测方法和检测浏览器指纹的嵌入式设备
CN105550250B (zh) 一种访问日志的处理方法及装置
CN110263549A (zh) 一种基于浏览器扩展的网站安全检测方法及终端
CN109167773A (zh) 一种基于马尔科夫模型的访问异常检测方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant