CN107992578A - 敏感视频源的数据库自动检测方法 - Google Patents

敏感视频源的数据库自动检测方法 Download PDF

Info

Publication number
CN107992578A
CN107992578A CN201711273704.6A CN201711273704A CN107992578A CN 107992578 A CN107992578 A CN 107992578A CN 201711273704 A CN201711273704 A CN 201711273704A CN 107992578 A CN107992578 A CN 107992578A
Authority
CN
China
Prior art keywords
video source
database
testing method
automatic testing
violation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711273704.6A
Other languages
English (en)
Other versions
CN107992578B (zh
Inventor
任明和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxi Ruixin Zhida Media Polytron Technologies Inc
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201711273704.6A priority Critical patent/CN107992578B/zh
Publication of CN107992578A publication Critical patent/CN107992578A/zh
Application granted granted Critical
Publication of CN107992578B publication Critical patent/CN107992578B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的敏感视频源的数据库自动检测方法,是通过植入检测程序智能化地扫读视频源数据库,自动提取所述视频源的音频内容,进行文字解析后做检索判定后,获取违规违法情况的检测和检测数据结果,最终实现违规违法视频源的技术检测判定。通过本发明的技术实施,针对现有视频网络行业存在急需监管的需要,并克服现有技术存在的明显不足,提供了一个智能化操作和客观性数据采集的监管业务实现方法,并对第三方监管机构对视频网络平台有效实施强制性法定监管,提供完整的技术方案支持。

Description

敏感视频源的数据库自动检测方法
技术领域
本发明涉及互联网技术领域中视频内容的监控技术,尤其是对各种视频源的违法违规情况,提供一种自动的数据库扫读检测方法。
背景技术
随着现在的互联网技术的飞速扩展,给市场和业务的监管带来了越来越迫切的需要,特别是针对各种视频源的违法违规情况的监管,提出了更高技术性要求。现有的监管技术模式大都采用用户举报事后处罚的方式,无法做到及时发现及时处理。另外所述监控技术模式,也无法支持第三方管理机构对网络平台数据库的强制监管,事后处罚禁绝不了已经的违法违规事实对社会造成的伤害。
值得提出进行技术方案性比较的公开发明专利有:一种直播视频信息监控方法、装置和设备,专利号2017101597653。该授权专利所述技术方案是基于监测直播平台上主播和玩家的使用体验,已经相关业务模块的性能效果,这是直播平台经营者比较关注的需求,但对直播内容是否违法违规,涉黄表演等问题,特别是对第三方机构对直播平台的监管没有提供技术支持。
值得提出进行技术方案比较的公开发明专利还有:一种直播视频的评估方法及装置,专利号201611179995。该专利涉及的主要技术方案是提取直播视频的观众端对视频的评分信息,来准确量化对直播视频的热度进行评估。同样对直播内容是否违法违规,涉黄表演等问题,特别是对第三方机构对直播平台的监管都没有提供技术支持。
特别需要进行技术方案比较的公开发明专利是:一种基于视频音频检测与数据分析系统,专利号201610715906。该发明通过主播分类分层数据分析模块、主播行为数据分析与监控模块、主播行为监管模块、大数据分析子系统模块、软件算法研发模块这些业务模块的具体实施,实现对主播行为进行监管与控制,避免主播的行为和语言出现不当,同时减少裸露画面的出现,避免对社会造成不好的影响。但其具体实施流程方案的技术特征点公开不足,无法明确其究竟采用了什么样的可实现的技术方案,来具体达成所述业务模块的功能;其次,其所述各个业务模块的数据采集,大都依托于监管操作人员的手工录入,没有让业务系统实现自主化的、客观的自动采集,自动检测和自动获得结果的技术效果,其业务功能方案上存在明显的技术劣势。
发明内容
本发明的敏感视频源的数据库自动检测方法,是通过植入检测程序智能化地扫读视频源数据库,自动提取所述视频源的音频内容,进行文字解析后做检索判定后,获取违规违法情况的检测和检测数据结果,最终实现违规违法视频源的技术检测判定。通过本发明的技术实施,针对现有视频网络行业存在急需监管的需要,并克服现有技术存在的明显不足,提供了一个智能化操作和客观性数据采集的监管业务实现方法,并对第三方监管机构对视频网络平台有效实施强制性法定监管,提供完整的技术方案支持。
本发明的敏感视频源的数据库自动检测方法,特征在于是通过提取所述视频源的音频内容,进行文字解析后做检索判定,进行违规违法情况的检测,包括如下技术实施流程:
S1-1、数据读取模块在视频源中提取音频数据。
S1-2、文字翻译模块对音频数据进行文字翻译处理。
S1-3、检索解析模块对文字和语句进行数据库筛查比对检测。
S1-4、当数据库比对模块检测有违规违法的结果,分级标记模块按设定标准进行分级分色标记。
S2-5、当检测达到设定的第一阈值,则自动发起对该视频源的全数据读取和数据库筛查比对检测。
S2-6、当检测达到设定的第二阈值,确认视频源存在违规违法的情况,启动警报业务模块。
S1-7、或根据在先设定管理处理程序发出警告指令。
S1-8、或根据在先设定的处理程序启动视频源屏蔽。
本发明的敏感视频源的数据库自动检测方法,所述文字翻译模块对音频数据进行文字翻译处理,进一步地对地方性语音进行识别后,经过地方性属地的方言翻译模块对音频数据进行文字化翻译处理。
本发明的敏感视频源的数据库自动检测方法,所述进行数据库筛查比对检测,进一步地对地方性文字进行识别后,经过地方性文字俗语分类数据库的筛查比对检测。
本发明的敏感视频源的数据库自动检测方法,所述按设定标准进行分级分色标记,是根据与数据库匹配的关键字关键词关键句进行对应的色差标记。
本发明的敏感视频源的数据库自动检测方法,达到设定的第一阈值,是指设定低度分级分色标记的检出量同无色差标记的正常量占有比例,来设定为启动全检的第一阈值。
本发明的敏感视频源的数据库自动检测方法,当单一强度分级分色标记出现时,就直接达到设定为启动全检的第一阈值。
本发明的敏感视频源的数据库自动检测方法,所述当达到设定的第二阈值,是对全检结果进行二阈值设定,来确认判定视频源存在违规违法的情况。
本发明的敏感视频源的数据库自动检测方法,所述根据在先设定管理处理程序发出警告指令,是第三方监测方自动激活向视频源所有权人自动发出行政警告令。
本发明的敏感视频源的数据库自动检测方法,根据在先设定的处理程序启动视频源屏蔽,是通过写入加密程序后强制激活屏蔽该视频源。
本发明的敏感视频源的数据库自动检测方法,还可以通过提取视频源的用户评价互动留言文字做检索判定,进行违规违法状态的技术检测判定。
附图说明
图1是本发明的业务模块构成图。
具体实施方式
以下通过附图,并结合具体的实施例进一步来说明,本发明的敏感视频源的数据库自动检测方法。
实现所述方法包括如下技术实施流程:
S1-1、数据读取模块101在视频源中提取音频数据。
S1-2、文字翻译模块102对音频数据进行文字翻译处理。
S1-3、检索解析模块103对文字和语句进行数据库筛查比对检测。
S1-4、当数据库比对模块检测有违规违法的结果,分级标记模块104按设定标准进行分级分色标记。
S2-5、当检测达到设定的第一阈值105,则自动发起对该视频源的全数据读取和数据库筛查比对检测105-1,前述流程回复。
S2-6、当检测达到设定的第二阈值106,确认视频源存在违规违法的情况,启动警报业务模块107。
S1-7、或根据在先设定管理处理程序发出警告指令107-1。
S1-8、或根据在先设定的处理程序启动视频源屏蔽107-2。
以上所述仅为本发明的实施例而已,并不用以限制本发明。凡在本发明的精神和原则之内,所做的修改。等同替换、改进等,均应包含在本发明的保护范围之内。以上所述仅为本发明的实施例而已,并不用以限制本发明。凡在本发明的精神和原则之内,所做的修改。等同替换、改进等,均应包含在本发明的保护范围之内。
综上所述,本发明的敏感视频源的数据库自动检测方法,是通过植入检测程序智能化地扫读视频源数据库,自动提取所述视频源的音频内容,进行文字解析后做检索判定后,获取违规违法情况的检测和检测数据结果,最终实现违规违法视频源的技术检测判定。通过本发明的技术实施,针对现有视频网络行业存在急需监管的需要,并克服现有技术存在的明显不足,提供了一个智能化操作和客观性数据采集的监管业务实现方法,并对第三方监管机构对视频网络平台有效实施强制性法定监管,提供完整的技术方案支持。

Claims (10)

1.敏感视频源的数据库自动检测方法,特征在于是通过提取所述视频源的音频内容,进行文字解析后做检索判定,进行违规违法情况的检测,包括如下技术实施流程:
S1-1、数据读取模块在视频源中提取音频数据;
S1-2、文字翻译模块对音频数据进行文字翻译处理;
S1-3、检索解析模块对文字和语句进行数据库筛查比对检测;
S1-4、当数据库比对模块检测有违规违法的结果,分级标记模块按设定标准进行分级分色标记;
S2-5、当检测达到设定的第一阈值,则自动发起对该视频源的全数据读取和数据库筛查比对检测;
S2-6、当检测达到设定的第二阈值,确认视频源存在违规违法的情况,启动警报业务模块;
S1-7、或根据在先设定管理处理程序发出警告指令;
S1-8、或根据在先设定的处理程序启动视频源屏蔽。
2.根据权利要求1的敏感视频源的数据库自动检测方法,特征在于所述文字翻译模块对音频数据进行文字翻译处理,进一步地对地方性语音进行识别后,经过地方性属地的方言翻译模块对音频数据进行文字化翻译处理。
3.根据权利要求1的敏感视频源的数据库自动检测方法,特征在于所述进行数据库筛查比对检测,进一步地对地方性文字进行识别后,经过地方性文字俗语分类数据库的筛查比对检测。
4.根据权利要求1的敏感视频源的数据库自动检测方法,特征在于所述按设定标准进行分级分色标记,是根据与数据库匹配的关键字关键词关键句进行对应的色差标记。
5.根据权利要求1的敏感视频源的数据库自动检测方法,特征在于达到设定的第一阈值,是指设定低度分级分色标记的检出量同无色差标记的正常量占有比例,来设定为启动全检的第一阈值。
6.根据权利要求1的敏感视频源的数据库自动检测方法,特征在于当单一强度分级分色标记出现时,就直接达到设定为启动全检的第一阈值。
7.根据权利要求1的敏感视频源的数据库自动检测方法,特征在于所述当达到设定的第二阈值,是对全检结果进行二阈值设定,来确认判定视频源存在违规违法的情况。
8.根据权利要求1的敏感视频源的数据库自动检测方法,特征在于所述根据在先设定管理处理程序发出警告指令,是第三方监测方自动激活向视频源所有权人自动发出行政警告令。
9.根据权利要求1的敏感视频源的数据库自动检测方法,特征在于根据在先设定的处理程序启动视频源屏蔽,是通过写入加密程序后强制激活屏蔽该视频源。
10.根据权利要求1的敏感视频源的数据库自动检测方法,特征在于还可以通过提取视频源的用户评价互动留言文字做检索判定,进行违规违法状态的技术检测判定。
CN201711273704.6A 2017-12-06 2017-12-06 敏感视频源的数据库自动检测方法 Active CN107992578B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711273704.6A CN107992578B (zh) 2017-12-06 2017-12-06 敏感视频源的数据库自动检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711273704.6A CN107992578B (zh) 2017-12-06 2017-12-06 敏感视频源的数据库自动检测方法

Publications (2)

Publication Number Publication Date
CN107992578A true CN107992578A (zh) 2018-05-04
CN107992578B CN107992578B (zh) 2019-11-22

Family

ID=62036248

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711273704.6A Active CN107992578B (zh) 2017-12-06 2017-12-06 敏感视频源的数据库自动检测方法

Country Status (1)

Country Link
CN (1) CN107992578B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109005425A (zh) * 2018-08-26 2018-12-14 俞绍富 网络视频监控系统
CN109376271A (zh) * 2018-11-01 2019-02-22 惠州学院 一种视频内容检索方法
CN109508402A (zh) * 2018-11-15 2019-03-22 上海指旺信息科技有限公司 违规用语检测方法及装置
CN109783689A (zh) * 2018-12-28 2019-05-21 广州华多网络科技有限公司 信息处理方法、装置及电子设备
CN111125539A (zh) * 2019-12-31 2020-05-08 武汉市烽视威科技有限公司 一种基于人工智能的cdn有害信息阻断方法及系统
CN111416960A (zh) * 2020-03-27 2020-07-14 河北凯通信息技术服务有限公司 一种基于云服务的视频监控系统
CN113591111A (zh) * 2021-07-27 2021-11-02 展讯半导体(南京)有限公司 音频数据处理方法及装置、计算机可读存储介质、终端

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663093A (zh) * 2012-04-10 2012-09-12 中国科学院计算机网络信息中心 不良网站检测方法及设备
CN102708708A (zh) * 2011-02-17 2012-10-03 索尼公司 具有书签功能的电子阅读器系统及其操作方法
CN103516915A (zh) * 2012-06-27 2014-01-15 百度在线网络技术(北京)有限公司 在移动终端通话过程中敏感词汇的替换方法、系统及装置
CN106101819A (zh) * 2016-06-21 2016-11-09 武汉斗鱼网络科技有限公司 一种基于语音识别的直播视频敏感内容过滤方法及装置
CN106383862A (zh) * 2016-08-31 2017-02-08 杭州云片网络科技有限公司 一种违规短信检测方法及系统
CN106792579A (zh) * 2016-12-01 2017-05-31 北京奇虎科技有限公司 一种彩信拦截方法及装置
CN107025239A (zh) * 2016-02-01 2017-08-08 博雅网络游戏开发(深圳)有限公司 敏感词过滤的方法和装置
US20170289624A1 (en) * 2016-04-01 2017-10-05 Samsung Electrônica da Amazônia Ltda. Multimodal and real-time method for filtering sensitive media
CN107295401A (zh) * 2017-08-10 2017-10-24 四川长虹电器股份有限公司 一种检测自媒体音视频内容中的违规信息的方法
CN103838835B (zh) * 2014-02-25 2017-11-21 中国科学院自动化研究所 一种网络敏感视频检测方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708708A (zh) * 2011-02-17 2012-10-03 索尼公司 具有书签功能的电子阅读器系统及其操作方法
CN102663093A (zh) * 2012-04-10 2012-09-12 中国科学院计算机网络信息中心 不良网站检测方法及设备
CN103516915A (zh) * 2012-06-27 2014-01-15 百度在线网络技术(北京)有限公司 在移动终端通话过程中敏感词汇的替换方法、系统及装置
CN103838835B (zh) * 2014-02-25 2017-11-21 中国科学院自动化研究所 一种网络敏感视频检测方法
CN107025239A (zh) * 2016-02-01 2017-08-08 博雅网络游戏开发(深圳)有限公司 敏感词过滤的方法和装置
US20170289624A1 (en) * 2016-04-01 2017-10-05 Samsung Electrônica da Amazônia Ltda. Multimodal and real-time method for filtering sensitive media
CN106101819A (zh) * 2016-06-21 2016-11-09 武汉斗鱼网络科技有限公司 一种基于语音识别的直播视频敏感内容过滤方法及装置
CN106383862A (zh) * 2016-08-31 2017-02-08 杭州云片网络科技有限公司 一种违规短信检测方法及系统
CN106792579A (zh) * 2016-12-01 2017-05-31 北京奇虎科技有限公司 一种彩信拦截方法及装置
CN107295401A (zh) * 2017-08-10 2017-10-24 四川长虹电器股份有限公司 一种检测自媒体音视频内容中的违规信息的方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109005425A (zh) * 2018-08-26 2018-12-14 俞绍富 网络视频监控系统
CN109376271A (zh) * 2018-11-01 2019-02-22 惠州学院 一种视频内容检索方法
CN109508402A (zh) * 2018-11-15 2019-03-22 上海指旺信息科技有限公司 违规用语检测方法及装置
CN109783689A (zh) * 2018-12-28 2019-05-21 广州华多网络科技有限公司 信息处理方法、装置及电子设备
CN109783689B (zh) * 2018-12-28 2021-05-21 广州华多网络科技有限公司 信息处理方法、装置及电子设备
CN111125539A (zh) * 2019-12-31 2020-05-08 武汉市烽视威科技有限公司 一种基于人工智能的cdn有害信息阻断方法及系统
CN111125539B (zh) * 2019-12-31 2024-02-02 武汉市烽视威科技有限公司 一种基于人工智能的cdn有害信息阻断方法及系统
CN111416960A (zh) * 2020-03-27 2020-07-14 河北凯通信息技术服务有限公司 一种基于云服务的视频监控系统
CN111416960B (zh) * 2020-03-27 2021-07-13 深圳普泰电气有限公司 一种基于云服务的视频监控系统
CN113591111A (zh) * 2021-07-27 2021-11-02 展讯半导体(南京)有限公司 音频数据处理方法及装置、计算机可读存储介质、终端

Also Published As

Publication number Publication date
CN107992578B (zh) 2019-11-22

Similar Documents

Publication Publication Date Title
CN107992578B (zh) 敏感视频源的数据库自动检测方法
CN104408093B (zh) 一种新闻事件要素抽取方法与装置
CN107968951B (zh) 对直播视频进行自动侦测和屏蔽的方法
CN106447239B (zh) 一种数据发布的审核方法及装置
CN107437038B (zh) 一种网页篡改的检测方法及装置
CN107896335B (zh) 基于大数据技术的视频检测和评级方法
AU2015252513B2 (en) Method and system for filtering goods evaluation information
CN107533698A (zh) 社交媒体事件的检测与验证
CN106055541A (zh) 一种新闻内容敏感词过滤方法及系统
CN105446864B (zh) 缓存文件删除影响的校验方法、装置及移动终端
CN107862327B (zh) 一种基于多特征的安全缺陷识别系统和方法
CN107506454A (zh) 一种计算机文本及多媒体信息安全自动预警系统
CN106383862B (zh) 一种违规短信检测方法及系统
CN112541476A (zh) 一种基于语义特征提取的恶意网页识别方法
CN104156447A (zh) 一种智能社交平台广告预警及处理方法
CN110135225A (zh) 样本标注方法及计算机存储介质
CN113076961B (zh) 一种图像特征库更新方法、图像检测方法和装置
CN110728582B (zh) 信息处理的方法、装置、存储介质和处理器
KR20170048736A (ko) 문자 중계 데이터로부터 이벤트 정보를 추출하는 이벤트 정보 추출 방법 및 그 방법을 수행하는 사용자 단말
CN115470341B (zh) 网络目标条款筛选方法、装置、电子设备及存储介质
CN115795319A (zh) 基于cnas检测实验室的试验项检测方法及相关装置
CN109409091A (zh) 检测Web页面的方法、装置、设备以及计算机存储介质
CN112818150B (zh) 一种图片内容审核方法、装置、设备和介质
CN110147491B (zh) 一种引流信息识别方法和装置
CN114706948A (zh) 新闻处理方法、装置、存储介质以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20191029

Address after: Jinan street 030009 Shanxi city of Taiyuan province No. 7 Building 94 floor A block 3 room 0307-0312

Applicant after: Shanxi Ruixin Zhida media Polytron Technologies Inc

Address before: 400800 Chongqing Nantong town Wansheng District Qijiang District 801 Village No. 635 of No. 1

Applicant before: Ren Minghe

GR01 Patent grant
GR01 Patent grant