CN103473299A - 一种网站不良似然度获取方法和装置 - Google Patents

一种网站不良似然度获取方法和装置 Download PDF

Info

Publication number
CN103473299A
CN103473299A CN2013104043726A CN201310404372A CN103473299A CN 103473299 A CN103473299 A CN 103473299A CN 2013104043726 A CN2013104043726 A CN 2013104043726A CN 201310404372 A CN201310404372 A CN 201310404372A CN 103473299 A CN103473299 A CN 103473299A
Authority
CN
China
Prior art keywords
bad
doubtful
website
text
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013104043726A
Other languages
English (en)
Other versions
CN103473299B (zh
Inventor
宋同珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruian Technology Co Ltd
Original Assignee
Beijing Ruian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruian Technology Co Ltd filed Critical Beijing Ruian Technology Co Ltd
Priority to CN201310404372.6A priority Critical patent/CN103473299B/zh
Publication of CN103473299A publication Critical patent/CN103473299A/zh
Application granted granted Critical
Publication of CN103473299B publication Critical patent/CN103473299B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种网站不良似然度获取方法和装置,该方法包括:统计网站疑似不良文本的数目;统计网站疑似不良图片的数目;统计网站疑似不良视频的数目;根据疑似不良文本的数目、疑似不良图片的数目和疑似不良视频的数目获取网站的不良似然度。本发明通过对网站的文本、图片和视频内容进行分析,通过各种内容的疑似不良数目判断网站的不良似然度,判断过程快速准确,提供了对网络环境的全面检测。

Description

一种网站不良似然度获取方法和装置
技术领域
本发明涉及互联网不良信息识别领域,尤其涉及一种网站不良似然度获取方法和装置。
背景技术
当今社会科学技术日新月异,随着我国国民经济的不断发展,人民生活水平的不断提高,互联网已经深入家庭。如今,互联网已经改变和影响了每一个人的生活,在充分体验互联网络为生活、工作带来方便、效率的同时,网络不良信息也在危害着广大青少年尤其是未成年的青少年的身心健康。目前最容易接触到网络不良信息的是手机,现在青少年近九成拥有移动手机,据不完全统计,全国拥有1.5亿19岁以下的青少年手机用户,据调查显示,80%青少年浏览过黄色、暴力和血腥等不良信息。因此,如何发现和遏制网络不良信息,保证青少年的身心健康,已经成为眼下亟待解决的问题。
发明内容
本发明提供了一种对网站的文本、图片和视频内容进行分析统计,获取网站的不良似然度的方法和装置。
为实现上述方法和装置,本发明采用以下技术方案:
一方面采用一种网站不良似然度获取方法,包括:
统计网站疑似不良文本的数目;
统计网站疑似不良图片的数目;
统计网站疑似不良视频的数目;
根据疑似不良文本的数目、疑似不良图片的数目和疑似不良视频的数目获取网站的不良似然度。
其中,所述统计网站疑似不良文本的数目,包括:
用预设的不良关键字字库与网站中的每个文本文件的文字进行匹配;
统计每个文本文件中不良关键字匹配个数和总次数;
当文本文件中的不良关键字匹配个数和次数均达到阈值时,将该文本文件标记为疑似不良文本,统计网站中的疑似不良文本的数目。
其中,所述统计网站疑似不良图片的数目,包括:
提取网站中每张图片的肤色、纹理和姿态参数;
根据图片的肤色、纹理和姿态参数对图片进行不良疑似度打分;
当图片的分数在预设范围内时,将该图片标记为疑似不良图片,统计网站中的疑似不良图片数目。
其中,所述统计网站疑似不良视频的数目,包括:
从网站的每个视频中抽取关键帧;
提取每个关键帧的肤色、纹理和姿态参数;
根据关键帧的肤色、纹理和姿态参数对关键帧进行不良疑似度打分;
当关键帧的分数在预设范围内时,将该关键帧标记为疑似不良帧;
当视频的疑似不良帧占视频关键帧的比例达到预设的阈值时,将该视频标记为疑似不良视频,统计网站疑似不良视频的数目。
其中,所述根据疑似不良文本的数目、疑似不良图片的数目和疑似不良视频的数目获取网站的不良似然度,具体为:
根据疑似不良文本、疑似不良图片和疑似不良视频的数目,预设的权重,预设的置信度获取网站的不良似然度;所述不良似然度的获取方法为:
S=α×Z1×S1+β×Z2×S2+γ×Z3×S3
其中,S表示网站的不良似然度值;α表示文本的权重;Z1表示文本的置信度;S1表示疑似不良文本的数量;β表示图片的权重;Z2表示图片的置信度;S2表示疑似不良图片的数量;γ表示视频的权重;Z3表示视频的置信度;S3表示疑似不良视频的数量;α+β+γ=1。
另一方面采用一种网站不良似然度获取装置,包括:
第一统计单元,用于统计网站疑似不良文本的数目;
第二统计单元,用于统计网站疑似不良图片的数目;
第三统计单元,用于统计网站疑似不良视频的数目;
似然度计算单元,用于根据疑似不良文本的数目、疑似不良图片的数目和疑似不良视频的数目获取网站的不良似然度。
其中,所述第一统计单元包括:
关键字匹配模块,用于用预设的不良关键字字库与网站中的每个文本文件的文字进行匹配;
数目统计模块,用于统计每个文本文件中不良关键字匹配个数和总次数;
文本计数模块,用于当文本文件中的不良关键字匹配个数和次数均达到阈值时,将该文本文件标记为疑似不良文本,统计网站中的疑似不良文本的数目。
其中,所述第二统计单元包括:
图片参数提取模块,用于提取网站中每张图片的肤色、纹理和姿态参数;
图片打分模块,用于根据图片的肤色、纹理和姿态参数对图片进行不良疑似度打分;
图片计数模块,用于当图片的分数在预设范围内时,将该图片标记为疑似不良图片,统计网站中的疑似不良图片数目。
其中,所述第三统计单元包括:
关键帧抽取模块,用于从网站的每个视频中抽取关键帧;
帧参数提取模块,用于提取每个关键帧的肤色、纹理和姿态参数;
关键帧打分模块,用于根据关键帧的肤色、纹理和姿态参数对关键帧进行不良疑似度打分;
关键帧标记模块,用于当关键帧的分数在预设范围内时,将该关键帧标记为疑似不良帧;
视频计数模块,用于当视频的疑似不良帧占视频关键帧的比例达到预设的阈值时,将该视频标记为疑似不良视频,统计网站疑似不良视频的数目。
其中,所述似然度计算单元具体用于:
根据疑似不良文本、疑似不良图片和疑似不良视频的数目,预设的权重,预设的置信度获取网站的不良似然度;所述不良似然度的获取方法为:
S=α×Z1×S1+β×Z2×S2+γ×Z3×S3
其中,S表示网站的不良似然度值;α表示文本的权重;Z1表示文本的置信度;S1表示疑似不良文本的数量;β表示图片的权重;Z2表示图片的置信度;S2表示疑似不良图片的数量;γ表示视频的权重;Z3表示视频的置信度;S3表示疑似不良视频的数量;α+β+γ=1。
本发明的有益效果为:本发明对网站的文本、图片和视频内容进行分析,通过各种内容的疑似不良数目判断网站的不良似然度,判断过程快速准确,提供了对网络环境的全面检测。
附图说明
图1是本发明一种网站不良似然度获取方法的第一实施例流程图;
图2是本发明一种网站不良似然度获取方法的第二实施例流程图;
图3是本发明一种网站不良似然度获取方法的对十个网站获取的不良似然度统计图;
图4是本发明一种网站不良似然度获取装置的结构方框图;
图5是本发明一种网站不良似然度获取装置的第一统计单元的结构方框图;
图6是本发明一种网站不良似然度获取装置的第二统计单元的结构方框图;
图7是本发明一种网站不良似然度获取装置的第三统计单元的结构方框图。
具体实施方式
下面结合图1至图7并通过具体实施方式来进一步说明本发明的技术方案。
图1是本发明一种网站不良似然度获取方法的第一实施例流程图,如图所示,该方法包括:
步骤110:统计网站疑似不良文本的数目;
步骤120:统计网站疑似不良图片的数目;
步骤130:统计网站疑似不良视频的数目;
上述三个步骤的执行过程并无特定的先后顺序,可同时统计,可交错统计,亦可按上述步骤描述的先后顺序依次统计。步骤140:根据疑似不良文本的数目、疑似不良图片的数目和疑似不良视频的数目获取网站的不良似然度。
本发明对网站的文本、图片和视频内容进行分析,通过各种内容的疑似不良数目判断网站的不良似然度,判断过程快速准确,提供了对网络环境的全面检测。
图2是本发明一种网站不良似然度获取方法的第二实施例流程图,如图所示,该方法包括:
步骤201:用预设的不良关键字字库与网站中的每个文本文件的文字进行匹配。
步骤202:统计每个文本文件中不良关键字匹配个数和次数。
步骤203:当文本文件中的不良关键字匹配个数和次数均达到阈值时,将该文本文件标记为疑似不良文本,统计网站中的疑似不良文本的数目。
步骤204:提取网站中每张图片的肤色、纹理和姿态参数。
步骤205:根据图片的肤色、纹理和姿态参数对图片进行不良疑似度打分。
步骤206:当图片的分数在预设范围内时,将该图片标记为疑似不良图片,统计网站中的疑似不良图片数目。
步骤207:从网站的每个视频中抽取关键帧。
步骤208:提取每个关键帧的肤色、纹理和姿态参数。
步骤209:根据关键帧的肤色、纹理和姿态参数对关键帧进行不良疑似度打分。
步骤210:当关键帧的分数在预设范围内时,将该关键帧标记为疑似不良帧。
步骤211:当视频的疑似不良帧占视频关键帧的比例达到预设的阈值时,将该视频标记为疑似不良视频,统计网站疑似不良视频的数目。
步骤212:根据疑似不良文本、疑似不良图片和疑似不良视频的数目、预设的权重、预设的置信度获取网站的不良似然度;所述不良似然度的获取方法为:
S=α×Z1×S1+β×Z2×S2+γ×Z3×S3
其中,S表示网站的不良似然度值;α表示文本的权重;Z1表示文本的置信度;S1表示疑似不良文本的数量;β表示图片的权重;Z2表示图片的置信度;S2表示疑似不良图片的数量;γ表示视频的权重;Z3表示视频的置信度;S3表示疑似不良视频的数量;α+β+γ=1。
为了进一步对本实施例进行说明,就实际的网站不良似然度获取过程中进行详细阐述。文本的权重设置为0.6,文本的置信度设置为0.6,文本文件中的不良关键字匹配中标个数和次数地阈值分别为3个和5次;图片的权重设置为0.2,图片的置信度设置为0.25;视频的权重设置为0.2,视频的置信度设置为0.6,视频的疑似不良帧占视频关键帧的比例的阈值为0.35。根据不良似然度的获取方法:S=α×Z1×S1+β×Z2×S2+γ×Z3×S3,疑似不良内容越多,网站的不良似然度越高,如图3所示是对10个网站进行统计分析后得到的不良似然度的统计图。从图3中可以看出,编号为1的网站的不良似然度最高,为626.21,相对应的,其为不良信息网站的可能性最高,需要对其进行重点监测,如果监测结果显示其确实为不良信息网站,则依法进行后续处理,以维护网络环境的健康安全。
图4是本发明一种网站不良似然度获取装置400的结构方框图,如图所示,该装置包括:
第一统计单元410,用于统计网站疑似不良文本的数目;
第二统计单元420,用于统计网站疑似不良图片的数目;
第三统计单元430,用于统计网站疑似不良视频的数目;
似然度计算单元440,用于根据疑似不良文本的数目、疑似不良图片的数目和疑似不良视频的数目获取网站的不良似然度。
进一步地,如图5所示,所述第一统计单元410包括:
关键字匹配模块411,用于用预设的不良关键字字库与网站中的每个文本文件的文字进行匹配;
数目统计模块412,用于统计每个文本文件中不良关键字匹配个数和次数;
文本计数模块413,用于当文本文件中的不良关键字匹配个数和次数均达到阈值时,将该文本文件标记为疑似不良文本,统计网站中的疑似不良文本的数目。
进一步地,如图6所示,所述第二统计单元420包括:
图片参数提取模块421,用于提取网站中每张图片的肤色、纹理和姿态参数;
图片打分模块422,用于根据图片的肤色、纹理和姿态参数对图片进行不良疑似度打分;
图片计数模块423,用于当图片的分数在预设范围内时,将该图片标记为疑似不良图片,统计网站中的疑似不良图片数目。
进一步地,如图7所示,所述第三统计单元430包括:
关键帧抽取模块431,用于从网站的每个视频中抽取关键帧;
帧参数提取模块432,用于提取每个关键帧的肤色、纹理和姿态参数;
关键帧打分模块433,用于根据关键帧的肤色、纹理和姿态参数对关键帧进行不良疑似度打分;
关键帧标记模块434,用于当关键帧的分数在预设范围内时,将该关键帧标记为疑似不良帧;
视频计数模块435,用于当视频的疑似不良帧占视频关键帧的比例达到预设的阈值时,将该视频标记为疑似不良视频,统计网站疑似不良视频的数目。
具体地,所述似然度计算单元用于:
根据疑似不良文本、疑似不良图片和疑似不良视频的数目、预设的权重、预设的置信度获取网站的不良似然度;所述不良似然度的获取方法为:
S=α×Z1×S1+β×Z2×S2+γ×Z3×S3
其中,S表示网站的不良似然度值;α表示文本的权重;Z1表示文本的置信度;S1表示疑似不良文本的数量;β表示图片的权重;Z2表示图片的置信度;S2表示疑似不良图片的数量;γ表示视频的权重;Z3表示视频的置信度;S3表示疑似不良视频的数量;α+β+γ=1。
通过上述单元和模块的配合工作,对网站的文本、图片和视频内容进行分析,通过各种内容的疑似不良数目判断网站的不良似然度,判断过程快速准确,提供了对网络环境的全面检测。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。

Claims (10)

1.一种网站不良似然度获取方法,其特征在于,包括:
统计网站疑似不良文本的数目;
统计网站疑似不良图片的数目;
统计网站疑似不良视频的数目;
根据疑似不良文本的数目、疑似不良图片的数目和疑似不良视频的数目获取网站的不良似然度。
2.根据权利要求1所述的一种网站不良似然度获取方法,其特征在于,所述统计网站疑似不良文本的数目,包括:
用预设的不良关键字字库与网站中的每个文本文件的文字进行匹配;
统计每个文本文件中不良关键字匹配个数和总次数;
当文本文件中的不良关键字匹配个数和次数均达到阈值时,将该文本文件标记为疑似不良文本,统计网站中的疑似不良文本的数目。
3.根据权利要求1所述的一种网站不良似然度获取方法,其特征在于,所述统计网站疑似不良图片的数目,包括:
提取网站中每张图片的肤色、纹理和姿态参数;
根据图片的肤色、纹理和姿态参数对图片进行不良疑似度打分;
当图片的分数在预设范围内时,将该图片标记为疑似不良图片,统计网站中的疑似不良图片数目。
4.根据权利要求1所述的一种网站不良似然度获取方法,其特征在于,所述统计网站疑似不良视频的数目,包括:
从网站的每个视频中抽取关键帧;
提取每个关键帧的肤色、纹理和姿态参数;
根据关键帧的肤色、纹理和姿态参数对关键帧进行不良疑似度打分;
当关键帧的分数在预设范围内时,将该关键帧标记为疑似不良帧;
当视频的疑似不良帧占视频关键帧的比例达到预设的阈值时,将该视频标记为疑似不良视频,统计网站疑似不良视频的数目。
5.根据权利要求1所述的一种网站不良似然度获取方法,其特征在于,所述根据疑似不良文本的数目、疑似不良图片的数目和疑似不良视频的数目获取网站的不良似然度,具体为:
根据疑似不良文本、疑似不良图片和疑似不良视频的数目,预设的权重,预设的置信度获取网站的不良似然度;所述不良似然度的获取方法为:
S=α×Z1×S1+β×Z2×S2+γ×Z3×S3
其中,S表示网站的不良似然度值;α表示文本的权重;Z1表示文本的置信度;S1表示疑似不良文本的数量;β表示图片的权重;Z2表示图片的置信度;S2表示疑似不良图片的数量;γ表示视频的权重;Z3表示视频的置信度;S3表示疑似不良视频的数量;α+β+γ=1。
6.一种网站不良似然度获取装置,其特征在于,包括:
第一统计单元,用于统计网站疑似不良文本的数目;
第二统计单元,用于统计网站疑似不良图片的数目;
第三统计单元,用于统计网站疑似不良视频的数目;
似然度计算单元,用于根据疑似不良文本的数目、疑似不良图片的数目和疑似不良视频的数目获取网站的不良似然度。
7.根据权利要求6所述的一种网站不良似然度获取装置,其特征在于,所述第一统计单元包括:
关键字匹配模块,用于用预设的不良关键字字库与网站中的每个文本文件的文字进行匹配;
数目统计模块,用于统计每个文本文件中不良关键字匹配个数和总次数;
文本计数模块,用于当文本文件中的不良关键字匹配个数和次数均达到阈值时,将该文本文件标记为疑似不良文本,统计网站中的疑似不良文本的数目。
8.根据权利要求6所述的一种网站不良似然度获取装置,其特征在于,所述第二统计单元包括:
图片参数提取模块,用于提取网站中每张图片的肤色、纹理和姿态参数;
图片打分模块,用于根据图片的肤色、纹理和姿态参数对图片进行不良疑似度打分;
图片计数模块,用于当图片的分数在预设范围内时,将该图片标记为疑似不良图片,统计网站中的疑似不良图片数目。
9.根据权利要求6所述的一种网站不良似然度获取装置,其特征在于,所述第三统计单元包括:
关键帧抽取模块,用于从网站的每个视频中抽取关键帧;
帧参数提取模块,用于提取每个关键帧的肤色、纹理和姿态参数;
关键帧打分模块,用于根据关键帧的肤色、纹理和姿态参数对关键帧进行不良疑似度打分;
关键帧标记模块,用于当关键帧的分数在预设范围内时,将该关键帧标记为疑似不良帧;
视频计数模块,用于当视频的疑似不良帧占视频关键帧的比例达到预设的阈值时,将该视频标记为疑似不良视频,统计网站疑似不良视频的数目。
10.根据权利要求6所述的一种网站不良似然度获取装置,其特征在于,所述似然度计算单元具体用于:
根据疑似不良文本、疑似不良图片和疑似不良视频的数目,预设的权重,预设的置信度获取网站的不良似然度;所述不良似然度的获取方法为:
S=α×Z1×S1+β×Z2×S2+γ×Z3×S3
其中,S表示网站的不良似然度值;α表示文本的权重;Z1表示文本的置信度;S1表示疑似不良文本的数量;β表示图片的权重;Z2表示图片的置信度;S2表示疑似不良图片的数量;γ表示视频的权重;Z3表示视频的置信度;S3表示疑似不良视频的数量;α+β+γ=1。
CN201310404372.6A 2013-09-06 2013-09-06 一种网站不良似然度获取方法和装置 Active CN103473299B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310404372.6A CN103473299B (zh) 2013-09-06 2013-09-06 一种网站不良似然度获取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310404372.6A CN103473299B (zh) 2013-09-06 2013-09-06 一种网站不良似然度获取方法和装置

Publications (2)

Publication Number Publication Date
CN103473299A true CN103473299A (zh) 2013-12-25
CN103473299B CN103473299B (zh) 2017-02-08

Family

ID=49798147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310404372.6A Active CN103473299B (zh) 2013-09-06 2013-09-06 一种网站不良似然度获取方法和装置

Country Status (1)

Country Link
CN (1) CN103473299B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389558A (zh) * 2015-11-10 2016-03-09 中国人民解放军信息工程大学 一种视频检测方法及装置
CN105721902A (zh) * 2014-12-17 2016-06-29 云播颂文创科技有限公司 智能推播方法及其系统
CN107766234A (zh) * 2017-08-31 2018-03-06 广州数沃信息科技有限公司 一种基于移动设备的网页健康度的测评方法、装置及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761204A (zh) * 2005-11-18 2006-04-19 郑州金惠计算机系统工程有限公司 在互联网上堵截色情图像与不良信息的系统
CN101055621A (zh) * 2006-04-10 2007-10-17 中国科学院自动化研究所 基于内容的敏感网页识别方法
CN101359329A (zh) * 2008-04-01 2009-02-04 北京恒金恒泰信息技术有限公司 基于浏览器的过滤色情软件插件
CN101388025A (zh) * 2008-10-09 2009-03-18 浙江大学 一种基于Pagerank的语义网对象排序方法
CN101834846A (zh) * 2010-03-30 2010-09-15 王兴强 一种未成年人健康网站认证系统及其认证方法
CN101853300A (zh) * 2010-05-26 2010-10-06 中国科学技术大学 一种视频下载服务网站的识别、评估方法及系统
CN101867932A (zh) * 2010-05-21 2010-10-20 武汉虹旭信息技术有限责任公司 一种基于移动互联网的有害信息过滤系统及其方法
CN101996203A (zh) * 2009-08-13 2011-03-30 阿里巴巴集团控股有限公司 一种过滤网页信息的方法和系统
CN102110122A (zh) * 2009-12-24 2011-06-29 阿里巴巴集团控股有限公司 一种建立样本图片索引表和图片过滤、搜索方法及装置
CN102170640A (zh) * 2011-06-01 2011-08-31 南通海韵信息技术服务有限公司 基于模式库的智能手机端不良内容网站鉴别方法
CN102332028A (zh) * 2011-10-15 2012-01-25 西安交通大学 一种面向网页的不良Web内容识别方法
CN102693236A (zh) * 2011-03-24 2012-09-26 苏州风采信息技术有限公司 基于内容理解的不良信息过滤方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761204A (zh) * 2005-11-18 2006-04-19 郑州金惠计算机系统工程有限公司 在互联网上堵截色情图像与不良信息的系统
CN101055621A (zh) * 2006-04-10 2007-10-17 中国科学院自动化研究所 基于内容的敏感网页识别方法
CN101359329A (zh) * 2008-04-01 2009-02-04 北京恒金恒泰信息技术有限公司 基于浏览器的过滤色情软件插件
CN101388025A (zh) * 2008-10-09 2009-03-18 浙江大学 一种基于Pagerank的语义网对象排序方法
CN101996203A (zh) * 2009-08-13 2011-03-30 阿里巴巴集团控股有限公司 一种过滤网页信息的方法和系统
CN102110122A (zh) * 2009-12-24 2011-06-29 阿里巴巴集团控股有限公司 一种建立样本图片索引表和图片过滤、搜索方法及装置
CN101834846A (zh) * 2010-03-30 2010-09-15 王兴强 一种未成年人健康网站认证系统及其认证方法
CN101867932A (zh) * 2010-05-21 2010-10-20 武汉虹旭信息技术有限责任公司 一种基于移动互联网的有害信息过滤系统及其方法
CN101853300A (zh) * 2010-05-26 2010-10-06 中国科学技术大学 一种视频下载服务网站的识别、评估方法及系统
CN102693236A (zh) * 2011-03-24 2012-09-26 苏州风采信息技术有限公司 基于内容理解的不良信息过滤方法
CN102170640A (zh) * 2011-06-01 2011-08-31 南通海韵信息技术服务有限公司 基于模式库的智能手机端不良内容网站鉴别方法
CN102332028A (zh) * 2011-10-15 2012-01-25 西安交通大学 一种面向网页的不良Web内容识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘蔚琴: "网络敏感信息监控系统研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 9, 15 September 2008 (2008-09-15), pages 139 - 88 *
陈欣: "基于文本和图像内容分析的中文敏感网页识别关键技术研究", 《万方数据库》, 31 December 2010 (2010-12-31) *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105721902A (zh) * 2014-12-17 2016-06-29 云播颂文创科技有限公司 智能推播方法及其系统
CN105389558A (zh) * 2015-11-10 2016-03-09 中国人民解放军信息工程大学 一种视频检测方法及装置
CN107766234A (zh) * 2017-08-31 2018-03-06 广州数沃信息科技有限公司 一种基于移动设备的网页健康度的测评方法、装置及系统

Also Published As

Publication number Publication date
CN103473299B (zh) 2017-02-08

Similar Documents

Publication Publication Date Title
US9705761B2 (en) Opinion information display system and method
US10380117B2 (en) Event occurrence place estimation method, computer-readable recording medium storing event occurrence place estimation program, and event occurrence place estimation apparatus
CN106250837A (zh) 一种视频的识别方法、装置和系统
CN106713579B (zh) 一种电话号码识别方法及装置
CN103336766A (zh) 短文本垃圾识别以及建模方法和装置
CN105704685B (zh) 一种短信安全处理方法及装置
CN106874253A (zh) 识别敏感信息的方法及装置
US9692771B2 (en) System and method for estimating typicality of names and textual data
CN104298665A (zh) 一种中文文本中评价对象的识别方法及装置
WO2015061046A3 (en) Method and apparatus for performing topic-relevance highlighting of electronic text
CN103546446A (zh) 一种钓鱼网站的检测方法、装置和终端
CN105550253B (zh) 一种类型关系的获取方法及装置
CN103870799A (zh) 字符方向判断方法及装置
CN104391641A (zh) 信息处理方法及装置
CN105320734A (zh) 一种网页核心内容提取方法
CN103473299A (zh) 一种网站不良似然度获取方法和装置
CN105959811B (zh) 一种视频网站弹幕合并方法及装置
CN103544150A (zh) 为移动终端浏览器提供推荐信息的方法及系统
CN104281850A (zh) 一种文字区域识别方法和装置
CN103092838B (zh) 一种获取英文词的方法及装置
CN103632070B (zh) 用于支付系统的手写任意图形密码方法
CN104077320B (zh) 一种用于生成待发布信息的方法和装置
CN105068988B (zh) 多维度和多粒度情感分析方法
CN106897291B (zh) 基于截屏操作的搜索方法及装置
US20130230248A1 (en) Ensuring validity of the bookmark reference in a collaborative bookmarking system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant