CN102523311B - 非法域名识别方法及装置 - Google Patents

非法域名识别方法及装置 Download PDF

Info

Publication number
CN102523311B
CN102523311B CN201110382578.4A CN201110382578A CN102523311B CN 102523311 B CN102523311 B CN 102523311B CN 201110382578 A CN201110382578 A CN 201110382578A CN 102523311 B CN102523311 B CN 102523311B
Authority
CN
China
Prior art keywords
domain name
illegal
subset
occurrence matrix
illegal domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110382578.4A
Other languages
English (en)
Other versions
CN102523311A (zh
Inventor
尉迟学彪
金键
李晓东
黄向阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Internet Network Information Center
Original Assignee
Computer Network Information Center of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Network Information Center of CAS filed Critical Computer Network Information Center of CAS
Priority to CN201110382578.4A priority Critical patent/CN102523311B/zh
Publication of CN102523311A publication Critical patent/CN102523311A/zh
Application granted granted Critical
Publication of CN102523311B publication Critical patent/CN102523311B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种非法域名识别方法及装置,该非法域名识别方法包括:获取域名访问行为信息,根据所述域名访问行为信息生成共现矩阵,所述共现矩阵中的元素用以指示所述元素所在的行对应的用户对所述元素所在的列对应的域名的访问次数;根据聚类算法对所述共现矩阵进行聚类分析,将所述共现矩阵中各列对应的域名划分为多个域名子集;根据非法域名列表确定各所述域名子集中域名的合法性。该非法域名识别装置包括共现矩阵生成模块、域名子集划分模块和合法性确定模块。本发明提供的非法域名识别方法及装置,针对了非法域名的特殊性,对域名间潜在的关联进行分析,以将非法域名和合法域名区分开,提高了非法网站的识别效率。

Description

非法域名识别方法及装置
技术领域
本发明涉及信息技术,尤其涉及一种非法域名识别方法及装置。
背景技术
域名是互联网的基础资源,相当于互联网上的门牌号码,是用于标识互联网上的计算机,是网站、电子邮箱等各种互联网应用的载体。非法域名是指以从事反动、涉黄、赌博网站等不良应用为目的或者其他非正常应用而存在的域名。
目前,针对非法域名的识别主要有两种方法。一是相关域名管理机构通过对域名相关注册信息、所辖网站内容等进行审核,人工判断该域名是否涉嫌非法。二是利用网页抽取、文本挖掘等技术手段对相关网站内容的语义分析来达到非法域名自动识别的目的。
上述两种方式非法域名识别的方法,在实际应用中都存在一定程度的弊端。第一种人工识别方式通常需要耗费大量的人力物力,效率低下,面对千万计的域名注册量,这种方法显然不能对非法域名实现及时有效的识别。第二种自动识别方式,虽然在一定程度上弥补了上述方式的不足,然而海量域名下网站内容的抽取入库过程依然繁琐,不仅需要耗费大量的存储资源,还要考虑该库的实时更新问题。另外,通过相关文本挖掘算法对入库后的内容进行分析的过程同样复杂且存在效率低下的问题。
发明内容
本发明提供一种非法域名识别方法及装置,以提高非法域名的识别效率。
本发明提供一种非法域名识别方法,包括:
获取域名访问行为信息,根据所述域名访问行为信息生成共现矩阵,所述共现矩阵中的元素用以指示所述元素所在的行对应的用户对所述元素所在的列对应的域名的访问次数;
根据聚类算法对所述共现矩阵进行聚类分析,将所述共现矩阵中各列对应的域名划分为多个域名子集;
根据非法域名列表确定各所述域名子集中域名的合法性。
本发明提供一种非法域名识别装置,包括:
共现矩阵生成模块,用于获取域名访问行为信息,根据所述域名访问行为信息生成共现矩阵,所述共现矩阵中的元素用以指示所述元素所在的行对应的用户对所述元素所在的列对应的域名的访问次数;
域名子集划分模块,用于根据聚类算法对所述共现矩阵进行聚类分析,将所述共现矩阵中各列对应的域名划分为多个域名子集;
合法性确定模块,用于根据非法域名列表确定各所述域名子集中域名的合法性。
由上述技术方案可知,本发明提供的非法域名识别方法及装置,通过对根据域名访问行为信息生成共现矩阵,根据聚类算法对共现矩阵进行聚类分析,将共现矩阵中各列对应的域名划分为多个域名子集,根据非法域名列表确定各域名子集中域名的合法性。针对了非法域名的特殊性,其面向的互联网用户群体与正常域名所面向的用户群体会表现出较大的差异的特点,对域名间潜在的关联进行分析,以将非法域名和合法域名区分开,提高了非法网站的识别效率。
附图说明
图1为本发明实施例提供的非法域名识别方法流程图;
图2为本发明实施例提供的非法域名识别装置结构示意图。
具体实施方式
图1为本发明实施例提供的非法域名识别方法流程图。如图1所示,本实施例提供的非法域名识别方法具体可以应用于对域名合法性的识别分析,可以通过非法域名识别装置来执行,该非法域名识别装置可以为服务器。
本实施例提供的非法域名识别方法具体包括:
步骤10、获取域名访问行为信息,根据域名访问行为信息生成共现矩阵,共现矩阵中的元素用以指示元素所在的行对应的用户对元素所在的列对应的域名的访问次数;
域名访问行为信息具体可以为预设时间段内的用户访问域名行为的信息,该域名访问行为信息可以从递归服务器或者权威服务器中获取。对域名访问行为信息中的域名访问数据进行数据抽取,假设经过抽取后的用户集合为U={u1,u2,...,uM},域名集合为D={d1,d2,...,dN},将用户的域名访问行为抽象为集合U与集合D之间交互关系,如图2所示。这种交互关系进一步表示为用户与域名之间的M×N阶共现矩阵UD:
UD=[w(um,dn)]M×N;
其中,w(um,dn)为该段时间内用户um与域名dn的共现次数,即用户um对域名dn的访问次数。
步骤20、根据聚类算法对共现矩阵进行聚类分析,将共现矩阵中各列对应的域名划分为多个域名子集;
聚类算法具体可以为潜在语义分析(Latent Semantic Analysis,简称LSA)算法或概率潜在语义分析(Probability Latent Semantic Analysis,简称PLSA)算法等。根据聚类算法对共现矩阵进行聚类分析,将共现矩阵中各列对应的域名划分为多个域名子集,每个域名子集至少包含了一个域名,域名子集中的各域名的访问行为具有相似性。
步骤30、根据非法域名列表确定各域名子集中域名的合法性。
非法域名列表中包含了已经确定的非法域名,这些已经确定的非法域名可以为从网络中公开信息中获取的,也可以为相关部门提供的,还可以为通过网页抽取和文本挖掘技术获取到的。将划分后的各域名子集,分别与已知的非法域名列表进行比较,如果某一域名子集中含有一部分或者全部已知非法域名列表中的域名,则该子集中的域名可被视为非法的域名集合,该域名集合中的域名为非法域名。
由于非法域名的特殊性,其面向的互联网用户群体往往会相对独立和集中,并且与正常域名所面向的用户群体会表现出较大的差异。对非法域名有特殊兴趣的互联网用户,其域名查询行为,必定有别于与其兴趣不同的互联网用户群体。换句话说,非法域名间潜在的关联关系会更强,非法域名比合法域名间的独立性会更高。因此,根据互联网用户与域名间的共现关系来对域名集合进行划分,可以有效的将非法域名和合法域名区分开来。
本实施例提供的非法域名识别方法,通过对根据域名访问行为信息生成共现矩阵,根据聚类算法对共现矩阵进行聚类分析,将共现矩阵中各列对应的域名划分为多个域名子集,根据非法域名列表确定各域名子集中域名的合法性。针对了非法域名的特殊性,其面向的互联网用户群体与正常域名所面向的用户群体会表现出较大的差异的特点,对域名间潜在的关联进行分析,以将非法域名和合法域名区分开,提高了非法网站的识别效率。
在本实施例中,步骤30,根据非法域名列表确定各域名子集中域名的合法性,具体可以包括如下步骤:
步骤301、将域名子集中的域名与非法域名列表中的域名进行比较,若域名子集与非法域名列表中相同的域名的数量大于预设阈值,则确定域名子集中的域名为非法域名。
预设阈值具体可以根据实际的非法域名识别准确度需要来设置。
进一步地,确定域名子集中的域名为涉嫌非法域名之后,具体还可以包括如下步骤:
步骤302、将非法域名作为一级非法域名,对一级非法域名中与非法域名列表中的域名不同的域名对应的网站进行文本挖掘,若判断获知一级非法域名对应的网站中包含非法信息,则将一级非法域名确定为二级非法域名。
可以设置非法域名的等级,将大量的域名经过上述步骤的分析处理后,获得小范围的非法域名的集合,将这些非法域名作为一级非法域名。再对一级非法域名进行进一步地的处理,可以采用文本挖掘的方法获取域名对应网站内容,并对网站内容中非法信息进行判断,若判断获知一级非法域名对应的网站中包含非法信息,则将一级非法域名确定为二级非法域名。通过对一级非法域名进行进一步的识别,可以提高非法域名识别的准确性。
在本实施例中,优选地,聚类算法为概率潜在语义分析(PLSA)算法。根据概率潜在语义分析算法对共现矩阵进行聚类分析,将共现矩阵中各列对应的域名划分为多个域名子集的实现方式具体如下:
定义类别的集合Z={z1,z2,...,zc},类别的数量c可以根据用户集合U和域名集合D的大小情况来设置,并可以根据分类的质量来选择一个最佳值。具体的,高质量的类别划分应使相同类别内的域名访问行为相似性最高,而不同类别间的域名访问行为相似性最低。为了对类别划分的质量进行量化评估,对于每个类别k,计算该类别的独立程度Ck
Ck=Cki/Cko
其中Cki表示类别k内部的域名集合和用户集合间的交互程度,Cko表示类别k与其他类别间的交互程度。
C ki = 1 | U k | | D k | Σ i ∈ U k , j ∈ D k w ( u i , d j ) ;
C ko = Σ k ′ = 1 , k ′ ≠ k c 1 | U k | | D k ′ | + | U k ′ | | D k | Σ k ′ = 1 , k ′ ≠ k c ( Σ i ∈ U k , j ∈ D k ′ w ( u i , d j ) + Σ i ∈ U k ′ , j ∈ D k w ( u i , d j ) ) ;
其中,Uk和Dk分别代表类别k中的用户集合和域名集合。
则对于一个被划分为类别总数为c的对象集合,其总体分类质量CC可以表示为:
C C = 1 c Σ k = 1 c C k ;
由此,对于不同的列别数量c,可以选择一个能够使CC值达到最优的作为类别的最终数量。
从用户集合U中选择一个用户ui,概率为Pr(ui),为用户ui分配一个类别zk,概率为Pr(zk|ui),从域名集合D中选取一个域名dj,概率为Pr(dj|zk)。
则用户ui与域名dj间存在访问行为的联合概率Pr(ui,dj)为:
Pr(ui,dj)=Pr(ui)Pr(dj|ui);
其中, Pr ( d j | u i ) = Σ k = 1 C Pr ( d j | z k ) Pr ( z k | u i ) ;
根据贝叶斯定理,该联合概率Pr(ui,dj)可以转化为:
Pr ( u i , d j ) = Σ k = 1 C Pr ( z k ) Pr ( u i | z k ) Pr ( d j | z k ) ;
定义用于描述联合概率期望的似然函数L(U,D):
L ( U , D ) = Σ i = 1 M Σ j = 1 N w ( u i , d j ) log Pr ( u i , d j ) ;
则为使该似然函数L(U,D)的值达到最大,需要对Pr(zk),Pr(ui|zk)和Pr(dj|zk)三类参数进行估计。
首先设定上述三类参数的初始值,然后,可以通过E-M算法(Expectation-Maximization)对该三类参数进行极大似然估计。该过程迭代执行以下两个步骤:
计算条件概率Pr(zk|uj,dj):
Pr ( z k | u i , d j ) = Pr ( z k ) Pr ( u i | z k ) Pr ( d j | z k ) Σ k ′ = 1 C Pr ( z k ′ ) Pr ( u i | z k ′ ) Pr ( d j | z k ′ ) ;
将条件概率Pr(zk|ui,dj)代入完全似然期望E(LC),初始值设为0:
E ( LC ) = Σ i = 1 M Σ i = 1 N w ( u i , d j ) Σ k = 1 C Pr ( z k | u i , d j ) log Pr ( u i , d j ) ;
判断当前E(LC)是否大于旧值,若是,继续执行以下步骤;否则终止该迭代过程。
利用上述公式求得的Pr(zk|ui,dj),分别求得上述三类参数的更新值:
Pr ( z k ) = Σ i = 1 M Σ j = 1 N w ( u i , d j ) Pr ( z k | u i , d j ) Σ i = 1 M Σ j = 1 N Σ k ′ = 1 C w ( u i , d j ) Pr ( z k ′ | u i , d j ) = Σ i = 1 M Σ j = 1 N w ( u i , d j ) Pr ( z k | u i , d j ) Σ i = 1 M Σ j = 1 N w ( u i , d j ) ;
Pr ( u i | z k ) = Σ j = 1 N w ( u i , d j ) Pr ( z k | u i , d j ) Σ i ′ = 1 M Σ j = 1 N w ( u i , d j ) Pr ( z k | u i ′ , d j ) ;
Pr ( d j | z k ) = Σ i = 1 N w ( u i , d j ) Pr ( z k | u i , d j ) Σ i ′ = 1 M Σ j ′ = 1 N w ( u i , d j ′ ) Pr ( z k | u i ′ , d j ′ ) ;
将上述求得的三类参数代入计算条件概率的公式中,迭代执行上述步骤,直至终止。迭代过程结束以后,根据所求得的Pr(zk)和Pr(ui|zk)可以求得某一个用户ui属于类别zk概率:
Pr ( z k | u i ) = Pr ( u i | z k ) Pr ( z k ) Σ k ′ = 1 C Pr ( u i | z k ′ ) Pr ( z k ′ ) ;
对所有的zk,1≤k≤C,计算概率Pr(zk|ui)的值,其中的最大值所对应的k即是用户ui所属的类别。依此对所有的互联网用户进行计算,就可以得到所有用户的类别属性,由此达到对互联网用户进行类别划分的目的。
图2为本发明实施例提供的非法域名识别装置结构示意图。如图2所示,本实施例提供非法域名识别装置具体可以实现本发明任意实施例提供的非法域名识别方法的各个步骤,此不再赘述。
本实施例提供的非法域名识别装置具体包括共现矩阵生成模块11、域名子集划分模块12和合法性确定模块13。共现矩阵生成模块11用于获取域名访问行为信息,根据域名访问行为信息生成共现矩阵,共现矩阵中的元素用以指示元素所在的行对应的用户对元素所在的列对应的域名的访问次数。域名子集划分模块12用于根据聚类算法对共现矩阵进行聚类分析,将共现矩阵中各列对应的域名划分为多个域名子集。合法性确定模块13用于根据非法域名列表确定各域名子集中域名的合法性。
本实施例提供的非法域名识别装置,通过共现矩阵生成模块11的设置对根据域名访问行为信息生成共现矩阵,域名子集划分模块12根据聚类算法对共现矩阵进行聚类分析,将共现矩阵中各列对应的域名划分为多个域名子集,合法性确定模块13根据非法域名列表确定各域名子集中域名的合法性。针对了非法域名的特殊性,其面向的互联网用户群体与正常域名所面向的用户群体会表现出较大的差异的特点,对域名间潜在的关联进行分析,以将非法域名和合法域名区分开,提高了非法网站的识别效率。
在本实施例中,合法性确定模块13还用于将域名子集中的域名与非法域名列表中的域名进行比较,若域名子集与非法域名列表中相同的域名的数量大于预设阈值,则确定域名子集中的域名为非法域名。
在本实施例中,合法性确定模块13还用于将非法域名作为一级非法域名,对一级非法域名中与非法域名列表中的域名不同的域名对应的网站进行文本挖掘,若判断获知一级非法域名对应的网站中包含非法信息,则将一级非法域名确定为二级非法域名。
在本实施例中,域名子集划分模块12还用于根据概率潜在语义分析算法对共现矩阵进行聚类分析,将共现矩阵中各列对应的域名划分为多个域名子集。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种非法域名识别方法,其特征在于,包括:
获取域名访问行为信息,根据所述域名访问行为信息生成共现矩阵,所述共现矩阵中的元素用以指示所述元素所在的行对应的用户对所述元素所在的列对应的域名的访问次数;
根据聚类算法对所述共现矩阵进行聚类分析,将所述共现矩阵中各列对应的域名划分为多个域名子集,其中每个所述域名子集中的各域名的访问行为具有相似性;
根据非法域名列表确定各所述域名子集中域名的合法性。
2.根据权利要求1所述的非法域名识别方法,其特征在于,所述根据非法域名列表确定各所述域名子集中域名的合法性,包括:
将所述域名子集中的域名与所述非法域名列表中的域名进行比较,若所述域名子集与所述非法域名列表中相同的域名的数量大于预设阈值,则确定所述域名子集中的域名为非法域名。
3.根据权利要求2所述的非法域名识别方法,其特征在于,所述确定所述域名子集中的域名为涉嫌非法域名之后,还包括:
将所述非法域名作为一级非法域名,对所述一级非法域名中与所述非法域名列表中的域名不同的域名对应的网站进行文本挖掘,若判断获知所述一级非法域名对应的网站中包含非法信息,则将所述一级非法域名确定为二级非法域名。
4.根据权利要求1所述的非法域名识别方法,其特征在于:所述聚类算法为概率潜在语义分析算法。
5.一种非法域名识别装置,其特征在于,包括:
共现矩阵生成模块,用于获取域名访问行为信息,根据所述域名访问行为信息生成共现矩阵,所述共现矩阵中的元素用以指示所述元素所在的行对应的用户对所述元素所在的列对应的域名的访问次数;
域名子集划分模块,用于根据聚类算法对所述共现矩阵进行聚类分析,将所述共现矩阵中各列对应的域名划分为多个域名子集,其中每个所述域名子集中的各域名的访问行为具有相似性;
合法性确定模块,用于根据非法域名列表确定各所述域名子集中域名的合法性。
6.根据权利要求5所述的非法域名识别装置,其特征在于:所述合法性确定模块还用于将所述域名子集中的域名与所述非法域名列表中的域名进行比较,若所述域名子集与所述非法域名列表中相同的域名的数量大于预设阈值,则确定所述域名子集中的域名为非法域名。
7.根据权利要求6所述的非法域名识别装置,其特征在于:所述合法性确定模块还用于将所述非法域名作为一级非法域名,对所述一级非法域名中与所述非法域名列表中的域名不同的域名对应的网站进行文本挖掘,若判断获知所述一级非法域名对应的网站中包含非法信息,则将所述一级非法域名确定为二级非法域名。
8.根据权利要求5所述的非法域名识别装置,其特征在于:所述域名子集划分模块还用于根据概率潜在语义分析算法对所述共现矩阵进行聚类分析,将所述共现矩阵中各列对应的域名划分为多个域名子集。
CN201110382578.4A 2011-11-25 2011-11-25 非法域名识别方法及装置 Active CN102523311B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110382578.4A CN102523311B (zh) 2011-11-25 2011-11-25 非法域名识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110382578.4A CN102523311B (zh) 2011-11-25 2011-11-25 非法域名识别方法及装置

Publications (2)

Publication Number Publication Date
CN102523311A CN102523311A (zh) 2012-06-27
CN102523311B true CN102523311B (zh) 2014-08-06

Family

ID=46294098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110382578.4A Active CN102523311B (zh) 2011-11-25 2011-11-25 非法域名识别方法及装置

Country Status (1)

Country Link
CN (1) CN102523311B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103581347B (zh) * 2012-07-23 2019-03-26 深圳市世纪光速信息技术有限公司 泛滥子域的识别方法和系统
CN102984178B (zh) * 2012-12-31 2015-07-29 山石网科通信技术有限公司 数据报文的检测方法及装置
CN103491074A (zh) * 2013-09-09 2014-01-01 中国科学院计算机网络信息中心 僵尸网络检测方法及装置
CN105099996B (zh) * 2014-04-30 2020-03-06 奇安信科技集团股份有限公司 网站验证方法及装置
CN105376217B (zh) * 2015-10-15 2019-01-04 中国互联网络信息中心 一种恶意跳转及恶意嵌套类不良网站的自动判定方法
CN108809904A (zh) * 2017-05-03 2018-11-13 互联网域名系统北京市工程研究中心有限公司 一种域名注册的审核方法和系统
CN107645503B (zh) * 2017-09-20 2020-01-24 杭州安恒信息技术股份有限公司 一种基于规则的恶意域名所属dga家族的检测方法
CN108712403B (zh) * 2018-05-04 2020-08-04 哈尔滨工业大学(威海) 基于域名构造相似性的非法域名挖掘方法
CN111131260B (zh) * 2019-12-24 2020-09-15 邑客得(上海)信息技术有限公司 一种海量网络恶意域名识别和分类方法及系统
CN111031068B (zh) * 2019-12-27 2022-04-26 杭州安恒信息技术股份有限公司 一种基于复杂网络的dns分析方法
CN114024718B (zh) * 2021-10-12 2024-05-07 鹏城实验室 恶意域名检测方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761204A (zh) * 2005-11-18 2006-04-19 郑州金惠计算机系统工程有限公司 在互联网上堵截色情图像与不良信息的系统
CN101458713A (zh) * 2008-12-29 2009-06-17 北京搜狗科技发展有限公司 网站分类的方法及系统
CN101634983A (zh) * 2008-07-21 2010-01-27 华为技术有限公司 一种文本分类方法和装置
CN101692639A (zh) * 2009-09-15 2010-04-07 西安交通大学 一种基于url的不良网页识别方法
CN102236652A (zh) * 2010-04-27 2011-11-09 腾讯科技(深圳)有限公司 一种信息的分类方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8219533B2 (en) * 2007-08-29 2012-07-10 Enpulz Llc Search engine feedback for developing reliable whois database reference for restricted search operation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1761204A (zh) * 2005-11-18 2006-04-19 郑州金惠计算机系统工程有限公司 在互联网上堵截色情图像与不良信息的系统
CN101634983A (zh) * 2008-07-21 2010-01-27 华为技术有限公司 一种文本分类方法和装置
CN101458713A (zh) * 2008-12-29 2009-06-17 北京搜狗科技发展有限公司 网站分类的方法及系统
CN101692639A (zh) * 2009-09-15 2010-04-07 西安交通大学 一种基于url的不良网页识别方法
CN102236652A (zh) * 2010-04-27 2011-11-09 腾讯科技(深圳)有限公司 一种信息的分类方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《潜在语义分析理论及其应用 》;盖杰 等;《计算机应用研究》;20040328(第3期);第9-12页 *
盖杰 等.《潜在语义分析理论及其应用 》.《计算机应用研究》.2004,(第3期),第9-12页.

Also Published As

Publication number Publication date
CN102523311A (zh) 2012-06-27

Similar Documents

Publication Publication Date Title
CN102523311B (zh) 非法域名识别方法及装置
Wu et al. Beyond views: Measuring and predicting engagement in online videos
Johnston et al. Analytical guidelines to increase the value of community science data: An example using eBird data to estimate species distributions
Papadogeorgou et al. Causal inference with interfering units for cluster and population level treatment allocation programs
Lakkaraju et al. What's in a name? understanding the interplay between titles, content, and communities in social media
Citron et al. Patterns of text reuse in a scientific corpus
Shulman et al. Predictability of popularity: Gaps between prediction and understanding
Javanmardi et al. Modeling user reputation in wikis
US9183293B2 (en) Systems and methods for scalable topic detection in social media
Hassan et al. A task level metric for measuring web search satisfaction and its application on improving relevance estimation
US8732015B1 (en) Social media pricing engine
Lim et al. Following the follower: Detecting communities with common interests on Twitter
CN102708131A (zh) 将消费者自动分类到微细分中
US8910188B1 (en) Deterministic data processing
Hristakieva et al. The spread of propaganda by coordinated communities on social media
KR101269441B1 (ko) 의미기반 특허 청구항 분석에 기반한 특허 침해 판단 장치 및 그 방법
CN102262647A (zh) 信息处理装置、信息处理方法和程序
US20230214863A1 (en) Methods and apparatus to correct age misattribution
US11005843B1 (en) System and means for detecting automated programs used to generate social media input
Srba et al. Auditing YouTube’s recommendation algorithm for misinformation filter bubbles
Weiss et al. Measuring the complexity of social associations using mixture models
CN111461778B (zh) 广告推送的方法和装置
CN105654198A (zh) 具有最优阈值筛选的品牌广告效果优化的方法
CN111178983A (zh) 用户性别预测方法、装置、设备及存储介质
McCaffrey et al. Power of tests for a dichotomous independent variable measured with error

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210218

Address after: 100190 room 506, building 2, courtyard 4, South 4th Street, Zhongguancun, Haidian District, Beijing

Patentee after: CHINA INTERNET NETWORK INFORMATION CENTER

Address before: 100190 No. four, four South Street, Haidian District, Beijing, Zhongguancun

Patentee before: Computer Network Information Center, Chinese Academy of Sciences

TR01 Transfer of patent right