CN105988993A - 检测网站上注册的姓名合理性的方法和装置 - Google Patents

检测网站上注册的姓名合理性的方法和装置 Download PDF

Info

Publication number
CN105988993A
CN105988993A CN201510101458.0A CN201510101458A CN105988993A CN 105988993 A CN105988993 A CN 105988993A CN 201510101458 A CN201510101458 A CN 201510101458A CN 105988993 A CN105988993 A CN 105988993A
Authority
CN
China
Prior art keywords
name
detected
storehouse
probability
transition probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510101458.0A
Other languages
English (en)
Other versions
CN105988993B (zh
Inventor
顾思源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510101458.0A priority Critical patent/CN105988993B/zh
Publication of CN105988993A publication Critical patent/CN105988993A/zh
Application granted granted Critical
Publication of CN105988993B publication Critical patent/CN105988993B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本申请提出一种检测网站上注册的姓名合理性的方法和装置,该检测网站上注册的姓名合理性的方法包括接收待检测的姓名;根据预先建立的姓名库中字符的概率信息,获取所述待检测的姓名对应的参数值;根据所述参数值,确定所述待检测的姓名的合理性。该方法能够确定出网络上注册的姓名合理性,从而降低恶意注册。

Description

检测网站上注册的姓名合理性的方法和装置
技术领域
本申请涉及数据处理技术领域,尤其涉及一种检测网站上注册的姓名合理性的方法和装置。
背景技术
用户在网站注册时需要提交真实姓名,一些恶意用户往往使用键盘上随机输入的字符串作为注册用的姓或者名,例如使用”fajfkajdf”作为注册用的姓或者名,很明显这一串字符串不符合任何一种语言的姓或者名的规则。
为了避免用户恶意注册,需要检测网站注册的姓名的合理性。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的一个目的在于提出一种检测网站上注册的姓名合理性的方法,该方法可以确定出网络上注册的姓名合理性,从而降低恶意注册。
本申请的另一个目的在于提出一种检测网站上注册的姓名合理性的装置。
为达到上述目的,本申请第一方面实施例提出的检测网站上注册的姓名合理性的方法,包括:接收待检测的姓名;根据预先建立的姓名库中字符的概率信息,获取所述待检测的姓名对应的参数值;根据所述参数值,确定所述待检测的姓名的合理性。
本申请第一方面实施例提出的检测网站上注册的姓名合理性的方法,通过根据姓名库中字符的概率信息,获取待检测的姓名的参数值,根据参数值确定待检测的姓名的合理性,可以确定出网络上注册的姓名合理性,从而降低恶意注册。
为达到上述目的,本申请第二方面实施例提出的检测网站上注册的姓名合理性的装置,包括:接收模块,用于接收待检测的姓名;获取模块,用于根据预先建立的姓名库中字符的概率信息,获取所述待检测的姓名对应的参数值;确定模块,用于根据所述参数值,确定所述待检测的姓名的合理性。
本申请第二方面实施例提出的检测网站上注册的姓名合理性的装置,通过根据姓名库中字符的概率信息,获取待检测的姓名的参数值,根据参数值确定待检测的姓名的合理性,可以确定出网络上注册的姓名合理性,从而降低恶意注册。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请一实施例提出的检测网站上注册的姓名合理性的方法的流程示意图;
图2是本申请另一实施例提出的检测网站上注册的姓名合理性的方法的流程示意图;
图3是本申请另一实施例提出的检测网站上注册的姓名合理性的装置的结构示意图;
图4是本申请另一实施例提出的检测网站上注册的姓名合理性的装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本申请一实施例提出的检测网站上注册的姓名合理性的方法的流程示意图,该方法包括:
S11:接收待检测的姓名;
例如,接收用户通过键盘或者触摸屏输入的待检测的姓名。
待检测的姓名可以包括一个或多个字符串。
待检测的姓名例如为“asdfjkldk”。
S12:根据预先建立的姓名库中字符的概率信息,获取所述待检测的姓名对应的参数值。
其中,可以预先建立姓名库,姓名库可以是包括多种语种的姓名库,例如,包括中文,英文等语种的混合姓名库。或者,也可以对应每个待检测的姓名,获取与待检测的姓名具有相同语种的姓名库,例如,待检测的姓名是英文的,则可以获取英文的姓名库。具体的,可以根据待检测的姓名中字符是英文或者中文等确定相应的语种。
可选的,所述参数值是归一化后的值,所述根据预先建立的姓名库中字符的概率信息,获取所述待检测的姓名对应的参数值,包括:
根据所述概率信息,计算所述待检测的姓名被所述姓名库生成所需的次数值;
根据所述概率信息,计算所述待检测的姓名被所述姓名库生成对应的总的数学期望和总的标准差;
根据所述次数值,所述总的数学期望和所述总的标准差,计算所述参数值。
其中,所述概率信息包括:所述姓名库中每个首字符对应的首字符生成概率,以及,所述姓名库中姓名的相邻的两个字符间的转移概率。
例如,姓名库中的所有首字符生成概率可以组成一个行向量,以英文字符为例,行向量包括a对应的首字符生成概率,b对应的首字符生成概率,c对应的首字符生成概率等。
姓名库中的所有转移概率可以组成一个26x26的矩阵,其中,每行和每列分别对应一个字符,第i行第j列的元素表示从第i行的字符转移到第j的字符的转移概率,例如,第1行第1列的元素表示从a转移到a的转移概率,第1行第2列的元素表示从a转移到b的转移概率,第1行第3列的元素表示从a转移到c的转移概率,第2行第1列的元素表示从b转移到a的转移概率等。
在得到首字符生成概率组成的行向量,以及,转移概率组成的转移概率矩阵后,可以按照从大到小的顺序对每个概率进行排序。例如,按照从大到小的顺序对首字符生成概率进行排序,以及,对应转移概率矩阵的每一行,对该每行中的转移概率按照从大到小的顺序排序。
在排序后,可以确定待检测的姓名中的首字符生成概率的排序位数,以及,待检测的姓名中两两相邻字符的转移概率的排序位数,对每个排序位数进行相加可以得到次数值。
另外,对应首字符生成概率组成的行向量,以及转移概率矩阵的每一行的行向量可以得到数学期望和标准差,对每个数学期望和标准差分别相加,得到总的数学期望和标准差。
在得到次数值,总的数学期望和总的标准差后,进行归一化后,得到参数值。
具体的计算流程可以参见后续实施例。
S13:根据所述参数值,确定所述待检测的姓名的合理性。
例如,当该参数值小于预设值时,确定待检测的姓名是合理的,否则不合理。
本实施例中,通过根据姓名库中字符的概率信息,获取待检测的姓名的参数值,根据参数值确定待检测的姓名的合理性,可以确定出网络上注册的姓名合理性,从而降低恶意注册。
图2是本申请另一实施例提出的检测网站上注册的姓名合理性的方法的流程示意图,本实施例以英文姓名库为例,该方法包括:
S21:生成姓名库中每个首字符对应的首字符生成概率,以及,所述姓名库中姓名的相邻的两个字符间的转移概率。
其中,可以将已有的姓名作为学习样本,生成首字符生成概率以及转移概率。
首字符生成概率是26个字符分别作为姓名库字符串首字符的概率,转移概率就是这些姓名字符串中从前一个字符(26个字符中的一个)转移到下一个字符(26个字符中的一个)的概率。
例如,英文姓名库中有Johnson,White,Black……,则字符“j”作为首字符出现了1次,“w”作为首字符出现了1次,“b”作为首字符出现了1次,依此类推,可以得到每个字符作为首字符的出现次数,再用该次数除以姓名的总数,得到该字符的首字符生成概率,例如,“j”在姓名库中作为首字符出现了m词,姓名库中的姓名的总数是n,则“j”对应的首字符生成概率是m/n。
又例如,字符“j”到“o”转移了1次,“o”到“h”转移了1次,“h”到“n”转移了1次,依此类推,可以得到每个字符转移到下一个的次数,再用该次数除以姓名的总数,得到该两个字符之间的转移概率,例如,字符“j”到“o”转移了x次,姓名库中的姓名的总数是n,则字符“j”到”o”的转移概率是x/n。
首字符生成概率可以组成一个1x26的行向量,分别表示“a”~“z”中的每一个字符对应的首字符生成概率。
转移概率矩阵是26x26的矩阵,每一行代表“a”~“z”中的一个字符,每一列代表“a”~“z”中的一个字符,每一列代表前一个字符是此行对应的字符,下一个字符是此列对应的字符的概率。
S22:从所述概率信息中,获取第一首字符生成概率,以及第一转移概率,确定所述第一首字符生成概率在所述姓名库中所有的首字符生成概率中的排序位数,以及,所述第一转移概率在所述转移概率矩阵中对应行的所有的转移概率中的排序位数,并根据所述排序位数计算所述次数值,所述第一首字符生成概率是所述待检测的姓名中首字符对应的首字符生成概率,所述第一转移概率包括所述待检测的姓名中相邻的两个字符间的转移概率。
例如,待检测的姓名是“asdfjkldk”,次数值可以采用如下规则生成:
对上一步得到的所有的首字符生成概率按照从大到小的顺序进行排序,并找到“asdfjkldk”中首字符“a”的首字符生成概率在排序后的位数,例如“a”的首字符生成概率从大到小排序排在第5位,则第一个数值取5。
对上一步中获得的转移概率矩阵的每一行的元素按照从大到小排序,找到首字符“a”到下一个字符“s”的转移概率在排序后的位置,例如是第23位,则第二个数值为23。重复此计算,得出“s”到“d”,“d”到“f”……分别对应的排序位数,例如分别是22,21,25,19,20,24,22。
再将这些值求和,得到181。
S23:对所述姓名库中所有的首字符生成概率进行排序,根据每个首字符生成概率以及对应的排序位数,计算得到第一数学期望和第一标准差。
第一数学期望和第一标准差可以采用如下规则生成:
对首字符生成概率按照从大到小的顺序排序,第一数学期望是每一个首字符生成概率与此概率在排序后的位数的乘积的和,例如首字符生成概率按照从大到小的顺序排序为:
“s”:0.07
“t”:0.06
“c”:0.04
……
“x”:0.002
则第一数学期望是0.07*1+0.06*2+0.04*3+…+0.002*26=11.37;
第一标准差是:
0.07 * ( 1 - 11.37 ) 2 + 0.06 ( 2 - 11.37 ) 2 + 0.04 * ( 3 - 11.37 ) 2 + · · · + 0.002 * ( 26 - 11.37 ) 2
S24:对所述第一转移概率在所述转移概率矩阵的对应行的所有的转移概率进行排序,根据所述第一转移概率的对应行的每个转移概率以及对应的排序位数,计算得到第二数学期望和第二标准差。
可选的,可以计算转移概率矩阵中每一行向量对应的数学期望和标准差,再从中获取待检测的姓名的字符间转移对应的数学期望和标准差,作为第二数学期望和第二标准差,或者,只计算待检测的姓名的字符间转移对应的数学期望和标准差。
例如,在转移概率矩阵中,对应第一行,可以得到字符“a”转移出去的数学期望和标准差,对应第二行,可以得到字符“b”转移出去的数学期望和标准差,对应第三行,可以得到字符“c”转移出去的数学期望和标准差,依次类推,可以得到26个字符转移出去的数学期望和标准差,其中,每一行向量计算数学期望和标准差的方式可以如计算第一数学期望和第一标准差的方式。
再从中找到“a”转移出去的数学期望和标准差,“s”转移出去的数学期望和标准差,依次类推,还可以找到“d”,“f”,“j”,“k”,“l”,“d”转移出去的数学期望和标准差,从而得到8个第二数学期望和第二标准差。
S25:将所述第一数学期望和所述第二数学期望之后确定为总的数学期望,将所述第一标准差和所述第二标准差之和确定为总的标准差。
其中,可以将1+8=9个数学期望的和作为总的数学期望,将9个标准差的和作为总的标准差。
S26:计算所述次数值与所述总的数学期望的差值,将所述差值与所述总的标准差的比值,确定为所述参数值。
例如,参数值的计算公式为:
181 - E σ ;
其中,181是上述步骤计算得到的次数值,E是总的数学期望,σ是总的标准差。
S27:当所述参数值小于预设值时,确定所述待检测的姓名是合理的,否则不合理。
其中,预设值可以根据实际情况设置。
例如,预设值是3,则当小于3时,根据切比雪夫不等式(大数定律),待检测的姓名被该姓名库生成的概率大于或等于1/9,则该待检测的姓名是合理的,反之,如果该参数值大于或等于3,表明待检测的姓名被该姓名库生成的概率小于1/9,则该待检测的姓名是不合理的。
当识别出不合理后,可以禁止用户注册该姓名等。
本实施例中,通过根据姓名库中字符的概率信息,获取待检测的姓名的参数值,根据参数值确定待检测的姓名的合理性,可以确定出网络上注册的姓名合理性,从而降低恶意注册。本实施例通过上述计算流程可以确定待检测的姓名被姓名库生成的概率。
图3是本申请另一实施例提出的检测网站上注册的姓名合理性的装置的结构示意图,该装置30包括接收模块31,获取模块32和确定模块33。
接收模块31,用于接收待检测的姓名;
例如,接收用户通过键盘或者触摸屏输入的待检测的姓名。
待检测的姓名可以包括一个或多个字符串。
待检测的姓名例如为“asdfjkldk”。
获取模块32,用于根据预先建立的姓名库中字符的概率信息,获取所述待检测的姓名对应的参数值;
可选的,所述姓名库是与所述待检测的姓名具有相同语种的姓名库,或者,所述姓名库是多种语种的姓名库,所述多种语种包括所述待检测的姓名的具有的语种。
例如,包括中文,英文等语种的混合姓名库。或者,也可以对应每个待检测的姓名,获取与待检测的姓名具有相同语种的姓名库,例如,待检测的姓名是英文的,则可以获取英文的姓名库。具体的,可以根据待检测的姓名中字符是英文或者中文等确定相应的语种。
可选的,参见图4,所述参数值是归一化后的值,所述获取模块32包括:
第一单元321,用于根据所述概率信息,计算所述待检测的姓名被所述姓名库生成所需的次数值;
可选的,所述概率信息包括:所述姓名库中每个首字符对应的首字符生成概率,以及,所述姓名库中姓名的相邻的两个字符间的转移概率,所述转移概率组成转移概率矩阵,所述第一单元321具体用于:
从所述概率信息中,获取第一首字符生成概率,以及第一转移概率,所述第一首字符生成概率是所述待检测的姓名中首字符对应的首字符生成概率,所述第一转移概率包括所述待检测的姓名中相邻的两个字符间的转移概率;
确定所述第一首字符生成概率在所述姓名库中所有的首字符生成概率中的排序位数,以及,所述第一转移概率在所述转移概率矩阵中对应行的所有的转移概率中的排序位数,并根据所述排序位数计算所述次数值。
例如,姓名库中的所有首字符生成概率可以组成一个行向量,以英文字符为例,行向量包括a对应的首字符生成概率,b对应的首字符生成概率,c对应的首字符生成概率等。
姓名库中的所有转移概率可以组成一个26x26的矩阵,其中,每行和每列分别对应一个字符,第i行第j列的元素表示从第i行的字符转移到第j的字符的转移概率,例如,第1行第1列的元素表示从a转移到a的转移概率,第1行第2列的元素表示从a转移到b的转移概率,第1行第3列的元素表示从a转移到c的转移概率,第2行第1列的元素表示从b转移到a的转移概率等。
在得到首字符生成概率组成的行向量,以及,转移概率组成的转移概率矩阵后,可以按照从大到小的顺序对每个概率进行排序。例如,按照从大到小的顺序对首字符生成概率进行排序,以及,对应转移概率矩阵的每一行,对该每行中的转移概率按照从大到小的顺序排序。
在排序后,可以确定待检测的姓名中的首字符生成概率的排序位数,以及,待检测的姓名中两两相邻字符的转移概率的排序位数,对每个排序位数进行相加可以得到次数值。
例如,英文姓名库中有Johnson,White,Black……,则字符“j”作为首字符出现了1次,“w”作为首字符出现了1次,“b”作为首字符出现了1次,依此类推,可以得到每个字符作为首字符的出现次数,再用该次数除以姓名的总数,得到该字符的首字符生成概率,例如,“j”在姓名库中作为首字符出现了m词,姓名库中的姓名的总数是n,则“j”对应的首字符生成概率是m/n。
又例如,字符“j”到“o”转移了1次,“o”到“h”转移了1次,“h”到“n”转移了1次,依此类推,可以得到每个字符转移到下一个的次数,再用该次数除以姓名的总数,得到该两个字符之间的转移概率,例如,字符“j”到“o”转移了x次,姓名库中的姓名的总数是n,则字符“j”到”o”的转移概率是x/n。
首字符生成概率可以组成一个1x26的行向量,分别表示“a”~“z”中的每一个字符对应的首字符生成概率。
转移概率矩阵是26x26的矩阵,每一行代表“a”~“z”中的一个字符,每一列代表“a”~“z”中的一个字符,每一列代表前一个字符是此行对应的字符,下一个字符是此列对应的字符的概率。
例如,待检测的姓名是“asdfjkldk”,次数值可以采用如下规则生成:
对上一步得到的所有的首字符生成概率按照从大到小的顺序进行排序,并找到“asdfjkldk”中首字符“a”的首字符生成概率在排序后的位数,例如“a”的首字符生成概率从大到小排序排在第5位,则第一个数值取5。
对上一步中获得的转移概率矩阵的每一行的元素按照从大到小排序,找到首字符“a”到下一个字符“s”的转移概率在排序后的位置,例如是第23位,则第二个数值为23。重复此计算,得出“s”到“d”,“d”到“f”……分别对应的排序位数,例如分别是22,21,25,19,20,24,22。
再将这些值求和,得到181。
第二单元322,用于根据所述概率信息,计算所述待检测的姓名被所述姓名库生成对应的总的数学期望和总的标准差;
可选的,所述第二单元322具体用于:
对所述姓名库中所有的首字符生成概率进行排序,根据每个首字符生成概率以及对应的排序位数,计算得到第一数学期望和第一标准差;
对所述第一转移概率在所述转移概率矩阵的对应行的所有的转移概率进行排序,根据所述第一转移概率的对应行的每个转移概率以及对应的排序位数,计算得到第二数学期望和第二标准差;
将所述第一数学期望和所述第二数学期望之和确定为总的数学期望,将所述第一标准差和所述第二标准差之和确定为总的标准差。
所述排序是按照从大到小的顺序进行排序,所述次数值为:所述第一首字符生成概率在所述姓名库中所有的首字符生成概率中的排序位数以及所述第一转移概率在所述姓名库中相应行的所有的转移概率中的排序位数之和。
第一数学期望和第一标准差可以采用如下规则生成:
对首字符生成概率按照从大到小的顺序排序,第一数学期望是每一个首字符生成概率与此概率在排序后的位数的乘积的和,例如首字符生成概率按照从大到小的顺序排序为:
“s”:0.07
“t”:0.06
“c”:0.04
……
“x”:0.002
则第一数学期望是0.07*1+0.06*2+0.04*3+…+0.002*26=11.37;
第一标准差是:
0.07 * ( 1 - 11.37 ) 2 + 0.06 ( 2 - 11.37 ) 2 + 0.04 * ( 3 - 11.37 ) 2 + · · · + 0.002 * ( 26 - 11.37 ) 2
可选的,可以计算转移概率矩阵中每一行向量对应的数学期望和标准差,再从中获取待检测的姓名的字符间转移对应的数学期望和标准差,作为第二数学期望和第二标准差,或者,只计算待检测的姓名的字符间转移对应的数学期望和标准差。
例如,在转移概率矩阵中,对应第一行,可以得到字符“a”转移出去的数学期望和标准差,对应第二行,可以得到字符“b”转移出去的数学期望和标准差,对应第三行,可以得到字符“c”转移出去的数学期望和标准差,依次类推,可以得到26个字符转移出去的数学期望和标准差,其中,每一行向量计算数学期望和标准差的方式可以如计算第一数学期望和第一标准差的方式。
再从中找到“a”转移出去的数学期望和标准差,“s”转移出去的数学期望和标准差,依次类推,还可以找到“d”,“f”,“j”,“k”,“l”,“d”转移出去的数学期望和标准差,从而得到8个第二数学期望和第二标准差。
其中,可以将1+8=9个数学期望的和作为总的数学期望,将9个标准差的和作为总的标准差。
第三单元323,用于根据所述次数值,所述总的数学期望和所述总的标准差,计算所述参数值。
可选的,所述第三单元323具体用于:
计算所述次数值与所述总的数学期望的差值;
将所述差值与所述总的标准差的比值,确定为所述参数值。
例如,参数值的计算公式为:
181 - E σ ;
其中,181是上述步骤计算得到的次数值,E是总的数学期望,σ是总的标准差。
确定模块33,用于根据所述参数值,确定所述待检测的姓名的合理性。
可选的,所述确定模块33具体用于:
当所述参数值小于预设值时,确定所述待检测的姓名是合理的,否则不合理。
其中,预设值可以根据实际情况设置。
例如,预设值是3,则当小于3时,根据切比雪夫不等式(大数定律),待检测的姓名被该姓名库生成的概率大于或等于1/9,则该待检测的姓名是合理的,反之,如果该参数值大于或等于3,表明待检测的姓名被该姓名库生成的概率小于1/9,则该待检测的姓名是不合理的。
当识别出不合理后,可以禁止用户注册该姓名等。
本实施例中,通过根据姓名库中字符的概率信息,获取待检测的姓名的参数值,根据参数值确定待检测的姓名的合理性,可以确定出网络上注册的姓名合理性,从而降低恶意注册。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种检测网站上注册的姓名合理性的方法,其特征在于,包括:
接收待检测的姓名;
根据预先建立的姓名库中字符的概率信息,获取所述待检测的姓名对应的参数值;
根据所述参数值,确定所述待检测的姓名的合理性。
2.根据权利要求1所述的方法,其特征在于,所述参数值是归一化后的值,所述根据预先建立的姓名库中字符的概率信息,获取所述待检测的姓名对应的参数值,包括:
根据所述概率信息,计算所述待检测的姓名被所述姓名库生成所需的次数值;
根据所述概率信息,计算所述待检测的姓名被所述姓名库生成对应的总的数学期望和总的标准差;
根据所述次数值,所述总的数学期望和所述总的标准差,计算所述参数值。
3.根据权利要求1所述的方法,其特征在于,所述概率信息包括:所述姓名库中每个首字符对应的首字符生成概率,以及,所述姓名库中姓名的相邻的两个字符间的转移概率,所述转移概率组成转移概率矩阵,所述根据预先建立的姓名库中字符的概率信息,获取所述待检测的姓名对应的参数值包括:根据所述概率信息,计算所述待检测的姓名被所述姓名库生成所需的次数值,所述根据所述概率信息,计算所述待检测的姓名被所述姓名库生成所需的次数值,包括:
从所述概率信息中,获取第一首字符生成概率,以及第一转移概率,所述第一首字符生成概率是所述待检测的姓名中首字符对应的首字符生成概率,所述第一转移概率包括所述待检测的姓名中相邻的两个字符间的转移概率;
确定所述第一首字符生成概率在所述姓名库中所有的首字符生成概率中的排序位数,以及,所述第一转移概率在所述转移概率矩阵中对应行的所有的转移概率中的排序位数,并根据所述排序位数计算所述次数值。
4.根据权利要求3所述的方法,其特征在于,所述根据所述概率信息,计算所述待检测的姓名被所述姓名库生成对应的总的数学期望和总的标准差,包括:
对所述姓名库中所有的首字符生成概率进行排序,根据每个首字符生成概率以及对应的排序位数,计算得到第一数学期望和第一标准差;
对所述第一转移概率在所述转移概率矩阵的对应行的所有的转移概率进行排序,根据所述第一转移概率的对应行的每个转移概率以及对应的排序位数,计算得到第二数学期望和第二标准差;
将所述第一数学期望和所述第二数学期望之和确定为总的数学期望,将所述第一标准差和所述第二标准差之和确定为总的标准差。
5.根据权利要求3或4所述的方法,其特征在于,所述排序是按照从大到小的顺序进行排序,所述次数值为:所述第一首字符生成概率在所述姓名库中所有的首字符生成概率中的排序位数以及所述第一转移概率在所述姓名库中相应行的所有的转移概率中的排序位数之和。
6.根据权利要求2所述的方法,其特征在于,所述根据所述次数值,所述总的数学期望和所述总的标准差,计算所述参数值,包括:
计算所述次数值与所述总的数学期望的差值;
将所述差值与所述总的标准差的比值,确定为所述参数值。
7.根据权利要求1所述的方法,其特征在于,所述根据所述参数值,确定所述待检测的姓名的合理性,包括:
当所述参数值小于预设值时,确定所述待检测的姓名是合理的,否则不合理。
8.根据权利要求1所述的方法,其特征在于,所述姓名库是与所述待检测的姓名具有相同语种的姓名库,或者,所述姓名库是多种语种的姓名库,所述多种语种包括所述待检测的姓名的具有的语种。
9.一种检测网站上注册的姓名合理性的装置,其特征在于,包括:
接收模块,用于接收待检测的姓名;
获取模块,用于根据预先建立的姓名库中字符的概率信息,获取所述待检测的姓名对应的参数值;
确定模块,用于根据所述参数值,确定所述待检测的姓名的合理性。
10.根据权利要求9所述的装置,其特征在于,所述参数值是归一化后的值,所述获取模块包括:
第一单元,用于根据所述概率信息,计算所述待检测的姓名被所述姓名库生成所需的次数值;
第二单元,用于根据所述概率信息,计算所述待检测的姓名被所述姓名库生成对应的总的数学期望和总的标准差;
第三单元,用于根据所述次数值,所述总的数学期望和所述总的标准差,计算所述参数值。
CN201510101458.0A 2015-03-06 2015-03-06 检测网站上注册的姓名合理性的方法和装置 Active CN105988993B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510101458.0A CN105988993B (zh) 2015-03-06 2015-03-06 检测网站上注册的姓名合理性的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510101458.0A CN105988993B (zh) 2015-03-06 2015-03-06 检测网站上注册的姓名合理性的方法和装置

Publications (2)

Publication Number Publication Date
CN105988993A true CN105988993A (zh) 2016-10-05
CN105988993B CN105988993B (zh) 2019-05-07

Family

ID=57040372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510101458.0A Active CN105988993B (zh) 2015-03-06 2015-03-06 检测网站上注册的姓名合理性的方法和装置

Country Status (1)

Country Link
CN (1) CN105988993B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340574A (zh) * 2020-05-15 2020-06-26 支付宝(杭州)信息技术有限公司 风险用户的识别方法、装置和电子设备

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101359254A (zh) * 2007-08-03 2009-02-04 北京搜狗科技发展有限公司 一种提高姓名词条输入效率的字符输入方法和系统
CN101634927A (zh) * 2008-12-04 2010-01-27 北京搜狗科技发展有限公司 一种字符输入过程中展现候选项的方法及装置
CN101939741A (zh) * 2007-12-06 2011-01-05 谷歌公司 Cjk姓名检测
CN102043763A (zh) * 2009-10-23 2011-05-04 北大方正集团有限公司 一种自动校对姓名的方法及装置
CN102193709A (zh) * 2010-03-01 2011-09-21 腾讯科技(深圳)有限公司 一种字符输入方法及装置
CN102622379A (zh) * 2011-01-31 2012-08-01 北京千橡网景科技发展有限公司 实名检测的方法和设备
JP2012248153A (ja) * 2011-05-31 2012-12-13 Kddi Corp 文字入力装置およびプログラム
CN103136190A (zh) * 2007-12-06 2013-06-05 谷歌公司 Cjk姓名检测
CN103167087A (zh) * 2013-01-31 2013-06-19 广东欧珀移动通信有限公司 一种手机联系人搜索方法及系统
CN103677296A (zh) * 2012-08-30 2014-03-26 深圳全智达通信股份有限公司 一种键盘生成方法、装置及移动终端
CN104239565A (zh) * 2014-09-28 2014-12-24 陆嘉恒 一种基于学术搜索的姓名自动提示方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101359254A (zh) * 2007-08-03 2009-02-04 北京搜狗科技发展有限公司 一种提高姓名词条输入效率的字符输入方法和系统
CN101939741A (zh) * 2007-12-06 2011-01-05 谷歌公司 Cjk姓名检测
CN103136190A (zh) * 2007-12-06 2013-06-05 谷歌公司 Cjk姓名检测
CN101634927A (zh) * 2008-12-04 2010-01-27 北京搜狗科技发展有限公司 一种字符输入过程中展现候选项的方法及装置
CN102043763A (zh) * 2009-10-23 2011-05-04 北大方正集团有限公司 一种自动校对姓名的方法及装置
CN102193709A (zh) * 2010-03-01 2011-09-21 腾讯科技(深圳)有限公司 一种字符输入方法及装置
CN102622379A (zh) * 2011-01-31 2012-08-01 北京千橡网景科技发展有限公司 实名检测的方法和设备
JP2012248153A (ja) * 2011-05-31 2012-12-13 Kddi Corp 文字入力装置およびプログラム
CN103677296A (zh) * 2012-08-30 2014-03-26 深圳全智达通信股份有限公司 一种键盘生成方法、装置及移动终端
CN103167087A (zh) * 2013-01-31 2013-06-19 广东欧珀移动通信有限公司 一种手机联系人搜索方法及系统
CN104239565A (zh) * 2014-09-28 2014-12-24 陆嘉恒 一种基于学术搜索的姓名自动提示方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340574A (zh) * 2020-05-15 2020-06-26 支付宝(杭州)信息技术有限公司 风险用户的识别方法、装置和电子设备
CN111340574B (zh) * 2020-05-15 2020-08-25 支付宝(杭州)信息技术有限公司 风险用户的识别方法、装置和电子设备

Also Published As

Publication number Publication date
CN105988993B (zh) 2019-05-07

Similar Documents

Publication Publication Date Title
Šimkovic et al. Robustness of statistical methods when measure is affected by ceiling and/or floor effect
CN109471915B (zh) 一种文本评价方法、装置、设备以及可读存储介质
CN107423278B (zh) 评价要素的识别方法、装置及系统
Kroese et al. Statistical modeling and computation
CN105303179A (zh) 指纹识别方法、装置
CN106326984A (zh) 用户意图识别方法和装置、自动应答系统
US9514412B2 (en) Techniques for detecting deceptive answers to user questions based on user preference relationships
CN107783898A (zh) 移动应用的测试方法及测试设备
CN110263328B (zh) 一种学科能力类型标注方法、装置、存储介质及终端设备
CN113407694A (zh) 客服机器人知识库歧义检测方法、装置及相关设备
CN110019790A (zh) 文本识别、文本监控、数据对象识别、数据处理方法
CN110457471A (zh) 基于A-BiLSTM神经网络的文本分类方法和装置
Ganju et al. Detecting randomization restrictions caused by factors
CN104699819A (zh) 一种义原的分类方法及装置
CN114692889A (zh) 用于机器学习算法的元特征训练模型
CN111477051A (zh) 一种测评方法、装置、电子设备及存储介质
CN105988993A (zh) 检测网站上注册的姓名合理性的方法和装置
CN114175017A (zh) 模型构建方法、分类方法、装置、存储介质及电子设备
CN110532458B (zh) 一种查找方式的确定方法、确定装置、服务器及存储介质
CN110427277B (zh) 数据校验方法、装置、设备及存储介质
CN108491451B (zh) 一种英文阅读文章推荐方法、装置、电子设备及存储介质
KR102128415B1 (ko) 딥러닝 모델 기반 키보드 오타 보정 방법 및 시스템
CN110363189B (zh) 一种文档内容修复方法、装置、电子设备及可读存储介质
US20170004723A1 (en) Identifying evidence of justification and explanation skills in computer automated scoring
CN109597828A (zh) 一种离线数据核对方法、装置及服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20200925

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200925

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: Alibaba Group Holding Ltd.