CN106600283A - 识别姓名国籍的方法、系统及判断交易风险的方法、系统 - Google Patents

识别姓名国籍的方法、系统及判断交易风险的方法、系统 Download PDF

Info

Publication number
CN106600283A
CN106600283A CN201611169286.1A CN201611169286A CN106600283A CN 106600283 A CN106600283 A CN 106600283A CN 201611169286 A CN201611169286 A CN 201611169286A CN 106600283 A CN106600283 A CN 106600283A
Authority
CN
China
Prior art keywords
name
nationality
neural network
recognition
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611169286.1A
Other languages
English (en)
Inventor
刘润石
霍文虎
袁旭萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Travel Information Technology Shanghai Co Ltd
Original Assignee
Ctrip Travel Information Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Travel Information Technology Shanghai Co Ltd filed Critical Ctrip Travel Information Technology Shanghai Co Ltd
Priority to CN201611169286.1A priority Critical patent/CN106600283A/zh
Publication of CN106600283A publication Critical patent/CN106600283A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Computer Security & Cryptography (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种识别姓名国籍的方法、系统及判断交易风险的方法、系统,其中识别姓名的国籍的方法中,所述循环神经网络的输入层为姓名,所述循环神经网络的隐藏层为所述输入层的当前输入和所述隐藏层的前一隐藏层的函数,所述循环神经网络的输出层为所述姓名的国籍;所述方法包括:基于所述循环神经网络建立RNN模型;将待识别的第一姓名输入所述RNN模型;所述RNN模型输出所述第一姓名的国籍。本发明能够利用大数据分析各国籍的姓名的特征,通过姓名的特征识别姓名的国籍,并且可以应用至交易风险的判断中,提升风控的判断性能。

Description

识别姓名国籍的方法、系统及判断交易风险的方法、系统
技术领域
本发明涉及一种识别姓名国籍的方法、系统及判断交易风险的方法、系统。
背景技术
现在网上购物或交易已经十分普遍,信用卡欺诈分子开始使用盗来的外卡在线上进行销赃。在线上交易时,交易平台(如在线旅游网站、购物网站)一般会要求消费者填写部分个人信息,例如支付交易的银行卡或信用卡的持卡人姓名、收货人姓名等。对于正常消费者而言,大部分往往会填写持卡人的真实姓名,此时真实姓名所反映出的国籍通常与该卡属国一致;对于信用卡欺诈分子而言,在填写持卡人姓名时经常会乱填姓名,此时姓名所反映出的国籍很大概率上与该卡属国不一致。目前的现有技术还不能从消费者所填的持卡人姓名中识别出持卡人的真实国籍,更难以判断持卡人的真实国籍与卡属国是否一致。
发明内容
本发明要解决的技术问题是为了克服现有技术不能从消费者所填的持卡人姓名中识别出持卡人的真实国籍的缺陷,提供一种识别姓名国籍的方法、系统及判断交易风险的方法、系统。
本发明是通过以下技术方案解决上述技术问题的:
一种基于循环神经网络的识别姓名的国籍的方法,其特点是,所述循环神经网络的输入层为姓名,所述循环神经网络的隐藏层为所述输入层的当前输入和所述隐藏层的前一隐藏层的函数,所述循环神经网络的输出层为所述姓名的国籍;
所述方法包括:
S1、基于所述循环神经网络建立RNN(循环神经网络)模型;
S2、将待识别的第一姓名输入所述RNN模型;
S3、所述RNN模型输出所述第一姓名的国籍。
其中,RNN模型可以根据各国籍的姓名的拼写特征识别出姓名的国籍,如姓名为张三,则国籍为中国,姓名为Tom,则国籍为英国或美国。
较佳地,S1包括:
S11、获取若干样本及每一样本对应的真实标签,所述样本为姓名,所述真实标签为姓名的真实国籍;
S12、从所述若干样本中抽取部分样本及对应的真实标签用作训练集,剩余的样本及对应的真实标签用作测试集;
S13、基于所述循环神经网络,利用所述训练集训练RNN模型;
S14、利用所述测试集验证S13训练后的RNN模型,得到优化后的RNN模型。
较佳地,所述输入层为所述姓名的编码,所述输出层为所述姓名的国籍的编码;
S2包括:将所述第一姓名编码,并将所述第一姓名的编码输入所述RNN模型;
S3包括:所述RNN模型输出所述第一姓名的国籍的编码,通过将所述第一姓名的国籍的编码反编码,得到所述第一姓名的国籍。
较佳地,姓名的编码通过以下步骤获得:
将姓名中的每个字母分别转换为26维的向量,所述向量包括0和1,其中1在所述向量中的位置与所述字母在英文字母表中排序的位置相同,所述向量中的其余位置均为0;
国籍的编码为N维向量,N等于所述训练集中国籍的种数。
其中,所述姓名中的每个字母不区分大小写。
较佳地,所述循环神经网络的激活函数是tanh函数;
St=tanh(Uxt+Wst-1)
其中,St是当前的隐藏层;xt是输入层当前的输入;U是输入层的权重系数;st-1是当前的隐藏层的前一隐藏层;W是当前的隐藏层的前一隐藏层的权重系数;
其中,是输出层;V是隐藏层st到输出层的权重系数。
其中,tanh函数可以将(-∞,+∞)数据映射到(-1,+1),起到压缩的作用,同时这个函数处处可导,在使用梯度下降的优化算法时比较容易求出梯度。当然,这个激活函数可以选取其他函数,比如sigmoid,ReLU等。
较佳地,所述循环神经网络选用以下的网络结构:
i=σ(xtUi+st-1Wi)
f=σ(xtUf+st-1Wf)
o=σ(xtUo+st-1Wo)
g=tanh(xtUg+st-1Wg)
ct=ct-1°f+g°i
st=tanh(ct)°o
其中,i是输入门,用于控制输入;f是遗忘门,用于控制遗忘;o是输出门,用于控制输出;g是一个备选的隐藏层;c是内部记忆层;st是当前的隐藏层。
本方案中的网络结构可以解决梯度消失(Gradient vanishing)问题。
较佳地,S13包括:
所述输入层输入所述训练集,所述隐藏层为LSTM层;
所述LSTM层通过时间的向前传播计算当前梯度;
损失函数通过时间的向后传播更新所述损失函数是其中yi是样本i对应的真实标签,是利用RNN模型对样本i的预测值;
确定
得到训练后的RNN模型。
较佳地,S14包括:
将所述测试集中的姓名输入训练后的RNN模型,训练后的RNN模型输出姓名的预测国籍;
通过比较姓名的预测国籍与姓名的真实国籍,验证训练后的RNN模型的准确率,优化训练后的RNN模型,得到优化后的RNN模型。
一种判断交易风险的方法,其特点是,所述方法包括:
从交易中提取支付卡的持卡人姓名和所述支付卡的所属国;
利用上述各优选条件任意组合的一种基于循环神经网络的识别姓名的国籍的方法识别所述持卡人姓名的国籍;
将识别出的所述持卡人姓名的国籍与所述支付卡的所属国进行比较;
根据比较结果判断所述交易的风险。
一种基于循环神经网络的识别姓名的国籍的系统,其特点是,所述循环神经网络的输入层为姓名,所述循环神经网络的隐藏层为所述输入层的当前输入和所述隐藏层的前一隐藏层的函数,所述循环神经网络的输出层为所述姓名的国籍;
所述系统包括:
建模单元,用于基于所述循环神经网络建立RNN模型;
输入单元,用于将待识别的第一姓名输入所述RNN模型;
输出单元,用于所述RNN模型输出所述第一姓名的国籍。
较佳地,所述建模单元包括:
样本模块,用于获取若干样本及每一样本对应的真实标签,所述样本为姓名,所述真实标签为姓名的真实国籍;
抽取模块,用于从所述若干样本中抽取部分样本及对应的真实标签用作训练集,剩余的样本及对应的真实标签用作测试集;
训练模块,用于基于所述循环神经网络,利用所述训练集训练RNN模型;
测试模块,用于利用所述测试集验证S13训练后的RNN模型,得到优化后的RNN模型。
较佳地,所述输入层为所述姓名的编码,所述输出层为所述姓名的国籍的编码;
所述输入单元还用于将所述第一姓名编码,并将所述第一姓名的编码输入所述RNN模型;
所述输出单元还用于所述RNN模型输出所述第一姓名的国籍的编码,通过将所述第一姓名的国籍的编码反编码,得到所述第一姓名的国籍。
较佳地,姓名的编码通过以下方式获得:
将姓名中的每个字母分别转换为26维的向量,所述向量包括0和1,其中1在所述向量中的位置与所述字母在英文字母表中排序的位置相同,所述向量中的其余位置均为0;
国籍的编码为N维向量,N等于所述训练集中国籍的种数。
较佳地,所述循环神经网络的激活函数是tanh函数;
St=tanh(Uxt+Wst-1)
其中,St是当前的隐藏层;xt是输入层当前的输入;U是输入层的权重系数;st-1是当前的隐藏层的前一隐藏层;W是当前的隐藏层的前一隐藏层的权重系数;
其中,是输出层;V是隐藏层st到输出层的权重系数。
较佳地,所述循环神经网络选用以下的网络结构:
i=σ(xtUi+st-1Wi)
f=σ(xtUf+st-1Wf)
o=σ(xtUo+st-1Wo)
g=tanh(xtUg+st-1Wg)
ct=ct-1°f+g°i
st=tanh(ct)°o
其中,i是输入门,用于控制输入;f是遗忘门,用于控制遗忘;o是输出门,用于控制输出;g是一个备选的隐藏层;c是内部记忆层;st是当前的隐藏层。
较佳地,所述训练模块用于:
所述输入层输入所述训练集,所述隐藏层为LSTM层;
所述LSTM层通过时间的向前传播计算当前梯度;
损失函数通过时间的向后传播更新所述损失函数是其中yi是样本i对应的真实标签,是利用RNN模型对样本i的预测值;
确定
得到训练后的RNN模型。
较佳地,测试模块用于:
将所述测试集中的姓名输入训练后的RNN模型,训练后的RNN模型输出姓名的预测国籍;
通过比较姓名的预测国籍与姓名的真实国籍,验证训练后的RNN模型的准确率,优化训练后的RNN模型,得到优化后的RNN模型。
一种判断交易风险的系统,其特点是,所述系统包括:
提取单元,用于从交易中提取支付卡的持卡人姓名和所述支付卡的所属国;
权利要求11-19中任意一项所述的基于循环神经网络的识别姓名的国籍的系统,用于识别所述持卡人姓名的国籍;
比较单元,用于将识别出的所述持卡人姓名的国籍与所述支付卡的所属国进行比较;
风控单元,用于根据比较结果判断所述交易的风险。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明的积极进步效果在于:本发明能够利用大数据分析各国籍的姓名的特征,通过姓名的特征识别姓名的国籍,并且可以应用至交易风险的判断中,提升风控的判断性能。
附图说明
图1为本发明的实施例1的基于循环神经网络的识别姓名的国籍的方法中循环神经网络的结构示意图。
图2为本发明的实施例1的基于循环神经网络的识别姓名的国籍的方法的流程图。
图3为步骤11的进一步细化流程图。
图4为训练RNN模型的示意图。
图5为本发明的实施例1的判断交易风险的方法的流程图。
图6为本发明的实施例2的基于循环神经网络的识别姓名的国籍的系统的框图。
图7为本发明的实施例2的判断交易风险的系统的框图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
本实施例提供一种基于循环神经网络的识别姓名的国籍的方法,其中,所述循环神经网络的结构如图1所示,包括输入层、隐藏层和输出层。所述输入层为姓名的编码,所述隐藏层为所述输入层的当前输入和所述隐藏层的前一隐藏层的函数,所述输出层为所述姓名的国籍的编码。
如图2所示,本实施例的基于循环神经网络的识别姓名的国籍的方法包括:
步骤11、基于所述循环神经网络建立RNN模型。
步骤12、将待识别的第一姓名输入所述RNN模型。
步骤13、所述RNN模型输出所述第一姓名的国籍。
其中,步骤11具体如图3所示,包括:
步骤111、获取若干样本及每一样本对应的真实标签,所述样本为姓名,所述真实标签为姓名的真实国籍。
步骤112、从所述若干样本中抽取部分样本及对应的真实标签用作训练集,剩余的样本及对应的真实标签用作测试集。
步骤113、基于所述循环神经网络,利用所述训练集训练RNN模型。
步骤114、利用所述测试集验证步骤113训练后的RNN模型,得到优化后的RNN模型。
下面对步骤113训练RNN模型的过程做进一步说明:
在训练RNN模型的过程中,样本及样本对应真实标签(即姓名及姓名的国籍)都要先进行编码才能使用。其中姓名的编码方式为:
将姓名的每个字母分别转换为26(因为英文字母总共有26个)维的向量,所述向量包括0和1,其中1在所述向量中的位置与所述字母在英文字母表中排序的位置相同,所述向量中的其余位置均为0。如:
a->1,0,0,……
b->0,1,0,……
c->0,0,1,……
在编码前,若姓名是汉字则将汉字转换为拼音,若姓名是其它文字则转换为对应的英文。为了排除姓名大小写不一致的干扰,可以在编码前将所有字母都统一成小写。编码后的姓名被输入至所述输入层。
姓名的国籍的编码方式为:
将国籍编码为N维向量,N等于所述训练集中国籍的种数。如,训练集中共有三种国籍,分别是中国、英国或美国、其它国籍,那么中国的编码可以为(1,0,0),英国或美国的编码可以为(0,1,0),其它国籍的编码可以为(0,0,1)。本实施例中国籍的标签可以由技术人员自行设定,只需要各国籍能够区分即可。
结合图1,图1中的圆圈表示隐藏层神经元st,所述循环神经网络的激活函数是tanh函数;
St=tanh(Uxt+Wst-1)
其中,St是当前的隐藏层;xt是输入层当前的输入;U是输入层的权重系数;st-1是当前的隐藏层的前一隐藏层;W是当前的隐藏层的前一隐藏层的权重系数;
其中,是输出层;V是隐藏层st到输出层的权重系数。
在实际应用中,可能会遇到梯度消失的问题,为了解决这个问题,可以选用以下网络结构:
i=σ(xtUi+st-1Wi)
f=σ(xtUf+st-1Wf)
o=σ(xtUo+st-1Wo)
g=tanh(xtUg+st-1Wg)
ct=ct-1°f+g°i
st=tanh(ct)°o
其中,i是输入门,用于控制输入;f是遗忘门,用于控制遗忘;o是输出门,用于控制输出;g是一个备选的隐藏层;c是内部记忆层;st是当前的隐藏层。
如图4所示,所述输入层输入所述训练集,所述隐藏层为LSTM层(Long Short TermMemory,长短期隐藏层);
所述LSTM层通过时间的向前传播(Forwardpropagation Through Time,FPTT)计算当前梯度;
损失函数通过时间的向后传播(Backpropagation Through Time,BPTT)更新所述损失函数是其中yi是样本i对应的真实标签,是利用RNN模型对样本i的预测值(即预测的样本i的国籍的编码);
确定
得到训练后的RNN模型。
下面对步骤114验证RNN模型的过程做进一步说明:
将所述测试集中的姓名输入训练后的RNN模型,训练后的RNN模型输出姓名的预测国籍;
通过比较姓名的预测国籍与姓名的真实国籍,验证训练后的RNN模型的准确率,优化训练后的RNN模型,得到优化后的RNN模型。
最终得到的优化后的RNN模型,即为步骤12输入所述第一姓名的RNN模型。输入RNN模型之前,所述第一姓名也需要按照上述的姓名的编码方式编码,步骤13得到所述第一姓名的国籍的编码,一个N维向量,通过将所述第一姓名的国籍的编码反编码,得到所述第一姓名的国籍。例如中国的编码可以为(1,0,0),英国或美国的编码可以为(0,1,0),其它国籍的编码可以为(0,0,1),RNN模型预测姓名的国籍的编码为3维向量(0.2,0.7,0.1),可以根据各分向量最大值对应的位置可以预测姓名国籍,最大值为0.7,则国籍预测为英国或美国;也可以根据技术人员的经验确定一个阈值,当向量的第几位大于所述阈值时,就把国籍预测成第几类,如果各分向量每一位置均小于这个阈值,就将其预测为其它国籍。
本实施例的判断交易风险的方法,如图5所示,所述方法包括:
步骤21、从交易中提取支付卡的持卡人姓名和所述支付卡的所属国。
步骤22、利用本实施例的基于循环神经网络的识别姓名的国籍的方法识别所述持卡人姓名的国籍。
步骤23、将识别出的所述持卡人姓名的国籍与所述支付卡的所属国进行比较。比较结果可能为所述持卡人姓名的国籍与所述支付卡的所属国一致,或者为所述持卡人姓名的国籍与所述支付卡的所属国不一致。
步骤24、根据比较结果判断所述交易的风险。其中,比较结果可以直接用来判断所述交易是否为欺诈交易,如所述持卡人姓名的国籍与所述支付卡的所属国一致,则交易非欺诈交易,所述持卡人姓名的国籍与所述支付卡的所属国不一致,则交易为欺诈交易;所述比较结果还可以作为现有风控模型的一个变量,用以判断所述交易是否为欺诈交易。
本实施例将识别持卡人姓名的国籍应用到判断交易的风险中,可以提高风控模型的性能,更准确地判断交易的风险。
实施例2
本实施例提供一种基于循环神经网络的识别姓名的国籍的系统,其中,所述循环神经网络的结构如图1所示,包括输入层、隐藏层和输出层。所述输入层为姓名的编码,所述隐藏层为所述输入层的当前输入和所述隐藏层的前一隐藏层的函数,所述输出层为所述姓名的国籍的编码。
如图6所示,所述系统包括:
建模单元31,用于基于所述循环神经网络建立RNN模型。
输入单元32,用于将待识别的第一姓名输入所述RNN模型。
输出单元33,用于所述RNN模型输出所述第一姓名的国籍。
其中,所述建模单元31具体包括:
样本模块311,用于获取若干样本及每一样本对应的真实标签,所述样本为姓名,所述真实标签为姓名的真实国籍。
抽取模块312,用于从所述若干样本中抽取部分样本及对应的真实标签用作训练集,剩余的样本及对应的真实标签用作测试集。
训练模块313,用于基于所述循环神经网络,利用所述训练集训练RNN模型。
测试模块314,用于利用所述测试集验证S13训练后的RNN模型,得到优化后的RNN模型。
下面对所述训练模块313做进一步说明:
在训练RNN模型的过程中,样本及样本对应真实标签(即姓名及姓名的国籍)都要先进行编码才能使用。其中姓名的编码方式为:
将姓名中的每个字母分别转换为26维的向量,所述向量包括0和1,其中1在所述向量中的位置与所述字母在英文字母表中排序的位置相同,所述向量中的其余位置均为0。
在编码前,若姓名是汉字则将汉字转换为拼音,若姓名是其它文字则转换为对应的英文。为了排除姓名大小写不一致的干扰,可以在编码前将所有字母都统一成小写。编码后的姓名被输入至所述输入层。
姓名的国籍的编码方式为:
国籍的编码为N维向量,N等于所述训练集中国籍的种数。
所述循环神经网络的激活函数是tanh函数;
St=tanh(Uxt+Wst-1)
其中,St是当前的隐藏层;xt是输入层当前的输入;U是输入层的权重系数;st-1是当前的隐藏层的前一隐藏层;W是当前的隐藏层的前一隐藏层的权重系数;
其中,是输出层;V是隐藏层st到输出层的权重系数。
在实际应用中,可能会遇到梯度消失的问题,为了解决这个问题,可以选用以下网络结构:
i=σ(xtUi+st-1Wi)
f=σ(xtUf+st-1Wf)
o=σ(xtUo+st-1Wo)
g=tanh(xtUg+st-1Wg)
ct=ct-1°f+g°i
st=tanh(ct)°o
其中,i是输入门,用于控制输入;f是遗忘门,用于控制遗忘;o是输出门,用于控制输出;g是一个备选的隐藏层;c是内部记忆层;st是当前的隐藏层。
具体地,所述训练模块313用于:
所述输入层输入所述训练集,所述隐藏层为LSTM层;
所述LSTM层通过时间的向前传播计算当前梯度;
损失函数通过时间的向后传播更新所述损失函数是其中yi是样本i对应的真实标签,是利用RNN模型对样本i的预测值;
确定
得到训练后的RNN模型。
下面对所述测试模块314做进一步说明:
所述测试模块314用于:
将所述测试集中的姓名输入训练后的RNN模型,训练后的RNN模型输出姓名的预测国籍;
通过比较姓名的预测国籍与姓名的真实国籍,验证训练后的RNN模型的准确率,优化训练后的RNN模型,得到优化后的RNN模型。
最终得到的优化后的RNN模型,即为所述输入单元32输入所述第一姓名的RNN模型。输入RNN模型之前,所述第一姓名也需要按照上述的姓名的编码方式编码,所述输出单元33得到所述第一姓名的国籍的编码,一个N维向量,通过将所述第一姓名的国籍的编码反编码,得到所述第一姓名的国籍。
本实施例的判断交易风险的系统,如图7所示,所述系统包括:
提取单元41,用于从交易中提取支付卡的持卡人姓名和所述支付卡的所属国;
本实施例的基于循环神经网络的识别姓名的国籍的系统42,用于识别所述持卡人姓名的国籍;
比较单元43,用于将识别出的所述持卡人姓名的国籍与所述支付卡的所属国进行比较;
风控单元44,用于根据比较结果判断所述交易的风险。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (18)

1.一种基于循环神经网络的识别姓名的国籍的方法,其特征在于,所述循环神经网络的输入层为姓名,所述循环神经网络的隐藏层为所述输入层的当前输入和所述隐藏层的前一隐藏层的函数,所述循环神经网络的输出层为所述姓名的国籍;
所述方法包括:
S1、基于所述循环神经网络建立RNN模型;
S2、将待识别的第一姓名输入所述RNN模型;
S3、所述RNN模型输出所述第一姓名的国籍。
2.如权利要求1所述的基于循环神经网络识别姓名的国籍的方法,其特征在于,S1包括:
S11、获取若干样本及每一样本对应的真实标签,所述样本为姓名,所述真实标签为姓名的真实国籍;
S12、从所述若干样本中抽取部分样本及对应的真实标签用作训练集,剩余的样本及对应的真实标签用作测试集;
S13、基于所述循环神经网络,利用所述训练集训练RNN模型;
S14、利用所述测试集验证S13训练后的RNN模型,得到优化后的RNN模型。
3.如权利要求2所述的基于循环神经网络识别姓名的国籍的方法,其特征在于,所述输入层为所述姓名的编码,所述输出层为所述姓名的国籍的编码;
S2包括:将所述第一姓名编码,并将所述第一姓名的编码输入所述RNN模型;
S3包括:所述RNN模型输出所述第一姓名的国籍的编码,通过将所述第一姓名的国籍的编码反编码,得到所述第一姓名的国籍。
4.如权利要求3所述的基于循环神经网络识别姓名的国籍的方法,其特征在于,姓名的编码通过以下步骤获得:
将姓名中的每个字母分别转换为26维的向量,所述向量包括0和1,其中1在所述向量中的位置与所述字母在英文字母表中排序的位置相同,所述向量中的其余位置均为0;
国籍的编码为N维向量,N等于所述训练集中国籍的种数。
5.如权利要求2所述的基于循环神经网络识别姓名的国籍的方法,其特征在于,所述循环神经网络的激活函数是tanh函数;
St=tanh(Uxt+Wst-1)
其中,St是当前的隐藏层;xt是输入层当前的输入;U是输入层的权重系数;st-1是当前的隐藏层的前一隐藏层;W是当前的隐藏层的前一隐藏层的权重系数;
y ^ t = S O F T M A X ( Vs t )
其中,是输出层;V是隐藏层st到输出层的权重系数。
6.如权利要求5所述的基于循环神经网络识别姓名的国籍的方法,其特征在于,所述循环神经网络选用以下的网络结构:
i=σ(xtUi+st-1Wi)
f=σ(xtUf+st-1Wf)
o=σ(xtUo+st-1Wo)
g=tanh(xtUg+st-1Wg)
ct=ct-1°f+g°i
st=tanh(ct)°o
其中,i是输入门,用于控制输入;f是遗忘门,用于控制遗忘;o是输出门,用于控制输出;g是一个备选的隐藏层;c是内部记忆层;st是当前的隐藏层。
7.如权利要求5所述的基于循环神经网络识别姓名的国籍的方法,其特征在于,S13包括:
所述输入层输入所述训练集,所述隐藏层为LSTM层;
所述LSTM层通过时间的向前传播计算当前梯度;
损失函数通过时间的向后传播更新所述损失函数是其中yi是样本i对应的真实标签,是利用RNN模型对样本i的预测值;
确定
得到训练后的RNN模型。
8.如权利要求7所述的基于循环神经网络识别姓名的国籍的方法,其特征在于,S14包括:
将所述测试集中的姓名输入训练后的RNN模型,训练后的RNN模型输出姓名的预测国籍;
通过比较姓名的预测国籍与姓名的真实国籍,验证训练后的RNN模型的准确率,优化训练后的RNN模型,得到优化后的RNN模型。
9.一种判断交易风险的方法,其特征在于,所述方法包括:
从交易中提取支付卡的持卡人姓名和所述支付卡的所属国;
利用权利要求1-8中任意一项所述的基于循环神经网络的识别姓名的国籍的方法识别所述持卡人姓名的国籍;
将识别出的所述持卡人姓名的国籍与所述支付卡的所属国进行比较;
根据比较结果判断所述交易的风险。
10.一种基于循环神经网络的识别姓名的国籍的系统,其特征在于,所述循环神经网络的输入层为姓名,所述循环神经网络的隐藏层为所述输入层的当前输入和所述隐藏层的前一隐藏层的函数,所述循环神经网络的输出层为所述姓名的国籍;
所述系统包括:
建模单元,用于基于所述循环神经网络建立RNN模型;
输入单元,用于将待识别的第一姓名输入所述RNN模型;
输出单元,用于所述RNN模型输出所述第一姓名的国籍。
11.如权利要求10所述的基于循环神经网络识别姓名的国籍的系统,其特征在于,所述建模单元包括:
样本模块,用于获取若干样本及每一样本对应的真实标签,所述样本为姓名,所述真实标签为姓名的真实国籍;
抽取模块,用于从所述若干样本中抽取部分样本及对应的真实标签用作训练集,剩余的样本及对应的真实标签用作测试集;
训练模块,用于基于所述循环神经网络,利用所述训练集训练RNN模型;
测试模块,用于利用所述测试集验证S13训练后的RNN模型,得到优化后的RNN模型。
12.如权利要求11所述的基于循环神经网络识别姓名的国籍的系统,其特征在于,所述输入层为所述姓名的编码,所述输出层为所述姓名的国籍的编码;
所述输入单元还用于将所述第一姓名编码,并将所述第一姓名的编码输入所述RNN模型;
所述输出单元还用于所述RNN模型输出所述第一姓名的国籍的编码,通过将所述第一姓名的国籍的编码反编码,得到所述第一姓名的国籍。
13.如权利要求12所述的基于循环神经网络识别姓名的国籍的系统,其特征在于,姓名的编码通过以下方式获得:
将姓名中的每个字母分别转换为26维的向量,所述向量包括0和1,其中1在所述向量中的位置与所述字母在英文字母表中排序的位置相同,所述向量中的其余位置均为0;
国籍的编码为N维向量,N等于所述训练集中国籍的种数。
14.如权利要求12所述的基于循环神经网络识别姓名的国籍的系统,其特征在于,所述循环神经网络的激活函数是tanh函数;
St=tanh(Uxt+Wst-1)
其中,St是当前的隐藏层;xt是输入层当前的输入;U是输入层的权重系数;st-1是当前的隐藏层的前一隐藏层;W是当前的隐藏层的前一隐藏层的权重系数;
y ^ t = S O F T M A X ( Vs t )
其中,是输出层;V是隐藏层st到输出层的权重系数。
15.如权利要求14所述的基于循环神经网络识别姓名的国籍的系统,其特征在于,所述循环神经网络选用以下的网络结构:
i=σ(xtUi+st-1Wi)
f=σ(xtUf+st-1Wf)
o=σ(xtUo+st-1Wo)
g=tanh(xtUg+st-1Wg)
ct=ct-1°f+g°i
st=tanh(ct)°o
其中,i是输入门,用于控制输入;f是遗忘门,用于控制遗忘;o是输出门,用于控制输出;g是一个备选的隐藏层;c是内部记忆层;st是当前的隐藏层。
16.如权利要求15所述的基于循环神经网络识别姓名的国籍的系统,其特征在于,所述训练模块用于:
所述输入层输入所述训练集,所述隐藏层为LSTM层;
所述LSTM层通过时间的向前传播计算当前梯度;
损失函数通过时间的向后传播更新所述损失函数是其中yi是样本i对应的真实标签,是利用RNN模型对样本i的预测值;
确定
得到训练后的RNN模型。
17.如权利要求16所述的基于循环神经网络识别姓名的国籍的系统,其特征在于,测试模块用于:
将所述测试集中的姓名输入训练后的RNN模型,训练后的RNN模型输出姓名的预测国籍;
通过比较姓名的预测国籍与姓名的真实国籍,验证训练后的RNN模型的准确率,优化训练后的RNN模型,得到优化后的RNN模型。
18.一种判断交易风险的系统,其特征在于,所述系统包括:
提取单元,用于从交易中提取支付卡的持卡人姓名和所述支付卡的所属国;
权利要求10-17中任意一项所述的基于循环神经网络的识别姓名的国籍的系统,用于识别所述持卡人姓名的国籍;
比较单元,用于将识别出的所述持卡人姓名的国籍与所述支付卡的所属国进行比较;
风控单元,用于根据比较结果判断所述交易的风险。
CN201611169286.1A 2016-12-16 2016-12-16 识别姓名国籍的方法、系统及判断交易风险的方法、系统 Pending CN106600283A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611169286.1A CN106600283A (zh) 2016-12-16 2016-12-16 识别姓名国籍的方法、系统及判断交易风险的方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611169286.1A CN106600283A (zh) 2016-12-16 2016-12-16 识别姓名国籍的方法、系统及判断交易风险的方法、系统

Publications (1)

Publication Number Publication Date
CN106600283A true CN106600283A (zh) 2017-04-26

Family

ID=58599654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611169286.1A Pending CN106600283A (zh) 2016-12-16 2016-12-16 识别姓名国籍的方法、系统及判断交易风险的方法、系统

Country Status (1)

Country Link
CN (1) CN106600283A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108228704A (zh) * 2017-11-03 2018-06-29 阿里巴巴集团控股有限公司 识别风险内容的方法及装置、设备
CN109165940A (zh) * 2018-06-28 2019-01-08 阿里巴巴集团控股有限公司 一种防盗方法、装置及电子设备
CN109620154A (zh) * 2018-12-21 2019-04-16 平安科技(深圳)有限公司 基于深度学习的肠鸣音识别方法及相关装置
CN110264337A (zh) * 2019-05-28 2019-09-20 阿里巴巴集团控股有限公司 一种预测模型构建和银行卡所属国预测方法及装置
CN110998608A (zh) * 2017-07-18 2020-04-10 世界线公司 用于各种计算机应用程序的机器学习系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868184A (zh) * 2016-05-10 2016-08-17 大连理工大学 一种基于循环神经网络的中文人名识别方法
CN105988991A (zh) * 2015-02-26 2016-10-05 阿里巴巴集团控股有限公司 一种姓氏所属语种的识别方法、装置及服务器

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105988991A (zh) * 2015-02-26 2016-10-05 阿里巴巴集团控股有限公司 一种姓氏所属语种的识别方法、装置及服务器
CN105868184A (zh) * 2016-05-10 2016-08-17 大连理工大学 一种基于循环神经网络的中文人名识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WEIHUA WANG等: "Mongolian Named Entity Recognition with Bidirectional Recurrent Neural Networks", 《2016 IEEE 28TH INTERNATIONAL CONFERENCE ON TOOLS WITH ARTIFICIAL INTELLIGENCE》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110998608A (zh) * 2017-07-18 2020-04-10 世界线公司 用于各种计算机应用程序的机器学习系统
CN110998608B (zh) * 2017-07-18 2024-02-20 世界线公司 用于各种计算机应用程序的机器学习系统
CN108228704A (zh) * 2017-11-03 2018-06-29 阿里巴巴集团控股有限公司 识别风险内容的方法及装置、设备
CN108228704B (zh) * 2017-11-03 2021-07-13 创新先进技术有限公司 识别风险内容的方法及装置、设备
CN109165940A (zh) * 2018-06-28 2019-01-08 阿里巴巴集团控股有限公司 一种防盗方法、装置及电子设备
CN109620154A (zh) * 2018-12-21 2019-04-16 平安科技(深圳)有限公司 基于深度学习的肠鸣音识别方法及相关装置
CN110264337A (zh) * 2019-05-28 2019-09-20 阿里巴巴集团控股有限公司 一种预测模型构建和银行卡所属国预测方法及装置

Similar Documents

Publication Publication Date Title
CN106600283A (zh) 识别姓名国籍的方法、系统及判断交易风险的方法、系统
CN109410036A (zh) 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置
CN111061843B (zh) 一种知识图谱引导的假新闻检测方法
CN106611169B (zh) 一种基于深度学习的危险驾驶行为实时检测方法
CN109345260A (zh) 一种欺诈检测模型训练方法和装置及欺诈检测方法和装置
CN109413028A (zh) 基于卷积神经网络算法的sql注入检测方法
CN110751557B (zh) 一种基于序列模型的异常资金交易行为分析方法及系统
CN107861951A (zh) 智能客服中的会话主题识别方法
CN110083700A (zh) 一种基于卷积神经网络的企业舆情情感分类方法及系统
CN110110335A (zh) 一种基于层叠模型的命名实体识别方法
CN111881722B (zh) 一种跨年龄人脸识别方法、系统、装置及存储介质
CN107633293A (zh) 一种领域自适应方法及装置
CN111914553B (zh) 一种基于机器学习的金融信息负面主体判定的方法
CN110222733A (zh) 一种高精度的多阶神经网络分类方法及系统
CN111324738B (zh) 一种确定文本标签的方法和系统
CN111274786A (zh) 一种自动量刑的方法和系统
CN113240506A (zh) 一种基于无监督领域自适应的金融风控冷启动建模方法
CN114202336A (zh) 一种金融场景下的风险行为监测方法及系统
CN115577172A (zh) 物品推荐方法、装置、设备及介质
CN115099326A (zh) 基于人工智能的行为预测方法、装置、设备及存储介质
CN117390141B (zh) 一种农业社会化服务质量用户评价数据分析方法
CN116541755A (zh) 一种基于时序图表征学习的金融行为模式分析预测方法
CN105718914A (zh) 一种人脸编码及识别方法
CN113449103B (zh) 融入标签与文本交互机制的银行交易流水分类方法及系统
Bisogni et al. Multibiometric score-level fusion through optimization and training

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170426