CN115147227B - 一种交易风险的检测方法、装置及设备 - Google Patents

一种交易风险的检测方法、装置及设备 Download PDF

Info

Publication number
CN115147227B
CN115147227B CN202211041057.7A CN202211041057A CN115147227B CN 115147227 B CN115147227 B CN 115147227B CN 202211041057 A CN202211041057 A CN 202211041057A CN 115147227 B CN115147227 B CN 115147227B
Authority
CN
China
Prior art keywords
transaction
sequence
sub
mark
positions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211041057.7A
Other languages
English (en)
Other versions
CN115147227A (zh
Inventor
赵闻飙
王昊天
吴晓烽
王维强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202211041057.7A priority Critical patent/CN115147227B/zh
Publication of CN115147227A publication Critical patent/CN115147227A/zh
Application granted granted Critical
Publication of CN115147227B publication Critical patent/CN115147227B/zh
Priority to US18/457,107 priority patent/US20240070182A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Computer Security & Cryptography (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Educational Administration (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Technology Law (AREA)
  • Probability & Statistics with Applications (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例公开了一种交易风险的检测方法、装置及设备,该方法包括:获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息,然后,将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列,为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中,基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及文本分类模型,确定目标交易是否存在风险。

Description

一种交易风险的检测方法、装置及设备
技术领域
本文件涉及计算机技术领域,尤其涉及一种交易风险的检测方法、装置及设备。
背景技术
在风控场景的人机交互中,用户可能会为了得到非分的好处而提供虚假信息,由于风控场景下交易目标方的账户是固定的,而交易发起方的数量会较多,为此,就需要判断多个交易发起方关于指定的某项交易的交易用途描述信息是否互相矛盾,从而来判断其中的某交易发起方是否存在提供虚假信息的情况,进而判断该项交易是否存在风险。
通常,可以通过获取多个证据来判断某信息的真伪或判断某对象是否存在风险,但是,在上述场景下,所有的交易发起方都是针对同一项交易提供的交易用途描述信息,不同的交易发起方都是平等的(任何一个交易发起方提供的相应证据的可信性会高于其他交易发起方),而且其最终所要达到的目的是检测上述交易用途描述信息中是否互相矛盾的信息,进而判断该交易是否存在风险,显然,上述检测方式应用于上述场景中是不合适的,为此,需要提供一种针对上述场景下的风险检测机制,以快速准确的检测出多个交易发起方提供的指定交易的交易用途描述信息是否互相矛盾,从而判断其中的交易发起方是否存在提供虚假信息的情况,进而判断该项交易是否存在风险。
发明内容
本说明书实施例的目的是提供一种针对上述场景下的风险检测机制,以快速准确的检测出多个交易发起方提供的指定交易的交易用途描述信息是否互相矛盾,从而判断其中的交易发起方是否存在提供虚假信息的情况,进而判断该项交易是否存在风险。
为了实现上述技术方案,本说明书实施例是这样实现的:
本说明书实施例提供的一种交易风险的检测方法,所述方法包括:获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息。将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,所述标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列。为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中。基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定所述目标交易是否存在风险。
本说明书实施例提供的一种交易风险的检测装置,所述装置包括:文本信息获取模块,获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息。转换模块,将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,所述标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列。处理模块,为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中。风险确定模块,基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定所述目标交易是否存在风险。
本说明书实施例提供的一种交易风险的检测设备,所述交易风险的检测设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息。将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,所述标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列。为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中。基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定所述目标交易是否存在风险。
本说明书实施例还提供了一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下流程:获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息。将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,所述标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列。为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中。基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定所述目标交易是否存在风险。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图;
图1为本说明书一种交易风险的检测方法实施例;
图2为一种交易场景的示意图;
图3为一种交易风险的检测过程的示意图;
图4为本说明书一种标记序列和标记位置设置的示意图;
图5为本说明书另一种标记序列和标记位置设置的示意图;
图6为本说明书另一种交易风险的检测方法实施例;
图7为本说明书另一种交易风险的检测过程的示意图;
图8为本说明书一种交易风险的检测装置实施例;
图9为本说明书一种交易风险的检测设备实施例。
具体实施方式
本说明书实施例提供一种交易风险的检测方法、装置及设备。
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
实施例一
如图1所示,本说明书实施例提供一种交易风险的检测方法,该方法的执行主体可以为终端设备或服务器,其中,该终端设备可以如手机、平板电脑等一定终端设备,还可以如笔记本电脑或台式电脑等计算机设备,或者,也可以为IoT设备(具体如智能手表、车载设备等)等。该服务器可以是独立的一个服务器,还可以是由多个服务器构成的服务器集群等,该服务器可以是如金融业务或网络购物业务等的后台服务器,也可以是某应用程序的后台服务器等。本实施例中以服务器为例进行详细说明,对于终端设备的执行过程可以参见下述相关内容,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S102中,获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息。
其中,交易业务可以是任意用于进行交易的业务,例如,交易业务可以为在线购物、实物交易、营销事件、转账业务、支付业务等,具体可以根据实际情况设定,本说明书实施例对此不做限定。交易发起方可以执行上述交易业务发起相应交易的一方,例如,交易业务为转账业务,则交易发起方可以是进行转账的一方,具体可以根据交易业务的不同而相应设置。交易目标方可以是执行上述交易业务时发起的相应交易所指向的目的一方,例如,交易业务为转账业务,则交易目标方可以是收款方或接收交易发起方转移的资源的一方等。交易用途描述信息可以是对某交易的用途进行描述的信息,其中的交易的用途可以基于该交易的属性确定,例如“专用于XX项目”等,也可以基于该交易的作用等确定,例如“还钱”、“买东西”等,还可以基于其它信息确定,例如“学费”、“课程”、“朋友急事”等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,在风控场景的人机交互中,用户可能会为了得到非分的好处而提供虚假信息,由于风控场景下交易目标方的账户是固定的,而交易发起方的数量会较多,为此,就需要判断多个交易发起方关于指定的某项交易的交易用途描述信息是否互相矛盾,从而来判断其中的某交易发起方是否存在提供虚假信息的情况,进而判断该项交易是否存在风险。通常,可以通过获取多个证据来判断某信息的真伪或判断某对象是否存在风险,但是,在上述场景下,所有的交易发起方都是针对同一项交易提供的交易用途描述信息,不同的交易发起方都是平等的(任何一个交易发起方提供的相应证据的可信性会高于其他交易发起方),而且其最终所要达到的目的是检测上述交易用途描述信息中是否互相矛盾的信息,进而判断该交易是否存在风险,显然,上述检测方式应用于上述场景中是不合适的,为此,需要提供一种针对上述场景下的风险检测机制,以快速准确的检测出多个交易发起方提供的指定交易的交易用途描述信息是否互相矛盾,从而判断其中的交易发起方是否存在提供虚假信息的情况,进而判断该项交易是否存在风险。本说明书实施例提供一种可以实现的技术方案,具体可以包括以下内容:
如图2所示,其中示出了本实施例的一种场景,即转账业务中的一种场景,其中,交易发起方为转账方,交易目标方为收款方,如图2中左侧的图示,当三个转账方针对当前交易提供的交易用途描述信息(“学费”、“学费”、“课程”)比较接近时,可以认为收款方是相对可信的,当前交易无风险;如图2中右侧的图示,当三个转账方针对当前交易提供的交易用途描述信息(“还钱”、“买东西”、“朋友急事”)差异较大时,说明可能存在转账方提供虚假的交易用途描述信息,则可以认为收款方很可能存在风险,当前交易存在风险。
对于常用的文本分类模型,如果直接将多个不同的交易发起方提供的交易用途描述信息拼接后输入到上述文本分类模型中进行文本分类,则会使得文本分类模型无法很好的区分拼接后的信息中包含的不同文本内容属于哪个交易发起方,从而导致分类效果差。例如,以文本分类模型基于BERT模型构建,具体如3所示,其中的BERT模型为预训练模型,其输入数据包括两部分,一部分是标记(token)序列,代表输入的字符,另一部分是标记位置(position),代表输入的字符的位置。上述结构的文本分类模型应用于上述场景会使得文本分类模型无法很好的区分每个字符属于哪个交易发起方(或某字符是哪个交易发起方提供的),例如,有些标记序列的第20个标记位置的字符是属于交易发起方A,有些标记序列的第20个标记位置的字符是属于交易发起方B,虽然不同的交易发起方对应的标记序列之间设置有分隔符[SEP],但是,在数据量较小的情况下,上述文本分类模型仍然无法很好的学习到标记序列中包含的不同文本内容属于哪个交易发起方,基于此,可以对上述文本分类模型的结构进行改进,具体如下:
针对某一项交易业务,当某用户需要向另一个用户发起该交易业务的一项交易时,该用户可以通过终端设备中安装的相应的应用程序向另一个用户发起该交易业务的交易,即交易发起方可以向交易目标方发起目标交易,此外,并不是只有一个交易发起方向上述交易目标方发起目标交易,还可以有多个不同的交易发起方向上述交易目标方发起目标交易,此时,针对同一交易业务,多个不同交易发起方可以向同一交易目标方发起目标交易,每个交易发起方向交易目标方发起目标交易时,可以对发起目标交易的用途进行描述,从而在每个交易发起方向交易目标方发起目标交易时,可以提供发起目标交易的交易用途描述信息。当需要检测出多个交易发起方提供的目标交易的交易用途描述信息是否互相矛盾,从而判断其中的交易发起方是否存在提供虚假信息的情况,进而判断目标交易是否存在风险时,可以获取上述多个不同交易发起方提供的交易用途描述信息。
例如,对于交易业务为转账业务的场景,当多个不同的转账方向同一收款方发起转账时,每个转账方向收款方发起转账的同时,还可以提供该转账的交易用途描述信息,当需要检测出多个转账方提供的转账的交易用途描述信息是否互相矛盾,从而判断其中的转账方是否存在提供虚假信息的情况,进而判断该转账是否存在风险时,可以获取上述多个不同转账方提供的交易用途描述信息。
在步骤S104中,将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列。
在实施中,可以根据文本分类模型的输入数据的要求,对上述获取的多个交易用途描述信息进行分析,本实施例中,可以根据文本分类模型的输入数据的要求,将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,例如,共有3个不同交易发起方提供了交易用途描述信息,分别为“我给我朋友还钱”、“买衣服”、“就朋友有点事”等,则可以对“我给我朋友还钱”、“买衣服”、“就朋友有点事”进行拼接,得到的字符序列可以为“我给我朋友还钱。买衣服。就朋友有点事。”,可以将上述字符序列转换为标记序列,即为:[CLS] 我给我朋友还钱[SEP] 买衣服[SEP] 就朋友有点事,上述标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列,即分别为[CLS] 我给我朋友还钱、[SEP] 买衣服、[SEP] 就朋友有点事。
在步骤S106中,为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中。
其中,第一数量可以根据实际情况设定,具体如可以根据多个子标记序列中包含的字符的数量确定,如可以获取包含的字符数量最多的子标记序列,可以将该子标记序列中包含的字符的数量作为第一数量,或者,可以计算多个子标记序列中包含的字符的数量的均值,可以将计算的均值作为第一数量,此外,也可以根据专家经验设置第一数量,具体如40或50等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,通过上述方式可以得到标记序列,其中包含多个子标记序列,为了能够很好的区分每个字符属于哪个交易发起方(或属于哪个子标记序列),可以为每个子标记序列设置固定长度的标记位置,这样,每个子标记序列可以放置在固定长度的标记位置中,具体地,可以为每个子标记序列均设置第一数量的标记位置,然后,按照每个子标记序列的顺序和第一数量的标记位置的顺序,分别将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中,基于上述示例,如果第一数量为10,则标记位置中0-9属于第一个子标记序列,标记位置中10-19属于第二个子标记序列,标记位置中20-29属于第三个子标记序列,此时,可以将第一个子标记序列[CLS] 我给我朋友还钱放置于标记位置0-9中,即标记字符“[CLS]”放置在标记位置0处,标记字符“我”放置在标记位置1处,标记字符“给”放置在标记位置2处,标记字符“我”放置在标记位置3处,标记字符“朋”放置在标记位置4处,标记字符“友”放置在标记位置5处,标记字符“还”放置在标记位置6处,标记字符“钱”放置在标记位置7处,此时,标记字符均已放置完成但还剩余8和9两个标记位置,8和9两个标记位置可以不填写任何字符。之后,可以按照与上述相同的方式,将第二个子标记序列[SEP] 买衣服放置于标记位置10-19中,即标记字符“[SEP]”放置在标记位置10处,标记字符“买”放置在标记位置11处…,同样的,可以将第三个子标记序列[SEP] 就朋友有点事放置于标记位置20-29中,即标记字符“[SEP]”放置在标记位置20处,标记字符“就”放置在标记位置21处…。
再例如,如图4所示,基于上述示例,如果第一数量为6,则标记位置中0-5属于第一个子标记序列,标记位置中6-11属于第二个子标记序列,标记位置中12-17属于第三个子标记序列,此时,可以将第一个子标记序列[CLS] 我给我朋友还钱放置于标记位置0-5中,即标记字符“[CLS]”放置在标记位置0处,标记字符“我”放置在标记位置1处,标记字符“给”放置在标记位置2处,标记字符“我”放置在标记位置3处,标记字符“朋”放置在标记位置4处,标记字符“友”放置在标记位置5处,由于标记位置都被占用,最后2个标记字符无法放置,此时,可以确定第一个子标记序列已完成向标记位置的放置。之后,可以按照与上述相同的方式,将第二个子标记序列[SEP] 买衣服放置于标记位置6-11中,即标记字符“[SEP]”放置在标记位置6处,标记字符“买”放置在标记位置7处…,同样的,可以将第三个子标记序列[SEP] 就朋友有点事放置于标记位置12-17中,即标记字符“[SEP]”放置在标记位置12处,标记字符“就”放置在标记位置13处…,其中,如果标记字符的数量超过标记位置的数量,则可以根据标记位置的数量将子标记序列截断,即如上述第一个子标记序列的处理方式。通过上述方式,每个交易发起方提供的交易用途描述信息处于指定的位置范围内(每个交易发起方提供的交易用途描述信息对应的子标记序列的起始位置均是固定的),这样对于文本分类模型来说,每个交易发起方的交易用途描述信息都有一个固定的位置区间,因此可以更容易的区分其中的每个字符属于哪个交易发起方。
在步骤S108中,基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定目标交易是否存在风险。
其中,每个第一数量的标记位置对应的交易发起方的标记信息可以是交易发起方的标识等,例如,A、B、C…,或者,1、2、3…等,交易发起方的标记信息可以根据标记位置进行设置,例如,如图4所示,标记位置0-5属于交易发起方A,则标记位置0-5的交易发起方的标记信息可以均为A,标记位置6-11属于交易发起方B,则标记位置6-11的交易发起方的标记信息可以均为B等,具体可以根据实际情况设定。文本分类模型可以基于多种不同的算法构建,例如,可以基于RoBERTa(A Robustly Optimized BERT Pretraining Approach)模型构建文本分类模型,或者,可以基于BERT模型构建文本分类模型,或者,可以基于TextCNN模型构建文本分类模型等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,可以根据文本分类模型的情况,获取相应的训练样本,并可以基于获取的训练样本对文本分类模型进行模型训练,使得文本分类模型具有对文本信息进行分类的能力,从而得到训练后的文本分类模型。可以将经过上述处理得到的每个第一数量的标记位置中放置的相应子标记序列,并可以连同每个第一数量的标记位置对应的交易发起方的标记信息输入到上述预先训练的文本分类模型中,通过文本分类模型的处理,可以输出多个交易发起方提供的交易用途描述信息是否互相矛盾的相关信息,可以基于上述相关信息判断其中的交易发起方是否存在提供虚假信息的情况,如果存在,则可以判定交易目标方存在风险,进而可以判定目标交易存在风险,如果不存在,则可以判定目标交易不存在风险。
需要说明的是,如图5所示,对于上述提到的某些没有填写标记字符的标记位置,可以在输入文本分类模型之前,将上述没有填写标记字符的标记位置移除,而在实际应用中,也可以不需要将上述没有填写标记字符的标记位置移除,具体可以根据实际情况设定。
本说明书实施例提供一种交易风险的检测方法,通过获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息,然后,将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列,为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中,最终,基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及文本分类模型,确定目标交易是否存在风险,这样,通过上述方式,每个交易发起方提供的交易用途描述信息处于指定的位置范围内(每个交易发起方提供的交易用途描述信息对应的子标记序列的起始位置均是固定的),这样对于文本分类模型来说,每个交易发起方的交易用途描述信息都有一个固定的位置区间,因此可以更容易的区分其中的每个字符属于哪个交易发起方,从而可以快速准确的检测出多个交易发起方提供的指定交易的交易用途描述信息是否互相矛盾,从而判断其中的交易发起方是否存在提供虚假信息的情况,进而判断该项交易是否存在风险。
实施例二
如图6所示,本说明书实施例提供一种交易风险的检测方法,该方法的执行主体可以为终端设备或服务器,其中,该终端设备可以如手机、平板电脑等一定终端设备,还可以如笔记本电脑或台式电脑等计算机设备,或者,也可以为IoT设备(具体如智能手表、车载设备等)等。该服务器可以是独立的一个服务器,还可以是由多个服务器构成的服务器集群等,该服务器可以是如金融业务或网络购物业务等的后台服务器,也可以是某应用程序的后台服务器等。本实施例中以服务器为例进行详细说明,对于终端设备的执行过程可以参见下述相关内容,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S602中,获取多个不同交易业务中的历史交易的历史交易用途描述信息,历史交易用途描述信息是针对任一交易业务中多个不同历史交易发起方向同一历史交易目标方发起历史交易时提供的信息。
在步骤S604中,将多个不同历史交易发起方提供的历史交易用途描述信息的字符序列转换为标记序列样本,其中,标记序列样本中包括每个历史交易发起方提供的历史交易用途描述信息的字符序列对应的子标记序列样本。
在步骤S606中,为每个子标记序列样本设置第一数量的标记位置,并按照每个子标记序列样本的顺序将每个子标记序列样本中的字符依次放置于相应的第一数量的标记位置中。
上述步骤S602~步骤S606的具体处理过程可以参见上述实施例一中的相关内容,在此不再赘述。
在步骤S608中,基于每个第一数量的标记位置中放置的相应子标记序列样本和每个第一数量的标记位置对应的历史交易发起方的标记信息对文本分类模型进行模型训练,得到训练后的文本分类模型。
其中,文本分类模型可以基于RoBERTa模型、BERT模型或TextCNN模型构建等。
在实施中,以文本分类模型基于BERT模型构建为例,BERT 模型是基于Transformer 的编码器(Encoder),主要模型结构就是 Transformer 的堆叠,通过BERT 模型中每一Transformer 层的Transformer 的编码器得到相应数量的隐向量,并传递到下一Transformer 层,这样一层一层的向下传递,直到最后的输出结果。可以选取用于进行文本信息分类的BERT模型的模型结构,并可以通过相应的算法构建BERT模型,可以使用每个第一数量的标记位置中放置的相应子标记序列样本和每个第一数量的标记位置对应的历史交易发起方的标记信息训练上述BERT模型,得到训练后的BERT模型,最终可以得到文本分类模型。
在步骤S610中,获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息。
在步骤S612中,将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列。
在步骤S614中,为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中。
上述步骤S610~步骤S614的具体处理过程可以参见上述实施例一中的相关内容,在此不再赘述。
在实际应用中,上述实施例一中基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定目标交易是否存在风险的具体处理方式可以多种多样,以下提供一种可选的处理方式,具体可以包括以下内容:将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果,基于该输出结果确定目标交易是否存在风险。
此外,对于文本分类模型基于BERT模型构建的情况,基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定目标交易是否存在风险的具体处理方式还可以通过下述步骤S616和步骤S618的方式实现。
在步骤S616中,将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果。
在步骤S618中,从上述输出结果中提取每个交易发起方提供的交易用途描述信息中第一个字符对应的嵌入特征,并将该嵌入特征输入预设的编码器中,得到相应的编码结果,基于该编码结果,确定目标交易是否存在风险。
其中,预设的编码器可以通过多种不同的方式实现,具体可以根据实际情况设定。本实施例中,为了减少编码器制作和选取所消耗的资源,可以直接由Transformer Block构建预设的编码器。
在实施中,系统架构可以如图7所示,在文本分类模型(即BERT模型)的上层,可以从上述输出结果中提取每个交易发起方提供的交易用途描述信息中第一个字符(如图7中的“我”、“买”、“就”)对应的嵌入(Embedding)特征,可以将提取的每个交易发起方提供的交易用途描述信息中第一个字符对应的嵌入特征再经过两层Transformer Block(编码器)处理,或者,可以提取每个交易发起方提供的交易用途描述信息中每个字符对应的嵌入特征,将每个交易发起方提供的交易用途描述信息中每个字符对应的嵌入特征中,最大值或均值对应的嵌入特征再经过两层Transformer Block处理等。在第二层Transformer Block(编码器)的每个输入数据(即将上述嵌入特征输入预设的编码器中,得到相应的编码结果)基本代表了每个交易发起方提供的交易用途描述信息,对于文本分类模型来说更容易区分,然后,可以根据该编码结果判断多个交易发起方提供的交易用途描述信息是否互相矛盾,进而可以判断其中的交易发起方是否存在提供虚假信息,如果存在,则可以判定交易目标方存在风险,进而可以判定目标交易存在风险,如果不存在,则可以判定目标交易不存在风险。
其中,上述基于该编码结果,确定目标交易是否存在风险的具体处理方式可以多种多样,以下提供一种可选的处理方式,具体可以包括以下步骤A2和步骤A4的处理。
在步骤A2中,基于预设的相似度算法,确定多个编码结果之间的相似度。
其中,相似度算法可以包括多种,例如余弦相似度算法、基于欧式距离的相似度算法、基于杰卡德相似系数的相似度算法等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
在实施中,可以通过预设的相似度算法,分别计算任意两个编码结果之间的相似度,得到一个或多个不同的相似度的数值。
在步骤A4中,如果多个编码结果之间的相似度中存在小于预设相似度阈值的相似度,则确定目标交易存在风险。
其中,相似度阈值可以根据实际情况设定,具体如80%或90%等。
此外,如果多个编码结果之间的相似度中不存在小于预设相似度阈值的相似度,则确定目标交易不存在风险。
为了验证上述处理方式的效果,可以进行消融实验,实验记过如下表1所示。
表1
Figure DEST_PATH_IMAGE001
消融实验的结果,可以说明每一部分的系统结构的修改都对最终的结果有正面效果。
本说明书实施例提供一种交易风险的检测方法,通过获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息,然后,将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列,为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中,最终,基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及文本分类模型,确定目标交易是否存在风险,这样,通过上述方式,每个交易发起方提供的交易用途描述信息处于指定的位置范围内(每个交易发起方提供的交易用途描述信息对应的子标记序列的起始位置均是固定的),这样对于文本分类模型来说,每个交易发起方的交易用途描述信息都有一个固定的位置区间,因此可以更容易的区分其中的每个字符属于哪个交易发起方,从而可以快速准确的检测出多个交易发起方提供的指定交易的交易用途描述信息是否互相矛盾,从而判断其中的交易发起方是否存在提供虚假信息的情况,进而判断该项交易是否存在风险。此外,通过在文本分类模型的上层,可以从其输出结果中提取每个交易发起方的第一个字符对应的嵌入特征,在经过编码器后得到相应的编码结果,并以此代表了每个交易发起方提供的交易用途描述信息,便于后续快速准确的检测出多个交易发起方提供的指定交易的交易用途描述信息是否互相矛盾,进一步提高了交易风险的检测效率和准确率。
实施例三
以上为本说明书实施例提供的交易风险的检测方法,基于同样的思路,本说明书实施例还提供一种交易风险的检测装置,如图8所示。
该交易风险的检测装置包括:文本信息获取模块801、转换模块802、处理模块803和风险确定模块804,其中:
文本信息获取模块801,获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息;
转换模块802,将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,所述标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列;
处理模块803,为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中;
风险确定模块804,基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定所述目标交易是否存在风险。
本说明书实施例中,所述风险确定模块804,将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果,基于所述输出结果确定所述目标交易是否存在风险。
本说明书实施例中,所述风险确定模块804,包括:
模型处理单元,将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果;
风险确定单元,从所述输出结果中提取每个交易发起方提供的交易用途描述信息中第一个字符对应的嵌入特征,并将所述嵌入特征输入预设的编码器中,得到相应的编码结果,基于所述编码结果,确定所述目标交易是否存在风险。
本说明书实施例中,所述风险确定单元,基于预设的相似度算法,确定多个所述编码结果之间的相似度;如果多个所述编码结果之间的相似度中存在小于预设相似度阈值的相似度,则确定所述目标交易存在风险。
本说明书实施例中,所述预设的编码器由Transformer Block构建。
本说明书实施例中,所述装置还包括:
历史文本获取模块,获取多个不同交易业务中的历史交易的历史交易用途描述信息,所述历史交易用途描述信息是针对任一交易业务中多个不同历史交易发起方向同一历史交易目标方发起所述历史交易时提供的信息;
样本转换模块,将多个不同历史交易发起方提供的历史交易用途描述信息的字符序列转换为标记序列样本,其中,标记序列样本中包括每个历史交易发起方提供的历史交易用途描述信息的字符序列对应的子标记序列样本;
样本处理模块,为每个子标记序列样本设置第一数量的标记位置,并按照每个子标记序列样本的顺序将每个子标记序列样本中的字符依次放置于相应的第一数量的标记位置中;
模型训练模块,基于每个第一数量的标记位置中放置的相应子标记序列样本和每个第一数量的标记位置对应的历史交易发起方的标记信息对所述文本分类模型进行模型训练,得到训练后的文本分类模型。
本说明书实施例中,所述文本分类模型基于BERT模型构建。
本说明书实施例提供一种交易风险的检测装置,通过获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息,然后,将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列,为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中,最终,基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及文本分类模型,确定目标交易是否存在风险,这样,通过上述方式,每个交易发起方提供的交易用途描述信息处于指定的位置范围内(每个交易发起方提供的交易用途描述信息对应的子标记序列的起始位置均是固定的),这样对于文本分类模型来说,每个交易发起方的交易用途描述信息都有一个固定的位置区间,因此可以更容易的区分其中的每个字符属于哪个交易发起方,从而可以快速准确的检测出多个交易发起方提供的指定交易的交易用途描述信息是否互相矛盾,从而判断其中的交易发起方是否存在提供虚假信息的情况,进而判断该项交易是否存在风险。此外,通过在文本分类模型的上层,可以从其输出结果中提取每个交易发起方的第一个字符对应的嵌入特征,在经过编码器后得到相应的编码结果,并以此代表了每个交易发起方提供的交易用途描述信息,便于后续快速准确的检测出多个交易发起方提供的指定交易的交易用途描述信息是否互相矛盾,进一步提高了交易风险的检测效率和准确率。
实施例四
以上为本说明书实施例提供的交易风险的检测装置,基于同样的思路,本说明书实施例还提供一种交易风险的检测设备,如图9所示。
所述交易风险的检测设备可以为上述实施例提供终端设备或服务器等。
交易风险的检测设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器901和存储器902,存储器902中可以存储有一个或一个以上存储应用程序或数据。其中,存储器902可以是短暂存储或持久存储。存储在存储器902的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对交易风险的检测设备中的一系列计算机可执行指令。更进一步地,处理器901可以设置为与存储器902通信,在交易风险的检测设备上执行存储器902中的一系列计算机可执行指令。交易风险的检测设备还可以包括一个或一个以上电源903,一个或一个以上有线或无线网络接口904,一个或一个以上输入输出接口905,一个或一个以上键盘906。
具体在本实施例中,交易风险的检测设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对交易风险的检测设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息;
将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,所述标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列;
为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中;
基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定所述目标交易是否存在风险。
本说明书实施例中,所述基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定所述目标交易是否存在风险,包括:
将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果,基于所述输出结果确定所述目标交易是否存在风险。
本说明书实施例中,所述基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定所述目标交易是否存在风险,包括:
将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果;
从所述输出结果中提取每个交易发起方提供的交易用途描述信息中第一个字符对应的嵌入特征,并将所述嵌入特征输入预设的编码器中,得到相应的编码结果,基于所述编码结果,确定所述目标交易是否存在风险。
本说明书实施例中,所述基于所述编码结果,确定所述目标交易是否存在风险,包括:
基于预设的相似度算法,确定多个所述编码结果之间的相似度;
如果多个所述编码结果之间的相似度中存在小于预设相似度阈值的相似度,则确定所述目标交易存在风险。
本说明书实施例中,所述预设的编码器由Transformer Block构建。
本说明书实施例中,还包括:
获取多个不同交易业务中的历史交易的历史交易用途描述信息,所述历史交易用途描述信息是针对任一交易业务中多个不同历史交易发起方向同一历史交易目标方发起所述历史交易时提供的信息;
将多个不同历史交易发起方提供的历史交易用途描述信息的字符序列转换为标记序列样本,其中,标记序列样本中包括每个历史交易发起方提供的历史交易用途描述信息的字符序列对应的子标记序列样本;
为每个子标记序列样本设置第一数量的标记位置,并按照每个子标记序列样本的顺序将每个子标记序列样本中的字符依次放置于相应的第一数量的标记位置中;
基于每个第一数量的标记位置中放置的相应子标记序列样本和每个第一数量的标记位置对应的历史交易发起方的标记信息对所述文本分类模型进行模型训练,得到训练后的文本分类模型。
本说明书实施例中,所述文本分类模型基于BERT模型构建。
本说明书实施例提供一种交易风险的检测设备,通过获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息,然后,将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列,为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中,最终,基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及文本分类模型,确定目标交易是否存在风险,这样,通过上述方式,每个交易发起方提供的交易用途描述信息处于指定的位置范围内(每个交易发起方提供的交易用途描述信息对应的子标记序列的起始位置均是固定的),这样对于文本分类模型来说,每个交易发起方的交易用途描述信息都有一个固定的位置区间,因此可以更容易的区分其中的每个字符属于哪个交易发起方,从而可以快速准确的检测出多个交易发起方提供的指定交易的交易用途描述信息是否互相矛盾,从而判断其中的交易发起方是否存在提供虚假信息的情况,进而判断该项交易是否存在风险。此外,通过在文本分类模型的上层,可以从其输出结果中提取每个交易发起方的第一个字符对应的嵌入特征,在经过编码器后得到相应的编码结果,并以此代表了每个交易发起方提供的交易用途描述信息,便于后续快速准确的检测出多个交易发起方提供的指定交易的交易用途描述信息是否互相矛盾,进一步提高了交易风险的检测效率和准确率。
实施例五
进一步地,基于上述图1到图7所示的方法,本说明书一个或多个实施例还提供了一种存储介质,用于存储计算机可执行指令信息,一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令信息在被处理器执行时,能实现以下流程:
获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息;
将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,所述标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列;
为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中;
基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定所述目标交易是否存在风险。
本说明书实施例中,所述基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定所述目标交易是否存在风险,包括:
将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果,基于所述输出结果确定所述目标交易是否存在风险。
本说明书实施例中,所述基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及预先训练的文本分类模型,确定所述目标交易是否存在风险,包括:
将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果;
从所述输出结果中提取每个交易发起方提供的交易用途描述信息中第一个字符对应的嵌入特征,并将所述嵌入特征输入预设的编码器中,得到相应的编码结果,基于所述编码结果,确定所述目标交易是否存在风险。
本说明书实施例中,所述基于所述编码结果,确定所述目标交易是否存在风险,包括:
基于预设的相似度算法,确定多个所述编码结果之间的相似度;
如果多个所述编码结果之间的相似度中存在小于预设相似度阈值的相似度,则确定所述目标交易存在风险。
本说明书实施例中,所述预设的编码器由Transformer Block构建。
本说明书实施例中,还包括:
获取多个不同交易业务中的历史交易的历史交易用途描述信息,所述历史交易用途描述信息是针对任一交易业务中多个不同历史交易发起方向同一历史交易目标方发起所述历史交易时提供的信息;
将多个不同历史交易发起方提供的历史交易用途描述信息的字符序列转换为标记序列样本,其中,标记序列样本中包括每个历史交易发起方提供的历史交易用途描述信息的字符序列对应的子标记序列样本;
为每个子标记序列样本设置第一数量的标记位置,并按照每个子标记序列样本的顺序将每个子标记序列样本中的字符依次放置于相应的第一数量的标记位置中;
基于每个第一数量的标记位置中放置的相应子标记序列样本和每个第一数量的标记位置对应的历史交易发起方的标记信息对所述文本分类模型进行模型训练,得到训练后的文本分类模型。
本说明书实施例中,所述文本分类模型基于BERT模型构建。
本说明书实施例提供一种存储介质,通过获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息,然后,将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列,为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中,最终,基于每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息,以及文本分类模型,确定目标交易是否存在风险,这样,通过上述方式,每个交易发起方提供的交易用途描述信息处于指定的位置范围内(每个交易发起方提供的交易用途描述信息对应的子标记序列的起始位置均是固定的),这样对于文本分类模型来说,每个交易发起方的交易用途描述信息都有一个固定的位置区间,因此可以更容易的区分其中的每个字符属于哪个交易发起方,从而可以快速准确的检测出多个交易发起方提供的指定交易的交易用途描述信息是否互相矛盾,从而判断其中的交易发起方是否存在提供虚假信息的情况,进而判断该项交易是否存在风险。此外,通过在文本分类模型的上层,可以从其输出结果中提取每个交易发起方的第一个字符对应的嵌入特征,在经过编码器后得到相应的编码结果,并以此代表了每个交易发起方提供的交易用途描述信息,便于后续快速准确的检测出多个交易发起方提供的指定交易的交易用途描述信息是否互相矛盾,进一步提高了交易风险的检测效率和准确率。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程欺诈案例的串并设备的处理器以产生一个机器,使得通过计算机或其他可编程欺诈案例的串并设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程欺诈案例的串并设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程欺诈案例的串并设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (9)

1.一种交易风险的检测方法,所述方法包括:
获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息;
将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,所述标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列;
为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中;
将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果,基于所述输出结果确定所述目标交易是否存在风险。
2.根据权利要求1所述的方法,所述将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果,基于所述输出结果确定所述目标交易是否存在风险,包括:
将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果;
从所述输出结果中提取每个交易发起方提供的交易用途描述信息中第一个字符对应的嵌入特征,并将所述嵌入特征输入预设的编码器中,得到相应的编码结果,基于所述编码结果,确定所述目标交易是否存在风险。
3.根据权利要求2所述的方法,所述基于所述编码结果,确定所述目标交易是否存在风险,包括:
基于预设的相似度算法,确定多个所述编码结果之间的相似度;
如果多个所述编码结果之间的相似度中存在小于预设相似度阈值的相似度,则确定所述目标交易存在风险。
4.根据权利要求2所述的方法,所述预设的编码器由Transformer Block构建。
5.根据权利要求1所述的方法,所述方法还包括:
获取多个不同交易业务中的历史交易的历史交易用途描述信息,所述历史交易用途描述信息是针对任一交易业务中多个不同历史交易发起方向同一历史交易目标方发起所述历史交易时提供的信息;
将多个不同历史交易发起方提供的历史交易用途描述信息的字符序列转换为标记序列样本,其中,标记序列样本中包括每个历史交易发起方提供的历史交易用途描述信息的字符序列对应的子标记序列样本;
为每个子标记序列样本设置第一数量的标记位置,并按照每个子标记序列样本的顺序将每个子标记序列样本中的字符依次放置于相应的第一数量的标记位置中;
基于每个第一数量的标记位置中放置的相应子标记序列样本和每个第一数量的标记位置对应的历史交易发起方的标记信息对所述文本分类模型进行模型训练,得到训练后的文本分类模型。
6.根据权利要求1或5所述的方法,所述文本分类模型基于BERT模型构建。
7.一种交易风险的检测装置,所述装置包括:
文本信息获取模块,获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息;
转换模块,将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,所述标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列;
处理模块,为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中;
风险确定模块,将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果,基于所述输出结果确定所述目标交易是否存在风险。
8.一种交易风险的检测设备,所述交易风险的检测设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,在所述存储器中存储的所述可执行指令被执行时,能够使得所述处理器:
获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息;
将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列;
为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中;
将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果,基于所述输出结果确定所述目标交易是否存在风险。
9.一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下流程:
获取针对同一交易业务中多个不同交易发起方向同一交易目标方发起目标交易时提供的交易用途描述信息;
将多个不同交易发起方提供的交易用途描述信息的字符序列转换为标记序列,其中,标记序列中包括每个交易发起方提供的交易用途描述信息的字符序列对应的子标记序列;
为每个子标记序列设置第一数量的标记位置,并按照每个子标记序列的顺序将每个子标记序列中的字符依次放置于相应的第一数量的标记位置中;
将每个第一数量的标记位置中放置的相应子标记序列和每个第一数量的标记位置对应的交易发起方的标记信息输入到预先训练的文本分类模型中,得到相应的输出结果,基于所述输出结果确定所述目标交易是否存在风险。
CN202211041057.7A 2022-08-29 2022-08-29 一种交易风险的检测方法、装置及设备 Active CN115147227B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211041057.7A CN115147227B (zh) 2022-08-29 2022-08-29 一种交易风险的检测方法、装置及设备
US18/457,107 US20240070182A1 (en) 2022-08-29 2023-08-28 Event detection and classification method, apparatus, and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211041057.7A CN115147227B (zh) 2022-08-29 2022-08-29 一种交易风险的检测方法、装置及设备

Publications (2)

Publication Number Publication Date
CN115147227A CN115147227A (zh) 2022-10-04
CN115147227B true CN115147227B (zh) 2022-12-27

Family

ID=83415823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211041057.7A Active CN115147227B (zh) 2022-08-29 2022-08-29 一种交易风险的检测方法、装置及设备

Country Status (2)

Country Link
US (1) US20240070182A1 (zh)
CN (1) CN115147227B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115600155B (zh) * 2022-11-09 2023-05-12 支付宝(杭州)信息技术有限公司 一种数据处理方法、装置及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108280766A (zh) * 2017-01-06 2018-07-13 阿里巴巴集团控股有限公司 交易行为风险识别方法及装置
CN113011875A (zh) * 2021-01-12 2021-06-22 腾讯科技(深圳)有限公司 文本处理方法、装置、计算机设备以及存储介质
CN113191777A (zh) * 2021-05-13 2021-07-30 支付宝(杭州)信息技术有限公司 风险识别方法和装置
CN113450215A (zh) * 2021-06-25 2021-09-28 中国工商银行股份有限公司 交易数据的风险检测方法、装置和服务器
CN113807073A (zh) * 2020-06-16 2021-12-17 中国电信股份有限公司 文本内容异常检测方法、装置以及存储介质
CN114281984A (zh) * 2021-08-18 2022-04-05 腾讯云计算(北京)有限责任公司 一种风险检测方法、装置、设备及计算机可读存储介质
CN114372884A (zh) * 2022-01-10 2022-04-19 中国工商银行股份有限公司 交易数据的风险识别方法和风险识别装置
CN114549001A (zh) * 2022-02-08 2022-05-27 支付宝(杭州)信息技术有限公司 训练风险交易识别模型、识别风险交易的方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11861580B2 (en) * 2012-11-28 2024-01-02 Robert William Graham System for processing a transaction by a user at a transaction point
CN111553701A (zh) * 2020-05-14 2020-08-18 支付宝(杭州)信息技术有限公司 一种基于会话的风险交易确定方法和装置
CN112200382B (zh) * 2020-10-27 2022-11-22 支付宝(杭州)信息技术有限公司 一种风险预测模型的训练方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108280766A (zh) * 2017-01-06 2018-07-13 阿里巴巴集团控股有限公司 交易行为风险识别方法及装置
CN113807073A (zh) * 2020-06-16 2021-12-17 中国电信股份有限公司 文本内容异常检测方法、装置以及存储介质
CN113011875A (zh) * 2021-01-12 2021-06-22 腾讯科技(深圳)有限公司 文本处理方法、装置、计算机设备以及存储介质
CN113191777A (zh) * 2021-05-13 2021-07-30 支付宝(杭州)信息技术有限公司 风险识别方法和装置
CN113450215A (zh) * 2021-06-25 2021-09-28 中国工商银行股份有限公司 交易数据的风险检测方法、装置和服务器
CN114281984A (zh) * 2021-08-18 2022-04-05 腾讯云计算(北京)有限责任公司 一种风险检测方法、装置、设备及计算机可读存储介质
CN114372884A (zh) * 2022-01-10 2022-04-19 中国工商银行股份有限公司 交易数据的风险识别方法和风险识别装置
CN114549001A (zh) * 2022-02-08 2022-05-27 支付宝(杭州)信息技术有限公司 训练风险交易识别模型、识别风险交易的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NEUD-TRI: Network Embedding Based on Upstream and Downstream for Transaction Risk Identification;Jingyi An et al.;《2020 IEEE 44th Annual Computers, Software, and Applications Conference (COMPSAC)》;20200922;全文 *
基于交易报文指纹关系的商业银行风险交易识别与发现;卢燕群等;《计算机应用研究》;20170331(第03期);全文 *

Also Published As

Publication number Publication date
CN115147227A (zh) 2022-10-04
US20240070182A1 (en) 2024-02-29

Similar Documents

Publication Publication Date Title
CN113516480B (zh) 一种支付风险识别方法、装置及设备
CN115147227B (zh) 一种交易风险的检测方法、装置及设备
CN115712866A (zh) 数据处理方法、装置及设备
CN115600157A (zh) 一种数据处理的方法、装置、存储介质及电子设备
CN110033092B (zh) 数据标签生成、模型训练、事件识别方法和装置
CN115238250B (zh) 一种模型的处理方法、装置及设备
CN115221523B (zh) 数据处理方法、装置及设备
CN110390015B (zh) 一种数据信息处理方法、装置及系统
CN110008252B (zh) 数据核对方法及装置
CN113992429B (zh) 一种事件的处理方法、装置及设备
CN113569873B (zh) 一种图像的处理方法、装置及设备
CN115310956A (zh) 支付处理方法及装置
CN115358777A (zh) 虚拟世界的广告投放处理方法及装置
CN115204395A (zh) 数据的处理方法、装置及设备
CN110705439B (zh) 一种信息的处理方法、装置及设备
CN115423485B (zh) 数据处理方法、装置及设备
CN115859975B (zh) 数据处理方法、装置及设备
CN116824580A (zh) 图像处理方法、装置、设备及存储介质
CN117036033A (zh) 事件预测模型的训练方法及装置
CN116843181A (zh) 风险识别方法及装置
CN117612269A (zh) 一种生物攻击检测方法、装置及设备
CN115905876A (zh) 一种模型的处理方法、装置及设备
CN116543759A (zh) 语音识别处理方法及装置
CN115392386A (zh) 一种模型的训练方法、装置及设备
CN116186607A (zh) 一种模型的处理方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant