CN114596153A - 一种数据处理方法、装置、设备及可读存储介质 - Google Patents

一种数据处理方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN114596153A
CN114596153A CN202011418189.8A CN202011418189A CN114596153A CN 114596153 A CN114596153 A CN 114596153A CN 202011418189 A CN202011418189 A CN 202011418189A CN 114596153 A CN114596153 A CN 114596153A
Authority
CN
China
Prior art keywords
feature
transaction
characteristic
text
behavior type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011418189.8A
Other languages
English (en)
Inventor
李嘉隆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011418189.8A priority Critical patent/CN114596153A/zh
Publication of CN114596153A publication Critical patent/CN114596153A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/389Keeping log of transactions for guaranteeing non-repudiation of a transaction

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种数据处理方法、装置、设备及可读存储介质,方法包括:获取资产交易数据以及资产交易数据所属的交易行为类型;根据资产交易数据与交易行为类型确定资产交易数据对应的交易特征;获取交易行为类型对应的特征评估矩阵,根据特征评估矩阵对特征文本进行排序,得到资产交易数据对应的目标交易报文。采用本申请,可以提高报文的生成效率与质量。

Description

一种数据处理方法、装置、设备及可读存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置、设备以 及可读存储介质。
背景技术
目前,对于反洗钱报文的生成,主要采用人工撰写,需要耗费大量时间, 实效性过低,速度缓慢,不利于快速完成对反洗钱业务的上报。
发明内容
本申请实施例提供一种数据处理方法、装置、设备以及可读存储介质,可 以提高报文的生成效率与质量。
本申请实施例一方面提供了一种数据处理方法,包括:
获取资产交易数据以及资产交易数据所属的交易行为类型;
根据资产交易数据与交易行为类型确定资产交易数据对应的交易特征;
获取交易行为类型对应的特征评估矩阵,根据特征评估矩阵对特征文本进 行排序,得到资产交易数据对应的目标交易报文;特征文本为与交易特征相匹 配的文本;目标交易报文用于识别资产交易数据的交易合法性。
本申请实施例一方面提供了一种数据处理装置,包括:
数据获取模块,用于获取资产交易数据以及资产交易数据所属的交易行为 类型;
特征确定模块,用于根据资产交易数据与交易行为类型确定资产交易数据 对应的交易特征;
报文生成模块,用于获取交易行为类型对应的特征评估矩阵,根据特征评 估矩阵对特征文本进行排序,得到资产交易数据对应的目标交易报文;特征文 本为与交易特征相匹配的文本;目标交易报文用于识别资产交易数据的交易合 法性。
其中,特征确定模块包括:
集合获取单元,用于获取交易行为类型对应的行为类型特征集合;
数据匹配单元,用于将资产交易数据与行为类型特征集合进行匹配;
特征确定单元,用于若行为类型特征集合中存在与资产交易数据相匹配的 行为类型特征,则将与资产交易数据相匹配的行为类型特征作为资产交易数据 对应的交易特征。
其中,特征评估矩阵为特征评估模型所包含的矩阵;交易特征的数量为N, N为正整数;
报文生成模块包括:
矩阵获取单元,用于通过特征评估模型,获取交易行为类型对应的特征评 估矩阵;特征评估矩阵包括一个或多个行为类型特征分别对应的特征评估值; 特征评估值用于表征行为类型特征与交易行为类型的匹配度;
评估值确定单元,用于在特征评估矩阵中,获取N个交易特征分别对应的 特征评估值,作为N个目标特征评估值;
序列生成单元,用于根据N个目标特征评估值分别对应的数值大小,生成 包含N个目标特征评估值的特征评估值序列;
文本排序单元,用于根据特征评估值序列,对N个交易特征分别对应的特 征文本进行排序;
报文生成单元,用于根据排序后的N个特征文本生成资产交易数据对应的 目标交易报文。
其中,报文生成单元包括:
规则获取子单元,用于获取报文生成规则;报文生成规则用于规定目标交 易报文所包含的最大词量;
文本确定子单元,用于根据最大词量,在排序后的N个特征文本中确定目 标特征文本;
文本拼接子单元,用于按照排序后的N个特征文本之间的排序顺序,对目 标特征文本进行拼接,得到资产交易数据对应的目标交易报文;目标交易报文 所包含的报文词量小于或等于最大词量。
其中,文本确定子单元,还用于在排序后的N个特征文本中选取P个特征 文本;P为小于N的正整数;
文本确定子单元,还用于获取P个特征文本的文本词量,将文本词量与最 大词量进行匹配;
文本确定子单元,还用于若文本词量小于最大词量,则按照排序后的N个 特征文本之间的排序顺序,在剩余特征文本中确定候选特征文本;候选特征文 本为N个特征文本中,除P个特征文本以外的特征文本;
文本确定子单元,还用于根据候选特征文本与P个特征文本,确定目标特 征文本;
文本确定子单元,还用于若文本词量大于或等于最大词量,则将P个特征 文本确定为目标特征文本。
其中,文本确定子单元,还用于确定最大词量与文本词量之间的词量差值;
文本确定子单元,还用于获取候选特征文本对应的候选文本词量,将候选 文本词量与词量差值进行匹配;
文本确定子单元,还用于若候选文本词量小于或等于词量差值,则将候选 特征文本与P个特征文本,确定为目标特征文本;
文本确定子单元,还用于若候选文本词量大于词量差值,则将P个特征文 本确定为目标特征文本。
其中,该装置还包括:
修正特征获取模块,用于响应针对行为类型特征的选择操作,获取资产交 易数据对应的修正交易特征;
报文更新模块,用于根据特征评估矩阵对修正特征文本进行排序,根据排 序结果将资产交易数据对应的目标交易报文更新为修正交易报文;修正特征文 本为与修正交易特征相匹配的文本;
参数调整模块,用于根据修正交易报文对特征评估模型中的特征评估矩阵 进行参数调整,得到调整后的特征评估矩阵;调整后的特征评估矩阵用于对下 一个资产交易数据对应的特征文本进行排序。
其中,参数调整模块包括:
赋值单元,用于将交易特征设置为有效值,将第一剩余特征设置为无效值, 生成包含交易特征对应的有效值与第一剩余特征对应的无效值的交易特征矩阵; 第一剩余特征为行为类型特征中除交易特征以外的特征;
赋值单元,还用于将修正交易特征设置为有效值,将第二剩余特征设置为 无效值,生成包含修正交易特征对应的有效值与第二剩余特征对应的无效值的 修正特征矩阵;第二剩余特征为行为类型特征中,除修正交易特征以外的特征;
矩阵调整单元,用于根据修正特征矩阵与交易特征矩阵,对特征评估矩阵 进行参数调整,得到调整后的特征评估矩阵。
其中,矩阵调整单元包括:
运算子单元,用于将修正特征矩阵与交易特征矩阵进行相减运算处理,得 到资产交易数据对应的调整特征矩阵;
矩阵确定子单元,用于将调整特征矩阵与特征评估矩阵进行相加运算处理, 将相加运算处理得到的矩阵,作为调整后的特征评估矩阵。
其中,该装置还包括:
可疑文本获取模块,用于获取目标交易报文中的可疑特征文本;可疑特征 文本为与可疑交易特征相匹配的文本;交易特征包括可疑交易特征;
文本匹配模块,用于将可疑特征文本与合法特征文本进行匹配;
数据确定模块,用于若可疑特征文本满足合法特征文本所指示的合法条件, 则确定资产交易数据为合法资产交易数据;
数据确定模块,还用于若可疑特征文本不满足合法特征文本所指示的合法 条件,则确定资产交易数据为非法资产交易数据。
本申请实施例一方面提供了一种计算机设备,包括:处理器和存储器;
存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行 本申请实施例中的方法。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介 质存储有计算机程序,该计算机程序由处理器加载并执行时,可执行本申请实 施例中的方法。
本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机 程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储 介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理 器执行该计算机指令,使得该计算机设备执行本申请实施例中一方面提供的方 法。
在本申请实施例中,在获取到资产交易数据后,可以根据资产交易数据所 属的交易行为类型,确定该资产交易数据对应的交易特征;随后,可以获取到 与该交易特征相匹配的特征文本,并依据该交易行为类型对应的特征评估矩阵 对这些特征文本进行排序,从而可以生成该资产交易数据对应的目标交易报文。 可以看出,本申请在获取到资产交易数据后以及交易行为类型后,可以获取到 资产交易数据对应的交易特征,随后,可以根据特征评估矩阵对交易特征对应 的特征文本进行排序,可以使得越符合该交易行为类型的交易特征对应的特征 文本排列越靠前,而在生成目标交易报文的时候,可以优先选取排列靠前的特 征文本,从而可以使得目标交易报文更符合该交易行为类型的特征。也就是说, 本申请可以实现自动化生成报文,提高报文的生成效率,同时可以提高所生成 的报文的质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施 例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述 中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付 出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网络架构图;
图2是本申请实施例提供的一种场景示意图;
图3是本申请实施例提供的一种对报文进行修正的场景示意图;
图4是本申请实施例提供的一种数据处理方法的方法流程图;
图5是本申请实施例提供的一种调整特征评估矩阵的流程示意图;
图6是本申请实施例提供的一种系统框架图;
图7是本申请实施例提供的一种生成目标交易报文的逻辑流程图;
图8是本申请实施例提供的一种数据处理装置的结构示意图;
图9是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是 全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造 性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制 的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳 结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一 个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的 方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实 现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有 软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、 云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。 人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技 术以及机器学习/深度学习等几大方向。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用, 例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人 驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的 发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案属于人工智能领域下属的机器学习(MachineLearning,ML)。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统 计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模 拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构 使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能 的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括 人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
请参见图1,图1是本申请实施例提供的一种网络架构图。如图1所示, 该网络架构可以包括业务服务器1000和用户终端集群,用户终端集群可以包括 一个或者多个用户终端,这里将不对用户终端的数量进行限制。如图1所示, 多个用户终端可以包括用户终端100a、用户终端100b、用户终端100c、…、 用户终端100n;如图1所示,用户终端100a、用户终端100b、用户终端100c、…、 用户终端100n可以分别与业务服务器1000进行网络连接,以便于每个用户终 端可以通过该网络连接与业务服务器1000之间进行数据交互。
可以理解的是,如图1所示的每个用户终端均可以安装有目标应用,当该 目标应用运行于各用户终端中时,可以分别与图1所示的业务服务器1000之间 进行数据交互,使得业务服务器1000可以接收来自于每个用户终端的业务数据。 其中,该目标应用可以包括具有显示文字、图像、音频以及视频等数据信息功 能的应用。如,应用可以为文本编辑应用(例如,报文编辑应用),该文本编辑 应用可以用于用户输入数据,并得到该数据对应的文档。例如,对于报文编辑 应用,用户可以在该报文编辑应用中,输入资产交易数据,从而可以得到该资 产交易数据对应的报文,应当理解,用户可通过该报文编辑应用对该报文进行修改,得到最终的修正报文。应当理解,本申请中的业务服务器1000可以根据 这些应用获取到业务数据,如,该业务数据可以为用户输入的资产交易数据以 及该资产交易数据对应的交易行为类型。
随后,对于所获取到的资产交易数据以及交易行为类型,业务服务器1000 可以获取到该交易行为类型对应的行为类型特征集合,并将该资产交易数据与 该行为类型特征集合进行匹配,从而可以在该行为类型特征集合中选取出与该 资产交易数据相匹配的行为类型特征,并将该与该资产交易数据相匹配的行为 类型特征作为资产交易数据的交易特征。进一步地,业务服务器1000可以获取 该交易特征对应的特征文本,并获取该交易行为类型对应的特征评估矩阵,其 中,该特征评估矩阵中包括有行为类型特征集合中每个行为类型特征对应的特 征文本的特征评估值(一个特征评估值可代表一个行为类型特征与交易行为类 型之间的匹配度,特征评估值越大,则匹配度越高),即,该特征评估矩阵中包括有交易特征对应的特征文本的特征评估值,则通过该特征评估矩阵,可以对 该交易特征对应的特征文本进行排序。进一步地,业务服务器1000可以按照特 征文本的排列顺序,对特征文本按序拼接,从而可以生成由一条或多条特征文 本所组成的目标交易报文。随后,该业务服务器1000可以将该目标交易报文返 回至用户终端。
本申请实施例可以在多个用户终端中选择一个用户终端作为目标用户终端, 该用户终端可以包括:智能手机、平板电脑、笔记本电脑、桌上型电脑、智能 电视、智能音箱、台式计算机、智能手表、车载设备等携带数据处理功能(例 如,文本数据显示功能、视频数据播放功能、音乐数据播放功能)的智能终端, 但并不局限于此。例如,本申请实施例可以将图1所示的用户终端100a作为该 目标用户终端,该目标用户终端中可以集成有上述目标应用,此时,该目标用 户终端可以通过该目标应用与业务服务器1000之间进行数据交互。
如,用户在使用用户终端中的目标应用(如报文编辑应用)时,用户在该 报文编辑应用中输入资产交易数据后,可以选择该资产交易数据所属的交易行 为类型,例如,用户所选择的交易行为类型为“破坏金融管理秩序犯罪”类型; 随后,用户终端可以将该资产交易数据以及该资产交易数据所属的交易行为类 型,即“破坏金融管理秩序犯罪”类型一并发送至业务服务器1000;随后,该 业务服务器1000可以获取该“破坏金融管理秩序犯罪”类型所对应的行为类型 特征集合,该行为类型特征集合中可包括一个或多个行为类型特征,例如,该 行为类型特征集合中可包括行为类型特征a、行为类型特征b以及行为类型特 征c;进一步地,业务服务器1000可以获取该“破坏金融管理秩序犯罪”类型 对应的特征评估矩阵,该特征评估矩阵中可包括一个或多个特征评估值,一个 特征评估值可用于表征一个行为类型特征与该“破坏金融管理秩序犯罪”类型 之间的匹配度,特征评估值越高,则匹配度越高。例如,该特征评估矩阵可如 特征评估矩阵A1所示:
Figure BDA0002820939750000091
其中,如特征评估矩阵A1所示,该特征评估矩阵中可包括特征评估值100、 特征评估值96以及特征评估值98。其中,特征评估值100可用于表征行为类 型特征a与“破坏金融管理秩序犯罪”类型之间的匹配度,特征评估值96可用 于表征行为类型特征b与“破坏金融管理秩序犯罪”类型之间的匹配度,特征 评估值98可用于表征行为类型特征c与“破坏金融管理秩序犯罪”类型之间的 匹配度,应当理解,因为100>98>96,所以行为类型特征a与“破坏金融管理 秩序犯罪”类型之间最匹配。
进一步地,业务服务器1000可将该资产交易数据,与“破坏金融管理秩序 犯罪”类型对应的行为类型特征集合(即{行为类型特征a,行为类型特征b, 行为类型特征c})进行匹配,根据匹配结果可确定该行为类型特征集合中的行 为类型特征a与行为类型特征b与该资产交易数据相匹配,则可将该行为类型 特征a与行为类型特征b确定为该资产交易数据对应的交易特征;随后,业务 服务器1000可在该特征评估矩阵A1中,获取该资产交易数据对应的交易特征 (即,行为类型特征a与行为类型特征b)对应的特征评估值(即特征评估值 100与特征评估值96),根据该特征评估值100与特征评估值96,可对该行为 类型特征a对应的特征文本1,以及行为类型特征b对应的特征文本2,进行排 序,例如,可按照特征评估值从大到小的顺序对特征文本1与特征文本2进行 排序,排序后的特征文本序列为{特征文本1,特征文本2};随后,业务服务器 1000可按照该特征文本的排列顺序,将特征文本按序进行拼接,得到的拼接文 本为“特征文本1+特征文本2”,该拼接文本可作为该资产交易数据对应的目 标交易报文。例如,特征文本1为“二十岁的年轻人”,特征文本2为“转账七十万元”,则拼接文本可为“20岁的年轻人转账70万元”,该拼接文本“二十 岁的年轻人转账七十万元”可作为该资产交易数据对应的目标交易报文。业务 服务器1000可将该目标交易报文“二十岁的年轻人转账七十万元”返回至用户 终端,用户终端可显示该目标交易报文“二十岁的年轻人转账七十万元”,用户 可通过用户终端查看到该目标交易报文“二十岁的年轻人转账七十万元”。
可选的,可以理解的是,在按照特征文本的排列顺序对特征文本进行拼接 时,若存在特征文本对应的特征评估值一样的情况,则可按照特征文本对应的 规定顺序进行拼接,其中,该特征文本对应的规定顺序可为人工指定顺序。例 如,特征评估矩阵A1中,行为类型特征a对应的特征评估值为100,行为类型 特征b对应的特征评估值也为100,因为行为类型特征a与行为类型特征b的 特征评估值相同,则在将特征文本1与特征文本2进行拼接时,可以获取该特 征文本对应的规定顺序(特征文本1排列于特征文本2之前),并按照该特征文 本对应的规定顺序将特征文本1与特征文本2拼接为“特征文本1+特征文本2”。
可选的,可以理解的是,在按照特征文本的排列顺序对特征文本进行拼接, 生成资产交易数据的目标交易报文时,可先获取该目标交易报文对应的最大限 制词量,并按照该最大限制词量对组成目标交易报文的特征文本进行过滤。例 如,该最大限制词量为10,则特征文本1“二十岁的年轻人”可作为目标交易 的组成部分,而特征文本1对应的文本词量为7,剩余词量为3,但特征文本2 “转账七十万元”的文本词量为6,则可将该特征文本2进行删除,该特征文 本2可不作为该目标交易报文的组成部分;也就是说,目标交易报文是由特征 文本1所组成,该目标交易报文为“二十岁的年轻人”。
应当理解,本申请在获取到资产交易数据及其所属的交易行为类型后,可 以获取到该交易行为类型对应的行为类型特征集合,并将该资产交易数据与该 行为类型特征集合进行匹配,从而可以确定出该资产交易数据对应的交易特征; 通过该交易行为类型对应的特征评估矩阵,可以对该交易特征对应的特征文本 进行排序,从而可以生成符合该交易特征的目标交易报文,可以提高目标交易 报文的质量;可以理解的是,该流程无需人工参与,可以实现自动化生成报文, 可以提高报文的生成效率,同时,也可以提高所生成的报文的质量。
可选的,可以理解的是,网络架构中可以包括多个业务服务器,一个用户 终端可以与一个业务服务器相连接,每个业务服务器可以获取到与之相连接的 用户终端中的业务数据(如,用户输入的资产交易数据及其所属的交易行为类 型),并根据该目标应用的功能,对业务数据进行处理(例如,目标应用为报文 编辑应用,则业务服务器可根据业务数据,生成该业务数据对应的目标交易报 文)。
可选的,可以理解的是,用户终端也可以获取到业务数据(如,用户输入 的资产交易数据及其所属的交易行为类型),并根据目标应用的功能,对业务数 据进行处理(例如,目标应用为报文编辑应用,则业务服务器可根据业务数据, 生成该业务数据对应的目标交易报文)。
可以理解的是,本申请实施例提供的方法可以由计算机设备执行,计算机 设备包括但不限于用户终端或业务服务器。其中,业务服务器可以是独立的物 理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可 以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、 中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础 云计算服务的云服务器。
其中,用户终端以及业务服务器可以通过有线或无线通信方式进行直接或 间接地连接,本申请在此不做限制。
为便于理解,请一并参见图2,图2是本申请实施例提供的一种场景示意 图。其中,如图2所示的用户终端A可以为上述图1所对应实施例中用户终端 集群中的任一用户终端,例如,该用户终端可为用户终端100a;如图2所示的 业务服务器可为上述图1所对应实施例中的业务服务器1000。
如图2所示,用户a(可以是指对资产交易数据进行审核上报的审核用户) 可在用户终端A的目标应用(如图2所示的报文生成系统)中输入待审核上报 的资产交易数据,并在多个交易行为类型(包括交易行为类型1、交易行为类 型2以及交易行为类型3)中,选择该资产交易数据所属的交易行为类型;如 图2所示,用户a所选择的交易行为类型为交易行为类型2,在用户a点击确 认控件后,用户终端A可响应用户a的这一触发操作,向业务服务器发送报文 生成请求(同时发送资产交易数据以及该资产交易数据所属的交易行为类型2); 进一步地,业务服务器在接收到该报文生成请求后,可以获取该交易行为类型 2对应的行为类型特征集合;进一步地,业务服务器可以将该行为类型特征集 合与该资产交易数据进行匹配,其中,该行为类型特征集合中包括有多条行为 类型特征(包括行为类型特征1、行为类型特征2、行为类型特征3、行为类型 特征4、行为类型特征5以及行为类型特征6),通过匹配,可以在这多条行为 类型特征中,确定出与该资产交易数据相匹配的行为类型特征,并将该与资产 交易数据相匹配的行为类型特征作为资产交易数据的交易特征。例如,该行为 类型特征1为“交易对象异常”,而该资产交易数据中所包括的交易对象均为外 国人,则可以确定该行为类型特征1“交易对象异常”是与该资产交易数据相 匹配的行为类型特征,并将该行为类型特征1“交易对象异常”确定为该资产 交易数据的交易特征。
进一步地,在通过匹配,确定资产交易数据的交易特征(包括行为类型特 征1、行为类型特征2以及行为类型特征3)后,可以获取该交易行为类型2 对应的特征评估矩阵,该特征评估矩阵可以如特征评估矩阵B1所示:
Figure BDA0002820939750000121
其中,特征评估矩阵B1中可包括行为类型特征1、行为类型特征2、行为 类型特征3、行为类型特征4、行为类型特征5以及行为类型特征6分别对应的 特征评估值,行为类型特征1对应的特征评估值为100,行为类型特征2对应 的特征评估值为92,行为类型特征3对应的特征评估值为97,行为类型特征4 对应的特征评估值为96,行为类型特征5对应的特征评估值为99,行为类型特 征6对应的特征评估值为100。通过该特征评估矩阵B1,可以对资产交易数据 的交易特征(包括行为类型特征1、行为类型特征2以及行为类型特征3)所对应的特征文本进行排序。其中,该特征文本可以是指预先为行为类型特征所配 置的文本,一个特征文本与一个行为类型特征具有关联关系,也就是说,一个 行为类型特征可配置关联有一个特征文本。
例如,行为类型特征1关联的特征文本为特征文本1“交易对象均为外国 人”;行为类型特征2关联的特征文本为特征文本2“交易频繁、金额巨大”; 行为类型特征3关联的特征文本为特征文本3“交易主体刻意逃避关注、将交 易分散于多网点办理”;因为行为类型特征1的特征评估值100大于行为类型特 征2的特征评估值97,且行为类型特征1的特征评估值100大于行为类型特征 3的特征评估值97,则可将该行为类型特征1对应的特征文本1“交易对象均 为外国人”排列于第一位;而因为行为类型特征2与行为类型特征3的特征评估值相同,则可按照特征文本2与特征文本3的文本规定顺序将特征文本2排 列于特征文本3之前,则可获取特征文本的排列顺序为{特征文本1,特征文本 2,特征文本3}。
进一步地,业务服务器可获取报文生成规则,并确定该报文生成规则中所 规定的报文生成最大词量为100,因为特征文本1“交易对象均为外国人”的文 本词量为9,特征文本2“交易频繁、金额巨大”的文本词量为9,特征文本3 “交易主体刻意逃避关注、将交易分散于多网点办理”的文本词量为22,则特 征文本1+特征文本2+特征文本3的总文本词量为9+9+22=40,总文本词量40 远小于最大词量100,则可将该特征文本1、特征文本2以及特征文本3按序进 行拼接,得到的拼接文本为“交易对象均为外国人,交易频繁、金额巨大,交易主体刻意逃避关注、将交易分散于多网点办理”;业务服务器可将该拼接文本 “交易对象均为外国人,交易频繁、金额巨大,交易主体刻意逃避关注、将交 易分散于多网点办理”作为该资产交易数据的目标交易报文,并将该目标交易 报文返回至用户终端A。如图2所示,用户终端A可在显示界面中显示该目标 交易报文,同时,如图2所示,用户终端A还可在显示界面中目标交易报文的 下方显示该交易行为类型2对应的行为类型特征(包括行为类型特征1、行为 类型特征2、行为类型特征3、行为类型特征4、行为类型特征5以及行为类型 特征6),应当理解,因为目标交易报文是由行为类型特征1、行为类型特征2 以及行为类型特征3对应的特征文本所组成,则可显示带有标记的行为类型特 征1、行为类型特征2以及行为类型特征3;由此,用户a通过用户终端A查 看该目标交易报文时,可以确定该目标交易报文是由该行为类型特征1、行为 类型特征2以及行为类型特征3对应的特征文本所组成。
可选的,可以理解的是,用户a可对该目标交易报文进行修正,得到修正 交易报文,而用户终端A可将该修正交易报文发送至业务服务器,业务服务器 可根据该修正交易报文对特征评估矩阵B1中的特征评估值进行调整,使得调 整后的特征评估矩阵中的特征评估值能更符合人工需求,从而可以使得通过调 整后的特征评估矩阵得到的交易报文,能更满足用户的需求。
为便于理解,请一并参见图3,图3是本申请实施例提供的一种对报文进 行修正的场景示意图。如图3所示,用户a可在行为类型特征1、行为类型特 征2、行为类型特征3、行为类型特征4、行为类型特征5以及行为类型特征6 中进行选择,确定出与资产交易数据相匹配的行为类型特征,作为资产交易数 据对应的交易特征。如图3所示,用户a所选择的行为类型特征为行为类型特 征1、行为类型特征3以及行为类型特征5,可以看出,用户a所选择的行为类 型特征(包括行为类型特征1、行为类型特征3以及行为类型特征5)与业务服 务器所确定的行为类型特征(包括行为类型特征1、行为类型特征2以及行为 类型特征3)中,存在相同的行为类型特征1与行为类型特征3,则可将业务服 务器所生成的目标交易报文中的行为类型特征2对应的特征文本2“交易频繁、 金额巨大”进行删除,同时,保留行为类型特征1对应的特征文本1“交易对 象均为外国人”以及行为类型特征3对应的特征文本3“交易主体刻意逃避关 注、将交易分散于多网点办理”。应当理解,用户a所选择的行为类型特征还包 括行为类型特征5,在特征评估矩阵B1中,行为类型特征5的评估值为98, 因为评估值98小于评估值100,但评估值98大于评估值97,则行为类型特征 5对应的特征文本5“多人开户资料所留地址相同”,可放置于特征文本1之后, 且放置于特征文本3之前,则特征文本1、特征文本3以及特征文本5对应的 排列顺序为{特征文本1,特征文本5,特征文本3};应当理解,因为该特征文 本5“多人开户资料所留地址相同”的文本词量为12,则特征文本1、特征文 本3以及特征文本5的文本总词量为9+22+12=43,因为文本总词量43小于最 大词量100,则可将特征文本1+特征文本5+特征文本3所组成的拼接文本“交 易对象均为外国人,多人开户资料所留地址相同,交易主体刻意逃避关注、将 交易分散于多网点办理”作为修正交易报文。
进一步地,用户终端A可将该修正交易报文返回至业务服务器,业务服务 器可根据该修正交易报文中特征文本对应的行为类型特征(用户a所选择的行 为类型特征1、行为类型特征3以及行为类型特征5)对特征评估矩阵B1进行 调整,得到调整后的特征评估矩阵,即得到特征评估矩阵B2。
其中,可以理解的是,上述特征评估矩阵B1与特征评估矩阵B2中的评估 值、特征文本所包括的内容,均是为便于理解所作出的举例说明,不具有参考 意义。而对于对特征评估矩阵进行调整,得到调整后的特征评估矩阵的具体实 现方式,可以参见后续图4所对应实施例中的描述。
应当理解,本申请通过获取资产交易数据以及资产交易数据所属的交易行 为类型,可以根据该交易行为类型对应的行为类型特征集合确定出该资产交易 数据的交易特征,而根据该交易行为类型对应的特征评估矩阵可以对该交易特 征对应的特征文本进行排序,可以使得越符合该交易行为类型的交易特征对应 的特征文本排列越靠前,而在生成目标交易报文的时候,可以优先选取排列靠 前的特征文本,从而可以使得目标交易报文更符合该交易行为类型的特征。全 程无需人工参与,可以实现自动化生成报文,提高报文的生成效率,同时也可 以提高报文的质量。同时,应当理解,对于自动生成的目标交易报文,可以通 过人工修正,得到修正交易报文,而通过该修正交易报文可以对特征评估矩阵 进行调整,使得特征评估矩阵中的参数(评估值)更符合人工需求,由此可以 保证报文的质量。
进一步地,请参见图4,图4是本申请实施例提供的一种数据处理方法的 方法流程图。其中,该方法可以由用户终端(例如,上述图1所对应实施例中 的用户终端集群中的任一用户终端)执行,也可以由业务服务器(例如,上述 图1所对应实施例中的业务服务器)执行,也可以由业务服务器与用户终端共 同执行。以下将以本方法由区用户终端执行为例进行说明,其中,该数据处理 方法至少可以包括以下步骤S101-步骤S103:
步骤S101,获取资产交易数据以及资产交易数据所属的交易行为类型。
本申请中,资产交易数据可以是指用户对于资产的交易数据,该资产交易 数据中可包括用户的基本信息、交易对象的基本信息、交易金额、交易机构、 交易地点,等等;而该交易行为类型可以是指该资产交易所属的资金非法交易 类型,该资金非法交易类型可包括非法药品交易类型、非法组织交易类型、非 法运输交易类型、资产来源不明类型以及破坏资产管理秩序类型,等等,在此 不再一一进行举例。
本申请中,进行资产交易数据审核的审核用户可通过用户终端中的目标应 用(例如,报文编辑应用),上传待审核上报的资产交易数据,并选择该资产交 易数据所属的交易行为类型,而用户终端可获取到该资产交易数据及其所属的 交易行为类型。
步骤S102,根据资产交易数据与交易行为类型确定资产交易数据对应的交 易特征。
本申请中,在获取到资产交易数据及其所属的交易行为类型后,可获取到 该交易行为类型对应的行为类型特征集合,根据该行为类型特征集合,可确定 该资产交易数据对应的交易特征。对于确定资产交易数据对应的交易特征的具 体方法可为,可以获取交易行为类型对应的行为类型特征集合;随后,可以将 资产交易数据与行为类型特征集合进行匹配;若该行为类型特征集合中存在与 资产交易数据相匹配的行为类型特征,则可将与资产交易数据相匹配的行为类 型特征作为资产交易数据对应的交易特征。应当理解,该行为类型特征集合中 可包括一个或多个行为类型特征,该一个或多个行为类型特征可以由人工进行 定义,对于每种交易行为类型,人工均可定义该交易行为类型对应的行为类型 特征;而通过将资产交易数据与这些行为类型特征进行匹配,可以确定出这些 行为类型特征中是否存在与该资产交易数据相匹配的行为类型特征,若存在, 则可将与资产交易数据相匹配的行为类型特征确定为该资产交易数据对应的交 易特征。例如,行为类型特征集合中包括有行为类型特征“年龄大于70”,而 该资产交易数据中存在文本“用户的年龄为75岁”,则通过匹配,可以确定该 资产交易数据中的文本“用户的年龄为75岁”是符合行为类型特征“年龄大于 70”的,则可将该行为类型特征“年龄大于70”作为该资产交易数据的交易特征。
步骤S103,获取交易行为类型对应的特征评估矩阵,根据特征评估矩阵对 特征文本进行排序,得到资产交易数据对应的目标交易报文;特征文本为与交 易特征相匹配的文本;目标交易报文用于识别资产交易数据的交易合法性。
本申请中,特征评估矩阵可以是指特征评估模型所包含的矩阵,通过该特 征评估矩阵,可以获取到该特征评估矩阵。其中,该特征评估矩阵中可包括一 个或多个行为类型特征分别对应的特征评估值,一个特征评估值可用于表征一 个行为类型特征与交易行为类型之间的匹配度,应当理解,特征评估值越高, 则该行为类型特征越符合该交易行为类型。以下将以交易特征的为N(N为正 整数)个为例,对根据特征评估矩阵确定资产交易数据对应的目标交易报文的 具体方法进行说明,具体方法可为,在通过特征评估模型获取到特征评估矩阵 后,可在特征评估矩阵中,获取N个交易特征分别对应的特征评估值,作为N 个目标特征评估值;随后,根据N个目标特征评估值分别对应的数值大小,可 生成包含N个目标特征评估值的特征评估值序列;根据特征评估值序列,可对 N个交易特征分别对应的特征文本进行排序,根据排序后的N个特征文本可生 成资产交易数据对应的目标交易报文。
应当理解,特征文本可以是指预先为行为类型特征所配置的文本,每个行 为类型特征可配置关联有一个特征文本,而通过该特征评估矩阵中的特征评估 值,可对这些特征文本进行排序。例如,行为类型特征“年龄大于65”配置关 联的特征文本为“老年人”,且该行为类型特征“年龄大于65”对应的特征评 估值为100;行为类型特征“交易对象的姓名都不是中文姓名”配置关联的特 征文本为“交易对象均为外国人”,且该行为类型特征“交易对象的姓名都不是 中文姓名”对应的特征评估值为98;则因为特征评估值100大于特征评估值98, 可将特征文本“老年人”排列于特征文本“交易对象均为外国人”之前。
应当理解,在得到排序后的N个特征文本后,可将这些排序后的N个特征 文本按序进行拼接,从而可以得到拼接文本,该拼接文本即可作为该资产交易 数据的目标交易报文。例如,N个特征文本包括特征文本1“交易对象均为外 国人”、特征文本2“交易频繁、金额巨大”、以及特征文本3“交易主体刻意逃 避关注”,按照特征评估值进行排序后,排列顺序为{特征文本2,特征文本3, 特征文本1},则按{特征文本2,特征文本3,特征文本1}的排列顺序将特征文 本1、特征文本2以及特征文本3进行拼接后,得到的拼接文本为“交易频繁、金额巨大,交易主体刻意逃避关注,交易对象均为外国人”,该拼接文本可作为 该目标交易报文。
其中,应当理解,在将排序后的特征文本按序进行拼接时,可获取报文生 成规则中的最大词量(即最大字数限制),根据该最大词量可对排序后的特征文 本进行过滤,由过滤后的特征文本生成目标交易报文。具体方法可为,可以获 取报文生成规则;其中,报文生成规则用于规定目标交易报文所包含的最大词 量;在排序后的N个特征文本中可选取P个特征文本;P为小于N的正整数; 随后,可获取P个特征文本的文本词量,并将文本词量与最大词量进行匹配; 若该P个特征文本的文本词量小于最大词量,则可按照排序后的N个特征文本 之间的排序顺序,在剩余特征文本中确定候选特征文本;其中,候选特征文本 为N个特征文本中,除P个特征文本以外的特征文本;根据候选特征文本与P 个特征文本,可确定目标特征文本;而若文本词量大于或等于最大词量,则可 将P个特征文本确定为目标特征文本。进一步地,按照排序后的N个特征文本 之间的排序顺序,可对目标特征文本进行拼接,得到资产交易数据对应的目标 交易报文;目标交易报文所包含的报文词量小于或等于最大词量。
其中,对于根据候选特征文本与P个特征文本确定目标特征文本的具体方 法可为,确定最大词量与文本词量之间的词量差值;随后,可以获取候选特征 文本对应的候选文本词量,将候选文本词量与词量差值进行匹配;若候选文本 词量小于或等于词量差值,则可将候选特征文本与P个特征文本,确定为目标 特征文本;而若候选文本词量大于词量差值,则可将P个特征文本确定为目标 特征文本。
应当理解,在根据特征评估矩阵对交易特征对应的特征文本进行排序后, 可按照特征文本的排列顺序,选取前P个特征文本进行拼接,此时,若前P个 特征文本的文本词量已达到该最大词量,则可不再考虑第P+1个特征文本及其 之后的特征文本,可直接将由前P个特征文本所拼接组成的拼接文本作为该资 产交易数据的目标交易报文;而若前P个特征文本的文本词量小于该最大词量, 则可以获取该最大词量与该前P个特征文本的文本词量之间的词量差值,若第 P+1个特征文本的候选文本词量小于或等于该词量差值,则可确定该P+1个特 征文本的总文本词量是满足该最大词量的限制条件的,则可将该第P+1个特征文本也作为该目标交易报文的组成部分;同理,若该前P+1个特征文本的总文 本词量小于该最大词量,则可继续获取该前P+1个特征文本的总文本词量与该 最大词量的词量差值,若该第P+2个特征文本的候选文本词量小于或等于该词 量差值,也可将该第P+2个特征文本作为该目标交易报文的组成部分。也就是 说,通过该最大词量,可对特征文本进行过滤,若前P个特征文本的文本词量 已达到最大词量的限制条件,则将第P+1个及其之后的特征文本进行过滤。
其中,应当理解,上述通过特征评估矩阵对特征文本进行排序,是采用降 序排序的方式,对于特征文本的排序,也可采用升序排序的方式,而按照升序 排序后,可按照排列顺序从后往前选取特征文本进行拼接组成目标交易报文。 也就是说,可以理解的是,无论是升序排序的方式,还是降序排序的方式,都 优先选取特征评估值较高的特征文本进行拼接,而若存在特征评估值相同的特 征文本,则可按照特征文本的原有文本规定顺序进行排序,例如,特征文本1 与特征文本2的特征评估值均为100,但特征文本1与特征文本2的原有文本 规定顺序为{特征文本2,特征文本1},则可按照该顺序{特征文本2,特征文 本1}将特征文本2放置于特征文本1之前。
应当理解,对于上述确认交易特征,并通过特征评估矩阵对交易特征对应 的特征文本进行排序的具体方法,可以如公式(1)所示:
Y=XS·Xm 公式(1)
其中,公式(1)中的XS可以是指特征评估矩阵,Xm可以是指通过交易特 征生成的交易特征矩阵,Y可以是指对用于资产交易数据的交易特征进行评估 的目标特征评估矩阵。
应当理解,特征评估矩阵中包括了交易行为类型的一个或多个行为类型特 征的特征评估值,以下将以行为类型特征包括行为类型特征1、行为类型特征2 以及行为类型特征3为例对公式(1)进行说明,对于行为类型特征1、行为类 型特征2以及行为类型特征3的特征评估矩阵可如特征评估矩阵C1所示:
Figure BDA0002820939750000191
其中,特征评估矩阵C1中的98可为行为类型特征1的特征评估值,100 可为行为类型特征2的特征评估值,97可为行为类型特征3的特征评估值。
进一步地,通过将资产交易数据与该行为类型特征1、行为类型特征2以 及行为类型特征3进行匹配后,可确定该资产交易数据的交易特征为行为类型 特征1与行为类型特征3,则可将该行为类型特征1与行为类型特征3设置为 有效值,例如,将该行为类型特征1与行为类型特征3设置为1;而因为该行 为类型特征2不是该资产交易数据的交易特征,则可将该行为类型特征2设置 为无效值,例如,可将行为类型特征2设置为0,从而可得到包含行为类型特 征1与行为类型特征3对应的有效值(例如,1),以及包含行为类型特征2对 应的无效值(例如,0)的交易特征矩阵,该交易特征矩阵可如交易特征矩阵 C2所示:
Figure BDA0002820939750000201
应当理解,可将上述特征评估矩阵C1与该交易特征矩阵进行相乘运算处 理,即可得到该资产交易数据对应的目标特征评估矩阵C3,该目标特征评估矩 阵C3可如下所示:
Figure BDA0002820939750000202
应当理解,通过该目标特征评估矩阵C3中的特征评估值98与特征评估值 97,即可对资产交易数据的交易特征(即行为类型特征1与行为类型特征3) 对应的特征文本进行排序。
可以理解的是,在生成目标交易报文后,该目标交易报文可用于确定该资 产交易数据的合法性,对于通过该目标交易报文确定资产交易数据的合法性的 具体方法可为,可以获取目标交易报文中的可疑特征文本;其中,该可疑特征 文本为与可疑交易特征相匹配的文本;交易特征可包括可疑交易特征;随后, 可将可疑特征文本与合法特征文本进行匹配;若可疑特征文本满足合法特征文 本所指示的合法条件,则可确定资产交易数据为合法资产交易数据;而若可疑 特征文本不满足合法特征文本所指示的合法条件,则可确定资产交易数据为非 法资产交易数据。例如,该交易特征中包括可疑交易特征“交易金额大于30万元”,可将该可疑交易特征的特征文本“交易金额巨大,超过30万元”作为 可疑特征文本;而因为合法特征文本为“交易金额不大于25万元”,则可确定 该可疑特征文本“交易金额巨大,超过30万元”不满足该合法特征文本“交易 金额不大于25万元”所指示的合法条件,则可确定该目标交易报文对应的资产 交易数据为非法资产交易数据。
可以理解的是,用户终端在终端显示界面中呈现该资产交易数据对应的目 标交易报文后,用户可对该目标交易报文进行调整,得到修正交易报文,而该 修正交易报文可用于对特征评估矩阵进行调整,以使得特征评估矩阵中的特征 评估值更符合用户对行为类型特征以及特征文本的需求。其中,对于用户对目 标交易报文进行调整的具体方法可为,用户可直接对目标交易报文中的文本进 行文本增加、文本删除或文本修改;用户也可通过在行为类型特征中选择资产 交易数据对应的修正交易特征的方式,来修改该目标交易报文中的特征文本, 例如,对于由上述行为类型特征1与行为类型特征3组成的目标交易报文,除 行为类型特征1与行为类型特征3以外,用户所选择的修正交易特征中还包括 行为类型特征2,则该目标交易报文中也会相应增加该行为类型特征2对应的 特征文本,需要说明的是,若用户增加了行为类型特征2,但此时目标交易报 文的文本词量已达到报文生成的最大词量,则用户可通过删除其他行为类型特 征(例如,删除行为类型特征1)的特征文本的方式,来将行为类型特征2的 特征文本添加至报文中。
其中,对于通过修正交易报文对特征评估矩阵进行调整的具体实现方式, 可参见后续图5所对应实施例的描述。
在本申请中,通过获取资产交易数据以及资产交易数据所属的交易行为类 型,可以根据该交易行为类型对应的行为类型特征集合确定出该资产交易数据 的交易特征,而根据该交易行为类型对应的特征评估矩阵可以对该交易特征对 应的特征文本进行排序,可以使得越符合该交易行为类型的交易特征对应的特 征文本排列越靠前,而在生成目标交易报文的时候,可以优先选取排列靠前的 特征文本,从而可以使得目标交易报文更符合该交易行为类型的特征。可以看 出,生成报文的全程无需人工参与,可以实现自动化生成报文,提高报文的生 成效率。同时,应当理解,对于自动生成的目标交易报文,可以通过人工修正, 得到修正交易报文,而通过该修正交易报文可以对特征评估矩阵进行调整,使 得特征评估矩阵中的参数(评估值)更符合人工对行为类型特征以及特征文本 的需求,由此可以保证所生成报文的质量。
进一步地,请参见图5,图5是本申请实施例提供的一种调整特征评估矩 阵的流程示意图。如图5所示,该流程可以包括:
步骤S201,响应针对行为类型特征的选择操作,获取资产交易数据对应的 修正交易特征。
本申请中,该行为类型特征可以为一个或多个,该一个或多个行为类型特 征可以是由人工为交易行为类型所进行定义的特征,该交易行为类型可是指资 产交易数据所属的交易行为类型。
本申请中,用户终端可在终端显示界面中显示针对资产交易数据的目标交 易报文,而审核用户可对该目标交易报文进行修正。例如,用户终端可在显示 该目标交易报文的同时,显示该交易行为类型的全部行为类型特征(并将为资 产交易数据的交易特征的行为类型特征进行标记),而审核用户可对这些全部行 为类型特征进行选择,得到审核用户所选择的资产交易数据的修正交易特征, 用户终端可获取到审核用户所选择的修正交易特征。
步骤S202,根据特征评估矩阵对修正特征文本进行排序,根据排序结果将 资产交易数据对应的目标交易报文更新为修正交易报文;修正特征文本为与修 正交易特征相匹配的文本。
本申请中,根据特征评估矩阵对修正特征文本进行排序的具体实现方式, 可以参见上述图3所对应实施例中,对于根据特征评估矩阵对特征文本进行排 序的描述,这里将不再进行赘述。
进一步地,可根据排序结果将目标交易报文进行更新,得到修正交易报文。 例如,以行为类型特征包括行为类型特征1、行为类型特征2以及行为类型特 征3,且特征评估矩阵为上述特征评估矩阵C1为例,目标交易报文由行为类型 特征1对应的特征文本“交易对象异常”,与行为类型特征3对应的特征文本“交 易地点异常”组成,即目标交易报文为“交易对象异常,交易地点异常”;而审 核用户所选择的修正交易特征为行为类型特征1、行为类型特征2以及行为类 型特征3(即相较于交易特征,审核用户所选择的修正交易特征还包括了行为 类型特征2),则通过特征评估矩阵C1,可确定该行为类型特征2的特征文本 “交易对象均为外国人”应排列于第一位(按照降序排序),则该修正交易报文 可为“交易对象均为外国人,交易对象异常,交易地点异常”。
步骤S203,根据修正交易报文对特征评估模型中的特征评估矩阵进行参数 调整,得到调整后的特征评估矩阵;调整后的特征评估矩阵用于对下一个资产 交易数据对应的特征文本进行排序。
本申请中,对于根据修正交易报文对特征评估模型中的特征评估矩阵进行 参数调整的具体方法可以为,可将交易特征设置为有效值,并将第一剩余特征 设置为无效值,从而可生成包含交易特征对应的有效值与第一剩余特征对应的 无效值的交易特征矩阵;其中,该第一剩余特征可为行为类型特征中除交易特 征以外的特征;同理,可将修正交易特征设置为有效值,将第二剩余特征设置 为无效值,从而可生成包含修正交易特征对应的有效值与第二剩余特征对应的 无效值的修正特征矩阵;其中,该第二剩余特征可为行为类型特征中,除修正 交易特征以外的特征;随后,根据修正特征矩阵与交易特征矩阵,对特征评估 矩阵进行参数调整,得到调整后的特征评估矩阵。
其中,对于根据修正特征矩阵与交易特征矩阵,对特征评估矩阵进行参数 调整的具体方法可为,可将修正特征矩阵与交易特征矩阵进行相减运算处理, 可得到资产交易数据对应的调整特征矩阵;随后,可将调整特征矩阵与特征评 估矩阵进行相加运算处理,将相加运算处理得到的矩阵,作为调整后的特征评 估矩阵。
对于调整特征评估矩阵的具体方法,可如公式(2)所示:
Figure BDA0002820939750000231
其中,Xs可用于表征特征评估矩阵,Pi可用于表征资产交易数据i对应的 调整特征评估矩阵,
Figure BDA0002820939750000232
可用于表征将n个资产交易数据对应的调整特征评估 矩阵进行求和所得到的值;Xsn可用于表征调整后的特征评估矩阵。
应当理解,一段时间(例如,一个小时,30分钟,20小时,3天,等等) 内,一种交易行为类型的资产交易数据可包括有n个,则可以确定出每个资产 交易数据对应的调整评估矩阵,并将这n个资产交易数据的调整评估矩阵进行 求和,从而可以得到总的调整评估矩阵;进一步地,可将该总的调整评估矩阵 与该特征评估矩阵Xs进行相加,即可得到调整后的特征评估矩阵Xsn
例如,以公式(2)中的n为1,行为类型特征包括行为类型特征1、行为 类型特征2以及行为类型特征3,交易特征为行为类型特征1与行为类型特征3, 特征评估矩阵为上述特征评估矩阵C1、且交易特征矩阵为上述交易特征矩阵 C2为例,若修正交易特征为行为类型特征1、行为类型特征2以及行为类型特 征3,则可将该行为类型特征1、行为类型特征2以及行为类型特征3设置为有 效值,如,该行为类型特征1、行为类型特征2以及行为类型特征3均设置为1; 从而可得到包含行为类型特征1、行为类型特征2以及行为类型特征3对应的有效值(例如,1)的修正特征矩阵,该修正特征矩阵可如修正特征矩阵C4所 示:
Figure BDA0002820939750000241
进一步地,可将该交易特征矩阵C2与该修正特征矩阵C4进行相减运算处 理,从而可得到该资产交易数据对应的调整特征矩阵C5,该调整特征矩阵C5 可如下所示:
Figure BDA0002820939750000242
进一步地,可将该特征评估矩阵C1与该调整特征评估矩阵C5进行相加, 即可得到调整后的特征评估矩阵C6,该调整后的特征评估矩阵可如下所示:
Figure BDA0002820939750000243
可以看出,调整后的特征评估矩阵C6中,对于审核用户所选择的行为类 型特征2的特征评估值有所调整提高,从而在生成报文时,可以优先选取特征 评估值高的行为类型特征对应的特征文本,即,该行为类型特征2的特征文本 被选取的概率也会更高,则通过特征评估矩阵所生成的目标交易报文也会更为 符合人工对于行为类型特征以及对应特征文本的需求,即生成的目标交易报文 的质量会更高。
在本申请中,通过响应用户对行为类型特征的选择操作,可以获取到用户 所选择的修正交易特征,根据该修正交易特征可生成修正交易报文,而通过该 修正交易报文可对特征评估矩阵进行调整,使得特征评估矩阵可以对人工选择 的特征进行学习,使之更为符合人工需求,从而可以保证自动化生成目标交易 报文的质量。
进一步地,请参见图6,图6是本申请实施例提供的一种系统框架图。如 图6所示,该系统中可包括报文输出模块、特征评估模型以及报文生成应用。 以下将对报文输出模块、特征评估模型以及报文生成应用的功能进行阐述:
报文生成应用,报文生成应用可以用于用户输入资产交易数据,以及可用 于用户选择该资产交易数据所属的交易行为类型。
报文输出模块,报文输出模块可用于接收报文生成应用的资产交易数据以 及交易行为类型,并获取该交易行为类型对应的行为类型特征集合,根据该行 为类型特征集合确定该资产交易数据的交易特征;同时,该报文输出模块可获 取来自特征评估模型的特征评估矩阵,在报文输出模块中,可通过该特征评估 矩阵对该交易特征对应的特征文本进行排序,从而可生成该资产交易数据的目 标交易报文;该报文输出模块可将该目标交易报文反馈至报文生成应用,并接 收用户通过该报文生成应用对该目标交易报文进行修正后的修正交易报文(即, 人工修正后的修正交易报文)。
特征评估模型,特征评估模型可用于向报文输出模块提供任一交易行为类 型的特征评估矩阵;同时,该特征评估模型可接收报文输出模块反馈的修正交 易报文,并根据该修正交易报文对特征评估矩阵进行调整。
其中,应当理解,上述报文输出模块、报文生成应用以及特征评估模型均 可集成于用户终端或业务服务器中,对于报文输出模块、报文生成应用以及特 征评估模型的功能的具体实现方式(例如,生成资产交易数据的目标交易报文 的具体实现方式,或对目标交易报文进行修正得到修正交易报文并通过修正交 易报文调整特征评估矩阵的具体实现方式),可参见上述图4-图5所对应实施 例中的描述,这里将不再进行赘述。
进一步地,请参见图7,图7是本申请实施例提供的一种生成目标交易报 文的逻辑流程图。如图7所示,该逻辑流程可包括以下步骤:
步骤S301,获取特征评估矩阵。
本申请中,在获取资产交易数据以及资产交易数据所属的交易行为类型后, 可以获取该交易行为类型对应的特征评估矩阵。
步骤S302,根据特征评估矩阵对特征文本进行排序。
本申请中,可按照特征评估矩阵中的特征评估值的大小,对资产交易数据 对应的交易特征的特征文本进行排序(可按照降序排序,也可以按照升序排序)。
步骤S303,将特征评估值相同的特征文本按照原有规定顺序进行排序。
本申请中,若存在特征评估值相同的特征文本,则可以按照特征文本的原 有规定顺序(可以为人工规定顺序)进行排序以及拼接。
步骤S304,确定字数是否大于或等于最大词量。
本申请中,将特征文本进行排序后,可按序选取前P个特征文本,并按序 进行拼接,以拼接生成目标交易报文,而这里的字数可是指前P个特征文本的 文本词量。若该前P个特征文本的文本词量小于最大词量,则可进入步骤S305; 而若该前P个特征文本的文本词量大于或等于最大词量,则可进入步骤S309, 将该前P个特征文本所拼接得到的特征文本作为目标交易报文。
步骤S305,确定特征文本是否已全部添加完。
本申请中,若上述前P个特征文本的文本词量是小于最大词量的,此时可 确定交易特征的特征文本是否已全部添加完,若交易特征为P个,则特征文本 总共也为P个,则此时特征文本已全部添加完毕,则可将前P个特征文本拼接 组成的拼接文本确定为目标交易报文(即,可进入步骤S309)。而若该特征文 本还未添加完毕,则可进入步骤S306。
步骤S306,按顺序添加交易特征对应的特征文本。
本申请中,若特征文本还未添加完毕,则可获取第P+1个特征文本,并将 第P+1个特征文本添加于第P个特征文本之后。
步骤S307,确定字数是否大于最大词量。
本申请中,可获取前P+1个特征文本的字数(即文本词量),若该前P+1 个特征文本的字数大于最大词量,则可进入步骤S308;若该前P+1个特征文本 的字数小于或等于最大词量,则可以进入步骤S305。
步骤S308,去除最后添加的特征文本。
本申请中,若前P+1个特征文本的字数大于最大词量,则可说明第P+1个 特征文本添加后,文本词量已不满足最大词量的限制条件,则可将该第P+1个 特征文本进行删除。
步骤S309,生成目标交易报文。
其中,对于步骤S301-步骤S309的具体实现方式,可参见上述图4所对应 实施例中步骤S101-步骤S103对于生成目标交易报文的描述,这里将不再进行 赘述。
在本申请中,通过获取资产交易数据以及资产交易数据所属的交易行为类 型,可以根据该交易行为类型对应的行为类型特征集合确定出该资产交易数据 的交易特征,而根据该交易行为类型对应的特征评估矩阵可以对该交易特征对 应的特征文本进行排序,可以使得越符合该交易行为类型的交易特征对应的特 征文本排列越靠前,而在生成目标交易报文的时候,可以优先选取排列靠前的 特征文本,从而可以使得目标交易报文更符合该交易行为类型的特征。可以看 出,生成报文的全程无需人工参与,可以实现自动化生成报文,提高报文的生 成效率。
进一步地,请参见图8,图8是本申请实施例提供的一种数据处理装置的 结构示意图。该数据处理装置可以是运行于计算机设备中的一个计算机程序(包 括程序代码),例如该数据处理装置为一个应用软件;该数据处理装置可以用于 执行图4或图5所示的方法。如图8所示,数据处理装置1可以包括:数据获 取模块11、特征确定模块12以及报文生成模块13。
数据获取模块11,用于获取资产交易数据以及资产交易数据所属的交易行 为类型;
特征确定模块12,用于根据资产交易数据与交易行为类型确定资产交易数 据对应的交易特征;
报文生成模块13,用于获取交易行为类型对应的特征评估矩阵,根据特征 评估矩阵对特征文本进行排序,得到资产交易数据对应的目标交易报文;特征 文本为与交易特征相匹配的文本;目标交易报文用于识别资产交易数据的交易 合法性。
其中,数据获取模块11、特征确定模块12以及报文生成模块13的具体实 现方式,可参见上述图4所对应实施例中步骤S101-步骤S103的描述,这里将 不再进行赘述。
请参见图8,特征确定模块12可以包括:集合获取单元121、数据匹配单 元122以及特征确定单元123。
集合获取单元121,用于获取交易行为类型对应的行为类型特征集合;
数据匹配单元122,用于将资产交易数据与行为类型特征集合进行匹配;
特征确定单元123,用于若行为类型特征集合中存在与资产交易数据相匹 配的行为类型特征,则将与资产交易数据相匹配的行为类型特征作为资产交易 数据对应的交易特征。
其中,集合获取单元121、数据匹配单元122以及特征确定单元123的具 体实现方式,可参见上述图4所对应实施例中步骤S102中的描述,这里将不 再进行赘述。
其中,特征评估矩阵为特征评估模型所包含的矩阵;交易特征的数量为N, N为正整数;
请参见图8,报文生成模块13可以包括:矩阵获取单元131、评估值确定 单元132、序列生成单元133以及报文生成单元134。
矩阵获取单元131,用于通过特征评估模型,获取交易行为类型对应的特 征评估矩阵;特征评估矩阵包括一个或多个行为类型特征分别对应的特征评估 值;特征评估值用于表征行为类型特征与交易行为类型的匹配度;
评估值确定单元132,用于在特征评估矩阵中,获取N个交易特征分别对 应的特征评估值,作为N个目标特征评估值;
序列生成单元133,用于根据N个目标特征评估值分别对应的数值大小, 生成包含N个目标特征评估值的特征评估值序列;
文本排序单元134,用于根据特征评估值序列,对N个交易特征分别对应 的特征文本进行排序;
报文生成单元135,用于根据排序后的N个特征文本生成资产交易数据对 应的目标交易报文。
其中,矩阵获取单元131、评估值确定单元132、序列生成单元133、文本 排序单元134以及报文生成单元135的具体实现方式,可参见上述图4所对应 实施例中步骤S103中的描述,这里将不再进行赘述。
请参见图8,报文生成单元135可以包括:规则获取子单元1351、文本确 定子单元1352以及文本拼接子单元1353。
规则获取子单元1351,用于获取报文生成规则;报文生成规则用于规定目 标交易报文所包含的最大词量;
文本确定子单元1352,用于根据最大词量,在排序后的N个特征文本中确 定目标特征文本;
文本拼接子单元1353,用于按照排序后的N个特征文本之间的排序顺序, 对目标特征文本进行拼接,得到资产交易数据对应的目标交易报文;目标交易 报文所包含的报文词量小于或等于最大词量。
其中,规则获取子单元1351、文本确定子单元1352以及文本拼接子单元1353的具体实现方式,可参见上述图4所对应实施例中步骤S103中的描述, 这里将不再进行赘述。
其中,文本确定子单元,还用于在排序后的N个特征文本中选取P个特征 文本;P为小于N的正整数;
文本确定子单元1352,还用于获取P个特征文本的文本词量,将文本词量 与最大词量进行匹配;
文本确定子单元1352,还用于若文本词量小于最大词量,则按照排序后的 N个特征文本之间的排序顺序,在剩余特征文本中确定候选特征文本;候选特 征文本为N个特征文本中,除P个特征文本以外的特征文本;
文本确定子单元1352,还用于根据候选特征文本与P个特征文本,确定目 标特征文本;
文本确定子单元1352,还用于若文本词量大于或等于最大词量,则将P个 特征文本确定为目标特征文本。
其中,文本确定子单元1352,还用于确定最大词量与文本词量之间的词量 差值;
文本确定子单元1352,还用于获取候选特征文本对应的候选文本词量,将 候选文本词量与词量差值进行匹配;
文本确定子单元1352,还用于若候选文本词量小于或等于词量差值,则将 候选特征文本与P个特征文本,确定为目标特征文本;
文本确定子单元1352,还用于若候选文本词量大于词量差值,则将P个特 征文本确定为目标特征文本。
请参见图8,该数据处理装置1还可以包括:修正特征获取模块14、报文 更新模块15以及参数调整模块16。
修正特征获取模块14,用于响应针对行为类型特征的选择操作,获取资产 交易数据对应的修正交易特征;
报文更新模块15,用于根据特征评估矩阵对修正特征文本进行排序,根据 排序结果将资产交易数据对应的目标交易报文更新为修正交易报文;修正特征 文本为与修正交易特征相匹配的文本;
参数调整模块16,用于根据修正交易报文对特征评估模型中的特征评估矩 阵进行参数调整,得到调整后的特征评估矩阵;调整后的特征评估矩阵用于对 下一个资产交易数据对应的特征文本进行排序。
其中,修正特征获取模块14、报文更新模块15以及参数调整模块16的具 体实现方式,可参见上述图5所对应实施例中步骤S201-步骤S203的描述,这 里将不再进行赘述。
请参见图8,参数调整模块16可以包括:赋值单元161以及矩阵调整单元 162。
赋值单元161,用于将交易特征设置为有效值,将第一剩余特征设置为无 效值,生成包含交易特征对应的有效值与第一剩余特征对应的无效值的交易特 征矩阵;第一剩余特征为行为类型特征中除交易特征以外的特征;
赋值单元161,还用于将修正交易特征设置为有效值,将第二剩余特征设 置为无效值,生成包含修正交易特征对应的有效值与第二剩余特征对应的无效 值的修正特征矩阵;第二剩余特征为行为类型特征中,除修正交易特征以外的 特征;
矩阵调整单元162,用于根据修正特征矩阵与交易特征矩阵,对特征评估 矩阵进行参数调整,得到调整后的特征评估矩阵。
其中,赋值单元161以及矩阵调整单元162的具体实现方式,可参见上述 图5所对应实施例中步骤S203的描述,这里将不再进行赘述。
请参见图8,矩阵调整单元162可以包括:运算子单元1621以及矩阵确定 子单元1622。
运算子单元1621,用于将修正特征矩阵与交易特征矩阵进行相减运算处理, 得到资产交易数据对应的调整特征矩阵;
矩阵确定子单元1622,用于将调整特征矩阵与特征评估矩阵进行相加运算 处理,将相加运算处理得到的矩阵,作为调整后的特征评估矩阵。
其中,运算子单元1621以及矩阵确定子单元1622的具体实现方式,可参 见上述图5所对应实施例中步骤S203的描述,这里将不再进行赘述。
请参见图8,该数据处理装置1还可以包括:可疑文本获取模块17、文本 匹配模块18以及数据确定模块19。
可疑文本获取模块17,用于获取目标交易报文中的可疑特征文本;可疑特 征文本为与可疑交易特征相匹配的文本;交易特征包括可疑交易特征;
文本匹配模块18,用于将可疑特征文本与合法特征文本进行匹配;
数据确定模块19,用于若可疑特征文本满足合法特征文本所指示的合法条 件,则确定资产交易数据为合法资产交易数据;
数据确定模块19,还用于若可疑特征文本不满足合法特征文本所指示的合 法条件,则确定资产交易数据为非法资产交易数据。
其中,可疑文本获取模块17、文本匹配模块18以及数据确定模块19的具 体实现方式,可参见上述图4所对应实施例中步骤S103中的描述,这里将不 再进行赘述。
在本申请中,通过获取资产交易数据以及资产交易数据所属的交易行为类 型,可以根据该交易行为类型对应的行为类型特征集合确定出该资产交易数据 的交易特征,而根据该交易行为类型对应的特征评估矩阵可以对该交易特征对 应的特征文本进行排序,可以使得越符合该交易行为类型的交易特征对应的特 征文本排列越靠前,而在生成目标交易报文的时候,可以优先选取排列靠前的 特征文本,从而可以使得目标交易报文更符合该交易行为类型的特征。可以看 出,生成报文的全程无需人工参与,可以实现自动化生成报文,提高报文的生 成效率。同时,应当理解,对于自动生成的目标交易报文,可以通过人工修正, 得到修正交易报文,而通过该修正交易报文可以对特征评估矩阵进行调整,使 得特征评估矩阵中的参数(评估值)更符合人工对行为类型特征以及特征文本 的需求,由此可以保证所生成报文的质量。
进一步地,请参见图9,图9是本申请实施例提供的一种计算机设备的结 构示意图。如图9所示,上述图8所对应实施例中的装置1可以应用于上述计 算机设备1000,上述计算机设备1000可以包括:处理器1001,网络接口1004 和存储器1005,此外,上述计算机设备1000还包括:用户接口1003,和至少 一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。 其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用 户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可 以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速 RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一 个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001 的存储装置。如图9所示,作为一种计算机可读存储介质的存储器1005中可以 包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图9所示的计算机设备1000中,网络接口1004可提供网络通讯功能; 而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调 用存储器1005中存储的设备控制应用程序,以实现:
获取资产交易数据以及资产交易数据所属的交易行为类型;
根据资产交易数据与交易行为类型确定资产交易数据对应的交易特征;
获取交易行为类型对应的特征评估矩阵,根据特征评估矩阵对特征文本进 行排序,得到资产交易数据对应的目标交易报文;特征文本为与交易特征相匹 配的文本;目标交易报文用于识别资产交易数据的交易合法性。
在一个实施例中,处理器1001在执行根据资产交易数据与交易行为类型确 定资产交易数据对应的交易特征时,具体执行以下步骤:
获取交易行为类型对应的行为类型特征集合;
将资产交易数据与行为类型特征集合进行匹配;
若行为类型特征集合中存在与资产交易数据相匹配的行为类型特征,则将 与资产交易数据相匹配的行为类型特征作为资产交易数据对应的交易特征。
其中,特征评估矩阵为特征评估模型所包含的矩阵;交易特征的数量为N, N为正整数;
在一个实施例中,处理器1001在执行获取交易行为类型对应的特征评估矩 阵,根据特征评估矩阵对特征文本进行排序,得到资产交易数据对应的目标交 易报文时,具体执行以下步骤:
通过特征评估模型,获取交易行为类型对应的特征评估矩阵;特征评估矩 阵包括一个或多个行为类型特征分别对应的特征评估值;特征评估值用于表征 行为类型特征与交易行为类型的匹配度;
在特征评估矩阵中,获取N个交易特征分别对应的特征评估值,作为N个 目标特征评估值;
根据N个目标特征评估值分别对应的数值大小,生成包含N个目标特征评 估值的特征评估值序列;
根据特征评估值序列,对N个交易特征分别对应的特征文本进行排序,根 据排序后的N个特征文本生成资产交易数据对应的目标交易报文。
在一个实施例中,处理器1001在执行根据特征评估值序列,对N个交易 特征分别对应的特征文本进行排序,根据排序后的N个特征文本生成资产交易 数据对应的目标交易报文时,具体执行以下步骤:
获取报文生成规则;报文生成规则用于规定目标交易报文所包含的最大词 量;
根据最大词量,在排序后的N个特征文本中确定目标特征文本;
按照排序后的N个特征文本之间的排序顺序,对目标特征文本进行拼接, 得到资产交易数据对应的目标交易报文;目标交易报文所包含的报文词量小于 或等于最大词量。
在一个实施例中,处理器1001在执行根据最大词量,在排序后的N个特 征文本中确定目标特征文本时,具体执行以下步骤:
在排序后的N个特征文本中选取P个特征文本;P为小于N的正整数;
获取P个特征文本的文本词量,将文本词量与最大词量进行匹配;
若文本词量小于最大词量,则按照排序后的N个特征文本之间的排序顺序, 在剩余特征文本中确定候选特征文本;候选特征文本为N个特征文本中,除P 个特征文本以外的特征文本;
根据候选特征文本与P个特征文本,确定目标特征文本;
若文本词量大于或等于最大词量,则将P个特征文本确定为目标特征文本。
在一个实施例中,处理器1001在执行根据候选特征文本与P个特征文本, 确定目标特征文本时,具体执行以下步骤:
确定最大词量与文本词量之间的词量差值;
获取候选特征文本对应的候选文本词量,将候选文本词量与词量差值进行 匹配;
若候选文本词量小于或等于词量差值,则将候选特征文本与P个特征文本, 确定为目标特征文本;
若候选文本词量大于词量差值,则将P个特征文本确定为目标特征文本。
在一个实施例中,处理器1001还具体执行以下步骤:
响应针对行为类型特征的选择操作,获取资产交易数据对应的修正交易特 征;
根据特征评估矩阵对修正特征文本进行排序,根据排序结果将资产交易数 据对应的目标交易报文更新为修正交易报文;修正特征文本为与修正交易特征 相匹配的文本;
根据修正交易报文对特征评估模型中的特征评估矩阵进行参数调整,得到 调整后的特征评估矩阵;调整后的特征评估矩阵用于对下一个资产交易数据对 应的特征文本进行排序。
在一个实施例中,处理器在执行根据修正交易报文对特征评估模型中的特 征评估矩阵进行参数调整,得到调整后的特征评估矩阵时,具体执行以下步骤:
将交易特征设置为有效值,将第一剩余特征设置为无效值,生成包含交易 特征对应的有效值与第一剩余特征对应的无效值的交易特征矩阵;第一剩余特 征为行为类型特征中除交易特征以外的特征;
将修正交易特征设置为有效值,将第二剩余特征设置为无效值,生成包含 修正交易特征对应的有效值与第二剩余特征对应的无效值的修正特征矩阵;第 二剩余特征为行为类型特征中,除修正交易特征以外的特征;
根据修正特征矩阵与交易特征矩阵,对特征评估矩阵进行参数调整,得到 调整后的特征评估矩阵。
在一个实施例中,处理器1001在执行根据修正特征矩阵与交易特征矩阵, 对特征评估矩阵进行参数调整,得到调整后的特征评估矩阵时,具体执行以下 步骤:
将修正特征矩阵与交易特征矩阵进行相减运算处理,得到资产交易数据对 应的调整特征矩阵;
将调整特征矩阵与特征评估矩阵进行相加运算处理,将相加运算处理得到 的矩阵,作为调整后的特征评估矩阵。
在一个实施例中,处理器1001还具体执行以下步骤:
获取目标交易报文中的可疑特征文本;可疑特征文本为与可疑交易特征相 匹配的文本;交易特征包括可疑交易特征;
将可疑特征文本与合法特征文本进行匹配;
若可疑特征文本满足合法特征文本所指示的合法条件,则确定资产交易数 据为合法资产交易数据;
若可疑特征文本不满足合法特征文本所指示的合法条件,则确定资产交易 数据为非法资产交易数据。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图4或图 5所对应实施例中对该数据处理方法的描述,也可执行前文图8所对应实施例 中对该数据处理装置1的描述,在此不再赘述。另外,对采用相同方法的有益 效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介 质,且上述计算机可读存储介质中存储有前文提及的数据处理的计算机设备 1000所执行的计算机程序,且上述计算机程序包括程序指令,当上述处理器执 行上述程序指令时,能够执行前文图4或图5所对应实施例中对上述数据处理 方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果 描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未 披露的技术细节,请参照本申请方法实施例的描述。
上述计算机可读存储介质可以是前述任一实施例提供的数据处理装置或者 上述计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可 读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备 的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital, SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既 包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介 质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机 可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机 程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储 介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理 器执行该计算机指令,使得该计算机设备执行本申请实施例中一方面提供的方 法。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等 是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们 任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、 方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括 没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或 设备固有的其他步骤单元。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示 例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现, 为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地 描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决 于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用 来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范 围。
本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程 图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或 结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框 的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理 机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其 他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或 多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算 机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工 作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括 指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示 意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算 机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系 列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行 的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或 多个方框中指定的功能的步骤。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之 权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (13)

1.一种数据处理方法,其特征在于,包括:
获取资产交易数据以及所述资产交易数据所属的交易行为类型;
根据所述资产交易数据与所述交易行为类型确定所述资产交易数据对应的交易特征;
获取所述交易行为类型对应的特征评估矩阵,根据所述特征评估矩阵对特征文本进行排序,得到所述资产交易数据对应的目标交易报文;所述特征文本为与所述交易特征相匹配的文本;所述目标交易报文用于识别所述资产交易数据的交易合法性。
2.根据权利要求1所述的方法,其特征在于,所述根据所述资产交易数据与所述交易行为类型确定所述资产交易数据对应的交易特征,包括:
获取所述交易行为类型对应的行为类型特征集合;
将所述资产交易数据与所述行为类型特征集合进行匹配;
若所述行为类型特征集合中存在与所述资产交易数据相匹配的行为类型特征,则将所述与所述资产交易数据相匹配的行为类型特征作为所述资产交易数据对应的交易特征。
3.根据权利要求1所述的方法,其特征在于,所述特征评估矩阵为特征评估模型所包含的矩阵;所述交易特征的数量为N,N为正整数;
所述获取所述交易行为类型对应的特征评估矩阵,根据所述特征评估矩阵对特征文本进行排序,得到所述资产交易数据对应的目标交易报文,包括:
通过所述特征评估模型,获取所述交易行为类型对应的所述特征评估矩阵;所述特征评估矩阵包括一个或多个行为类型特征分别对应的特征评估值;所述特征评估值用于表征所述行为类型特征与所述交易行为类型的匹配度;
在所述特征评估矩阵中,获取所述N个交易特征分别对应的特征评估值,作为N个目标特征评估值;
根据所述N个目标特征评估值分别对应的数值大小,生成包含所述N个目标特征评估值的特征评估值序列;
根据所述特征评估值序列,对所述N个交易特征分别对应的特征文本进行排序,根据排序后的N个特征文本生成所述资产交易数据对应的目标交易报文。
4.根据权利要求3所述的方法,其特征在于,所述根据排序后的N个特征文本生成所述资产交易数据对应的目标交易报文,包括:
获取报文生成规则;所述报文生成规则用于规定所述目标交易报文所包含的最大词量;
根据所述最大词量,在所述排序后的N个特征文本中确定目标特征文本;
按照所述排序后的N个特征文本之间的排序顺序,对所述目标特征文本进行拼接,得到所述资产交易数据对应的所述目标交易报文;所述目标交易报文所包含的报文词量小于或等于所述最大词量。
5.根据权利要求4所述的方法,其特征在于,所述根据所述最大词量,在所述排序后的N个特征文本中确定目标特征文本,包括:
在所述排序后的N个特征文本中选取P个特征文本;P为小于N的正整数;
获取所述P个特征文本的文本词量,将所述文本词量与所述最大词量进行匹配;
若所述文本词量小于所述最大词量,则按照所述排序后的N个特征文本之间的排序顺序,在剩余特征文本中确定候选特征文本;所述候选特征文本为所述N个特征文本中,除所述P个特征文本以外的特征文本;
根据所述候选特征文本与所述P个特征文本,确定所述目标特征文本;
若所述文本词量大于或等于所述最大词量,则将所述P个特征文本确定为所述目标特征文本。
6.根据权利要求5所述的方法,其特征在于,所述根据所述候选特征文本与所述P个特征文本,确定所述目标特征文本,包括:
确定所述最大词量与所述文本词量之间的词量差值;
获取所述候选特征文本对应的候选文本词量,将所述候选文本词量与所述词量差值进行匹配;
若所述候选文本词量小于或等于所述词量差值,则将所述候选特征文本与所述P个特征文本,确定为所述目标特征文本;
若所述候选文本词量大于所述词量差值,则将所述P个特征文本确定为所述目标特征文本。
7.根据权利要求2所述的方法,其特征在于,所述方法还包括:
响应针对所述行为类型特征的选择操作,获取所述资产交易数据对应的修正交易特征;
根据所述特征评估矩阵对修正特征文本进行排序,根据排序结果将所述资产交易数据对应的目标交易报文更新为修正交易报文;所述修正特征文本为与所述修正交易特征相匹配的文本;
根据所述修正交易报文对所述特征评估模型中的所述特征评估矩阵进行参数调整,得到调整后的特征评估矩阵;所述调整后的特征评估矩阵用于对下一个资产交易数据对应的特征文本进行排序。
8.根据权利要求7所述的方法,其特征在于,所述根据所述修正交易报文对所述特征评估模型中的所述特征评估矩阵进行参数调整,得到调整后的特征评估矩阵,包括:
将所述交易特征设置为有效值,将第一剩余特征设置为无效值,生成包含所述交易特征对应的有效值与所述第一剩余特征对应的无效值的交易特征矩阵;所述第一剩余特征为所述行为类型特征中除所述交易特征以外的特征;
将所述修正交易特征设置为所述有效值,将第二剩余特征设置为所述无效值,生成包含所述修正交易特征对应的有效值与所述第二剩余特征对应的无效值的修正特征矩阵;所述第二剩余特征为所述行为类型特征中,除所述修正交易特征以外的特征;
根据所述修正特征矩阵与所述交易特征矩阵,对所述特征评估矩阵进行参数调整,得到调整后的特征评估矩阵。
9.根据权利要求8所述的方法,其特征在于,所述根据所述修正特征矩阵与所述交易特征矩阵,对所述特征评估矩阵进行参数调整,得到调整后的特征评估矩阵,包括:
将所述修正特征矩阵与所述交易特征矩阵进行相减运算处理,得到所述资产交易数据对应的调整特征矩阵;
将所述调整特征矩阵与所述特征评估矩阵进行相加运算处理,将相加运算处理得到的矩阵,作为所述调整后的特征评估矩阵。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标交易报文中的可疑特征文本;所述可疑特征文本为与可疑交易特征相匹配的文本;所述交易特征包括所述可疑交易特征;
将所述可疑特征文本与合法特征文本进行匹配;
若所述可疑特征文本满足所述合法特征文本所指示的合法条件,则确定所述资产交易数据为合法资产交易数据;
若所述可疑特征文本不满足所述合法特征文本所指示的合法条件,则确定所述资产交易数据为非法资产交易数据。
11.一种数据处理装置,其特征在于,包括:
数据获取模块,用于获取资产交易数据以及所述资产交易数据所属的交易行为类型;
特征确定模块,用于根据所述资产交易数据与所述交易行为类型确定所述资产交易数据对应的交易特征;
报文生成模块,用于获取所述交易行为类型对应的特征评估矩阵,根据所述特征评估矩阵对特征文本进行排序,得到所述资产交易数据对应的目标交易报文;所述特征文本为与所述交易特征相匹配的文本;所述目标交易报文用于识别所述资产交易数据的交易合法性。
12.一种计算机设备,其特征在于,包括:处理器、存储器以及网络接口;
所述处理器与所述存储器、所述网络接口相连,其中,所述网络接口用于提供网络通信功能,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行权利要求1-10任一项所述的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序适于由处理器加载并执行权利要求1-10任一项所述的方法。
CN202011418189.8A 2020-12-07 2020-12-07 一种数据处理方法、装置、设备及可读存储介质 Pending CN114596153A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011418189.8A CN114596153A (zh) 2020-12-07 2020-12-07 一种数据处理方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011418189.8A CN114596153A (zh) 2020-12-07 2020-12-07 一种数据处理方法、装置、设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN114596153A true CN114596153A (zh) 2022-06-07

Family

ID=81812385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011418189.8A Pending CN114596153A (zh) 2020-12-07 2020-12-07 一种数据处理方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN114596153A (zh)

Similar Documents

Publication Publication Date Title
CN110084377B (zh) 用于构建决策树的方法和装置
CN111401558B (zh) 数据处理模型训练方法、数据处理方法、装置、电子设备
CN109388674B (zh) 数据处理方法、装置、设备及可读存储介质
CN113011889B (zh) 账号异常识别方法、系统、装置、设备及介质
CN110929806B (zh) 基于人工智能的图片处理方法、装置及电子设备
KR102144126B1 (ko) 기업을 위한 정보 제공 장치 및 방법
CN115130711A (zh) 一种数据处理方法、装置、计算机及可读存储介质
US20240005165A1 (en) Machine learning model training method, prediction method therefor, apparatus, device, computer-readable storage medium, and computer program product
CN109690581A (zh) 用户指导系统及方法
CN111522724A (zh) 异常账号的确定方法、装置、服务器及存储介质
CN113918738B (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN112995155A (zh) 金融异常报文识别方法及装置
CN111667018B (zh) 一种对象聚类的方法、装置、计算机可读介质及电子设备
CN114996486A (zh) 一种数据推荐方法、装置、服务器以及存储介质
CN112269875A (zh) 文本分类方法、装置、电子设备及存储介质
CN114596153A (zh) 一种数据处理方法、装置、设备及可读存储介质
CN113033209B (zh) 文本关系抽取方法、装置、存储介质及计算机设备
CN113269179B (zh) 数据处理方法、装置、设备及存储介质
CN114742163A (zh) 一种售后任务的审核方法及装置
CN114723455A (zh) 业务处理方法、装置、电子设备和存储介质
CN111882415A (zh) 一种质量检测模型的训练方法和相关装置
CN111882416A (zh) 一种风险预测模型的训练方法和相关装置
CN113450127A (zh) 信息展示方法、装置、计算机设备及存储介质
CN114817526B (zh) 文本分类方法及装置、存储介质、终端
CN112231367B (zh) 基于人工智能的业务处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination