CN111198945A - 数据处理方法、装置、介质及电子设备 - Google Patents
数据处理方法、装置、介质及电子设备 Download PDFInfo
- Publication number
- CN111198945A CN111198945A CN201911222371.3A CN201911222371A CN111198945A CN 111198945 A CN111198945 A CN 111198945A CN 201911222371 A CN201911222371 A CN 201911222371A CN 111198945 A CN111198945 A CN 111198945A
- Authority
- CN
- China
- Prior art keywords
- information
- current
- compliance
- text
- product
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000013145 classification model Methods 0.000 claims abstract description 35
- 239000013598 vector Substances 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 238000012015 optical character recognition Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000013475 authorization Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/401—Transaction verification
- G06Q20/4016—Transaction verification involving fraud or risk level assessment in transaction processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种数据处理方法、装置、计算机可读存储介质和电子设备,涉及计算机技术领域,所述方法包括:获取当前产品的当前交易信息;将音频信息、图像信息和第一文本信息转换为当前词向量;将当前词向量输入至训练完成的文本分类模型,输出所述当前交易信息对应的目标合规风险类型;获取目标行业的合规判断库;将当前产品的产品信息输入至所述合规判断库,输出当前产品的合规风险识别结果。本发明实施例的技术方案中,通过将当前交易信息转换成的词向量输入至文本分类模型,将当前产品的产品信息输入至合规判断库,可以较为方便智能地得到当前交易信息的合规情况和当前产品的合规风险。
Description
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种数据处理方法、装置、计算机可读介质及电子设备。
背景技术
在金融行业中,金融产品销售过程是否符合行业和法律规定,需要经过严格审查。
在审查金融产品销售过程是否合规时,审查人员需要参考大量的同类金融产品的销售过程案例,以及与该金融产品的销售过程相关的法规等识别风险和规避风险信息。这些信息具体包括:金融产品相关制度的角色、数据、流程、接口、权限、授权等信息,金融行业相关制度的审计架构,金融创新产品的效率、成本和体验,金融产品相关风险的识别与计量,金融创新产品和业务流程的标注与规范,金融产品相关规避风险的案例,相关金融产品系统是否安全可控。
综合以上信息对金融产品的销售过程是否合规进行审核时,审查人员的工作量较大。
如何高效智能地对金融产品的销售过程进行合规审查是亟待解决的技术问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种数据处理方法、装置、计算机可读介质及电子设备,进而至少在一定程度上克服不能智能判断金融产品的销售过程的合规风险的问题。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的第一方面,提供了一种数据处理方法,包括:获取当前产品的当前交易信息,所述当前交易信息包括音频信息、图像信息和第一文本信息;将所述音频信息、所述图像信息和所述第一文本信息转换为当前词向量;将所述当前词向量输入至训练完成的文本分类模型,输出所述当前交易信息对应的目标合规风险类型;其中,所述文本分类模型根据所述历史交易信息及其标注的合规风险类型训练完成;获取目标行业的合规判断库;将当前产品的产品信息输入至所述合规判断库,输出所述当前产品的合规风险识别结果。
在一些实施例中,所述方法还包括:获取训练集,所述训练集包括所述历史交易信息及其标注的合规风险类型;利用所述训练集训练所述文本分类模型。
在一些实施例中,所述获取训练集之前,所述方法还包括:将所述历史交易信息上传到区块链网络中。
在一些实施例中,所述文本分类模型包括用于文本分类的卷积神经网络。
在一些实施例中,将所述音频信息、所述图像信息和所述第一文本信息转换为当前词向量,包括:
将所述音频信息和所述图像信息转换为第二文本信息;
将所述第一文本信息和所述第二文本信息转换为当前词向量。
在一些实施例中,所述将所述音频信息和所述图像信息转换为第二文本信息,包括:
采用语音识别技术将所述音频信息转换为第二文本信息;
采用光学字符识别技术将所述图像信息转换为第二文本信息。
在一些实施例中,所述获取目标行业的合规判断库之前,所述方法还包括:
利用区块链中存储的相关法律和条例建立所述目标行业的合规判断库。
根据本发明实施例的第二方面,提供了一种数据处理装置,包括:第一获取单元,用于获取当前产品的当前交易信息,所述当前交易信息包括音频信息、图像信息和第一文本信息;转换单元,用于将所述音频信息、所述图像信息和所述第一文本信息转换为当前词向量;第一输入单元,用于将所述当前词向量输入至训练完成的文本分类模型,输出所述当前交易信息对应的目标合规风险类型;其中,所述文本分类模型根据所述历史交易信息及其标注的合规风险类型训练完成;第二获取单元,用于获取目标行业的合规判断库;第二输入单元,用于将当前产品的产品信息输入至所述合规判断库,输出所述当前产品的合规风险识别结果。
根据本发明实施例的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的数据处理方法。
根据本发明实施例的第四方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的数据处理方法。
本发明实施例提供的技术方案可以包括以下有益效果:
在本发明的一些实施例所提供的技术方案中,本发明实施例的技术方案中,通过当前交易信息转换成的词向量输入至文本分类模型,将当前产品的产品信息输入至合规判断库,可以较为方便智能地得到当前交易信息的合规情况和当前产品的合规风险。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了根据本发明的一种实施例的数据处理方法的流程图;
图2示意性示出了根据本发明的一种实施例的数据处理装置的方框图;
图3示意性示出了根据本发明的另一种实施例的数据处理装置的方框图;
图4示意性示出了适于用来实现本发明实施例的电子设备的计算机系统的结构图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
相关技术中,审查人员通过参考大量的同类金融产品案例,以及与该金融产品相关的法规等识别风险和规避风险信息,来对金融产品及其销售过程是否合规进行审查。
这些案例和法规数量巨大,内容繁杂,因此审查人员工作量巨大。
为解决上述问题,本发明实施例提供一种数据处理方法,以智能判断金融产品以及金融产品的销售过程是否合规。
图1示意性示出了本发明的示例性实施方式的一种数据处理方法。该数据处理方法的执行主体可以是具有计算处理功能的设备,如服务器和/或移动终端等。参考图1,该数据处理方法可以包括以下步骤:
步骤S102,获取当前产品的当前交易信息,当前交易信息包括音频信息、图像信息和第一文本信息。
步骤S104,将音频信息、图像信息和第一文本信息转换为当前词向量。
步骤S106,将当前词向量输入至训练完成的文本分类模型,输出当前交易信息对应的目标合规风险类型;其中,文本分类模型根据历史交易信息及其标注的合规风险类型训练完成。
步骤S108,获取目标行业的合规判断库;
步骤S110,将当前产品的产品信息输入至合规判断库,输出当前产品的合规风险识别结果。
本发明实施例的技术方案在获取历史交易信息后,根据该历史交易信息及其标注的合规风险类型训练文本分类模型,再将当前交易信息输入文本分类模型以得到当前交易信息对应的目标合规风险类型,从而实现了对当前金融产品交易过程的合规风险类型的智能化判断。此外,还将当前风险输入至合规判断库,以对当前金融产品的合规风险进行智能化识别判断。
在本发明一种优选的实施例中,历史交易信息可以上传到区块链网络中,但在实际应用中,并不局限于此,历史交易信息也可以采用其它存储方式。
利用区块链技术的隐私保护、公开透明、可追溯、不易篡改等特点,可以方便地存储历史交易信息。
在下面的举例说明中,均以金融产品以及金融产品销售过程为例进行举例说明,但本发明并不限定于此,本发明实施例提供的方法可以应用于任何合适的产品或者产品销售过程的合规风险辨别培训场景,当应用场景改变时,可以相应的改变上传区块链的信息。
在本发明实施例中,在步骤S102中,从区块链中获取当前产品的当前交易信息。在步骤S102之前,可以预先构建区块链节点及区块链网络构建,譬如,以公司基层营业机构为最小节点,一个或多个集团/公司参与金融行业智能识别合规风险和规避风险信息共享和管理交易区块链网络构建。
在构建区块链节点及区块链网络后,可以按照本发明实施例定义的数据结构方式、信息存储方式和协议来存储和认证共享信息等,以保证信息存储和信息处理的高效率。
对共享信息进行存储和认证的具体交易信息示例如下表1所示:
表1
在区块链技术大多数应用场景中,利用区块链哈希指针的交易链数据结构和加密学的哈希计算和加密学数字签字的机制实现交易过程中的多层次证据确认来实现不同个体交易方之间的信任问题。
在本发明实施例中,上传到区块链的信息包括与该金融产品相关的法规等识别风险和规避风险信息。这些信息具体包括:金融产品相关制度的角色、数据、流程、接口、权限、授权等信息,金融行业相关制度的审计架构,金融创新产品的效率、成本和体验,金融产品相关风险的识别与计量,金融创新产品和业务流程的标注与规范,金融产品相关规避风险的案例,相关金融产品系统是否安全可控等中的任意一项或者多项。
上述信息可以由获得授权的企业或个人上传到区块链中。其中,可以证明金融产品相关信息的音频、视频、图像等相关材料也可以上传至区块链。
当前交易信息可以包括音频信息、图像信息和第一文本信息。在步骤S104中,需要将音频信息、图像信息和第一文本信息分别转换为词向量。
具体地,在将音频信息和图像信息转换为词向量时,需要将当前音频信息和图像信息转换为第二文本信息,并将第一文本信息和第二文本信息转换为当前词向量。这里,将音频信息和图像信息转换为第二文本信息时,可以通过语音识别技术将音频信息转换为第二文本信息,通过光学字符识别技术将图像信息转换为第二文本信息。
在本发明实施例中,步骤S106之前,还需要获取训练集并利用训练集训练文本分类模型。其中,训练集包括存储在区块链的历史交易信息及其标注的合规风险类型。
具体地,需要从区块链中采集销售人员产品介绍材料、宣传手册以及语音销售记录等历史交易信息,以获取训练集。历史交易信息被预先上传到区块链网络中。训练文本分类模型时,通过语音识别技术将原始音频信息转换为文本,进而转换为词向量作为模型输入,将与文本相对应的合规风险类型作为标签训练文本分类模型并学习模型参数。其中,文本分类模型可以为textCNN(text Convolutional Neural Network,文本卷积神经网络)模型。textCNN模型是一种用于文本分类的卷积神经网络。
这里的合规风险类型可以为虚假宣传、混淆产品或者或者片面介绍,且并不局限于此。
在得到文本分类模型后,可以执行步骤S106进行销售合规风险识别。将销售人员的音频信息以及销售材料等转换得到的词向量,输入到训练好的模型中,模型的输出即为识别的可能的合规风险类型以及概率大小。
在步骤S108之前,需要利用区块链中存储的金融行业的相关法律和条例建立目标行业的合规判断库。具体地,将金融行业的相关法律和条例上传到区块链网络中,并将所有法律和条例转换为具有IF(条件)THEN(行为)结构的规则结构。这样,当具有该规则结构的合规规则的条件被满足时,触发该合规规则,继而执行行为。
进一步地,建立基于上述合规规则的合规判断库,该合规判断库包括基于所有由金融行业法律法规转换而来的合规规则。
在步骤S110中进行合规风险识别时,采用已知条件来推理结论。将当前金融产品的相关信息,如业务价值,范畴边界,效率,成本,业务流程等内容作为事实输入合规判断库,合规判断库根据知识库中的合规规则完成推理,输出该金融创新产品是否合规以及风险来源等结论。
在本发明实施例提供的技术方案中,可以不间断地评估方案的及时性、有效性和准确性,以不断调整和优化方案的系统参数。
本发明实施例提供的数据处理方法,通过当前交易信息转换成的词向量输入至文本分类模型,将当前产品的产品信息输入至合规判断库,可以较为方便智能地得到当前交易信息的合规情况和当前产品的合规风险。
以下介绍本发明的装置实施例,可以用于执行本发明上述的数据处理方法。如图2所示,根据本发明实施例提供的一种数据处理装置300包括:
第一获取单元302,用于获取当前产品的当前交易信息。当前交易信息包括音频信息、图像信息和第一文本信息。
转换单元304,用于将音频信息、图像信息和第一文本信息转换为当前词向量。
第一输入单元306,用于将当前词向量输入至训练完成的文本分类模型,输出当前交易信息对应的目标合规风险类型;其中,文本分类模型根据历史交易信息及其标注的合规风险类型训练完成。
第二获取单元308,用于获取目标行业的合规判断库。
第二输入单元310,用于将当前产品的产品信息输入至合规判断库,输出当前产品的合规风险识别结果。
本发明实施例的技术方案在获取历史交易信息后,根据该历史交易信息及其标注的合规风险类型训练文本分类模型,再将当前交易信息输入文本分类模型以得到当前交易信息对应的目标合规风险类型,从而实现了对当前金融产品交易过程的合规风险类型的智能化判断。此外,还将当前风险输入至合规判断库,以对当前金融产品的合规风险进行智能化识别判断。
在本发明实施例中,当前交易信息包括音频信息、图像信息和第一文本信息。转换单元304转换单元需要将当前销售音频信息和当前销售图像信息分别转换为第二文本信息,并将第一文本信息和第二文本信息转换为词向量。
根据本发明的示例性实施例,参考图3,相比较数据处理装置300,数据处理装置400不仅包括第一获取单元302、转换单元304、第一输入单元306、第二获取单元308和第二输入单元310,还包括训练单元412和存储单元414。
训练单元412用于利用训练集训练文本分类模型。训练集包括历史交易信息及其标注的合规风险类型。
存储单元414用于利用区块链中存储的相关法律和条例建立目标行业的合规判断库。
在得到文本分类模型后,第一输入单元306可以进行销售合规风险识别,具体为:将销售人员的音频信息以及销售材料等转换为词向量,输入到训练好的文本分类模型中,模型输出即为识别的可能的合规风险类型以及概率大小。
在根据区块链存储的历史交易信息得到当前交易信息对应的目标合规风险之外,还可以在区块链中存储目标行业的相关法律和条例,并根据该相关法律和条例提取出目标规则并建立合规判断库,以识别金融产品的合规风险。
第二输入单元412用于将当前产品的产品信息输入至合规判断库,输出当前产品的合规风险识别结果。
在进行合规风险识别时,采用已知条件来推理结论。第二输入单元310将当前金融创新产品的相关信息,如业务价值,范畴边界,效率,成本,业务流程等内容作为事实输入合规判断库,合规判断库根据知识库中的合规规则完成推理,输出该金融创新产品是否合规以及风险来源等结论。
由于本发明的示例实施例的数据处理装置的各个功能模块与上述数据处理方法的示例实施例的步骤对应,因此对于本发明装置实施例中未披露的细节,请参照本发明上述的数据处理方法的实施例。
本发明实施例的数据处理装置,通过当前交易信息转换成的词向量输入至文本分类模型,将当前产品的产品信息输入至合规判断库,可以较为方便智能地得到当前交易信息的合规情况和当前产品的合规风险。
下面参考图4,其示出了适于用来实现本发明实施例的电子设备的计算机系统500的结构示意图。图4示出的电子设备的计算机系统500仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图4所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统操作所需的各种程序和数据。CPU501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中的数据处理方法。
例如,的电子设备可以实现如图1中所示的:步骤S102,获取当前产品的当前交易信息,当前交易信息包括音频信息、图像信息和第一文本信息;步骤S104,将音频信息、图像信息和第一文本信息转换为当前词向量;步骤S106,将当前词向量输入至训练完成的文本分类模型,输出当前交易信息对应的目标合规风险类型;其中,文本分类模型根据历史交易信息及其标注的合规风险类型训练完成;步骤S108,获取目标行业的合规判断库;步骤S110,将当前产品的产品信息输入至合规判断库,输出当前产品的合规风险识别结果。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
获取当前产品的当前交易信息,所述当前交易信息包括音频信息、图像信息和第一文本信息;
将所述音频信息、所述图像信息和所述第一文本信息转换为当前词向量;
将所述当前词向量输入至训练完成的文本分类模型,输出所述当前交易信息对应的目标合规风险类型,其中,所述文本分类模型根据历史交易信息及其标注的合规风险类型训练完成;
获取目标行业的合规判断库;
将所述当前产品的产品信息输入至所述合规判断库,输出所述当前产品的合规风险识别结果。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取训练集,所述训练集包括所述历史交易信息及其标注的合规风险类型;
利用所述训练集训练所述文本分类模型。
3.根据权利要求2所述的方法,其特征在于,所述获取训练集之前,所述方法还包括:
将所述历史交易信息上传到区块链网络中。
4.根据权利要求2所述的方法,其特征在于,所述文本分类模型包括用于文本分类的卷积神经网络。
5.根据权利要求1所述的方法,其特征在于,将所述音频信息、所述图像信息和所述第一文本信息转换为当前词向量,包括:
将所述音频信息和所述图像信息转换为第二文本信息;
将所述第一文本信息和所述第二文本信息转换为当前词向量。
6.根据权利要求5所述的方法,其特征在于,所述将所述音频信息和所述图像信息转换为第二文本信息,包括:
采用语音识别技术将所述音频信息转换为第二文本信息;
采用光学字符识别技术将所述图像信息转换为第二文本信息。
7.根据权利要求1所述的方法,其特征在于,所述获取目标行业的合规判断库之前,所述方法还包括:
利用区块链中存储的相关法律和条例建立所述目标行业的合规判断库。
8.一种数据处理装置,其特征在于,包括:
第一获取单元,用于获取当前产品的当前交易信息,所述当前交易信息包括音频信息、图像信息和第一文本信息;
转换单元,用于将所述音频信息、所述图像信息和所述第一文本信息转换为当前词向量;
第一输入单元,用于将所述当前词向量输入至训练完成的文本分类模型,输出所述当前交易信息对应的目标合规风险类型,其中,所述文本分类模型根据历史交易信息及其标注的合规风险类型训练完成;
第二获取单元,用于获取目标行业的合规判断库;
第二输入单元,用于将所述当前产品的产品信息输入至所述合规判断库,输出所述当前产品的合规风险识别结果。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至7中任一项所述的数据处理方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911222371.3A CN111198945A (zh) | 2019-12-03 | 2019-12-03 | 数据处理方法、装置、介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911222371.3A CN111198945A (zh) | 2019-12-03 | 2019-12-03 | 数据处理方法、装置、介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111198945A true CN111198945A (zh) | 2020-05-26 |
Family
ID=70746288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911222371.3A Pending CN111198945A (zh) | 2019-12-03 | 2019-12-03 | 数据处理方法、装置、介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111198945A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111753496A (zh) * | 2020-06-22 | 2020-10-09 | 平安付科技服务有限公司 | 行业类别识别方法、装置、计算机设备及可读存储介质 |
CN112488831A (zh) * | 2020-11-20 | 2021-03-12 | 东软集团股份有限公司 | 区块链网络交易方法、装置、存储介质及电子设备 |
CN112528646A (zh) * | 2020-12-07 | 2021-03-19 | 深圳市优必选科技股份有限公司 | 词向量生成方法、终端设备及计算机可读存储介质 |
CN112766824A (zh) * | 2021-03-02 | 2021-05-07 | 中国工商银行股份有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN113177851A (zh) * | 2021-04-15 | 2021-07-27 | 国任财产保险股份有限公司 | 线上保险交易的存证方法、装置、电子设备及存储介质 |
CN114007131A (zh) * | 2021-10-29 | 2022-02-01 | 平安科技(深圳)有限公司 | 视频监控方法、装置及相关设备 |
CN116862677A (zh) * | 2023-09-04 | 2023-10-10 | 湖北微模式科技发展有限公司 | 一种具备检查功能的互联网交易可回溯方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107301246A (zh) * | 2017-07-14 | 2017-10-27 | 河北工业大学 | 基于超深卷积神经网络结构模型的中文文本分类方法 |
CN108509424A (zh) * | 2018-04-09 | 2018-09-07 | 平安科技(深圳)有限公司 | 制度信息处理方法、装置、计算机设备和存储介质 |
CN109272396A (zh) * | 2018-08-20 | 2019-01-25 | 平安科技(深圳)有限公司 | 客户风险预警方法、装置、计算机设备和介质 |
CN109344382A (zh) * | 2018-10-23 | 2019-02-15 | 出门问问信息科技有限公司 | 审核合同的方法、装置、电子设备及计算机可读存储介质 |
CN109377104A (zh) * | 2018-12-04 | 2019-02-22 | 泰康保险集团股份有限公司 | 数据处理方法、装置、介质及电子设备 |
CN109829629A (zh) * | 2019-01-07 | 2019-05-31 | 平安科技(深圳)有限公司 | 风险分析报告的生成方法、装置、计算机设备和存储介质 |
-
2019
- 2019-12-03 CN CN201911222371.3A patent/CN111198945A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107301246A (zh) * | 2017-07-14 | 2017-10-27 | 河北工业大学 | 基于超深卷积神经网络结构模型的中文文本分类方法 |
CN108509424A (zh) * | 2018-04-09 | 2018-09-07 | 平安科技(深圳)有限公司 | 制度信息处理方法、装置、计算机设备和存储介质 |
CN109272396A (zh) * | 2018-08-20 | 2019-01-25 | 平安科技(深圳)有限公司 | 客户风险预警方法、装置、计算机设备和介质 |
CN109344382A (zh) * | 2018-10-23 | 2019-02-15 | 出门问问信息科技有限公司 | 审核合同的方法、装置、电子设备及计算机可读存储介质 |
CN109377104A (zh) * | 2018-12-04 | 2019-02-22 | 泰康保险集团股份有限公司 | 数据处理方法、装置、介质及电子设备 |
CN109829629A (zh) * | 2019-01-07 | 2019-05-31 | 平安科技(深圳)有限公司 | 风险分析报告的生成方法、装置、计算机设备和存储介质 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111753496A (zh) * | 2020-06-22 | 2020-10-09 | 平安付科技服务有限公司 | 行业类别识别方法、装置、计算机设备及可读存储介质 |
CN111753496B (zh) * | 2020-06-22 | 2023-06-23 | 平安付科技服务有限公司 | 行业类别识别方法、装置、计算机设备及可读存储介质 |
CN112488831A (zh) * | 2020-11-20 | 2021-03-12 | 东软集团股份有限公司 | 区块链网络交易方法、装置、存储介质及电子设备 |
CN112528646A (zh) * | 2020-12-07 | 2021-03-19 | 深圳市优必选科技股份有限公司 | 词向量生成方法、终端设备及计算机可读存储介质 |
CN112766824A (zh) * | 2021-03-02 | 2021-05-07 | 中国工商银行股份有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN112766824B (zh) * | 2021-03-02 | 2024-02-23 | 中国工商银行股份有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN113177851A (zh) * | 2021-04-15 | 2021-07-27 | 国任财产保险股份有限公司 | 线上保险交易的存证方法、装置、电子设备及存储介质 |
CN114007131A (zh) * | 2021-10-29 | 2022-02-01 | 平安科技(深圳)有限公司 | 视频监控方法、装置及相关设备 |
CN114007131B (zh) * | 2021-10-29 | 2023-04-25 | 平安科技(深圳)有限公司 | 视频监控方法、装置及相关设备 |
CN116862677A (zh) * | 2023-09-04 | 2023-10-10 | 湖北微模式科技发展有限公司 | 一种具备检查功能的互联网交易可回溯方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111198945A (zh) | 数据处理方法、装置、介质及电子设备 | |
US11455493B2 (en) | Explanations for artificial intelligence based recommendations | |
CN109460664B (zh) | 风险分析方法、装置、电子设备及计算机可读介质 | |
CN111563267A (zh) | 用于联邦特征工程数据处理的方法和装置 | |
CN111191677B (zh) | 用户特征数据生成方法、装置及电子设备 | |
WO2022152018A1 (zh) | 用于识别一人多账号的方法及装置 | |
CN115936895A (zh) | 基于人工智能的风险评估方法、装置、设备及存储介质 | |
US20220318675A1 (en) | Secure environment for a machine learning model generation platform | |
CN111209403B (zh) | 数据处理方法、装置、介质及电子设备 | |
US11341394B2 (en) | Diagnosis of neural network | |
US11676063B2 (en) | Exposing payload data from non-integrated machine learning systems | |
US20130073504A1 (en) | System and method for decision support services based on knowledge representation as queries | |
CN114493850A (zh) | 基于人工智能的在线公证方法、系统及存储介质 | |
CN110532304B (zh) | 数据处理方法及装置、计算机可读存储介质以及电子设备 | |
US10915711B2 (en) | Numerical representation in natural language processing techniques | |
CN111797931A (zh) | 图像处理方法、图像处理网络训练方法、装置、设备 | |
CN107368597B (zh) | 信息输出方法和装置 | |
CN113111165A (zh) | 基于深度学习模型的接警警情类别确定方法和装置 | |
CN111754984A (zh) | 文本选取的方法、装置、设备和计算机可读介质 | |
CN111709784A (zh) | 用于生成用户留存时间的方法、装置、设备和介质 | |
CN113077353B (zh) | 用于生成核保结论的方法、装置、电子设备和介质 | |
CN116880899B (zh) | 任务信息关联方法、装置、电子设备和计算机可读介质 | |
CN115169321B (zh) | 物流内容文本核对方法、装置、电子设备和计算机介质 | |
CN109858812B (zh) | 基于区块链的人力资源管理方法、装置、介质及电子设备 | |
CN113077352B (zh) | 基于用户信息和保险相关信息的保险服务物品推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200526 |