CN112102049A - 一种模型训练方法、业务处理方法、装置及设备 - Google Patents
一种模型训练方法、业务处理方法、装置及设备 Download PDFInfo
- Publication number
- CN112102049A CN112102049A CN202011011568.5A CN202011011568A CN112102049A CN 112102049 A CN112102049 A CN 112102049A CN 202011011568 A CN202011011568 A CN 202011011568A CN 112102049 A CN112102049 A CN 112102049A
- Authority
- CN
- China
- Prior art keywords
- service
- abnormal
- services
- information
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/08—Auctions
Abstract
本说明书实施例提供一种模型训练方法、业务处理方法、装置及设备。所述方法包括:获取至少一个历史记载业务;所述历史记载业务对应有业务信息;根据业务信息确定历史记载业务对应于至少一个预设判断规则的判断结果;所述判断结果包括正常业务和异常业务;利用判断结果中包括异常业务的历史记载业务的业务信息构建至少一个训练样本业务;所述训练样本业务的数量大于所述异常业务的数量;基于训练样本业务训练异常业务识别模型;所述异常业务识别模型用于识别异常业务。通过上述方法,在获取到异常业务后对异常业务的数量进行扩充,并利用扩充后的训练样本业务对模型进行训练,从而保证训练模型时具有充足的样本量,确保了识别异常业务的准确性。
Description
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种模型训练方法、业务处理方法、装置及设备。
背景技术
随着人工智能技术的发展,人们可以借助计算机完成一些需要人类的智能才能完成的工作,例如对目标对象进行分类,或进行图像识别和处理等。而机器学习技术又是人工智能的核心技术,主要通过不断获取新的数据来完善对于某一事物的认知,例如当确定用于识别某一对象的模型之后,通过不断地获取对应于所述对象的样本数据,并利用所述样本数据进行训练以完善所述模型,进而使得所述模型更为准确地识别该对象。
为了保证机器学习模型的准确性,在训练机器学习模型时往往需要利用大量的训练样本数据。但是,当用于训练模型的样本数据量过小时,可能无法训练出具有较高准确性的模型。例如,当训练模型对异常投标进行识别时,需要从以往的投标记录中筛选出异常投标记录,并利用标记后的数据对相应的模型进行训练。但是,实际生活中,诸如投标公司互相串通、投标公司预先获知标底信息等异常投标的情况并不常见,所获取到的投标记录中可能只包含有较少的异常投标记录,而在异常投标记录较少的情况下,基于异常投标记录训练得到的模型可能只能针对一些异常投标的特例进行识别,从而使得模型缺乏一定的准确性。因此,目前亟需一种在训练样本较少时仍然能够实现对机器学习模型的正常训练的方法。
发明内容
本说明书实施例的目的是提供一种模型训练方法、业务处理方法、装置及设备,以解决如何方便准确地利用训练后的模型对异常业务进行识别的问题。
为解决上述技术问题,本说明书实施例提供一种模型训练方法,包括:
获取至少一个历史记载业务;所述历史记载业务对应有业务信息;
根据所述业务信息确定所述历史记载业务对应于至少一个预设判断规则的判断结果;所述判断结果包括正常业务和异常业务;
利用判断结果中包括异常业务的历史记载业务的业务信息构建至少一个训练样本业务;所述训练样本业务的数量大于所述历史记载业务的数量;
基于所述训练样本业务训练异常业务识别模型;所述异常业务识别模型用于识别异常业务。
本说明书实施例还提出一种模型训练装置,包括:
历史记载业务获取模块,用于获取至少一个历史记载业务;所述历史记载业务对应有业务信息;
判断结果确定模块,用于根据所述业务信息确定历史记载业务对应于至少一个预设判断规则的判断结果;所述判断结果包括正常业务和异常业务;
训练样本业务构建模块,用于利用判断结果中包括异常业务的历史记载业务的业务信息构建至少一个训练样本业务;所述训练样本业务的数量大于所述历史记载业务的数量;
异常业务识别模型训练模块,用于基于所述训练样本业务训练异常业务识别模型;所述异常业务识别模型用于识别异常业务。
本说明书实施例还提出一种模型训练设备,包括存储器和处理器;所述存储器,用于存储计算机程序指令;所述处理器,用于执行所述计算机程序指令以实现以下步骤:获取至少一个历史记载业务;所述历史记载业务对应有业务信息;根据所述业务信息确定所述历史记载业务对应于至少一个预设判断规则的判断结果;所述判断结果包括正常业务和异常业务;利用判断结果中包括异常业务的历史记载业务的业务信息构建至少一个训练样本业务;所述训练样本业务的数量大于所述历史记载业务的数量;基于所述训练样本业务训练异常业务识别模型;所述异常业务识别模型用于识别异常业务。
为了解决上述技术问题,本说明书实施例还提出一种业务处理方法,包括:
接收待处理业务;所述待处理业务对应有业务信息;
基于所述待处理业务的业务信息识别所述待处理业务是否为异常业务;其中,包括,利用异常业务识别模型识别所述待处理业务是否为异常业务;所述异常业务识别模型,包括根据预设判断规则在历史记载业务中识别出异常业务后,利用所述异常业务对应的业务信息构建训练样本业务,并基于所述训练样本业务训练得到的模型;
在所述待处理业务为异常业务的情况下,反馈业务拒绝信息;所述业务拒绝信息用于表示拒绝处理所述待处理业务。
本说明书实施例还提出一种业务处理装置,包括:
待处理业务接收模块,用于接收待处理业务;所述待处理业务对应有业务信息;
异常业务识别模块,用于基于所述待处理业务的业务信息识别所述待处理业务是否为异常业务;其中,包括,利用异常业务识别模型识别所述待处理业务是否为异常业务;所述异常业务识别模型,包括根据预设判断规则在历史记载业务中识别出异常业务后,利用所述异常业务对应的业务信息构建训练样本业务,并基于所述训练样本业务训练得到的模型;
业务拒绝信息反馈模块,用于在所述待处理业务为异常业务的情况下,反馈业务拒绝信息;所述业务拒绝信息用于表示拒绝处理所述待处理业务。
本说明书实施例还提出一种业务处理设备,包括存储器和处理器;所述存储器,用于存储计算机程序指令;所述处理器,用于执行所述计算机程序指令以实现以下步骤:接收待处理业务;所述待处理业务对应有业务信息;基于所述待处理业务的业务信息识别所述待处理业务是否为异常业务;其中,包括,利用异常业务识别模型识别所述待处理业务是否为异常业务;所述异常业务识别模型,包括根据预设判断规则在历史记载业务中识别出异常业务后,利用所述异常业务对应的业务信息构建训练样本业务,并基于所述训练样本业务训练得到的模型;在所述待处理业务为异常业务的情况下,反馈业务拒绝信息;所述业务拒绝信息用于表示拒绝处理所述待处理业务。
由以上本说明书实施例提供的技术方案可见,本说明书实施例中所述模型训练方法在获取到历史记载样本后,根据预设判断条件在所述历史记载样本中筛选出异常业务,并利用异常业务所对应的业务信息进行扩展,进而得到数量大于所述异常业务的训练样本业务,从而能够利用所述训练样本业务对业务识别模型进行训练。上述方法在用于训练模型的样本量不足时,根据预先筛选的业务的信息实现对于训练样本量的扩充,从而确保了训练得到的模型的准确性,有利于在后续的步骤中利用所述模型完成对于异常业务的识别,保证了业务流程的正常进行。所述业务处理方法在获取到待处理业务后,通过异常业务识别模型来判断所述待处理业务是否为异常业务。在所述异常业务识别模型是通过具有较充足的数量的样本训练得到的模型的情况下,确保了利用异常业务识别模型识别异常业务的准确性,从而能够在后续过程中避免由于处理异常业务导致业务处理异常或相关流程受损等情况的发生,提高了业务处理的有效性。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例一种模型训练方法的流程图;
图2为本说明书实施例一种业务处理方法的流程图;
图3为本说明书实施例一种模型训练装置的模块图;
图4为本说明书实施例一种业务处理装置的模块图;
图5为本说明书实施例一种模型训练设备的结构图;
图6为本说明书实施例一种业务处理设备的结构图。
具体实施方式
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
以下结合附图1介绍本说明书实施例一种模型训练方法。所述方法的执行主体为模型训练设备,所述模型训练设备包括但不限于服务器、工控机、PC机等。所述模型训练方法包括以下具体实施步骤。
S110:获取至少一个历史记载业务;所述历史记载业务对应有业务信息。
历史记载业务可以是数据库或其他存储系统中所记载的对应于本说明书实施例所训练的模型的业务。所述历史记载业务对应有相应的业务信息,进而能够对所述历史记载业务进行分析利用。
由于本说明书实施例是用于训练识别异常业务的模型,因此所述历史记载业务中可以包含有正常的业务,也可以包含异常业务。所述异常业务可以是干扰业务流程正常进行或不符合业务相关规定的业务。具体的对于正常业务和异常业务的区分准则可以根据实际应用的需求进行设置,在此不再赘述。
业务信息是所述历史记载业务所对应的信息。具体的,所述业务信息可以是所述历史记载业务自身所对应的信息,也可以是所述历史记载业务的提交用户的身份信息。在所述历史记载业务对应有机构、组织或公司时,所述业务信息也可以包括对应的机构、组织或公司的登记信息以及所雇佣的员工的相关身份信息。实际应用中可以根据历史记载业务的具体情况获取相应的业务信息,并不限于上述示例,在此不再赘述。
在一些实施方式中,本说明书实施例所训练得到的模型可以是用于识别异常投标的模型。当卖方需要售卖某一物品时,可以采用竞标的方式,即由多个买方提出针对上述物品的出价后,由卖方根据买方的出价决定该物品所出售的对象,例如可以是出价最高的买方。但是,在竞标的过程中,可能会出现异常投标的现象,这些异常投标的现象可以是买方之间相互串通,从而尽可能地压低出价,或者是具有不良信用的买方恶意抬高竞标价格从而影响竞标的正常进行等情况。
相应的,在本说明书实施例训练的模型是用于识别异常投标的模型的情况下,所述历史记载业务可以是以往的投标记录。这些投标记录所对应的业务信息可以是投标金额、投标公司信息、投标公司员工信息等。
S120:根据所述业务信息确定历史记载业务对应于至少一个预设判断规则的判断结果;所述判断结果包括正常业务和异常业务。
在获取到所述历史记载业务之后,可以通过对所述历史记载业务进行分析判断以获取所述对应于所述历史记载业务的判断结果。所述判断结果用于确定所述历史记载业务所对应的类别,从而在所述历史记载业务中筛选出能够在后续步骤中实现模型训练的业务。
在一些实施方式中,所述判断结果包括正常业务和异常业务。在本说明书实施例所针对的模型是用于识别异常业务的情况下,可以根据判断结果中包含异常业务的历史记载业务训练相应的模型。
具体的确定所述历史记载业务对应的判断结果可以是利用预设判断规则对所述历史记载业务进行判别。所述预设判断规则可以是预先总结的对应于异常业务各项特征的判别规则。由于预设判断规则往往针对历史记载业务的细节进行判断,且往往具有较多的数量,因此,在实际应用中,若直接利用预设判断规则进行异常业务的识别对于业务的信息完整度具有较高的要求,且需要花费较多的时间和资源,因此,所述预设判断规则一般只用于在训练模型之前对训练样本进行筛选。
在一些实施方式中,所述预设判断规则可以是关联性判断规则。所述关联性判断规则用于判断针对同一对象的历史记载业务之间是否存在关联性。判断历史记载业务之间是否具备关联性可以是获取到所述历史记载业务的业务信息之后,根据所述业务信息判断对应于同一目标对象的历史记载业务之间是否具备关联性。若判断不同的历史记载业务所对应的业务信息之间存在关联性,可以将这些业务信息之间存在关联性的历史记载业务标识为异常业务。
利用一个具体的示例进行说明,当所述历史记载业务为投标业务时,所述目标对象可以是竞标物品。在获取所述历史记载业务后,可以通过分析各个历史记载业务的业务信息确定各个历史记载业务所对应的竞标物品,并将历史记载业务分类为对应于不同竞标物品的业务。针对对应于同一竞标物品的历史记载业务,可以通过分析历史记载业务之间的业务信息是否具有关联性来确定不同的历史记载业务之间是否具备关联性。
例如,当所述历史记载业务为竞标业务时,可以判断对应的竞标公司中是否雇佣有相同的员工,或竞标公司的实际控制人是同一家公司,或竞标公司所使用的银行账户相同等;也可以是判断竞标公司的员工之间是否有关联关系,例如通过获取不同竞标公司的员工的身份信息,并分析不同竞标公司的员工之间是否存在前同事关系、亲属关系或不同竞标公司的员工之间在投标日期附近是否存在较为频繁或数额较大的转账行为,进而判断不同竞标公司的员工之间是否存在过于亲近的关系进而影响到竞标的正常进行。
当通过分析确定不同的竞标业务之间存在关联性后,则这些竞标业务可能是对应的用户在串通后所提出的业务,可以将这些竞标业务判定为异常业务,从而作为训练样本执行后续的步骤。
在一些实施方式中,所述预设判断规则还可以是投标金额相似规则。当所述历史记载业务为对应于投标项目的业务时,所述历史记载业务即为对应的投标业务,所述投标业务即对应有一定的投标金额。通过比较针对同一投标项目的投标金额,若存在投标业务的投标金额之间的差值大于投标金额最大差值或小于投标金额最小差值,则对应的投标业务可能是对应的用户在事先沟通的情况下所提出的业务,也可以将对应的投标业务认定为异常业务。
利用具体的示例进行说明,假设针对某一投标项目,对应的投标金额最大差值为50万,投标金额最小差值为1万,则在获取对应于所述投标项目的历史记载业务之后,根据各个历史记载业务所对应的业务信息获取对应的投标金额,并分析各个投标金额之间的差值,若存在某两个投标金额的差值大于50万或小于1万,则这两个投标金额可能是业务的发起用户在串通之后所确定的投标金额,可以认定这两个投标金额所对应的历史记载业务为异常业务。
在一些实施方式中,所述预设判断规则还可以是标底泄漏规则。所述历史记载业务可以对应有投标项目,所述投标项目可以对应有预算金额。所述预算金额可以是所述投标项目的标底,即针对所述投标项目出价的最低值。在获取到历史记载业务之后,可以从所述历史记载业务的业务信息中提取对应的投标金额,并判断所述投标金额与所述预算金额之间的差值,并在所述差值小于投标差值阈值的情况下,认定所述历史记载业务为异常业务。
所述投标差值阈值可以是一个固定的数值,也可以是一个固定的比例。当所述投标差值阈值为固定比例时,所述固定比例可以对应于所述预算金额,并根据所述预算金额和所述固定比例计算出对应的数值后与所述差值进行比较。
利用一个具体的示例对上述实施方式进行说明。假设某一投标项目的预算金额为十万,对应的投标差值阈值为五千,则在获取到对应于所述投标项目的历史记载业务之后,若存在历史记载业务的投标金额在十万至十万零五千的范围内,则判断所述历史记载业务为异常业务。
在一些实施方式中,所述预设判断规则还可以是失信判断规则。根据预设判断规则判断历史记载业务是否为异常业务可以是获取到历史记载业务后,判断所述历史记载业务的业务信息中是否存在失信记录。所述失信记录可以是欠款欠费名单、欠税名单表、纳税非正常户、限制高消费名单、限制出境名单、失信老赖、民商事裁判文书表、罪犯及嫌疑人名单表、行政违法记录表和执行公开信息等。若所述业务信息中存在失信记录,则可以将对应的历史记载业务认定为异常业务。
为了防止提交历史记载业务的用户未在业务信息中补充相应的失信记录,获取失信记录的方式也可以是用户提交历史记载业务的用户身份标识或机构标识,并利用所述用户身份标识或机构标识查询对应的历史记录中是否存在失信记录。
利用一个具体的示例进行说明,当查找到某一历史记载业务后,确定所述历史记载业务的提交者隶属于限制高消费名单,则执行所述历史记载业务可能会对业务的正常处理造成影响,因此可以将所述历史记载业务认定为异常业务。
实际应用中在历史记载业务中识别出异常业务的方式可以不限于上述实施方式,具体的可以根据实际应用的情况进行调整,在此不做赘述。
需要说明的是,所获取到的历史记载业务可能已经存在有一定的处理结果,例如正常处理或拒绝处理等处理结果,但是所述处理结果不影响对于异常业务的判定。例如某一历史记载业务在以往的处理过程中作为正常业务被处理,但在利用预设判断规则进行判断时确定所述历史记载业务为异常业务,则仍然认定所述历史记载业务为异常业务,以往的处理结果对其不存在影响。
S130:利用判断结果中包括异常业务的历史记载业务的业务信息构建至少一个训练样本业务;所述训练样本业务的数量大于所述异常业务的数量。
训练样本业务即为对本说明书实施例所针对的模型进行训练的样本数据。在获取到判断结果中包含异常业务的历史记载业务后,可以利用所述历史记载业务的业务信息构建训练样本业务。在实际应用中,由于所述历史记载业务应用条件的差别,所述历史记载业务的数量可能较少。例如在所述历史记载业务为投标业务时,实际生活中可能并不存在较多的异常投标业务,最终所获取到的历史记载业务可能数量较少。因此,需要对所述历史记载业务的数量进行扩充,即利用历史记载业务构建训练样本业务,使得所述训练样本业务的数量大于所述异常业务的数量,从而完成训练样本的扩充。
需要说明的是,在对应于历史记载业务存在多个预设判断规则的情况下,对应于同一历史记载业务可能会存在多个判断结果。而在这些判断结果中只要出现一个判断结果将所述历史记载业务认定为异常业务,则在本步骤中都利用所述历史记载业务的业务信息构建训练样本业务。
在获取到判断结果中包括异常业务的历史记载业务之后,可以利用所述历史记载业务构建训练样本业务。具体的,可以是将判断结果中包含异常业务的历史记载业务标记为初始异常业务,再将所述初始异常业务的业务信息划分为对应于不同业务特征的业务特征信息,再将不同初始异常业务的业务特征信息分别进行组合得到候选样本业务。再根据候选样本业务之间的相似度将所述候选样本业务划分为至少两个候选样本业务集合。对所述候选样本业务集合进行分析,若所述候选样本业务中包含所述初始异常业务,将所述候选样本业务集合中的候选样本业务作为训练样本业务。
业务特征可以是不同类型的业务信息,例如,在所述业务信息包含提交业务的用户的身份信息、业务自身的业务数据、提交业务的机构的信息时,可以根据业务自身信息、业务所属人信息、业务所述机构信息等业务特征从业务信息中分离出相应的业务特征信息。实际应用中对所述业务特征的定义以及业务特征信息的分离可以根据实际应用的需求进行设置,并不限于上述示例,例如还可以通过Featuretools方法对业务信息进行特征衍生,在此不做赘述。
在确定各个业务特征信息之后,可以将对应于不同业务特征的业务特征信息分别进行组合,进而得到组合后的候选样本业务。由于业务信息可以划分至多种业务特征,因此通过组合业务特征信息可以使得所获取到的候选样本业务呈现指数级别的增多。例如,在获取到10个初始异常业务的情况下,针对初始异常业务划分三种业务特征,通过组合即可获取1000个候选样本业务,即使这些候选样本业务中可能出现重复的业务,也极大地提升了候选样本业务的数量。
由于通过组合不同的业务特征信息会使得业务的数量呈指数级别的放大,很容易造成获取到的候选样本业务的数量过多。而利用候选样本业务对模型进行训练则将会具有较高的计算成本,从而消耗较多的时间和资源。因此,在获取到候选样本业务之后,可以在所述候选样本业务中筛选出一定的业务作为训练样本业务对模型进行训练。
在一些实施方式中,可以根据候选样本业务之间的相似度将所述候选样本业务划分为多个候选样本业务集合,例如,可以通过KNN分类算法对所述候选样本业务进行分类,从而将所述候选样本业务划分至不同的候选样本业务集合中。具体的分类类别以及类别的数量可以根据实际应用的需求进行设置,对此不做赘述。
在对候选样本业务进行分类之后,则每一个候选样本业务集合中的候选样本业务都具有较高的相似性。通过分析不同候选样本业务集合中的候选样本业务,若这些候选样本业务中存在初始异常业务,则由于业务之间的相似性,在该候选样本业务集合中的其他业务是异常业务的可能性也更高,因此可以将包含有初始异常业务的候选样本业务集合中的候选样本业务均作为训练样本业务。
通过构建候选样本业务并在候选样本业务中筛选出相应的训练样本业务,使得样本的数量得到的扩充,克服了训练模型的样本的数量不足的问题。而在对训练样本业务进行筛选之后,既保证了筛选得到的样本与模型的关联性强,同时也减少了训练模型所需要的时间和资源,有利于后续步骤中对模型的训练。
S140:基于所述训练样本业务训练异常业务识别模型;所述异常业务识别模型用于识别异常业务。
在获取到所述训练样本业务后,即可利用所述训练样本业务训练异常业务识别模型。所述异常业务识别模型可以用于识别异常业务。通过将业务的业务信息输入至所述异常业务识别模型中即可判断该业务是否为异常业务。
在本说明书实施例中,所述异常业务识别模型可以为一种数学模型,例如可以为贝叶斯分类模型、支持向量机分类模型(Support Vector Machine,SVM)、或卷积神经网络分类模型(Convolutional Neural Networks,CNN)等。
在一些实施方式中,所述异常业务识别模型可以是基于KNN分类算法训练得到的模型。KNN分类算法即为K最邻近法,通过分析样本在特征空间中K个最相近的样本中的大多数都属于某一个类别时,则可以确定该样本属于该类别。KNN分类算法中通过确定各个对象之间的距离作为对象之间的非相似指标,避免了对象之间的相互匹配。其中,对象之间的距离可以是欧式距离或曼哈顿距离,欧式距离可以利用公式计算,式中,d(x,y)为点x和点y之间的欧式距离,xk和yk分别为点x和点y在k维度上的坐标;曼哈顿距离可以利用公式来进行计算,式中,d′(x,y)为点x和点y之间的曼哈顿距离,xk和yk分别为点x和点y在k维度上的坐标。
具体的,利用KNN算法进行计算的过程可以是计算某个训练数据与其他各个训练数据之间的距离,并按照距离的递增关系进行排序。从这些距离中选取距离最小的K个点,并确定这K个点所在类别的出现频率,将出现频率最高的类别作为该训练数据的预测分类类别。其中,K可以由用户自行进行设置。
上述实施方式只是对所述异常业务识别模型的其中一个具体示例的介绍。实际应用中,能够根据样本业务的业务数据识别出相应的异常业务的机器学习模型均可以作为所述异常业务识别模型进行训练,对此不做赘述。
通过上述方法的实施例的介绍,可以看出,所述模型训练方法在获取到历史记载样本后,根据预设判断条件在所述历史记载样本中筛选出异常业务,并利用异常业务所对应的业务信息进行扩展,进而得到数量大于所述异常业务的训练样本业务,从而能够利用所述训练样本业务对业务识别模型进行训练。上述方法在用于训练模型的样本量不足时,根据预先筛选的业务的信息实现对于训练样本量的扩充,从而确保了训练得到的模型的准确性,有利于在后续的步骤中利用所述模型完成对于异常业务的识别,保证了业务流程的正常进行。
以下结合附图2介绍本说明书实施例一种业务处理方法。所述方法的执行主体为业务处理设备,所述业务处理设备包括但不限于服务器、工控机、PC机等。所述业务处理方法包括以下具体实施步骤。
S210:接收待处理业务;所述待处理业务对应有业务信息。
所述待处理业务可以是还未被处理,但在被处理之前需要针对业务的异常情况进行分析的业务。例如,在所述待处理业务为投标业务,即针对某一投标项目进行投标的业务的情况下,可以首先判断所述投标业务是否正常,以避免所述投标业务为恶意获取投标物品或恶意抬高投标物品价格的情况出现。
所述待处理业务对应有业务信息。业务信息是所述待处理业务所对应的信息。具体的,所述业务信息可以是所述待处理业务自身所对应的信息,也可以是所述待处理业务的提交用户的身份信息。在所述待处理业务对应有机构、组织或公司时,所述业务信息也可以包括对应的机构、组织或公司的登记信息以及所雇佣的员工的相关身份信息。实际应用中可以根据待处理业务的具体情况获取相应的业务信息,并不限于上述示例,在此不再赘述。根据所述业务信息能够识别所述待处理业务是否为异常业务。
S220:基于所述业务信息识别所述待处理业务是否为异常业务;其中,包括,利用异常业务识别模型识别所述待处理业务是否为异常业务;所述异常业务识别模型,包括根据预设判断规则在历史记载业务中识别出异常业务后,利用所述异常业务对应的业务信息构建训练样本业务,并基于所述训练样本业务训练得到的模型。
在获取到所述待处理业务的业务信息之后,可以通过所述业务信息识别所述待处理业务是否为异常业务。具体的,可以是利用异常业务识别模型识别所述待处理业务是否为异常业务。所述异常业务识别模型可以是根据样本训练业务所对应的业务信息训练得到的模型,通过分析待处理业务的业务信息可以判断所述待处理业务是否为异常业务。
在本说明书实施例中,所述异常业务识别模型可以为一种数学模型,例如可以为贝叶斯分类模型、支持向量机分类模型(Support Vector Machine,SVM)、或卷积神经网络分类模型(Convolutional Neural Networks,CNN)等。
在一些实施方式中,所述异常业务识别模型可以是基于KNN分类算法训练得到的模型。KNN分类算法即为K最邻近法,通过分析样本在特征空间中K个最相近的样本中的大多数都属于某一个类别时,则可以确定该样本属于该类别。KNN分类算法中通过确定各个对象之间的距离作为对象之间的非相似指标,避免了对象之间的相互匹配。其中,对象之间的距离可以是欧式距离或曼哈顿距离,欧式距离可以利用公式计算,式中,d(x,y)为点x和点y之间的欧式距离,xk和yk分别为点x和点y在k维度上的坐标;曼哈顿距离可以利用公式来进行计算,式中,d′(x,y)为点x和点y之间的曼哈顿距离,xk和yk分别为点x和点y在k维度上的坐标。
具体的,利用KNN算法进行计算的过程可以是计算某个训练数据与其他各个训练数据之间的距离,并按照距离的递增关系进行排序。从这些距离中选取距离最小的K个点,并确定这K个点所在类别的出现频率,将出现频率最高的类别作为该训练数据的预测分类类别。其中,K可以由用户自行进行设置。
在一些实施方式中,本说明书实施例所训练得到的模型可以是用于识别异常投标的模型。当卖方需要售卖某一物品时,可以采用竞标的方式,即由多个买方提出针对上述物品的出价后,由卖方根据买方的出价决定该物品所出售的对象,例如可以是出价最高的买方。但是,在竞标的过程中,可能会出现异常投标的现象,这些异常投标的现象可以是买方之间相互串通,从而尽可能地压低出价,或者是具有不良信用的买方恶意抬高竞标价格从而影响竞标的正常进行等情况。
具体的获取所述业务分配模型的方法可以参照图1所对应的实施例中的介绍,在此不再赘述。
S230:在所述待处理业务为异常业务的情况下,反馈业务拒绝信息;所述业务拒绝信息用于表示拒绝处理所述待处理业务。
若通过所述业务识别模型对所述待处理业务进行识别后,确定所述待处理业务为异常业务,则接受或执行所述待处理业务可能会影响业务执行流程的正常进行。在这种情况下,可以向所述待处理业务的提交用户反馈业务拒绝信息。所述业务拒绝信息用于表示拒绝所述待处理业务,即通知所述提交用户其所提交的待处理业务不会得到处理。
所述异常业务可以用于表示对业务的处理过程造成影响的业务,例如在所述业务为投标业务时,异常业务可能为干扰投标过程或投标结果的异常投标。具体的对于所述异常业务的定义可以参考图1所对应的实施例中关于步骤S120中的说明,在此不再赘述。
在一些实施方式中,在所述待处理业务为投标业务,即针对某一投标项目进行投标的情况下,反馈业务拒绝信息可以是不接受所述待处理业务对应的投标。实际应用中在拒绝该投标业务之后也可以采用其他方式对其进行处理,例如可以将所述异常投标对应的用户标记为重点监察用户等,在此对其他实施方式不再赘述。
在一些实施方式中,若利用业务识别模型对所述待处理业务进行识别后,确定所述待处理业务不是异常业务,则可以处理所述待处理业务。具体的处理方式可以是基于实际应用中所述待处理业务的需求对所述待处理业务进行处理。例如,在所述待处理业务为投标业务,即针对某一投标项目进行投标的情况下,可以将所述投标业务作为可以被接收的投标进行审核和分析。
通过上述业务处理方法的实施例的介绍,可以看出,所述业务处理方法在获取到待处理业务后,通过异常业务识别模型来判断所述待处理业务是否为异常业务。在所述异常业务识别模型是通过具有较充足的数量的样本训练得到的模型的情况下,确保了利用异常业务识别模型识别异常业务的准确性,从而能够在后续过程中避免由于处理异常业务导致业务处理异常或相关流程受损等情况的发生,提高了业务处理的有效性。
基于图1所对应的模型训练方法,介绍本说明书实施例一种模型训练装置。所述模型训练装置设置于所述模型训练设备。如图3所示,所述模型训练装置可以包括以下模块。
历史记载业务获取模块310,用于获取至少一个历史记载业务;所述历史记载业务对应有业务信息;
判断结果确定模块320,用于根据所述业务信息确定所述历史记载业务对应于至少一个预设判断规则的判断结果;所述判断结果包括正常业务和异常业务;
训练样本业务构建模块330,用于利用判断结果中包括异常业务的历史记载业务的业务信息构建至少一个训练样本业务;所述训练样本业务的数量大于所述历史记载业务的数量;
异常业务识别模型训练模块340,用于基于所述训练样本业务训练异常业务识别模型;所述异常业务识别模型用于识别异常业务。
基于图2所对应的业务处理方法,介绍本说明书实施例一种业务处理装置。所述业务处理装置设置于所述业务处理设备。如图4所示,所述业务处理装置包括以下模块。
待处理业务接收模块410,用于接收待处理业务;所述待处理业务对应有业务信息;
异常业务识别模块420,用于基于所述业务信息识别所述待处理业务是否为异常业务;其中,包括,利用异常业务识别模型识别所述待处理业务是否为异常业务;所述异常业务识别模型,包括根据预设判断规则在历史记载业务中识别出异常业务后,利用所述异常业务对应的业务信息构建训练样本业务,并基于所述训练样本业务训练得到的模型;
业务拒绝信息反馈模块430,用于在所述待处理业务为异常业务的情况下,反馈业务拒绝信息;所述业务拒绝信息用于表示拒绝处理所述待处理业务。
基于图1所对应的模型训练方法,本说明书实施例提供一种模型训练设备。如图5所示,所述模型训练设备可以包括存储器和处理器。
在本实施例中,所述存储器可以按任何适当的方式实现。例如,所述存储器可以为只读存储器、机械硬盘、固态硬盘、或U盘等。所述存储器可以用于存储计算机程序指令。
在本实施例中,所述处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以执行所述计算机程序指令实现以下步骤:获取至少一个历史记载业务;所述历史记载业务对应有业务信息;根据所述业务信息确定所述历史记载业务对应于至少一个预设判断规则的判断结果;所述判断结果包括正常业务和异常业务;利用判断结果中包括异常业务的历史记载业务的业务信息构建至少一个训练样本业务;所述训练样本业务的数量大于所述历史记载业务的数量;基于所述训练样本业务训练异常业务识别模型;所述异常业务识别模型用于识别异常业务。
基于图2所对应的业务处理方法,本说明书实施例提供一种业务处理设备。如图6所示,所述业务处理设备可以包括存储器和处理器。
在本实施例中,所述存储器可以按任何适当的方式实现。例如,所述存储器可以为只读存储器、机械硬盘、固态硬盘、或U盘等。所述存储器可以用于存储计算机程序指令。
在本实施例中,所述处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以执行所述计算机程序指令实现以下步骤:接收待处理业务;所述待处理业务对应有业务信息;基于所述待处理业务的业务信息识别所述待处理业务是否为异常业务;其中,包括,利用异常业务识别模型识别所述待处理业务是否为异常业务;所述异常业务识别模型,包括根据预设判断规则在历史记载业务中识别出异常业务后,利用所述异常业务对应的业务信息构建训练样本业务,并基于所述训练样本业务训练得到的模型;在所述待处理业务为异常业务的情况下,反馈业务拒绝信息;所述业务拒绝信息用于表示拒绝处理所述待处理业务。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片2。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的第一硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书可用于众多第一或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
Claims (15)
1.一种异常业务识别模型训练方法,其特征在于,包括:
获取至少一个历史记载业务;所述历史记载业务对应有业务信息;
根据所述业务信息确定所述历史记载业务对应于至少一个预设判断规则的判断结果;所述判断结果包括正常业务和异常业务;
利用判断结果中包括异常业务的历史记载业务的业务信息构建至少一个训练样本业务;所述训练样本业务的数量大于所述历史记载业务的数量;
基于所述训练样本业务训练异常业务识别模型;所述异常业务识别模型用于识别异常业务。
2.如权利要求1所述的方法,其特征在于,所述历史记载业务包括投标业务;相应的,所述业务信息包括投标公司信息、投标公司员工信息、投标金额中的至少一种。
3.如权利要求1所述的方法,其特征在于,所述历史记载业务对应有目标对象;所述根据所述业务信息确定历史记载业务对应于至少一个预设判断规则的判断结果,包括:
判断对应于同一目标对象的至少两个历史记载业务的业务信息之间是否存在关联性;
若存在,将业务信息之间存在关联性的历史记载业务标识为异常业务。
4.如权利要求1所述的方法,其特征在于,所述历史记载业务对应有投标项目;所述业务信息中包含有投标金额;所述根据所述业务信息确定历史记载业务对应于至少一个预设判断规则的判断结果,包括:
获取对应于同一投标项目的至少两个历史记载业务的投标金额;
在不同的投标金额之间的差值大于投标金额最大差值或小于投标金额最小差值的情况下,判断所述投标金额对应的历史记载业务为异常业务。
5.如权利要求1所述的方法,其特征在于,所述历史记载业务对应有投标项目;所述投标项目对应有预算金额;所述历史记载业务的业务信息中包含投标金额;所述根据所述业务信息确定历史记载业务对应于至少一个预设判断规则的判断结果,包括:
获取所述历史记载业务对应的投标项目的预算金额;
在所述投标金额与所述预算金额之间的差值小于投标差值阈值的情况下,判断所述历史记载业务为异常业务。
6.如权利要求1所述的方法,其特征在于,所述根据所述业务信息确定历史记载业务对应于至少一个预设判断规则的判断结果,包括:
判断所述业务信息中是否包含失信记录;所述失信记录,用于表示所述历史记载业务对应的用户存在异常信用数据;
若存在,确定所述业务信息对应的历史记载业务为异常业务。
7.如权利要求1所述的方法,其特征在于,所述业务信息对应于至少两个业务特征;所述利用判断结果中包括异常业务的历史记载业务的业务信息构建至少一个训练样本业务,包括:
将判断结果中包含异常业务的历史记载业务标记为初始异常业务;
将所述初始异常业务的业务信息划分为对应于不同业务特征的业务特征信息;
将不同初始异常业务的业务特征信息分别进行组合得到候选样本业务;
基于候选样本业务之间的相似度将所述候选样本业务划分为至少两个候选样本业务集合;
获取包含有所述初始异常业务的候选样本业务集合中的候选样本业务作为训练样本业务。
8.如权利要求1所述的方法,其特征在于,所述基于所述训练样本业务训练异常业务识别模型,包括:
基于所述训练样本业务利用KNN算法训练异常业务识别模型。
9.一种模型训练装置,其特征在于,包括:
历史记载业务获取模块,用于获取至少一个历史记载业务;所述历史记载业务对应有业务信息;
判断结果确定模块,用于根据所述业务信息确定历史记载业务对应于至少一个预设判断规则的判断结果;所述判断结果包括正常业务和异常业务;
训练样本业务构建模块,用于利用判断结果中包括异常业务的历史记载业务的业务信息构建至少一个训练样本业务;所述训练样本业务的数量大于所述历史记载业务的数量;
异常业务识别模型训练模块,用于基于所述训练样本业务训练异常业务识别模型;所述异常业务识别模型用于识别异常业务。
10.一种模型训练设备,包括存储器和处理器;
所述存储器,用于存储计算机程序指令;
所述处理器,用于执行所述计算机程序指令以实现以下步骤:获取至少一个历史记载业务;所述历史记载业务对应有业务信息;根据所述业务信息确定所述历史记载业务对应于至少一个预设判断规则的判断结果;所述判断结果包括正常业务和异常业务;利用判断结果中包括异常业务的历史记载业务的业务信息构建至少一个训练样本业务;所述训练样本业务的数量大于所述历史记载业务的数量;基于所述训练样本业务训练异常业务识别模型;所述异常业务识别模型用于识别异常业务。
11.一种业务处理方法,其特征在于,包括:
接收待处理业务;所述待处理业务对应有业务信息;
基于所述待处理业务的业务信息识别所述待处理业务是否为异常业务;其中,包括,利用异常业务识别模型识别所述待处理业务是否为异常业务;所述异常业务识别模型,包括根据预设判断规则在历史记载业务中识别出异常业务后,利用所述异常业务对应的业务信息构建训练样本业务,并基于所述训练样本业务训练得到的模型;
在所述待处理业务为异常业务的情况下,反馈业务拒绝信息;所述业务拒绝信息用于表示拒绝处理所述待处理业务。
12.如权利要求11所述的方法,其特征在于,所述待处理业务包括投标业务;所述在所述待处理业务为异常业务的情况下,反馈业务拒绝信息,包括:
在所述待处理业务为异常业务的情况下,不接受所述待处理业务对应的投标。
13.如权利要求11所述的方法,其特征在于,所述基于所述业务信息识别所述待处理业务是否为异常业务之后,还包括:
在所述待处理业务不是异常业务的情况下,处理所述待处理业务。
14.一种业务处理装置,其特征在于,包括:
待处理业务接收模块,用于接收待处理业务;所述待处理业务对应有业务信息;
异常业务识别模块,用于基于所述待处理业务的业务信息识别所述待处理业务是否为异常业务;其中,包括,利用异常业务识别模型识别所述待处理业务是否为异常业务;所述异常业务识别模型,包括根据预设判断规则在历史记载业务中识别出异常业务后,利用所述异常业务对应的业务信息构建训练样本业务,并基于所述训练样本业务训练得到的模型;
业务拒绝信息反馈模块,用于在所述待处理业务为异常业务的情况下,反馈业务拒绝信息;所述业务拒绝信息用于表示拒绝处理所述待处理业务。
15.一种业务处理设备,包括存储器和处理器;
所述存储器,用于存储计算机程序指令;
所述处理器,用于执行所述计算机程序指令以实现以下步骤:接收待处理业务;所述待处理业务对应有业务信息;基于所述待处理业务的业务信息识别所述待处理业务是否为异常业务;其中,包括,利用异常业务识别模型识别所述待处理业务是否为异常业务;所述异常业务识别模型,包括根据预设判断规则在历史记载业务中识别出异常业务后,利用所述异常业务对应的业务信息构建训练样本业务,并基于所述训练样本业务训练得到的模型;在所述待处理业务为异常业务的情况下,反馈业务拒绝信息;所述业务拒绝信息用于表示拒绝处理所述待处理业务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011011568.5A CN112102049A (zh) | 2020-09-23 | 2020-09-23 | 一种模型训练方法、业务处理方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011011568.5A CN112102049A (zh) | 2020-09-23 | 2020-09-23 | 一种模型训练方法、业务处理方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112102049A true CN112102049A (zh) | 2020-12-18 |
Family
ID=73755170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011011568.5A Pending CN112102049A (zh) | 2020-09-23 | 2020-09-23 | 一种模型训练方法、业务处理方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112102049A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112860968A (zh) * | 2021-02-02 | 2021-05-28 | 北京三快在线科技有限公司 | 一种异常检测的方法以及装置 |
CN113051291A (zh) * | 2021-04-16 | 2021-06-29 | 平安国际智慧城市科技股份有限公司 | 工单信息的处理方法、装置、设备及存储介质 |
CN113709223A (zh) * | 2021-08-18 | 2021-11-26 | 上海明略人工智能(集团)有限公司 | 平台异常的监测方法、装置、电子设备及可读存储介质 |
-
2020
- 2020-09-23 CN CN202011011568.5A patent/CN112102049A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112860968A (zh) * | 2021-02-02 | 2021-05-28 | 北京三快在线科技有限公司 | 一种异常检测的方法以及装置 |
CN113051291A (zh) * | 2021-04-16 | 2021-06-29 | 平安国际智慧城市科技股份有限公司 | 工单信息的处理方法、装置、设备及存储介质 |
CN113709223A (zh) * | 2021-08-18 | 2021-11-26 | 上海明略人工智能(集团)有限公司 | 平台异常的监测方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3985578A1 (en) | Method and system for automatically training machine learning model | |
CN105426356B (zh) | 一种目标信息识别方法和装置 | |
Wang et al. | Your cart tells you: Inferring demographic attributes from purchase data | |
CN112102049A (zh) | 一种模型训练方法、业务处理方法、装置及设备 | |
CN110378786B (zh) | 模型训练方法、违约传导风险识别方法、装置及存储介质 | |
WO2022037541A1 (zh) | 图像处理模型训练方法、装置、设备及存储介质 | |
US11531987B2 (en) | User profiling based on transaction data associated with a user | |
CN111783039B (zh) | 风险确定方法、装置、计算机系统和存储介质 | |
WO2022116771A1 (en) | Method for analyzing emotion shown in image and related devices | |
CN112750029A (zh) | 信用风险预测方法、装置、电子设备及存储介质 | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN114971294A (zh) | 数据采集方法、装置、设备及存储介质 | |
CN111784053A (zh) | 交易风险检测方法、设备及可读存储介质 | |
CN112541055A (zh) | 一种确定文本标签的方法及装置 | |
CN111784506A (zh) | 逾期风险控制方法、设备及可读存储介质 | |
CN115170838A (zh) | 一种数据筛选方法及装置 | |
Yang et al. | An evidential reasoning rule-based ensemble learning approach for evaluating credit risks with customer heterogeneity | |
Zhao et al. | Detecting fake reviews via dynamic multimode network | |
CN111861493A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
US11956400B2 (en) | Systems and methods for measuring document legibility | |
US20230368557A1 (en) | Image reading systems, methods and storage medium for performing entity extraction, grouping and validation | |
CN116304058B (zh) | 企业负面信息的识别方法、装置、电子设备及存储介质 | |
US20230057762A1 (en) | Predicting a time of an event associated with an instrument using a machine learning model | |
CN117541885A (zh) | 样本数据处理方法、装置、存储介质和系统 | |
US20240078829A1 (en) | Systems and methods for identifying specific document types from groups of documents using optical character recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |