CN111553487B - 一种业务对象识别方法及装置 - Google Patents

一种业务对象识别方法及装置 Download PDF

Info

Publication number
CN111553487B
CN111553487B CN202010450303.9A CN202010450303A CN111553487B CN 111553487 B CN111553487 B CN 111553487B CN 202010450303 A CN202010450303 A CN 202010450303A CN 111553487 B CN111553487 B CN 111553487B
Authority
CN
China
Prior art keywords
service
business
objects
preset
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010450303.9A
Other languages
English (en)
Other versions
CN111553487A (zh
Inventor
朱标
章鹏
崔阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010450303.9A priority Critical patent/CN111553487B/zh
Publication of CN111553487A publication Critical patent/CN111553487A/zh
Application granted granted Critical
Publication of CN111553487B publication Critical patent/CN111553487B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Technology Law (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种业务对象识别方法及装置,所述方法包括:将特征样本集中与业务对象相对应的业务特征输入预先训练的机器学习模型,以根据所述机器学习模型的输出结果确定所述业务特征对应的业务对象是否运营了预设业务;将运营了预设业务的业务对象添加至对象集,将运营了预设业务的业务对象对应的业务特征添加至数据集;在预设的舆情数据库中搜索与所述数据集中的业务特征相关的舆情数据,并从搜索到的舆情数据中提取业务特征,将提取出的所述业务特征添加至所述特征样本集,以对所述特征样本集进行更新;以及,确定与所述对象集中的各业务对象存在业务关系的扩展业务对象,并将确定出的所述扩展业务对象添加至所述对象集,以得到更新后的所述对象集。

Description

一种业务对象识别方法及装置
技术领域
本说明书涉及计算机应用领域,尤其涉及一种业务对象识别方法及装置。
背景技术
随着电子商务与互联网金融的发展,越来越多的企业开始运营诸如现金贷款的业务;然而,此类业务往往伴随着隐性高利率、恶意逾期、暴力催收等情况,为了减少上述情况的发生,人们需要通过技术手段检索到运营上述业务的企业等业务对象。
在相关技术中,人们可以采用人工智能技术,预先训练能够根据企业所公开的信息,判断对应的企业是否运营上述业务的机器学习模型,以快速筛选、检索运营上述业务的企业;然而,此种方法需要首先获取要输入模型的数据,由于互联网信息总量庞大,人工从海量数据中获取能够用于输入模型的数据,覆盖率会较差;而直接爬取海量数据输入模型,由于直接爬取的数据并不针对上述业务,因此亦会导致检索的整体效率偏低。
发明内容
有鉴于此,本说明书公开了一种业务对象识别方法及装置。
根据本说明书实施例的第一方面,公开了一种业务对象识别方法,包括:
将特征样本集中,与业务对象相对应的业务特征,输入预先训练的机器学习模型,以根据所述机器学习模型的输出结果,确定所述业务特征对应的业务对象是否运营了预设业务;
将运营了预设业务的业务对象添加至对象集,将运营了预设业务的业务对象对应的业务特征添加至数据集;
在预设的舆情数据库中搜索与所述数据集中的业务特征相关的舆情数据,并从搜索到的舆情数据中提取业务特征,将提取出的所述业务特征添加至所述特征样本集,以对所述特征样本集进行更新;以及,
确定与所述对象集中的各业务对象,存在业务关系的扩展业务对象,并将确定出的所述扩展业务对象添加至所述对象集,以得到更新后的所述对象集。
根据本说明书实施例的第二方面,公开了一种业务对象识别装置,包括:
模型调用模块,将特征样本集中,与业务对象相对应的业务特征,输入预先训练的机器学习模型,以根据所述机器学习模型的输出结果,确定所述业务特征对应的业务对象是否运营了预设业务;
添加模块,将运营了预设业务的业务对象添加至对象集,将运营了预设业务的业务对象对应的业务特征添加至数据集;
特征样本集更新模块,在预设的舆情数据库中搜索与所述数据集中的业务特征相关的舆情数据,并从搜索到的舆情数据中提取业务特征,将提取出的所述业务特征添加至所述特征样本集,以对所述特征样本集进行更新;
对象集更新模块,确定与所述对象集中的各业务对象,存在业务关系的扩展业务对象,并将确定出的所述扩展业务对象添加至所述对象集,以得到更新后的所述对象集。
以上技术方案中,一方面,在将利用机器学习模型识别出的运营了预设业务的业务对象添加至对象集后,由于与对象集中的业务对象存在业务关系的扩展业务对象,一般亦会运营与对象集中的业务对象同样的预设业务;因此,将扩展业务对象添加至对象集以对该对象集进行更新,相对于传统方案而言增加了新的业务对象识别渠道,可以提高业务对象的识别效率和覆盖率。
另一方面,在将利用机器学习模型识别出的运营了预设业务的业务对象对应的业务特征添加至数据集后,由于从舆情数据库中搜索出的与数据集中的业务特征相关的舆情数据,通常也与上述预设业务相互关联;因此,将从搜索到的舆情数据中提取出的业务特征,也添加至特征样本集,相对于传统方案而言增加了新的业务特征获取渠道,可以进一步提高业务对象的识别效率和覆盖率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施例,并与说明书文本一同用于解释原理。
图1是本说明书所述业务对象识别方法的流程示例图;
图2是本说明书所述业务关系网络的情景示例图;
图3是本说明书所述舆情数据搜索的示例图;
图4是本说明书所述业务闭环的示例图;
图5是本说明书所述业务对象识别装置的结构示例图;
图6是本说明书所述用于业务对象识别的计算机设备的结构示例图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的系统和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
随着电子商务与互联网金融的发展,越来越多的企业开始运营诸如现金贷款的业务;然而,此类业务往往伴随着隐性高利率、恶意逾期、暴力催收等情况,为了减少上述情况的发生,人们需要通过技术手段检索到运营上述业务的企业等业务对象。
在相关技术中,人们可以采用人工智能技术,预先训练能够根据企业所公开的信息,判断对应的企业是否运营上述业务的机器学习模型,以快速筛选、检索运营上述业务的企业;然而,此种方法需要首先获取要输入模型的数据,由于互联网信息总量庞大,人工从海量数据中获取能够用于输入模型的数据,效率太低;而直接爬取海量数据输入模型,由于直接爬取的数据并不针对上述业务,因此亦会导致检索的整体效率偏低。
基于此,本说明书提出一种通过舆情搜索不断补充用于输入机器学习模型的业务特征,以形成业务闭环,并根据业务对象的业务关系进一步发掘运营预设业务的业务对象的技术方案。
在实现时,可以利用预先训练的机器学习模型,将特征样本集中的业务特征输入,以确定运营预设业务的业务对象以及对应的业务特征,并将对应的业务特征用于舆情搜索,再利用舆情搜索的结果更新上述特征样本集,以形成业务闭环;还可以在将确定出的、运营预设业务的业务对象添加至对象集后,将与对象集中的业务对象存在业务关系的扩展业务对象也添加至对象集,完成对象集的更新,从而充分利用已知的运营预设业务的业务对象,发掘其他同样运营预设业务的业务对象。
以上技术方案中,一方面,在将利用机器学习模型识别出的运营了预设业务的业务对象添加至对象集后,由于与对象集中的业务对象存在业务关系的扩展业务对象,一般亦会运营与对象集中的业务对象同样的预设业务;因此,将扩展业务对象添加至对象集以对该对象集进行更新,相对于传统方案而言增加了新的业务对象识别渠道,可以提高业务对象的识别效率和覆盖率。
另一方面,在将利用机器学习模型识别出的运营了预设业务的业务对象对应的业务特征添加至数据集后,由于从舆情数据库中搜索出的与数据集中的业务特征相关的舆情数据,通常也与上述预设业务相互关联;因此,将从搜索到的舆情数据中提取出的业务特征,也添加至特征样本集,相对于传统方案而言增加了新的业务特征获取渠道,可以进一步提高业务对象的识别效率和覆盖率。
下面通过具体实施例并结合具体的应用场景对本说明书进行描述。
请参考图1,图1是本说明书一实施例提供的一种业务对象识别方法,该方法执行以下步骤:
S101,将特征样本集中,与业务对象相对应的业务特征,输入预先训练的机器学习模型,以根据所述机器学习模型的输出结果,确定所述业务特征对应的业务对象是否运营了预设业务;
S102,将运营了预设业务的业务对象添加至对象集,将运营了预设业务的业务对象对应的业务特征添加至数据集;
S103,在预设的舆情数据库中搜索与所述数据集中的业务特征相关的舆情数据,并从搜索到的舆情数据中提取业务特征,将提取出的所述业务特征添加至所述特征样本集,以对所述特征样本集进行更新;以及,
S104,确定与所述对象集中的各业务对象,存在业务关系的扩展业务对象,并将确定出的所述扩展业务对象添加至所述对象集,以得到更新后的所述对象集。
可以理解的是,上述步骤中,S103与S104执行的先后顺序可以不进行限定;例如,可以先执行S103,再执行S104,也可以先执行S104再执行S103,或者将S103与S104并行执行,本领域技术人员可以自行设计具体的实现过程。
上述业务对象,可以是个人独资企业、合伙制企业、公司制企业等各种形式的,在经济活动中可以作为主体的对象;例如商业银行、保险公司、基金公司等等,均可以视为本说明书所述的业务对象。
上述业务特征,可以来自于与业务对象相对应的各类可以获取的数据,例如公司的名称、产品以及业务的描述信息、公司的网络主页、开发的PC应用程序以及手机App等等,均可以作为本说明书所述的业务特征的来源;可以理解的是,业务特征可以是多种形式的;例如,公司的商标可以是中文文本,也可以是英文文本,还可以是商标图案的截图,等等;亦可以理解的是,从业务对象公开的原始信息,到可以作为业务特征使用,可能需要各种形式的预处理,例如图像的缩放、文本的切分等等,本说明书无需进行具体限定。
上述特征样本集,可以是容纳上述业务特征的容器,或者指代由上述业务特征构成的集合;例如,该特征样本集可以是一个存放结构体的数组,其中,对应于同一个业务对象的业务特征被存放在同一个结构体中;该特征样本集的具体实现方式本申请无需进行具体限定,本领域技术人员可以根据具体需求自行选择实现方式。
上述预先训练的机器学习模型,可以是任意将业务特征作为训练样本训练得到的、用于判断业务特征对应的业务对象是否运营预设业务的机器学习模型;该机器学习模型的模型架构、训练方法本说明书均不作具体限定,本领域技术人员可以根据具体需求,参考相关技术文档完成具体设计。
上述预设的预设业务,可以是任意形式的可运营业务,本说明书无需进行限定;举例而言,无论是生产销售,还是教育服务,还是具有金融活动属性,但并非传统金融的类金融业务,诸如融资租赁、小额贷款、资本管理、担保、典当等等,均可包含在内;在本说明书中,预设何种业务,可以由本领域技术人员根据具体需求自行设定,本说明书不作具体限定。
在示出的一种实施方式中,上述业务对象可以为企业,上述预设的类金融业务可以为现金管理业务;例如,某家企业运营融资、资本管理等现金管理业务,即可被认为是运营预设业务的业务对象;由于现金管理业务相关的舆情信息通常会聚集出现,因此采用本说明书公开的方案能够更高效地识别运营了现金管理业务的企业。
在示出的一种实施方式中,上述现金管理业务可以为现金贷款业务;现金贷款业务一般指向低收入群体和微型企业提供的一种持续信贷服务,由于其业务关系特征相对明显,因此采用本说明书公开的方案能够更高效地识别出运营现金贷款业务的企业。
在本说明书中,可以利用预先训练的分类模型,以及特征样本集,获取运营预设业务的业务对象;具体而言,可以将特征样本集中,对应于业务对象的业务特征输入到上述预先训练的机器学习模型中,以根据该分类模型的输出结果,确定输入的业务特征对应的业务对象是否运营预设业务;之后,可以将运营预设业务业务对象添加到对象集,将运营预设业务业务对象对应的业务特征添加到数据集;
举例而言,假设将对应于业务对象A的业务特征A1、A2、A3输入该机器学习模型,如果模型输出的判断结果为是,则可以认为业务对象A是运营了预设业务的业务对象;进一步地,可以将业务对象A添加至对象集,并将业务特征A1、A2、A3均添加至数据集。
可以理解的是,上述对于业务对象的操作,可以包括对于业务对象的标识的操作;例如,需要将业务对象A添加至对象集时,实际操作可以是将业务对象A的标识添加到对象集这一数据结构中;更为具体的实现方式,本领域技术人员可以参见相关技术完成设计,本说明书对此不作具体限定。
在本说明书中,上述机器学习模型可以包括多种类别,以适应多种形式的业务特征;具体而言,该机器学习模型可以由若干个分别对应不同形式的业务特征的机器学习子模型组成,也可以是一个可以支持多种不同形式的业务特征输入的综合机器学习模型。
在示出的一种实施方式中,上述业务特征可以为与上述业务对象相关的业务图片;对应的,上述机器学习模型即可以为基于与业务对象相关的业务图片训练得到的,用于判断相关的业务对象是否运营预设业务的分类模型;其中,业务图片可以是该业务对象公开的信息中与业务相关的图片信息;由于运营预设的类金融业务的企业所公开的图片信息往往具有一定相似性,因此可以利用该预先训练的分类模型完成上述判断。
例如,输入上述分类模型的业务特征为某企业的App中的业务介绍图片,包括了金币、钱袋、银行卡等等与现金贷款业务具有显著相关性的图标;在此种情景下,对应的分类模型可以识别上述与现金贷款业务具有显著相关性的图标,并作出该企业是涉及现金贷款业务的企业的判断输出。
类似地,如果需要识别运营在线教育业务的企业,那么则需要该分类模型能够识别诸如眼镜、书本、教室等等与在线教育业务具有显著相关性的图片;如果需要识别运营房屋租赁业务的企业,那么则需要该分类模型能够识别诸如房屋平面图、家具效果图等等与房屋租赁业务具有显著相关性的图片;对应其他领域的业务,本领域技术人员也可参照相关技术以及经验,完成具体设计,本说明书不作进一步的限定。
在示出的一种实施方式中,上述业务特征可以为与上述业务对象相关的业务文本;对应的,上述分类模型即可以为基于与业务对象相关的业务文本训练得到的,用于判断相关的业务对象是否运营预设业务的分类模型;其中,业务文本可以是该业务对象公开的信息中与业务相关的文本信息;
例如,输入上述分类模型的业务特征为某企业的网页中的业务介绍文本,包括了“低利息”、“当天放款”、“额度高”等等与现金贷款业务具有显著相关性的词语;在此种情景下,对应的分类模型可以识别上述与现金贷款业务具有显著相关性的词语,并作出该企业是涉及现金贷款业务的企业的判断输出;类似地,对应其他领域的业务,本领域技术人员也可参照相关技术以及经验,完成具体设计,本说明书不作进一步的限定。
在示出的一种实施方式中,上述业务文本还可以是从上述与业务对象相关的业务图片中识别出的文本;具体而言,由于部分业务的文本宣传可能会被宣传平台(例如各类社交平台、论坛、网上商店等等)所屏蔽,因此对应的业务对象会选择将文本信息以图片形式发放,以取得难以被屏蔽的效果;对应的,可以通过OCR(Optical Character Recognition,光学字符识别)技术,将业务图片中的文本信息重新识别、提取出来,并作为文本形式的业务特征输入分类模型。
在本说明书中,可以首先确定与上述对象集中的各业务对象存在业务关系的扩展业务对象,并进一步将确定出的上述扩展业务对象添加至上述对象集,以对上述对象集进行更新;由于存在业务关系的业务对象,一般会运营同样的预设业务,因此可以将上述扩展业务对象视为与上述对象集中的各业务对象运营了同样预设业务的业务对象;而下一次执行该步骤时,则可以使用更新后的对象集。
在示出的一种实施方式中,可以根据上述对象集中的各业务对象的历史业务记录,构建业务关系网络,则该网络中将包含诸多其他由业务关系联结的业务对象;进一步将与所述对象集中的各业务对象存在业务关系的业务对象确定为扩展业务对象,即可视为完成了一次基于业务关系网络的挖掘。
可以理解的是,上述过程可以通过迭代的方式多次完成,每一次完成业务关系网络挖掘,都有可能向对象集中添加新的业务对象,则在下一次迭代中,构建的业务关系网络也就更丰富,进一步地也就能够获得更多的扩展业务对象;上述迭代的停止条件,可以是迭代次数,也可以为迭代时间,还可以是迭代是否无法挖掘到新的业务对象,等等;上述迭代条件的具体设计,本领域技术人员可以根据具体需求自行设定,本说明书不作具体限定。
在示出的一种实施方式中,在上述业务关系网络挖掘过程中,可以首先确定中间对象,再根据确定的中间对象的业务关系,间接挖掘扩展业务对象;具体而言,可以通过该业务关系网络,确定与该对象集中的各业务对象存在业务关系的中间对象,并进一步将与该中间对象存在业务关系的业务对象确定为扩展业务对象。在实际操作中,以现金贷款为例,假设一个人从某公司申请了现金贷款,那么这个人还申请其他公司的现金贷款业务的概率就会较高,因此,可以从与这个人存在资金往来的业务对象中找到其他运营现金贷款业务的公司;类似的,如果一个人从某公司查询了房屋租赁信息,那么这个人也有较大可能性也从其他公司查询房屋租赁信息,因此,可以根据这个人存在业务联系的其他公司中找到运营房屋租赁业务的公司。
可以理解的是,基于上述思想,在实际实现中还可以补充各类过滤措施,以减少将并未运营预设业务的业务对象误确定为扩展业务对象的可能;例如,可以在找到满足上述“存在业务关系”的条件的业务对象之后,对其进行人工核查,或者利用其他识别手段,以过滤实际并未运营预设业务的业务对象。
在示出的一种实施方式中,如果某业务对象与数量超过预设数量阈值的中间对象存在业务关系,则该业务对象即可以被认定为与该中间对象存在业务关系,因此也可以被认定为扩展业务对象。在实际操作中,依然以现金贷款为例,如果一家公司向多个使用现金贷款的人发放资金,那么极有可能该公司也是运营现金贷款的公司;如果一家公司与多个曾查询房屋租赁信息的人存在信息推送、合同签订等业务关系,那么该公司也极有可能是运营房屋租赁业务的公司;具体实现中,上述阈值可以由本领域技术人员根据具体需求进行设定,本说明书不作具体限定。
请参见图2,图2为业务关系网络的一具体示例;若以上述一家公司向多个使用现金贷款的人发放资金的情景为例,则箭头可以指代资金流动方向,种子企业将资金发往了3个目标,则作为目标的这三个人则成为中间对象;假设在该例子中预设的数量阈值为1,那么由于业务对象A向两个中间对象发放了资金,超过了阈值1,则可以将业务对象A作为挖掘到的业务对象;而业务对象B仅向1个中间对象发放了资金,未超过阈值1,因此不会被作为挖掘到的业务对象。
通过上述对扩展业务对象的挖掘以及对对象集的补充更新,可以在机器学习模型识别的基础上,进一步丰富对象集内运营预设业务的业务对象的来源,提高业务对象的识别消息以及覆盖率。
在本说明书中,还可以通过舆情搜索的方式,根据搜索到的舆情信息更新业务特征集,完成业务闭环;具体而言,可以在预设的舆情数据库中搜索与数据集中的业务特征相关的舆情数据,并从搜索到的舆情数据中提取业务特征,将提取出的业务特征添加至该特征样本集,以对特征样本集进行更新;由于客观上涉及相同业务的业务对象在舆情中也往往存在联系,而数据集中的数据均对应于运营预设业务的业务对象,因此,通过根据数据集中的数据进行搜索,得到的舆情数据中就很可能包含新的运营预设业务的业务对象。
上述舆情数据库,可以是专用的、由爬虫程序对互联网上的信息进行过初步筛选的舆情数据库,也可以将特定的社交平台或者资讯平台作为舆情数据库,还可以直接将整个互联网作为舆情数据库,具体搜索的范围,可以由本领域技术人员根据具体需求自行确定,本说明书无需进行具体限定。
上述提取业务特征,可以是通过预处理手段,将原始的网络公开信息处理为对应的机器学习模型能够接受的形式。
在示出的一种实施方式中,上述预处理手段可以包括基于预设的文本识别算法,将搜索到的舆情数据中与业务对象相关的业务图片中携带的文本提取出来,以形成文本形式的业务特征。
可以理解的是,上述预处理手段还可以包括文本切分、图像缩放等等,本说明书无需进行具体限定,本领域技术人员可以根据具体需求,参照相关技术文献确定此部分实现细节。
在示出的一种实施方式中,可以基于近义词挖掘算法,获取所述数据集中的业务特征的近义词,并将获取到的近义词与该数据集中的业务特征作为搜索关键词,在预设的舆情数据库中搜索相关的舆情数据;上述近义词挖掘算法可以是word2vector算法、基于知识库的近义词算法、基于文本相似度的近义词算法等等,本领域技术人员可以根据具体需求确定所使用的近义词挖掘算法,本说明书无需进行具体限定。
请参见图3,图3是利用近义词挖掘方式进行舆情搜索的一示例图;在本例中,数据集中的业务特征包括“当天打款”“门槛低”“X微贷”三个短语,经过近义词挖掘,可见新增了“当天放款”“低门槛”“X小贷”,分别为上述三者的近义词,采用上述6个词语作为搜索关键词,即有可能搜索到如图中所示的舆情信息;采用此方案,相对于仅使用最初的三个短语进行舆情搜索,能够增大搜索的覆盖面,提高获取新的业务特征的效率;又能保证新获得的业务特征与预设的业务存在较强的关联,进一步使得更新后的特征样本集对预设业务仍有较佳的针对性。
在本说明书中,更新后的对象集中的业务对象,可以用于为舆情数据搜索提供更多相关信息作为搜索关键词;例如,将确定出的所述扩展业务对象添加至所述对象集后,可以进一步获取该对象的名称、涉及的业务名称、别名等信息,将这部分信息作为搜索关键词进行舆情搜索,可以进一步增大搜索的覆盖面,提高获取新的业务特征的效率。
在示出的在一种实施方式中,可以将确定出的扩展业务对象的相关数据添加至数据集中;具体而言,上述相关数据可以包括确定出的扩展业务对象的名称、确定出的扩展业务对象的别名和/或确定出的扩展业务对象提供的产品的描述。
在本说明书中,上述方法可以循环执行,形成业务闭环;请参见图4,图4是本说明书所述的一种业务闭环的示例图;
在该例中,主要的业务闭环结构为,业务特征通过机器学习模型,部分进入数据集,经过近义词挖掘得到关键词,再经过舆情数据搜索得到相关舆情,最后从搜索到的舆情数据中提取业务特征并添加至特征样本集;由于机器学习模型会不断筛选去除并不对应预设业务的业务特征,而近义词挖掘与舆情数据搜索则会使业务特征增加,因此,该业务闭环将最终使得特征样本集中,对应预设业务的业务特征所占的比例显著增加,进而对识别、检索出运营预设业务的业务对象的过程产生正向反馈;
另一方面,机器学习模型不断鉴别出运营了预设业务的业务对象并添加到对象集中,而对象集中的业务对象则会因为扩展业务对象进一步丰富,而通过相关信息补充,则可以增加数据集的容量,进而在上述舆情数据搜索后,可以添加至特征样本集的业务特征会增多,因此也可以对业务对象的识别检索过程产生正向反馈;
最终,相对于相关技术而言,上述业务闭环可以以更高的效率和覆盖率,完成对运营预设业务的业务对象的识别,并将其存储在对象集中。
在本说明书中,可以首先确定是否满足与对象集相对应的输出条件,在满足该输出条件的情况下,则可输出上述对象集中的业务对象;可以理解的是,无条件输出可以视为输出条件恒被满足的特殊情况,查询方式输出可以将查询指令视为输出条件;因此,输出的条件可以由本领域技术人员根据具体情况以及需求设定,本说明书无需作出详细限定。
在示出的一种实施方式中,上述输出条件可以为下列条件中任意一者,或者多者的组合:
上述对象集中的业务对象的数量达到预设的数量阈值;
上述对象集中的业务对象的数量的增量小于预设的数量阈值;
上述方法执行的时间达到预设的时间阈值;
上述方法执行的次数达到预设的次数阈值;等等。
采用上述方案,可以在特定的条件下将检索到的运营预设业务的业务对象进行输出,提高了该方法输出的灵活性。
本说明书还提出一种业务对象识别装置;请参见图5,图5是本说明书所述业务对象识别装置的一种结构示例图,该装置包括:
模型调用模块501,将特征样本集中,与业务对象相对应的业务特征,输入预先训练的机器学习模型,以根据所述机器学习模型的输出结果,确定所述业务特征对应的业务对象是否运营了预设业务;
添加模块502,将运营了预设业务的业务对象添加至对象集,将运营了预设业务的业务对象对应的业务特征添加至数据集;
特征样本集更新模块503,在预设的舆情数据库中搜索与所述数据集中的业务特征相关的舆情数据,并从搜索到的舆情数据中提取业务特征,将提取出的所述业务特征添加至所述特征样本集,以对所述特征样本集进行更新;
对象集更新模块504,确定与所述对象集中的各业务对象,存在业务关系的扩展业务对象,并将确定出的所述扩展业务对象添加至所述对象集,以得到更新后的所述对象集。
上述预设的预设业务,可以是任意形式的可运营业务,本说明书无需进行限定;举例而言,无论是生产销售,还是教育服务,还是具有金融活动属性,但并非传统金融的类金融业务,诸如融资租赁、小额贷款、资本管理、担保、典当等等,均可包含在内;在本说明书中,预设何种类金融业务,可以由本领域技术人员根据具体需求自行设定,本说明书不作具体限定。
在示出的一种实施方式中,上述业务对象可以为企业,上述预设的类金融业务可以为现金管理业务;例如,某家企业运营融资、资本管理等现金管理业务,即可被认为是运营预设业务的业务对象;由于现金管理业务相关的舆情信息通常会聚集出现,因此采用本说明书公开的方案能够更高效地识别运营了现金管理业务的企业。
在示出的一种实施方式中,上述现金管理业务可以为现金贷款业务;现金贷款业务一般指向低收入群体和微型企业提供的额度较小的持续信贷服务,由于其业务关系特征相对明显,因此采用本说明书公开的方案能够更高效地识别出运营现金贷款业务的企业。
在本说明书中,模型调用模块501可以利用预先训练的分类模型,以及特征样本集,获取运营预设业务的业务对象;具体而言,模型调用模块501可以将特征样本集中,对应于业务对象的业务特征输入到上述预先训练的机器学习模型中,以根据该分类模型的输出结果,确定输入的业务特征对应的业务对象是否运营预设业务;
在本说明书中,上述机器学习模型可以包括多种类别,以适应多种形式的业务特征;具体而言,该机器学习模型可以由若干个分别对应不同形式的业务特征的机器学习子模型组成,也可以是一个可以支持多种不同形式的业务特征输入的综合机器学习模型。
在示出的一种实施方式中,上述业务特征可以为与上述业务对象相关的业务图片;对应的,上述机器学习模型即可以为基于与业务对象相关的业务图片训练得到的,用于判断相关的业务对象是否运营预设业务的分类模型;其中,业务图片可以是该业务对象公开的信息中与业务相关的图片信息。
在示出的一种实施方式中,上述业务特征可以为与上述业务对象相关的业务文本;对应的,上述机器学习模型即可以为基于与业务对象相关的业务文本训练得到的,用于判断相关的业务对象是否运营预设业务的分类模型;其中,业务文本可以是该业务对象公开的信息中与业务相关的文本信息。
在示出的一种实施方式中,上述业务文本还可以是从上述与业务对象相关的业务图片中识别出的文本;具体而言,由于部分业务的文本宣传可能会被宣传平台(例如各类社交平台、论坛、网上商店等等)所屏蔽,因此对应的业务对象会选择将文本信息以图片形式发放,以取得难以被屏蔽的效果;对应的,可以通过OCR(Optical Character Recognition,光学字符识别)技术,将业务图片中的文本信息重新识别、提取出来,并作为文本形式的业务特征输入分类模型。
在本说明书中,添加模块502可以将运营预设业务业务对象添加到对象集,将运营预设业务业务对象对应的业务特征添加到数据集;具体而言,数据集以及对象集的数据格式本说明书不作限定,本领域技术人员可以根据具体情况以及需求,自行选择并加以实现。
在本说明书中,特征样本集更新模块503可以通过舆情搜索的方式,根据搜索到的舆情信息更新业务特征集,完成业务闭环;具体而言,可以在预设的舆情数据库中搜索与数据集中的业务特征相关的舆情数据,并从搜索到的舆情数据中提取业务特征,将提取出的业务特征添加至该特征样本集,以对特征样本集进行更新。
上述舆情数据库,可以是专用的、由爬虫程序对互联网上的信息进行过初步筛选的舆情数据库,也可以将特定的社交平台或者资讯平台作为舆情数据库,还可以直接将整个互联网作为舆情数据库,具体搜索的范围,可以由本领域技术人员根据具体需求自行确定,本说明书无需进行具体限定。
上述提取业务特征,可以是通过预处理手段,将原始的网络公开信息处理为对应的机器学习模型能够接受的形式。
在示出的一种实施方式中,上述预处理手段可以包括基于预设的文本识别算法,将搜索到的舆情数据中与业务对象相关的业务图片中携带的文本提取出来,以形成文本形式的业务特征。
可以理解的是,上述预处理手段还可以包括文本切分、图像缩放等等,本说明书无需进行具体限定,本领域技术人员可以根据具体需求,参照相关技术文献确定此部分实现细节。
在示出的一种实施方式中,特征样本集更新模块503可以基于近义词挖掘算法,获取所述数据集中的业务特征的近义词,并将获取到的近义词与所述数据集中的业务特征作为搜索关键词,在预设的舆情数据库中搜索相关的舆情数据;上述近义词挖掘算法可以是word2vector算法、基于知识库的近义词算法、基于文本相似度的近义词算法等等,本领域技术人员可以根据具体需求确定所使用的近义词挖掘算法,本说明书无需进行具体限定。
在本说明书中,对象集更新模块504可以首先确定与上述对象集中的各业务对象存在业务关系的扩展业务对象,并进一步将确定出的上述扩展业务对象添加至上述对象集,以对上述对象集进行更新;由于存在业务关系的业务对象,一般会运营同样的预设业务,因此可以将上述扩展业务对象视为与上述对象集中的各业务对象运营了同样预设业务的业务对象;而下一次执行该步骤时,则可以使用更新后的对象集。
在示出的一种实施方式中,上述对象集更新模块504还可以进一步根据上述对象集中的各业务对象的历史业务记录,构建业务关系网络,则该网络中将包含诸多其他由业务关系联结的业务对象;进一步将与所述对象集中的各业务对象存在业务关系的业务对象确定为扩展业务对象,即可视为完成了一次基于业务关系网络的挖掘。
可以理解的是,上述过程可以通过迭代的方式多次完成,每一次完成业务关系网络挖掘,都有可能向对象集中添加新的业务对象,则在下一次迭代中,构建的业务关系网络也就更丰富,进一步地也就能够获得更多的扩展业务对象;上述迭代的停止条件,可以是迭代次数,也可以为迭代时间,还可以是迭代是否无法挖掘到新的业务对象,等等;上述迭代条件的具体设计,本领域技术人员可以根据具体需求自行设定,本说明书不作具体限定。
在示出的一种实施方式中,在上述业务关系网络挖掘过程中,对象集更新模块504可以首先确定中间对象,再根据确定的中间对象的业务关系,间接挖掘扩展业务对象;具体而言,可以通过该业务关系网络,确定与该对象集中的各业务对象存在业务关系的中间对象,并进一步将与该中间对象存在业务关系的业务对象确定为扩展业务对象。
在示出的一种实施方式中,如果某业务对象与数量超过预设数量阈值的中间对象存在业务关系,则该业务对象即可以被认定为与该中间对象存在业务关系,也进一步可以被认定为扩展业务对象。该阈值可以由本领域技术人员根据具体需求进行设定,本说明书不作具体限定。
在本说明书中,更新后的对象集中的业务对象,可以用于为舆情数据搜索提供更多相关信息作为搜索关键词。
在示出的在一种实施方式中,该装置还可以包括相关数据补充模块,该模块可以将确定出的扩展业务对象的相关数据添加至所述数据集中;具体而言,上述相关数据可以包括确定出的扩展业务对象的名称、确定出的扩展业务对象的别名和/或确定出的扩展业务对象提供的产品的描述。
在本说明书中,上述装置还可以包括业务对象输出模块,该模块可以首先确定是否满足预设的输出条件,在满足输出条件的情况下,输出上述对象集中的业务对象。
在示出的一种实施方式中,上述输出条件可以为下列条件中任意一者,或者多者的组合:
上述对象集中的业务对象的数量达到预设的数量阈值;
上述对象集中的业务对象的数量的增量小于预设的数量阈值。
采用上述方案,业务对象输出模块可以在特定的条件下将检索到的运营预设业务的业务对象进行输出,提高了该方法输出的灵活性。
本说明书实施例还提供一种计算机设备,其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现前述的业务对象识别方法。
图6示出了本说明书实施例所提供的一种更为具体的计算设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述的业务对象识别方法。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书实施例可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书实施例各个实施例或者实施例的某些部分所述的方法。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,在实施本说明书实施例方案时可以把各模块的功能在同一个或多个软件和/或硬件中实现。也可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅是本说明书实施例的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本说明书实施例原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本说明书实施例的保护范围。

Claims (27)

1.一种业务对象识别方法,包括:
将特征样本集中,与业务对象相对应的业务特征,输入预先训练的机器学习模型,以根据所述机器学习模型的输出结果,确定所述业务特征对应的业务对象是否运营了预设业务;
将运营了预设业务的业务对象添加至对象集,将运营了预设业务的业务对象对应的业务特征添加至数据集;
在预设的舆情数据库中搜索与所述数据集中的业务特征相关的舆情数据,并从搜索到的舆情数据中提取业务特征,将提取出的所述业务特征添加至所述特征样本集,以对所述特征样本集进行更新;以及,
基于包含所述对象集中的各业务对象的业务关系网络,确定与所述对象集中的各业务对象存在业务关系的扩展业务对象,并将确定出的所述扩展业务对象添加至所述对象集,以得到更新后的所述对象集。
2.根据权利要求1所述的方法,
所述业务对象包括企业;所述预设业务包括现金管理业务。
3.根据权利要求2所述的方法,
所述现金管理业务包括现金贷款业务。
4.根据权利要求1所述的方法,所述业务特征包括与所述业务对象相关的业务图片的图片特征,和/或与所述业务对象相关的业务文本的文本特征。
5.根据权利要求4所述的方法,所述业务文本包括:
从与所述业务对象相关的业务图片中识别出的文本。
6.根据权利要求1所述的方法,
所述基于包含所述对象集中的各业务对象的业务关系网络,确定与所述对象集中的各业务对象存在业务关系的扩展业务对象,包括:
根据所述对象集中的各业务对象的历史业务记录,构建业务关系网络;
将所述业务关系网络中,与所述对象集中的各业务对象存在业务关系的业务对象确定为扩展业务对象。
7.根据权利要求6所述的方法,
所述将所述业务关系网络中,与所述对象集中的各业务对象存在业务关系的业务对象确定为扩展业务对象,包括:
通过所述业务关系网络,确定与所述对象集中的各业务对象存在业务关系的中间对象,并进一步将与所述中间对象存在业务关系的业务对象确定为扩展业务对象。
8.根据权利要求7所述的方法,
所述与所述中间对象存在业务关系的业务对象,包括:
与数量超过预设数量阈值的中间对象存在业务关系的业务对象。
9.根据权利要求1所述的方法,所述在预设的舆情数据库中搜索与所述数据集中的业务特征相关的舆情数据,包括:
基于近义词挖掘算法,获取所述数据集中的业务特征的近义词,并将获取到的近义词与所述数据集中的业务特征作为搜索关键词,在预设的舆情数据库中搜索相关的舆情数据。
10.根据权利要求5所述的方法,
所述从搜索到的舆情数据中提取业务特征,包括:
基于预设的文本识别算法,从搜索到的舆情数据中与业务对象相关的业务图片内,提取文本形式的业务特征。
11.根据权利要求1所述的方法,在将确定出的所述扩展业务对象添加至所述对象集后,所述方法还包括:
将确定出的所述扩展业务对象的相关数据添加至所述数据集中;所述相关数据包括下列任意一种或多种的组合:
确定出的所述扩展业务对象的名称;
确定出的所述扩展业务对象的别名;
确定出的所述扩展业务对象提供的产品的描述。
12.根据权利要求1所述的方法,所述方法还包括:
确定是否满足与所述对象集对应的输出条件;如果是,输出所述对象集中的业务对象。
13.根据权利要求12所述的方法,
所述与所述对象集对应的输出条件包括下列条件中的任意一者或多者的组合:
所述对象集中的业务对象的数量达到预设的数量阈值;
所述对象集中的业务对象的数量的增量小于预设的数量阈值。
14.一种业务对象识别装置,包括:
模型调用模块,将特征样本集中,与业务对象相对应的业务特征,输入预先训练的机器学习模型,以根据所述机器学习模型的输出结果,确定所述业务特征对应的业务对象是否运营了预设业务;
添加模块,将运营了预设业务的业务对象添加至对象集,将运营了预设业务的业务对象对应的业务特征添加至数据集;
特征样本集更新模块,在预设的舆情数据库中搜索与所述数据集中的业务特征相关的舆情数据,并从搜索到的舆情数据中提取业务特征,将提取出的所述业务特征添加至所述特征样本集,以对所述特征样本集进行更新;
对象集更新模块,基于包含所述对象集中的各业务对象的业务关系网络,确定与所述对象集中的各业务对象存在业务关系的扩展业务对象,并将确定出的所述扩展业务对象添加至所述对象集,以得到更新后的所述对象集。
15.根据权利要求14所述的装置,
所述业务对象包括企业;所述预设业务包括现金管理业务。
16.根据权利要求15所述的装置,
所述现金管理业务包括现金贷款业务。
17.根据权利要求14所述的装置,所述业务特征包括与所述业务对象相关的业务图片的图片特征,和/或与所述业务对象相关的业务文本的文本特征。
18.根据权利要求17所述的装置,所述业务文本包括:
从与所述业务对象相关的业务图片中识别出的文本。
19.根据权利要求14所述的装置,
所述对象集更新模块,进一步:
根据所述对象集中的各业务对象的历史业务记录,构建业务关系网络;
将所述业务关系网络中,与所述对象集中的各业务对象存在业务关系的业务对象确定为扩展业务对象。
20.根据权利要求19所述的装置,
所述对象集更新模块,进一步:
通过所述业务关系网络,确定与所述对象集中的各业务对象存在业务关系的中间对象,并进一步将与所述中间对象存在业务关系的业务对象确定为扩展业务对象。
21.根据权利要求20所述的装置,
所述与所述中间对象存在业务关系的业务对象,包括:
与数量超过预设数量阈值的中间对象存在业务关系的业务对象。
22.根据权利要求14所述的装置,所述特征样本集更新模块进一步:
基于近义词挖掘算法,获取所述数据集中的业务特征的近义词,并将获取到的近义词与所述数据集中的业务特征作为搜索关键词,在预设的舆情数据库中搜索相关的舆情数据。
23.根据权利要求18所述的装置,
所述特征样本集更新模块进一步:
基于预设的文本识别算法,从搜索到的舆情数据中与业务对象相关的业务图片内,提取文本形式的业务特征。
24.根据权利要求14所述的装置,所述装置还包括:
相关数据补充模块,将确定出的所述扩展业务对象的相关数据添加至所述数据集中;所述相关数据包括下列任意一种或多种的组合:
确定出的所述扩展业务对象的名称;
确定出的所述扩展业务对象的别名;
确定出的所述扩展业务对象提供的产品的描述。
25.根据权利要求14所述的装置,所述装置还包括:
业务对象输出模块,确定是否满足与所述对象集对应的输出条件;如果是,输出所述对象集中的业务对象。
26.根据权利要求25所述的装置,
所述与所述对象集对应的输出条件包括下列条件中的任意一者或多者的组合:
所述对象集中的业务对象的数量达到预设的数量阈值;
所述对象集中的业务对象的数量的增量小于预设的数量阈值。
27.一种计算机设备,其至少包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行所述程序时实现权利要求1~13任一所述的方法。
CN202010450303.9A 2020-05-25 2020-05-25 一种业务对象识别方法及装置 Active CN111553487B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010450303.9A CN111553487B (zh) 2020-05-25 2020-05-25 一种业务对象识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010450303.9A CN111553487B (zh) 2020-05-25 2020-05-25 一种业务对象识别方法及装置

Publications (2)

Publication Number Publication Date
CN111553487A CN111553487A (zh) 2020-08-18
CN111553487B true CN111553487B (zh) 2021-04-27

Family

ID=72008573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010450303.9A Active CN111553487B (zh) 2020-05-25 2020-05-25 一种业务对象识别方法及装置

Country Status (1)

Country Link
CN (1) CN111553487B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112199337A (zh) * 2020-10-20 2021-01-08 支付宝(杭州)信息技术有限公司 一种证明文件处理方法、装置及设备
CN113127689B (zh) * 2021-04-30 2024-05-14 峥峰润洁科技(山西)股份有限公司 一种数据处理方法、装置、设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095435A (zh) * 2016-06-08 2016-11-09 联想(北京)有限公司 一种信息处理方法及电子设备
CN107273411A (zh) * 2017-05-03 2017-10-20 上海上讯信息技术股份有限公司 业务操作与数据库操作数据的关联方法及设备
CN109523153A (zh) * 2018-11-12 2019-03-26 平安科技(深圳)有限公司 非法集资企业的获取方法、装置、计算机设备和存储介质
CN109583890A (zh) * 2018-11-09 2019-04-05 阿里巴巴集团控股有限公司 异常交易对象的识别方法、装置及设备
CN109858965A (zh) * 2019-01-25 2019-06-07 上海基分文化传播有限公司 一种用户识别方法和系统
CN110135693A (zh) * 2019-04-12 2019-08-16 北京中科闻歌科技股份有限公司 一种风险识别方法、装置、设备及存储介质
CN110555107A (zh) * 2018-03-29 2019-12-10 阿里巴巴集团控股有限公司 确定业务对象主题、业务对象推荐的方法及装置
CN110619568A (zh) * 2019-09-17 2019-12-27 王文斌 风险评估报告的生成方法、装置、设备及存储介质
CN110706117A (zh) * 2019-08-22 2020-01-17 中国平安财产保险股份有限公司 业务处理方法、装置、计算机装置及存储介质
CN110930078A (zh) * 2019-12-31 2020-03-27 中国银行股份有限公司 一种业务对象识别方法、装置及设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10970796B2 (en) * 2018-02-17 2021-04-06 Constru Ltd System and method for hybrid processing of construction site images
CN110443666A (zh) * 2018-05-04 2019-11-12 阿里巴巴集团控股有限公司 信息处理方法、装置、终端及服务器
CN111126340B (zh) * 2019-12-31 2023-12-01 北京旷视科技有限公司 对象识别方法、装置、电子设备及计算机可读存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106095435A (zh) * 2016-06-08 2016-11-09 联想(北京)有限公司 一种信息处理方法及电子设备
CN107273411A (zh) * 2017-05-03 2017-10-20 上海上讯信息技术股份有限公司 业务操作与数据库操作数据的关联方法及设备
CN110555107A (zh) * 2018-03-29 2019-12-10 阿里巴巴集团控股有限公司 确定业务对象主题、业务对象推荐的方法及装置
CN109583890A (zh) * 2018-11-09 2019-04-05 阿里巴巴集团控股有限公司 异常交易对象的识别方法、装置及设备
CN109523153A (zh) * 2018-11-12 2019-03-26 平安科技(深圳)有限公司 非法集资企业的获取方法、装置、计算机设备和存储介质
CN109858965A (zh) * 2019-01-25 2019-06-07 上海基分文化传播有限公司 一种用户识别方法和系统
CN110135693A (zh) * 2019-04-12 2019-08-16 北京中科闻歌科技股份有限公司 一种风险识别方法、装置、设备及存储介质
CN110706117A (zh) * 2019-08-22 2020-01-17 中国平安财产保险股份有限公司 业务处理方法、装置、计算机装置及存储介质
CN110619568A (zh) * 2019-09-17 2019-12-27 王文斌 风险评估报告的生成方法、装置、设备及存储介质
CN110930078A (zh) * 2019-12-31 2020-03-27 中国银行股份有限公司 一种业务对象识别方法、装置及设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Multiple-Cue Object Recognition for Inter actionable Objects;Sarah Aboutalib;《ProQuest LLC》;20111231;全文 *
基于机器学习的商业银行客户关系管理的研究;王予辰;《中国优秀硕士学位论文全文数据库 经济与管理科学辑(月刊)》;20200115;第2020年卷(第01期);J152-1406 *
机器学习在银行对公客户管理中的应用;阮绍臣 等;《中国金融电脑》;20171231;第10卷;57-60 *

Also Published As

Publication number Publication date
CN111553487A (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
Ondrus et al. The impact of openness on the market potential of multi-sided platforms: a case study of mobile payment platforms
Anshari et al. Financial technology and disruptive innovation in business: Concept and application
CN109493199A (zh) 产品推荐方法、装置、计算机设备和存储介质
CN108885624B (zh) 信息推荐系统及方法
US10817804B1 (en) Using machine learning to predict user profile affinity based on behavioral data analytics
Vakulenko et al. Enriching iTunes App Store Categories via Topic Modeling.
CN110737811B (zh) 应用分类方法、装置以及相关设备
CN111553487B (zh) 一种业务对象识别方法及装置
Saleem et al. Data science and machine learning approach to improve E-commerce sales performance on social web
CN110020196B (zh) 一种基于不同数据源的用户分析方法和装置及计算设备
CN115238688A (zh) 电子信息数据关联关系分析方法、装置、设备和存储介质
CN111383072A (zh) 一种用户信用评分方法、存储介质及服务器
CN110858326A (zh) 模型训练及获取附加特征数据的方法、装置、设备及介质
CN114357184A (zh) 事项推荐方法及相关装置、电子设备和存储介质
KR20230058227A (ko) 선행 콘텐츠 추적 시스템
US11755958B1 (en) Systems and methods for detecting cryptocurrency wallet artifacts in a file system
WO2021093320A1 (zh) 用于输出信息的方法和装置
Shen et al. Big data overview
Aytaç et al. Analysis of digital marketing strategies of deposit banks in Turkey via text mining twitter posts
CN110163482B (zh) 确定活动方案的安全方案数据的方法、终端设备及服务器
CN114861829A (zh) 特征提取模型的训练方法、装置、设备、介质及程序产品
Mehrotra et al. Predictive power of online and offline behavior sequences: Evidence from a micro-finance context
KR20230068897A (ko) 인플루언서 영향력 분석 서비스 제공 방법
CN113780318A (zh) 用于生成提示信息的方法、装置、服务器和介质
CN111401641A (zh) 业务数据处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40035842

Country of ref document: HK