CN109801118A - 识别指定行业的制造业企业的方法、装置、介质和设备 - Google Patents

识别指定行业的制造业企业的方法、装置、介质和设备 Download PDF

Info

Publication number
CN109801118A
CN109801118A CN201811585278.4A CN201811585278A CN109801118A CN 109801118 A CN109801118 A CN 109801118A CN 201811585278 A CN201811585278 A CN 201811585278A CN 109801118 A CN109801118 A CN 109801118A
Authority
CN
China
Prior art keywords
enterprise
invoice
total amount
trade
target enterprise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811585278.4A
Other languages
English (en)
Inventor
杨海峰
任钦正
吴伟刚
潘竞旭
田宜喜
张玉魁
陈荣兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN201811585278.4A priority Critical patent/CN109801118A/zh
Publication of CN109801118A publication Critical patent/CN109801118A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本公开涉及一种识别指定行业的制造业企业的方法、装置、计算机可读存储介质和电子设备,涉及计算机技术领域,本公开的方法可以包括:获取发票数据库中的目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额;根据所述第一总金额占所述第二总金额的比例,识别所述目标企业是否是所述指定行业的制造业企业。根据本公开提供的一种应用在计算机上的识别制造业企业的方法,能够自动完成对发票数据库中的企业是否是指定行业的制造业的识别,因而可以提高识别效率。

Description

识别指定行业的制造业企业的方法、装置、介质和设备
技术领域
本公开涉及计算机技术领域,具体地,涉及一种识别指定行业的制造业企业的方法、装置、计算机可读存储介质和电子设备。
背景技术
制造业是指机械工业时代对制造资源(物料、能源、设备、工具、资金、技术、信息和人力等),按照市场要求,通过制造过程,转化为可供人们使用和利用的大型工具、工业品与生活消费产品的行业。
制造业直接体现了一个国家的生产力水平,是一切行业之母,是区别发展中国家和发达国家的重要因素,制造业在世界发达国家的国民经济中占有重要份额。
制造业企业作为其他所有类型企业的基础,经营数据(例如制造业指数)可以具体反映行业、地区或者国家的经济繁荣或萧条的情况。在获取制造业企业的数据前,需要对制造业企业进行识别,如何准确而便利的识别制造业企业成为重要的课题。
发明内容
本公开的目的是提供一种效率更高的识别指定行业的制造业企业的方法、装置、计算机可读存储介质和电子设备。
为了实现上述目的,本公开提供一种识别指定行业的制造业企业的方法,该方法包括:
获取发票数据库中的目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额;
根据所述第一总金额占所述第二总金额的比例,识别所述目标企业是否是所述指定行业的制造业企业。
可选地,所述根据所述第一总金额占所述第二总金额的比例,识别所述目标企业是否是所述指定行业的制造业企业,包括:
若所述第一总金额占所述第二总金额的比例大于预设的比例阈值,则识别所述目标企业是所述指定行业的制造业企业。
可选地,所述获取目标企业的指定行业发票的第一总金额,包括:
根据所述指定行业的发票代码确定所述目标企业的指定行业发票,进而确定所述第一总金额。
可选地,在所述获取目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额之前,所述方法还包括:
去除所述发票数据库中的无效发票;
确定保留下的各张发票对应的企业,形成企业名单;
从所述企业名单中确定所述目标企业。
可选地,在所述去除所述发票数据库中的无效发票之后,所述确定保留下的各张发票对应的企业,形成企业名单之前,所述方法还包括:
识别所述企业名单中的商贸企业;
从所述发票数据库去除所述商贸企业的发票。
可选地,所述识别所述企业名单中的商贸企业,包括:
对所述企业名单中的各企业的名称进行分词;
若企业名称的分词结果中包括预设的商贸企业的关键词,则识别对应企业为商贸企业。
可选地,所述目标企业的数量为多个;
所述获取发票数据库中的目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额,包括:通过分布式并行处理平台,获取各目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额;以及
所述根据所述第一总金额占所述第二总金额的比例,识别所述目标企业是否是所述指定行业的制造业企业,包括:通过所述分布式并行处理平台,根据所述第一总金额占所述第二总金额的比例,识别各目标企业是否是所述指定行业的制造业企业。
本公开提供一种识别指定行业的制造业企业的装置,该装置包括:
获取模块,用于获取发票数据库中的目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额;
处理器,与所述获取模块相连,用于根据所述第一总金额占所述第二总金额的比例,识别所述目标企业是否是所述指定行业的制造业企业。
可选地,所述处理器,包括:
识别模块,用于若所述第一总金额占所述第二总金额的比例大于预设的比例阈值,则识别所述目标企业是所述指定行业的制造业企业。
可选地,所述获取模块,包括:
第一确定子模块,用于根据所述指定行业的发票代码确定所述目标企业的指定行业发票,进而确定所述第一总金额。
可选地,所述装置,还包括:
第一去除模块,用于去除所述发票数据库中的无效发票;
第一确定模块,用于确定保留下的各张发票对应的企业,形成企业名单;
第二确定模块,用于从所述企业名单中确定所述目标企业。
可选地,所述装置,还包括:
识别模块,用于识别所述企业名单中的商贸企业;
第二去除模块,用于从所述发票数据库去除所述商贸企业的发票。
可选地,所述识别模块,还包括:
分词子模块,用于对所述企业名单中的各企业的名称进行分词;
第二确定子模块,用于若企业名称的分词结果中包括预设的商贸企业的关键词,则识别对应企业为商贸企业。
可选地,所述目标企业的数量为多个;
所述获取模块包括分布式获取子模块,用于通过分布式并行处理平台,获取各目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额;以及
所述处理器包括分布式处理子模块,用于通过所述分布式并行处理平台,根据所述第一总金额占所述第二总金额的比例,识别各目标企业是否是所述指定行业的制造业企业。
本公开提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开提供的上述方法的步骤。
本公开提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现本公开提供的上述方法的步骤。
根据本公开提供的方法、装置、计算机存储介质和电子设备,能够自动完成对发票数据库中的企业是否是指定行业的制造业企业的识别,因而可以提高识别制造业企业的效率。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是本公开一实施例提供的识别指定行业的制造业企业的方法的流程图;
图2是本公开一实施例提供的识别指定行业的制造业企业的装置的框图;
图3是本公开一实施例示出的一种识别指定行业的制造业企业的电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
图1是本公开一实施例提供的识别指定行业的制造业企业的方法的流程图。如图1所示,该方法可以包括以下步骤:
步骤101,获取发票数据库中的目标企业的指定行业发票的第一总金额和目标企业的所有发票的第二总金额。
步骤102,根据第一总金额占第二总金额的比例,识别目标企业是否是指定行业的制造业企业。
具体地,发票数据库可以是直接存放在基于Hadoop分布式系统基础架构的HIVE数据库中。发票数据库也可以是原本存放在传统关系型Oracle数据库中,通过SQOOP工具从Oracle数据库将发票数据库抽取出来,再存放在Hadoop的HIVE数据库中。
发票数据库中的内容可以包括发票数据表、发票明细表和企业信息维表。其中,发票数据表可以包括每个发票的总金额。发票明细表可以包括每个发票的发票代码和每个发票中交易的具体商品的详细情况(例如,名称、数量、金额)。每个发票的发票代码前几位代表了发票类型。例如,发票代码10302代表的是食品发票。企业信息维度表中可以包括发票购销双方的企业名称。
发票数据表、发票明细表和企业信息维度表中同一个发票的信息可以存在映射关系。例如,用发票明细表中的A发票的发票代码,可以在企业信息维度表中查到A发票的购销双方的企业名称,还可以在发票数据表中查到A发票的总金额。
该实施例的方法由于能够自动完成对发票数据库中的企业是否是指定行业的制造业企业的识别,因而可以提高识别制造业企业的效率。
在又一实施例中,在图1的基础上,步骤101可以包括:根据指定行业的发票代码确定目标企业的指定行业发票,进而确定第一总金额。
具体地,以确定目标企业的食品行业发票的第一总金额为例,可以收集目标企业中所有的发票代码前五位为10302的食品发票,并计算出所有的食品发票的总金额(第一总金额)。
该实施例中,通过发票代码准确地确定目标企业的指定行业的发票,进而准确确定目标企业的指定行业的发票总金额,因而可以更准确地识别目标企业是否是指定行业的制造业企业。
在又一实施例中,步骤102可以包括:若第一总金额占第二总金额的比例大于预设的比例阈值,则识别目标企业是指定行业的制造业企业。
其中,比例阈值可以来自网上数据,或者由用户自行确定。比例阈值可以为50%。
该实施例,基于图1的实施例,由于通过指定行业内发票金额占总发票金额比重的经验数据识别企业是否是指定行业的制造业企业,因此能够更准确地识别企业是否是指定行业的制造业企业。
在又一实施例中,在识别目标企业是否为制造业企业之前,可以对HIVE数据库中的发票数据库进行除去无效发票的处理,减少需要识别的企业的数量。该实施例中,在图1的基础上,在步骤101之前,该方法还可以包括以下步骤:去除发票数据库中的无效发票;确定保留下的各张发票对应的企业,形成企业名单;从企业名单中确定目标企业。
该实施例中,由于能够去除发票数据库中因信息不完整而无效的发票,因而能够更准确地识别企业是否是指定行业的制造业企业。另外,根据去除无效发票后的数据库生成企业名单,只识别名单中的企业,能够避免做不必要的数据处理,提高效率。
无效发票根据无效原因可以分为三种:
(1)信息不完整
信息不完整可以包括但不限于下列信息不完整:购销双方或一方的企业名称、发票总金额、发票代码、商品名称、发票开具时间等。
(2)发票总金额为负数
(3)发票中商品价格为负数
具体地,可以在Spark处理平台下编写Scala语句设定抽取规则,对HIVE数据库进行抽取转换加载(ETL,Extract-Transform-Load)处理:从HIVE数据库中的发票数据库中抽取出信息完整,并且金额都为正数的发票形成新的发票数据库。将老版本的存储在HIVE数据库中的发票数据库去除,将抽取出来的新的发票数据库存储在HIVE数据库中,作为数据库。
在又一实施例中,在图1的基础上,在去除发票数据库中的无效发票之后,确定保留下的各张发票对应的企业,形成企业名单之前,该方法还包括:
识别企业名单中的商贸企业;从发票数据库去除商贸企业的发票。
该实施例中,由于能够从用于抽取目标企业的企业名单中去除商贸企业,因此能够减少商贸企业被误判为制造业企业的可能性,提高识别制造业企业的准确率。
识别企业名单中的商贸企业可以有多种方法:
1、人工识别
2、根据商贸企业的关键词识别
又提供一种实施例,该实施例中识别企业名单中的商贸企业的步骤可以包括:对企业名单中的各企业的名称进行分词;若企业名称的分词结果中包括预设的商贸企业的关键词,则识别对应企业为商贸企业。
对企业名称进行分词,即将企业名称分成单独的单词,即分词结果。例如,“旺旺食品贸易公司”可以分为“旺旺”、“食品”、“贸易”、“公司”。
商贸公司的关键词可以包括但不限于下列词汇:“贸易”、“商贸”、“超市”、“化工”、“电子”、“管理”、“商务”、“医药”、“商行”、“销售”、“副食品”、“部”、“实业”等等。
分词结果如果出现一个或者多个商贸公司的关键词,则可以识别该企业为商贸企业。
本实施例可以利用Spark处理平台编写程序设定规则,抽取商贸企业以外的其他企业的发票,汇总起来形成新的发票数据库。
该实施例,由于提出了一种识别企业是否是商贸企业的有效方法,因此能够更准确地识别企业是否是商贸企业,因而降低了商贸企业被误判为制造业企业的可能性,进而增加识别企业是否是制造业企业的准确率。
又提供一种实施例,该实施例中,目标企业的数量为多个。并且,步骤101包括:通过分布式并行处理平台,获取各目标企业的指定行业发票的第一总金额和目标企业的所有发票的第二总金额。并且,步骤102包括:通过分布式并行处理平台,根据第一总金额占第二总金额的比例,识别各目标企业是否是指定行业的制造业企业。
本实施例可以利用Spark分布式处理平台,在同一时刻并行识别HIVE数据库中的发票数据库中多个目标企业是否是制造业企业。
该实施例,由于能够并行识别发票对应的所有企业是否是制造业企业,因此比依次单独识别,减少识别的时间,效率更高。
基于相同的发明构思,本公开还提供一种识别指定行业的制造业企业的装置。图2是本公开一实施例提供的识别指定行业的制造业企业的装置的框图。如图2所示,该实施例提供的装置包括获取模块201和处理器202。
获取模块201用于获取发票数据库中的目标企业的指定行业发票的第一总金额和目标企业的所有发票的第二总金额。
处理器202与获取模块201相连,用于根据第一总金额占第二总金额的比例,识别目标企业是否是指定行业的制造业企业。
可选地,处理器202包括识别子模块。
识别子模块用于若第一总金额占第二总金额的比例大于预设的比例阈值,则识别目标企业是指定行业的制造业企业。
可选地,获取模块201包括第一确定子模块。
第一确定子模块用于根据指定行业的发票代码确定目标企业的指定行业发票,进而确定第一总金额。
可选地,装置还包括第一去除模块、第一确定模块和第二确定模块。
第一去除模块用于去除发票数据库中的无效发票。
第一确定模块用于确定保留下的各张发票对应的企业,形成企业名单。
第二确定模块用于从企业名单中确定目标企业。
可选地,装置还包括识别模块和第二去除模块。
识别模块用于识别企业名单中的商贸企业。
第二去除模块用于从发票数据库去除商贸企业的发票。
可选地,识别模块还包括分词子模块和第二确定子模块。
分词子模块用于对企业名单中的各企业的名称进行分词。
第二确定子模块用于若企业名称的分词结果中包括预设的商贸企业的关键词,则识别对应企业为商贸企业。
可选地,目标企业的数量为多个。
获取模块201包括分布式获取子模块,用于通过分布式并行处理平台,获取各目标企业的指定行业发票的第一总金额和目标企业的所有发票的第二总金额。
处理器202包括分布式处理子模块,用于通过分布式并行处理平台,根据第一总金额占第二总金额的比例,识别各目标企业是否是指定行业的制造业企业。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开提供的上述方法的步骤。
本公开提供一种电子设备,包括存储器和处理器。
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现本公开提供的上述方法的步骤。
图3是本公开一实施例示出的一种识别指定行业的制造业企业的电子设备的框图。例如,电子设备300可以被提供为一服务器。参照图3,电子设备300包括处理器322,其数量可以为一个或多个,以及存储器332,用于存储可由处理器322执行的计算机程序。存储器332中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理器322可以被配置为执行该计算机程序,以执行上述的识别指定行业的制造业企业方法。
另外,电子设备300还可以包括电源组件326和通信组件350,该电源组件326可以被配置为执行电子设备300的电源管理,该通信组件350可以被配置为实现电子设备300的通信,例如,有线或无线通信。此外,该电子设备300还可以包括输入/输出(I/O)接口358。电子设备300可以操作基于存储在存储器332的操作系统,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM等等。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的识别指定行业的制造业企业方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器332,上述程序指令可由电子设备300的处理器322执行以完成上述的识别指定行业的制造业企业方法。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

Claims (16)

1.一种识别指定行业的制造业企业的方法,其特征在于,包括:
获取发票数据库中的目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额;
根据所述第一总金额占所述第二总金额的比例,识别所述目标企业是否是所述指定行业的制造业企业。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一总金额占所述第二总金额的比例,识别所述目标企业是否是所述指定行业的制造业企业,包括:
若所述第一总金额占所述第二总金额的比例大于预设的比例阈值,则识别所述目标企业是所述指定行业的制造业企业。
3.根据权利要求1所述的方法,其特征在于,所述获取目标企业的指定行业发票的第一总金额,包括:
根据所述指定行业的发票代码确定所述目标企业的指定行业发票,进而确定所述第一总金额。
4.根据权利要求1所述的方法,其特征在于,在所述获取目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额之前,所述方法还包括:
去除所述发票数据库中的无效发票;
确定保留下的各张发票对应的企业,形成企业名单;
从所述企业名单中确定所述目标企业。
5.根据权利要求4所述的方法,其特征在于,在所述去除所述发票数据库中的无效发票之后,所述确定保留下的各张发票对应的企业,形成企业名单之前,所述方法还包括:
识别所述企业名单中的商贸企业;
从所述发票数据库去除所述商贸企业的发票。
6.根据权利要求5所述的方法,其特征在于,所述识别所述企业名单中的商贸企业,包括:
对所述企业名单中的各企业的名称进行分词;
若企业名称的分词结果中包括预设的商贸企业的关键词,则识别对应企业为商贸企业。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述目标企业的数量为多个;
所述获取发票数据库中的目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额,包括:通过分布式并行处理平台,获取各目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额;以及
所述根据所述第一总金额占所述第二总金额的比例,识别所述目标企业是否是所述指定行业的制造业企业,包括:通过所述分布式并行处理平台,根据所述第一总金额占所述第二总金额的比例,识别各目标企业是否是所述指定行业的制造业企业。
8.一种识别指定行业的制造业企业的装置,其特征在于,包括:
获取模块,用于获取发票数据库中的目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额;
处理器,与所述获取模块相连,用于根据所述第一总金额占所述第二总金额的比例,识别所述目标企业是否是所述指定行业的制造业企业。
9.根据权利要求8所述的装置,其特征在于,所述处理器包括:
识别子模块,用于若所述第一总金额占所述第二总金额的比例大于预设的比例阈值,则识别所述目标企业是所述指定行业的制造业企业。
10.根据权利要求8所述的装置,其特征在于,所述获取模块包括:
第一确定子模块,用于根据所述指定行业的发票代码确定所述目标企业的指定行业发票,进而确定所述第一总金额。
11.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第一去除模块,用于去除所述发票数据库中的无效发票;
第一确定模块,用于确定保留下的各张发票对应的企业,形成企业名单;
第二确定模块,用于从所述企业名单中确定所述目标企业。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
识别模块,用于识别所述企业名单中的商贸企业;
第二去除模块,用于从所述发票数据库去除所述商贸企业的发票。
13.根据权利要求12所述的装置,其特征在于,所述识别模块还包括:
分词子模块,用于对所述企业名单中的各企业的名称进行分词;
第二确定子模块,用于若企业名称的分词结果中包括预设的商贸企业的关键词,则识别对应企业为商贸企业。
14.根据权利要求8-13中任一项所述的装置,其特征在于,所述目标企业的数量为多个;
所述获取模块包括分布式获取子模块,用于通过分布式并行处理平台,获取各目标企业的指定行业发票的第一总金额和所述目标企业的所有发票的第二总金额;以及
所述处理器包括分布式处理子模块,用于通过所述分布式并行处理平台,根据所述第一总金额占所述第二总金额的比例,识别各目标企业是否是所述指定行业的制造业企业。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。
16.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-7中任一项所述方法的步骤。
CN201811585278.4A 2018-12-24 2018-12-24 识别指定行业的制造业企业的方法、装置、介质和设备 Pending CN109801118A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811585278.4A CN109801118A (zh) 2018-12-24 2018-12-24 识别指定行业的制造业企业的方法、装置、介质和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811585278.4A CN109801118A (zh) 2018-12-24 2018-12-24 识别指定行业的制造业企业的方法、装置、介质和设备

Publications (1)

Publication Number Publication Date
CN109801118A true CN109801118A (zh) 2019-05-24

Family

ID=66557515

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811585278.4A Pending CN109801118A (zh) 2018-12-24 2018-12-24 识别指定行业的制造业企业的方法、装置、介质和设备

Country Status (1)

Country Link
CN (1) CN109801118A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336983A (zh) * 2013-06-08 2013-10-02 上海电机学院 基于条形码的票据生成系统及其识别方法
CN106095759A (zh) * 2016-06-20 2016-11-09 西安交通大学 一种基于启发式规则的发票货物归类方法
US20170270526A1 (en) * 2016-03-15 2017-09-21 Hrb Innovations, Inc. Machine learning for fraud detection
CN107357851A (zh) * 2017-06-28 2017-11-17 国信优易数据有限公司 一种信息处理方法和系统
CN107463616A (zh) * 2017-07-03 2017-12-12 上海凡响网络科技有限公司 一种企业信息分析方法及系统
CN107944480A (zh) * 2017-11-16 2018-04-20 广州探迹科技有限公司 一种企业行业分类方法
CN108171276A (zh) * 2018-01-17 2018-06-15 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN108242020A (zh) * 2016-12-26 2018-07-03 航天信息股份有限公司 一种计算进项和销项物品列表之间差异度的方法及系统
CN108268880A (zh) * 2016-12-30 2018-07-10 航天信息股份有限公司 一种行业类别的识别方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103336983A (zh) * 2013-06-08 2013-10-02 上海电机学院 基于条形码的票据生成系统及其识别方法
US20170270526A1 (en) * 2016-03-15 2017-09-21 Hrb Innovations, Inc. Machine learning for fraud detection
CN106095759A (zh) * 2016-06-20 2016-11-09 西安交通大学 一种基于启发式规则的发票货物归类方法
CN108242020A (zh) * 2016-12-26 2018-07-03 航天信息股份有限公司 一种计算进项和销项物品列表之间差异度的方法及系统
CN108268880A (zh) * 2016-12-30 2018-07-10 航天信息股份有限公司 一种行业类别的识别方法及装置
CN107357851A (zh) * 2017-06-28 2017-11-17 国信优易数据有限公司 一种信息处理方法和系统
CN107463616A (zh) * 2017-07-03 2017-12-12 上海凡响网络科技有限公司 一种企业信息分析方法及系统
CN107944480A (zh) * 2017-11-16 2018-04-20 广州探迹科技有限公司 一种企业行业分类方法
CN108171276A (zh) * 2018-01-17 2018-06-15 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置

Similar Documents

Publication Publication Date Title
CN109635117A (zh) 一种基于知识图谱识别用户意图方法及装置
CN106529968A (zh) 一种基于交易数据的客户分类方法及其系统
CN104915879A (zh) 基于金融数据的社会关系挖掘的方法及装置
CN115391669B (zh) 一种智能推荐方法、装置、电子设备
CN113449187A (zh) 基于双画像的产品推荐方法、装置、设备及存储介质
CN112801498A (zh) 风险识别模型的训练方法、风险识别方法、装置及设备
CN105913235A (zh) 一种客户转账关系分析方法及系统
CN110458644A (zh) 一种信息处理方法及相关设备
CN113886708A (zh) 基于用户信息的产品推荐方法、装置、设备及存储介质
CN114240672B (zh) 绿色资产的占比的识别方法及相关产品
CN114626731A (zh) 风险识别方法、装置、电子设备及计算机可读存储介质
CN109739992A (zh) 一种获取关联信息的方法及终端
Shaohui et al. Customer transaction fraud detection using random forest
CN114756669A (zh) 问题意图的智能分析方法、装置、电子设备及存储介质
CN112835910A (zh) 一种企业信息与政策信息的处理方法和装置
CN107527289A (zh) 一种投资组合行业配置方法、装置、服务器和存储介质
CN109801118A (zh) 识别指定行业的制造业企业的方法、装置、介质和设备
CN112330328A (zh) 一种基于特征提取的信用卡欺诈检测方法
CN109635289A (zh) 词条分类方法及审计信息抽取方法
CN114708073A (zh) 一种围标串标智能检测方法、装置、电子设备及存储介质
CN113298530A (zh) 基于行情数据分类的交易配置方法、装置、设备及介质
CN113849618A (zh) 基于知识图谱的策略确定方法、装置、电子设备及介质
CN111242318B (zh) 基于异构特征库的业务模型训练方法及装置
CN113486145B (zh) 基于网络节点的用户咨询回复方法、装置、设备及介质
Lee et al. An Integral Predictive Model of Financial Distress

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190524

RJ01 Rejection of invention patent application after publication