CN111027854A - 一种基于企业大数据的综合画像指数生成方法及相关设备 - Google Patents

一种基于企业大数据的综合画像指数生成方法及相关设备 Download PDF

Info

Publication number
CN111027854A
CN111027854A CN201911255623.2A CN201911255623A CN111027854A CN 111027854 A CN111027854 A CN 111027854A CN 201911255623 A CN201911255623 A CN 201911255623A CN 111027854 A CN111027854 A CN 111027854A
Authority
CN
China
Prior art keywords
enterprise
information
dimension
processing
processing result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911255623.2A
Other languages
English (en)
Inventor
张炫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Shake Big Data Co Ltd
Original Assignee
Chongqing Shake Big Data Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Shake Big Data Co Ltd filed Critical Chongqing Shake Big Data Co Ltd
Priority to CN201911255623.2A priority Critical patent/CN111027854A/zh
Publication of CN111027854A publication Critical patent/CN111027854A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于企业大数据的综合画像指数生成方法及相关设备,所述方法包括如下步骤:获取企业相关信息;对企业相关信息进行企业相关维度信息预处理以获取第一处理结果;对企业相关信息进行企业标签信息预处理以获取第二处理结果;根据预设算法处理第一处理结果和第二处理结果以生成综合画像指数。本发明根据分类后的数据创建企业画像,完整、全方位地刻画了企业信息,使创建的企业画像更加全面,更加客观。

Description

一种基于企业大数据的综合画像指数生成方法及相关设备
技术领域
本发明涉及画像库构建技术领域,尤其涉及一种基于企业大数据的综 合画像指数生成方法及相关设备。
背景技术
随着大数据时代的来临,企业画像的概念应运而生。所谓企业画像, 就是将描述企业状态及行为的信息标签化,基于与企业状态及行为信息相 关的数据为企业“贴”标签,从而刻画出企业全貌。
现有的企业画像方案大多是以财务数据为基础对企业进行画像,然 而,财务数据无法全面、清楚且准确地反映企业经营行为及状态,同时追 溯财务数据的动态变动成本较高,中小企业的财务数据还存在完整性、可 信性不高等数据风险,因而现有以财务数据为基础的企业画像方案所提供 的企业画像存在准确性和可靠性较低的问题,无法满足用户快速准确了解 企业的需求。
发明内容
本发明针对现有方式的缺点,提出一种基于企业大数据的综合画像指 数生成方法及相关设备,用以解决现有技术存在的上述问题。
根据本发明的第一个方面,提供了一种基于企业大数据的综合画像指 数生成方法,包括如下步骤:
获取企业相关信息;
对所述企业相关信息进行企业相关维度信息预处理以获取第一处理 结果;
对所述企业相关信息进行企业标签信息预处理以获取第二处理结果;
根据预设算法处理所述第一处理结果和第二处理结果以生成综合画 像指数。
进一步地,所述对所述企业相关信息进行企业相关维度信息预处理以 获取第一处理结果,包括:
以工商基础信息为主体,采集与企业相关的、预设的维度信息,所述 维度信息包括专利、商标、认证认可、企业标准、中标、招聘、创投、舆 情、百度竞价、百科介绍、ICP备案各维度信息;
将各维度信息与工商基础信息的企业编码建立关系;
对各维度信息进行归纳统计处理与存储。
进一步地,所述对所述企业相关信息进行企业标签信息预处理以获取 第二处理结果,包括:
基于文本分析,提取工商基础及企业相关的各维度信息中出现的高频 词,统一存储到企业标签库;
或将用户搜索的关键词作为企业标签存储到企业标签库;
或人工预先定义的企业标签信息。
进一步地,所述根据预设算法处理所述第一处理结果和第二处理结果 以生成综合画像指数,包括:
在每个维度中预先设置若干个特征及对应的系数、给每个维度设置一 个权重;
通过关键词在每个维度以及每个维度下的特征查找命中率;
将命中维度的权重以及维度特征对应的系数相乘,最后取出加权和, 生成综合画像指数。
进一步地,所述根据预设算法处理所述第一处理结果和第二处理结果 以生成综合画像指数之后,还包括:
在用户查看企业画像时,通过令牌验证并获取用户输入或选择的预设 关键词,生成综合画像指数。
进一步地,所述根据预设算法处理所述第一处理结果和第二处理结果 以生成综合画像指数,是指:
通过关键词匹配工商基础及各相关维度的特征信息;
获取各个匹配的特征信息对应的系数,记为p;
获取各个维度的权重,记为q;
计算综合画像指数:∑pq。
另一方面,本发明提供了一种基于企业大数据的综合画像指数生成装 置,包括:
获取模块,用于获取企业相关信息;
第一处理模块,用于对所述企业相关信息进行企业相关维度信息预处 理以获取第一处理结果;
第二处理模块,用于对所述企业相关信息进行企业标签信息预处理以 获取第二处理结果;
计算模块,用于根据预设算法处理所述第一处理结果和第二处理结果 以生成综合画像指数。
进一步地,所述计算模块包括:
匹配单元,用于通过关键词匹配工商基础及各相关维度的特征信息;
第一确定单元,用于获取各个匹配的特征信息对应的系数,记为p;
第二确定单元,用于获取各个维度的权重,记为q;
生成单元,用于计算综合画像指数:∑pq。
第三方面,本发明提供了一种计算机设备,所述计算机设备包括存储 器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算 机程序时实现如上所述中任一项所述的综合画像指数生成方法。
第四方面,本发明提供了一种存储介质,所述存储介质存储有计算机 程序,所述计算机程序被处理器执行时可实现如上所述中任一项所述的综 合画像指数生成方法。
与现有技术相比,本发明的有益效果是:
本发明采集企业相关维度信息后,进行相应的预处理,可以去除一些无 用的、无效的、重复的数据等等;然后对维度信息进行分类,再和工商基础 信息进行匹配,以便于匹配后的数据同样是分类存储的;根据分类后的数据 创建企业画像,完整、全方位地刻画了企业信息,使创建的企业画像更加全 面,更加客观。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的 描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描 述中将变得明显和容易理解,其中:
图1为本发明实施例一中的一种基于企业大数据的综合画像指数生 成方法的流程示意图;
图2为本发明实施例二中的一种基于企业大数据的综合画像指数生 成装置的结构示意图;
图3为本发明实施例二中的一种基于企业大数据的综合画像指数生 成装置设置在手机上时,手机的部分结构框图;
图4为本发明实施例三中的一种计算机设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明 实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
在本发明的说明书和权利要求书及上述附图中的描述的一些流程中, 包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以 不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102 等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。 另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执 行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是 用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一” 和“第二”是不同的类型。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进 行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分例,实 施而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有 作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范 围。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语 (包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员 的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术 语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除 非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
在互联网得到普及应用的情况下,大数据时代已经正式到来。“大数 据”也被称为巨量资料,它指网上图像、文本、音频和视频等数据所涉及 的资料总体量规模巨大,无法用目前的常用普通软件等处理工具在合理时 间内进行处理,也无法整理成为对用户有价值的资讯。也就是说,大数据 具有四个特征,体量巨大、信息密度低、数据类型多、要求的处理速度快。 大数据时代,信息呈爆炸式增长,目前,互联网上的数据每年都会增长 50%。在这种时代背景下,用户对于信息的需求以及市场趋势等都在不断 发展和变化,传统的企业信息分析方法已经无法高效完成。
实施例一
如图1所示,提供了本发明一个实施例的一种基于企业大数据的综合 画像指数生成方法,包括如下步骤:
S101获取企业相关信息,企业相关信息包括:产品数据、生产组织 数据、工艺数据、生产信息、企业基础信息、企业征信信息、企业标签信 息、企业发展历程信息、企业关系图谱信息、企业专题属性信息、经营产 品信息、产品库存信息以及客户信息;
S102对企业相关信息进行企业相关维度信息预处理以获取第一处理 结果;
预处理操作包括收集操作、整理操作以及清洗操作;这里主要是将信 息Excel数据表化,再利用java程序或Sqoop工具将结构化的Excel数据 表提取相关信息。
对企业相关信息进行企业相关维度信息预处理以获取第一处理结果, 包括:
以工商基础信息为主体,采集与企业相关的、预设的维度信息,维度 信息包括专利、商标、认证认可、企业标准、中标、招聘、创投、舆情、 百度竞价、百科介绍、ICP备案各维度信息;
将各维度信息与工商基础信息的企业编码建立关系,主要是一种映射 关系;
各维度信息与工商基础信息的企业编码的关系如下:
各维度信息 工商基础信息的企业编码 关系
专利 00001 10001
商标 00002 10010
认证认可 00003 10011
企业标准 00004 10100
中标 00005 10101
招聘 00006 10110
创投 00007 10111
舆情 00008 11000
百度竞价 00009 11001
百科介绍 00010 11010
ICP备 00011 11011
对各维度信息进行归纳统计处理与存储。
S103对企业相关信息进行企业标签信息预处理以获取第二处理结果;
对企业相关信息进行企业标签信息预处理以获取第二处理结果,包 括:
基于文本分析,提取工商基础及企业相关的各维度信息中出现的高频 词,统一存储到企业标签库;
文本分析法是指从文本的表层深入到文本的深层,从而发现那些不能 为普通阅读所把握的深层意义。
或将用户搜索的关键词作为企业标签存储到企业标签库;
或人工预先定义的企业标签信息。
S104根据预设算法处理第一处理结果和第二处理结果以生成综合画 像指数。
根据预设算法处理第一处理结果和第二处理结果以生成综合画像指 数,包括:
在每个维度中预先设置若干个特征及对应的系数、给每个维度设置一 个权重;
通过关键词在每个维度以及每个维度下的特征查找命中率;
将命中维度的权重以及维度特征对应的系数相乘,最后取出加权和, 生成综合画像指数。
根据预设算法处理第一处理结果和第二处理结果以生成综合画像指 数之后,还包括:
在用户查看企业画像时,通过令牌验证并获取用户输入或选择的预设 关键词,生成综合画像指数。
根据预设算法处理第一处理结果和第二处理结果以生成综合画像指 数,是指:
通过关键词匹配工商基础及各相关维度的特征信息;
获取各个匹配的特征信息对应的系数,记为p;
获取各个维度的权重,记为q;
计算综合画像指数:∑pq。
本发明采集企业相关维度信息后,进行相应的预处理,可以去除一些无 用的、无效的、重复的数据等等;然后对维度信息进行分类,再和工商基础 信息进行匹配,以便于匹配后的数据同样是分类存储的;根据分类后的数据 创建企业画像,完整、全方位地刻画了企业信息,使创建的企业画像更加全 面,更加客观。
实施例二
如图2所示,提供了本发明一个实施例的一种基于企业大数据的综合 画像指数生成装置,包括:
获取模块A201,用于获取企业相关信息,企业相关信息包括:产品 数据、生产组织数据、工艺数据、生产信息、企业基础信息、企业征信信 息、企业标签信息、企业发展历程信息、企业关系图谱信息、企业专题属 性信息、经营产品信息、产品库存信息以及客户信息;
第一处理模块A202,用于对企业相关信息进行企业相关维度信息预 处理以获取第一处理结果;
预处理操作包括收集操作、整理操作以及清洗操作;
对企业相关信息进行企业相关维度信息预处理以获取第一处理结果, 包括:
以工商基础信息为主体,采集与企业相关的、预设的维度信息,维度 信息包括专利、商标、认证认可、企业标准、中标、招聘、创投、舆情、 百度竞价、百科介绍、ICP备案各维度信息;
将各维度信息与工商基础信息的企业编码建立关系;
各维度信息与工商基础信息的企业编码的关系如下:
各维度信息 工商基础信息的企业编码 关系
专利 00001 10001
商标 00002 10010
认证认可 00003 10011
企业标准 00004 10100
中标 00005 10101
招聘 00006 10110
创投 00007 10111
舆情 00008 11000
百度竞价 00009 11001
百科介绍 00010 11010
ICP备 00011 11011
对各维度信息进行归纳统计处理与存储。
第二处理模块A203,用于对企业相关信息进行企业标签信息预处理 以获取第二处理结果;
对企业相关信息进行企业标签信息预处理以获取第二处理结果,包 括:
基于文本分析,提取工商基础及企业相关的各维度信息中出现的高频 词,统一存储到企业标签库;
或将用户搜索的关键词作为企业标签存储到企业标签库;
或人工预先定义的企业标签信息。
计算模块A204,用于根据预设算法处理第一处理结果和第二处理结 果以生成综合画像指数。
根据预设算法处理第一处理结果和第二处理结果以生成综合画像指 数,包括:
在每个维度中预先设置若干个特征及对应的系数、给每个维度设置一 个权重;
通过关键词在每个维度以及每个维度下的特征查找命中率;
将命中维度的权重以及维度特征对应的系数相乘,最后取出加权和, 生成综合画像指数。
根据预设算法处理第一处理结果和第二处理结果以生成综合画像指 数之后,还包括:
在用户查看企业画像时,通过令牌验证并获取用户输入或选择的预设 关键词,生成综合画像指数。
计算模块A204包括:
匹配单元,用于通过关键词匹配工商基础及各相关维度的特征信息;
第一确定单元,用于获取各个匹配的特征信息对应的系数,记为p;
第二确定单元,用于获取各个维度的权重,记为q;
生成单元,用于计算综合画像指数:∑pq。
如图3所示,该装置可设置在包括手机、平板电脑、PDA(Personal DigitalAssistant,个人数字助理)、POS(Point of Sales,销售终端)、车 载电脑等任意终端设备上,以终端为手机为例:
参考图3,手机的部分结构的框图,手机包括:射频(Radio Frequency, RF)电路1510、存储器1520、输入单元1530、显示单元1540、传感器 1550、音频电路1560、无线保真(wireless fidelity,WiFi)模块1570、处 理器1580、以及电源1590等部件。本领域技术人员可以理解,图3中示 出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部 件,或者组合某些部件,或者不同的部件布置。
下面结合图3对手机的各个构成部件进行具体的介绍:
RF电路1510可用于收发信息或通话过程中,信号的接收和发送,特 别地,将基站的下行信息接收后,给处理器1580处理;另外,将设计上 行的数据发送给基站。通常,RF电路1510包括但不限于天线、至少一个 放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,LNA)、 双工器等。此外,RF电路1510还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动 通讯系统(Global System of Mobile communication,GSM)、通用分组无 线服务(General PacketRadio Service,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、 短消息服务(Short Messaging Service,SMS)等。
存储器1520可用于存储软件程序以及模块,处理器1580通过运行存 储在存储器1520的软件程序以及模块,从而执行手机的各种功能应用以 及数据处理。存储器1520可主要包括存储程序区和存储数据区,其中, 存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播 放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建 的数据(比如音频数据、电话本等)等。此外,存储器1520可以包括高 速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储 器件、闪存器件、或其他易失性固态存储器件。
输入单元1530可用于接收输入的数字或字符信息,以及产生与手机 的用户设置以及功能控制有关的键信号输入。具体地,输入单元1530可 包括触控面板1531以及其他输入设备1532。触控面板1531,也称为触摸 屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任 何适合的物体或附件在触控面板1531上或在触控面板1531附近的操作), 并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1531可 包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户 的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触 摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送 给处理器1580,并能接收处理器1580发来的命令并加以执行。此外,可 以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1531。除了触控面板1531,输入单元1530还可以包括其他输入设备1532。 具体地,其他输入设备1532可以包括但不限于物理键盘、功能键(比如 音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1540可用于显示由用户输入的信息或提供给用户的信息以 及手机的各种菜单。显示单元1540可包括显示面板1541,可选的,可以 采用液晶显示器(LiquidCrystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1541。进一步的,触 控面板1531可覆盖显示面板1541,当触控面板1531检测到在其上或附 近的触摸操作后,传送给处理器1580以确定触摸事件的类型,随后处理器1580根据触摸事件的类型在显示面板1541上提供相应的视觉输出。虽 然在图3中,触控面板1531与显示面板1541是作为两个独立的部件来实 现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1531 与显示面板1541集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器1550,比如光传感器、运动传感器以 及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其 中,环境光传感器可根据环境光线的明暗来调节显示面板1541的亮度, 接近传感器可在手机移动到耳边时,关闭显示面板1541和/或背光。作为 运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速 度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应 用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能 (比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、 温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1560、扬声器1561,传声器1562可提供用户与手机之间的 音频接口。音频电路1560可将接收到的音频数据转换后的电信号,传输 到扬声器1561,由扬声器1561转换为声音信号输出;另一方面,传声器 1562将收集的声音信号转换为电信号,由音频电路1560接收后转换为音 频数据,再将音频数据输出处理器1580处理后,经RF电路1510以发送给比如另一手机,或者将音频数据输出至存储器1520以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块1570可以帮助用 户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽 带互联网访问。虽然图3示出了WiFi模块1570,但是可以理解的是,其 并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围 内而省略。
处理器1580是手机的控制中心,利用各种接口和线路连接整个手机 的各个部分,通过运行或执行存储在存储器1520内的软件程序和/或模块, 以及调用存储在存储器1520内的数据,执行手机的各种功能和处理数据, 从而对手机进行整体监控。可选的,处理器1580可包括一个或多个处理 单元;优选的,处理器1580可集成应用处理器和调制解调处理器,其中, 应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器 主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到 处理器1580中。
手机还包括给各个部件供电的电源1590(比如电池),优选的,电 源可以通过电源管理系统与处理器1580逻辑相连,从而通过电源管理系 统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述 描述的模块、相关工作单元和装置的具体工作过程,可以参考前述方法实 施例中的对应过程,在此不再赘述。
本发明采集企业相关维度信息后,进行相应的预处理,可以去除一些无 用的、无效的、重复的数据等等;然后对维度信息进行分类,再和工商基础 信息进行匹配,以便于匹配后的数据同样是分类存储的;根据分类后的数据 创建企业画像,完整、全方位地刻画了企业信息,使创建的企业画像更加全 面,更加客观。
实施例三
如图4所示,提供了本发明一个实施例的一种计算机设备,计算机设 备包括存储器及处理器,存储器上存储有计算机程序,处理器执行计算机 程序时实现如实施例一中的综合画像指数生成方法。
具体的,计算机设备包括处理器A510,以及分别与处理器连接的存 储器A520和收发器A530。
处理器A510,用于执行机器的可读指令,以执行实施例一中的综合 画像指数生成方法。
在本申请实施例中,处理器A510可以是中央处理单元(Central ProcessingUnit,CPU),该处理器A510还可以是其他通用处理器、数字 信号处理器(Digital SignalProcessor,DSP)、专用集成电路 (Application Specific Integrated Circuit,ASIC)、现成可编程门阵 列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、 分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是 微处理器或者该处理器也可以是任何常规的处理器等。
存储器A520,用于存储处理器A510可执行的机器可读指令,并提供 计算和控制能力,以支撑整个计算机设备的运行。
存储器A520可以包括非易失性存储介质和内存储器。
该非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括 程序指令,该程序指令被执行时,可使得处理器510执行实施例一中的综合 画像指数生成方法。
收发器A530,用于与外部设备进行通信传输。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相 关的部分结构的框图,并不构成对本申请方案所应用于其上的服计算机设备 的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组 合某些部件,或者具有不同的部件布置。
实施例四
提供了本发明另一个实施例的一种存储介质,存储介质存储有计算机 程序,计算机程序被处理器执行时可实现如实施例一中的综合画像指数生 成方法。
计算机程序包括程序指令,程序指令当被处理器执行时可实现如实施 例一中的综合画像指数生成方法。
该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序, 其中计算机程序包括程序指令。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory, ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各 示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实 现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一 般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执 行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个 特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超 出本发明的范围。
在本申请所提供的实施例中,应该理解到,所揭露的方法、系统、装 置、模块和/或单元,可以通过其它的方式实现。例如,以上所描述的方 法实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能 划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合 或者可以集成到另一个系统,或一些特征可以忽略,或不执行。所述作为 分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示 的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可 以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部 单元来实现本实施例方案的目的。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的 普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进 和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于企业大数据的综合画像指数生成方法,其特征在于,包括如下步骤:
获取企业相关信息;
对所述企业相关信息进行企业相关维度信息预处理以获取第一处理结果;
对所述企业相关信息进行企业标签信息预处理以获取第二处理结果;
根据预设算法处理所述第一处理结果和第二处理结果以生成综合画像指数。
2.根据权利要求1所述的综合画像指数生成方法,其特征在于,所述对所述企业相关信息进行企业相关维度信息预处理以获取第一处理结果,包括:
以工商基础信息为主体,采集与企业相关的、预设的维度信息,所述维度信息包括专利、商标、认证认可、企业标准、中标、招聘、创投、舆情、百度竞价、百科介绍、ICP备案各维度信息;
将各维度信息与工商基础信息的企业编码建立关系;
对各维度信息进行归纳统计处理与存储。
3.根据权利要求2所述的综合画像指数生成方法,其特征在于,所述对所述企业相关信息进行企业标签信息预处理以获取第二处理结果,包括:
基于文本分析,提取工商基础及企业相关的各维度信息中出现的高频词,统一存储到企业标签库;
或将用户搜索的关键词作为企业标签存储到企业标签库;
或人工预先定义的企业标签信息。
4.根据权利要求3所述的综合画像指数生成方法,其特征在于,所述根据预设算法处理所述第一处理结果和第二处理结果以生成综合画像指数,包括:
在每个维度中预先设置若干个特征及对应的系数、给每个维度设置一个权重;
通过关键词在每个维度以及每个维度下的特征查找命中率;
将命中维度的权重以及维度特征对应的系数相乘,最后取出加权和,生成综合画像指数。
5.根据权利要求1或4所述的综合画像指数生成方法,其特征在于,所述根据预设算法处理所述第一处理结果和第二处理结果以生成综合画像指数之后,还包括:
在用户查看企业画像时,通过令牌验证并获取用户输入或选择的预设关键词,生成综合画像指数。
6.根据权利要求5所述的综合画像指数生成方法,其特征在于,所述根据预设算法处理所述第一处理结果和第二处理结果以生成综合画像指数,是指:
通过关键词匹配工商基础及各相关维度的特征信息;
获取各个匹配的特征信息对应的系数,记为p;
获取各个维度的权重,记为q;
计算综合画像指数:∑pq。
7.一种基于企业大数据的综合画像指数生成装置,其特征在于,包括:
获取模块,用于获取企业相关信息;
第一处理模块,用于对所述企业相关信息进行企业相关维度信息预处理以获取第一处理结果;
第二处理模块,用于对所述企业相关信息进行企业标签信息预处理以获取第二处理结果;
计算模块,用于根据预设算法处理所述第一处理结果和第二处理结果以生成综合画像指数。
8.根据权利要求7所述的综合画像指数生成装置,其特征在于,所述计算模块包括:
匹配单元,用于通过关键词匹配工商基础及各相关维度的特征信息;
第一确定单元,用于获取各个匹配的特征信息对应的系数,记为p;
第二确定单元,用于获取各个维度的权重,记为q;
生成单元,用于计算综合画像指数:∑pq。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的综合画像指数生成方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现如权利要求1至6中任一项所述的综合画像指数生成方法。
CN201911255623.2A 2019-12-10 2019-12-10 一种基于企业大数据的综合画像指数生成方法及相关设备 Pending CN111027854A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911255623.2A CN111027854A (zh) 2019-12-10 2019-12-10 一种基于企业大数据的综合画像指数生成方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911255623.2A CN111027854A (zh) 2019-12-10 2019-12-10 一种基于企业大数据的综合画像指数生成方法及相关设备

Publications (1)

Publication Number Publication Date
CN111027854A true CN111027854A (zh) 2020-04-17

Family

ID=70208318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911255623.2A Pending CN111027854A (zh) 2019-12-10 2019-12-10 一种基于企业大数据的综合画像指数生成方法及相关设备

Country Status (1)

Country Link
CN (1) CN111027854A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950932A (zh) * 2020-08-26 2020-11-17 北京信息科技大学 基于多源信息融合的中小微企业综合质量画像方法
CN112287016A (zh) * 2020-10-19 2021-01-29 天筑科技股份有限公司 一种企业视图的构建方法及系统
CN112907093A (zh) * 2021-03-04 2021-06-04 天九共享网络科技集团有限公司 企业信息处理方法、装置、可读存储介质及电子设备
CN113327048A (zh) * 2021-06-16 2021-08-31 力合科创集团有限公司 基于大数据及多维特征的企业画像计算方法、介质及程序
CN115827934A (zh) * 2023-02-21 2023-03-21 四川省计算机研究院 基于统一社会信用代码的企业画像智能分析系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056407A (zh) * 2016-06-03 2016-10-26 北京网智天元科技股份有限公司 基于用户行为分析的网银用户画像方法及设备
CN108572967A (zh) * 2017-03-09 2018-09-25 神州数码系统集成服务有限公司 一种创建企业画像的方法及装置
CN109447126A (zh) * 2018-09-27 2019-03-08 长威信息科技发展股份有限公司 一种实体和实体属性动态聚合构造人物画像的方法及设备
CN109658478A (zh) * 2017-10-10 2019-04-19 爱信诺征信有限公司 一种提供企业画像的方法及系统
CN109684330A (zh) * 2018-12-17 2019-04-26 深圳市华云中盛科技有限公司 用户画像库构建方法、装置、计算机设备及存储介质
CN110490729A (zh) * 2019-08-16 2019-11-22 南京汇银迅信息技术有限公司 一种基于用户画像模型的金融用户分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106056407A (zh) * 2016-06-03 2016-10-26 北京网智天元科技股份有限公司 基于用户行为分析的网银用户画像方法及设备
CN108572967A (zh) * 2017-03-09 2018-09-25 神州数码系统集成服务有限公司 一种创建企业画像的方法及装置
CN109658478A (zh) * 2017-10-10 2019-04-19 爱信诺征信有限公司 一种提供企业画像的方法及系统
CN109447126A (zh) * 2018-09-27 2019-03-08 长威信息科技发展股份有限公司 一种实体和实体属性动态聚合构造人物画像的方法及设备
CN109684330A (zh) * 2018-12-17 2019-04-26 深圳市华云中盛科技有限公司 用户画像库构建方法、装置、计算机设备及存储介质
CN110490729A (zh) * 2019-08-16 2019-11-22 南京汇银迅信息技术有限公司 一种基于用户画像模型的金融用户分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴行惠等: "质监大数据企业画像的研究及应用", 《数字通信世界》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950932A (zh) * 2020-08-26 2020-11-17 北京信息科技大学 基于多源信息融合的中小微企业综合质量画像方法
CN111950932B (zh) * 2020-08-26 2023-04-25 北京信息科技大学 基于多源信息融合的中小微企业综合质量画像方法
CN112287016A (zh) * 2020-10-19 2021-01-29 天筑科技股份有限公司 一种企业视图的构建方法及系统
CN112287016B (zh) * 2020-10-19 2022-03-11 天筑科技股份有限公司 一种企业视图的构建方法及系统
CN112907093A (zh) * 2021-03-04 2021-06-04 天九共享网络科技集团有限公司 企业信息处理方法、装置、可读存储介质及电子设备
CN113327048A (zh) * 2021-06-16 2021-08-31 力合科创集团有限公司 基于大数据及多维特征的企业画像计算方法、介质及程序
CN115827934A (zh) * 2023-02-21 2023-03-21 四川省计算机研究院 基于统一社会信用代码的企业画像智能分析系统及方法
CN115827934B (zh) * 2023-02-21 2023-05-09 四川省计算机研究院 基于统一社会信用代码的企业画像智能分析系统及方法

Similar Documents

Publication Publication Date Title
CN111027854A (zh) 一种基于企业大数据的综合画像指数生成方法及相关设备
CN104217717A (zh) 构建语言模型的方法及装置
CN109726726B (zh) 视频中的事件检测方法及装置
CN109376700B (zh) 指纹识别方法及相关产品
CN106294308A (zh) 命名实体识别方法及装置
CN108388630A (zh) 一种购物信息推送方法、装置及电子设备
CN111125523A (zh) 搜索方法、装置、终端设备及存储介质
CN112685578B (zh) 一种多媒体信息内容提供方法及装置
CN104516886A (zh) 一种展现数据分析结果的方法、移动终端以及服务器
CN109871524B (zh) 一种图表生成方法及装置
CN108205568A (zh) 基于标签选择数据的方法及装置
CN107666515A (zh) 图像处理方法和装置、计算机设备、计算机可读存储介质
CN111090877B (zh) 数据生成、获取方法及对应的装置、存储介质
CN110597957B (zh) 一种文本信息检索的方法及相关装置
CN116070114A (zh) 数据集的构建方法、装置、电子设备及存储介质
CN110196833A (zh) 应用程序的搜索方法、装置、终端及存储介质
CN110866114B (zh) 对象行为的识别方法、装置及终端设备
CN111080305A (zh) 一种风险识别方法、装置及电子设备
CN116167867A (zh) 基于知识图谱的保险业务风险识别方法、装置及电子设备
CN115330522A (zh) 基于聚类的信用卡审批方法、装置、电子设备和介质
CN114840570A (zh) 数据处理方法、装置、电子设备及存储介质
CN112862289B (zh) 一种临床研究从业者的信息匹配方法和装置
CN114996369A (zh) 一种数据仓库指标库的构建方法和装置
CN108616637A (zh) 信息处理方法和装置、电子设备、计算机可读存储介质
CN111062198A (zh) 一种基于大数据的企业类别分析方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200417