CN107169036A - 确定企业所属行业类别的方法及系统 - Google Patents

确定企业所属行业类别的方法及系统 Download PDF

Info

Publication number
CN107169036A
CN107169036A CN201710257503.0A CN201710257503A CN107169036A CN 107169036 A CN107169036 A CN 107169036A CN 201710257503 A CN201710257503 A CN 201710257503A CN 107169036 A CN107169036 A CN 107169036A
Authority
CN
China
Prior art keywords
enterprise
employment
industry
category
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710257503.0A
Other languages
English (en)
Inventor
张昕雅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHANJET INFORMATION TECHNOLOGY Co Ltd
Original Assignee
CHANJET INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHANJET INFORMATION TECHNOLOGY Co Ltd filed Critical CHANJET INFORMATION TECHNOLOGY Co Ltd
Priority to CN201710257503.0A priority Critical patent/CN107169036A/zh
Publication of CN107169036A publication Critical patent/CN107169036A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种确定企业所属行业类别的方法及系统,用于服务器,确定企业所属行业类别的方法包括:获取行业表述词数据;根据行业表述词数据,确定企业的第一行业类别;获取主营业务数据;根据主营业务数据,确定企业的第二行业类别;获取供应商和/或客户的行业类别数据;根据供应商和/或客户的行业类别数据,确定企业的第三行业类别;根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。本发明综合获取企业的行业分类,能更加灵活、准确地得到企业在行业链中的位置信息,使众多蓬勃发展的小微创新型企业得到科学的行业划分,最大限度地方便生产者、销售者及消费者的需要。

Description

确定企业所属行业类别的方法及系统
技术领域
本发明涉及企业分类技术领域,具体而言,涉及一种确定企业所属行业类别的方法及系统。
背景技术
所谓行业,是反映以生产要素组合为特征的各类经济活动。行业是根据人类经济活动的技术特点划分的,即按反映生产力三要素(劳动者、劳动对象、劳动资料)不同排列组合的各类经济活动的特点划分的。
在现代市场经济社会中,需要明确分类的行业及产品所包括的范围。行业分类要从有利于产品生产、销售、经营习惯出发,最大限度地方便生产者、销售者及消费者的需要,并保持行业的分类上的科学性,选择的分类依据要适当,同时应具有科学的系统性。
随着社会的发展,众多小微创新型企业蓬勃发展,社会分工逐步精细化,产品和服务不再像过去一样粗放,提供的是个性化的产品和服务,那么简单的遵从现有的行业分类,已不能对这些小微创新型企业进行区分,那么需要有适应这种个性化发展的行业划分方法及系统。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个目的在于提出了一种确定企业所属行业类别的方法。
本发明的另一个目的在于提出了一种确定企业所属行业类别的系统。
有鉴于此,根据本发明的一个目的,提出了一种确定企业所属行业类别的方法,用于服务器,包括:获取行业表述词数据;根据行业表述词数据,确定企业的第一行业类别;获取主营业务数据;根据主营业务数据,确定企业的第二行业类别;获取供应商和/或客户的行业类别数据;根据供应商和/或客户的行业类别数据,确定企业的第三行业类别;根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。
本发明提供的确定企业所属行业类别的方法,根据行业表述词对企业进行分类得到企业的第一行业分类,根据企业的主营业务得到企业的第二行业分类,根据企业的供应商和/或客户的行业类别数据得到企业的第三行业分类,再综合第一、第二、第三行业分类获取企业的最终的行业分类,本发明综合获取企业的行业分类,能更加灵活、准确地得到企业在行业链中的位置信息,使众多蓬勃发展的小微创新型企业得到科学的行业划分,最大限度地方便生产者、销售者及消费者的需要。
根据本发明的上述确定企业所属行业类别的方法,还可以具有以下技术特征:
在上述技术方案中,优选地,获取行业表述词数据的步骤,具体包括:接收企业名称;从企业名称中提取所述行业表述词数据。
在该技术方案中,在企业名称中提取出一个或多个行业表述词,根据行业表述词对企业进行行业划分,使企业的行业划分更加精细化。
在上述任一技术方案中,优选地,根据行业表述词数据,确定企业的所述第一行业类别的步骤,具体包括:通过K近邻分类方法,对行业表述词数据进行分类,获取行业表述词数据的类别;将行业表述词数据的类别作为第一行业类别。
在该技术方案中,通过K近邻分类方法,对行业表述词数据进行分类,将行业表述词数据的类别作为第一行业类别,例如提取出K个行业表述词,K个行业表述词中多数行业表述词的数据近邻A行业类别,则将A行业类别作为企业的第一行业类别。
在上述任一技术方案中,优选地,根据主营业务数据,确定企业的第二行业类别的步骤,具体包括:接收企业名称;根据企业名称,在工商局网站中查询并获取企业的经营范围数据;根据主营业务数据,在企业的经营范围数据中筛选出企业的至少一项主要经营范围数据;通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别。
在该技术方案中,根据企业的名称在工商局网站中查询企业经营范围数据,根据主营业务数据筛选出企业的主要经营范围数据,通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别,即将多个主要经营范围数据中经营概率最大的作为第二行业类别。
在上述任一技术方案中,优选地,根据供应商和/或客户的行业类别数据,确定企业的所述第三行业类别的步骤,具体包括:根据供应商和/或客户的行业类别数据,确定供应商和/或客户的行业类别;将供应商和/或客户的行业类别作为第三行业类别。
在该技术方案中,因为一个企业是不能单独存在的,从一个企业的供应商及客户的名称来获得的行业分类,可以进一步确认该企业的行业,根据该公司的供应商、客户确定行业分类,能得到该企业在行业链中的准确的位置信息。
在上述任一技术方案中,优选地,根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别的步骤,具体包括:通过朴素贝叶斯分类方法,根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。
在该技术方案中,对企业的行业分类标签集进行朴素贝叶斯分类,最后将概率最大的行业类别,作为得企业的行业类别,确保企业行业分类的科学性和系统性。
根据本发明的另一个目的,提出了一种确定企业所属行业类别的系统,用于服务器,包括:获取单元,用于获取行业表述词数据;第一确定单元,用于根据由获取单元获取的所述行业表述词数据,确定企业的第一行业类别;所述获取单元,还用于获取主营业务数据;第二确定单元,用于根据由获取单元获取的所述主营业务数据,确定企业的第二行业类别;获取单元,还用于获取供应商和/或客户的行业类别数据;第三确定单元,用于根据由获取单元获取的供应商和/或客户的行业类别数据,确定企业的第三行业类别;总确定单元,用于根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。
本发明提供的确定企业所属行业类别的系统,第一确定单元根据行业表述词对企业进行分类得到企业的第一行业分类,第二确定单元根据企业的主营业务得到企业的第二行业分类,第三确定单元根据企业的供应商和/或客户的行业类别数据得到企业的第三行业分类,再由总确定单元综合第一、第二、第三行业分类获取企业的最终的行业分类,本发明综合获取企业的行业分类,能更加灵活、准确地得到企业在行业链中的位置信息,使众多蓬勃发展的小微创新型企业得到科学的行业划分,最大限度地方便生产者、销售者及消费者的需要。
根据本发明的上述确定企业所属行业类别的系统,还可以具有以下技术特征:
在上述技术方案中,优选地,还包括:接收单元,用于接收企业名称;获取单元,用于从企业名称中提取所述行业表述词数据。
在该技术方案中,获取单元在企业名称中提取出一个或多个行业表述词,根据行业表述词对企业进行行业划分,使企业的行业划分更加精细化。
在上述任一技术方案中,优选地,第一确定单元,具体用于:通过K近邻分类方法,对行业表述词数据进行分类,获取行业表述词数据的类别;将行业表述词数据的类别作为第一行业类别。
在该技术方案中,第一确定单元通过K近邻分类方法,对行业表述词数据进行分类,将行业表述词数据的类别作为第一行业类别,例如提取出K个行业表述词,K个行业表述词中多数行业表述词的数据近邻A行业类别,则将A行业类别作为企业的第一行业类别。
在上述任一技术方案中,优选地,还包括:接收单元,用于接收企业名称;第二确定单元,用于根据企业名称,在工商局网站中查询并获取企业的经营范围数据;根据主营业务数据,在企业的经营范围数据中筛选出企业的至少一项主要经营范围数据;通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别。
在该技术方案中,第二确定单元根据企业的名称在工商局网站中查询企业经营范围数据,根据主营业务数据筛选出企业的主要经营范围数据,通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别,即将多个主要经营范围数据中经营概率最大的作为第二行业类别。
在上述任一技术方案中,优选地,第三确定单元,具体用于:根据供应商和/或客户的行业类别数据,确定供应商和/或客户的行业类别;将供应商和/或客户的行业类别作为第三行业类别。
在该技术方案中,因为一个企业是不能单独存在的,从一个企业的供应商及客户的名称来获得的行业分类,可以进一步确认该企业的行业,根据该公司的供应商、客户确定行业分类,能得到该企业在行业链中的准确的位置信息。
在上述任一技术方案中,优选地,总确定单元,具体用于:通过朴素贝叶斯分类方法,根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。
在该技术方案中,对企业的行业分类标签集进行朴素贝叶斯分类,最后将概率最大的行业类别,作为得企业的行业类别,确保企业行业分类的科学性和系统性。
本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1示出了本发明的一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图;
图2示出了本发明的另一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图;
图3示出了本发明的再一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图;
图4示出了本发明的又一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图;
图5示出了本发明的又一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图;
图6示出了本发明的一个实施例的用于服务器的确定企业所属行业类别的系统的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不限于下面公开的具体实施例的限制。
本发明第一方面的实施例,提出一种确定企业所属行业类别的方法,用于服务器,图1示出了本发明的一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图。其中,该方法包括:
步骤102,获取行业表述词数据;
步骤104,根据行业表述词数据,确定企业的第一行业类别;
步骤106,获取主营业务数据;
步骤108,根据主营业务数据,确定企业的第二行业类别;
步骤110,获取供应商和/或客户的行业类别数据;
步骤112,根据供应商和/或客户的行业类别数据,确定企业的第三行业类别;
步骤114,根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。
本发明提供的确定企业所属行业类别的方法,根据行业表述词对企业进行分类得到企业的第一行业分类,根据企业的主营业务得到企业的第二行业分类,根据企业的供应商和/或客户的行业类别数据得到企业的第三行业分类,再综合第一、第二、第三行业分类获取企业的最终的行业分类,本发明综合获取企业的行业分类,能更加灵活、准确地得到企业在行业链中的位置信息,使众多蓬勃发展的小微创新型企业得到科学的行业划分,最大限度地方便生产者、销售者及消费者的需要。
图2示出了本发明的另一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图。其中,该方法包括:
步骤202,接收企业名称;
步骤204,从企业名称中提取所述行业表述词数据;
步骤206,通过K近邻分类方法,对行业表述词数据进行分类,获取行业表述词数据的类别;
步骤208,将行业表述词数据的类别作为第一行业类别。
在该实施例中,在企业名称中提取出一个或多个行业表述词,根据行业表述词对企业进行行业划分,使企业的行业划分更加精细化。通过K近邻分类方法,对行业表述词数据进行分类,将行业表述词数据的类别作为第一行业类别,例如提取出K个行业表述词,K个行业表述词中多数行业表述词的数据近邻A行业类别,则将A行业类别作为企业的第一行业类别。
图3示出了本发明的再一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图。其中,该方法包括:
步骤302,获取主营业务数据;
步骤304,根据企业名称,在工商局网站中查询并获取企业的经营范围数据;
步骤306,根据主营业务数据,在企业的经营范围数据中筛选出企业的至少一项主要经营范围数据;
步骤308,通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别。
在该实施例中,根据企业的名称在工商局网站中查询企业经营范围数据,根据主营业务数据筛选出企业的主要经营范围数据,通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别,即将多个主要经营范围数据中经营概率最大的作为第二行业类别。
图4示出了本发明的又一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图。其中,该方法包括:
步骤402,获取供应商和/或客户的行业类别数据;
步骤404,根据供应商和/或客户的行业类别数据,确定供应商和/或客户的行业类别;
步骤406,将供应商和/或客户的行业类别作为第三行业类别。
在该实施例中,因为一个企业是不能单独存在的,从一个企业的供应商及客户的名称来获得的行业分类,可以进一步确认该企业的行业,根据该公司的供应商、客户确定行业分类,能得到该企业在行业链中的准确的位置信息。
图5示出了本发明的又一个实施例的用于服务器的确定企业所属行业类别的方法的流程示意图。其中,该方法包括:
步骤502,接收企业名称,从企业名称中提取所述行业表述词数据;
步骤504,通过K近邻分类方法,对行业表述词数据进行分类,获取行业表述词数据的类别;
步骤506,将行业表述词数据的类别作为第一行业类别;
步骤508,根据企业名称,在工商局网站中查询并获取企业的经营范围数据;
步骤510,获取主营业务数据,根据主营业务数据,在企业的经营范围数据中筛选出企业的至少一项主要经营范围数据;
步骤512,通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别;
步骤514,获取供应商和/或客户的行业类别数据,根据供应商和/或客户的行业类别数据,确定供应商和/或客户的行业类别,将供应商和/或客户的行业类别作为第三行业类别;
步骤516,通过朴素贝叶斯分类方法,根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。
在该实施例中,对企业的行业分类标签集进行朴素贝叶斯分类,最后将概率最大的行业类别,作为得企业的行业类别,确保企业行业分类的科学性和系统性。
本发明第二方面的实施例,提出一种确定企业所属行业类别的系统600,用于服务器,图6示出了本发明的一个实施例的用于服务器的确定企业所属行业类别的系统600的示意图。其中,该系统包括:
获取单元602,用于获取行业表述词数据;
第一确定单元604,用于根据由获取单元获取的所述行业表述词数据,确定企业的第一行业类别;
获取单元602,还用于获取主营业务数据;
第二确定单元606,用于根据由获取单元获取的所述主营业务数据,确定企业的第二行业类别;
获取单元602,还用于获取供应商和/或客户的行业类别数据;
第三确定单元608,用于根据由获取单元获取的供应商和/或客户的行业类别数据,确定企业的第三行业类别;
总确定单元610,用于根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。
本发明提供的确定企业所属行业类别的系统600,第一确定单元604根据行业表述词对企业进行分类得到企业的第一行业分类,第二确定单元606根据企业的主营业务得到企业的第二行业分类,第三确定单元608根据企业的供应商和/或客户的行业类别数据得到企业的第三行业分类,再由总确定单元610综合第一、第二、第三行业分类获取企业的最终的行业分类,本发明综合获取企业的行业分类,能更加灵活、准确地得到企业在行业链中的位置信息,使众多蓬勃发展的小微创新型企业得到科学的行业划分,最大限度地方便生产者、销售者及消费者的需要。
在本发明的一个实施例中,如图6所示,优选地,还包括:接收单元612,用于接收企业名称;获取单元602,用于从企业名称中提取所述行业表述词数据。
在该实施例中,获取单元602在企业名称中提取出一个或多个行业表述词,根据行业表述词对企业进行行业划分,使企业的行业划分更加精细化。
在本发明的一个实施例中,优选地,第一确定单元604,具体用于:通过K近邻分类方法,对行业表述词数据进行分类,获取行业表述词数据的类别;将行业表述词数据的类别作为第一行业类别。
在该实施例中,第一确定单元604通过K近邻分类方法,对行业表述词数据进行分类,将行业表述词数据的类别作为第一行业类别,例如提取出K个行业表述词,K个行业表述词中多数行业表述词的数据近邻A行业类别,则将A行业类别作为企业的第一行业类别。
在本发明的一个实施例中,优选地,还包括:接收单元612,用于接收企业名称;第二确定单元606,用于根据企业名称,在工商局网站中查询并获取企业的经营范围数据;根据主营业务数据,在企业的经营范围数据中筛选出企业的至少一项主要经营范围数据;通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别。
在该实施例中,第二确定单元606根据企业的名称在工商局网站中查询企业经营范围数据,根据主营业务数据筛选出企业的主要经营范围数据,通过朴素贝叶斯分类方法,根据企业的至少一项主要经营范围数据确定第二行业类别,即将多个主要经营范围数据中经营概率最大的作为第二行业类别。
在本发明的一个实施例中,优选地,第三确定单元608,具体用于:根据供应商和/或客户的行业类别数据,确定供应商和/或客户的行业类别;将供应商和/或客户的行业类别作为第三行业类别。
在该实施例中,因为一个企业是不能单独存在的,从一个企业的供应商及客户的名称来获得的行业分类,可以进一步确认该企业的行业,根据该公司的供应商、客户确定行业分类,能得到该企业在行业链中的准确的位置信息。
在本发明的一个实施例中,优选地,总确定单元610,具体用于:通过朴素贝叶斯分类方法,根据第一行业类别、第二行业类别、第三行业类别,确定企业的行业类别。
在该实施例中,对企业的行业分类标签集进行朴素贝叶斯分类,最后将概率最大的行业类别,作为得企业的行业类别,确保企业行业分类的科学性和系统性。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种确定企业所属行业类别的方法,用于服务器,其特征在于,包括:
获取行业表述词数据;
根据所述行业表述词数据,确定所述企业的第一行业类别;
获取主营业务数据;
根据所述主营业务数据,确定所述企业的第二行业类别;
获取供应商和/或客户的行业类别数据;
根据所述供应商和/或客户的行业类别数据,确定所述企业的第三行业类别;
根据所述第一行业类别、所述第二行业类别、所述第三行业类别,确定所述企业的行业类别。
2.根据权利要求1所述的企业行业分类的方法,其特征在于,获取所述行业表述词数据的步骤,具体包括:
接收企业名称;
从所述企业名称中提取所述行业表述词数据。
3.根据权利要求1所述的企业行业分类的方法,其特征在于,根据所述行业表述词数据,确定所述企业的所述第一行业类别的步骤,具体包括:
通过K近邻分类方法,对所述行业表述词数据进行分类,获取所述行业表述词数据的类别;
将所述行业表述词数据的类别作为所述第一行业类别。
4.根据权利要求1所述的企业行业分类的方法,其特征在于,根据所述主营业务数据,确定所述企业的所述第二行业类别的步骤,具体包括:
接收企业名称;
根据所述企业名称,在工商局网站中查询并获取所述企业的经营范围数据;
根据所述主营业务数据,在所述企业的经营范围数据中筛选出所述企业的至少一项主要经营范围数据;
通过朴素贝叶斯分类方法,根据所述企业的至少一项主要经营范围数据确定所述第二行业类别。
5.根据权利要求1所述的企业行业分类的方法,其特征在于,根据所述供应商和/或客户的行业类别数据,确定所述企业的所述第三行业类别的步骤,具体包括:
根据所述供应商和/或客户的行业类别数据,确定所述供应商和/或客户的行业类别;
将所述供应商和/或客户的行业类别作为所述第三行业类别。
6.根据权利要求1至5中任一项所述的企业行业分类的方法,其特征在于,根据所述第一行业类别、所述第二行业类别、所述第三行业类别,确定所述企业的行业类别的步骤,具体包括:
通过所述朴素贝叶斯分类方法,根据所述第一行业类别、所述第二行业类别、所述第三行业类别,确定所述企业的行业类别。
7.一种确定企业所属行业类别的系统,用于服务器,其特征在于,包括:
获取单元,用于获取行业表述词数据;
第一确定单元,用于根据由所述获取单元获取的所述行业表述词数据,确定所述企业的第一行业类别;
所述获取单元,还用于获取主营业务数据;
第二确定单元,用于根据由所述获取单元获取的所述主营业务数据,确定所述企业的第二行业类别;
所述获取单元,还用于获取供应商和/或客户的行业类别数据;
第三确定单元,用于根据由所述获取单元获取的所述供应商和/或客户的行业类别数据,确定所述企业的第三行业类别;
总确定单元,用于根据所述第一行业类别、所述第二行业类别、所述第三行业类别,确定所述企业的行业类别。
8.根据权利要求7所述的企业行业分类的系统,其特征在于,还包括:
接收单元,用于接收企业名称;
所述获取单元,用于从所述企业名称中提取所述行业表述词数据。
9.根据权利要求7所述的企业行业分类的系统,其特征在于,所述第一确定单元,具体用于:
通过K近邻分类方法,对所述行业表述词数据进行分类,获取所述行业表述词数据的类别;
将所述行业表述词数据的类别作为所述第一行业类别。
10.根据权利要求7所述的企业行业分类的系统,其特征在于,还包括:
接收单元,用于接收企业名称;
所述第二确定单元,用于根据所述企业名称,在工商局网站中查询并获取所述企业的经营范围数据;根据所述主营业务数据,在所述企业的经营范围数据中筛选出所述企业的至少一项主要经营范围数据;通过朴素贝叶斯分类方法,根据所述企业的至少一项主要经营范围数据确定所述第二行业类别。
11.根据权利要求7所述的企业行业分类的系统,其特征在于,所述第三确定单元,具体用于:
根据所述供应商和/或客户的行业类别数据,确定所述供应商和/或客户的行业类别;
将所述供应商和/或客户的行业类别作为所述第三行业类别。
12.根据权利要求7至11中任一项所述的企业行业分类的系统,其特征在于,所述总确定单元,具体用于:
通过所述朴素贝叶斯分类方法,根据所述第一行业类别、所述第二行业类别、所述第三行业类别,确定所述企业的行业类别。
CN201710257503.0A 2017-04-19 2017-04-19 确定企业所属行业类别的方法及系统 Pending CN107169036A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710257503.0A CN107169036A (zh) 2017-04-19 2017-04-19 确定企业所属行业类别的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710257503.0A CN107169036A (zh) 2017-04-19 2017-04-19 确定企业所属行业类别的方法及系统

Publications (1)

Publication Number Publication Date
CN107169036A true CN107169036A (zh) 2017-09-15

Family

ID=59812269

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710257503.0A Pending CN107169036A (zh) 2017-04-19 2017-04-19 确定企业所属行业类别的方法及系统

Country Status (1)

Country Link
CN (1) CN107169036A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944480A (zh) * 2017-11-16 2018-04-20 广州探迹科技有限公司 一种企业行业分类方法
CN108171276A (zh) * 2018-01-17 2018-06-15 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN109034834A (zh) * 2018-06-20 2018-12-18 深圳市标准技术研究院 商事主体经营范围登记方法、装置、终端设备及存储介质
CN109271460A (zh) * 2018-09-29 2019-01-25 阿里巴巴集团控股有限公司 对电子平台中的商户进行分类的方法和装置
CN109359197A (zh) * 2018-10-31 2019-02-19 税友软件集团股份有限公司 一种税费种类认证方法、装置和计算机可读存储介质
CN109710906A (zh) * 2018-12-06 2019-05-03 深圳市标准技术研究院 经营范围辅助填报方法、装置、终端设备及存储介质
CN110059692A (zh) * 2019-04-16 2019-07-26 厦门商集网络科技有限责任公司 一种识别企业所属行业的方法及终端
CN110134759A (zh) * 2019-05-13 2019-08-16 极智(上海)企业管理咨询有限公司 一种获取企业的行业信息的方法
CN110245226A (zh) * 2018-10-23 2019-09-17 爱信诺征信有限公司 企业行业分类方法及其装置
CN110472131A (zh) * 2019-08-20 2019-11-19 杭州安恒信息技术股份有限公司 一种网站行业类型识别的方法、系统及设备
CN110990529A (zh) * 2019-11-28 2020-04-10 爱信诺征信有限公司 企业的行业明细划分方法及系统
CN111209397A (zh) * 2019-12-30 2020-05-29 中伯伦(北京)信息技术有限公司 一种确定企业产业类别的方法
CN112287075A (zh) * 2020-12-25 2021-01-29 北京智源人工智能研究院 一种自动获取企业多层级分类训练数据的方法和装置
CN113298352A (zh) * 2021-04-28 2021-08-24 北京网核精策科技管理中心(有限合伙) 企业行业信息处理方法、装置、电子设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1806243A (zh) * 2003-06-17 2006-07-19 Google公司 用于企业列表搜索的搜索查询类别划分
CN103810569A (zh) * 2014-02-17 2014-05-21 曾祥辉 基于行业经营管理平台的贸易管理方法及智能管理系统
CN105243389A (zh) * 2015-09-28 2016-01-13 北京橙鑫数据科技有限公司 公司名称的行业分类标签的确定方法和装置
US20170046787A1 (en) * 2012-11-08 2017-02-16 Hartford Fire Insurance Company Web Data Scraping, Tokenization, and Classification System and Method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1806243A (zh) * 2003-06-17 2006-07-19 Google公司 用于企业列表搜索的搜索查询类别划分
US20170046787A1 (en) * 2012-11-08 2017-02-16 Hartford Fire Insurance Company Web Data Scraping, Tokenization, and Classification System and Method
CN103810569A (zh) * 2014-02-17 2014-05-21 曾祥辉 基于行业经营管理平台的贸易管理方法及智能管理系统
CN105243389A (zh) * 2015-09-28 2016-01-13 北京橙鑫数据科技有限公司 公司名称的行业分类标签的确定方法和装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944480B (zh) * 2017-11-16 2020-11-24 广州探迹科技有限公司 一种企业行业分类方法
CN107944480A (zh) * 2017-11-16 2018-04-20 广州探迹科技有限公司 一种企业行业分类方法
CN108171276A (zh) * 2018-01-17 2018-06-15 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN108171276B (zh) * 2018-01-17 2019-07-23 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN109034834A (zh) * 2018-06-20 2018-12-18 深圳市标准技术研究院 商事主体经营范围登记方法、装置、终端设备及存储介质
CN109271460A (zh) * 2018-09-29 2019-01-25 阿里巴巴集团控股有限公司 对电子平台中的商户进行分类的方法和装置
CN109271460B (zh) * 2018-09-29 2021-09-03 创新先进技术有限公司 对电子平台中的商户进行分类的方法和装置
CN110245226A (zh) * 2018-10-23 2019-09-17 爱信诺征信有限公司 企业行业分类方法及其装置
CN109359197A (zh) * 2018-10-31 2019-02-19 税友软件集团股份有限公司 一种税费种类认证方法、装置和计算机可读存储介质
CN109710906A (zh) * 2018-12-06 2019-05-03 深圳市标准技术研究院 经营范围辅助填报方法、装置、终端设备及存储介质
CN110059692A (zh) * 2019-04-16 2019-07-26 厦门商集网络科技有限责任公司 一种识别企业所属行业的方法及终端
CN110134759A (zh) * 2019-05-13 2019-08-16 极智(上海)企业管理咨询有限公司 一种获取企业的行业信息的方法
CN110472131A (zh) * 2019-08-20 2019-11-19 杭州安恒信息技术股份有限公司 一种网站行业类型识别的方法、系统及设备
CN110990529A (zh) * 2019-11-28 2020-04-10 爱信诺征信有限公司 企业的行业明细划分方法及系统
CN110990529B (zh) * 2019-11-28 2024-04-09 爱信诺征信有限公司 企业的行业明细划分方法及系统
CN111209397A (zh) * 2019-12-30 2020-05-29 中伯伦(北京)信息技术有限公司 一种确定企业产业类别的方法
CN112287075A (zh) * 2020-12-25 2021-01-29 北京智源人工智能研究院 一种自动获取企业多层级分类训练数据的方法和装置
CN112287075B (zh) * 2020-12-25 2021-04-13 北京智源人工智能研究院 一种自动获取企业多层级分类训练数据的方法和装置
CN113298352A (zh) * 2021-04-28 2021-08-24 北京网核精策科技管理中心(有限合伙) 企业行业信息处理方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN107169036A (zh) 确定企业所属行业类别的方法及系统
MacCarthy et al. Mapping the supply chain: Why, what and how?
Bozdogan Statistical data mining and knowledge discovery
Wang et al. The relationship between bank performance and intellectual capital in East Asia
Harper et al. Organisational change and retail finance: An ethnographic perspective
Castelo Branco et al. Intellectual capital disclosure media in Portugal
Vesalainen et al. Toward a typological view of buyer–supplier relationships: Challenging the unidimensional relationship continuum
Peneder A sectoral taxonomy of educational intensity
Salim et al. Impact of organizational innovation on firm performance: Evidence from Malaysian-based ICT companies
Kim Business intelligence and marketing insights in an era of big data: The q-sorting approach
Morrison A Russian factory enters the market economy
CN102043847A (zh) 基于条件检索的公司股东投资关系自动分析系统及方法
da Silva Motta et al. Assessment of non-financial criteria in the selection of investment projects for seed capital funding: the contribution of scientometrics and patentometrics
Ötting et al. The future of leadership—How is leadership in small and medium-sized enterprises going to change?
Beyer et al. Social sustainability in an evolving circular fashion industry: identifying and triangulating concepts across different publication groups
Javdan et al. A novel framework for social life cycle assessment to achieve sustainable cultural tourism destinations
Sarjana et al. Reputation development strategy for corporate operating in industrial estate
Coker et al. Investigating service responsiveness in customer perception of the corporate logo
Apparao et al. Financial statement fraud detection by data mining
Lee et al. Measuring the change in knowledge sharing efficiency of virtual communities of practice: a case study
Bavarsad et al. A study of the relationship between organizational learning, strategic flexibility, competitive strategy and firm’s performance
Paper et al. Introduction to scikit-learn
Zhao Interpreting innovation dynamics with complexity theory
Freitas et al. Developing and testing a methodological approach to assess the QWL in retail banks
Khan Intellectual capital reporting practices: evidence from Bangladesh

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170915