CN106294714A - 一种信息采集方法和装置 - Google Patents

一种信息采集方法和装置 Download PDF

Info

Publication number
CN106294714A
CN106294714A CN201610644965.3A CN201610644965A CN106294714A CN 106294714 A CN106294714 A CN 106294714A CN 201610644965 A CN201610644965 A CN 201610644965A CN 106294714 A CN106294714 A CN 106294714A
Authority
CN
China
Prior art keywords
code
information
agency information
party server
organization mechanism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610644965.3A
Other languages
English (en)
Inventor
龙官波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610644965.3A priority Critical patent/CN106294714A/zh
Publication of CN106294714A publication Critical patent/CN106294714A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供信息采集方法,本发明的信息采集方法,应用于信息采集系统,所述信息采集系统包括本地终端和第三方服务器,所述本地终端包含信息采集装置。针对于现有技术中的系统中无法一次性采集到较为全面的组织机构信息的技术问题,本发明所提供的信息采集系统的所述本地终端按照预设条件生成组织机构代码,将组织机构代码发送至第三方服务器,使得第三方服务器反馈与组织机构代码对应的组织机构信息,将组织机构信息存储在本地终端,即可实现采集多数企业的较为全面的组织机构信息。

Description

一种信息采集方法和装置
技术领域
本发明涉及通信技术领域,具体而言,涉及一种信息采集方法和装置。
背景技术
现在生活中网络应用已经十分普遍,我们日常生活中需要查询的信息在各个网站应有尽有。我们日常生产生活中需要了解一些企业的相关信息,通常是根据该企业的名称在网站上进行检索,以查找该企业的企业名称、组织机构代码、组织机构信息等,而我们查询上述信息通常有两种途径,其一是通过在各大网站进行简单检索,一般是选择在网站上输入关键字,该关键字一般是企业的名称简写,在上搜索到关于企业的多条检索信息,在分别取多条检索信息里面选择所需要的企业信息,将选择的多条企业信息进行汇总为所需要的企业信息,此检索过程较为繁琐且难以检索齐全企业的包括组织机构代码、子公司名录等在内的较为全面的企业信息;另一种途径是通过国家工商局官方网站检索查询,国家工商局官方网站检索信息相对齐全,但是对于同一ID用户的检索次数限制,不方便大批量检索。因此,如何开发一个存储的企业信息较为全面的系统的问题是目前面临的一大课题。
发明内容
有鉴于此,本发明实施例的目的在于提供一种信息采集方法和装置。
本发明实施例提供的一种信息采集方法,应用于信息采集系统,所述信息采集系统包括本地终端和第三方服务器,所述第三方服务器内存储有组织机构代码与组织机构信息的对应关系.所述方法包括:所述本地终端按照预设条件生成组织机构代码;将所获取的所述组织机构代码发送至所述第三方服务器;接收所述第三方服务器反馈的与所述组织机构代码对应的所述组织机构信息;将所获取的所述组织机构信息存储在存储器。
优选地,所述的将组织机构信息存储在存储器,具体包括:将所获取的所述组织机构信息与所述存储器内存储的组织机构信息进行复率比对,得出重复率;将重复率满足预设阈值的组织机构信息存储在所述存储器。
优选地,所述本地终端按照预设条件生成组织机构代码,具体包括:生成代码串,所述代码串包括8个代码值,每个所述代码值包括0-9中的任意一个数字;根据所述代码串生成校验码,所述效验码包括1个校验值,所述校验值包括0-9中的任意一个数字或X;组合所述代码串和所述校验码生成所述组织机构代码。
优选地,所述的根据所述代码串生成校验码,具体包括:根据下式生成校验码:其中,MOD代表求余函数,i代表所述代码值从左至右的位置序号,Ci代表第i位上的代码值,C9代表校验码,Wi代表第i位上的加权因子。
优选地,所述的接收所述第三方服务器反馈的与所述组织机构代码对应的所述组织机构信息,具体包括:接收所述第三方服务器反馈的验证请求;根据所述验证请求获取验证结果;将所述验证结果发送至第三方服务器;接收所述第三方服务器反馈的在所述第三方服务器判断所述验证结果为正确之后发送的组织机构信息。
本发明实施例提供的一种信息采集装置,所述信息采集装置设置于本地终端,所述本地终端应用于信息采集系统,所述信息采集系统还包括第 三方服务器,所述第三方服务器内存储有组织机构代码与组织机构信息的对应关系,代码与组织机构信息的对应关系,所述装置包括:组织机构代码生成模块、组织机构信息获取模块和组织机构信息存储模块;所述组织机构代码生成模块,用于按照预设条件生成组织机构代码至所述组织机构名称获取模块;所述组织机构信息发送模块,用于将所获取的所述组织机构代码发送至所述第三方服务器;组织机构信息接收模块,用于接收所述第三方服务器反馈的与所述组织机构代码对应的所述组织机构信息至所述组织机构信息存储模块;所述组织机构信息存储模块,用于将所述组织机构信息存储在存储器。
优选地,所述组织机构信息存储模块还包括重复率比对子模块和存储子模块;所述重复率比对子模块,用于将所获取的所述组织机构信息与所述存储器内存储的组织机构信息进行重复率比对,得出重复率;所述存储子模块,用于将重复率满足预设阈值的组织机构信息存储在所述存储器。
优选地,所述组织机构代码生成模块包括:代码串生成子模块、校验码生成子模块和组合子模块;所述代码串生成子模块,用于生成代码串,所述代码串包括8个代码值,每个所述代码值包括0-9中的任意一个数字;所述校验码生成子模块,用于根据所述代码串生成校验码,所述效验码包括1个校验值,所述校验值包括0-9中的任意一个数字或X;所述组合子模块,用于组合所述代码串和所述校验码生成所述组织机构代码。
优选地,所述校验码生成子模块具体用于根据下式生成校验码:其中,MOD代表求余函数,i代表所述代码值从左至右的位置序号,Ci代表第i位上的代码值,C9代表校验码,Wi代表第i位上的加权因子。
优选地,所述组织机构信息接收模块,具体包括:验证请求接收子模块,用于接收所述第三方服务器反馈的验证请求;验证结果获取子模块, 用于根据所述验证请求获取验证结果;验证结果发送子模块,用于将所述验证结果发送至所述第三方服务器;组织机构信息接收子模块,用于接收所述第三方服务器反馈的在所述第三方服务器判断所述验证结果为正确之后发送的所述组织机构信息。
与现有技术相比,本发明的信息采集方法,应用于信息采集系统,所述信息采集系统包括本地终端和第三方服务器,所述本地终端包含信息采集装置。针对于现有技术中的系统中无法一次性采集到较为全面的组织机构信息的技术问题,本发明所提供的信息采集系统的所述本地终端按照预设条件生成组织机构代码,将组织机构代码发送至第三方服务器,使得第三方服务器反馈与组织机构代码对应的组织机构信息,将组织机构信息存储在本地终端,即可实现采集多数企业的较为全面的组织机构信息。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明较佳实施例提供的第三方服务器与本地终端进行交互的示意图。
图2为本发明较佳实施例提供的信息采集装置的方框示意图。
图3为本发明较佳实施例提供的信息采集方法的流程图。
图4为本发明较佳实施例提供的信息采集方法的流程图。
图5为本发明较佳实施例提供的信息采集方法的流程图。
图6为本发明较佳实施例提供的信息采集方法的流程图。
图7为本发明较佳实施例提供的信息采集装置的功能模块示意图。
图8为本发明较佳实施例提供的信息采集装置的组织机构信息存储模块的功能模块示意图。
图9为本发明较佳实施例提供的信息采集装置的组织机构代码生成模块的功能模块示意图。
图10为本发明较佳实施例提供的信息采集装置的组织机构信息获取模块的功能模块示意图。
具体实施方式
本领域技术人员长期以来一直在寻求一种改善该问题的工具或方法。
鉴于此,本发明的设计者通过长期的探索和尝试,以及多次的实验和努力,不断的改革创新,得出本方案所示的较佳信息采集方法和装置。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
组织机构代码是对中华人民共和国内依法注册、依法登记的机关、企、事业单位、社会团体和民办非企业单位颁发一个在全国范围内唯一的、始终不变的代码标识。国家质检总局负责组织机构代码的管理作。
如同居民的身份证一样,组织机构代码证是组织机构在社会经济活动中统一赋予的单位身份证。组织机构代码系统覆盖范围广泛,对申领代码 单位的资质审核也有数字档案作为凭证,可以动态追溯每一个组织机构的历史发展变化。
一个企业对应一个组织机构信息,但是一个企业对应的企业名称、企业子公司、企业信息非常多。若需要查询一个企业的全部的企业信息,则可以优选企业的组织机构信息与该企业的所有企业信息的对应关系。
如图1所示,是本发明较佳实施例提供的信息采集系统所包含的本地终端101和第三方服务器102进行交互的示意图。所述信息采集系统包括本地终端101和第三方服务器102,其中,所述第三方服务器102内对应存储有组织机构代码与较为全面的组织机构信息。本地终端101主要用于生成组织机构代码,将生成的组织机构代码发送至第三方服务器102,使得第三方服务器102根据所述组织机构代码反馈与该组织机构代码对应的组织机构信息,本地终端101将组织机构代码和组织机构信息存储。通过生成多个组织机构代码,进而获得所存在的组织机构代码及其所对应的组织机构信息,以实现现存企业的组织机构代码和组织机构信息。所述第三方服务器102通过网络与一个或多个本地终端101进行通信连接,以进行数据通信或交互。
所述第三方服务器102可以是网络方服务器、数据库服务器等所述本地终端101对应存储多个组织机构代码和多个组织机构信息,其中,一个组织机构代码对应一个组织机构信息,所述第三方服务器102内存储有较为全面的组织机构代码和组织机构信息,所述第三方服务器102可以为多个存储企业的组织机构信息的公用数据库服务器,也可以为分布式服务器,包含多个常用的组织机构信息查询网站的数据库服务器。
所述本地终端101可以是个人电脑(personal computer,PC)、平板电脑、智能手机、个人数字助理(personal digital assistant,PDA)等终端设备,所述的本地终端101也可以理解为终端设备和本地服务器的统称,通过终端设备和本地服务器进行交互,实现终端设备通过本地服务 器与第三方服务器102之间的交互操作。
如图2所示,是所述本地终端200的方框示意图。所述本地终端200包括信息采集装置201、存储器202、存储控制器203、处理器204、其它(如传感器)205、外设接口206、输入输出单元207、音频单元208和显示单元209。
所述存储器202、存储控制器203、处理器204、外设接口206、输入输出单元207、音频单元208和显示单元209各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述信息采集装置201包括至少一个可以软件或固件(firmware)的形式存储于所述存储器202中或固化在所述本地终端200的操作系统(operating system,OS)中的软件功能模块。所述处理器204用于执行存储器202中存储的可执行模块,例如所述信息采集装置201包括的软件功能模块或计算机程序。
其中,存储器202可以是,但不限于,随机存取存储器202(Random Access Memory,RAM),只读存储器202(Read Only Memory,ROM),可编程只读存储器202(ProgrammableRead-Only Memory,PROM),可擦除只读存储器202(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器202(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,存储器202用于存储程序,所述处理器204在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的第三方服务器所执行的方法可以应用于处理器204中,或者由处理器204实现。
处理器204可能是一种集成电路芯片,具有信号的处理能力。上述的处理器204可以是通用处理器204,包括中央处理器204(Central Processing Unit,简称CPU)、网络处理器204(Network Processor,简称NP)等;还可以是数字信号处理器204(DSP)、专用集成电路(ASIC)、现 成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器204可以是微处理器204或者该处理器204也可以是任何常规的处理器204等。
所述外设接口206将各种输入/输入装置耦合至处理器204以及存储器202。在一些实施例中,外设接口206,处理器204以及存储控制器203可以在单个芯片中实现。在其他一些实例中,他们可以分别由独立的芯片实现。
输入输出单元207用于提供给用户输入数据实现用户与所述第三方服务器(或本地终端200)的交互。所述输入输出单元207可以是,但不限于,鼠标和键盘等。
音频单元208向用户提供音频接口,其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。
显示单元209在所述本地终端200与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中,所述显示单元209可以是液晶显示器或触控显示器。若为触控显示器,其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作,并将该感应到的触控操作交由处理器204进行计算和处理。
请参阅图3,是本发明较佳实施例提供的应用于图2所示的信息采集装置的信息采集方法的流程图。所述信息采集方法应用于信息采集系统,所述信息采集系统包括本地终端和第三方服务器,所述第三方服务器内存储有组织机构代码和组织机构信息的对应关系。下面将对图3所示的具体流程进行详细阐述。
步骤S301,所述本地终端按照预设条件生成组织机构代码。
本地终端按照预设条件生成组织机构代码,预设条件为根据国家对于组织机构代码的规范设定。其中,所述步骤S101中所述的本地终端按照预设条件生成组织机构代码,可以具体包括图4所述的两个步骤:
S401:生成代码串,所述代码串包括8个代码值,每个所述代码值包括0-9中的任意一个数字。
组织机构代码包括右8位数值构成的本体代码段和由1位数值构成的校验码段。本地终端生成组织机构代码的过程,可以先成生成代码串,代码串包括8个代码值,每个代码值均包括0-9中的任意一个数字,将从左至右依次设置为第1位代码值、第2位代码值、第3位代码值、、、第7位代码值和第8位代码值。生成第一个代码串之后,可以保持前7位代码值保持不变,将第8位代码值进行9次变换(0-9中除了现有数字之外的9个值),即可得到9个新的代码串。可以替换第7位代码值的数字,然后再按照上述步骤将第8位数字进行十次变换(0-9共10个数字的依次替换),即可得到另外10个新的代码串,再依次按照上述步骤依次进行变换,即可得到总数为N=10*10*10*10*10*10*10*10=108个代码串,当然,上述多个代码串的生成方式所获得的108个代码串,并不是每个代码串均对应存在一个企业。
S402:根据所述代码串生成校验码,所述效验码包括1个校验值,所述校验值包括0-9中的任意一个数字或X。
组织机构代码除了8位本体代码段,还包括由1位数值构成的校验码段,所述效验码包括1个校验值,所述校验值包括0-9中的任意一个数字或X,组织机构代码的最后一位校验码为根据该组织机构代码的包括8位代码值的代码串生成的唯一存在的校验码,并非是随机生成的。本地终端根据所述代码串生成校验码的过程,具体包括:
本地终端根据下式生成校验码:
其中,MOD代表求余函数,i代表所述代码值从左至右的位置序号,Ci代表第i位代码值,C9代表校验码,Wi代表第i位上的加权因子。其中,第i位上的加权因子Wi与i的对应关系如下表所示:
当由上式计算得出校验码C9的值为10时,校验码应用大写的拉丁字母X表示;当由上式计算得出校验码C9的值为11时,校验码用0表示。
例如,当所述本地终端生成的某个新的代码串为12345678时,则其校验码按照上市计算可得:
S403:组合所述代码串和所述校验码生成所述组织机构代码
本地终端将上述步骤中生成的代码串和校验码进行组合,以使其满足标准格式的组织机构代码。代码串和校验码的组合方式可以为:组织机构代码=代码串—校验码,例如,若生成的某个代码串为12345678,根据该代码串的8位代码值和校验码的计算公式可得校验码为:
C 9 = M O D ( Σ i = 1 → 8 C i * W i , 11 ) = M O D ( 1 * 3 + 2 * 7 + 3 * 9 + 4 * 10 + 5 * 5 + 6 * 3 + 7 * 4 + 8 * 2 , 11 ) = 8 ,
则该组织机构代码为:12345678-8。
根据上述步骤可以生成符合组织机构代码规范的所有可能存在的组织机构代码,根据生成的组织机构代码获取与该组织机构代码信息所对应的企业信息,即执行步骤S302。
步骤S302,将所获取的所述组织机构代码发送至所述第三方服务器。
步骤S303:接收所述第三方服务器反馈的与所述组织机构代码对应的所述组织机构信息。
第三方服务器内对应存储有已经注册的企业的组织机构代码与该企 业的全部组织机构信息,该第三方服务器可以为官方的查询网站等。
本地终端根据预设规则生成一个新的组织机构代码之后,将生成的组织机构代码发送至第三方服务器。第三方服务器在其存储的数据中查找所接收的组织机构代码,若查找不到,证明该组织机构代码还没有对应一个注册的企业,可以向本地终端反馈组织机构信息不存在的指示信息。若查找到,则根据组织机构代码与组织机构信息的对应关系找到与该组织机构代码对应的组织机构信息,将该组织机构信息发送至本地终端。
步骤S303,将所获取的所述组织机构信息存储在存储器。
第三方服务器将所查找到的与所查询的组织机构代码对应的企业的组织机构信息发送至本地终端,本地终端将接收的组织机构信息进行存储。第三方服务器可以将组织机构信息发送至本地终端的同时会同时发送所查询的组织机构代码,以便所述本地终端在接收该组织机构信息时,可以同时将对应的组织机构信息和组织机构信息对应存储。
上述本发明实施例提供的信息采集方法,应用于信息采集系统,所述信息采集系统包括本地终端和第三方服务器,本地终端包括信息采集装置。针对于现有技术的系统中无法一次性采集到较为全面的组织机构信息的技术问题,本发明所提供的信息采集系统的所述本地终端按照预设条件生成组织机构代码,将组织机构代码发送至第三方服务器,使得第三方服务器反馈与组织机构代码对应的组织机构信息,将组织机构信息存储在本地终端,即可实现采集多数企业的较为全面的组织机构信息。
考虑到上述实施例提供的信息采集方法中,本地终端向第三方服务器索取组织机构信息的过程中,第三方服务器会发送验证码等的验证过程,以限制外接设备的访问量的问题,本发明较佳实施例提供了另一种信息采集方法,增加了通过解答验证环节。参见图5,本发明较佳实施例提供的应用于图2所示的信息采集装置的信息采集方法的流程图,其中,上述步骤S303所述的接收所述第三方服务器反馈与所述组织机构代码对应的所 述组织机构信息,具体包括:
S501:接收所述第三方服务器反馈的验证请求。
本地终端根据预设规则生成组织机构代码后,将生成的组织机构代码发送至第三方服务器。
第三方服务器在接收到本地终端发送的需要查询的组织机构代码后,生成验证请求,所述验证请求可以包括验证码验证、身份验证等验证方式。
S502:根据所述验证请求获取验证结果。
第三方服务器将生成的验证请求发送至本地终端后,本的终端根据所接收的验证请求获得验证结果。若所述验证请求为验证码请求,例如字符复述等验证码,则所述验证结果与为验证码;若所述验证请求为身份验证,则所述验证记过结果为与之相应的身份信息。
所述本地终端获取验证结果的方式可以有多种,包括本地终端自动生成和依赖第三终端等外接设备生成等。若所述验证请求为验证码验证方式,本地终端可以自动生成验证码,但是这样会影响交互时限,且受系统ID限制。本地终端也可以将所接收的验证请求发送至第三终端,第三终端可以为兼职验证的客户端。第三终端接收到验证请求后发送验证结果至本地终端,一定程度上增加验证成本,但是可以减少本地终端的硬件设置和验证时限。
S503:将所述验证结果发送至第三方服务器。
本地终端将自动生成的验证结果或者是第三终端反馈的验证结果发送至第三方服务器。
S504:接收所述第三方服务器反馈的在所述第三方服务器判断所述验证结果为正确之后发送的组织机构信息。
第三方服务器在接收到本地终端发送的验证结果之后,判断所述验证结果是否为正确,若验证结果为错误,则可以发送验证结果错误的指示信息至本地终端,方便本地终端选择重新验证或者是放弃信息采集等操作。 若第三方服务器判断所述验证结果为正确,则将与所接收的组织机构代码对应的组织机构信息发送至本地终端,以供本地终端存储。
考虑到上述实施例提供的信息采集方法中,组织机构信息采集和存储过程中,可能存在组织机构代码重复生成或者企业的组织机构信息的二次采集所导致的组织机构信息重复采集和存储,占用了存储空间的技术问题,本发明较佳实施例提供了另一种信息采集方法,增设了组织机构信息与已存储的组织机构信息的重复率比对过程。请参阅图6,本发明较佳实施例提供的应用于图2所示的信息采集装置的信息采集方法的流程图,其中,上述步骤S103所述的将组织机构信息存储在存储器,具体包括:
S601:将所获取的所述组织机构信息与所述存储器内存储的组织机构信息进行重复率比对,得出重复率。
本地终端每获取一个新的组织机构代码及其对应的组织机构信息时,都会将获得的组织机构代码和组织机构信息进行存储。存储过程中会存在重复存储的问题,例如,在前序信息采集步骤时某个验证码对应的企业信息不齐全,不能满足用户的访问需求,则后期可能会对某些组织机构代码对应的组织机构信息进行二次采集,二次采集时获得的组织机构信息可能会与本地终端的存储器内已经存储的组织机构信息存在重合部分,本实施例提供的信息采集方法增设了重复率比对环节。
将新获取的所述组织机构信息与所述存储器内已经存储的组织机构信息进行重复率比对,得出重复率,所述重复率可以理解为同一组织机构信息所对应的企业的组织机构信息的重合率。
S602:将重复率满足预设阈值的组织机构信息存储在所述存储器。
新获取的组织机构信息与存储器内已经存储的组织机构信息存在重复率,重复率的范围为0%-100%,0%的重复率代表该组织机构代码对应的企业为新注册企业,可以将该企业的组织机构信息全部存储,而重复率为100%,则代表该企业的组织机构信息已经被全部采集,属于重复采集,可 以选择放弃该次采集的全部组织机构信息。重复率为0%到100%之间的则代表企业信息存在更新或者补充,可以选择性的存储,选择性存储的依据可以为根据企业名录进行部分存储,企业名录已经存在的则放弃存储,企业名录未存在的企业信息进行部分存储。
上述本发明实施例提供的信息采集方法,应用于信息采集系统,针对于现有技术的系统中无法一次性采集到较为全面的组织机构信息的技术问题,本发明所提供的信息采集系统的所述本地终端按照符合组织机构代码规范的预设条件生成组织机构代码,将组织机构代码发送至第三方服务器,使得第三方服务器反馈与组织机构代码对应的组织机构信息,将组织机构信息存储在本地终端,即可实现采集多数企业的较为全面的组织机构信息的技术效果。
请参阅图7,是本发明较佳实施例提供的应用于图2所示的信息采集装置700的功能模块示意图。所述信息采集装置700设置于本地终端,所述本地终端应用于信息采集系统,所述信息采集系统还包括第三方服务器,所述第三方服务器内存储有组织机构代码与组织机构信息的对应关系,所述装置包括:组织机构代码生成模块701、组织机构代码发送模块702、所述组织机构信息接收模块703和组织机构信息存储模块704;
所述组织机构代码生成模块701,用于按照预设条件生成组织机构代码至所述组织机构名称获取模块;
所述组织机构信息获取模块702,用于将所获取的所述组织机构代码发送至所述第三方服务器;
所述组织机构信息接收模块703,用于接收所述第三方服务器反馈的与所述组织机构代码对应的所述组织机构信息;
所述组织机构信息存储模块704,用于将所述组织机构信息存储在存储器。
请参阅图8,是本发明较佳实施例提供的图2所示的信息采集装置的 功能模块示意图,其中,所述组织机构信息存储模块800还包括重复率比对子模块801和存储子模块802;
所述重复率比对子模块801,用于将所获取的所述组织机构信息与所述存储器内存储的组织机构信息进行重复率比对,得出重复率;
所述存储子模块802,用于将重复率满足预设阈值的组织机构信息存储在所述存储器。
请参阅图9,是本发明较佳实施例提供的图2所示的信息采集装置的功能模块示意图,其中,所述组织机构代码生成模块900包括:代码串生成子模块901、校验码生成子模块902和组合子模块903;
所述代码串生成子模块901,用于生成代码串,所述代码串包括8个代码值,每个所述代码值包括0-9中的任意一个数字;
所述校验码生成子模块902,用于根据所述代码串生成校验码,所述效验码包括1个校验值,所述校验值包括0-9中的任意一个数字或X;
所述组合子模块903,用于组合所述代码串和所述校验码生成所述组织机构代码。
上述实施例提供的信息采集装置的校验码生成子模块,根据代码串生成校验码,其中,所述校验码生成子模块902具体用于根据下式生成校验码:
C 9 = M O D ( Σ i = 1 → 8 C i * W i , 11 ) ,
其中,MOD代表求余函数,i代表所述代码值从左至右的位置序号,Ci代表第i位上的代码值,C9代表校验码,Wi代表第i位上的加权因子。
请参阅图10,是本发明较佳实施例提供的图2所示的信息采集装置的功能模块示意图,其中,所述组织机构信息接收模块1000,具体包括:
验证请求接收子模块1001,用于接收所述第三方服务器反馈的验证请求;
验证结果获取子模块1002,用于根据所述验证请求获取验证结果;
验证结果发送子模块1003,用于将所述验证结果发送至所述第三方服务器;
组织机构信息接收子模块1004,用于接收所述第三方服务器反馈的在所述第三方服务器判断所述验证结果为正确之后发送的所述组织机构信息。
上述本发明实施例提供的信息采集装置,应用于信息采集系统,针对于现有技术的系统中无法一次性采集到较为全面的组织机构信息的技术问题,本发明所提供的信息采集系统的所述本地终端按照符合组织机构代码规范的预设条件生成组织机构代码,将组织机构代码发送至第三方服务器,使得第三方服务器反馈与组织机构代码对应的组织机构信息,将组织机构信息存储在本地终端,即可实现采集多数企业的较为全面的组织机构信息的技术效果。所述信息采集装置的具体实施情况请参照上述方法实施例,在此不再一一赘述。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种信息采集方法,其特征在于,应用于信息采集系统,所述信息采集系统包括本地终端和第三方服务器,所述方法包括:
所述本地终端按照预设条件生成组织机构代码;
将所获取的所述组织机构代码发送至所述第三方服务器;
接收所述第三方服务器反馈的与所述组织机构代码对应的所述组织机构信息;
将所获取的所述组织机构信息存储在存储器。
2.根据权利要求1所述的方法,其特征在于,所述的将组织机构信息存储在存储器,具体包括:
将所获取的所述组织机构信息与所述存储器内存储的组织机构信息进行重复率比对,得出重复率;
将所述重复率满足预设阈值的组织机构信息存储在所述存储器。
3.根据权利要求1所述的方法,其特征在于,所述本地终端按照预设条件生成组织机构代码,具体包括:
生成代码串,所述代码串包括8个代码值,每个所述代码值包括0-9中的任意一个数字;
根据所述代码串生成校验码,所述效验码包括1个校验值,所述校验值包括0-9中的任意一个数字或X;
组合所述代码串和所述校验码生成所述组织机构代码。
4.根据权利要求3所述的方法,其特征在于,所述的根据所述代码串生成校验码,具体包括:
根据下式生成校验码:
其中,MOD代表求余函数,i代表所述代码值从左至右的位置序号,Ci代表第i位上的代码值,C9代表校验码,Wi代表第i位上的加权因子。
5.根据权利要求1所述的方法,其特征在于,所述的接收所述第三方服务器反馈的与所述组织机构代码对应的所述组织机构信息,具体包括:
接收所述第三方服务器反馈的验证请求;
根据所述验证请求获取验证结果;
将所述验证结果发送至第三方服务器;
接收所述第三方服务器反馈的在所述第三方服务器判断所述验证结果为正确之后发送的组织机构信息。
6.一种信息采集装置,其特征在于,所述信息采集装置设置于本地终端,所述本地终端应用于信息采集系统,所述信息采集系统还包括第三方服务器,所述第三方服务器内存储有组织机构代码与组织机构信息的对应关系,所述装置包括:组织机构代码生成模块、组织机构信息获取模块和组织机构信息存储模块;
所述组织机构代码生成模块,用于按照预设条件生成组织机构代码至所述组织机构名称获取模块;
所述组织机构代码发送模块,用于将所获取的所述组织机构代码发送至所述第三方服务器;
组织机构信息接收模块,用于接收所述第三方服务器反馈的与所述组织机构代码对应的所述组织机构信息至所述组织机构信息存储模块;
所述组织机构信息存储模块,用于将所述组织机构信息存储在存储器。
7.根据权利要求6所述的装置,其特征在于,所述组织机构信息存储模块还包括重复率比对子模块和存储子模块;
所述重复率比对子模块,用于将所获取的所述组织机构信息与所述存 储器内存储的组织机构信息进行重复率比对,得出重复率;
所述存储子模块,用于将重复率满足预设阈值的组织机构信息存储在所述存储器。
8.根据权利要求6所述的装置,其特征在于,所述组织机构代码生成模块包括:代码串生成子模块、校验码生成子模块和组合子模块;
所述代码串生成子模块,用于生成代码串,所述代码串包括8个代码值,每个所述代码值包括0-9中的任意一个数字;
所述校验码生成子模块,用于根据所述代码串生成校验码,所述效验码包括1个校验值,所述校验值包括0-9中的任意一个数字或X;
所述组合子模块,用于组合所述代码串和所述校验码生成所述组织机构代码。
9.根据权利要求8所述的装置,其特征在于,所述校验码生成子模块具体用于根据下式生成校验码:
其中,MOD代表求余函数,i代表所述代码值从左至右的位置序号,Ci代表第i位上的代码值,C9代表校验码,Wi代表第i位上的加权因子。
10.根据权利要求6所述的装置,其特征在于,所述组织机构信息接收模块,具体包括:
验证请求接收子模块,用于接收所述第三方服务器反馈的验证请求;
验证结果获取子模块,用于根据所述验证请求获取验证结果;
验证结果发送子模块,用于将所述验证结果发送至所述第三方服务器;
组织机构信息接收子模块,用于接收所述第三方服务器反馈的在所述第三方服务器判断所述验证结果为正确之后发送的所述组织机构信息。
CN201610644965.3A 2016-08-08 2016-08-08 一种信息采集方法和装置 Pending CN106294714A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610644965.3A CN106294714A (zh) 2016-08-08 2016-08-08 一种信息采集方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610644965.3A CN106294714A (zh) 2016-08-08 2016-08-08 一种信息采集方法和装置

Publications (1)

Publication Number Publication Date
CN106294714A true CN106294714A (zh) 2017-01-04

Family

ID=57666881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610644965.3A Pending CN106294714A (zh) 2016-08-08 2016-08-08 一种信息采集方法和装置

Country Status (1)

Country Link
CN (1) CN106294714A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108366052A (zh) * 2018-01-29 2018-08-03 深圳壹账通智能科技有限公司 验证短信的处理方法及系统
CN111539748A (zh) * 2020-04-15 2020-08-14 易开业(上海)科技发展有限公司 一种工商注册起名、核名系统及其方法
CN113052616A (zh) * 2021-03-15 2021-06-29 北京金和网络股份有限公司 一种冷链产品溯源方法、装置及系统
CN113742552A (zh) * 2021-08-20 2021-12-03 广州市易工品科技有限公司 基于组织机构代码的信息获取方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722562A (zh) * 2012-06-01 2012-10-10 浙江灵玖天下软件有限公司 基于互联网的组织机构信息整合与更新方法
CN103886474A (zh) * 2014-04-14 2014-06-25 湖南惠农科技有限公司 一种产品信息处理方法及装置
CN105160036A (zh) * 2015-09-30 2015-12-16 广州市经济贸易信息中心 一种企业非银信息查询方法
CN105631044A (zh) * 2016-01-29 2016-06-01 四川长虹电器股份有限公司 网络视频资源的汇聚方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722562A (zh) * 2012-06-01 2012-10-10 浙江灵玖天下软件有限公司 基于互联网的组织机构信息整合与更新方法
CN103886474A (zh) * 2014-04-14 2014-06-25 湖南惠农科技有限公司 一种产品信息处理方法及装置
CN105160036A (zh) * 2015-09-30 2015-12-16 广州市经济贸易信息中心 一种企业非银信息查询方法
CN105631044A (zh) * 2016-01-29 2016-06-01 四川长虹电器股份有限公司 网络视频资源的汇聚方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
龚庆: "组织机构代码信息系统研究与设计", 《中国优秀硕士学位论文 信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108366052A (zh) * 2018-01-29 2018-08-03 深圳壹账通智能科技有限公司 验证短信的处理方法及系统
CN108366052B (zh) * 2018-01-29 2021-01-01 深圳壹账通智能科技有限公司 验证短信的处理方法及系统
CN111539748A (zh) * 2020-04-15 2020-08-14 易开业(上海)科技发展有限公司 一种工商注册起名、核名系统及其方法
CN113052616A (zh) * 2021-03-15 2021-06-29 北京金和网络股份有限公司 一种冷链产品溯源方法、装置及系统
CN113742552A (zh) * 2021-08-20 2021-12-03 广州市易工品科技有限公司 基于组织机构代码的信息获取方法和装置

Similar Documents

Publication Publication Date Title
US8166047B1 (en) Systems, devices, and/or methods for managing data
CN110462604A (zh) 基于设备使用关联互联网设备的数据处理系统和方法
CN107798038B (zh) 数据响应方法及数据响应设备
CN102171689A (zh) 响应于搜索查询提供针对讨论话题的帖子
US10810600B2 (en) Using multi-factor context for resolving customer service issues
CN104462084A (zh) 基于多个查询提供搜索细化建议
CN106294714A (zh) 一种信息采集方法和装置
CN105045799A (zh) 可搜索索引
CN101206641A (zh) 用于自适应拼写检查的系统和方法
JP2014513826A (ja) コンピュータシステム、データベース及びそれらの使用
CN104380323A (zh) 经由雇员连接来标识前瞻雇员候选
CN104572889A (zh) 一种搜索词推荐方法、装置和系统
CN107066534B (zh) 多源数据聚合方法及系统
CN105872127B (zh) 一种ip地址管理系统
CN103685606B (zh) 关联域名的获取方法和系统以及网站管理员权限验证方法
CN114138985B (zh) 文本数据处理的方法、装置、计算机设备以及存储介质
CN109345417A (zh) 基于身份认证的业务人员的在线考核方法及终端设备
US10409866B1 (en) Systems and methods for occupation normalization at a job aggregator
CN110502692A (zh) 基于搜索引擎的信息检索方法、装置、设备和存储介质
CN110020974A (zh) 律师推荐方法、装置、介质及电子设备
CN108536702A (zh) 一种相关实体确定方法、装置及计算设备
CN109408502A (zh) 一种数据标准处理方法、装置及其存储介质
CN103116619A (zh) 协同商业智能实现方法及装置
US9275421B2 (en) Triggering social pages
US9996955B2 (en) Analytics visualization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170104

RJ01 Rejection of invention patent application after publication