CN108564333A - 一种职业调查方法和系统 - Google Patents

一种职业调查方法和系统 Download PDF

Info

Publication number
CN108564333A
CN108564333A CN201810215341.9A CN201810215341A CN108564333A CN 108564333 A CN108564333 A CN 108564333A CN 201810215341 A CN201810215341 A CN 201810215341A CN 108564333 A CN108564333 A CN 108564333A
Authority
CN
China
Prior art keywords
information
field
job position
position request
request information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810215341.9A
Other languages
English (en)
Inventor
王艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koala Credit Services Ltd
Original Assignee
Koala Credit Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koala Credit Services Ltd filed Critical Koala Credit Services Ltd
Priority to CN201810215341.9A priority Critical patent/CN108564333A/zh
Publication of CN108564333A publication Critical patent/CN108564333A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种职业调查方法和系统,涉及大数据技术领域,其中,方法包括:获取被调查者的标识信息和岗位要求信息;基于所述标识信息进行检索,得到被调查者的职业征信信息;从所述职业征信信息中提取与所述岗位要求信息相关联的字段;将与所述岗位要求信息相关联的字段填入预存的调查清单模板中,生成调查清单。相对于现有技术中采用人工访问的方式生成的调查清单,本发明具有效率高、精度高、受人为主观评价因素小、信息量大,生成的调查报告参考价值高等有益效果。

Description

一种职业调查方法和系统
技术领域
本发明涉及大数据技术领域,尤其涉及一种职业调查方法和系统。
背景技术
现有技术中,企业在招聘人员时,需要对求职者的职业信用水平进行调查,即职业征信调查,由于职业征信调查需要花费大量的时间和精力去寻找调查数据,因此企业一般委托专门的背景调查公司进行调查。
对于背景调查公司来说,其传统的调查方式通过与被调查者的前职业经历有关系的人员(例如:前雇主或前同事)进行面对面的或电话访问,并根据访问结果撰写访谈报告来完成。
现有技术的调查方式存在以下问题:一方面,由于目前的调查方式是采用人工访谈的方式完成,这导致了生成的访谈报告中体现的数据范围太狭窄、信息量小、效率低以及受人为评价影响高的问题,从而影响了访谈报告的参考价值。另一方面,由于访谈报告中的调查项目设置过于程式化,使得调查项目不能满足岗位的差异性,再加上存在人工操作的固有缺点,例如信息收集量太小,背调公司自己的信用本身也可能存在风险等因素,更导致了调查结果的千篇一律,不能提供足够精确的履职风险判断。
因此,现有技术中亟需一种高效率、受人为主观评价因素小、信息量大且信息客观的职业调查方法和系统。
发明内容
(一)发明目的
本发明的目的是提供一种高效率、受人为主观评价因素小、信息量大且信息客观的职业调查方法和系统。
(二)技术方案
为解决上述问题,本发明的第一方面提供了一种职业调查方法,包括:获取被调查者的标识信息和岗位要求信息;基于所述标识信息进行检索,得到被调查者的职业征信信息;从所述职业征信信息中提取与所述岗位要求信息相关联的字段;将与所述岗位要求信息相关联的字段填入预存的调查清单模板中,生成调查清单。
进一步,所述的职业调查方法,其中,所述岗位要求信息采用结构化字段的格式;其中,每个岗位要求信息包括至少一个结构化字段。
进一步,所述的职业调查方法,其中,所述岗位要求信息采用文字描述的格式;在获取所述岗位要求信息之后,还包括:基于预设的关键词库从所述岗位要求信息中提取与所述关键词库中的关键词相匹配的字段;通过提取的字段和职业征信信息之间的关联度对岗位要求信息进行拆分,得到至少一个结构化字段;其中,每个结构化字段包括标签字段和与标签字段对应的内容字段。
进一步,所述的职业调查方法,其中,从所述职业征信信息中提取与所述岗位要求信息相关联的字段,包括:基于所述岗位要求信息中的每个结构化字段,从所述职业征信信息中提取与每个结构化字段相关联的字段。
进一步,所述的职业调查方法,其中,所述职业征信信息包括以下信息中的至少一种:企业工商注册信息、司法诉讼信息、学历信息、社交信息、金融信息、购物信息和旅行信息。
进一步,所述的职业调查方法,其中,所述基于所述标识信息进行检索,得到被调查者的职业征信信息;包括:向存储有所述职业征信信息的服务器或服务器集群发送访问请求;其中,所述访问请求包括所述标识信息;获取所述服务器反馈的与所述标识信息相匹配的职业征信信息。
进一步,所述的职业调查方法,其中,所述基于所述标识信息进行检索,得到被调查者的职业征信信息;包括:向存储有所述职业征信信息的服务器或服务器集群发送访问请求;其中,所述访问请求包括所述标识信息;获取所述服务器反馈的与所述标识信息相关联的隐含信息;对所述隐含信息进行处理,得到职业征信信息。
进一步,所述的职业调查方法,其中,所述存储有所述职业征信信息的服务器或服务器集群包括一下服务器或服务器集群中的至少一种:存储有企业工商注册信息的服务器或服务器集群、存储有司法诉讼信息的服务器或服务器集群、存储有学历信息的服务器或服务器集群、存储有社交信息的服务器或服务器集群、存储有金融信息的服务器或服务器集群、存储有购物信息的服务器或服务器集群、存储有旅行信息的服务器或服务器集群。
进一步,所述的职业调查方法,其中,在所述得到被调查者的职业征信信息之后,还包括:对职业征信信息进行处理,得到至少一个结构化字段;其中,每个结构化字段包含标签字段和与标签字段对应的内容字段。
进一步,所述的职业调查方法,其中,所述对职业征信信息进行处理,得到至少一个结构化字段,包括:基于预设的职业征信字段库,从所述职业征信信息中获取与所述预设的职业征信字段库中的职业征信字段相匹配的字段,并基于获取的字段形成结构化字段;或对所述职业征信信息进行处理、推测,得到结构化字段。
进一步,所述的职业调查方法,其中,在所述将与所述岗位要求信息相关联的字段还包括风险字段;从所述职业征信信息中提取与所述岗位要求信息相关联的字段还包括:基于预设的风险字段库,从所述职业征信信息中获取与所述预设的风险字段库中的风险字段相匹配的字段,生成风险字段。
进一步,所述的职业调查方法,其中,生成的所述调查清单中,包括多个风险字段,所述多个风险字段根据每个字段的风险度而排序。
进一步,所述的职业调查方法,其中,生成的所述调查清单中,包括多个与所述岗位要求信息相关联的字段,所述多个与所述岗位要求信息相关联的字段根据每个字段的关联度而排序。
进一步,所述的职业调查方法,其中,生成的所述调查清单中,多个字段根据字段之间的关联度组成字段组。
进一步,所述的职业调查方法,其中,生成的所述调查清单包括至少一个调查项目;每个所述调查项目至少包括:调查项目名称字段和调查项目内容字段;进一步,每个所述调查项目还包括:调查类型字段和调查原因字段。
进一步,所述的职业调查方法,其中,调查项目包括固定调查项目和自动调查项目;所述固定调查项目是预先设定的调查项目,并存储在所述调查清单模板中;所述自动调查项目是基于所述岗位要求信息和所述职业征信信息的匹配而生成的调查项目。
进一步,所述的职业调查方法,其中,在获取到岗位要求信息和被调查者的职业征信信息之前,包括:建立调查清单生成模型,基于大量的调查清单以及相对应的岗位需求信息对所述调查清单生成模型进行训练,得到训练后的调查清单生成模型;在获取到岗位要求信息和被调查者的职业征信信息之后,还包括:将岗位要求信息和被调查者的职业征信信息输入所述训练后的调查清单生成模型,得到与所述岗位要求信息相关联的字段。
根据本发明的另一个方面,提供了一种职业调查系统,包括:标识信息获取模块,用于获取被调查者的标识信息;岗位需求信息获取模块,用于获取岗位要求信息;职业征信信息获取模块,用于基于所述标识信息进行检索,得到被调查者的职业征信信息;评估模块,用于从所述职业征信信息中提取与所述岗位要求信息相关联的字段;调查清单生成模块,用于将与所述岗位要求信息相关联的字段填入预存的调查清单模板中,生成调查清单。
根据本发明的又一方面,提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述程序被处理器执行时实现所述职业调查方法的步骤。
根据本发明的又一方面,提供了一种计算机设备,包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现所述职业调查方法的步骤。
(三)有益效果
本发明的上述技术方案具有如下有益的技术效果:
本发明提供的一种职业调查方法和系统,能够从能够存储海量的职业征信信息的各种服务器中获取被调查人的职业征信数据,并基于对职业征信数据的分析和提取,得到符合招聘企业的岗位要求信息的字段,并基于字段生成调查清单;从而便于背景调查公司基于调查清单生成调查报告,相对于现有技术中采用人工访问的方式生成的调查清单,效率高、精度高、受人为主观评价因素小、信息量大,生成的调查报告参考价值高。
附图说明
图1是本发明提供的职业调查方法的第一实施例的应用场景的示意图;
图2是本发明提供的职业调查方法的第一实施例步骤流程图;
图3是本发明提供的职业调查系统的第一实施例模块关系示意图;
图4是本发明提供的计算机设备的硬件结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
图1是本发明提供的职业调查方法的第一实施例的应用场景的示意图;2是本发明提供的职业调查方法的第一实施例步骤流程图。
如图1所示,本实施例的应用场景中包括:企业客户端、背调公司客户端和服务器。其中,企业客户端获取招聘企业的人员输入的被调查者的标识信息和岗位要求信息,并将被调查者的标识信息和岗位要求信息发送至服务器,从而使得服务器获取被调查者的标识信息和岗位要求信息。
服务器,一方面用于从各个其他服务器中获取职业征信信息,形成职业征信信息大数据,并对职业征信信息大数据进行处理,保证数据的全面性以及完整性;另一方面将岗位要求信息与个人职业征信信息进行自动匹配,并且从匹配的职业征信信息中自动提取一些具有较高参考性的调查项目添加至调查清单中,此后将调查清单传输至背调公司客户端。
背调公司客户端,用于接收服务器发送的调查清单,并通过人工审核的方式对调查清单进行完善,形成调查报告。调查报告可以由背调公司客户端发送给企业客户端,也可以是背调公司客户端将调查报告发给服务器,服务器再将调查报告发送给企业客户端。
本发明的实施例的主要实施主体是服务器,本发明提供的职业调查方法的执行主体均为服务器。
如图2所示,在本实施例中,职业调查方法,包括以下步骤S1-S4:
S1,获取被调查者的标识信息和岗位要求信息。
其中,被调查者的标识信息指的是能够标识调查者的身份的信息,被调查者的标识信息包括以下信息中的至少一种:身份证号码、姓名、性别、学历编号、驾驶证编号、社保卡编号、银行卡号、信用卡号、社交软件账户信息(例如QQ账户、微信账户、百度账户、新浪微博账户、智联招聘账户、钉钉账户)、购物软件账户信息(例如淘宝账户信息、聚美账户信息、京东账户信息)。
其中,岗位要求信息指的是招聘企业对待招聘的岗位的需求信息。在一实施例中,岗位要求信息采用结构化字段的格式;其中,每个岗位要求信息包括至少一个结构化字段;每个结构化字段包括标签字段和与标签字段对应的内容字段。在另一实施例中,岗位要求信息采用文字描述的格式。
S2,基于标识信息进行检索,得到被调查者的职业征信信息。
服务器在获取到标识信息之后,可以通过网络以及信息获取算法,例如爬虫技术,获取与被调查者人相关的至少一个职业征信信息。其中,职业征信信息包括一下信息中的至少一个:企业工商注册信息、司法诉讼信息、学历信息、社交信息、金融信息、购物信息和旅行信息。
服务器在获取到标识信息之后,还可以通过数据库或服务器接口,获取与被调查者人相关的至少一个职业征信信息。例如,通过访问国家机构的服务器获取,具体地,通过访问工商局的服务器获取企业注册信息,通过访问司法机构的服务器获取的诉讼信息,通过访问高等院校的服务器获取学历信息。再例如,通过访问社交软件的服务器获取社交信息(好友列表、旅行地点等)。再例如,通过访问购物软件的服务器获取购物信息。再例如,通过访问金融机构的服务器获取金融信息(借贷、还款、信用卡额度等信息)。
具体地,得到职业征信信息的步骤包括:向存储有职业征信信息的服务器或服务器集群发送访问请求;获取服务器反馈的与标识信息相匹配的职业征信信息。其中,访问请求包括标识信息。存储有职业征信信息的服务器或服务器集群包括一下服务器或服务器集群中的至少一种:存储有企业工商注册信息的服务器或服务器集群、存储有司法诉讼信息的服务器或服务器集群、存储有学历信息的服务器或服务器集群、存储有社交信息的服务器或服务器集群、存储有金融信息的服务器或服务器集群、存储有购物信息的服务器或服务器集群、存储有旅行信息的服务器或服务器集群。
在一实施例中,职业征信信息是通过访问服务器直接获得的,例如通过访问政府机构公开的查询网站所获取的信息可以直接作为职业征信信息。在另一实施例中,职业征信信息是通过对一些网站信息进行处理后得到的有用信息,例如存储在社交网站中的社交关系,存储在电商平台的交易记录等。通过对这些自动抓取的有用信息进行处理,得到职业征信信息。具体地,向存储有职业征信信息的服务器或服务器集群发送访问请求;获取服务器反馈的与标识信息相关联的隐含信息;对隐含信息进行处理,得到职业征信信息。其中,隐含信息是指,通过一个信息源获得标识关联的另外一个标识,再根据另外一个标识获得相关信息。例如,通过工商信息获得一个人持有的公司ID,并根据公司ID在司法纠纷中获得相关信息。该相关信息与该人不是直接关联,所以叫“隐含信息”。
S3,从职业征信信息中提取与岗位要求信息相关联的字段。
在得到被调查者的职业征信信息之后,还包括:对职业征信信息进行处理,得到至少一个结构化字段其中,职业征信信息的结构化与描述性岗位要求信息的结构化可以是相同的,也可以是不同的。甚至获取的职业征信信息就是结构化数据,例如专利的著录项目。
本步骤中,可以采用直接或间接的方式从职业征信信息中提取与岗位要求信息相关联的字段。具体地,在一个实施例中,基于预设的职业征信字段库,从职业征信信息中获取与预设的职业征信字段库中的职业征信字段相匹配的字段,并基于获取的字段形成结构化字段;在另一个实施例中,对职业征信信息进行推测,得到结构化字段。其中,推测包括使用大数据统计分析,提取非直接关联或潜在风险因素的字段。
从职业征信信息中提取与岗位要求信息相关联的字段,包括:基于岗位要求信息中的每个结构化字段,从职业征信信息中提取与每个结构化字段相关联的字段。其中,相关联的字段可以是与岗位要求信息关联度较强的字段,也可以是高风险的字段。
S4,将与岗位要求信息相关联的字段填入预存的调查清单模板中,生成调查清单。
本发明实施例的有益效果在于:本发明利用互联网和大数据处理,获得从大数据中获得职业征信信息,并将其作为依据,通过计算机实施的方法,自动生成符合岗位要求信息的调查清单,并将自动生成的调查清单发送给背景调查公司的客户端,进而生成高精度、高匹配度的调查报告,以提高访谈报告的准确度。相比传统的电话访谈,效率更高、数据源更多、信息量更大、数据更客观、准确。
在本发明提供的职业调查方法的第二实施例,在上述实施例的基础上,其中,所述岗位要求信息采用文字描述的格式。在获取岗位要求信息之后,还包括:基于预设的关键词库从岗位要求信息中提取与关键词库中的关键词相匹配的字段;通过提取的字段和职业征信信息之间的关联度对岗位要求信息进行拆分,得到至少一个结构化字段;其中,每个结构化字段包括标签字段和与标签字段对应的内容字段。
在本发明提供的职业调查方法的第三实施例,在上述实施例的基础上,其中,与岗位要求信息相关联的字段还包括风险字段。从所述职业征信信息中提取与所述岗位要求信息相关联的字段还包括以下步骤S11:基于预设的风险字段库,从职业征信信息中获取与预设的风险字段库中的风险字段相匹配的字段,生成风险字段。
其中,风险字段库可以是基于人工经验标注的字段库,也可以是经过大数据方式得到的字段库。生成的调查清单中,包括多个风险字段和多个与岗位要求信息相关联的字段,其中,多个风险字段根据每个字段的风险度而排序;多个与岗位要求信息相关联的字段根据每个字段的关联度而排序。
在本发明中,关联度、风险度,既可以基于人工检验的标注而得,也可以是通过大数据得计算而得。
例如:招聘成功与失败的数据,就可以获得某一岗位与不同技能或履历经验之间的关联度,例如一次成功应聘就可以使得某一岗位与求职者之间的某一技能关联度提升,而失败则意味着降低。通过大数据训练,就可以得到这个关联度。
具体地,关联度的计算可以通过经验知识,也可以通过大数据训练。经验知识就是将某一职业与对应字段通过人工,例如HR,标注关联度。大数据训练就是将不同的个人信息输入一个字段网络,就可以获得字段之间的关联度。另,现有技术中,关键词提取技术存在噪音或干扰,本实施方式利用其与职业征信信息之间的关联度可以有效去除噪音或者说不恰当的关键词,从而使得岗位要求信息的结构化准确率更高。
具体地,风险度的计算可以采用以下两种方式的任一种或两种的结合。
方法一:人工输入风险度数据;
方法二:通过历史风险事件相关的字段来计算出的风险字段列表以及风险程度指数。
本实施例进一步的有益效果为:本实施例能够自动提取与不同岗位要求相关的信息,并自动识别具有潜在履职风险的信息,将与岗位要求相关的信息和具有潜在履职风险的信息都作为调查项目,并列入到调查清单中,使最终的调查报告更准确。
在本发明提供的职业调查方法的第四实施例,在上述实施例的基础上,生成的调查清单包括至少一个调查项目。每个调查项目至少包括:调查项目名称字段和调查项目内容字段。进一步,每个调查项目还包括:调查项目类型字段和调查原因字段。进一步,每个调查项目还包括调查结果字段,示例中未写出。项目类型为固定调查项目或自动调查项目;其中,固定调查项目是预先设定的调查项目,并存储在调查清单模板中。自动调查项目是基于岗位要求信息和职业征信信息的匹配而生成的调查项目。
以下给出三个调查清单的示例详细介绍调查清单。
示例1:调查清单表A
调查项目名称 调查项目内容 调查项目类型 调查原因
姓名 张三 固定
最高学历 博士 固定 岗位要求相关
离职状态 离职 自动 多个数据源冲突
如调查清单表A所示,该调查清单中包括三个调查项目:“姓名”“最高学历”和“离职状态”。其中,每个调查项目包括一下四个字段:调查项目名称字段、调查项目内容字段、调查项目类型字段和调查原因字段。其中,调查项目类型包括“固定”和“自动”两种类型。其中,“固定”表示该调查项目是一个必须考察的项目,该调查项目是在调查清单模板中预先设置好的。其中,“字段”表示该调查项目是一个非必须考察的项目,该调查项目并不是在调查清单模板中预先设置好的,而是基于岗位要求信息和职业征信信息的匹配而生成的。
在“姓名”这个调查项目中,调查项目内容字段为:张三。由于该字段为标识信息,不需要调查,因此,调查原因字段和调查结果字段中均为“无”。由于该标识信息是调查报告的一个必须字段,因此,调查项目类型字段为“固定”。
在“最高学历”这个调查项目中,调查项目内容字段为:博士。该字段最初可能由求职者简历中获得,最终通过访问高等院校服务器中的学历信息大数据获得。该字段为一个必须考察字段,因此,调查项目类型字段为“固定”。由于该调查项目与岗位要求相关,因此调查原因字段为“岗位要求相关”。
“离职状态”这个调查项目是自动生成,该字段不在固定的调查清单模板中出现,因此,调查项目类型字段为“自动”,意为服务器自动生成的一个调查项目。调查原因字段为“多个数据源冲突”,意味着从多个数据源获得的该求职者的离职状态冲突,例如,获取的社保信息显示仍然有雇主在为该求职者缴纳社保,与获取的该被调查者的求职简历中的“离职状态”为“离职”存在潜在冲突。
示例2:调查清单表B
调查项目名称 调查项目内容 调查项目类型 调查原因
姓名 赵四 固定
最高学历 博士 固定 岗位相关
软件工程师认证 高级 自动 岗位相关
项目经验 完成X项目开发 固定 核实
示例3:调查清单表C
其中,调查清单表B和表C是针对同一个被调查者赵四的不同的调查清单,之所以出现不同的调查清单是因为这两个调查清单分别是对应于企业客户端输入的不同的岗位要求信息自适应生成的。其中,表B是针对软件工程师岗位的一个调查清单。表C是针对项目经理岗位的一个调查清单。
其中,在调查清单表B中,倒数第二个字段是软件工程师认证的字段。该字段由服务器根据职业征信信息大数据与输入的岗位要求信息自动生成,该字段在众多职业征信信息大数据字段中与软件工程师相关度更高,因此出现在该清单中,同时可能抽取到简历信息中的“完成X项目开发”,以供后续人工核实。
在调查清单表C中,由于项目经理是一个管理性职位,因此调查清单中出现了与管理相关的字段。由于职业征信信息大数据中可能没有包含具体的信息,例如该字段所示状态为“管理团队人数未知”,该字段的调查原因意味着求职者曾经管理的团队人数并没有从职业征信信息大数据中得到。因此,尽管该调查项目中的调查项目内容字段中的没有有用信息,但仍然将其作为一个调查项目加入调查清单,以供后续人工核实。
在本发明提供的职业调查方法的第五实施例,在上述实施例的基础上,在获取到岗位要求信息和被调查者的职业征信信息之前,包括:建立调查清单生成模型,基于大量的调查清单以及相对应的岗位需求信息对调查清单生成模型进行训练,得到训练后的调查清单生成模型。在获取到岗位要求信息和被调查者的职业征信信息之后,还包括:将岗位要求信息和被调查者的职业征信信息输入训练后的调查清单生成模型,得到与岗位要求信息相关联的字段。
图3是本发明提供的职业调查方法的第一实施例的模块关系示意图。
如图3所示,在本实施例中,职业调查系统,包括:标识信息获取模块、岗位需求信息获取模块、职业征信信息获取模块、评估模块和调查清单生成模块。
其中,标识信息获取模块,用于获取被调查者的标识信息。
其中,被调查者的标识信息指的是能够标识调查者的身份的信息,被调查者的标识信息包括以下信息中的至少一种:身份证号码、姓名、性别、学历编号、驾驶证编号、社保卡编号、银行卡号、信用卡号、社交软件账户信息(例如QQ账户、微信账户、百度账户、新浪微博账户、智联招聘账户、钉钉账户)、购物软件账户信息(例如淘宝账户信息、聚美账户信息、京东账户信息)。
岗位需求信息获取模块,用于获取岗位要求信息。
其中,岗位要求信息指的是招聘企业对待招聘的岗位的需求信息。在一实施例中,岗位要求信息采用结构化字段的格式;其中,每个岗位要求信息包括至少一个结构化字段;每个结构化字段包括标签字段和与标签字段对应的内容字段。在另一实施例中,岗位要求信息采用文字描述的格式。
职业征信信息获取模块,用于基于标识信息进行检索,得到被调查者的职业征信信息。
其中,服务器在获取到标识信息之后,可以通过网络以及信息获取算法,例如爬虫技术,获取与被调查者人相关的至少一个职业征信信息。其中,职业征信信息包括一下信息中的至少一个:企业工商注册信息、司法诉讼信息、学历信息、社交信息、金融信息、购物信息和旅行信息。
服务器在获取到标识信息之后,还可以通过数据库或服务器接口,获取与被调查者人相关的至少一个职业征信信息。例如,通过访问国家机构的服务器获取,具体地,通过访问工商局的服务器获取企业注册信息,通过访问司法机构的服务器获取的诉讼信息,通过访问高等院校的服务器获取学历信息。再例如,通过访问社交软件的服务器获取社交信息(好友列表、旅行地点等)。再例如,通过访问购物软件的服务器获取购物信息。再例如,通过访问金融机构的服务器获取金融信息(借贷、还款、信用卡额度等信息)。
评估模块,用于从职业征信信息中提取与岗位要求信息相关联的字段。
其中,评估模块在得到被调查者的职业征信信息之后,还用于对职业征信信息进行处理,得到至少一个结构化字段。其中,职业征信信息的结构化与描述性岗位要求信息的结构化可以是相同的,也可以是不同的。甚至获取的职业征信信息就是结构化数据,例如专利的著录项目。
评估模块可以采用直接或间接的方式从职业征信信息中提取与岗位要求信息相关联的字段。具体地,在一个实施例中,基于预设的职业征信字段库,从职业征信信息中获取与预设的职业征信字段库中的职业征信字段相匹配的字段,并基于获取的字段形成结构化字段;在另一个实施例中,对职业征信信息进行推测,得到结构化字段。其中,推测包括使用大数据统计分析,提取非直接关联或潜在风险因素的字段。
从职业征信信息中提取与岗位要求信息相关联的字段,包括:基于岗位要求信息中的每个结构化字段,从职业征信信息中提取与每个结构化字段相关联的字段。其中,相关联的字段可以是与岗位要求信息关联度较强的字段,也可以是高风险的字段。
调查清单生成模块,用于将与岗位要求信息相关联的字段填入预存的调查清单模板中,生成调查清单。
本发明提供的职业调查方法的第二实施例中,岗位要求信息采用文字描述格式。在上述实施例的基础上,还包括岗位要求信息处理模块,该模块用于基于预设的关键词库从所述岗位要求信息中提取与所述关键词库中的关键词相匹配的字段;并通过提取的字段和职业征信信息之间的关联度对岗位要求信息进行拆分,得到至少一个结构化字段;其中,每个结构化字段包括标签字段和与标签字段对应的内容字段。
本发明提供的职业调查方法的第三实施例中,在上述实施例的基础上,所述职业征信信息获取模块包括:访问请求发送单元和职业征信信息获取单元。其中,访问请求发送单元,用于向存储有所述职业征信信息的服务器或服务器集群发送访问请求。其中,所述访问请求包括所述标识信息。职业征信信息获取单元,用于获取所述服务器反馈的与所述标识信息相匹配的职业征信信息。
本发明提供的职业调查方法的第四实施例中,在上述实施例的基础上,所述职业征信信息获取模块包括:访问请求发送单元、隐含信息获取单元和隐含信息处理单元。其中,访问请求发送单元,用于向存储有所述职业征信信息的服务器或服务器集群发送访问请求。其中,所述访问请求包括所述标识信息。隐含信息获取单元,用于获取所述服务器反馈的与所述标识信息相关联的隐含信息。隐含信息处理单元,用于对所述隐含信息进行处理,得到职业征信信息。其中,隐含信息是指,通过一个信息源获得标识关联的另外一个标识,再根据另外一个标识获得相关信息。例如,通过工商信息获得一个人持有的公司ID,并根据公司ID在司法纠纷中获得相关信息。该相关信息与该人不是直接关联,所以叫“隐含信息”。
其中,存储有所述职业征信信息的服务器或服务器集群包括一下服务器或服务器集群中的至少一种:存储有企业工商注册信息的服务器或服务器集群、存储有司法诉讼信息的服务器或服务器集群、存储有学历信息的服务器或服务器集群、存储有社交信息的服务器或服务器集群、存储有金融信息的服务器或服务器集群、存储有购物信息的服务器或服务器集群、存储有旅行信息的服务器或服务器集群。
本发明提供的职业调查方法的第五实施例中,还包括数据生成模块,用于对获取的职业征信信息进行处理,得到至少一个结构化字段;其中,每个结构化字段包含标签字段和与标签字段对应的内容字段。具体地,所述数据生成模块基于预设的职业征信字段库,从所述职业征信信息中获取与所述预设的职业征信字段库中的职业征信字段相匹配的字段,并基于获取的字段形成结构化字段。
本发明提供的职业调查方法的第六实施例中,还包括风险字段生成模块,该模块用于基于预设的风险字段库,从所述职业征信信息中获取与所述预设的风险字段库中的风险字段相匹配的字段,生成风险字段,并将风险字段发送至调查清单生成模块。调查清单生成模块用于将与所述风险字段填入预存的调查清单模板中,生成调查清单。
本发明提供的职业调查方法的第七实施例中,还包括风险字段排列模块,该模块用于根据每个字段的风险度对生成多个风险字段进行排列,并将排列结果发送至调查清单生成模块。
本发明提供的职业调查方法的第八实施例中,还包括相关联字段排列模块,该模块用于根据每个字段的关联度对多个与所述岗位要求信息相关联的字段进行排列,并将排列结果发送至调查清单生成模块。
本发明提供的职业调查方法的第九实施例中,生成的所述调查清单包括至少一个调查项目;每个所述调查项目至少包括:调查项目名称字段和调查项目内容字段;进一步,每个所述调查项目还包括:调查类型字段和调查原因字段。调查项目包括固定调查项目和自动调查项目;所述固定调查项目是预先设定的调查项目,并存储在所述调查清单模板中;所述自动调查项目是基于所述岗位要求信息和所述职业征信信息的匹配而生成的调查项目。
本发明提供的职业调查方法的第十实施例中,还包括:模型训练模块,用于基于大量的调查清单以及相对应的岗位需求信息对建立的调查清单生成模型进行训练,得到训练后的调查清单生成模型。在获取到岗位要求信息和被调查者的职业征信信息之后,将岗位要求信息和被调查者的职业征信信息输入所述训练后的调查清单生成模型,得到与所述岗位要求信息相关联的字段。
如图4所示,本发明还提供了一种计算机设备,包括:一个或多个处理器以及存储器,图4中以一个处理器为例。
处理器、存储器可以通过总线或其他方式连接,图4中以通过总线连接的方式为例。
本领域技术人员可以理解,图4中示出的计算机设备的结构并不构成对本发明实施例的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
处理器可以由集成电路(IntegratedCircuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器可以仅包括中央处理器(CentralProcessingUnit,简称CPU),也可以是CPU、数字信号处理器(digitalsignalprocessor,简称DSP)、图形处理器(GraphicProcessingUnit,简称GPU)及各种控制芯片的组合。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机课执行程序以及模块,如本申请实施例中的职业调查系统对应的程序模块(例如,附图3所示的标识信息获取模块、岗位需求信息获取模块、职业征信信息获取模块、评估模块和调查清单生成模块)。处理器通过运行存储在存储器的非暂态软件程序以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述职业调查方法实施例的处理方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;在本发明实施例中,操作系统可以是Android系统、iOS系统或Windows操作系统等等。存储数据区可存储依据职业调查系统的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或者其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器。上述网络的实施例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (10)

1.一种职业调查方法,其特征在于,包括:
获取被调查者的标识信息和岗位要求信息;
基于所述标识信息进行检索,得到被调查者的职业征信信息;
从所述职业征信信息中提取与所述岗位要求信息相关联的字段;
将与所述岗位要求信息相关联的字段填入预存的调查清单模板中,生成调查清单。
2.根据权利要求1所述的方法,其特征在于,所述岗位要求信息采用结构化字段的格式;其中,每个岗位要求信息包括至少一个结构化字段。
3.根据权利要求1所述的方法,其特征在于,所述岗位要求信息采用文字描述的格式;
在获取所述岗位要求信息之后,还包括:
基于预设的关键词库从所述岗位要求信息中提取与所述关键词库中的关键词相匹配的字段;
通过提取的字段和职业征信信息之间的关联度对岗位要求信息进行拆分,得到至少一个结构化字段。
4.根据权利要求2或3所述的方法,其特征在于,从所述职业征信信息中提取与所述岗位要求信息相关联的字段,包括:
基于所述岗位要求信息中的每个结构化字段,从所述职业征信信息中提取与每个结构化字段相关联的字段。
5.根据权利要求1所述的方法,其特征在于,所述职业征信信息包括以下信息中的至少一种:企业工商注册信息、司法诉讼信息、学历信息、社交信息、金融信息、购物信息和旅行信息。
6.根据权利要求1所述的方法,其特征在于,在所述得到被调查者的职业征信信息之后,还包括:
对职业征信信息进行处理,得到至少一个结构化字段。
7.根据权利要求1所述的方法,其特征在于,所述将与所述岗位要求信息相关联的字段还包括风险字段;
从所述职业征信信息中提取与所述岗位要求信息相关联的字段还包括:
基于预设的风险字段库,从所述职业征信信息中获取与所述预设的风险字段库中的风险字段相匹配的字段,生成风险字段。
8.根据权利要求7所述的方法,其特征在于,
生成的所述调查清单中,包括多个风险字段,所述多个风险字段根据每个字段的风险度而排序。
9.根据权利要求1所述的方法,其特征在于,
生成的所述调查清单中,包括多个与所述岗位要求信息相关联的字段,所述多个与所述岗位要求信息相关联的字段根据每个字段的关联度而排序。
10.根据权利要求1所述的方法,其特征在于,
生成的所述调查清单中,多个字段根据字段之间的关联度组成字段组。
CN201810215341.9A 2018-03-15 2018-03-15 一种职业调查方法和系统 Pending CN108564333A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810215341.9A CN108564333A (zh) 2018-03-15 2018-03-15 一种职业调查方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810215341.9A CN108564333A (zh) 2018-03-15 2018-03-15 一种职业调查方法和系统

Publications (1)

Publication Number Publication Date
CN108564333A true CN108564333A (zh) 2018-09-21

Family

ID=63531778

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810215341.9A Pending CN108564333A (zh) 2018-03-15 2018-03-15 一种职业调查方法和系统

Country Status (1)

Country Link
CN (1) CN108564333A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457424A (zh) * 2019-06-28 2019-11-15 谭浩 生成访谈报告的方法、计算机可读存储介质和终端设备
CN114240339A (zh) * 2021-11-30 2022-03-25 支付宝(杭州)信息技术有限公司 背景调查方法、装置、存储介质及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315682A (zh) * 2007-05-28 2008-12-03 上海易米信息科技有限公司 基于互联网的个人简历数据库的处理方法
CN101315681A (zh) * 2007-05-28 2008-12-03 上海易米信息科技有限公司 基于互联网的个人简历的背景调查方法
CN101826190A (zh) * 2009-03-03 2010-09-08 一零四管理顾问股份有限公司 求职履历的评价方法
CN105678510A (zh) * 2015-12-31 2016-06-15 北京擎宇信息技术有限公司 一种在线面试的方法与系统
CN106384230A (zh) * 2016-10-21 2017-02-08 北京搜前途科技有限公司 简历中工作经历与招聘职位及简历与招聘信息的匹配方法
CN106874470A (zh) * 2017-02-16 2017-06-20 季春庆 一种人员信息评测方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315682A (zh) * 2007-05-28 2008-12-03 上海易米信息科技有限公司 基于互联网的个人简历数据库的处理方法
CN101315681A (zh) * 2007-05-28 2008-12-03 上海易米信息科技有限公司 基于互联网的个人简历的背景调查方法
CN101826190A (zh) * 2009-03-03 2010-09-08 一零四管理顾问股份有限公司 求职履历的评价方法
CN105678510A (zh) * 2015-12-31 2016-06-15 北京擎宇信息技术有限公司 一种在线面试的方法与系统
CN106384230A (zh) * 2016-10-21 2017-02-08 北京搜前途科技有限公司 简历中工作经历与招聘职位及简历与招聘信息的匹配方法
CN106874470A (zh) * 2017-02-16 2017-06-20 季春庆 一种人员信息评测方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457424A (zh) * 2019-06-28 2019-11-15 谭浩 生成访谈报告的方法、计算机可读存储介质和终端设备
CN114240339A (zh) * 2021-11-30 2022-03-25 支付宝(杭州)信息技术有限公司 背景调查方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
US20210232608A1 (en) Trust scores and/or competence ratings of any entity
US12003393B2 (en) Parallel computational framework and application server for determining path connectivity
US20210174440A1 (en) Providing virtual markers based upon network connectivity
US9684905B1 (en) Systems and methods for data verification
US20210287303A9 (en) Scoring trustworthiness, competence, and/or compatibility of any entity for activities including recruiting or hiring decisions, composing a team, insurance underwriting, credit decisions, or shortening or improving sales cycles
US20130232045A1 (en) Automatic Detection Of Fraud And Error Using A Vector-Cluster Model
US20120330819A1 (en) System and method for locating and accessing account data
US20090265392A1 (en) Data verifying device, data verifying method, and data verifying program
US20160004984A1 (en) Service oriented architecture optimization system and method
US20230116362A1 (en) Scoring trustworthiness, competence, and/or compatibility of any entity for activities including recruiting or hiring decisions, composing a team, insurance underwriting, credit decisions, or shortening or improving sales cycles
CN109345417A (zh) 基于身份认证的业务人员的在线考核方法及终端设备
CN111028072A (zh) 一种供应链金融贷前尽调数据处理方法及系统
CN112598249A (zh) 一种对象评价方法、装置及设备
CN107908979A (zh) 用于在区块链中进行配置和背书的方法和电子设备
DE102014116982B4 (de) Sich seiner selbst bewusstes Token
CN108564333A (zh) 一种职业调查方法和系统
US11102311B2 (en) Registration during downtime
WO2017021998A1 (ja) 電子稟議書の更新方法およびシステム
JP5963998B1 (ja) 与信事務管理システムおよびその方法
JP2018142284A (ja) リスク算出装置、リスク算出装置を搭載するリスク判定装置及びリスク算出方法
US20180089445A1 (en) Access control device, method and program
US20130262327A1 (en) Method for divorce disclosure processing
US20170011456A1 (en) System and method for an electronic consumer debt extinguishment process
CN114022166B (zh) 一种信息处理方法、装置、计算机设备及存储介质
CN112115137B (zh) 数据配置方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180921