CN107908704B - 专家匹配方法和装置以及存储介质 - Google Patents

专家匹配方法和装置以及存储介质 Download PDF

Info

Publication number
CN107908704B
CN107908704B CN201711090934.9A CN201711090934A CN107908704B CN 107908704 B CN107908704 B CN 107908704B CN 201711090934 A CN201711090934 A CN 201711090934A CN 107908704 B CN107908704 B CN 107908704B
Authority
CN
China
Prior art keywords
expert
information
keyword vector
resume
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711090934.9A
Other languages
English (en)
Other versions
CN107908704A (zh
Inventor
智强
霍东云
崔星汉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Scientistin Technology Co ltd
Original Assignee
Beijing Scientistin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Scientistin Technology Co ltd filed Critical Beijing Scientistin Technology Co ltd
Priority to CN201711090934.9A priority Critical patent/CN107908704B/zh
Publication of CN107908704A publication Critical patent/CN107908704A/zh
Application granted granted Critical
Publication of CN107908704B publication Critical patent/CN107908704B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Abstract

本发明涉及专家匹配方法和系统以及计算机存储介质。该专家匹配方法,包括:专家数据获取步骤,获取专家数据,所述专家数据包括专家的简历信息和/或作品信息,所述作品信息包括作品的概要或内容;专家数据分类步骤,按照技术领域对专家数据进行分类;类别关键词矢量和专家关键词矢量构建步骤,针对所获得的各个类别,确定各类别的关键词矢量和各专家的关键词矢量;需求信息获取步骤,获取对专家的需求信息;需求信息分类步骤,确定需求信息所涉及的技术领域;需求信息关键词矢量确定步骤,根据所述技术领域,确定所述需求信息的关键词矢量;匹配步骤,利用所述需求信息的关键词矢量和各专家的关键词矢量,确定与所述需求信息相匹配的专家。

Description

专家匹配方法和装置以及存储介质
技术领域
本发明涉及对专家的需求匹配。
背景技术
人才是重要的资源,如何找到好的专家人才对企业至关重要。目前企业有需求时,往往只能靠领导或员工的亲朋好友介绍,或者到招聘求职网站上自行用关键词(例如年龄、学历、工作内容等)进行搜索,或者坐等求职者投送简历。这些方法的效率都不高,而且有时结果因主观性较强而不尽人意。
发明内容
本发明鉴于现有技术的以上问题提出,用以克服或缓解现有技术中存在的一项或更多项问题,至少提供一种有益的选择。
为了实现以上的目的,根据本发明的一个方面,提供了一种专家匹配方法,包括:专家数据获取步骤,获取专家数据,所述专家数据包括各专家的简历信息和各该专家的作品信息;专家数据分类步骤,按照技术领域,根据所述作品信息对各所述专家进行分类;专家关键词矢量构建步骤,针对所获得的各个分类,确定各专家的关键词矢量,所述关键词量矢中包括的关键词基于该专家自身的简历以及该专家在该类别的作品的内容。
根据本发明的又一个方面,提供了一种专家匹配方法,包括:专家数据获取单元,获取专家数据,所述专家数据包括各专家的简历信息和各该专家的作品信息;专家数据分类单元,按照技术领域,根据所述作品信息对各所述专家进行分类;专家关键词矢量构建单元,针对所获得的各个分类,确定各专家的关键词矢量,所述关键词量矢中包括的关键词基于该专家自身的简历以及该专家在该类别的作品的内容。
根据本发明的另一方面,提供了一种存储介质,存储有计算机软件,在被处理器解释或编译后执行时,可以使所述处理器实现所要求权利的方法。
根据本发明的实施方式,可以更快更准确地寻找到合适的专家。
附图说明
图1示出了依据本发明一种实施方式的专家匹配方法的示意性流程图。
图2示出了依据本发明一种实施方式的专家匹配装置的示意性方框图。
具体实施方式
图1示出了依据本发明一种实施方式的专家匹配方法的示意性流程图。如图1所示,依据本发明的一种实施方式,首先在步骤S101,获取专家数据,所述专家数据包括各专家的简历信息和各该专家的作品信息,作品信息可以包括作品的概要或作品的内容(在本文中,作品的概要和作品的内容一并称为作品内容)。然后在步骤S102,对专家数据进行分类,即,按照技术领域,根据所述作品信息对各所述专家进行分类。在步骤S103,构建专家关键词矢量,即针对所获得的各个分类,确定各专家的关键词矢量,所述关键词量矢中包括的关键词基于该专家自身的简历以及该专家在该类别的作品的内容。如果一个专家被分入多个类别,则有多个关键词矢量。在步骤S104,获取对专家的需求信息。在步骤S105,确定需求信息所涉及的技术领域;在步骤S106,根据所涉及的技术领域,确定所述需求信息的关键词矢量,所述需求信息的关键词矢量包括多个关键词和各所述关键词的权重。如果该需求信息被分入多个技术领域,则获得多个关键词矢量。然后,在步骤S107,进行需求信息的关键词矢量与各类别专家的关键词矢量的匹配,从而为各需求找到适合的专家。
更具体地,在步骤S101收集专家的简历信息和作品信息。例如收集专家A的信息和专家A的作品;然后在步骤S102中,根据所收集的作品对专家进行分类。这可以通过例如聚类的方法进行。在一种实施方式中,例如对于专家A,如果收集的作品为“浅论CAD作图”、“CAD精确作图的几点体会”、“基于AutoCAD平台的机械制图考试软件的开发”、“计算机辅助设计(CAD)上机测试题库及其管理系统研究与开发”,则可以根据聚类法、词频法等提取这些作品内容或概要中的关键词,例如CAD、软件、考试、机械制图、开发等。根据这些关键词进行分类。也可以根据其整体的技术领域领域进行分类。可以采用本领域现在知悉以及未来可能知悉的各种方法来进行分类。一个专家可能会被分入多个技术领域。一方面是现在很多学科之间具有交叉,另一方面是有些专家自身多才多艺。因而根据本发明的一种实施方式,还包括简历重构步骤108,根据其作品,按类别对专家的简历进行重构。重构可以包括分割、添加、细化。分割是将一份简历分成两份简历,分别对应不同的技术领域。添加是将简历中不够完善的履历信息、著作情况、真正擅长事项等进行完善。细化是根据作品信息对其技术领域的细化。例如法学专家可以细化为刑法类专家、民法类专家、宪法类专家。而民法类专家可以更细化为合同法专家、婚姻法专家、劳动法专家等。
在步骤S103中,确定各专家的关键词矢量,所述关键词量矢中包括的关键词基于该专家自身的简历以及该专家在该类别的作品的内容。简历的重构可以使各专家的关键词矢量更加准确。
应该注意,步骤S102和S103可以同时完成,在本申请文件中,除非特殊说明,标号并不表示顺序,即便这些标号本身有大小。相同的关键词在不同的技术领域中,其权重可能不同。专家的关键词矢量可以包括关键词和关键词的权重。例如CAD在CAD作图类别中的权重可能占90%,而在软件开发类别中,可能权重仅占10%。例如可以形成(CAD 90%,作图50%,精确30%,软件开发10%,机械8%)这样的针对CAD类的矢量。
在步骤104中接收对专家的需求信息。需求信息例如“岗位职责:1、根据公司知识产权战略,负责公司知识产权相关工作;2、负责部门工作的统筹安排及团队建设;3、负责公司创新成果保护和专利布局;4、负责公司知识产权风险管控机制的建立及落实;5、负责应对专利诉讼及其他知识产权纠纷;6、负责公司各类合同中知识产权相关条款。任职要求:1、10年以上中大型企业或上市公司知识产权业务管理经验(具有专利诉讼经验者优先);2、本科以上学历,理工科或知识产权相关专业背景;3、精通知识产权各类业务,熟练掌握国内外专利法律法规;4、具备优秀的沟通协调组织能力,良好的团队协作精神,性格开朗,主动性强;5、能够以英语作为工作语言;6、具有专利代理人和律师资格者优先。”
然后在步骤S105,基于需求信息,确定该需求的技术领域。对于上述的需求信息,可以首先根据需求信息中的词频和对专家的分类确定类别,所确定的类别为所确定的专家类别中一种。例如上述的需求信息可能被分类为知识产权或专利。然后在步骤106,根据所确定类别,确定要在该需求信息中提取的关键词和关键词的权重。例如对于知识产权领域,“战略”、“布局”、“合同”可能权重比较高,可以率先提取,形成例如“知识产权80%,商标60%,专利50%,著作权30%,战略30%,布局20%,合同8%”的关键词矢量。对于专利领域,“创新成果”、“保护”的权重可能较高,可以率先提取,例如形成(专利80%,保护70%,无效60%,创新成果40%,战略20%,布局20%)的矢量。针对不同的技术领域,相同的需求会产生不同的关键词和关键词权重,即形成不同的关键词矢量,需求信息的关键词矢量应予所对应的类别的矢量相对应,具有可比较性。然后,在步骤S107,将需求信息的关键词矢量与对应类别中专家的关键词矢量进行匹配,从而找到合适的专家。例如,可以将所提取的关键词矢量与各专家的关键词矢量进行相似度匹配,从而实现对专家的查找。
在某些情况下,所获得的需求信息是简略的。过于简略的需求信息可能会导致匹配过多的专家,使得一些其实不符合条件的专家也出现在其中,降低了用户体验。
因而,根据本发明的一种实施方式,还包括类别关键词矢量构建步骤S109,针对所获得的各个分类,基于各分类中专家的作品,确定各分类的关键词矢量;预匹配步骤S110,将所述需求信息的关键词矢量与所述需求信息所涉及的分类的关键词矢量进行匹配;以及需求信息重构步骤S111,根据预匹配步骤S110的匹配结果对所述需求信息进行重构。这样,当需求信息与分类的信息相差较大时,可以补充和细化需求信息。例如如果需求信息进行简单地要求律师,由于从需求信息中获得的信息过于简略,和所各分类的关键词矢量距离过大,则可以进行补充,例如补充为专利律师、民法律师、刑法律师等。
在步骤S109,当收集了许多专家的作品信息时,可以根据基于这些专家的作品所获得关键词或关键词向量对这些专家进行分类,形成专家类别。某一类别的数量如果大于预定数量,则进一步分为小类。获得各专家类别或小类的关键词矢量。
应该注意,利用关键词和关键词权重来形成关键词矢量仅仅是构建关键词矢量的一种实施方式,可以采用其他的方式来构建关键词矢量。
本发明首先根据专家的简历和/或作品信息对专家进行分类,并进而确定各分类的关键词以及关键词的权重信息,对专家信息进行针对所在类别的关键词矢量调整,对需求信息首先进行分类,并根据分类所确定应提取的关键词,从而可以更好地进行与专家的匹配。
实践证明,依据本发明的方法,比采用常规的用对专家的需求和专家信息直接匹配的方法的匹配度要高,可以更快地发现所需的专家。
进一步,本发明可以包括专家信息和需求信息中的地域信息、性别信息、年龄信息、学历信息的收集和比对的步骤,从而初步或进一步限定专家。
图2示出了依据本发明一种实施方式的专家匹配装置的示意性方框图。对本发明装置的描述可以用来理解本发明的方法,对本发明方法的描述可以用来理解本发明的装置。
如图2所示,依据本发明的一种实施方式,首先专家数据获取单元201获取专家数据,所述专家数据包括各专家的简历信息和各该专家的作品信息,作品信息可以包括作品的概要或作品的内容(在本文中,作品的概要和作品的内容一并称为作品内容)。然后专家数据分类单元202,对专家数据进行分类,即,按照技术领域,根据所述作品信息对各所述专家进行分类。专家关键词矢量构建单元203构建专家关键词矢量,即针对所获得的各个分类,确定各专家的关键词矢量,所述关键词矢量中包括的关键词基于该专家自身的简历以及该专家在该类别的作品的内容。如果一个专家被分入多个类别,则有多个关键词矢量。需求信息获取单元204获取对专家的需求信息。需求信息分类单元205确定需求信息所涉及的技术领域,对需求信息进行分类;需求信息关键词矢量构建单元206根据所涉及的技术领域,确定所述需求信息的关键词矢量,所述需求信息的关键词矢量包括多个关键词和各所述关键词的权重。如果该需求信息被分入多个技术领域,则获得多个关键词矢量。然后,匹配单元207进行需求信息的关键词矢量与各类别专家的关键词矢量的匹配,从而为各需求找到适合的专家。
根据本发明的一种实施方式,该专家匹配装置还包括简历重构单元208,简历重构单元208根据专家的作品,按类别对专家的简历进行重构。重构可以包括分割、添加、细化。分割是将一份简历分成两份简历,分别对应不同的技术领域。添加是将简历中不够完善的履历信息、著作情况、真正擅长事项等进行完善。细化是根据作品信息对其技术领域的细化。例如法学专家可以细化为刑法类专家、民法类专家、宪法类专家。而民法类专家可以更细化为合同法专家、婚姻法专家、劳动法专家等。
根据本发明的一种实施方式,该专家匹配装置还包括类别关键词矢量构建单元209,针对所获得的各个分类,基于各分类中专家的作品,确定各分类的关键词矢量;预匹配单元210,将所述需求信息的关键词矢量与所述需求信息所涉及的分类的关键词矢量进行匹配;以及需求信息重构单元211,根据预匹配单元210的匹配结果对所述需求信息进行重构。这样,当需求信息与分类的信息相差较大时,可以补充和细化需求信息。例如如果需求信息进行简单地要求律师,由于从需求信息中获得的信息过于简略,和所各分类的关键词矢量距离过大,则可以进行补充,例如补充为专利律师、民法律师、刑法律师等。
本发明的装置可以由硬件实现,也可以由软件结合硬件实现。实现本发明的方法的软件可以存储早存储介质上,例如软盘、硬盘等。计算机和处理器执行所述软件可以实现本发明的方法。
以上对本发明的描述都是示例性的,不是对本发明保护范围的限制。对本领域熟悉的技术人员来说,可以在本发明的精神和范围内做各种变化或修正,这些都在本发明的保护范围内。

Claims (5)

1.一种专家匹配方法,包括以下步骤:
专家数据获取步骤,获取专家数据,所述专家数据包括各专家的简历信息和各该专家的作品信息;
专家数据分类步骤,按照技术领域,根据所述作品信息对各所述专家进行分类;
专家关键词矢量构建步骤,针对所获得的各个分类,确定各专家的关键词矢量,所述关键词矢量中包括的关键词基于该专家自身的简历以及该专家在该分类的作品的内容,针对不同的分类,对相同的关键词分别确定权重,
其中,所述方法还包括:
简历重构步骤,根据各所述专家的分类和作品信息,按分类对各该专家的简历进行重构,所述重构包括分割、添加或细化,分割是将一份简历分成两份简历,分别对应不同的技术领域;添加是将简历中不够完善的履历信息、著作情况进行完善;细化是根据作品信息对其技术领域的细化,其中,所述方法还包括:
需求信息获取步骤,获取对专家的需求信息;
需求信息分类步骤,确定需求信息所涉及的技术领域;
需求信息关键词矢量确定步骤,根据所述技术领域,确定所述需求信息的关键词矢量,所述需求信息的关键词矢量包括多个关键词和各所述关键词的权重;
匹配步骤,利用所述需求信息的关键词矢量和各专家的关键词矢量,确定与所述需求信息相匹配的专家。
2.根据权利要求1所述的专家匹配方法,其特征在于,还包括:
类别关键词矢量构建步骤,针对所获得的各个分类,基于各分类中专家的作品,确定各分类的关键词矢量;
预匹配步骤,将所述需求信息的关键词矢量与所述需求信息所涉及的分类的关键词矢量进行匹配;
需求信息重构步骤,根据所述预匹配步骤的匹配结果对所述需求信息进行重构。
3.一种存储介质,存储有计算机软件,所述计算机软件在被处理器解释或编译后执行时,使所述处理器实现权利要求1或2所述的方法。
4.一种专家匹配装置,包括:
专家数据获取单元,获取专家数据,所述专家数据包括各专家的简历信息和各该专家的作品信息;
专家数据分类单元,按照技术领域,根据所述作品信息对各所述专家进行分类;
专家关键词矢量构建单元,针对所获得的各个分类,确定各专家的关键词矢量,所述关键词矢量中包括的关键词基于该专家自身的简历以及该专家在该分类的作品的内容,针对不同的分类,对相同的关键词分别确定权重;以及
简历重构单元,根据各所述专家的分类和作品信息,按分类对各该专家的简历进行重构,所述重构包括分割、添加或细化,分割是将一份简历分成两份简历,分别对应不同的技术领域;添加是将简历中不够完善的履历信息、著作情况进行完善;细化是根据作品信息对其技术领域的细化,
其中,所述的专家匹配装置还包括:
需求信息获取单元,获取对专家的需求信息;
需求信息分类单元,确定需求信息所涉及的技术领域;
需求信息关键词矢量确定单元,根据所述技术领域,确定所述需求信息的关键词矢量,所述需求信息的关键词矢量包括多个关键词和各所述关键词的权重;
匹配单元,利用所述需求信息的关键词矢量和各专家的关键词矢量,确定与所述需求信息相匹配的专家。
5.根据权利要求4所述的专家匹配装置,其特征在于,还包括:
类别关键词矢量构建单元,针对所获得的各个分类,基于各分类中专家的作品,确定各分类的关键词矢量;
预匹配单元,将所述需求信息的关键词矢量与所述需求信息所涉及的分类的关键词矢量进行匹配;
需求信息重构单元,根据所述预匹配单元的匹配结果对所述需求信息进行重构。
CN201711090934.9A 2017-11-08 2017-11-08 专家匹配方法和装置以及存储介质 Active CN107908704B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711090934.9A CN107908704B (zh) 2017-11-08 2017-11-08 专家匹配方法和装置以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711090934.9A CN107908704B (zh) 2017-11-08 2017-11-08 专家匹配方法和装置以及存储介质

Publications (2)

Publication Number Publication Date
CN107908704A CN107908704A (zh) 2018-04-13
CN107908704B true CN107908704B (zh) 2024-04-23

Family

ID=61843617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711090934.9A Active CN107908704B (zh) 2017-11-08 2017-11-08 专家匹配方法和装置以及存储介质

Country Status (1)

Country Link
CN (1) CN107908704B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081617A (zh) * 2009-11-26 2011-06-01 英业达股份有限公司 在线咨询方法与系统
CN103123636A (zh) * 2011-11-21 2013-05-29 北京百度网讯科技有限公司 建立词条分类模型的方法、词条自动分类的方法和装置
CN106708924A (zh) * 2016-11-09 2017-05-24 上海知邦信息科技有限公司 一种咨询系统和方法
CN107274261A (zh) * 2017-06-05 2017-10-20 杭州王道起兮科技有限公司 B2b电子商务供需双边匹配方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080147630A1 (en) * 2006-10-27 2008-06-19 Kaiyi Chu Recommender and payment methods for recruitment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102081617A (zh) * 2009-11-26 2011-06-01 英业达股份有限公司 在线咨询方法与系统
CN103123636A (zh) * 2011-11-21 2013-05-29 北京百度网讯科技有限公司 建立词条分类模型的方法、词条自动分类的方法和装置
CN106708924A (zh) * 2016-11-09 2017-05-24 上海知邦信息科技有限公司 一种咨询系统和方法
CN107274261A (zh) * 2017-06-05 2017-10-20 杭州王道起兮科技有限公司 B2b电子商务供需双边匹配方法及系统

Also Published As

Publication number Publication date
CN107908704A (zh) 2018-04-13

Similar Documents

Publication Publication Date Title
Zhang et al. A research on an improved Unet-based concrete crack detection algorithm
CN108804641B (zh) 一种文本相似度的计算方法、装置、设备和存储介质
Maleki et al. A comprehensive literature review of the rank reversal phenomenon in the analytic hierarchy process
US9058327B1 (en) Enhancing training of predictive coding systems through user selected text
JP2021504789A (ja) Esg基盤の企業評価遂行装置及びその作動方法
CN110637316B (zh) 用于预期对象识别的系统和方法
US11023503B2 (en) Suggesting text in an electronic document
US20160217200A1 (en) Dynamic creation of domain specific corpora
CN112800173B (zh) 标准化数据库和医学文本库的构建方法、装置及电子设备
Pita et al. A Spark-based Workflow for Probabilistic Record Linkage of Healthcare Data.
CN112818162A (zh) 图像检索方法、装置、存储介质和电子设备
CN110968664A (zh) 一种文书检索方法、装置、设备及介质
US20210397905A1 (en) Classification system
Mohammadi et al. Weakly supervised learning and interpretability for endometrial whole slide image diagnosis
US11176311B1 (en) Enhanced section detection using a combination of object detection with heuristics
EP3828731A1 (en) A method and analytical engine for a semantic analysis of textual data
CN107908704B (zh) 专家匹配方法和装置以及存储介质
CN115617978A (zh) 指标名称检索方法、装置、电子设备及存储介质
CN108733702B (zh) 用户查询上下位关系提取的方法、装置、电子设备和介质
CN116415020A (zh) 一种图像检索的方法、装置、电子设备及存储介质
JP6026036B1 (ja) データ分析システム、その制御方法、プログラム、及び、記録媒体
US11501071B2 (en) Word and image relationships in combined vector space
CN112215006B (zh) 机构命名实体归一化方法和系统
CN113688854A (zh) 数据处理方法、装置及计算设备
Lapatta Ecotourism recommendations based on sentiments using skyline query and apache-spark

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant