CN113064975A - 基于ai深度学习的人力资源数据处理系统及方法 - Google Patents

基于ai深度学习的人力资源数据处理系统及方法 Download PDF

Info

Publication number
CN113064975A
CN113064975A CN202110401236.6A CN202110401236A CN113064975A CN 113064975 A CN113064975 A CN 113064975A CN 202110401236 A CN202110401236 A CN 202110401236A CN 113064975 A CN113064975 A CN 113064975A
Authority
CN
China
Prior art keywords
error correction
human resource
text information
resource data
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110401236.6A
Other languages
English (en)
Inventor
周进龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Nuojin System Integration Co ltd
Original Assignee
Shenzhen Nuojin System Integration Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Nuojin System Integration Co ltd filed Critical Shenzhen Nuojin System Integration Co ltd
Priority to CN202110401236.6A priority Critical patent/CN113064975A/zh
Publication of CN113064975A publication Critical patent/CN113064975A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于AI深度学习的人力资源数据处理系统及方法,该方法包括步骤:响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息;基于所述纠错前文本信息识别所述人力资源数据的种类;基于预设映射关系,选取所述种类对应的预设文本纠错细分模型;输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息,并返回所述目标纠错后文本信息至所述客户端。本发明提高了训练该预设文本纠错细分模型的训练数据集的数据关联度,从而提高了对人力资源数据的纠错前文本信息进行纠错的纠错效果,进而提高了对人力资源数据的纠错前文本信息进行纠错的纠错准确率。

Description

基于AI深度学习的人力资源数据处理系统及方法
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于AI深度学习的人力资源数据处理系统及方法。
背景技术
在人力资源相关人员输入人力资源数据的过程中,多字、错字和漏字情况时常发生,为避免人力资源数据存在错误,需要人工反复校对,这在一定程度上降低了使用人力资源数据(例如通过人力资源数据确定员工的工作绩效)的效率,为了解决这个问题,对人力资源数据的文本进行纠错的自动化与智能化是十分必要的。
目前已有的文本纠错的方法在对人力资源数据的文本进行纠错时,由于人力资源数据的数据量庞大,导致在纠错时需要考虑较多的纠错相关因素,包括纠错相关的纠错模型在训练时需要大量的数据关联度不高的训练数据集,而通过数据关联度不高的训练数据集训练得到的纠错模型,其模型收敛时容易向一部分数据收敛,使得纠错效果并不好,在完成纠错后,文本中仍旧存在较多的错误。
由此可知,目前在对人力资源数据进行文本纠错时,存在纠错准确率低的问题。
发明内容
本发明的主要目的在于提供一种基于AI深度学习的人力资源数据处理系统及方法,旨在解决现有的对人力资源数据进行文本纠错时,存在纠错准确率低的技术问题。
为实现上述目的,本发明提供一种基于AI深度学习的人力资源数据处理方法,所述基于AI深度学习的人力资源数据处理方法包括步骤:
响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息;
基于所述纠错前文本信息识别所述人力资源数据的种类;
基于预设映射关系,选取所述种类对应的预设文本纠错细分模型;
输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息,并返回所述目标纠错后文本信息至所述客户端。
可选地,所述基于所述纠错前文本信息识别所述人力资源数据的种类,包括:
获取所述纠错前文本信息的种类判断特征信息;
基于所述种类判断特征信息识别所述人力资源数据的种类。
可选地,所述获取所述纠错前文本信息的种类判断特征信息,包括:
基于预设分词工具对所述纠错前文本信息进行分词处理,得到分词结果;
基于预设剔除规则,对所述分词结果进行剔除处理,得到种类判断特征信息。
可选地,所述输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息,包括:
将所述纠错前文本信息输入所述预设文本纠错细分模型,生成纠错编辑操作序列;所述预设文本纠错细分模型由预设标注编辑操作序列训练得到;所述预设标注编辑操作序列用于将预设错误文本信息转化为与所述预设错误文本信息对应的正确文本信息;
基于所述纠错编辑操作序列对所述纠错前文本信息进行纠错,得到目标纠错后文本信息。
可选地,所述基于所述纠错编辑操作序列对所述纠错前文本信息进行纠错,得到目标纠错后文本信息,包括:
基于所述纠错编辑操作序列对所述纠错前文本信息进行纠错,得到初始纠错后文本信息;
将所述初始纠错后文本信息输入所述预设文本纠错细分模型进行迭代纠错,得到更新后的纠错后文本信息,并确定所述更新后的纠错后文本信息是否满足预设迭代结束要求;
若所述更新后的纠错后文本信息满足所述预设迭代结束要求,则将所述更新后的纠错后文本信息作为目标纠错后文本信息;
若所述更新后的纠错后文本信息未满足所述预设迭代结束要求,则继续对所述更新后的纠错后文本信息进行迭代纠错更新,直至所述更新后的纠错后文本信息满足所述预设迭代结束要求。
可选地,所述响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息,包括:
当检测到人力资源管理人员通过客户端录入人力资源数据的录入操作时,获取人力资源数据的纠错前文本信息。
可选地,所述响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息,包括:
响应于人力资源数据获取指令,发送人力资源数据获取请求至人力资源数据库;
获取所述人力资源数据库反馈的人力资源数据的纠错前文本信息。
此外,为实现上述目的,本发明还提供一种基于AI深度学习的人力资源数据处理系统,所述基于AI深度学习的人力资源数据处理系统包括:至少一客户端和人力资源数据处理平台;
所述客户端包括发送模块和接收模块;
所述人力资源数据处理平台包括获取模块、识别模块、选取模块、输入模块和返回模块;
所述发送模块发送纠错请求至人力资源数据处理平台;
响应于所述纠错请求,所述获取模块获取人力资源数据的纠错前文本信息;
所述识别模块基于所述纠错前文本信息识别所述人力资源数据的种类;
所述选取模块基于预设映射关系,选取所述种类对应的预设文本纠错细分模型;
所述输入模块输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息,并返回所述目标纠错后文本信息至所述客户端;
所述接收模块接收人力资源数据处理平台返回的目标纠错后文本信息。
此外,为实现上述目的,本发明还提供一种基于AI深度学习的人力资源数据处理设备,所述基于AI深度学习的人力资源数据处理设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的基于AI深度学习的人力资源数据处理程序,所述基于AI深度学习的人力资源数据处理程序被所述处理器执行时实现如上所述的基于AI深度学习的人力资源数据处理方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于AI深度学习的人力资源数据处理程序,所述基于AI深度学习的人力资源数据处理程序被处理器执行时实现如上所述的基于AI深度学习的人力资源数据处理方法的步骤。
本发明通过响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息;基于所述纠错前文本信息识别所述人力资源数据的种类;基于预设映射关系,选取所述种类对应的预设文本纠错细分模型;输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息,并返回所述目标纠错后文本信息至所述客户端。本发明实现了对人力资源数据的文本进行纠错的过程的改进,具体地,在纠错时,先通过纠错前文本信息识别人力资源数据的种类,在确定该种类后,通过与该种类对应的预设文本纠错细分模型对该纠错前文本信息进行纠错,得到目标纠错后文本信息,而非直接对纠错前文本信息进行纠错,可以理解,预设文本纠错细分模型与人力资源数据的种类对应,即人力资源数据的文本由于归属的种类不同,而对应不同的纠错模型,使得预设文本纠错细分模型对应的数据量得到减少,提高了训练该预设文本纠错细分模型的训练数据集的数据关联度,从而提高了纠错效果,进而提高了纠错准确率。
附图说明
图1是本发明基于AI深度学习的人力资源数据处理方法第一实施例的流程示意图;
图2是本发明基于AI深度学习的人力资源数据处理装置较佳实施例的功能模块示意图;
图3是本发明实施例方案涉及的硬件运行环境的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种基于AI深度学习的人力资源数据处理方法,参照图1,图1为本发明基于AI深度学习的人力资源数据处理方法第一实施例的流程示意图。
本发明实施例提供了基于AI深度学习的人力资源数据处理方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。基于AI深度学习的人力资源数据处理方法可应用于人力资源数据处理平台,为了便于描述,以下省略执行主体描述基于AI深度学习的人力资源数据处理方法的各个步骤。基于AI深度学习的人力资源数据处理方法包括:
步骤S10,响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息。
具体地,在接收到客户端的纠错请求时,响应于该客户端的纠错请求,获取人力资源数据的纠错前文本信息。需要说明的是,纠错请求包括主动请求和被动请求。其中,主动请求为该客户端需要使用人力资源数据时对应的请求,例如人力资源管理人员调用人力资源数据时、人力资源数据管理人员对人力资源数据进行定期维护(纠错)等;被动请求为客户端无需使用人力资源数据时对应的请求,例如人力资源管理人员录入人力资源数据。
需要说明的是,人力资源数据除数字外,多以文本的形式进行记录、存储、使用,该文本形式的人力资源数据包括记录员工的住址、部门等。
在一实施例中,所述响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息,包括:
步骤a,当检测到人力资源管理人员通过客户端录入人力资源数据的录入操作时,获取人力资源数据的纠错前文本信息。
具体的,针对被动请求的情况,在检测到人力资源管理人员通过客户端录入人力资源数据的录入操作时,需要对纠错前文本信息进行纠错,可以理解,出于时效方面的考虑,人力资源管理人员在录入人力资源速度时,其文字编辑速度一般较快,因此而导致的编辑错误包括错别字、多字、漏字较为常见。
需要说明的是,在人力资源管理人员录入人力资源数据时立即对其输入的文本进行纠错,一方面,可以节省等待纠错的时间(即在需要使用人力资源数据时直接获取并使用即可而无需等待对人力资源数据的文本进行纠错的过程);另一方面,由于纠错发生在人力资源管理人员输入文本的过程,因此,纠错的结果可由人力资源管理人员进一步确定,例如向人力资源管理人员根据预判的纠错概率,输出多种备选纠错方案,并向人力资源管理人员提供确定最终的纠错方案的功能,以提高纠错的准确率。
需要说明的是,在人力资源管理人员录入人力资源数据时立即对其输入的文本进行纠错,不仅能提高当前对人力资源数据的文本进行纠错的准确性,还可进一步提高对文本进行纠错的模型的准确率。具体的,可建立实时反馈机制,即根据人力资源管理人员从多种备选纠错方案中确定的最终的纠错方案来更新输出的备选纠错方案,在该模型再次对该相同纠错问题进行纠错时,输出更新后的备选纠错方案,从而提高该模型的智能性,进而提高了人力资源管理人员在使用该模型时的体验以及提高了模型的准确率。
在其他实施例中,所述响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息,包括:
步骤b,响应于人力资源数据获取指令,发送人力资源数据获取请求至人力资源数据库。
具体地,针对主动请求的情况,人力资源管理人员在需要使用人力资源数据时,例如需要对人力资源数据进行统计、分析时,会通过客户端输入人力资源数据获取指令,响应于该人力资源数据获取指令,向存储有人力资源数据的人力资源数据库发送人力资源数据获取请求,以请求人力资源数据库反馈该人力资源数据获取请求对应的人力资源数据。
步骤c,获取所述人力资源数据库反馈的人力资源数据的纠错前文本信息。
具体地,获取该人力资源数据库反馈的人力资源数据,并获取该人力资源数据的纠错前文本信息。可以理解,对纠错前文本信息进行纠错发生于获取人力资源数据之后、显示人力资源数据的文本之前,以使人力资源管理人员看到的人力资源数据的文本是正确的文本。
此外,对于人力资源数据库中的人力资源数据,为节省人力资源管理人员等待文本纠错的时间或提高人力资源管理人员获取人力资源数据的体验,可在后台自行与该人力资源数据库进行交互以自行对人力资源数据库中的人力资源数据的文本进行纠错并根据经过纠错的文本更新人力资源数据库中对应的人力资源数据的文本。
步骤S20,基于所述纠错前文本信息识别所述人力资源数据的种类。
具体地,人力资源数据包括部门数据信息、职位数据信息、员工数据信息、招聘数据信息、管理数据信息等,因此,可根据上述数据的不同类型为人力资源数据进行分类,并得到分类结果,该分类结果包括部门类人力资源数据、职位类人力资源数据、员工类人力资源数据、招聘类人力资源数据、管理类人力资源数据等。
需要说明的是,不同类型的人力资源数据,其文本类型同样不同,可以理解,通过对文本的识别可以实现对人力资源数据的类型的识别。例如,部门类人力资源数据的文本多包括部门名称、部门职能等;职位类人力资源数据的文本多包括职位名称、职位职能等;员工类人力资源数据多包括员工姓名、员工住址、员工籍贯等;招聘类人力资源数据包括应聘人员的应聘部门、应聘人员的姓名、应聘人员的学历等;管理类人力资源数据包括管理制度、管理执行相关记录等。
基于纠错前文本信息可确定其对应的人力资源数据属于上述分类结果中的哪一类,即识别出该人力资源数据的种类。
进一步地,所述基于所述纠错前文本信息识别所述人力资源数据的种类,包括:
步骤d,获取所述纠错前文本信息的种类判断特征信息;
步骤e,基于所述种类判断特征信息识别所述人力资源数据的种类。
具体的,基于纠错前文本信息对人力资源数据的种类进行识别时,识别的是纠错前文本信息中的种类判断特征信息,以通过该种类判断特征信息来确定人力资源数据的种类,即在识别时,需要获取该纠错前文本信息的种类判断特征信息;并基于该种类判断特征信息识别人力资源数据的种类。
需要说明的是,该种类判断特征信息为纠错前文本信息中提取的关键字、词,可以理解,该关键字、词为可以唯一代表或组合后可以唯一代表人力资源数据的种类的标识。例如,在识别到纠错前文本信息中包括“XXX工程师”时,可以理解,“工程师”为一种职位,由此可确定该纠错前文本信息对应的人力资源数据的类型为职位类人力资源数据;又如,在识别到纠错前文本信息中包括部门名称和地名时,可以理解,部门名称可能出现在多种类型的人力资源数据的文本中,包括员工类人力资源数据和部门类人力资源数据,但在确定该纠错前文本信息仅可能属于员工类人力资源数据和部门类人力资源数据,若进一步确定纠错前文本信息中包括地名,可以理解,部门类人力资源数据的文本中不包含地名,则可确定该纠错前文本信息对应的人力资源数据的类型为员工类人力资源数据。
在一实施例中,所述获取所述纠错前文本信息的种类判断特征信息,包括:
步骤d1,基于预设分词工具对所述纠错前文本信息进行分词处理,得到分词结果;
步骤d2,基于预设剔除规则,对所述分词结果进行剔除处理,得到种类判断特征信息。
具体地,基于预设分词工具对纠错前文本信息进行分词,以得到分词结果。需要说明的是,对于纠错前文本信息为中文的情况,预设分词工具为中文分词工具,例如,SnowNLP、LTP(Language Technology Plantfoem,语言技术平台);对于纠错前文本信息为英文的情况,预设分词工具为英文文本分词(无空格)工具,例如,wordninja。
需要说明的是,上述基于种类判断特征信息识别人力资源数据的种类的过程可通过映射关系来实现,也可通过预设数据种类识别模型来完成。其中,预设数据种类识别模型可为训练RNN(Recurrent Neural Network,循环神经网络)或CNN(Convolutional NeuralNetworks,卷积神经网络)等用于文本分类的神经网络模型得到的识别模型。对于RNN对应的预设数据种类识别模型,其训练过程为:首先获取样本数据集中的文本集,并通过预设分词工具对文本进行分词;之后通过人工标注出该样本数据集中的各种类判断特征信息的种类;将上述标注好后的样本数据集以预设比例(如4:1、3:2等)分为训练集和测试集;设置预设层数(如6层、5层等)的中间层(隐藏层),并通过上述样本数据集对初始数据种类识别模型进行训练,以生成预设数据种类识别模型。
需要说明的是,分词结果中并非所有字或词均为关键字或词,因此,为避免非关键字或词对识别过程的干扰,以及避免通过对识别过程没有帮助的字或词进行识别,减少了识别过程所需要花费的时间,可通过预设剔除规则对该分词结果进行剔除处理,以剔除上述非关键字或词,从而得到关键字或词,即得到种类判断特征信息。特别地,对于通过预设数据种类识别模型来识别的情况,由于避免了非关键字或词对模型识别过程的干扰,还提高了通过模型进行识别的识别准确性。
步骤S30,基于预设映射关系,选取所述种类对应的预设文本纠错细分模型。
具体地,在确定上述人力资源数据的种类后,通过预设映射关系从纠错模型集合中选取该种类对应的预设文本纠错细分模型。其中,纠错模型集合中包括多个预设文本纠错细分模型,例如预设部门类文本纠错模型、预设职位类文本纠错模型,可以理解,不同类型的人力资源数据的文本对应不同的预设文本纠错细分模型,其中,人力资源数据与预设文本纠错细分模型之间存在一一对应关系,例如部门类人力资源数据与预设部门类文本纠错模型,即预设部门类文本纠错模型用于为部门类人力资源数据的纠错前文本信息进行纠错,而不为其他类型的人力资源数据进行纠错。可以理解,该一一对应关系即预设映射关系。
步骤S40,输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息,并返回所述目标纠错后文本信息至所述客户端。
具体地,输入纠错前文本信息至预设文本纠错细分模型,在预设文本纠错细分模型完成对纠错前文本信息的纠错后,得到纠错结果,即得到目标纠错后文本信息,并返回该目标纠错后文本信息至发出纠错请求的客户端。
需要说明的是,针对上述纠错过程,本实施例采用的是编辑距离(编辑距离是针对二个字符串的差异程度的量化量测,量测方式为确定至少需要进行多少次的处理才能将一个字符串变成另一个字符串)的思想来处理的,即,对于文本1转换为文本2(文本1与文本2不相同)的过程,需要通过一系列的处理(至少包括在文本1的任意一个位置添加一个字符、删去一个字符、替换一个字符中的至少一种)。例如文本1为“张三的部门为小手部”,文本2为“张三的部门为销售部”,为将文本1转换为文本2,需要在文本1中的“小手”替换为“销售”,即文本1转换为文本2的过程中替换了两个字符。
进一步地,所述输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息,包括:
步骤f,将所述纠错前文本信息输入所述预设文本纠错细分模型,生成纠错编辑操作序列;所述预设文本纠错细分模型由预设标注编辑操作序列训练得到;所述预设标注编辑操作序列用于将预设错误文本信息转化为与所述预设错误文本信息对应的正确文本信息。
具体地,将上述纠错前文本信息输入预设文本纠错细分模型,生成纠错编辑操作序列;该预设文本纠错细分模型由预设标注编辑操作序列训练得到;该预设标注编辑操作序列用于将预设错误文本信息转化为与预设错误文本信息对应的正确文本信息。需要说明的是,该预设标注编辑操作序列可由人工对预设错误文本信息进行标注得到,即人工对预设错误文本信息进行纠错,并将该纠错过程对应的编辑操作整理为预设标注编辑操作序列。
需要说明的是,该纠错编辑操作序列包括至少一个编辑操作,该编辑操作包括以下至少一种:保留当前字符(C)、删除当前字符(D)、在当前字符后面插入字符或字符串(A)。例如,文本3为“张三的的加在湖北武汉市”,文本4为“张三的家在湖北省武汉市”,将文本3转换为文本4的过程可为:保留字符“张”、保留字符“三”、保留字符“的”、删除字符“的”、删除字符“加”并在字符“加”后面插入字符“家”、保留字符“在”、保留字符“湖”、在字符“北”后面插入字符“省”,保留字符“武”、保留字符“汉”、保留字符“市”。
需要说明的是,由上述纠错前文本信息得到纠错编辑操作序列需要通过预设序列到编辑操作的算法实现,该预设序列到编辑操作的算法可为seq2edit算法,其具体地实现过程为:
通过一系列的编辑操作(例如C、A)可以将错误文本信息转化为正确文本信息,从而通过各编辑操作生成编辑操作序列,例如,错误文本信息为“张三加在上海”,正确文本信息为“张三家在上海”,只需要将字符“加”删除并在字符“加”后面插入字符“家”,因此,生成的编辑操作序列为“CCDACCC”,本实施例对该编辑操作序列进行了优化,提出了一个新的编辑操作将当前字符替换成字符或字符串(R),可以理解,“替换”的编辑操作可替代“删除”和“插入”的编辑操作的组合,即经过优化后的编辑操作序列为“CCRCCC”,可以理解,优化后的编辑操作序列得到了简化,从而提高了预设文本纠错细分模型在生成编辑操作序列时的效率。
步骤g,基于所述纠错编辑操作序列对所述纠错前文本信息进行纠错,得到目标纠错后文本信息。
具体地,在得到纠错编辑操作序列后,通过该纠错编辑操作序列对纠错前文本信息进行纠错,以得到目标纠错后文本信息。
在一实施例中,为进一步提高纠错的准确率,所述基于所述纠错编辑操作序列对所述纠错前文本信息进行纠错,得到目标纠错后文本信息,包括:
步骤g1,基于所述纠错编辑操作序列对所述纠错前文本信息进行纠错,得到初始纠错后文本信息。
具体地,基于纠错编辑操作序列对纠错前文本信息进行纠错编辑操作以完成对纠错前文本信息的纠错,得到初始纠错后文本信息,该初始纠错后文本信息与正确文本信息之间可能存在一定的差距,即初始纠错后文本不一定是正确文本信息,例如初始纠错后文本信息还需要经过一个或多个编辑操作后才能转化为正确文本信息。
步骤g2,将所述初始纠错后文本信息输入所述预设文本纠错细分模型进行迭代纠错,得到更新后的纠错后文本信息,并确定所述更新后的纠错后文本信息是否满足预设迭代结束要求。
具体地,为避免纠错前文本信息在经过预设文本纠错细分模型进行一次纠错之后得到的纠错后文本信息仍不是正确文本信息,本实施提出将初始纠错后文本信息输入预设文本纠错细分模型进行迭代纠错,得到更新后的纠错后文本信息,并确定更新后的纠错后文本信息是否满足预设迭代结束要求,以改善上述得不到正确文本信息的问题。需要说明的是,该预设迭代结束要求可以为更新后的纠错后文本信息的准确率满足不需要再次迭代更新的要求,例如准确率达到95%时则结束迭代更新;也可以为迭代更新次数达到预设阈值,该预设阈值可根据具体情况设置,本实施例不做具体限制。
步骤g3,若所述更新后的纠错后文本信息满足所述预设迭代结束要求,则将所述更新后的纠错后文本信息作为目标纠错后文本信息;
步骤g4,若所述更新后的纠错后文本信息未满足所述预设迭代结束要求,则继续对所述更新后的纠错后文本信息进行迭代纠错更新,直至所述更新后的纠错后文本信息满足所述预设迭代结束要求。
具体地,若更新后的纠错后文本信息满足预设迭代结束要求,则将该更新后的纠错后文本信息作为目标纠错后文本信息;若更新后的纠错后文本信息未满足预设迭代结束要求,则继续对更新后的纠错后文本信息进行迭代纠错更新,直至更新后的纠错后文本信息满足预设迭代结束要求,才停止迭代纠错并将该更新后的纠错后文本信息作为目标纠错后文本信息。
本实施例通过响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息;基于所述纠错前文本信息识别所述人力资源数据的种类;基于预设映射关系,选取所述种类对应的预设文本纠错细分模型;输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息,并返回所述目标纠错后文本信息至所述客户端。本发明实现了对人力资源数据的文本进行纠错的过程的改进,具体地,在纠错时,先通过纠错前文本信息识别人力资源数据的种类,在确定该种类后,通过与该种类对应的预设文本纠错细分模型对该纠错前文本信息进行纠错,得到目标纠错后文本信息,而非直接对纠错前文本信息进行纠错,可以理解,预设文本纠错细分模型与人力资源数据的种类对应,即人力资源数据的文本由于归属的种类不同,而对应不同的纠错模型,使得预设文本纠错细分模型对应的数据量得到减少,提高了训练该预设文本纠错细分模型的训练数据集的数据关联度,从而提高了纠错效果,进而提高了纠错准确率。
此外,本发明还提供了一种基于AI深度学习的人力资源数据处理系统,所述基于AI深度学习的人力资源数据处理系统包括:至少一客户端和人力资源数据处理平台;所述客户端包括发送模块和接收模块;所述人力资源数据处理平台包括获取模块、识别模块、选取模块、输入模块和返回模块;所述发送模块发送纠错请求至人力资源数据处理平台;响应于所述纠错请求,所述获取模块获取人力资源数据的纠错前文本信息;所述识别模块基于所述纠错前文本信息识别所述人力资源数据的种类;所述选取模块基于预设映射关系,选取所述种类对应的预设文本纠错细分模型;所述输入模块输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息,并返回所述目标纠错后文本信息至所述客户端;所述接收模块接收人力资源数据处理平台返回的目标纠错后文本信息。
本发明基于AI深度学习的人力资源数据处理系统具体实施方式与上述基于AI深度学习的人力资源数据处理方法各实施例基本相同,在此不再赘述。
此外,本发明还提供一种基于AI深度学习的人力资源数据处理装置,如图2所示,所述基于AI深度学习的人力资源数据处理装置包括:
获取模块10,用于响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息;
识别模块20,用于基于所述纠错前文本信息识别所述人力资源数据的种类;
选取模块30,用于基于预设映射关系,选取所述种类对应的预设文本纠错细分模型;
输入模块40,输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息;
返回模块50,用于返回所述目标纠错后文本信息至所述客户端。
进一步地,所述识别模块20包括:
第一获取单元,用于获取所述纠错前文本信息的种类判断特征信息;
识别单元,用于基于所述种类判断特征信息识别所述人力资源数据的种类。
进一步地,所述第一获取单元包括:
分词子单元,用于基于预设分词工具对所述纠错前文本信息进行分词处理,得到分词结果;
剔除子单元,用于基于预设剔除规则,对所述分词结果进行剔除处理,得到种类判断特征信息。
进一步地,所述输入模块40包括:
输入单元,用于将所述纠错前文本信息输入所述预设文本纠错细分模型,生成纠错编辑操作序列;
纠错单元,用于基于所述纠错编辑操作序列对所述纠错前文本信息进行纠错,得到目标纠错后文本信息。
进一步地,所述纠错单元包括:
纠错子单元,用于基于所述纠错编辑操作序列对所述纠错前文本信息进行纠错,得到初始纠错后文本信息;
输入子单元,用于将所述初始纠错后文本信息输入所述预设文本纠错细分模型进行迭代纠错,得到更新后的纠错后文本信息;
确定子单元,用于确定所述更新后的纠错后文本信息是否满足预设迭代结束要求;若所述更新后的纠错后文本信息满足所述预设迭代结束要求,则将所述更新后的纠错后文本信息作为目标纠错后文本信息;
迭代更新子单元,用于若所述更新后的纠错后文本信息未满足所述预设迭代结束要求,则继续对所述更新后的纠错后文本信息进行迭代纠错更新,直至所述更新后的纠错后文本信息满足所述预设迭代结束要求。
进一步地,所述获取模块10包括:
第二获取单元,用于当检测到人力资源管理人员通过客户端录入人力资源数据的录入操作时,获取人力资源数据的纠错前文本信息。
进一步地,所述获取模块10包括:
发送单元,用于响应于人力资源数据获取指令,发送人力资源数据获取请求至人力资源数据库;
第三获取单元,用于获取所述人力资源数据库反馈的人力资源数据的纠错前文本信息。
本发明基于AI深度学习的人力资源数据处理装置具体实施方式与上述基于AI深度学习的人力资源数据处理方法各实施例基本相同,在此不再赘述。
此外,本发明还提供一种基于AI深度学习的人力资源数据处理设备。如图3所示,图3是本发明实施例方案涉及的硬件运行环境的结构示意图。
需要说明的是,图3即可为基于AI深度学习的人力资源数据处理设备的硬件运行环境的结构示意图。
如图3所示,该基于AI深度学习的人力资源数据处理设备可以包括:处理器1001,例如CPU,存储器1005,人力资源管理人员接口1003,网络接口1004,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。人力资源管理人员接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选人力资源管理人员接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,基于AI深度学习的人力资源数据处理设备还可以包括RF(RadioFrequency,射频)电路,传感器、音频电路、WiFi模块等等。
本领域技术人员可以理解,图3中示出的基于AI深度学习的人力资源数据处理设备结构并不构成对基于AI深度学习的人力资源数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图3所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、人力资源管理人员接口模块以及基于AI深度学习的人力资源数据处理程序。其中,操作系统是管理和控制基于AI深度学习的人力资源数据处理设备硬件和软件资源的程序,支持基于AI深度学习的人力资源数据处理程序以及其它软件或程序的运行。
在图3所示的基于AI深度学习的人力资源数据处理设备中,人力资源管理人员接口1003主要用于连接终端,与终端进行数据通信,例如获取客户端发送的纠错请求;网络接口1004主要用于后台服务器,与后台服务器进行数据通信;处理器1001可以用于调用存储器1005中存储的基于AI深度学习的人力资源数据处理程序,并执行如上所述的基于AI深度学习的人力资源数据处理方法的步骤。
本发明基于AI深度学习的人力资源数据处理设备具体实施方式与上述基于AI深度学习的人力资源数据处理方法各实施例基本相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有基于AI深度学习的人力资源数据处理程序,所述基于AI深度学习的人力资源数据处理程序被处理器执行时实现如上所述的基于AI深度学习的人力资源数据处理方法的步骤。
本发明计算机可读存储介质具体实施方式与上述基于AI深度学习的人力资源数据处理方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,设备,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的较佳实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于AI深度学习的人力资源数据处理方法,其特征在于,所述基于AI深度学习的人力资源数据处理方法,包括以下步骤:
响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息;
基于所述纠错前文本信息识别所述人力资源数据的种类;
基于预设映射关系,选取所述种类对应的预设文本纠错细分模型;
输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息,并返回所述目标纠错后文本信息至所述客户端。
2.如权利要求1所述的基于AI深度学习的人力资源数据处理方法,其特征在于,所述基于所述纠错前文本信息识别所述人力资源数据的种类,包括:
获取所述纠错前文本信息的种类判断特征信息;
基于所述种类判断特征信息识别所述人力资源数据的种类。
3.如权利要求2所述的基于AI深度学习的人力资源数据处理方法,其特征在于,所述获取所述纠错前文本信息的种类判断特征信息,包括:
基于预设分词工具对所述纠错前文本信息进行分词处理,得到分词结果;
基于预设剔除规则,对所述分词结果进行剔除处理,得到种类判断特征信息。
4.如权利要求1所述的基于AI深度学习的人力资源数据处理方法,其特征在于,所述输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息,包括:
将所述纠错前文本信息输入所述预设文本纠错细分模型,生成纠错编辑操作序列;所述预设文本纠错细分模型由预设标注编辑操作序列训练得到;所述预设标注编辑操作序列用于将预设错误文本信息转化为与所述预设错误文本信息对应的正确文本信息;
基于所述纠错编辑操作序列对所述纠错前文本信息进行纠错,得到目标纠错后文本信息。
5.如权利要求4所述的基于AI深度学习的人力资源数据处理方法,其特征在于,所述基于所述纠错编辑操作序列对所述纠错前文本信息进行纠错,得到目标纠错后文本信息,包括:
基于所述纠错编辑操作序列对所述纠错前文本信息进行纠错,得到初始纠错后文本信息;
将所述初始纠错后文本信息输入所述预设文本纠错细分模型进行迭代纠错,得到更新后的纠错后文本信息,并确定所述更新后的纠错后文本信息是否满足预设迭代结束要求;
若所述更新后的纠错后文本信息满足所述预设迭代结束要求,则将所述更新后的纠错后文本信息作为目标纠错后文本信息;
若所述更新后的纠错后文本信息未满足所述预设迭代结束要求,则继续对所述更新后的纠错后文本信息进行迭代纠错更新,直至所述更新后的纠错后文本信息满足所述预设迭代结束要求。
6.如权利要求1所述的基于AI深度学习的人力资源数据处理方法,其特征在于,所述响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息,包括:
当检测到人力资源管理人员通过客户端录入人力资源数据的录入操作时,获取人力资源数据的纠错前文本信息。
7.如权利要求1所述的基于AI深度学习的人力资源数据处理方法,其特征在于,所述响应于客户端的纠错请求,获取人力资源数据的纠错前文本信息,包括:
响应于人力资源数据获取指令,发送人力资源数据获取请求至人力资源数据库;
获取所述人力资源数据库反馈的人力资源数据的纠错前文本信息。
8.一种基于AI深度学习的人力资源数据处理系统,其特征在于,所述基于AI深度学习的人力资源数据处理系统包括:至少一客户端和人力资源数据处理平台;
所述客户端包括发送模块和接收模块;
所述人力资源数据处理平台包括获取模块、识别模块、选取模块、输入模块和返回模块;
所述发送模块发送纠错请求至人力资源数据处理平台;
响应于所述纠错请求,所述获取模块获取人力资源数据的纠错前文本信息;
所述识别模块基于所述纠错前文本信息识别所述人力资源数据的种类;
所述选取模块基于预设映射关系,选取所述种类对应的预设文本纠错细分模型;
所述输入模块输入所述纠错前文本信息至所述预设文本纠错细分模型,得到目标纠错后文本信息,并返回所述目标纠错后文本信息至所述客户端;
所述接收模块接收人力资源数据处理平台返回的目标纠错后文本信息。
9.一种基于AI深度学习的人力资源数据处理设备,其特征在于,所述基于AI深度学习的人力资源数据处理设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的基于AI深度学习的人力资源数据处理程序,所述基于AI深度学习的人力资源数据处理程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于AI深度学习的人力资源数据处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于AI深度学习的人力资源数据处理程序,所述基于AI深度学习的人力资源数据处理程序被处理器执行时实现如权利要求1至7中任一项所述的基于AI深度学习的人力资源数据处理方法的步骤。
CN202110401236.6A 2021-04-14 2021-04-14 基于ai深度学习的人力资源数据处理系统及方法 Pending CN113064975A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110401236.6A CN113064975A (zh) 2021-04-14 2021-04-14 基于ai深度学习的人力资源数据处理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110401236.6A CN113064975A (zh) 2021-04-14 2021-04-14 基于ai深度学习的人力资源数据处理系统及方法

Publications (1)

Publication Number Publication Date
CN113064975A true CN113064975A (zh) 2021-07-02

Family

ID=76566744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110401236.6A Pending CN113064975A (zh) 2021-04-14 2021-04-14 基于ai深度学习的人力资源数据处理系统及方法

Country Status (1)

Country Link
CN (1) CN113064975A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200175107A1 (en) * 2018-11-30 2020-06-04 MeVero Inc. method and system for passion identification of a user
CN112199945A (zh) * 2020-08-19 2021-01-08 宿迁硅基智能科技有限公司 一种文本纠错的方法和装置
CN112597754A (zh) * 2020-12-23 2021-04-02 北京百度网讯科技有限公司 文本纠错方法、装置、电子设备和可读存储介质
CN112632912A (zh) * 2020-12-18 2021-04-09 平安科技(深圳)有限公司 文本纠错方法、装置、设备及可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200175107A1 (en) * 2018-11-30 2020-06-04 MeVero Inc. method and system for passion identification of a user
CN112199945A (zh) * 2020-08-19 2021-01-08 宿迁硅基智能科技有限公司 一种文本纠错的方法和装置
CN112632912A (zh) * 2020-12-18 2021-04-09 平安科技(深圳)有限公司 文本纠错方法、装置、设备及可读存储介质
CN112597754A (zh) * 2020-12-23 2021-04-02 北京百度网讯科技有限公司 文本纠错方法、装置、电子设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN111198948B (zh) 文本分类校正方法、装置、设备及计算机可读存储介质
CN109918640B (zh) 一种基于知识图谱的中文文本校对方法
CN110580308B (zh) 信息审核方法及装置、电子设备、存储介质
CN108363701B (zh) 命名实体识别方法及系统
CN111582169A (zh) 图像识别数据纠错方法、装置、计算机设备和存储介质
CN112163424A (zh) 数据的标注方法、装置、设备和介质
CN108776677B (zh) 平行语句库的创建方法、设备及计算机可读存储介质
JP4998237B2 (ja) 論理構造モデル作成支援プログラム、論理構造モデル作成支援装置および論理構造モデル作成支援方法
CN112667697A (zh) 结合rpa和ai的房产信息的获取方法及装置
CN109933803B (zh) 一种成语信息展示方法、展示装置、电子设备及存储介质
CN112632912A (zh) 文本纠错方法、装置、设备及可读存储介质
CN116132527A (zh) 管理指示牌的系统、方法及数据处理服务器
CN116245177A (zh) 地理环境知识图谱自动化构建方法及系统、可读存储介质
CN115659226A (zh) 一种获取app标签的数据处理系统
CN113821554B (zh) 一种实现异构数据库数据采集的方法
CN117911039A (zh) 售后服务系统的控制方法、设备及存储介质
CN114398315A (zh) 一种数据存储方法、系统、存储介质及电子设备
CN113157978B (zh) 数据的标签建立方法和装置
CN111243593A (zh) 语音识别纠错方法、移动终端和计算机可读存储介质
CN110413518B (zh) 控件对象库的生成方法及生成装置和计算机可读存储介质
CN110134920A (zh) 绘文字兼容显示方法、装置、终端及计算机可读存储介质
CN113064975A (zh) 基于ai深度学习的人力资源数据处理系统及方法
CN116069842A (zh) 数据转储方法及装置
CN114154480A (zh) 信息提取方法、装置、设备和存储介质
CN114297229A (zh) 一种数据查询方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210702