CN118134441A - 一种基于rpa和ai的在线招聘信息发布方法及系统 - Google Patents

一种基于rpa和ai的在线招聘信息发布方法及系统 Download PDF

Info

Publication number
CN118134441A
CN118134441A CN202410394564.1A CN202410394564A CN118134441A CN 118134441 A CN118134441 A CN 118134441A CN 202410394564 A CN202410394564 A CN 202410394564A CN 118134441 A CN118134441 A CN 118134441A
Authority
CN
China
Prior art keywords
rpa
latency
recruitment
information
waiting time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410394564.1A
Other languages
English (en)
Other versions
CN118134441B (zh
Inventor
麦伟良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jishi Gongjiang Network Technology Co ltd
Original Assignee
Guangzhou Jishi Gongjiang Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jishi Gongjiang Network Technology Co ltd filed Critical Guangzhou Jishi Gongjiang Network Technology Co ltd
Priority to CN202410394564.1A priority Critical patent/CN118134441B/zh
Publication of CN118134441A publication Critical patent/CN118134441A/zh
Application granted granted Critical
Publication of CN118134441B publication Critical patent/CN118134441B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources
    • G06Q10/1053Employment or hiring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/19007Matching; Proximity measures
    • G06V30/19093Proximity measures, i.e. similarity or distance measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明具体涉及一种基于RPA和AI的在线招聘信息发布方法及系统,编程RPA机器人以模拟人类用户正常交互行为、设定合理访问间隔、随机化鼠标移动轨迹以及模拟键盘输入延迟;使用RPA机器人获取包含待招岗位信息和目标招聘网站信息,遵循目标招聘网站对应流程自动发布岗位信息到各个指定网站,发布后截屏并利用OCR确认发布成功,利用OCR确认发布成功的过程中利用Levenshtein距离算法来衡量OCR识别结果与可能正确答案之间的差异度,并据此推断最可能的正确文本。

Description

一种基于RPA和AI的在线招聘信息发布方法及系统
技术领域
本发明属于在线招聘信息领域,具体涉及一种基于RPA和AI的在线招聘信息发布方法及系统。
背景技术
RPA的招聘信息发布旨在高效、自动地在多个招聘网站发布招聘信息,一般包括:使用RPA机器人或专用装置作为执行主体,获取包含待招岗位标识(如“岗位1”、“岗位A2”)和目标招聘网站标识(如“网站1”、“网站B2”)的发布指令,来源可为客户端(如浏览器、App)或对话机器人。
根据待招岗位标识从存储的招聘信息库(如Excel、Word文件)中获取相应岗位的详细信息。
根据网站标识从发布流程库获取各网站的发布步骤(登录、填写、发布等),包括登录凭证(网址、账号、密码)。按照网站顺序或批量方式,遵循对应流程自动发布岗位信息到各个指定网站。发布后截屏并利用OCR确认发布成功,将结果反馈至客户端或邮箱。
现有的有关RPA的招聘信息发布技术,很多的技术问题:
部分招聘网站设有反爬虫措施,以防止自动化工具滥用。RPA机器人在执行发布流程时可能触发这些机制,被误判为恶意行为,导致发布受阻或账户被封禁。
利用OCR技术解析发布结果截图可能存在识别误差,尤其是在处理复杂排版、特殊字体、低质量图片或非标准格式文本时。识别错误可能影响发布结果的正确判断,导致误报或漏报。
发明内容
本发明的目的在于提供一种基于RPA和AI的在线招聘信息发布方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:
基于RPA和AI的在线招聘信息发布方法,包括步骤:
编程RPA机器人以模拟人类用户正常交互行为、设定合理访问间隔、随机化鼠标移动轨迹以及模拟键盘输入延迟;使用RPA机器人获取包含待招岗位信息和目标招聘网站信息,遵循目标招聘网站对应流程自动发布岗位信息到各个指定网站,发布后截屏并利用OCR确认发布成功,利用OCR确认发布成功的过程中利用Levenshtein距离算法来衡量OCR识别结果与可能正确答案之间的差异度,并据此推断最可能的正确文本。
优选的,使用RPA机器人获取包含待招岗位信息和目标招聘网站信息,遵循目标招聘网站对应流程自动发布岗位信息到各个指定网站,包括步骤:
待招岗位信息整理:收集待发布岗位的详细信息;目标招聘网站列表:确定要在哪些招聘网站发布岗位信息;安装并配置RPA工具,创建或导入RPA机器人项目,设置必要的环境变量、连接器、库依赖;编写RPA脚本模拟人类用户登录目标招聘网站;针对每个目标网站的发布流程,设计并编写相应的RPA脚本,覆盖以下环节:导航至发布页面:模拟点击菜单、链接或搜索关键词,到达岗位发布或编辑页面;填写岗位信息:根据待招岗位信息结构化数据,自动化填充发布表单的各项字段;提交发布:模拟点击“发布”、“保存”或“提交”按钮,完成岗位信息发布。
优选的,利用Levenshtein距离算法来衡量OCR识别结果与可能正确答案之间的差异度,并据此推断最可能的正确文本时,步骤:
设字符串`S`和`T`的长度分别为`m`和`n`,`D[i,j]`表示`S`的前`i`个字符与`T`的前`j`个字符之间的Levenshtein距离,`s[i]`和`t[j]`分别为`S`和`T`的第`i`个和第`j`个字符,则递推公式为:
其中`(s[i]!=t[j])`是一个条件表达式,当`s[i]`与`t[j]`相等时值为0,否则为1,表示是否需要进行替换操作,`D[m,n]`即为字符串`S`和`T`之间的Levenshtein距离;
根据招聘业务场景,获取或推断出可能正确的文本作为参考答案;
使用上述递推公式,计算OCR识别结果与可能正确答案之间的Levenshtein距离;
设定一个阈值`threshold`,如果Levenshtein距离小于等于`threshold`,则认为识别结果与可能正确答案的差异较小,可以接受;否则,识别结果可能存在较大误差,需要进一步处理;在多个识别结果中,选择与可能正确答案之间Levenshtein距离最小的识别结果作为最可能的正确文本。
优选的,编程RPA机器人以模拟人类用户正常交互行为、设定合理访问间隔、随机化鼠标移动轨迹以及模拟键盘输入延迟,具体步骤:使用支持高级交互功能的RPA工具,设置等待时间:在RPA流程中插入`Wait`或`Delay`动作,设定合理的延时以模拟人类阅读页面内容或思考的时间,在关键操作前后添加等待时间;动态调整间隔:根据实际网络状况、服务器响应速度因素,使用变量或函数动态计算等待时间,使其在一定范围内随机波动,更接近真实用户行为;模拟鼠标移动路径:编写代码直接指定鼠标从当前位置到目标元素之间的随机路径;在浏览器环境中模拟鼠标移动,通过JavaScript控制鼠标的移动轨迹,使其更加自然;插入键入延时:在RPA流程中为每个字符输入操作添加随机延时,模拟人类键入时的间隔;模拟击键速度:设置不同的击键速度,以模拟不同用户的打字习惯。
优选的,根据实际网络状况、服务器响应速度因素,使用变量或函数动态计算等待时间,使其在一定范围内随机波动,更接近真实用户行为,具体:
通过网络诊断工具获取网络延迟作为网络状况的量化指标;对于HTTP(S)请求,通过HTTP响应头中的`X-Response-Time`、`Server-Timing`字段获取服务器处理时间,或者使用第三方API获取页面加载时间;
通过RPA机器人在执行过程中实际测量服务器响应时间;将响应时间作为计算等待时间的一个重要因素,确保等待时间与服务器处理速度相匹配,公式:
```math
WaitTime=BaseWaitTime+α*ResponseTime
```其中:
`WaitTime`是最终计算出的等待时间;
`BaseWaitTime`是一个基本等待时间,作为最低等待值;
`α`是响应时间影响系数,表示响应时间对等待时间的影响程度;
`ResponseTime`是实际测量的服务器响应时间;
将网络延迟作为另一个计算等待时间的因素,确保在高延迟环境下增加等待时间,公式:
```math
WaitTime=BaseWaitTime+β*NetworkLatency
```
其中:
`WaitTime`是最终计算出的等待时间;
`BaseWaitTime`是一个基本等待时间,作为最低等待值;
`β`是网络延迟影响系数,表示网络延迟对等待时间的影响程度;
`NetworkLatency`是实际测量的网络延迟;
在计算出的基础等待时间上加上一个随机波动值,模拟人类操作的不确定性,公式:
```math
WaitTime=CalculatedWaitTime+RandomVariance
```
其中:
`CalculatedWaitTime`是根据服务器响应时间和网络延迟计算出的等待时间;
`RandomVariance`是一个在指定范围内的随机值,表示等待时间的随机波动。
优选的,待发布岗位的详细信息,包括但不限于职位名称、职位描述、任职要求、薪酬福利、工作地点、联系方式。优选的,RPA工具包括UiPath、Automation Anywhere、BluePrism。
有益效果:本申请通过模拟人类行为、动态调整访问间隔、运用Levenshtein距离算法优化OCR识别结果以及全面自动化岗位发布流程,显著改善了在线招聘信息发布的效率、成功率和准确性,有效解决了背景技术中提到的反爬虫问题、识别误差以及发布流程复杂性等技术难点。这种基于RPA和AI的在线招聘信息发布方法及系统不仅减轻了人力资源部门的工作负担,还确保了招聘信息的及时、准确发布,提升了企业在人才市场的竞争力。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请公开了基于RPA和AI的在线招聘信息发布方法,包括步骤:
编程RPA机器人以模拟人类用户正常交互行为、设定合理访问间隔、随机化鼠标移动轨迹以及模拟键盘输入延迟:
使用支持高级交互功能的RPA工具,如UiPath、Automation Anywhere、BluePrism、WorkFusion等。这些工具提供了丰富的API、库函数和设计模式,便于实现所需的模拟行为。
设置等待时间:
在RPA流程中插入适当的`Wait`或`Delay`动作,设定合理的延时(如5-10秒)以模拟人类阅读页面内容或思考的时间。在关键操作(如点击链接、提交表单)前后添加等待时间,避免过于频繁的操作引起反爬虫机制警觉。
动态调整间隔:
根据实际网络状况、服务器响应速度因素,使用变量或函数动态计算等待时间,使其在一定范围内随机波动,更接近真实用户行为,具体:
网络状况量化:
通过网络诊断工具(如ping命令、traceroute等)获取网络延迟(RTT)作为网络状况的量化指标。
对于HTTP(S)请求,通过HTTP响应头中的`X-Response-Time`、`Server-Timing`字段获取服务器处理时间,或者使用第三方API(如GTMetrix、WebPageTest)获取页面加载时间。
服务器响应速度量化:
通过RPA机器人在执行过程中实际测量服务器响应时间,如记录从发送请求到接收到响应的总耗时。
服务器响应时间(如HTTP请求的响应时间)可以反映当前网络状况和服务器负载。可以将响应时间作为计算等待时间的一个重要因素,确保等待时间与服务器处理速度相匹配。
公式:
```math
WaitTime=BaseWaitTime+α*ResponseTime
```
其中:
`WaitTime`是最终计算出的等待时间。
`BaseWaitTime`是一个基本等待时间,如5秒,作为最低等待值。
`α`是响应时间影响系数,通常在0到1之间,表示响应时间对等待时间的影响程度。
`ResponseTime`是实际测量的服务器响应时间(单位:秒)。
网络延迟(如Ping值)可以反映当前网络连接的延迟状况。可以将网络延迟作为另一个计算等待时间的因素,确保在高延迟环境下增加等待时间。
公式:
```math
WaitTime=BaseWaitTime+β*NetworkLatency
```
其中:
`WaitTime`是最终计算出的等待时间。
`BaseWaitTime`是一个基本等待时间,如5秒,作为最低等待值。
`β`是网络延迟影响系数,通常在0到1之间,表示网络延迟对等待时间的影响程度。
`NetworkLatency`是实际测量的网络延迟(单位:秒)。
为了更接近真实用户行为,可以在计算出的基础等待时间上加上一个随机波动值,模拟人类操作的不确定性。
公式:
```math
WaitTime=CalculatedWaitTime+RandomVariance
```
其中:
`CalculatedWaitTime`是根据服务器响应时间和网络延迟计算出的等待时间。
`RandomVariance`是一个在指定范围内的随机值,如[-1,1]秒,表示等待时间的随机波动。
伪代码示例
模拟鼠标移动路径:
编写代码直接指定鼠标从当前位置到目标元素之间的随机路径。例如,设置几个中间点,让鼠标沿折线而非直线移动到目标位置。
使用无头浏览器:
在浏览器环境中模拟鼠标移动。通过JavaScript或相关库(如Puppeteer)控制鼠标的移动轨迹,使其更加自然。插入键入延时:
在RPA流程中为每个字符输入操作添加微小的随机延时(如10-200毫秒),模拟人类键入时的间隔。
模拟击键速度:
设置不同的击键速度(如每分钟字符数),以模拟不同用户的打字习惯。
示例代码片段(以UiPath为例)
以下是一些使用UiPath实现模拟人类行为的示例代码片段:
使用RPA机器人获取包含待招岗位信息和目标招聘网站信息,遵循目标招聘网站对应流程自动发布岗位信息到各个指定网站:
待招岗位信息整理:收集待发布岗位的详细信息,包括但不限于职位名称、职位描述、任职要求、薪酬福利、工作地点、联系方式等,并将其整理成结构化的数据格式(如CSV、JSON或数据库记录)。
目标招聘网站列表:确定要在哪些招聘网站发布岗位信息,记录每个网站的名称、URL、API接口(如有)及所需登录凭据(如账号、密码、API密钥等)。
RPA机器人配置:安装并配置RPA工具(如UiPath、Automation Anywhere、BluePrism),创建或导入RPA机器人项目,设置必要的环境变量、连接器、库依赖等。
网站登录脚本:编写RPA脚本模拟人类用户登录目标招聘网站,包括输入用户名、密码、处理验证码(如有)、点击登录按钮等操作。
岗位发布脚本:针对每个目标网站的发布流程,设计并编写相应的RPA脚本,覆盖以下环节:
导航至发布页面:模拟点击菜单、链接或搜索关键词,到达岗位发布或编辑页面。
填写岗位信息:根据待招岗位信息结构化数据,自动化填充发布表单的各项字段。
上传附件(如有):自动上传职位描述文档、公司logo等附件。
提交发布:模拟点击“发布”、“保存”或“提交”按钮,完成岗位信息发布。
发布后截屏并利用OCR确认发布成功,利用OCR确认发布成功的过程中利用Levenshtein距离算法来衡量OCR识别结果与可能正确答案之间的差异度,并据此推断最可能的正确文本:
Levenshtein距离是一种衡量两个字符串之间差异的方法。其基本思想是计算由一个字符串转换成另一个字符串所需的最少单字符编辑(插入、删除或替换)次数。具体公式如下:
设字符串`S`和`T`的长度分别为`m`和`n`,`D[i,j]`表示`S`的前`i`个字符与`T`的前`j`个字符之间的Levenshtein距离,`s[i]`和`t[j]`分别为`S`和`T`的第`i`个和第`j`个字符,则递推公式为:
其中`(s[i]!=t[j])`是一个条件表达式,当`s[i]`与`t[j]`相等时值为0,否则为1,表示是否需要进行替换操作。最终,`D[m,n]`即为字符串`S`和`T`之间的Levenshtein距离。
操作步骤:
1.确定可能正确答案:根据招聘业务场景,获取或推断出可能正确的文本作为参考答案。
2.计算Levenshtein距离:使用上述递推公式,计算OCR识别结果与可能正确答案之间的Levenshtein距离。
3.差异度判断:设定一个阈值`threshold`,如果Levenshtein距离小于等于`threshold`,则认为识别结果与可能正确答案的差异较小,可以接受;否则,识别结果可能存在较大误差,需要进一步处理(如人工复核等)。
4.推断最可能正确文本:在多个识别结果中,选择与可能正确答案之间Levenshtein距离最小的识别结果作为最可能的正确文本。
示例代码:
本申请相对于背景的在线招聘信息发布技术,取得了以下进步和技术效果:
1.模拟人类行为以降低反爬虫风险:
高级交互功能集成:采用支持高级交互功能的RPA工具(如UiPath、AutomationAnywhere、Blue Prism等),能够更精确地模拟人类用户在网页上的正常交互行为,包括设定合理访问间隔、随机化鼠标移动轨迹以及模拟键盘输入延迟,有效地规避了招聘网站的反爬虫机制,降低了发布受阻或账户被封禁的风险。
2.动态调整访问间隔:
网络状况与服务器响应时间量化:通过网络诊断工具、HTTP响应头和第三方API等手段,量化网络延迟和服务器响应时间,作为计算等待时间的依据,提高了等待时间设置的精准度和适应性。
数学模型优化:引入响应时间影响系数(`α`)和网络延迟影响系数(`β`),以及随机波动值(`RandomVariance`),设计了基于实际网络状况和服务器响应速度的动态等待时间计算公式,确保等待时间与当前环境相匹配,增强了发布过程的真实性和成功率。
3.OCR识别结果验证与优化:
Levenshtein距离算法应用:引入Levenshtein距离算法,用于衡量OCR识别结果与可能正确答案之间的差异度,为识别结果的准确性提供了量化评估标准。
差异度判断与正确文本推断:通过设定阈值,对识别结果进行差异度判断,自动识别出与可能正确答案差异较小的识别结果,减少了人工干预需求。在多个识别结果中,选择Levenshtein距离最小的作为最可能的正确文本,进一步提高了识别准确性。
4.岗位发布流程全面自动化:
岗位信息与目标网站管理:对待招岗位信息进行细致整理,明确目标招聘网站列表,并配置RPA工具,为自动化发布坚实基础。
登录与发布脚本定制:针对每个目标网站,编写专门的登录脚本和岗位发布脚本,覆盖从导航到发布页面、填写岗位信息、上传附件到提交发布的全过程,确保了发布流程的针对性和成功率。
综上所述,本申请通过模拟人类行为、动态调整访问间隔、运用Levenshtein距离算法优化OCR识别结果以及全面自动化岗位发布流程,显著改善了在线招聘信息发布的效率、成功率和准确性,有效解决了背景技术中提到的反爬虫问题、识别误差以及发布流程复杂性等技术难点。这种基于RPA和AI的在线招聘信息发布方法及系统不仅减轻了人力资源部门的工作负担,还确保了招聘信息的及时、准确发布,提升了企业在人才市场的竞争力。
本申请需要保护的实施例包括:
基于RPA和AI的在线招聘信息发布方法,包括步骤:
编程RPA机器人以模拟人类用户正常交互行为、设定合理访问间隔、随机化鼠标移动轨迹以及模拟键盘输入延迟;使用RPA机器人获取包含待招岗位信息和目标招聘网站信息,遵循目标招聘网站对应流程自动发布岗位信息到各个指定网站,发布后截屏并利用OCR确认发布成功,利用OCR确认发布成功的过程中利用Levenshtein距离算法来衡量OCR识别结果与可能正确答案之间的差异度,并据此推断最可能的正确文本。
优选的,使用RPA机器人获取包含待招岗位信息和目标招聘网站信息,遵循目标招聘网站对应流程自动发布岗位信息到各个指定网站,包括步骤:
待招岗位信息整理:收集待发布岗位的详细信息;目标招聘网站列表:确定要在哪些招聘网站发布岗位信息;安装并配置RPA工具,创建或导入RPA机器人项目,设置必要的环境变量、连接器、库依赖;编写RPA脚本模拟人类用户登录目标招聘网站;针对每个目标网站的发布流程,设计并编写相应的RPA脚本,覆盖以下环节:导航至发布页面:模拟点击菜单、链接或搜索关键词,到达岗位发布或编辑页面;填写岗位信息:根据待招岗位信息结构化数据,自动化填充发布表单的各项字段;提交发布:模拟点击“发布”、“保存”或“提交”按钮,完成岗位信息发布。
优选的,利用Levenshtein距离算法来衡量OCR识别结果与可能正确答案之间的差异度,并据此推断最可能的正确文本时,步骤:
设字符串`S`和`T`的长度分别为`m`和`n`,`D[i,j]`表示`S`的前`i`个字符与`T`的前`j`个字符之间的Levenshtein距离,`s[i]`和`t[j]`分别为`S`和`T`的第`i`个和第`j`个字符,则递推公式为:
其中`(s[i]!=t[j])`是一个条件表达式,当`s[i]`与`t[j]`相等时值为0,否则为1,表示是否需要进行替换操作,`D[m,n]`即为字符串`S`和`T`之间的Levenshtein距离;
根据招聘业务场景,获取或推断出可能正确的文本作为参考答案;
使用上述递推公式,计算OCR识别结果与可能正确答案之间的Levenshtein距离;
设定一个阈值`threshold`,如果Levenshtein距离小于等于`threshold`,则认为识别结果与可能正确答案的差异较小,可以接受;否则,识别结果可能存在较大误差,需要进一步处理;在多个识别结果中,选择与可能正确答案之间Levenshtein距离最小的识别结果作为最可能的正确文本。
优选的,编程RPA机器人以模拟人类用户正常交互行为、设定合理访问间隔、随机化鼠标移动轨迹以及模拟键盘输入延迟,具体步骤:使用支持高级交互功能的RPA工具,设置等待时间:在RPA流程中插入`Wait`或`Delay`动作,设定合理的延时以模拟人类阅读页面内容或思考的时间,在关键操作前后添加等待时间;动态调整间隔:根据实际网络状况、服务器响应速度因素,使用变量或函数动态计算等待时间,使其在一定范围内随机波动,更接近真实用户行为;模拟鼠标移动路径:编写代码直接指定鼠标从当前位置到目标元素之间的随机路径;在浏览器环境中模拟鼠标移动,通过JavaScript控制鼠标的移动轨迹,使其更加自然;插入键入延时:在RPA流程中为每个字符输入操作添加随机延时,模拟人类键入时的间隔;模拟击键速度:设置不同的击键速度,以模拟不同用户的打字习惯。
优选的,根据实际网络状况、服务器响应速度因素,使用变量或函数动态计算等待时间,使其在一定范围内随机波动,更接近真实用户行为,具体:
通过网络诊断工具获取网络延迟作为网络状况的量化指标;对于HTTP(S)请求,通过HTTP响应头中的`X-Response-Time`、`Server-Timing`字段获取服务器处理时间,或者使用第三方API获取页面加载时间;
通过RPA机器人在执行过程中实际测量服务器响应时间;将响应时间作为计算等待时间的一个重要因素,确保等待时间与服务器处理速度相匹配,公式:
```math
WaitTime=BaseWaitTime+α*ResponseTime
```其中:
`WaitTime`是最终计算出的等待时间;
`BaseWaitTime`是一个基本等待时间,作为最低等待值;
`α`是响应时间影响系数,表示响应时间对等待时间的影响程度;
`ResponseTime`是实际测量的服务器响应时间;
将网络延迟作为另一个计算等待时间的因素,确保在高延迟环境下增加等待时间,公式:
```math
WaitTime=BaseWaitTime+β*NetworkLatency
```
其中:
`WaitTime`是最终计算出的等待时间;
`BaseWaitTime`是一个基本等待时间,作为最低等待值;
`β`是网络延迟影响系数,表示网络延迟对等待时间的影响程度;
`NetworkLatency`是实际测量的网络延迟;
在计算出的基础等待时间上加上一个随机波动值,模拟人类操作的不确定性,公式:
```math
WaitTime=CalculatedWaitTime+RandomVariance
```
其中:
`CalculatedWaitTime`是根据服务器响应时间和网络延迟计算出的等待时间;
`RandomVariance`是一个在指定范围内的随机值,表示等待时间的随机波动。
优选的,待发布岗位的详细信息,包括但不限于职位名称、职位描述、任职要求、薪酬福利、工作地点、联系方式。优选的,RPA工具包括UiPath、Automation Anywhere、BluePrism。
本申请实施例还提供了一种计算机设备,可以包括终端设备或服务器,前述的基于RPA和AI的在线招聘信息发布方法的数据计算程序可以配置在该计算机设备中。下面对该计算机设备进行介绍。
(一)若该计算机设备为终端设备,本申请实施例提供了一种终端设备,以终端设备为手机为例包括:射频(Radio Frequency,简称RF)电路、存储器、输入单元、显示单元、传感器、音频电路、无线保真(Wireless Fidelity,简称WiFi)模块、处理器、以及电源等部件。
1.RF电路可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器处理;另外,将设计上行的数据发送给基站。通常,RF电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,简称LNA)、双工器等。此外,RF电路还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(Global System ofMobile communication,简称GSM)、通用分组无线服务(GeneralPacket Radio Service,简称GPRS)、码分多址(Code Division Multiple Access,简称CDMA)、宽带码分多址(Wideband Code Division Multiple Access,简称WCDMA)、长期演进(Long TermEvolution,简称LTE)、电子邮件、短消息服务(Short Messaging Service,简称SMS)等。
2.存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储按照手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
3.输入单元可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元可包括触控面板以及其他输入设备。触控面板,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并按照预先设定的程式驱动相应的连接装置。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器,并能接收处理器发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板。除了触控面板,输入单元还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
4.显示单元可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元可包括显示面板,可选的,可以采用液晶显示器(LiquidCrystal Display,简称LCD)、有机发光二极管(Organic Light-Emitting Diode,简称OLED)等形式来配置显示面板。进一步的,触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器以确定触摸事件的类型,随后处理器按照触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图中,触控面板与显示面板是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板与显示面板集成而实现手机的输入和输出功能。
5.手机还可包括至少一种传感器,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可按照环境光线的明暗来配置显示面板的亮度,接近传感器可在手机移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
6.音频电路、扬声器,传声器可提供用户与手机之间的音频接口。音频电路可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路接收后转换为音频数据,再将音频数据输出处理器处理后,经RF电路以发送给比如另一手机,或者将音频数据输出至存储器以便进一步处理。
7.WiFi属于短距离无线传输技术,手机通过WiFi模块可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图示出了WiFi模块,但是可以理解的是,其并不属于手机的必须构成,完全可以按照需要在不改变发明的本质的范围内而省略。
8.处理器是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器内的软件程序和/或模块,以及调用存储在存储器内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器可包括一个或多个处理单元;优选的,处理器可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器中。
9.手机还包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理系统与处理器逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本实施例中,该终端设备所包括的处理器还具有以下功能:执行基于RPA和AI的在线招聘信息发布方法的数据计算程序。
若计算机设备为服务器,本申请实施例还提供一种服务器,服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central ProcessingUnits,简称CPU)(例如,一个或一个以上处理器)和存储器,一个或一个以上存储应用程序或数据的存储介质(例如一个或一个以上海量存储设备)。其中,存储器和存储介质可以是短暂存储或持久存储。存储在存储介质的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器可以设置为与存储介质通信,在服务器上执行存储介质中的一系列指令操作。
服务器还可以包括一个或一个以上电源,一个或一个以上有线或无线网络接口,一个或一个以上输入输出接口,和/或,一个或一个以上操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
另外,本申请实施例还提供了一种存储介质,所述存储介质用于存储计算机程序,所述计算机程序用于执行上述实施例提供的方法。
本申请实施例还提供了一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例提供的方法。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:Read-only Memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
所以本申请还公开了基于RPA和AI的在线招聘信息发布系统,包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述基于RPA和AI的在线招聘信息发布方法。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以按照实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

Claims (7)

1.基于RPA和AI的在线招聘信息发布方法,其特征在于,包括步骤:
编程RPA机器人以模拟人类用户正常交互行为、设定合理访问间隔、随机化鼠标移动轨迹以及模拟键盘输入延迟;使用RPA机器人获取包含待招岗位信息和目标招聘网站信息,遵循目标招聘网站对应流程自动发布岗位信息到各个指定网站,发布后截屏并利用OCR确认发布成功,利用OCR确认发布成功的过程中利用Levenshtein距离算法来衡量OCR识别结果与可能正确答案之间的差异度,并据此推断最可能的正确文本。
2.根据权利要求1所述的基于RPA和AI的在线招聘信息发布方法,其特征在于,使用RPA机器人获取包含待招岗位信息和目标招聘网站信息,遵循目标招聘网站对应流程自动发布岗位信息到各个指定网站,包括步骤:
待招岗位信息整理:收集待发布岗位的详细信息;目标招聘网站列表:确定要在哪些招聘网站发布岗位信息;安装并配置RPA工具,创建或导入RPA机器人项目,设置必要的环境变量、连接器、库依赖;编写RPA脚本模拟人类用户登录目标招聘网站;针对每个目标网站的发布流程,设计并编写相应的RPA脚本,覆盖以下环节:导航至发布页面:模拟点击菜单、链接或搜索关键词,到达岗位发布或编辑页面;填写岗位信息:根据待招岗位信息结构化数据,自动化填充发布表单的各项字段;提交发布:模拟点击“发布”、“保存”或“提交”按钮,完成岗位信息发布。
3.根据权利要求2所述的基于RPA和AI的在线招聘信息发布方法,其特征在于,利用Levenshtein距离算法来衡量OCR识别结果与可能正确答案之间的差异度,并据此推断最可能的正确文本时,步骤:
设字符串`S`和`T`的长度分别为`m`和`n`,`D[i,j]`表示`S`的前`i`个字符与`T`的前`j`个字符之间的Levenshtein距离,`s[i]`和`t[j]`分别为`S`和`T`的第`i`个和第`j`个字符,则递推公式为:
```
D[i,0]=i
D[0,j]=j
D[i,j]=min(
D[i-1,j]+1,//删除S的一个字符
D[i,j-1]+1,//插入一个字符到T
D[i-1,j-1]+(s[i]!=t[j])//替换一个字符
)
```
其中`(s[i]!=t[j])`是一个条件表达式,当`s[i]`与`t[j]`相等时值为0,否则为1,表示是否需要进行替换操作,`D[m,n]`即为字符串`S`和`T`之间的Levenshtein距离;
根据招聘业务场景,获取或推断出可能正确的文本作为参考答案;
使用上述递推公式,计算OCR识别结果与可能正确答案之间的Levenshtein距离;
设定一个阈值`threshold`,如果Levenshtein距离小于等于`threshold`,则认为识别结果与可能正确答案的差异较小,可以接受;否则,识别结果可能存在较大误差,需要进一步处理;在多个识别结果中,选择与可能正确答案之间Levenshtein距离最小的识别结果作为最可能的正确文本。
4.根据权利要求3所述的基于RPA和AI的在线招聘信息发布方法,其特征在于,编程RPA机器人以模拟人类用户正常交互行为、设定合理访问间隔、随机化鼠标移动轨迹以及模拟键盘输入延迟,具体步骤:使用支持高级交互功能的RPA工具,设置等待时间:在RPA流程中插入`Wait`或`Delay`动作,设定合理的延时以模拟人类阅读页面内容或思考的时间,在关键操作前后添加等待时间;动态调整间隔:根据实际网络状况、服务器响应速度因素,使用变量或函数动态计算等待时间,使其在一定范围内随机波动,更接近真实用户行为;模拟鼠标移动路径:编写代码直接指定鼠标从当前位置到目标元素之间的随机路径;在浏览器环境中模拟鼠标移动,通过JavaScript控制鼠标的移动轨迹,使其更加自然;插入键入延时:在RPA流程中为每个字符输入操作添加随机延时,模拟人类键入时的间隔;模拟击键速度:设置不同的击键速度,以模拟不同用户的打字习惯。
5.根据权利要求4所述的基于RPA和AI的在线招聘信息发布方法,其特征在于,根据实际网络状况、服务器响应速度因素,使用变量或函数动态计算等待时间,使其在一定范围内随机波动,更接近真实用户行为,具体:
通过网络诊断工具获取网络延迟作为网络状况的量化指标;对于HTTP(S)请求,通过HTTP响应头中的`X-Response-Time`、`Server-Timing`字段获取服务器处理时间,或者使用第三方API获取页面加载时间;
通过RPA机器人在执行过程中实际测量服务器响应时间;将响应时间作为计算等待时间的一个重要因素,确保等待时间与服务器处理速度相匹配,公式:
```math
WaitTime=BaseWaitTime+α*ResponseTime
```其中:
`WaitTime`是最终计算出的等待时间;
`BaseWaitTime`是一个基本等待时间,作为最低等待值;
`α`是响应时间影响系数,表示响应时间对等待时间的影响程度;
`ResponseTime`是实际测量的服务器响应时间;
将网络延迟作为另一个计算等待时间的因素,确保在高延迟环境下增加等待时间,公式:
```math
WaitTime=BaseWaitTime+β*NetworkLatency
```
其中:
`WaitTime`是最终计算出的等待时间;
`BaseWaitTime`是一个基本等待时间,作为最低等待值;
`β`是网络延迟影响系数,表示网络延迟对等待时间的影响程度;
`NetworkLatency`是实际测量的网络延迟;
在计算出的基础等待时间上加上一个随机波动值,模拟人类操作的不确定性,公式:
```math
WaitTime=CalculatedWaitTime+RandomVariance
```
其中:
`CalculatedWaitTime`是根据服务器响应时间和网络延迟计算出的等待时间;
`RandomVariance`是一个在指定范围内的随机值,表示等待时间的随机波动。
6.根据权利要求5所述的基于RPA和AI的在线招聘信息发布方法,其特征在于,待发布岗位的详细信息,包括但不限于职位名称、职位描述、任职要求、薪酬福利、工作地点、联系方式。
7.根据权利要求6所述的基于RPA和AI的在线招聘信息发布方法,其特征在于,RPA工具包括UiPath、Automation Anywhere、Blue Prism。
CN202410394564.1A 2024-04-02 2024-04-02 一种基于rpa和ai的在线招聘信息发布方法及系统 Active CN118134441B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410394564.1A CN118134441B (zh) 2024-04-02 2024-04-02 一种基于rpa和ai的在线招聘信息发布方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410394564.1A CN118134441B (zh) 2024-04-02 2024-04-02 一种基于rpa和ai的在线招聘信息发布方法及系统

Publications (2)

Publication Number Publication Date
CN118134441A true CN118134441A (zh) 2024-06-04
CN118134441B CN118134441B (zh) 2024-10-15

Family

ID=91242554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410394564.1A Active CN118134441B (zh) 2024-04-02 2024-04-02 一种基于rpa和ai的在线招聘信息发布方法及系统

Country Status (1)

Country Link
CN (1) CN118134441B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908300A (zh) * 2017-11-17 2018-04-13 哈尔滨工业大学(威海) 一种用户鼠标行为的合成与模拟方法及系统
CN110135487A (zh) * 2019-05-09 2019-08-16 国网山东省电力公司滨州供电公司 一种电脑用户鼠标行为模拟方法
CN111967848A (zh) * 2020-08-19 2020-11-20 工银科技有限公司 获取简历的方法、装置、系统及介质
CN114661745A (zh) * 2022-02-15 2022-06-24 来也科技(北京)有限公司 基于rpa和ai的招聘信息发布方法及装置
CN117236676A (zh) * 2023-08-07 2023-12-15 安徽思高智能科技有限公司 一种基于多模态事件抽取的rpa流程挖掘方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908300A (zh) * 2017-11-17 2018-04-13 哈尔滨工业大学(威海) 一种用户鼠标行为的合成与模拟方法及系统
CN110135487A (zh) * 2019-05-09 2019-08-16 国网山东省电力公司滨州供电公司 一种电脑用户鼠标行为模拟方法
CN111967848A (zh) * 2020-08-19 2020-11-20 工银科技有限公司 获取简历的方法、装置、系统及介质
CN114661745A (zh) * 2022-02-15 2022-06-24 来也科技(北京)有限公司 基于rpa和ai的招聘信息发布方法及装置
CN117236676A (zh) * 2023-08-07 2023-12-15 安徽思高智能科技有限公司 一种基于多模态事件抽取的rpa流程挖掘方法和装置

Also Published As

Publication number Publication date
CN118134441B (zh) 2024-10-15

Similar Documents

Publication Publication Date Title
CN106970790B (zh) 一种应用程序创建的方法、相关设备及系统
CN111078479B (zh) 一种内存检测模型训练的方法、内存检测的方法及装置
CN108345543B (zh) 一种数据处理方法、装置、设备及存储介质
US20160241589A1 (en) Method and apparatus for identifying malicious website
CN113272825A (zh) 通过模拟进行的强化学习模型训练
US11058948B1 (en) Predictive modeling for multiplayer gaming
CN108615158B (zh) 风险检测方法、装置、移动终端和存储介质
CN105363201A (zh) 提示信息的显示方法及装置
CN112597361B (zh) 一种排序处理方法、装置、电子设备及存储介质
CN111708927B (zh) 信息推荐方法、装置及电子设备
CN112540996B (zh) 一种业务数据的校验方法、装置、电子设备及存储介质
CN109032905B (zh) 一种点击事件的统计方法以及相关设备
CN112749074A (zh) 一种测试用例推荐方法以及装置
CN112486567B (zh) 代码的合并请求发送方法、装置、电子设备及存储介质
CN104966205A (zh) 对象抽取的方法和装置
CN118134441B (zh) 一种基于rpa和ai的在线招聘信息发布方法及系统
CN106230919B (zh) 一种文件上传的方法和装置
CN114428721A (zh) 测试数据处理方法、装置和存储介质
WO2020252880A1 (zh) 反向图灵验证方法及装置、存储介质、电子设备
CN114461183B (zh) 基于用户标签的ai模型快速组合的方法、装置及存储介质
CN115576805A (zh) 日志展示方法、装置、可读介质及电子设备
CN112416927B (zh) 一种数据处理方法、装置、电子设备及存储介质
CN112418835B (zh) 一种测试网银支付流程的方法和相关装置
CN114201494A (zh) 云文档数据处理方法、装置、设备、存储介质及产品
CN116028099A (zh) 一种安装包生成的方法及相关装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant