CN110188201A - 一种信息匹配方法及设备 - Google Patents

一种信息匹配方法及设备 Download PDF

Info

Publication number
CN110188201A
CN110188201A CN201910446537.3A CN201910446537A CN110188201A CN 110188201 A CN110188201 A CN 110188201A CN 201910446537 A CN201910446537 A CN 201910446537A CN 110188201 A CN110188201 A CN 110188201A
Authority
CN
China
Prior art keywords
description information
information
personal
database
rnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910446537.3A
Other languages
English (en)
Inventor
王跃寅
胡宏辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Lake Information Technology Co Ltd
Original Assignee
Shanghai Lake Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Lake Information Technology Co Ltd filed Critical Shanghai Lake Information Technology Co Ltd
Priority to CN201910446537.3A priority Critical patent/CN110188201A/zh
Publication of CN110188201A publication Critical patent/CN110188201A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息匹配方法及设备,包括:获取任务发布方输入的任务信息及认领需求描述信息并保存在数据库,获取任务待领取方输入的个人描述信息及个人信息并保存在数据库;利用基于循环神经网络RNN/长短时记忆人工神经网络LSTM的文本分类模型,确定相匹配的认领需求描述信息及个人描述信息的对应关系,并将所述对应关系保存在数据库中的表格中;触发推送需求时,根据保存的表格,向任务发布方推送相匹配的个人描述信息对应的个人信息,或向任务待领取方推送相匹配的认领需求描述信息对应的任务信息。通过该方式,实现了更高效、更准确的信息匹配,为用户带来更好的使用体验。

Description

一种信息匹配方法及设备
技术领域
本发明涉及数据检索技术领域,特别涉及一种信息匹配方法及设备。
背景技术
信息匹配技术利用数据库的存储功能向用户提供检索服务,目前常用的信息匹配技术为预先在数据库中存储文本并抽取相应的关键信息,将用户输入的信息与抽取的关键信息进行匹配搜索相应的信息需求。
具体的信息匹配过程为:预先获取至少一个非结构化的原始文本;分别从每一个原始文本中提取出至少一个待匹配信息;接收用户发送的至少一个目标信息;针对每一个原始文本中的每一个待匹配信息,确定每一个目标信息中是否存在至少一个相近信息,其中,待匹配信息的语义与每一个相近信息的语义的相似值,大于等于预设的第一阈值;如果是,标记待匹配信息;在接收到用户根据标记的待匹配信息发送的反馈结果为匹配正确时,记录待匹配信息与每一个目标信息相匹配。
上述从每一个原始文本中提取出至少一个待匹配信息仅是一种示例,具体的针对采用表结构的数据库,还可以针对数据库中的原始表结构进行如下处理来支持信息匹配检索:
1)贴标签
在数据库的表结构上增加标签字段,标签选项由系统管理员统一维护。
则用户在进行信息检索时,可以将用户输入信息拆成多个字段,与数据库中标签字段,采用包含方式进行匹配,如果包含某一表结构数据的标签字段,则认为检索到相匹配的信息,上述数据库可以为MySQL数据库,可以用in的查找手段进行查找;
2)关键字
在数据库的表结构上添加关键字字段,用户输入的字段内容可以自定义,检索时输入的关键字字段的最大长度是固定值,例如:只能输入50个字符等。在检索时,通过模糊查找方式匹配,上述数据库可以为MySQL数据库,可以用like的查找手段进行查找;
3)自我描述
在数据库的表结构上添加描述字段,记录一段描述,通常该描述为页面展示,用户在进行检索时自行查看该段描述。用户在页面上浏览多位其他用户的自我描述,进行感官上判断是否合适,比较费时费力。
4)纵表
通过纵表方式,每一条记录,记录着这个用户的关键字或描述。用户在进行检索时自行查看该纵表。用户在页面上浏览多位其他用户的自我描述,进行感官上判断是否合适,比较费时费力。
如前所述的信息匹配技术,适用于有目的性的在原有数据库基础上进行检索。如果应用到企业管理系统,需要提供一种信息匹配技术,满足任务发布方将任务相关信息存储到数据库,任务待领取方将个人信息上传到数据库,通过信息匹配技术为任务发布方推送适合的任务待领取方,针对任务待领取方推送合适的任务相关信息。
如果采用上述信息匹配技术,需要将任务相关信息的描述信息与任务待领取方个人的描述信息进行匹配,由于描述信息进行相匹配,这种信息匹配方式单一,匹配效果不够细化,可能出现表达不充分,过于抽象等问题导致匹配结果不准确。
发明内容
本发明提供了一种信息匹配方法及装置,用以解决现有技术信息中单一匹配两方面的信息,匹配结果不准确的问题。
第一方面,本发明提供一种信息匹配方法,该方法包括:
获取任务发布方输入的任务信息及认领需求描述信息并保存在数据库,获取任务待领取方输入的个人描述信息及个人信息并保存在数据库;
利用基于循环神经网络RNN/长短时记忆人工神经网络LSTM的文本分类模型,确定相匹配的认领需求描述信息及个人描述信息的对应关系,并将所述对应关系保存在数据库中的表格中;
触发推送需求时,根据保存的表格,向任务发布方推送相匹配的个人描述信息对应的个人信息,或向任务待领取方推送相匹配的认领需求描述信息对应的任务信息。
作为一种可选的实施方式,所述基于RNN/LSTM的文本分类模型,以数据库中的所有认领需求描述信息及所有个人描述信息作为检索数据库,确定相匹配的认领需求描述信息及个人描述信息的对应关系,包括:
每获取到新的认领需求描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息相匹配的个人描述信息;
每获取到新的个人描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该个人描述信息相匹配的认领需求描述信息。
每获取到新的认领需求描述信息时/每获取到新的个人描述信息时,还包括:
利用新的认领需求描述信息/个人描述信息动态更新检索数据库。
作为一种可选的实施方式,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息,包括:
利用基于RNN/LSTM的文本分类模型,通过对获取到新的个人描述信息/认领需求描述信息进行词性分析,去除冗余词汇得到有用分词;
将有用分词与预设词典进行匹配,检索出与所述有用词汇相关词汇;
根据所述有用词汇和相关词汇得到特征向量,与检索数据库中所有认领需求描述信息及所有个人描述信息对应的分类向量进行模糊匹配,得到与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息。
作为一种可选的实施方式,通过如下方式建立基于RNN/LSTM的文本分类模型:
获取包括多个训练样本的训练样本集及包括多个测试样本的测试样本集,所述训练样本/测试样本包括相匹配的认领需求描述信息及个人描述信息,包括多个认领需求描述信息及个人描述信息的测试检索数据库;
抽取训练样本对初始的基于RNN/LSTM的文本分类模型进行训练,并利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定测试结果满足预设匹配精度要求时,结束训练得到基于RNN/LSTM的文本分类模型。
作为一种可选的实施方式,确定测试结果满足预设匹配精度要求,包括:
利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定匹配正确概率大于预设阈值时,确定测试结果满足预设分类精度要求。
作为一种可选的实施方式,获取任务发布方输入的任务信息及认领需求描述信息,包括:
显示包括任务信息输入框及认领需求描述信息输入框,所述认领需求描述信息输入框包括任务类型输入框及任务待领取方要求信息输入框。
作为一种可选的实施方式,所述数据库为关系型数据库MYSQL数据库。
作为一种可选的实施方式,基于RNN/LSTM的文本分类模型基于Deeplearning4j框架实现。
第二方面,本发明实施例提供一种信息匹配设备,包括:
数据保存单元,用于获取任务发布方输入的任务信息及认领需求描述信息并保存在数据库,获取任务待领取方输入的个人描述信息并保存在数据库;
数据匹配单元,用于利用基于RNN/LSTM的文本分类模型,确定相匹配的认领需求描述信息及个人描述信息的对应关系,并将所述对应关系保存在数据库中的表格中;
信息推送单元,用于触发推送需求时,根据保存的表格,向任务发布方推送相匹配的个人描述信息对应的任务待领取方,或向任务待领取方推送相匹配的认领需求描述信息对应的任务信息。
作为一种可选的实施方式,所述数据匹配单元基于RNN/LSTM的文本分类模型,以数据库中的所有认领需求描述信息及所有个人描述信息作为检索数据库,确定相匹配的认领需求描述信息及个人描述信息的对应关系,包括:
每获取到新的认领需求描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息相匹配的个人描述信息;
每获取到新的个人描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该个人描述信息相匹配的认领需求描述信息。
作为一种可选的实施方式,还包括:
数据库更新单元,用于每获取到新的认领需求描述信息时/每获取到新的个人描述信息时,利用新的认领需求描述信息/个人描述信息动态更新检索数据库。
作为一种可选的实施方式,所述数据匹配单元利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息,包括:
利用基于RNN/LSTM的文本分类模型,通过对获取到新的个人描述信息/认领需求描述信息进行词性分析,去除冗余词汇得到有用分词;
将有用分词与预设词典进行匹配,检索出与所述有用词汇相关词汇;
根据所述有用词汇和相关词汇得到特征向量,与检索数据库中所有认领需求描述信息及所有个人描述信息对应的分类向量进行模糊匹配,得到与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息。
作为一种可选的实施方式,还包括:
分类模型建立单元,用于通过如下方式建立基于RNN/LSTM的文本分类模型:
获取包括多个训练样本的训练样本集及包括多个测试样本的测试样本集,所述训练样本/测试样本包括相匹配的认领需求描述信息及个人描述信息,包括多个认领需求描述信息及个人描述信息的测试检索数据库;
抽取训练样本对初始的基于RNN/LSTM的文本分类模型进行训练,并利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定测试结果满足预设匹配精度要求时,结束训练得到基于RNN/LSTM的文本分类模型。
作为一种可选的实施方式,所述分类模型建立单元确定测试结果满足预设匹配精度要求,包括:
利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定匹配正确概率大于预设阈值时,确定测试结果满足预设分类精度要求。
作为一种可选的实施方式,所述数据保存单元获取任务发布方输入的任务信息及认领需求描述信息,包括:
显示包括任务信息输入框及认领需求描述信息输入框,所述认领需求描述信息输入框包括任务类型输入框及任务待领取方要求信息输入框。
作为一种可选的实施方式,所述数据库为关系型数据库MYSQL数据库。
作为一种可选实施方式,所述分类模型建立单元建立的基于RNN/LSTM的文本分类模型基于Deeplearning4j框架实现。
第三方面,本发明实施例提供一种信息匹配设备,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器用于执行所述处理器中的计算机程序,并执行如下步骤:
获取任务发布方输入的任务信息及认领需求描述信息并保存在数据库,获取任务待领取方输入的个人描述信息及个人信息并保存在数据库;
利用基于循环神经网络RNN/长短时记忆人工神经网络LSTM的文本分类模型,确定相匹配的认领需求描述信息及个人描述信息的对应关系,并将所述对应关系保存在数据库中的表格中;
触发推送需求时,根据保存的表格,向任务发布方推送相匹配的个人描述信息对应的个人信息,或向任务待领取方推送相匹配的认领需求描述信息对应的任务信息。
所述基于RNN/LSTM的文本分类模型,以数据库中的所有认领需求描述信息及所有个人描述信息作为检索数据库,所述处理器确定相匹配的认领需求描述信息及个人描述信息的对应关系,包括:
每获取到新的认领需求描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息相匹配的个人描述信息;
每获取到新的个人描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该个人描述信息相匹配的认领需求描述信息。
作为一种可选的实施方式,所述处理器每获取到新的认领需求描述信息时/每获取到新的个人描述信息时,还用于:
利用新的认领需求描述信息/个人描述信息动态更新检索数据库。
作为一种可选的实施方式,所述处理器利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息,包括:
利用基于RNN/LSTM的文本分类模型,通过对获取到新的个人描述信息/认领需求描述信息进行词性分析,去除冗余词汇得到有用分词;
将有用分词与预设词典进行匹配,检索出与所述有用词汇相关词汇;
根据所述有用词汇和相关词汇得到特征向量,与检索数据库中所有认领需求描述信息及所有个人描述信息对应的分类向量进行模糊匹配,得到与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息。
作为一种可选的实施方式,所述处理器具体通过如下方式建立基于RNN/LSTM的文本分类模型:
获取包括多个训练样本的训练样本集及包括多个测试样本的测试样本集,所述训练样本/测试样本包括相匹配的认领需求描述信息及个人描述信息,包括多个认领需求描述信息及个人描述信息的测试检索数据库;
抽取训练样本对初始的基于RNN/LSTM的文本分类模型进行训练,并利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定测试结果满足预设匹配精度要求时,结束训练得到基于RNN/LSTM的文本分类模型。
作为一种可选的实施方式,所述处理器确定测试结果满足预设匹配精度要求,包括:
利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定匹配正确概率大于预设阈值时,确定测试结果满足预设分类精度要求。
作为一种可选的实施方式,所述处理器获取任务发布方输入的任务信息及认领需求描述信息,包括:
显示包括任务信息输入框及认领需求描述信息输入框,所述认领需求描述信息输入框包括任务类型输入框及任务待领取方要求信息输入框。
作为一种可选的实施方式,所述数据库为关系型数据库MYSQL数据库。
作为一种可选的实施方式,所述处理器基于RNN/LSTM的文本分类模型基于Deeplearning4j框架实现。
第四方面,本申请还提供一种计算机存储介质,其上存储有计算机程序,该程序被处理单元执行时实现上述第一方面提供的信息匹配方法的步骤。
利用本发明提供的信息匹配方法及设备,具有以下有益效果:
本发明实施例提供的信息匹配方法及设备,基于RNN(循环神经网络)/LSTM(长短时记忆人工神经网络)的文本分类模型,确定相匹配的认领需求描述信息及个人描述信息的对应关系并保存在数据库中的表格中;触发推送需求时,根据保存的表格,向任务发布方推送相匹配的个人描述信息对应的个人信息,或向任务待领取方推送相匹配的认领需求描述信息对应的任务信息。由于基于RNN(循环神经网络)/LSTM(长短时记忆人工神经网络)的文本分类模型进行匹配检索,可以实现文本情感分析,做到智能纠正、采纳、推荐等功能,实现了更高效、更准确的信息匹配,为用户带来更好的使用体验。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例中界面交互示意图;
图2为本发明实施例中信息匹配的方法示意图;
图3为本发明实施例中提供的一种信息匹配的设备示意图;
图4为本发明实施例中信息匹配的设备示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
下面对文中出现的一些词语进行解释:
1、本发明实施例中术语“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
2、本发明实施例中术语“任务”,指要完成的工作,不限制所应用的技术领域,应用场景。
本发明实施例描述的应用场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域普通技术人员可知,随着新应用场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。其中,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
企业管理系统是企业现代化发展的产物,能够使企业内信息传输及数据存储更加快捷。通过信息匹配功能有效提高企业管理效率。企业管理系统一种常用的场景为任务发布方将任务相关信息存储到数据库,任务待领取方将个人信息上传到数据库,通过信息匹配技术为任务发布方推送适合的任务待领取方,针对任务待领取方推送合适的任务相关信息。
传统的企业管理系统采用基于Vue.JS+Java+MySQL的B/S架构,B/S架构主要由客户端,Web服务器、应用服务器和数据服务器组成。应用服务器主要负责事物处理,数据服务器主要用于数据的管理。在客户端安装的是标准、易用的通用浏览器,将WEB技术与数据库技术相结合,在客户端通过web网页访问相应的数据库,任务发布方通过客户端访问应用服务器,实现将任务相关信息存储到数据服务器,任务待领取方通过客户端访问应用服务器,实现将个人信息上传到数据服务器,任务发布方通过客户端访问应用服务器,利用提供的信息检索功能获取适合的任务待领取方,任务待领取方通过客户端访问应用服务器,利用提供的信息检索功能获取适合的任务相关信息。
应用服务器利用数据库的存储功能向用户提供检索服务,目前常用的信息匹配技术为预先在数据库中存储文本并抽取相应的关键信息,将任务发布方或任务待领取方输入的信息与抽取的关键信息进行匹配搜索相应的信息需求。
如前所述的信息匹配技术,由于采用根据输入信息和抽取关键信息的简单匹配功能,信息匹配方式单一,匹配效果不够细化,可能出现表达不充分,过于抽象等问题导致匹配结果不准确。
基于上述场景,本申请提供了一种信息匹配的方法及设备。
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
针对上述场景,下面结合说明书附图对本发明实施例做进一步详细描述。
如图2所示,本发明实施例的一种信息匹配的方法,具体包括以下步骤:
步骤201:获取任务发布方输入的任务信息及认领需求描述信息并保存在数据库,获取任务待领取方输入的个人描述信息及个人信息并保存在数据库。
任务发布方通过发布需求的方式,将详细的任务信息及认领需求描述信息保存在数据库,任务信息可以是与任务有关的所有信息,认领需求描述信息,主要是描述需求的任务待领取方的要求信息,如可以描述任务待领取方的身份,所需的专业,所需要掌握的技能及在该任务中所需要完成的工作等。
任务待领取方通过对自身特长、愿景等自我描述,表达想要完成的任务,并把个人描述信息及个人信息保存在数据库中,个人信息是指与个人有关的所有信息,个人描述信息可以是与个人有关的关键信息。
本实施例中的任务信息比较简单,或个人信息比较简单时,任务信息与认领需求描述信息可以是同一个信息,认为是一项信息,个人描述信息及个人信息可以是同一个信息,认为是一项信息。
在进行用户界面设计时,可以分别设计任务信息输入框和认领需求信息输入框,任务信息输入框与认领需求信息输入框可以位于同一页面,也可以位于不同的页面。同样,可以分别设计个人描述信息输入框和个人信息输入框,个人描述信息输入框和个人信息输入框可以位于同一页面,也可以位于不同的页面。
如图1所示为用户任务交付界面,上栏为任务信息输入框,下栏为认领需求描述信息输入框,包括任务类型输入框及任务待领取方要求信息输入框,包括领取方的身份所需的技能等。
步骤202:利用基于循环神经网络RNN/长短时记忆人工神经网络LSTM的文本分类模型,确定相匹配的认领需求描述信息及个人描述信息的对应关系,并将所述对应关系保存在数据库中的表格中。
RNN(Recurrent Neural Network,循环神经网络)是一类用于处理序列数据的神经网络。时间序列数据是指在不同时间点上收集到的数据,这类数据反映了某一事物、现象等随时间的变化状态或程度。
RNN可以利用它内部的记忆来处理任意时序的输入序列,容易处理如不分段的手写识别、语音识别等,具有分类功能。
LSTM(Long Short-Term Memory,长短时记忆人工神经网络)是长短期记忆网络,是RNN的一种变体,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件,具有分类功能。
所有的RNN都具有一种重复神经网络模块的链式形式。在标准RNN中,这个重复的结构模块只有一个非常简单的结构,例如一个tanh层。LSTM同样是这样的结构,但是重复的模块拥有一个不同的结构。不同于单一神经网络层,这里是有四个,以一种非常特殊的方式进行交互。RNN由于梯度消失的原因只能有短期记忆,LSTM网络通过精妙的门控制将短期记忆与长期记忆结合起来,并且一定程度上解决了梯度消失的问题。
基于RNN(循环神经网络)/LSTM(长短时记忆人工神经网络)的文本分类模型整体包括两部分。
第一部分:句子特征提取;
S1读取数据(这里是经过结巴分词后的句子),按比例划分训练集和验证集,这里每个句子都生成了相应的mask向量,用以标记每个输入文本的实际长度。这里有几个可选项:
1)reverse:考虑到句子中越靠后的词重要程度越高,因此可对句子进行逆序后处理;
2)enhance:样本数较小的时候可选择数据增强,即打乱句子顺序来构建新样本;
3)sort_by_len:对句子按照长短进行排序;
4)shuffle:打乱样本顺序,随机采样;
S2对输入到模型中的句子进行Word Embedding,将每个词表示成一个数值型的词向量。这个过程中对于不同长度的问题文本,pad和截断成一样长度的,从而构建维数一致的模型句向量输入。
第二部分:基于RNN/LSTM的分类器模型
每个词经过embedding之后,进入LSTM层,然后经过一个时间序列得到的n个隐藏LSTM神经单元的向量,这些向量经过mean pooling层之后,可以得到一个向量h,然后经过Softmax层,得到一个类别分布概率向量,取概率值最大的类别作为最终预测结果。
基于以上原理,本实施例中基于RNN/LSTM的文本分类模型,以数据库中的所有认领需求描述信息及所有个人描述信息作为分类器模型的检索数据库,数据库中的所有认领需求描述信息及所有个人描述信息,即将各认领需求描述信息/各个人描述信息处理为一个分类向量,随后将分类向量保存在数据库中,当输入认领需求描述信息或个人描述信息,得到该认领需求描述信息或个人描述信息对应的概率向量。其中:每获取到新的认领需求描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息相匹配的个人描述信息;
每获取到新的个人描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该个人描述信息相匹配的认领需求描述信息。
每获取到新的认领需求描述信息时/每获取到新的个人描述信息时,还包括:利用新的认领需求描述信息/个人描述信息动态更新检索数据库,即更新目标分类向量。即将新的认领需求描述信息/个人描述信息经处理后保存为新的分类向量。利用新的认领需求描述信息/个人描述信息动态更新检索数据库(分类向量)。以保证任务发布方或任务待领取方能够始终获取到当前数据库中的最新信息。保证匹配结果的时效性及准确性。
步骤203,触发推送需求时,根据保存的表格,向任务发布方推送相匹配的个人描述信息对应的个人信息,或向任务待领取方推送相匹配的认领需求描述信息对应的任务信息。
触发推送需求,可以根据需要进行设定触发方式,如用户通过界面请求推送时,认为触发推送需求,或者用户新输入任务信息或个人信息时,认为触发推送需求,或者间隔设定时间向用户指定的地址如邮箱等推送。
本实施例通过利用基于RNN(循环神经网络)/LSTM(长短时记忆人工神经网络)的文本分类模型,在信息匹配技术中添加人工智能技术,结合现有关系型数据库,提高了企业管理系统中信息匹配效率,使匹配结果更加精确。避免了任务发布方或任务待领取方表达不准确、过于抽象等问题时出现的匹配结果不准确的问题。
神经网络包含输入层、隐层、输出层,通过激活函数控制输出,层与层之间通过权值连接。激活函数是事先确定好的,那么神经网络模型通过训练“学“到的东西就蕴含在“权值“中。
基础的神经网络只在层与层之间建立了权连接,RNN最大的不同之处就是在层之间的神经元之间也建立的权连接。
BPTT(back-propagation through time)算法是常用的训练RNN的方法,本质上与BP算法无差别。BPTT的中心思想和BP算法相同,沿着需要优化的参数的负梯度方向不断寻找更优的点直至收敛。
训练样本是指给神经网络提供的数据,训练样本在Deeplearning4j里面分成两部分,分别为特征(features)和标签(labels),特征就是网络实际用于训练的数据,标签是指给样本打标签,在Deeplearning4j的一些demo里,指的是一个维为1,其余全为0的n维向量。转换成Deeplearning4j的标签即为一个三维向量。
为了保证学习质量,训练样本一般成批地进行输入,因此这里设定一个最小批量(miniBatch)的概念。神经网络是一个复杂的计算模型,要考虑到性能与精度的问题,样本量太大,会导致性能下降,样本量太小,样本覆盖范围不够广,精度又会降低,因此设定一个最小批量值,有助于得到一个性能与精度之间的平衡。
而训练的过程,就是不断向神经网络输入相同的数据样本,不断调整网络参数,并最终得到输出误差达到指定范围内的网络模型。
本实施例通过如下方式建立基于RNN/LSTM的文本分类模型:
获取包括多个训练样本的训练样本集及包括多个测试样本的测试样本集,所述训练样本/测试样本包括相匹配的认领需求描述信息及个人描述信息,包括多个认领需求描述信息及个人描述信息的测试检索数据库;
抽取训练样本对初始的基于RNN/LSTM的文本分类模型进行训练,并利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定测试结果满足预设匹配精度要求时,结束训练得到基于RNN/LSTM的文本分类模型。
如前所述,抽取训练样本对初始的基于RNN/LSTM的文本分类模型进行训练过程,将认领需求描述信息/个人描述信息进行相应的数据增强,提取分词得到对应的特征向量,经过相应层的处理,得到对应的分类向量,根据对应的分类向量找到对应的个人描述信息/认领需求描述信息,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息,包括:
利用基于RNN/LSTM的文本分类模型,通过对获取到新的个人描述信息/认领需求描述信息进行词性分析,去除冗余词汇得到有用分词,该步骤主要由RNN/LSTM中的S1部分实现;
将有用分词与预设词典进行匹配,检索出与所述有用词汇相关词汇,该步骤主要由RNN/LSTM中的S1部分实现,完成相应的关联词汇检索后得到对应的维数一致的模型句向量输入,上述预设词典使用Word2Vec提取特征词构建词典。
DeepLearning4J是一套基于Java语言的神经网络工具包,可以构建、定型和部署神经网络。在DeepLearning4J框架中支持对Word2Vec的训练。通过Word2Vec,提取特征词构建词典,并根据特征词关联出相关词。根据这些相关词的权重,分析出文本的分类。
根据所述有用词汇和相关词汇得到特征向量,与检索数据库中所有认领需求描述信息及所有个人描述信息对应的分类向量进行模糊匹配,得到与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息。具体地,模型句向量经过meanpooling层之后,可以得到一个向量h,然后经过Softmax层,完成上述模糊匹配过程。
在训练过程中,上述文本分类模型会根据预期的分类向量对模型参数进行调整,使利用文本分类模型输出的分类向量与训练样本中给出的分类向量一致,具体的模型参数调整为现有方式,这里不再详述。
在训练结束后,可以将测试样本输入文本分类模型,得到对应的输入向量,利用模型内部的分类功能得到对应的分类向量,将输出的分类向量与测试样本中对应的分类向量比较,如果一致,则认为匹配正确,否则匹配错误。利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定匹配正确概率百分比大于预设阈值时,确定测试结果满足预设分类精度要求,如果不满足,则继续用训练样本进行训练。
本实施例中的数据库为关系型数据库MYSQL数据库。
关系型数据库,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。MYSQL是一种开放源代码的关系型数据库管理系统,使用最常用的数据库管理语言--结构化查询语言(SQL)进行数据库管理。关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性,并且具有很好的可靠性与适应性。
本申请所述的基于RNN/LSTM的文本分类模型基于Deeplearning4j框架实现。
Deeplearning4j是广泛支持各种深度学习算法的运算框架。Deeplearning4j可以实施的技术包括受限玻尔兹曼机、深度置信网络、深度自动编码器、堆叠式降噪自动编码器、循环神经张量网络,以及word2vec、doc2vec和GloVe。这些算法全部包括分布式并行版本,与Hadoop和Spark集成。Skymind是Deeplearning4j的商业支持机构。
通过上述方案,可以有效解决现有企业管理系统中信息匹配不准确,效率低的问题。
需要说明的是,本发明实施例中所列举的信息匹配的方式只是举例说明,任何一种其他场景的任务发布与领取场景,都适用于本发明实施例。
如图3所示,本发明实施例还提供一种信息匹配的设备,该设备包括:
数据保存单元301,用于获取任务发布方输入的任务信息及认领需求描述信息并保存在数据库,获取任务待领取方输入的个人描述信息并保存在数据库;
数据匹配单元302,用于利用基于RNN/LSTM的文本分类模型,确定相匹配的认领需求描述信息及个人描述信息的对应关系,并将所述对应关系保存在数据库中的表格中;
信息推送单元303,用于触发推送需求时,根据保存的表格,向任务发布方推送相匹配的个人描述信息对应的任务待领取方,或向任务待领取方推送相匹配的认领需求描述信息对应的任务信息。
作为一种可选的实施方式,所述数据匹配单元基于RNN/LSTM的文本分类模型,以数据库中的所有认领需求描述信息及所有个人描述信息作为检索数据库,确定相匹配的认领需求描述信息及个人描述信息的对应关系,包括:
每获取到新的认领需求描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息相匹配的个人描述信息;
每获取到新的个人描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该个人描述信息相匹配的认领需求描述信息。
作为一种可选的实施方式,还包括:
数据库更新单元,用于每获取到新的认领需求描述信息时/每获取到新的个人描述信息时,利用新的认领需求描述信息/个人描述信息动态更新检索数据库。
作为一种可选的实施方式,所述数据匹配单元利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息,包括:
利用基于RNN/LSTM的文本分类模型,通过对获取到新的个人描述信息/认领需求描述信息进行词性分析,去除冗余词汇得到有用分词;
将有用分词与预设词典进行匹配,检索出与所述有用词汇相关词汇;
根据所述有用词汇和相关词汇得到特征向量,与检索数据库中所有认领需求描述信息及所有个人描述信息对应的分类向量进行模糊匹配,得到与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息。
作为一种可选的实施方式,还包括:
分类模型建立单元,用于通过如下方式建立基于RNN/LSTM的文本分类模型:
获取包括多个训练样本的训练样本集及包括多个测试样本的测试样本集,所述训练样本/测试样本包括相匹配的认领需求描述信息及个人描述信息,包括多个认领需求描述信息及个人描述信息的测试检索数据库;
抽取训练样本对初始的基于RNN/LSTM的文本分类模型进行训练,并利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定测试结果满足预设匹配精度要求时,结束训练得到基于RNN/LSTM的文本分类模型。
作为一种可选的实施方式,所述分类模型建立单元确定测试结果满足预设匹配精度要求,包括:
利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定匹配正确概率大于预设阈值时,确定测试结果满足预设分类精度要求。
作为一种可选的实施方式,所述数据保存单元获取任务发布方输入的任务信息及认领需求描述信息,包括:
显示包括任务信息输入框及认领需求描述信息输入框,所述认领需求描述信息输入框包括任务类型输入框及任务待领取方要求信息输入框。
作为一种可选的实施方式,所述数据库为关系型数据库MYSQL数据库。
作为一种可选实施方式,所述分类模型建立单元建立的基于RNN/LSTM的文本分类模型基于Deeplearning4j框架实现。
本发明实施例提供一种信息匹配设备,如图4所示,包括处理器401和存储器402,所述存储器中存储有计算机程序,所述处理器用于执行所述处理器中的计算机程序,并执行如下步骤:
获取任务发布方输入的任务信息及认领需求描述信息并保存在数据库,获取任务待领取方输入的个人描述信息及个人信息并保存在数据库;
利用基于循环神经网络RNN/长短时记忆人工神经网络LSTM的文本分类模型,确定相匹配的认领需求描述信息及个人描述信息的对应关系,并将所述对应关系保存在数据库中的表格中;
触发推送需求时,根据保存的表格,向任务发布方推送相匹配的个人描述信息对应的个人信息,或向任务待领取方推送相匹配的认领需求描述信息对应的任务信息。
所述基于RNN/LSTM的文本分类模型,以数据库中的所有认领需求描述信息及所有个人描述信息作为检索数据库,所述处理器确定相匹配的认领需求描述信息及个人描述信息的对应关系,包括:
每获取到新的认领需求描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息相匹配的个人描述信息;
每获取到新的个人描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该个人描述信息相匹配的认领需求描述信息。
作为一种可选的实施方式,所述处理器每获取到新的认领需求描述信息时/每获取到新的个人描述信息时,还用于:
利用新的认领需求描述信息/个人描述信息动态更新检索数据库。
作为一种可选的实施方式,所述处理器利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息,包括:
利用基于RNN/LSTM的文本分类模型,通过对获取到新的个人描述信息/认领需求描述信息进行词性分析,去除冗余词汇得到有用分词;
将有用分词与预设词典进行匹配,检索出与所述有用词汇相关词汇;
根据所述有用词汇和相关词汇得到特征向量,与检索数据库中所有认领需求描述信息及所有个人描述信息对应的分类向量进行模糊匹配,得到与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息。
作为一种可选的实施方式,所述处理器具体通过如下方式建立基于RNN/LSTM的文本分类模型:
获取包括多个训练样本的训练样本集及包括多个测试样本的测试样本集,所述训练样本/测试样本包括相匹配的认领需求描述信息及个人描述信息,包括多个认领需求描述信息及个人描述信息的测试检索数据库;
抽取训练样本对初始的基于RNN/LSTM的文本分类模型进行训练,并利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定测试结果满足预设匹配精度要求时,结束训练得到基于RNN/LSTM的文本分类模型。
作为一种可选的实施方式,所述处理器确定测试结果满足预设匹配精度要求,包括:
利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定匹配正确概率大于预设阈值时,确定测试结果满足预设分类精度要求。
作为一种可选的实施方式,所述处理器获取任务发布方输入的任务信息及认领需求描述信息,包括:
显示包括任务信息输入框及认领需求描述信息输入框,所述认领需求描述信息输入框包括任务类型输入框及任务待领取方要求信息输入框。
作为一种可选的实施方式,所述数据库为关系型数据库MYSQL数据库。
作为一种可选的实施方式,所述处理器基于RNN/LSTM的文本分类模型基于Deeplearning4j框架实现。
本发明实施例还提供一种计算机可读非易失性存储介质,包括程序代码,当所述程序代码在计算终端上运行时,所述程序代码用于使所述计算终端执行上述本发明实施例的方法的步骤。
以上参照示出根据本申请实施例的方法、装置(系统)和/或计算机程序产品的框图和/或流程图描述本申请。应理解,可以通过计算机程序指令来实现框图和/或流程图示图的一个块以及框图和/或流程图示图的块的组合。可以将这些计算机程序指令提供给通用计算机、专用计算机的处理器和/或其它可编程数据处理装置,以产生机器,使得经由计算机处理器和/或其它可编程数据处理装置执行的指令创建用于实现框图和/或流程图块中所指定的功能/动作的方法。
相应地,还可以用硬件和/或软件(包括固件、驻留软件、微码等)来实施本申请。更进一步地,本申请可以采取计算机可使用或计算机可读存储介质上的计算机程序产品的形式,其具有在介质中实现的计算机可使用或计算机可读程序代码,以由指令执行系统来使用或结合指令执行系统而使用。在本申请上下文中,计算机可使用或计算机可读介质可以是任意介质,其可以包含、存储、通信、传输、或传送程序,以由指令执行系统、装置或设备使用,或结合指令执行系统、装置或设备使用。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种信息匹配方法,其特征在于,包括:
获取任务发布方输入的任务信息及认领需求描述信息并保存在数据库,获取任务待领取方输入的个人描述信息及个人信息并保存在数据库;
利用基于循环神经网络RNN/长短时记忆人工神经网络LSTM的文本分类模型,确定相匹配的认领需求描述信息及个人描述信息的对应关系,并将所述对应关系保存在数据库中的表格中;
触发推送需求时,根据保存的表格,向任务发布方推送相匹配的个人描述信息对应的个人信息,或向任务待领取方推送相匹配的认领需求描述信息对应的任务信息。
2.根据权利要求1所述的方法,其特征在于,所述基于RNN/LSTM的文本分类模型,以数据库中的所有及所有个人信息作为检索数据库,确定相匹配的认领需求描述信息及个人描述信息的对应关系,包括:
每获取到新的认领需求描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息相匹配的个人描述信息;
每获取到新的个人描述信息时,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该个人描述信息相匹配的认领需求描述信息。
3.根据权利要求2所述的方法,其特征在于,每获取到新的认领需求描述信息时/每获取到新的个人描述信息时,还包括:
利用新的认领需求描述信息/个人描述信息动态更新检索数据库。
4.根据权利要求2所述的方法,其特征在于,利用基于RNN/LSTM的文本分类模型,从检索数据库中获取与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息,包括:
利用基于RNN/LSTM的文本分类模型,通过对获取到新的个人描述信息/认领需求描述信息进行词性分析,去除冗余词汇得到有用分词;
将有用分词与预设词典进行匹配,检索出与所述有用词汇相关词汇;
根据所述有用词汇和相关词汇得到特征向量,与检索数据库中所有认领需求描述信息及所有个人描述信息对应的分类向量进行模糊匹配,得到与该认领需求描述信息/个人描述信息相匹配的个人描述信息/认领需求描述信息。
5.根据权利要求1所述的方法,其特征在于,通过如下方式建立基于RNN/LSTM的文本分类模型:
获取包括多个训练样本的训练样本集及包括多个测试样本的测试样本集,所述训练样本/测试样本包括相匹配的认领需求描述信息及个人描述信息,包括多个认领需求描述信息及个人描述信息的测试检索数据库;
抽取训练样本对初始的基于RNN/LSTM的文本分类模型进行训练,并利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定测试结果满足预设匹配精度要求时,结束训练得到基于RNN/LSTM的文本分类模型。
6.根据权利要求5所述的方法,其特征在于,确定测试结果满足预设匹配精度要求,包括:
利用测试样本对基于RNN/LSTM的文本分类模型进行测试,确定匹配正确百分比大于预设阈值时,确定测试结果满足预设分类精度要求。
7.根据权利要求1所述的方法,其特征在于,获取任务发布方输入的任务信息及认领需求描述信息,包括:
显示包括任务信息输入框及认领需求描述信息输入框,所述认领需求描述信息输入框包括任务类型输入框及任务待领取方要求信息输入框。
8.根据权利要求1所述的方法,其特征在于,所述数据库为关系型数据库MYSQL数据库。
9.根据权利要求1所述的方法,其特征在于,基于RNN/LSTM的文本分类模型基于Deeplearning4j框架实现。
10.一种信息匹配设备,其特征在于,包括:
数据保存单元,用于获取任务发布方输入的任务信息及认领需求描述信息并保存在数据库,获取任务待领取方输入的个人描述信息并保存在数据库;
数据匹配单元,用于利用基于RNN/LSTM的文本分类模型,确定相匹配的认领需求描述信息及个人描述信息的对应关系,并将所述对应关系保存在数据库中的表格中;
信息推送单元,用于触发推送需求时,根据保存的表格,向任务发布方推送相匹配的个人描述信息对应的任务待领取方,或向任务待领取方推送相匹配的认领需求描述信息对应的任务信息。
11.一种信息匹配设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器用于执行所述处理器中的计算机程序,并执行如下步骤:
获取任务发布方输入的任务信息及认领需求描述信息并保存在数据库,获取任务待领取方输入的个人描述信息及个人信息并保存在数据库;
利用基于循环神经网络RNN/长短时记忆人工神经网络LSTM的文本分类模型,确定相匹配的认领需求描述信息及个人描述信息的对应关系,并将所述对应关系保存在数据库中的表格中;
触发推送需求时,根据保存的表格,向任务发布方推送相匹配的个人描述信息对应的个人信息,或向任务待领取方推送相匹配的认领需求描述信息对应的任务信息。
12.一种计算机介质,其上存储有计算机程序,其特征在于,该程序被处理单元执行时实现权利要求1-8任一所述信息匹配方法的步骤。
CN201910446537.3A 2019-05-27 2019-05-27 一种信息匹配方法及设备 Pending CN110188201A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910446537.3A CN110188201A (zh) 2019-05-27 2019-05-27 一种信息匹配方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910446537.3A CN110188201A (zh) 2019-05-27 2019-05-27 一种信息匹配方法及设备

Publications (1)

Publication Number Publication Date
CN110188201A true CN110188201A (zh) 2019-08-30

Family

ID=67718012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910446537.3A Pending CN110188201A (zh) 2019-05-27 2019-05-27 一种信息匹配方法及设备

Country Status (1)

Country Link
CN (1) CN110188201A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128296A (zh) * 2019-12-31 2021-07-16 重庆傲雄在线信息技术有限公司 一种电子手写签字模糊标签化识别系统
CN113254840A (zh) * 2021-06-22 2021-08-13 中电科新型智慧城市研究院有限公司 人工智能应用服务推送方法、推送平台及终端设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407211A (zh) * 2015-07-30 2017-02-15 富士通株式会社 对实体词的语义关系进行分类的方法和装置
CN107943847A (zh) * 2017-11-02 2018-04-20 平安科技(深圳)有限公司 企业关系提取方法、装置及存储介质
CN108804633A (zh) * 2018-06-01 2018-11-13 腾讯科技(深圳)有限公司 基于行为语义知识网络的内容推荐方法
CN109740160A (zh) * 2018-12-31 2019-05-10 浙江成功软件开发有限公司 一种基于人工智能语义分析的任务发布方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407211A (zh) * 2015-07-30 2017-02-15 富士通株式会社 对实体词的语义关系进行分类的方法和装置
CN107943847A (zh) * 2017-11-02 2018-04-20 平安科技(深圳)有限公司 企业关系提取方法、装置及存储介质
CN108804633A (zh) * 2018-06-01 2018-11-13 腾讯科技(深圳)有限公司 基于行为语义知识网络的内容推荐方法
CN109740160A (zh) * 2018-12-31 2019-05-10 浙江成功软件开发有限公司 一种基于人工智能语义分析的任务发布方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128296A (zh) * 2019-12-31 2021-07-16 重庆傲雄在线信息技术有限公司 一种电子手写签字模糊标签化识别系统
CN113128296B (zh) * 2019-12-31 2023-05-09 重庆傲雄在线信息技术有限公司 一种电子手写签字模糊标签化识别系统
CN113254840A (zh) * 2021-06-22 2021-08-13 中电科新型智慧城市研究院有限公司 人工智能应用服务推送方法、推送平台及终端设备
CN113254840B (zh) * 2021-06-22 2021-11-16 中电科新型智慧城市研究院有限公司 人工智能应用服务推送方法、推送平台及终端设备

Similar Documents

Publication Publication Date Title
CN109885672B (zh) 一种面向在线教育的问答式智能检索系统及方法
AU2018214675B2 (en) Systems and methods for automatic semantic token tagging
CN110427463B (zh) 搜索语句响应方法、装置及服务器和存储介质
KR102288249B1 (ko) 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체
CN108780464A (zh) 用于处理输入查询的方法和系统
CN112214593A (zh) 问答处理方法、装置、电子设备及存储介质
CN111325029A (zh) 一种基于深度学习集成模型的文本相似度计算方法
CN108536807B (zh) 一种信息处理方法及装置
CN110674292A (zh) 一种人机交互方法、装置、设备及介质
CN110633366A (zh) 一种短文本分类方法、装置和存储介质
CN108664599A (zh) 智能问答方法、装置、智能问答服务器及存储介质
CN114238573B (zh) 基于文本对抗样例的信息推送方法及装置
US20200134537A1 (en) System and method for generating employment candidates
CN107145573A (zh) 人工智能客服机器人的问题解答方法及系统
US11321580B1 (en) Item type discovery and classification using machine learning
US20190197110A1 (en) Method for content search and electronic device therefor
CN113807103B (zh) 基于人工智能的招聘方法、装置、设备及存储介质
CN111539212A (zh) 文本信息处理方法、装置、存储介质及电子设备
CN110019703A (zh) 数据标记方法及装置、智能问答方法及系统
CN110516035A (zh) 一种混合模块的人机交互方法和系统
CN112632258A (zh) 文本数据处理方法、装置、计算机设备和存储介质
CN110188201A (zh) 一种信息匹配方法及设备
CN114328800A (zh) 文本处理方法、装置、电子设备和计算机可读存储介质
CN114253990A (zh) 数据库查询方法、装置、计算机设备和存储介质
CN111198949B (zh) 一种文本标签确定方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190830

RJ01 Rejection of invention patent application after publication