CN112989037A - 用于识别职业压力源的信息处理方法及装置 - Google Patents

用于识别职业压力源的信息处理方法及装置 Download PDF

Info

Publication number
CN112989037A
CN112989037A CN202110166519.7A CN202110166519A CN112989037A CN 112989037 A CN112989037 A CN 112989037A CN 202110166519 A CN202110166519 A CN 202110166519A CN 112989037 A CN112989037 A CN 112989037A
Authority
CN
China
Prior art keywords
semantic feature
pressure source
representing
vector
occupational
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110166519.7A
Other languages
English (en)
Other versions
CN112989037B (zh
Inventor
徐涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lianxin Technology Co ltd
Original Assignee
Zhejiang Lianxin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lianxin Technology Co ltd filed Critical Zhejiang Lianxin Technology Co ltd
Priority to CN202110166519.7A priority Critical patent/CN112989037B/zh
Publication of CN112989037A publication Critical patent/CN112989037A/zh
Application granted granted Critical
Publication of CN112989037B publication Critical patent/CN112989037B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)

Abstract

本公开实施例公开了一种用于识别职业压力源的信息处理方法及装置中,通过获取人机对话语料文本,而后将人机对话语料文本转换为目标向量,为目标向量匹配出最相似的职业压力源相关的文本信息。提高识别职业压力源的准确度;实现了对职业压力源预测的可持续性、长周期性,进而解决了相关技术中通过问卷调查方式可信度低、准确性差、不能实时、持续地识别职业压力源的技术问题。

Description

用于识别职业压力源的信息处理方法及装置
技术领域
本公开涉及数据处理技术领域,具体涉及到一种用于识别职业压力源的信息处理方法及装置。
背景技术
职业压力源,不同职业的人群产生压力的动源,也是职业压力产生的最直接原因。
相关技术中,确定职业压力源的主要依赖于人工或者机器的问卷调查的结果、以及测评量表的方式确定,一方面,由于人工或者设备的局限性,需要定地点、定时间、定次数地对职业压力源进行识别,因此采用上述方式并不能实时、持续地识别职业压力源信息,另一方面,问卷调查、测评量表,由于存在相同、相似的题目设计,会因题目作答记忆、选项偏好依赖、作答填写惯性等因素,降低所确定的结果的可信度和准确度。
发明内容
本公开的主要目的在于提供一种用于识别职业压力源的信息处理方法及装置,以解决职业压力源识别准确度低问题。
为了实现上述目的,根据本公开的第一方面,提供了一种用于识别职业压力源的信息处理方法,包括:在获取到人机对话语料文本后,将所述人机对话语料文本输入情感分类器,以对所述语料文本进行情感识别,得到所述语料文本对应的情感识别结果,其中,所述情感识别结果包括负面情感;将所述负面情感的人机对话语料文本转换为目标向量;将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量;确定所述目标向量与各个所述待匹配向量的相似度,得到最相似向量,其中,所述最相似的向量对应的职业压力源相关的文本信息作为识别结果输出。
可选地,在将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量之前,所述方法还包括:针对不同的各个职业信息,建立多个编码表,每个编码表包括至少一个用于表示压力源的语义特征信息、至少一个用于表示压力成因的语义特征信息以及至少一个用于表示压力现象的语义特征信息,其中,一个用于表示压力源的语义特征信息、一个用于表示压力成因的语义特征信息、以及一个用于表示压力成因的语义特征信息组成一个所述与职业压力源相关的文本信息。
可选地,在将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量之前,所述方法还包括:针对不同的各个职业信息,建立多个编码表,每个编码表包括至少一个用于表示压力源的语义特征信息、至少一个用于表示压力成因的语义特征信息、至少一个用于表示压力现象的语义特征信息和自定义的语义特征信息,其中,一个用于表示压力源的语义特征信息、一个用于表示压力成因的语义特征信息、一个用于表示压力成因的语义特征信息、以及一个自定义的语义特征信息组成一条所述与职业压力源相关的文本信息。
可选地,将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量包括:获取用户端发送的用于表示用户职业的信息;在数据库中确定与所述用户职业的信息相匹配的待匹配编码表;将所述待匹配编码表中至少一条与职业压力源相关的文本信息转换为至少一个待匹配向量。
可选地,所述确定所述目标向量与各个所述待匹配向量的相似度,得到最相似向量包括:计算所述目标向量与各个所述待匹配向量的相似度,得到相似度分数矩阵;对所述相似度分数矩阵进行主成分分析,得到最相似向量。
根据本公开的第二方面,提供了一种用于识别职业压力源的信息处理装置,包括:分类单元,被配置成在获取到人机对话语料文本后,将所述人机对话语料文本输入情感分类器,以对所述语料文本进行情感识别,得到所述语料文本对应的情感识别结果,其中,所述情感识别结果包括负面情感;第一向量转换单元,被配置成将所述负面情感的人机对话语料文本转换为目标向量;第二向量转换单元,被配置成将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量;确定单元,被配置成确定所述目标向量与各个所述待匹配向量的相似度,得到最相似向量,其中,所述最相似的向量对应的职业压力源相关的文本信息作为识别结果输出。
可选地,装置还包括:第一创建单元,被配置成针对不同的各个职业信息,建立多个编码表,每个编码表包括至少一个用于表示压力源的语义特征信息、至少一个用于表示压力成因的语义特征信息以及至少一个用于表示压力现象的语义特征信息,其中,一个用于表示压力源的语义特征信息、一个用于表示压力成因的语义特征信息、以及一个用于表示压力成因的语义特征信息组成一个所述与职业压力源相关的文本信息。
可选地,装置还包括:第二创建单元,被配置成针对不同的各个职业信息,建立多个编码表,每个编码表包括至少一个用于表示压力源的语义特征信息、至少一个用于表示压力成因的语义特征信息、至少一个用于表示压力现象的语义特征信息和自定义的语义特征信息,其中,一个用于表示压力源的语义特征信息、一个用于表示压力成因的语义特征信息、一个用于表示压力成因的语义特征信息、以及一个自定义的语义特征信息组成一条所述与职业压力源相关的文本信息。
根据本公开的第三方面,提供了一种计算机可读存储介质,存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面任意一项实施例所述的用于识别职业压力源的信息处理方法。
根据本公开的第四方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行第一方面任意一项实施例所述的用于识别职业压力源的信息处理方法。
在本公开实施例用于识别职业压力源的信息处理方法及装置中,通过获取人机对话语料文本,而后将人机对话语料文本转换为目标向量,为目标向量匹配出最相似的职业压力源相关的文本信息。提高识别职业压力源的准确度;实现了对职业压力源预测的可持续性、长周期性,进而解决了相关技术中通过问卷调查方式可信度低、准确性差、不能实时、持续地识别职业压力源的技术问题。
附图说明
为了更清楚地说明本公开具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本公开实施例用于识别职业压力源的信息处理方法的流程图;
图2是根据本公开实施例用于识别职业压力源的信息处理方法的一个应用场景图;
图3是根据本公开实施例用于识别职业压力源的信息处理方法的又一个应用场景图;
图4是根据本公开实施例用于识别职业压力源的信息处理装置的示意图。
图5是根据本公开实施例的电子设备的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
适用于本公开实施例用于识别职业压力源的信息处理方法的系统架构可以包括机器人,网络、以及服务器。网络用以在机器人和服务器之间提供通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
机器人通过网络与服务器连接,以接收或发送消息等。机器人可以是任意类型的终端设备,终端设备可以是具有音频输入接口和音频输出接口并支持互联网访问的各种电子设备,包括但不限于语音交互机器人、平板电脑等,其上可安装有提供各种服务类的应用,包括但是不限于音频交互类应用。
服务器可以是为识别职业压力源提供支持的服务器,服务器在获取到人机对话语料文本后,将人机对话语料文本输入情感分类器,以对语料文本进行情感识别,以最终实现对职业压力源的信息的识别。
需要说明的是,本申请实施例所提供的用于识别职业压力源的信息处理方法可以由服务器执行,相应地,用于识别职业压力源的信息处理装置可以设置于服务器中。应该理解,可以具有任意数目的机器人、网络、服务器。
根据本公开实施例,提供了一种用于识别职业压力源的信息处理方法,如图1所示,该方法包括如下的步骤101至步骤104:
步骤101:在获取到人机对话语料文本后,将所述人机对话语料文本输入情感分类器,以对所述语料文本进行情感识别,得到所述语料文本对应的情感识别结果,其中,所述情感识别结果包括负面情感。
在本实施例中,服务器可以从机器人获取预设时间段内的人机对话语料,在每一次人机对话后,对话时采用的自然语言以文本的形式存储在机器人存储装置中。当机器人被触发职业压力源识别后,机器人可以将该请求发送至服务器;服务器也可以直接从机器人端主动获取人机对话语料文本。
服务器获取的人机对话语料可以是单个职业用户的对话语料,进而针对单个人机对话语料进行职业压力源识别,得到针对单个用户的职业压力源的相关信息;获取的人机对话语料也可以是某一个职业群体用户的对话语料,进而针对该职业群体的大量的人机对话语料进行职业压力源识别,得到某个特定职业下群体的职业压力源的特定信息(获取某市域的1000多名特定职业人群进行人机会话语料文本,得到某段时期内该特定职业群体的职业压力源相关的信息)。
采用人机对话的方式能够实时、随时获取从事某个职业的用户在一段时间内的语料,而后基于该语料文本确定职业压力源相关信息,可以提高识别职业压力源相关信息的准确性和真实性;同时基于人机对话的方式,克服了对职业压力源识别需要定时、定点、定次的缺陷,实现了对职业压力源预测的可持续性、长周期性。
具体地,在实际场景中,职业用户在拥有负面情感时,才会有职业压力,因此为了确定职业压力源就只需要筛选出包含负面情感的对话语料文本,通过数据初筛,可以大大减少职业压力源识别的数据处理量,提高识别效率。
因此,服务器在获取到对话语料文本后,可以将该文本输入至情感分类器,情感分类器用于筛选出包含目标情感的文本,情感分类器对语料文本的处理方式可以包括,首先对语料文本进行分词等预处理,再利用先构建好的情感词典,对文本进行字符串匹配,匹配后进行权重处理,利用最终输出的权重值,区分正面情感、负面情感还是中性情感。
步骤102:将所述负面情感的人机对话语料文本转换为目标向量。
在本实施例中,在得到包含负面情感的人机对话语料文本后,可以将该文本转换向量,具体可以包括,首先对语料文本进行分词处理,而后将得到的分词转换为词向量(可以采用开源的词向量数据库确定分词后的各自对应的词向量),再将词向量进行加和求平均的方式,得到每一个语料文本对应的句向量,即目标向量。
步骤103:将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量。
在本实施例中,可以基于上述步骤102的方式,将与职业压力源相关的文本信息转换为待匹配向量。与职业压力源相关的文本信息存储在编码表中。
作为本实施例一种可选的实现方式,在将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量之前,所述方法还包括:针对不同的各个职业信息,建立多个编码表,每个编码表包括至少一个用于表示压力源的语义特征信息、至少一个用于表示压力成因的语义特征信息以及至少一个用于表示压力现象的语义特征信息,其中,一个用于表示压力源的语义特征信息、一个用于表示压力成因的语义特征信息、以及一个用于表示压力成因的语义特征信息组成一个所述与职业压力源相关的文本信息。
在本实施例中,不同职业,职业压力源相关的信息不同,但是职业压力源信息均可以从压力源信息、压力源成因信息以及压力现象信息三个维度表示职业压力源相关的信息。在建立编码表时,编码表包括用于表示压力源的语义特征信息、用于表示压力成因的语义特征信息以及至少一个用于表示压力现象的语义特征信息,上述特征信息均采用文本表示。参考图2,以职业是某职业人群为例,该职业对应的编码表中的文本信息包括:用于表示压力源的语义特征信息,例如“社会环境、岗位要求、家庭、工作任务、工作报酬、人际应酬......”等文本信息;用以表示压力成因的语义特征信息,例如“社会生态差异、、身体、性别、....等等”;用以表示压力现象的语义特征信息,例如“政治及政策差异、经济水平、社会舆论.....等等”。
具体地,一个压力源的语义特征信息、一个用于表示压力成因的语义特征信息以及一个用于表示压力现象的语义特征信息可以组成一个职业压力源相关的文本信息。以图2为例,“社会环境、社会生态差异、政治及政策差异”该条文本内容可以组成一个职业压力源相关的文本信息;“社会环境、社会生态差异、经济水平”该条文本内容也可以组成一个职业压力源相关的文本信息。
上述可选的实现方式,通过建立包含上述内容的编码表,从而可以为职业压力源的识别提供了丰富的数据源,基于此编码表可以提高职业压力源识别的准确性。
作为本实施例一种可选的实现方式,在将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量之前,所述方法还包括:针对不同的各个职业,建立多个编码表,每个编码表包括至少一个用于表示压力源的语义特征信息、至少一个用于表示压力成因的语义特征信息、至少一个用于表示压力现象的语义特征信息和自定义的语义特征信息,其中,一个用于表示压力源的语义特征信息、一个用于表示压力成因的语义特征信息、一个用于表示压力成因的语义特征信息、以及一个自定义的语义特征信息组成一条所述与职业压力源相关的文本信息。
在本实现方式中,在建立编码表时,可以增加自定义接口,通过该接口可以对编码表包含的文本信息进行更改。即增加自定义的语义特征信息,以使职业压力源相关的文本信息可以更加完善,从而进一步提高职业压力源识别的准确度。
具体地,一个压力源的语义特征信息、一个用于表示压力成因的语义特征信息、一个用于表示压力现象的语义特征信息、以及一个自定义的语义特征信息可以组成一个职业压力源相关的文本信息。以图3为例,“社会环境、社会生态差异、政治及政策差异、以及政策及制度的地区差别”该条文本内容可以组成一个职业压力源相关的文本信息,其中的“政策及度的地区差别”文本信息为自定位的语义特征信息;“家庭、家庭期待、配偶、子女亲戚期望”该条文本内容也可以组成一个职业压力源相关的文本信息,其中的“家人不理解或地位期待”文本信息为自定义的语义特征信息。
作为本实施例一种可选的实现方式,将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量包括:获取用户端发送的用于表示用户职业的信息;在数据库中确定与所述用户职业的信息相匹配的待匹配编码表;将所述待匹配编码表中至少一条与职业压力源相关的文本信息转换为至少一个待匹配向量。
在本实施例中,由于不同职业具有不同编码表,因此服务器可以从用户端获取职业用户的职业信息,而后基于该信息,确定与之匹配的编码表,将编码表中的职业压力源相关的文本信息转换为待匹配向量。例如,将“家庭、家庭期待、配偶、子女及亲戚期望、家人不理解或地位期待”该条文本内容”转换为一个待匹配向量;将“社会环境、社会生态差异、政治及政策差异、以及政策及制度的地区差别”该条文本内容转换为另一个向量等等,直到将编码表中的各个职业压力源相关的文本信息全部转换完为止,将待匹配向量存储至数据库中。
步骤104:确定所述目标向量与各个所述待匹配向量的相似度,得到最相似向量,其中,所述最相似的向量对应的职业压力源相关的文本信息作为识别结果输出。
在本实施例中,当得到目标向量和待匹配向量后,可以采用向量的匹配算法,计算出最匹配的向量,最终得到最相似的向量对应的职业压力源相关的文本信息。
作为本实施例一种可选的实现方式,所述确定所述目标向量与各个所述待匹配向量的相似度,得到最相似向量包括:计算所述目标向量与各个所述待匹配向量的相似度,得到相似度分数矩阵;对所述相似度分数矩阵进行主成分分析,得到最相似向量。
在本实现方式中,向量的点积,在代数意义上作为标量,可以来表示语义距离的远近;在几何意义上,表示向量夹角的大小,越相似的语义向量,数值越大,夹角越小。因此可以通过将目标向量与各个待匹配向量进行点积,得到目标向量与各个待匹配向量的相似度分数。而后将多个相似度分数组成相似度分数矩阵后,通过主成分分析方法(PrincipalComponentAnalysis,PCA) 得到相似度分数的矩阵的主成分,而后可以对该主成分进行降维处理,分级为特征值、特征向量,将特征值从大到校排序后,可以将最大(或者排序位于前几位)特征值对应的向量确定为最相似向量(或者相似度较高的向量),将该向量所表示的文本内容确定为职业压力源相关的文本信息。
以简单的场景为例,单个职业用户的人机对话语料文本中的“今天很难过,妻子误解我工作不努力,希望我可以多赚一点钱”转换为向量后,通过上述方式匹配后可以确定最相似的向量,如最相似向量所表示的职业压力源相关的文本信息为“家庭-家庭期待-配偶、子女、亲戚期望-家人不理解或地位期待”,则该文本信息即为识别得到的职业压力源。
显然,也可以将某职业群体的大量人机对话语料文本进行向量转换,通过上述方式匹配后可以得到最相似的向量。
上述可选的方式,通过利用主成分分析方法确定目标向量的最相似向量,能够提高识别职业压力源的准确度。
从以上的描述中,可以看出,本公开实现了如下技术效果:提高识别职业压力源的准确度;实现了对职业压力源预测的可持续性、长周期性。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本公开实施例,还提供了一种用于实施上述用于识别职业压力源的信息处理方法的装置,如图4所示,该装置包括:分类单元401,被配置成在获取到人机对话语料文本后,将所述人机对话语料文本输入情感分类器,以对所述语料文本进行情感识别,得到所述语料文本对应的情感识别结果,其中,所述情感识别结果包括负面情感;第一向量转换单元402,被配置成将所述负面情感的人机对话语料文本转换为目标向量;第二向量转换单元403,被配置成将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量;确定单元404,被配置成确定所述目标向量与各个所述待匹配向量的相似度,得到最相似向量,其中,所述最相似的向量对应的职业压力源相关的文本信息作为识别结果输出。
作为本实施例一种可选的实现方式,所述装置还包括:第一创建单元,被配置成针对不同的各个职业信息,建立多个编码表,每个编码表包括至少一个用于表示压力源的语义特征信息、至少一个用于表示压力成因的语义特征信息以及至少一个用于表示压力现象的语义特征信息,其中,一个用于表示压力源的语义特征信息、一个用于表示压力成因的语义特征信息、以及一个用于表示压力成因的语义特征信息组成一个所述与职业压力源相关的文本信息。
作为本实施例一种可选的实现方式,所述装置还包括:第二创建单元,被配置成针对不同的各个职业信息,建立多个编码表,每个编码表包括至少一个用于表示压力源的语义特征信息、至少一个用于表示压力成因的语义特征信息、至少一个用于表示压力现象的语义特征信息和自定义的语义特征信息,其中,一个用于表示压力源的语义特征信息、一个用于表示压力成因的语义特征信息、一个用于表示压力成因的语义特征信息、以及一个自定义的语义特征信息组成一条所述与职业压力源相关的文本信息。
本公开实施例提供了一种电子设备,如图5所示,该电子设备包括一个或多个处理器51以及存储器52,图5中以一个处理器51为例。
该控制器还可以包括:输入装置53和输出装置54。
处理器51、存储器52、输入装置53和输出装置54可以通过总线或者其他方式连接,图5中以通过总线连接为例。
处理器51可以为中央处理器(CentralProcessingUnit,CPU)。处理器 51还可以为其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器52作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本公开实施例中的控制方法对应的程序指令/模块。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的用于识别职业压力源的信息处理方法。
存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据服务器操作的处理装置的使用所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器52 可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至网络连接装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置53可接收输入的数字或字符信息,以及产生与服务器的处理装置的用户设置以及功能控制有关的键信号输入。输出装置54可包括显示屏等显示设备。
一个或者多个模块存储在存储器52中,当被一个或者多个处理器51 执行时,执行如图1所示的方法。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各电机控制方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体 (Read-OnlyMemory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(FlashMemory)、硬盘(HardDiskDrive,缩写:HDD) 或固态硬盘(Solid-StateDrive,SSD)等;存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本公开的实施方式,但是本领域技术人员可以在不脱离本公开的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种用于识别职业压力源的信息处理方法,其特征在于,包括:
在获取到人机对话语料文本后,将所述人机对话语料文本输入情感分类器,以对所述语料文本进行情感识别,得到所述语料文本对应的情感识别结果,其中,所述情感识别结果包括负面情感;
将所述负面情感的人机对话语料文本转换为目标向量;
将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量;
确定所述目标向量与各个所述待匹配向量的相似度,得到最相似向量,其中,所述最相似的向量对应的职业压力源相关的文本信息作为识别结果输出。
2.根据权利要求1所述的用于识别职业压力源的信息处理方法,其特征在于,在将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量之前,所述方法还包括:
针对不同的各个职业信息,建立多个编码表,每个编码表包括至少一个用于表示压力源的语义特征信息、至少一个用于表示压力成因的语义特征信息以及至少一个用于表示压力现象的语义特征信息,其中,一个用于表示压力源的语义特征信息、一个用于表示压力成因的语义特征信息、以及一个用于表示压力成因的语义特征信息组成一个所述与职业压力源相关的文本信息。
3.根据权利要求1所述的用于识别职业压力源的信息处理方法,其特征在于,在将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量之前,所述方法还包括:
针对不同的各个职业信息,建立多个编码表,每个编码表包括至少一个用于表示压力源的语义特征信息、至少一个用于表示压力成因的语义特征信息、至少一个用于表示压力现象的语义特征信息和自定义的语义特征信息,其中,一个用于表示压力源的语义特征信息、一个用于表示压力成因的语义特征信息、一个用于表示压力成因的语义特征信息、以及一个自定义的语义特征信息组成一条所述与职业压力源相关的文本信息。
4.根据权利要求2或3所述的用于识别职业压力源的信息处理方法,其特征在于,将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量包括:
获取用户端发送的用于表示用户职业的信息;
在数据库中确定与所述用户职业的信息相匹配的待匹配编码表;
将所述待匹配编码表中至少一条与职业压力源相关的文本信息转换为至少一个待匹配向量。
5.根据权利要求1所述的用于识别职业压力源的信息处理方法,其特征在于,所述确定所述目标向量与各个所述待匹配向量的相似度,得到最相似向量包括:
计算所述目标向量与各个所述待匹配向量的相似度,得到相似度分数矩阵;
对所述相似度分数矩阵进行主成分分析,得到最相似向量。
6.一种用于识别职业压力源的信息处理装置,其特征在于,包括:
分类单元,被配置成在获取到人机对话语料文本后,将所述人机对话语料文本输入情感分类器,以对所述语料文本进行情感识别,得到所述语料文本对应的情感识别结果,其中,所述情感识别结果包括负面情感;
第一向量转换单元,被配置成将所述负面情感的人机对话语料文本转换为目标向量;
第二向量转换单元,被配置成将数据库中预先存储的与职业压力源相关的文本信息转换为至少一个待匹配向量;
确定单元,被配置成确定所述目标向量与各个所述待匹配向量的相似度,得到最相似向量,其中,所述最相似的向量对应的职业压力源相关的文本信息作为识别结果输出。
7.根据权利要求6所述的用于识别职业压力源的信息处理装置,其特征在于,所述装置还包括:
第一创建单元,被配置成针对不同的各个职业信息,建立多个编码表,每个编码表包括至少一个用于表示压力源的语义特征信息、至少一个用于表示压力成因的语义特征信息以及至少一个用于表示压力现象的语义特征信息,其中,一个用于表示压力源的语义特征信息、一个用于表示压力成因的语义特征信息、以及一个用于表示压力成因的语义特征信息组成一个所述与职业压力源相关的文本信息。
8.根据权利要求6所述的用于识别职业压力源的信息处理装置,其特征在于,所述装置还包括:
第二创建单元,被配置成针对不同的各个职业信息,建立多个编码表,每个编码表包括至少一个用于表示压力源的语义特征信息、至少一个用于表示压力成因的语义特征信息、至少一个用于表示压力现象的语义特征信息和自定义的语义特征信息,其中,一个用于表示压力源的语义特征信息、一个用于表示压力成因的语义特征信息、一个用于表示压力成因的语义特征信息、以及一个自定义的语义特征信息组成一条所述与职业压力源相关的文本信息。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-5任意一项所述的用于识别职业压力源的信息处理方法。
10.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-4任意一项所述的用于识别职业压力源的信息处理方法。
CN202110166519.7A 2021-02-05 2021-02-05 用于识别职业压力源的信息处理方法及装置 Active CN112989037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110166519.7A CN112989037B (zh) 2021-02-05 2021-02-05 用于识别职业压力源的信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110166519.7A CN112989037B (zh) 2021-02-05 2021-02-05 用于识别职业压力源的信息处理方法及装置

Publications (2)

Publication Number Publication Date
CN112989037A true CN112989037A (zh) 2021-06-18
CN112989037B CN112989037B (zh) 2023-05-23

Family

ID=76348665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110166519.7A Active CN112989037B (zh) 2021-02-05 2021-02-05 用于识别职业压力源的信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN112989037B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014026152A2 (en) * 2012-08-10 2014-02-13 Assurerx Health, Inc. Systems and methods for pharmacogenomic decision support in psychiatry
CN105206284A (zh) * 2015-09-11 2015-12-30 清华大学 疏导青少年心理压力的虚拟聊天方法与系统
CN110742625A (zh) * 2019-10-23 2020-02-04 西安交通大学 一种基于社交网络数据的用户周期性心理压力检测方法
CN110807325A (zh) * 2019-10-18 2020-02-18 腾讯科技(深圳)有限公司 谓词识别方法、装置及存储介质
CN111192025A (zh) * 2019-12-31 2020-05-22 广东德诚科教有限公司 职业信息匹配方法、装置、计算机设备和存储介质
CN111767737A (zh) * 2019-05-30 2020-10-13 北京京东尚科信息技术有限公司 文本意图相似度确定方法、装置、电子设备和存储介质
CN111767729A (zh) * 2020-06-30 2020-10-13 北京百度网讯科技有限公司 文本分类方法、装置、设备以及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014026152A2 (en) * 2012-08-10 2014-02-13 Assurerx Health, Inc. Systems and methods for pharmacogenomic decision support in psychiatry
CN105206284A (zh) * 2015-09-11 2015-12-30 清华大学 疏导青少年心理压力的虚拟聊天方法与系统
CN111767737A (zh) * 2019-05-30 2020-10-13 北京京东尚科信息技术有限公司 文本意图相似度确定方法、装置、电子设备和存储介质
CN110807325A (zh) * 2019-10-18 2020-02-18 腾讯科技(深圳)有限公司 谓词识别方法、装置及存储介质
CN110742625A (zh) * 2019-10-23 2020-02-04 西安交通大学 一种基于社交网络数据的用户周期性心理压力检测方法
CN111192025A (zh) * 2019-12-31 2020-05-22 广东德诚科教有限公司 职业信息匹配方法、装置、计算机设备和存储介质
CN111767729A (zh) * 2020-06-30 2020-10-13 北京百度网讯科技有限公司 文本分类方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN112989037B (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
US10991366B2 (en) Method of processing dialogue query priority based on dialog act information dependent on number of empty slots of the query
WO2020224213A1 (zh) 语句意图识别方法、装置及计算机可读存储介质
WO2022142041A1 (zh) 意图识别模型的训练方法、装置、计算机设备和存储介质
US20190221208A1 (en) Method, user interface, and device for audio-based emoji input
CN111177324B (zh) 基于语音识别结果进行意图分类的方法和装置
WO2020199600A1 (zh) 情感极性分析方法及相关装置
CN111177350A (zh) 智能语音机器人的话术形成方法、装置和系统
CN111222837A (zh) 智能化面试的方法、系统、设备及计算机存储介质
CN111639162A (zh) 信息交互方法和装置、电子设备和存储介质
CN113642317A (zh) 一种基于语音识别结果的文本纠错方法及系统
CN111368066B (zh) 获取对话摘要的方法、装置和计算机可读存储介质
US11132999B2 (en) Information processing device, information processing method, and non-transitory computer readable storage medium
CN112559725A (zh) 文本匹配方法、装置、终端和存储介质
CN111522937A (zh) 话术推荐方法、装置和电子设备
CN113255368B (zh) 针对文本数据进行情感分析的方法、装置及相关设备
CN112989037B (zh) 用于识别职业压力源的信息处理方法及装置
CN114038451A (zh) 对话数据的质检方法、装置、计算机设备及存储介质
CN114528851A (zh) 回复语句确定方法、装置、电子设备和存储介质
KR102072708B1 (ko) 텍스트 콘텐츠의 장르를 추론하는 방법 및 컴퓨터 프로그램
CN111625636A (zh) 一种人机对话的拒绝识别方法、装置、设备、介质
CN112115229A (zh) 文本意图识别方法、装置、系统以及文本分类系统
US20230325604A1 (en) Method and system for automated sentiment classification
CN110489532B (zh) 提供自适应会话系统的计算机实现方法和自适应会话系统
CN112084769B (zh) 依存句法模型优化方法、装置、设备及可读存储介质
CN109359181B (zh) 负面情绪原因识别方法、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant