CN114548694A - 社会化回答式网络心理咨询服务质量评估模型的构建方法 - Google Patents

社会化回答式网络心理咨询服务质量评估模型的构建方法 Download PDF

Info

Publication number
CN114548694A
CN114548694A CN202210094763.1A CN202210094763A CN114548694A CN 114548694 A CN114548694 A CN 114548694A CN 202210094763 A CN202210094763 A CN 202210094763A CN 114548694 A CN114548694 A CN 114548694A
Authority
CN
China
Prior art keywords
consultant
sqa
data
style
usefulness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210094763.1A
Other languages
English (en)
Inventor
王伟军
黄英辉
周宗奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central China Normal University
Original Assignee
Central China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central China Normal University filed Critical Central China Normal University
Priority to CN202210094763.1A priority Critical patent/CN114548694A/zh
Publication of CN114548694A publication Critical patent/CN114548694A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种SQA‑OC服务质量评估模型的构建方法,用于构建一SQA‑OC服务质量评估模型,可以为SQA‑OC服务质量的评估量化提供便捷有效的数据支持。方法包括:获取SQA‑OC服务平台上的咨询数据;通过预先利用精神疾病和心理问题的相关知识构建的领域词库,从咨询数据中剔除掉与症状、影响因素都无关的词,并对咨询数据通过潜在语义模型转化为向量数据模式的数据;基于预设的语言线索和向量数据模式,从咨询数据中解析得到咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性共三种特征集;以三种特征集为自变量,以公众对SQA‑OC服务的感知有用性为因变量,采用可解释学习回归法,构建一SQA‑OC服务质量评估模型。

Description

社会化回答式网络心理咨询服务质量评估模型的构建方法
技术领域
本申请涉及评估领域,具体涉及一种社会化回答式网络心理咨询服务质量评估模型的构建方法。
背景技术
随着移动互联网的快速发展和"互联网+"概念的广泛实践,网络心理咨询服务已经成为一个新兴的市场,大量的网络心理应用也随之出现。
与面对面咨询的隐私性和匿名性相比,社会化回答式网络心理咨询(SocialQuestion Answer-Online-Counseling,SQA-OC)显著避免了咨询过程中的隐私和伦理问题,可以大大提高心理咨询服务的主动性、可及性和即时性。
然而在现有的相关技术的研究过程中,发明人发现,SQA-OC服务这种非正式的心里咨询服务方式虽然对公众来说更舒适,但服务效果却往往不如正式的咨询服务,随着SQA-OC服务与心理咨询者的关系日益密切,在SQA-OC服务服务的质量方面存在着巨大而迫切的需求。
发明内容
本申请提供了一种社会化回答式网络心理咨询服务质量评估模型的构建方法,用于构建一SQA-OC服务质量评估模型,可以为SQA-OC服务质量的评估量化提供便捷有效的数据支持,从而有助于SQA-OC服务的良好开展。
第一方面,本申请提供了一种社会化回答式网络心理咨询服务质量评估模型的构建方法,方法包括:
获取SQA-OC服务平台上的咨询数据,咨询数据具体为咨询者向咨询师咨询心理问题所涉及的数据;
通过预先利用精神疾病和心理问题的相关知识构建的领域词库,从咨询数据中剔除掉与症状、影响因素都无关的词,并对咨询数据通过潜在语义模型转化为向量数据模式的数据;
基于预设的语言线索和向量数据模式,从咨询数据中解析得到咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性共三种特征集;
以三种特征集为自变量,以公众对SQA-OC服务的感知有用性为因变量,采用可解释学习回归法,构建一SQA-OC服务质量评估模型,SQA-OC服务质量评估模型用于对输入的目标咨询数据评估对应的感知有用性,达到对应的SQA-OC服务质量评估效果。
结合本申请第一方面,在本申请第一方面第一种可能的实现方式中,咨询者与咨询师之间行为的同步性的特征集,通过话题一致性、语言风格匹配和情感相似性三个方面的定量考察策略进行定量考察。
结合本申请第一方面,在本申请第一方面第二种可能的实现方式中,SQA-OC服务质量评估模型采用基于Shapley值的可解释人工智能框架,通过Shapley值来量化不同特征对模型的积极影响和消极影响。
结合本申请第一方面第二种可能的实现方式,在本申请第一方面第三种可能的实现方式中,方法还包括:
根据SQA-OC服务质量评估模型对不同特征计算得到的Shapley值,确定产生显著影响的多个特征值,显著影响是在预设的范围内通过Shapley值的大小或者Shapley值的排名名次确定得到的。
结合本申请第一方面第三种可能的实现方式,在本申请第一方面第四种可能的实现方式中,确定产生显著影响的多个特征值包括以下增加感知有用性的特征:
咨询者来源的文体特征、咨询者来源的非正式语言、文体和人称代词的语言线索;
高水平的咨询师来源的驱动力、风格和认知过程的语言线索;
高水平的咨询师来源的文体、人称代词、生物过程、个人关注、情感过程、知觉过程、时间取向的语言线索;
高水平的咨询师来源的认知过程、个人关注和情感过程的语言线索;
低水平的咨询者来源的非正式语言和人称代词的语言线索;
确定产生显著影响的多个特征值包括以下降低感知有用性的特征:
咨询师来源中的文体、情感过程、认知过程、驱动力、相对性和社会过程的语言线索;
低水平的咨询师来源的文体、时间取向、认知过程的语言线索;
低水平的咨询者-咨询师同步来源的主题一致性的语言线索。
结合本申请第一方面第三种或者第四种可能的实现方式,在本申请第一方面第五种可能的实现方式中,根据SQA-OC服务质量评估模型对不同特征计算得到的Shapley值,确定产生显著影响的多个特征值之后,方法还包括:
基于产生显著影响的多个特征值,确定提高感知有用性的咨询风格以及降低感知有用性的咨询风格,提高感知有用性的咨询风格包括具体化风格、感知-情感风格和共情风格,降低感知有用性的咨询风格包括消极风格和非正式风格。
结合本申请第一方面第五种可能的实现方式,在本申请第一方面第六种可能的实现方式中,基于产生显著影响的多个特征值,确定提高感知有用性的咨询风格以及降低感知有用性的咨询风格之后,方法还包括:
根据提高感知有用性的咨询风格以及降低感知有用性的咨询风格,为目标咨询师提供咨询风格提示。
第二方面,本申请提供了一种社会化回答式网络心理咨询服务质量评估模型的构建装置,装置包括:
获取单元,用于获取SQA-OC服务平台上的咨询数据,咨询数据具体为咨询者向咨询师咨询心理问题所涉及的数据;
转换单元,用于通过预先利用精神疾病和心理问题的相关知识构建的领域词库,从咨询数据中剔除掉与症状、影响因素都无关的词,并对咨询数据通过潜在语义模型转化为向量数据模式的数据;
解析单元,用于基于预设的语言线索和向量数据模式,从咨询数据中解析得到咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性共三种特征集;
构建单元,用于以三种特征集为自变量,以公众对SQA-OC服务的感知有用性为因变量,采用可解释学习回归法,构建一SQA-OC服务质量评估模型,SQA-OC服务质量评估模型用于对输入的目标咨询数据评估对应的感知有用性,达到对应的SQA-OC服务质量评估效果。
结合本申请第二方面,在本申请第二方面第一种可能的实现方式中,咨询者与咨询师之间行为的同步性的特征集,通过话题一致性、语言风格匹配和情感相似性三个方面的定量考察策略进行定量考察。
结合本申请第二方面,在本申请第二方面第二种可能的实现方式中,SQA-OC服务质量评估模型采用基于Shapley值的可解释人工智能框架,通过Shapley值来量化不同特征对模型的积极影响和消极影响。
结合本申请第二方面第二种可能的实现方式,在本申请第二方面第三种可能的实现方式中,装置还包括确定单元,用于:
根据SQA-OC服务质量评估模型对不同特征计算得到的Shapley值,确定产生显著影响的多个特征值,显著影响是在预设的范围内通过Shapley值的大小或者Shapley值的排名名次确定得到的。
结合本申请第二方面第三种可能的实现方式,在本申请第二方面第四种可能的实现方式中,确定产生显著影响的多个特征值包括以下增加感知有用性的特征:
咨询者来源的文体特征、咨询者来源的非正式语言、文体和人称代词的语言线索;
高水平的咨询师来源的驱动力、风格和认知过程的语言线索;
高水平的咨询师来源的文体、人称代词、生物过程、个人关注、情感过程、知觉过程、时间取向的语言线索;
高水平的咨询师来源的认知过程、个人关注和情感过程的语言线索;
低水平的咨询者来源的非正式语言和人称代词的语言线索;
确定产生显著影响的多个特征值包括以下降低感知有用性的特征:
咨询师来源中的文体、情感过程、认知过程、驱动力、相对性和社会过程的语言线索;
低水平的咨询师来源的文体、时间取向、认知过程的语言线索;
低水平的咨询者-咨询师同步来源的主题一致性的语言线索。
结合本申请第二方面第三种或者第四种可能的实现方式,在本申请第二方面第五种可能的实现方式中,根据SQA-OC服务质量评估模型对不同特征计算得到的Shapley值,确定产生显著影响的多个特征值之后,方法还包括:
基于产生显著影响的多个特征值,确定提高感知有用性的咨询风格以及降低感知有用性的咨询风格,提高感知有用性的咨询风格包括具体化风格、感知-情感风格和共情风格,降低感知有用性的咨询风格包括消极风格和非正式风格。
结合本申请第二方面第五种可能的实现方式,在本申请第二方面第六种可能的实现方式中,装置还包括提示单元,用于:
根据提高感知有用性的咨询风格以及降低感知有用性的咨询风格,为目标咨询师提供咨询风格提示。
第三方面,本申请提供了一种处理设备,包括处理器和存储器,存储器中存储有计算机程序,处理器调用存储器中的计算机程序时执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。
第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。
从以上内容可得出,本申请具有以下的有益效果:
针对于SQA-OC服务质量的自动化评估,本申请先获取SQA-OC服务平台上的咨询数据,再通过领域词库剔除掉与症状、影响因素都无关的词,并通过潜在语义模型转化为向量数据模式的数据,接着又解析得到咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性共三种特征集,再以该三种特征集为自变量,以公众对SQA-OC服务的感知有用性为因变量,采用可解释学习回归法,构建一SQA-OC服务质量评估模型,可以为SQA-OC服务质量的评估量化提供便捷有效的数据支持,从而有助于SQA-OC服务的良好开展;
此外,本申请在促进自动化评估SQA-OC服务质量的过程中,具体采用咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性三种影响因素来量化公众对SQA-OC服务的感知有用性,不仅提供了SQA-OC服务质量的具体量化方案,并且在实际操作中发现,该量化方案也精确有效地反映了SQA-OC服务质量情况,可取得很强的实用性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请社会化回答式网络心理咨询服务质量评估模型的构建方法的一种流程示意图;
图2为本申请社会化回答式网络心理咨询服务质量评估模型的构建方法的一种场景示意图;
图3为本申请不同特征累计的Shapley值的一种场景示意图;
图4为本申请不同特征累计的Shapley值的又一种场景示意图;
图5为本申请社会化回答式网络心理咨询服务质量评估模型的构建装置的一种结构示意图;
图6为本申请处理设备的一种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。在本申请中出现的对步骤进行的命名或者编号,并不意味着必须按照命名或者编号所指示的时间/逻辑先后顺序执行方法流程中的步骤,已经命名或者编号的流程步骤可以根据要实现的技术目的变更执行次序,只要能达到相同或者相类似的技术效果即可。
本申请中所出现的模块的划分,是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本申请中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分布到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。
在介绍本申请提供的社会化回答式网络心理咨询服务质量评估模型的构建方法之前,首先介绍本申请所涉及的背景内容。
本申请提供的社会化回答式网络心理咨询服务质量评估模型的构建方法、装置以及计算机可读存储介质,可应用于处理设备,用于构建一SQA-OC服务质量评估模型,可以为SQA-OC服务质量的评估量化提供便捷有效的数据支持,从而有助于SQA-OC服务的良好开展。
本申请提及的社会化回答式网络心理咨询服务质量评估模型的构建方法,其执行主体可以为社会化回答式网络心理咨询服务质量评估模型的构建装置,或者集成了该社会化回答式网络心理咨询服务质量评估模型的构建装置的服务器、物理主机或者用户设备(User Equipment,UE)等不同类型的处理设备。其中,社会化回答式网络心理咨询服务质量评估模型的构建装置可以采用硬件或者软件的方式实现,UE具体可以为智能手机、平板电脑、笔记本电脑、台式电脑或者个人数字助理(Personal Digital Assistant,PDA)等终端设备,处理设备可以通过设备集群的方式设置。
举例而言,处理设备具体可以为SQA-OC服务平台上的后台服务器,从而在SQA-OC服务平台背后,可以为平台上展开的SQA-OC服务自动评估其服务质量,尤其是还可以为当前正进行的SQA-OC服务进行质量评估,从而可以为当前正为咨询者提供SQA-OC服务的咨询师提供对应的服务质量提示、服务方式转变提示等提示方案,以进一步保障SQA-OC服务质量,保障咨询者的服务体验以及心理咨询效果。
下面,开始介绍本申请提供的社会化回答式网络心理咨询服务质量评估模型的构建方法。
首先,参阅图1,图1示出了本申请社会化回答式网络心理咨询服务质量评估模型的构建方法的一种流程示意图,本申请提供的社会化回答式网络心理咨询服务质量评估模型的构建方法,具体可包括如下步骤S101至步骤S104:
步骤S101,获取SQA-OC服务平台上的咨询数据,咨询数据具体为咨询者向咨询师咨询心理问题所涉及的数据;
可以理解,为构建一用于评估SQA-OC服务质量的评估模型,需要准备构建、训练模型用的样本数据。
对于样本数据,本申请优选地采用取SQA-OC服务平台上已有的咨询数据,SQA-OC服务平台上的咨询数据,可以理解,为SQA-OC服务平台为咨询者提供SQA-OC服务而得到的真实数据。
在SQA-OC服务平台上的咨询数据中,包含了咨询者向咨询师咨询心理问题所涉及的数据,具体的,如咨询者发起的问题、咨询师的问题回复以及在咨询过程中反应各种咨询状态、咨询进展的数据,其数据的具体内容,可以随实际需要调整,在此不做更多限制。
而对于咨询数据的获取处理,一方面可以为从SQA-OC服务平台实时地进行咨询数据的获取,另一方面也可以为从设备本地(包括相关的存储器、存储设备)提取预先从SQA-OC服务平台获取到的咨询数据。
而从SQA-OC服务平台获取咨询数据,既可以是SQA-OC服务平台方主动提供,例如SQA-OC服务平台方可以基于合作协议的内容在线上主动发送过来相关咨询数据,又例如SQA-OC服务平台方可以基于合作协议的内容在线下提供相关咨询数据的存储设备,或者,也可以是在SQA-OC服务平台方的许可下,主动从SQA-OC服务平台方的公开数据中抓取。
在实际应用中,无论是SQA-OC服务平台方还是本申请的处理设备,其对于SQA-OC服务平台上初始咨询数据的获取,一般都是采用的自动抓取方式,即通过数据类型的筛选,提取到满足基本要求的咨询数据。
作为一种实例,咨询数据可以从国内最大的网络心理平台"壹心理社区"中抓取,该平台上有近2000万的心理求助者,在该平台的问答栏目中,心理求助者可以匿名发布自己的心理困扰和问题,向平台的心理咨询师寻求心理服务和支持。问题帖可以包括几个内容,如帖子的标题、咨询者的年龄、性别、心理问题的过程、内心感受、问题的持续时间、标签(如职业、婚姻、恋爱关系、家庭等)。
在一次实际操作中,本申请抓取了5169个咨询者的心理帮助问题,以及15058个咨询者的回答,时间跨度是从2013年6月17日到2020年12月16日,每个咨询者的问题都有以下三个部分:描述的标题,心理问题的描述,以及询问时间,平均包含185个字。对问题的回答是咨询师的回复文字,平均包含388个字。用户给咨询师的喜欢数从1到39不等,平均为4.362。
可以理解,步骤S101所获取到的咨询数据,较为粗糙,本申请认为其还需进行进一步的数据加工,类似于预处理,以便将其处理为更适合进行模型构建的样本数据。
步骤S102,通过预先利用精神疾病和心理问题的相关知识构建的领域词库,从咨询数据中剔除掉与症状、影响因素都无关的词,并对咨询数据通过潜在语义模型转化为向量数据模式的数据;
在得到初始状态的咨询数据后,本申请则可对其进行内容筛选,以筛选出、剔除掉粗略的数据获取过程中存在的无意义内容,在该处理中,本申请则可以预先构建一领域词库,该领域词库具体是利用心里咨询相关的知识构建的,即利用精神疾病和心理问题的相关知识构建的,如此可过滤掉与心理咨询无关的内容,保留有效的心理咨询的内容,在筛选内容的过程中,还可以是以向量数据模式的形式进行,如此既方便内容筛选的处理,又可促进数据类型的表转化,方便后续的数据处理。
具体的,在实际操作中,本申请可以引入词嵌入,词嵌入是一种流行的机器学习方法,它用一个向量表示每个词,这样,这些向量之间的几何关系就能捕捉到相应词之间的语义关系。事实证明,单词嵌入可以将单词之间丰富的语义关系编码为低维向量空间中的几何关系,嵌入模型为具有挑战性的问题提供了新的机会和解决方案,包括语言进化性别和刻板印象,文化和身份,甚至材料特性的预测。对于SQA-OC相关文本中的心理语言线索(如症状和影响因素)的分析,利用词语嵌入从文本的描述标题和心理问题的描述部分提取领域主题。
具体来说,首先,本申请可以构建一个关于精神问题的症状和外部因素的预定义词库,示例性的,词库的种子词从Kessler 10和病人健康问卷、大连理工大学的情感词汇以及One Psychology网站的问题标签系统三个文本资源获得;然后,构建网络心理健康领域词典,通过使用Jieba工具(即一个Python中文分词包)和百度停用词表,对心理健康问题的文本进行切割,并删除停用词。根据基于神经嵌入的潜在语义分析方法,将该文本作为训练语料。利用Gensim软件中Word2vec的词嵌入方法,构建大规模SQA文本的潜在语义模型,获得心理健康症状及相关影响因素的领域词库。具体来说,在模型的基础上,计算模型词汇和预定义词汇之间的余弦相似度,设置余弦相似度阈值,去除SQA-OC文本中与预设词汇无关的词,对保留的词还可人工检查,建立心理问题、症状和外部因素的领域词典。
还可获得咨询者的心理问题和外部因素的主题。根据领域词库,选择咨询者的相关词汇。症状和外部因素的词向量表示是通过使用平均词嵌入方法获取。进一步,使用K-均值聚类算法及其评价指标(即Silhouette系数),评价不同聚类中心数量的聚类性能。选择最佳轮廓系数下的聚类中心数量来构建症状和外部因素的聚类。轮廓系数由聚类的聚集度和分离度来计算,其数值范围为-1至1。数值越大,代表聚类性能越好。然后,根据高频关键词将相似的症状表现和外部因素的话题分为几个群组,并确定有关咨询者心理问题的内容和数量。
步骤S103,基于预设的语言线索和向量数据模式,从咨询数据中解析得到咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性共三种特征集;
接下来,则可继续进行咨询数据的划分,加工成三种不同的样本数据,来实现本申请SQA-OC服务质量的特有量化方案。
可以理解,本申请认为,在SQA-OC服务方面,主要可以从咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性三个方面来反映对应的SQA-OC服务质量,因此,可以将咨询数据划分为这三个方面的数据,即,三种特征集。
作为特征集的处理依据,是采用预设的语言线索展开的,该语言线索,也可以理解为在文本层面咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性三者的语言特征,具体的:
对于咨询者的求助行为、咨询师的回复行为
咨询者文本中的语言线索,鉴于壹心理平台等SQA-OC平台上咨询者的问题对公众是可见的,其他咨询者在看了一个咨询者的问题及相关咨询师的回复后,可能会投票决定咨询师的回答是否有用。因此,假设咨询者文本中的语言线索会影响人们对SQA-OC服务质量的感知。
咨询师文本中的语言线索。以前的研究发现,治疗结果可以从咨询师使用语言的线索中预测出来。本申请假设,咨询师回应文本中的语言线索将影响SQA-OC服务质量。
对于咨询师文本或被咨询者文本的测量,作为一种实例,本申请使用CLIWC等程序来提取语言线索,包括情感过程、社会过程、认知过程、知觉过程、生物过程、驱动力、相对性、个人关注、非正式语言、时间取向。本申请还包括字数、每句字数、句数、功能词、动词、名词和人称代词的数量。
对于咨询者与咨询师之间行为的同步性
咨询者与咨询师之间行为的同步性,也可记为咨询师-咨询者的同步性,其同步的概念通常被用来描述在人际交流中发生的并发的非语言行为(如姿势、手势、面部表情),指的是只有当参与者拥有共同的行动路线/目标并在相互关系中约束自己的行为时才能实现的一种互动结果,本申请借用这个术语来指代咨询师和被咨询者之间的同步线下对话。
作为又一种适于实用的实现方式,在实际操作中,对于咨询者与咨询师之间行为的同步性的特征集,本申请具体通过话题一致性、语言风格匹配和情感相似性三个方面的定量考察策略进行定量考察。
具体的,本申请通过以下三个方面,即话题一致性(TC)、语言风格匹配(LSM)和情感相似性(ES)来进行定量考察。
1)主题一致性测量(TC)
对话题一致性的研究是为了探讨心理咨询师是否对求助者在问题中提到的多个话题做出回应。为了准确识别网络心理者和咨询师回复之间的SQA-OC文本中的心理话题,可以利用文本中的高频特征词的分布。因此,根据基于词嵌入的心理主题检测方法,将咨询者文本中的心理问题分为七个主题(即抑郁和焦虑、痛苦、社交恐惧症、缺乏兴趣、自杀倾向、担心和害怕以及愤怒)。同样,咨询者文本的影响因素也分为七个主题(即爱情、婚姻、心理治疗、工作、人际关系、个人特征和家庭)。相关的影响因素也被分为七种类型,即爱情、婚姻、心理治疗、工作、人际关系、个人特征和家庭。
在本研究中,本申请用Jaccard相似度来检验咨询师的回答中所涉及的话题是否与咨询者的文字一致。Jaccard相似度系数是一种衡量不对称二元属性相似度的方法。在计算一致性之前,本申请需要建立一个对应于七个主题的七维向量,以代表每个文本的主题多样性。首先,本申请对SQA-OC文本语料库进行逐一匹配,如果一个文本中出现了某个话题下的词,向量中的相应元素就会被改为1,否则就是0。同样,回复语料库也会进行上述操作。因此,对于每一段QA文本,本申请得到两个主题向量,即咨询者的问题和咨询者的相应回应。然后,计算Jaccard相似度来表示两个文本之间的话题一致性,并测量A和B集的共享属性(其中集由0或1组成)。因此,本申请可以把两个数据集以向量的形式表达出来,以衡量咨询者和咨询师之间的Jaccard相似性系数:J(Ri,Mi)=|Ri∩Mi||RiUMi|,其中Ri是咨询者i的话题向量表示,Mi代表心理咨询师回应i的话题向量表示,|Ri∩Mi|指咨询者的问题I和咨询师的回应i中共同出现的话题数量。最后,本申请用J(Ri,Mi)来表示咨询师的回答和咨询者的问题之间的话题一致性。
2)语言风格相似性测量(LSM)
为了心理咨询会话中的互动相关隐含语义内容,本申请引入了语言风格匹配度量,并通过LIWC软件等程序进行的量化分析。LSM不是基于语言内容的指标(例如,使用咨询者对感觉"生动"而不是"愤怒"的描述),而是代表会话双方在产生相似比率的功能词(例如,代词、介词和连词)的程度。事实上,功能词包括九种类型:介词、助动词、副词、连词、冠词、量词、否定词、人称代词和非人称代词。因此,本申请首先使用CLIWC程序等程序来计算文本中功能词的比例。然后,根据Ireland和Pennebaker(2010)介绍的LSM方法,咨询者提问和咨询师回复之间介词(preps)的LSM得分是。LSMpreps=1-[(|preps1-preps2|)/(preps1+preps2+0.0001)],其中,preps1代表整个咨询者文本中介词的百分比,preps2代表整个心理咨询师回复中介词的百分比。0.0001被添加到分母中,以防止出现空集,即一个功能词类别的值在整个文本中的百分比可能为零。本申请获取九个功能词类别的LSM分数均值,得到一个综合LSM分数,它代表咨询者的问题和咨询师的回答之间的语言风格相似性。其中较高的数字代表咨询者和咨询师之间更大的LSM。
3)情感相似性测量(ES)
共情对于成功的心理支持服务至关重要,也是咨询师培训中治疗策略的一部分。共情测量主要发生在同步的、面对面的环境中。目前还不知道共情的能否应用于异步的、基于文本的心理咨询环境。另外,虽然之前的NLP相关研究主要集中在共情,即对温暖和同情的情绪做出反应,或者集中在基于语音会话的环境。但同理心的一个独立但关键的方面是传达对他人的认知理解。鉴于数百万人使用基于社会化问答平台寻求心理支持服务,在SQA-OC中探索同理心的作用在本研究中具有实际意义。
在这项研究中,本申请采用一种新的计算方法来理解同理心是如何在基于文本的、异步的心理咨询会话中的表达。同理心是一个复杂的多维结构,其与情感和认知两个方面有关。情感方面涉及到对用户所表达的经验、感受的的情感反应。认知方面是一个深思熟虑的过程,即理解和解释用户的经验和感受,并将这种理解传达给他们。在这里,本申请研究了基于社会化问答的心理咨询中所表达的同理心,即咨询师在与咨询者的文本互动中所表达或传达的同理心。
具体来说,本申请使用CLIWC等程序从咨询者的提问和咨询师的相应回应的文本中提取与情感相关的语言线索,包括七个维度:情绪、积极情绪、消极情绪、焦虑、愤怒、悲伤和爱。本申请用咨询者与咨询师的情感相关语言线索的相似度来量化情感相似度,以表征共情。本申请应用余弦距离来衡量咨询者("clle")和咨询者("cllr")的情绪相关语言线索向量之间的相似度,即〖情绪〗_cllr和〖情绪〗_clle1。然后本申请计算余弦相似度如下。
Figure BDA0003490392580000111
其中,分子代表咨询者和咨询师之间的点状情绪相关语言线索向量,分母代表这两个向量的模块乘积。
步骤S104,以三种特征集为自变量,以公众对SQA-OC服务的感知有用性为因变量,采用可解释学习回归法,构建一SQA-OC服务质量评估模型,SQA-OC服务质量评估模型用于对输入的目标咨询数据评估对应的感知有用性,达到对应的SQA-OC服务质量评估效果。
在得到咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性三个方面的特征集后,则可开展SQA-OC服务质量评估模型的构建。
在构建模型或者说训练模型的过程中,遵循着以三种特征集为自变量,以公众对SQA-OC服务的感知有用性为因变量的原则,即,以标注有对应公众对SQA-OC服务的感知有用性的三种特征集作为模型训练数据,来训练模型对于输入的咨询数据的感知有用性的识别,如此当模型参数的优化满足训练次数、训练时长、识别精度等训练要求后,则可完成模型的训练,此时的模型则可投入实际应用,对输入的目标咨询数据评估对应的感知有用性,达到对应的SQA-OC服务质量评估效果。
其中,对于该SQA-OC服务质量评估模型,本申请是采用的采用可解释学习回归法构建的,具体可以使用线性机器学习回归,如线性回归、岭回归、拉索回归、支持向量回归以及非线性机器学习回归,如随机森林法,建立SQA-OC服务质量评估模型,在训练模型过程所涉及的损失函数中,本申请具体可以使用平均绝对误差(Mean Absolute Error,MAE)和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)来评估模型中不同算法和特征集的性能,并使用十倍交叉验证法来选择最佳预测模型。
此外,还可以注意到的是,本申请在SQA-OC服务质量的评估中,具体则是采用的公众对SQA-OC服务的感知有用性来进行服务质量的量化,通过感知有用性,精确反应咨询服务是否对于公众可产生明显的影响,达到其质量评估目的。
总体而言,从以上所示实施例可看出,针对于SQA-OC服务质量的自动化评估,本申请先获取SQA-OC服务平台上的咨询数据,再通过领域词库剔除掉与症状、影响因素都无关的词,并通过潜在语义模型转化为向量数据模式的数据,接着又解析得到咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性共三种特征集,再以该三种特征集为自变量,以公众对SQA-OC服务的感知有用性为因变量,采用可解释学习回归法,构建一SQA-OC服务质量评估模型,可以为SQA-OC服务质量的评估量化提供便捷有效的数据支持,从而有助于SQA-OC服务的良好开展;
此外,本申请在促进自动化评估SQA-OC服务质量的过程中,具体采用咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性三种影响因素来量化公众对SQA-OC服务的感知有用性,不仅提供了SQA-OC服务质量的具体量化方案,并且在实际操作中发现,该量化方案也精确有效地反映了SQA-OC服务质量情况,可取得很强的实用性。
进一步的,为提高该SQA-OC服务质量评估模型的使用价值,本申请将其配置为,采用基于Shapley值的可解释人工智能框架,通过Shapley值来量化不同特征(上述三种特征集中的特征)对模型的积极影响和消极影响。
对于该Shapley值(沙普利值),其是一种广泛使用的来自合作博弈理论的方法,它具有理想的特性。Shapley值代表一个特征对模型输出变化的责任,。Shapley值提供了两个重要的好处。第一,全球可解释性,即Shapley值可以显示每个预测因子对目标变量的贡献有多大,无论是积极的还是消极的。第二,局部可解释性,即每个观测值都能得到自己的一组Shapley值。传统的变量重要性算法只显示整个群体的结果,而不是每个个体的情况。本地可解释性使本申请能够准确地指出并对比各因素的影响。Shapley值大大增加了机器学习的透明度,并且已经在许多研究和工业场景中得到实施。
在引入基于Shapley值的可解释人工智能框架后,本申请可以用不同特征集的累积正负Shapley值来量化不同特征集对模型的积极影响和消极影响。
设数据量为M,特征集的特征数为{1,2,...,p},特征总数为N,因此,该特征集的正Shapley值为:
Figure BDA0003490392580000121
Figure BDA0003490392580000122
以同样的方式,可以计算负Shapley值。
如此可以通过Shapley值来可视化地量化模型构建过程中所发现的不同特征对于模型识别公众对SQA-OC服务的感知有用性的积极影响或者消极影响,从而对于确定了可以产生积极影响或者消极影响的特征,来为更好的心理咨询服务提供数据指导、提示、纠正。
具体的,对于上述内容,还可参考图2示出的本申请社会化回答式网络心理咨询服务质量评估模型的构建方法的一种场景示意图进行理解。
而在引入基于Shapley值的可解释人工智能框架后,还可根据SQA-OC服务质量评估模型对不同特征计算得到的Shapley值,确定产生显著影响的多个特征值,该显著影响是在预设的范围内通过Shapley值的大小或者Shapley值的排名名次确定得到的,从而可以为更好的心理咨询服务提供基于特征的、更为具体的数据指导、提示、纠正。
举例而言,首先本申请从包含218个特征的特征集中挑选出能够提高模型性能的有影响力的特征,并使用随机森林回归方法和基于Shapley值的可解释方法,计算了每个特征在预测SQA-OC的感知有用性方面的Shapley值,根据Shapley值将这些特征从高到低排序,根据排名顺序逐步向回归器添加特征,并评估每次添加新特征后模型的MAE值,最后,Shapley值发现,前52个最重要的特征取得了最高的性能:1.8556。
其次,我们通过MAE值进一步量化了不同算法和特征集在预测模型中的表现。如下面的表1所示,在不同的预测模型中,基于咨询者特征、咨询者特征和咨询者-咨询者同步特征组合的随机森林取得了最低的MAE。具体来说,对于具有大量特征的特征集,与其他线性预测算法相比,非线性随机森林算法取得了较低的MAE,如咨询师的特征集及其组合来源("咨询师"、"咨询师&咨询师&咨询师_咨询师_同步")。对于特征数量较少的特征集,与非线性预测算法("随机森林")相比,具有线性核的支持向量寄存器实现了较低的MAE,如counselees的特征集和它的组合源("counselee","counselee&counselee_counselor_sync")。总的来说,基于咨询者、咨询师及其同步来源的组合特征集的随机森林算法取得了最好的性能,其MAPE(MAE与平均感知有用性的比率)分别为0.20108、0.211445和0.228419。非线性随机森林和线性支持向量机算法在预测中优于其他典型的回归算法。
表1-模型中不同算法和特征集的性能
Figure BDA0003490392580000131
Figure BDA0003490392580000141
语言线索对SQA-OC的感知有用性的影响
(1)语言线索的不同来源和特征类型
为了进一步分析不同来源(即咨询师文本、被咨询者文本、咨询师-被咨询者同步文本)和不同类型的语言线索,对SQA-OC感知有用性预测模型的影响,本申请计算了上述影响性特征在预测感知有用性方面的累积Shapley值,结果见下面的表2。
对于不同特征来源的影响,首先,本申请发现三个来源都能提高预测模型的性能,而且这三个来源对感知有用性模型的性能提高都有递增的作用。从三个来源对模型性能改善的相对差异来看,心理咨询师反应特征对感知有用性的影响最大,其累计Shapley值为6.093(正值为3.2436,负值为-2.8497),占总Shapley值值的93.38%;远高于咨询者来源的语言线索的影响(Shapley值值为0.1699,占2.60%)或咨询者与咨询师之间的同步性(Shapley值为0.2621,占4.02%)。
在不同特征类型对预测模型的影响方面,我们计算并分析了预测模型中不同类型语言线索特征的累积Shapley值。在咨询师来源的特征集中,情感过程、生物过程、认知过程、驱动力、非正式语言、数字、感知过程、个人关注、个人代词、相对性、社会过程、文体、时间取向,是预测感知有用性的语言线索类型,占总效果的85.82%。其中,文体、认知过程和人称代词是最重要的语言线索,Shapley值分别为1.8539、1.2500和0.8139,占总效应的60.04%。在咨询者来源的特征集中,非正式语言(Shapley值为0.0625)和文体(Shapley值为0.1074)特征是有影响的语言线索类型。在咨询师和被咨询者间的同步性特征中,情感相似性(0.0936)和话题一致性(0.0665)是有影响的语言线索类型。
表2-感知有用性预测模型中不同来源和类型的语言线索的累积Shapley值
Figure BDA0003490392580000142
Figure BDA0003490392580000151
(2)不同来源和特征类型影响SQA-OC的感知有用性的方式
对于不同类型的语言线索影响感知有用性的方式,我们分析了不同类型的语言线索的特征对感知有用性的积极和消极影响,如表2所示,对于来自咨询师来源的不同类型的语言线索,除了相对性、社会过程和多功能性只降低感知有用性外,其他有影响的语言线索类型都可能提高和降低感知有用性。对于来自咨询者来源的不同类型的语言线索,文体只增加感知的有用性,而非正式语言既可能减少也可能增加感知的有用性。对于来自咨询者-咨询师同步来源的不同类型的语言线索,情感相似性、语言风格相似性和症状主题一致性语言线索都可能增加和减少感知有用性。
(3)排名靠前的语言学线索影响SQA-OC的感知有用性的方式
首先,为了获得感知有用性预测模型中最重要的语言线索特征,我们计算并分析了不同特征的Shapley值,如图3示出的本申请不同特征累计的Shapley值的一种场景示意图所示。对于预测模型中各特征的累积Shapley值,前33个最重要的特征贡献了约90%的影响,前40个重要特征贡献了95%以上的影响。具体来说,前33个特征包括:(1)来自咨询师来源语言学线索的文体;(2)来自咨询师来源语言学线索的文体、人称代词、认知过程、生物过程、认知过程、生物过程、个人关注、情感过程、时间取向、知觉过程;(3)和来自咨询者-咨询师同步特征的主题(症状)一致性。
其次,根据Shapley值,本申请进一步计算了前40个最重要的语言线索对感知有用性的影响,如图4示出的本申请不同特征累计的Shapley值的又一种场景示意图所示。在图4中,每张图都是由训练数据集中的数千个单独的点组成的,这样一来,数值越高就越红,数值越低就越蓝。这由每个图右边的"特征值"条来描述。因此,如果中心线一侧的点越来越红或越来越蓝,这表明增加的值或减少的值分别使预测的感知有用性向该方向发展。例如,较低的"趋势降低"值(蓝点)与相对较低的预测有用性有关。简单总结一下,本申请根据不同的影响方式,将其分为五种典型模式。
1)对于咨询者来源的文体(即WordCount)特征和咨询者来源的非正式语言(即Filler、Assent)、文体(即WordPerSentence)和人称代词(即You)语言线索,无论它们的特征值是处于高还是低水平,感知有用性都会增加。
2)对于咨询师来源中的文体(即Preps、MultiFun、PrepEnd)、情感过程(即Sad)、认知过程(即Certain)、驱动力(即Achieve)、相对性(即Space),以及社会过程(即Humans)语言线索,无论其特征值是处于高还是低水平,都倾向于降低感知有用性的水平。此外,驱动力(即成就)、风格(即PrepEnd)和认知过程(即某些)语言线索在处于非常高的水平时,会提高感知的有用性。
3)咨询师来源的文体(即Quote,RateFourCharWord,Colon,Nonfl)、人称代词(即We)、生物过程(即Health)、个人关注(即Religion,Money)、情感过程(即Anger,Anx)、知觉过程(即See,Feel,Hear)和时间取向(即tPast,ProgM)都处于高水平。情感过程(即愤怒、焦虑)、知觉过程(即看到、感觉到、听到)和时间取向(即tPast、ProgM)的语言线索在其特征值处于高水平时都会增强感知的有用性。
4)来自咨询师的文体(即SpecArt、Period、Number)、时间取向(即FutureM、PresentM)、认知过程(即Cause)语言线索,以及来自咨询者-咨询师同步来源(即Symptomsimi、Affect simi和LSM mean,包括LSMpreps)语言线索的主题(Symptom)一致性,在它们的特征值处于低水平时,会降低感知的有用性。相反,来自咨询师的认知过程(即抑制)、个人关注(即休闲)和情感过程(即悲伤)的语言线索的特征值在高水平时提高感知有用性,在低水平时降低感知有用性。
5)对于来自咨询者来源的非正式语言(即同意)和人称代词(即你)语言线索,它们的低水平提高了感知有用性,而它们的高水平则降低了这种提高。
或者说,上述引起显著影响的多个特征值包括以下增加感知有用性的特征:
咨询者来源的文体特征、咨询者来源的非正式语言、文体和人称代词的语言线索;
高水平的咨询师来源的驱动力、风格和认知过程的语言线索;
高水平的咨询师来源的文体、人称代词、生物过程、个人关注、情感过程、知觉过程、时间取向的语言线索;
高水平的咨询师来源的认知过程、个人关注和情感过程的语言线索;
低水平的咨询者来源的非正式语言和人称代词的语言线索;
此外,确定产生显著影响的多个特征值包括以下降低感知有用性的特征:
咨询师来源中的文体、情感过程、认知过程、驱动力、相对性和社会过程的语言线索;
低水平的咨询师来源的文体、时间取向、认知过程的语言线索;
低水平的咨询者-咨询师同步来源的主题一致性的语言线索。
进一步的,本申请在上述考察了三个来源的语言特征后,还发现可以融合为三种语言线索模式来有效提高SQA-OC的感知有用性,即"具体化"风格、"感知-情绪化"风格和"共情"风格。
即,在确定产生显著影响的多个特征值之后,还可包括:
基于产生显著影响的多个特征值,确定提高感知有用性的咨询风格以及降低感知有用性的咨询风格,提高感知有用性的咨询风格包括具体化风格、感知-情感风格和共情风格,降低感知有用性的咨询风格包括消极风格和非正式风格。
具体的:
(1)有帮助的咨询经验
本申请考察了三个来源的语言特征,发现有三种语言线索模式可以提高SQA-OC的感知有用性,即"具体化"风格、"感知-情绪化"风格和"共情"风格。
第一种模式的特点是"具体性"风格,有高水平的咨询师来源的文体(即WordCount)和高水平的咨询师来源的语言线索,即非正式语言(即Filler,Assent),文体(即Word Per Sentence),人称代词(即You)。成功的咨询师更善于处理对话中的模糊性,使用更多的词是有效的策略之一,使对话不那么不确定,更具体。
第二种模式的特点是具有"感知-情感"风格,主要是咨询师来源的语言使用,包括文体(即引用、冒号、Nonfl)、人称代词(即。我们)、生物过程(即健康)、个人关注(即宗教、金钱)、情感过程(即愤怒、焦虑)、知觉过程(即看、感觉、听)、时间取向(即tPast、ProgM)。使用这种风格的语言线索的咨询师更偏向于以群体为中心(复数代词"我们"),更关注情感话语和感官体验。对于生物过程、感知过程和时间取向等词汇的使用,之前的研究表明,好的咨询师和差的咨询师之间没有明显的差异这与本研究的结果不一致,这可能是由于SQA-OC采用单一的QA形式,而不是分步的多种咨询进度,导致咨询师尽可能多地使用认知/感官/情感描述来满足咨询者的信息需求,缓解其心理困扰。
第三种提高SQA-OC感知有用性的独特模式包括咨询师与被咨询者同步特征的变量,我们称之为"共情"风格。这种风格包括主题(症状)的一致性、情感的相似性、咨询师与被咨询者同步的LSM,此外还有咨询师来源的文体(即SpecArt、Period、Number)、时间取向(即FutureM、PresentM)、认知过程(即Cause)。与之前使用计算机方法研究咨询进展的研究一致,情感相似性和LSM似乎是咨询师与被咨询者同步的重要特征,这可能是由于情感相似性反映了共情的情感维度,它预测了咨询师的能力和谈话技巧,而LSM和话题(Symptom)一致性代表了同理心的认知维度,是无意识的人际沟通行为的反映,促进双方的相互理解和增加亲密感。这三个维度会影响咨询者对整体咨询体验的感知。因此,咨询师的回复文本与被咨询者的语言风格、情绪倾向和症状越相似,被咨询者就越有可能将SQA-OC的体验投以有用和有益的一票。
(2)无帮助的咨询经验
以下两种语言线索模式会降低SQA-OC的感知有用性,即"消极"风格,和"非正式"风格。消极"风格包含高级咨询师来源的文体(即Preps,MultiFun,PrepEnd)、情感过程(即Sad)、认知过程(即Certain)、驱动力(即Achieve)、相对性(即Space)、社会过程(即Humans)。这与之前的一项研究一致,即好的咨询师倾向于使用更多的积极情绪而不是消极的语言。第二种无益的特征组合被命名为"非正式"风格,它包含高水平的咨询师来源的非正式语言(即Assent)和高水平的咨询师来源的人称代词(即You)。这一发现补充了之前NLP从咨询者语言特征的角度研究咨询对话的方法,即咨询者的语言输出对咨询过程的影响与咨询者同样重要--对于这些咨询者来说,使用更多的非正式语言可能会降低对SQA-OC的感知帮助。
对于该咨询风格的设置,具体可以理解为,本申请研究了在线治疗关系,并开发了一种新的方法,从LSS、情感相似性和话题一致性方面对咨询师与被咨询者的互动进行计算机化。以前的研究表明,由于"抑制效应",咨询者在与咨询师进行在线交流时,可能会以更快的速度揭开谜底,直奔主题,而不是平静地缓和问题。然而,很少有人知道如何衡量基于文本的沟通的特点以及咨询师和被咨询者之间的互动模式。本申请的研究利用大规模的话语分析,指出了在线治疗关系中可能发生的五种风格("具体性"、"感知-情感"、"共情"、"消极"和"非正式")。然而,值得注意的是,咨询师在实际的实践环境中可能会采用不止一种风格。
而在确定了有助于提高感知有用性的咨询风格以及可能降低感知有用性的咨询风格之后,则还可包括:
根据提高感知有用性的咨询风格以及降低感知有用性的咨询风格,为目标咨询师提供咨询风格提示。
可以理解,除了在展开心理咨询服务之前,基于确定的提高感知有用性的咨询风格以及降低感知有用性的咨询风格,为不同的目标咨询师提供咨询风格提示,还可在展开心理咨询服务的过程中,为当前的咨询师(目标咨询师)提供动态的咨询风格提示,从而相比于上述只基于具体的特征的提示,可实现更为灵活的、概括性的咨询风格提示,方便目标咨询师根据当前咨询状态、咨询进展调整其咨询风格,更进一步保障了SQA-OC服务质量。
以上是本申请提供社会化回答式网络心理咨询服务质量评估模型的构建方法的介绍,为便于更好的实施本申请提供的社会化回答式网络心理咨询服务质量评估模型的构建方法,本申请还从功能模块角度提供了一种社会化回答式网络心理咨询服务质量评估模型的构建装置。
参阅图5,图5为本申请社会化回答式网络心理咨询服务质量评估模型的构建装置的一种结构示意图,在本申请中,社会化回答式网络心理咨询服务质量评估模型的构建装置500具体可包括如下结构:
获取单元501,用于获取SQA-OC服务平台上的咨询数据,咨询数据具体为咨询者向咨询师咨询心理问题所涉及的数据;
转换单元502,用于通过预先利用精神疾病和心理问题的相关知识构建的领域词库,从咨询数据中剔除掉与症状、影响因素都无关的词,并对咨询数据通过潜在语义模型转化为向量数据模式的数据;
解析单元503,用于基于预设的语言线索和向量数据模式,从咨询数据中解析得到咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性共三种特征集;
构建单元504,用于以三种特征集为自变量,以公众对SQA-OC服务的感知有用性为因变量,采用可解释学习回归法,构建一SQA-OC服务质量评估模型,SQA-OC服务质量评估模型用于对输入的目标咨询数据评估对应的感知有用性,达到对应的SQA-OC服务质量评估效果。
在又一种示例性的实现方式中,咨询者与咨询师之间行为的同步性的特征集,通过话题一致性、语言风格匹配和情感相似性三个方面的定量考察策略进行定量考察。
在又一种示例性的实现方式中,SQA-OC服务质量评估模型采用基于Shapley值的可解释人工智能框架,通过Shapley值来量化不同特征对模型的积极影响和消极影响。
在又一种示例性的实现方式中,装置还包括确定单元505,用于:
根据SQA-OC服务质量评估模型对不同特征计算得到的Shapley值,确定产生显著影响的多个特征值,显著影响是在预设的范围内通过Shapley值的大小或者Shapley值的排名名次确定得到的。
在又一种示例性的实现方式中,确定产生显著影响的多个特征值包括以下增加感知有用性的特征:
咨询者来源的文体特征、咨询者来源的非正式语言、文体和人称代词的语言线索;
高水平的咨询师来源的驱动力、风格和认知过程的语言线索;
高水平的咨询师来源的文体、人称代词、生物过程、个人关注、情感过程、知觉过程、时间取向的语言线索;
高水平的咨询师来源的认知过程、个人关注和情感过程的语言线索;
低水平的咨询者来源的非正式语言和人称代词的语言线索;
确定产生显著影响的多个特征值包括以下降低感知有用性的特征:
咨询师来源中的文体、情感过程、认知过程、驱动力、相对性和社会过程的语言线索;
低水平的咨询师来源的文体、时间取向、认知过程的语言线索;
低水平的咨询者-咨询师同步来源的主题一致性的语言线索。
在又一种示例性的实现方式中,根据SQA-OC服务质量评估模型对不同特征计算得到的Shapley值,确定产生显著影响的多个特征值之后,方法还包括:
基于产生显著影响的多个特征值,确定提高感知有用性的咨询风格以及降低感知有用性的咨询风格,提高感知有用性的咨询风格包括具体化风格、感知-情感风格和共情风格,降低感知有用性的咨询风格包括消极风格和非正式风格。
在又一种示例性的实现方式中,装置还包括提示单元506,用于:
根据提高感知有用性的咨询风格以及降低感知有用性的咨询风格,为目标咨询师提供咨询风格提示。
本申请还从硬件结构角度提供了一种处理设备,参阅图6,图6示出了本申请处理设备的一种结构示意图,具体的,本申请处理设备可包括处理器601、存储器602以及输入输出设备603,处理器601用于执行存储器602中存储的计算机程序时实现如图1对应实施例中社会化回答式网络心理咨询服务质量评估模型的构建方法的各步骤;或者,处理器601用于执行存储器602中存储的计算机程序时实现如图5对应实施例中各单元的功能,存储器602用于存储处理器601执行上述图1对应实施例中社会化回答式网络心理咨询服务质量评估模型的构建方法所需的计算机程序。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器602中,并由处理器601执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
处理设备可包括,但不仅限于处理器601、存储器602、输入输出设备603。本领域技术人员可以理解,示意仅仅是处理设备的示例,并不构成对处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如处理设备还可以包括网络接入设备、总线等,处理器601、存储器602、输入输出设备603等通过总线相连。
处理器601可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是处理设备的控制中心,利用各种接口和线路连接整个设备的各个部分。
存储器602可用于存储计算机程序和/或模块,处理器601通过运行或执行存储在存储器602内的计算机程序和/或模块,以及调用存储在存储器602内的数据,实现计算机装置的各种功能。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据处理设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器601用于执行存储器602中存储的计算机程序时,具体可实现以下功能:
获取SQA-OC服务平台上的咨询数据,咨询数据具体为咨询者向咨询师咨询心理问题所涉及的数据;
通过预先利用精神疾病和心理问题的相关知识构建的领域词库,从咨询数据中剔除掉与症状、影响因素都无关的词,并对咨询数据通过潜在语义模型转化为向量数据模式的数据;
基于预设的语言线索和向量数据模式,从咨询数据中解析得到咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性共三种特征集;
以三种特征集为自变量,以公众对SQA-OC服务的感知有用性为因变量,采用可解释学习回归法,构建一SQA-OC服务质量评估模型,SQA-OC服务质量评估模型用于对输入的目标咨询数据评估对应的感知有用性,达到对应的SQA-OC服务质量评估效果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的社会化回答式网络心理咨询服务质量评估模型的构建装置、处理设备及其相应单元的具体工作过程,可以参考如图1对应实施例中社会化回答式网络心理咨询服务质量评估模型的构建方法的说明,具体在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请如图1对应实施例中社会化回答式网络心理咨询服务质量评估模型的构建方法的步骤,具体操作可参考如图1对应实施例中社会化回答式网络心理咨询服务质量评估模型的构建方法的说明,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(Read Only Memory,ROM)、随机存取记忆体(Random Access Memory,RAM)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请如图1对应实施例中社会化回答式网络心理咨询服务质量评估模型的构建方法的步骤,因此,可以实现本申请如图1对应实施例中社会化回答式网络心理咨询服务质量评估模型的构建方法所能实现的有益效果,详见前面的说明,在此不再赘述。
以上对本申请提供的社会化回答式网络心理咨询服务质量评估模型的构建方法、装置、处理设备以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种社会化回答式网络心理咨询服务质量评估模型的构建方法,其特征在于,所述方法包括:
获取社会化问答式网络心理咨询SQA-OC服务平台上的咨询数据,所述咨询数据具体为咨询者向咨询师咨询心理问题所涉及的数据;
通过预先利用精神疾病和心理问题的相关知识构建的领域词库,从所述咨询数据中剔除掉与症状、影响因素都无关的词,并对所述咨询数据通过潜在语义模型转化为向量数据模式的数据;
基于预设的语言线索和所述向量数据模式,从所述咨询数据中解析得到咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性共三种特征集;
以所述三种特征集为自变量,以公众对SQA-OC服务的感知有用性为因变量,采用可解释学习回归法,构建一SQA-OC服务质量评估模型,所述SQA-OC服务质量评估模型用于对输入的目标咨询数据评估对应的感知有用性,达到对应的SQA-OC服务质量评估效果。
2.根据权利要求1所述的方法,其特征在于,所述咨询者与咨询师之间行为的同步性的特征集,通过话题一致性、语言风格匹配和情感相似性三个方面的定量考察策略进行定量考察。
3.根据权利要求1所述的方法,其特征在于,所述SQA-OC服务质量评估模型采用基于Shapley值的可解释人工智能框架,通过Shapley值来量化不同特征对模型的积极影响和消极影响。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述SQA-OC服务质量评估模型对不同特征计算得到的Shapley值,确定产生显著影响的多个特征值,所述显著影响是在预设的范围内通过Shapley值的大小或者Shapley值的排名名次确定得到的。
5.根据权利要求4所述的方法,其特征在于,所述确定产生显著影响的多个特征值包括以下增加感知有用性的特征:
咨询者来源的文体特征、咨询者来源的非正式语言、文体和人称代词的语言线索;
高水平的咨询师来源的驱动力、风格和认知过程的语言线索;
高水平的咨询师来源的文体、人称代词、生物过程、个人关注、情感过程、知觉过程、时间取向的语言线索;
高水平的咨询师来源的认知过程、个人关注和情感过程的语言线索;
低水平的咨询者来源的非正式语言和人称代词的语言线索;
所述确定产生显著影响的多个特征值包括以下降低感知有用性的特征:
咨询师来源中的文体、情感过程、认知过程、驱动力、相对性和社会过程的语言线索;
低水平的咨询师来源的文体、时间取向、认知过程的语言线索;
低水平的咨询者-咨询师同步来源的主题一致性的语言线索。
6.根据权利要求4或5所述的方法,其特征在于,所述根据所述SQA-OC服务质量评估模型对不同特征计算得到的Shapley值,确定产生显著影响的多个特征值之后,所述方法还包括:
基于产生显著影响的所述多个特征值,确定提高感知有用性的咨询风格以及降低感知有用性的咨询风格,所述提高感知有用性的咨询风格包括具体化风格、感知-情感风格和共情风格,所述降低感知有用性的咨询风格包括消极风格和非正式风格。
7.根据权利要求6所述的方法,其特征在于,所述基于产生显著影响的所述多个特征值,确定提高感知有用性的咨询风格以及降低感知有用性的咨询风格之后,所述方法还包括:
根据所述提高感知有用性的咨询风格以及所述降低感知有用性的咨询风格,为目标咨询师提供咨询风格提示。
8.一种社会化回答式网络心理咨询服务质量评估模型的构建装置,其特征在于,所述装置包括:
获取单元,用于获取社会化问答式网络心理咨询SQA-OC服务平台上的咨询数据,所述咨询数据具体为咨询者向咨询师咨询心理问题所涉及的数据;
转换单元,用于通过预先利用精神疾病和心理问题的相关知识构建的领域词库,从所述咨询数据中剔除掉与症状、影响因素都无关的词,并对所述咨询数据通过潜在语义模型转化为向量数据模式的数据;
解析单元,用于基于预设的语言线索和所述向量数据模式,从所述咨询数据中解析得到咨询者的求助行为、咨询师的回复行为、咨询者与咨询师之间行为的同步性共三种特征集;
构建单元,用于以所述三种特征集为自变量,以公众对SQA-OC服务的感知有用性为因变量,采用可解释学习回归法,构建一SQA-OC服务质量评估模型,所述SQA-OC服务质量评估模型用于对输入的目标咨询数据评估对应的感知有用性,达到对应的SQA-OC服务质量评估效果。
9.一种处理设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的方法。
CN202210094763.1A 2022-01-26 2022-01-26 社会化回答式网络心理咨询服务质量评估模型的构建方法 Pending CN114548694A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210094763.1A CN114548694A (zh) 2022-01-26 2022-01-26 社会化回答式网络心理咨询服务质量评估模型的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210094763.1A CN114548694A (zh) 2022-01-26 2022-01-26 社会化回答式网络心理咨询服务质量评估模型的构建方法

Publications (1)

Publication Number Publication Date
CN114548694A true CN114548694A (zh) 2022-05-27

Family

ID=81674401

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210094763.1A Pending CN114548694A (zh) 2022-01-26 2022-01-26 社会化回答式网络心理咨询服务质量评估模型的构建方法

Country Status (1)

Country Link
CN (1) CN114548694A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115221306A (zh) * 2022-09-21 2022-10-21 北京云迹科技股份有限公司 自动应答评价方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115221306A (zh) * 2022-09-21 2022-10-21 北京云迹科技股份有限公司 自动应答评价方法及装置

Similar Documents

Publication Publication Date Title
CN111444709B (zh) 文本分类方法、装置、存储介质及设备
Ferrer et al. Discovering and categorising language biases in reddit
WO2013125286A1 (ja) ノン・ファクトイド型質問応答システム及びコンピュータプログラム
KR102216768B1 (ko) 심리상담 데이터를 이용한 텍스트 내 감정분석을 위한 시스템 및 방법
Ahmad et al. Tools and techniques for lexicon driven sentiment analysis: a review
Peng et al. Human–machine dialogue modelling with the fusion of word-and sentence-level emotions
Shen et al. Kwickchat: A multi-turn dialogue system for aac using context-aware sentence generation by bag-of-keywords
Novielli et al. The role of affect analysis in dialogue act identification
Krommyda et al. Emotion detection in Twitter posts: a rule-based algorithm for annotated data acquisition
Qudar et al. A survey on language models
Johns Determining the relativity of word meanings through the construction of individualized models of semantic memory
CN114548694A (zh) 社会化回答式网络心理咨询服务质量评估模型的构建方法
Genest et al. French translation of a dialogue dataset and text-based emotion detection
Chaoua et al. Detecting and tracking ongoing topics in psychotherapeutic conversations.
Westbury Prenominal adjective order is such a fat big deal because adjectives are ordered by likely need
CN114300127A (zh) 问诊处理方法、装置、设备及存储介质
Lau et al. Perceptual features predict word frequency asymmetry across modalities
Gao et al. Detecting affective states from text based on a multi-component emotion model
Yang et al. Detecting Signs of Depression for Using Chatbots–Extraction of the First Person from Japanese
Bainbridge et al. Thinking about life in COVID-19: An exploratory study on the influence of temporal framing on streams-of-consciousness
van der Sluis et al. Information Retrieval eXperience (IRX): Towards a human-centered personalized model of relevance
Bandyopadhyay et al. Identification of depression strength for users of online platforms: a comparison of text retrieval approaches
Ellingson Eddington Processing Spanish gender in a usage‑based model with special reference to dual‑gendered nouns
CN116226677B (zh) 平行语料构建方法及装置、存储介质及电子设备
Babu et al. Multiclass Text Emotion Recognition in Social Media Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination