CN112466435A - 心理辅导方案的确定方法及装置、存储介质、电子装置 - Google Patents

心理辅导方案的确定方法及装置、存储介质、电子装置 Download PDF

Info

Publication number
CN112466435A
CN112466435A CN202110141784.XA CN202110141784A CN112466435A CN 112466435 A CN112466435 A CN 112466435A CN 202110141784 A CN202110141784 A CN 202110141784A CN 112466435 A CN112466435 A CN 112466435A
Authority
CN
China
Prior art keywords
user
determining
psychological
sample data
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110141784.XA
Other languages
English (en)
Other versions
CN112466435B (zh
Inventor
司马华鹏
汪成
华冰涛
汤毅平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Silicon Intelligence Technology Co Ltd
Original Assignee
Nanjing Silicon Intelligence Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Silicon Intelligence Technology Co Ltd filed Critical Nanjing Silicon Intelligence Technology Co Ltd
Priority to CN202110141784.XA priority Critical patent/CN112466435B/zh
Publication of CN112466435A publication Critical patent/CN112466435A/zh
Application granted granted Critical
Publication of CN112466435B publication Critical patent/CN112466435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/70ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mental therapies, e.g. psychological therapy or autogenous training
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Child & Adolescent Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Developmental Disabilities (AREA)
  • Hospice & Palliative Care (AREA)
  • Psychiatry (AREA)
  • Psychology (AREA)
  • Social Psychology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本申请实施例提供了一种心理辅导方案的确定方法及装置、存储介质、电子装置,所述方法包括:对获取的样本数据进行聚类标注,以确定样本数据的类别标签;提供包含类别标签的选项;根据用户对类别标签的选择确定用户对应的第一心理辅导方案。解决了心理识别领域中的样本数据需要对每一个数据进行标注,导致工作量极大且效率极低的问题,通过聚类算法对样本数据进行聚类后标注,大大提高了标注的效率和准确性。

Description

心理辅导方案的确定方法及装置、存储介质、电子装置
技术领域
本申请涉及心理机器人技术领域,具体而言,涉及一种心理辅导方案的确定方法及装置、存储介质、电子装置。
背景技术
心理机器人是基于人工智能实现的对用户进行心理治疗/辅导的产品,心理机器人可以在使用过程中,根据用户的选择或与用户的交互以确定用户存在的心理问题,进而采用合适的方式对用户进行心理治疗或辅导。因此对于用户心理的识别判断至关重要。
相关技术中,大部分产品所实现的用户心理的识别依赖于预先采集大批量的用户语音/文本样本数据,并由人工对每一个数据进行标注,导致工作量极大且效率极低,进一步地,使用上述方法标注后的样本数据识别用户的心理问题时,往往缺乏规律可循,不易对症设置治疗方案。
针对相关技术中,心理识别领域中的样本数据需要对每一个数据进行标注,导致工作量极大且效率极低的问题,目前尚未有有效的解决办法。
发明内容
本申请实施例提供了一种心理辅导方案的确定方法及装置、存储介质、电子装置,以至少解决相关技术中心理识别领域中的样本数据需要对每一个数据进行标注,导致工作量极大且效率极低的问题。
在本申请的一个实施例中,提出了一种心理辅导方案的确定方法,包括:对获取的样本数据进行聚类标注,以确定所述样本数据的类别标签,其中,所述样本数据用于描述事件和/或心情;提供包含所述类别标签的选项;根据用户对所述类别标签的选择确定所述用户对应的第一心理辅导方案。
在本申请的一个实施例中,还提出了一种心理辅导方案的确定方法,包括:确定与用户进行交互的主题,其中,所述主题至少包括以下之一:用户性格、用户生活状态、用户近期精神状态,不同的所述主题对应于不同的预设话术规则;按照所述预设话术规则提供至少一个来自交互数据库的问询语句,其中,所述交互数据库中包括:根据心理学话术规则预先设置的具有对应关系的问询语句和应答语句;根据所述用户基于所述问询语句反馈的输入数据,确定所述用户的第二心理辅导方案。
在本申请的一个实施例中,还提出了一种心理辅导方案的确定装置,包括:标注模块,用于对获取的样本数据进行聚类标注,以确定所述样本数据的类别标签,其中,所述样本数据用于描述事件和/或心情;第一提供模块,用于提供包含所述类别标签的选项;第一确定模块,用于根据用户对所述类别标签的选择确定所述用户对应的第一心理辅导方案。
在本申请的一个实施例中,还提出了一种心理辅导方案的确定装置,包括:第二确定模块,用于确定与用户进行交互的主题,其中,所述主题至少包括以下之一:用户性格、用户生活状态、用户近期精神状态,不同的所述主题对应于不同的预设话术规则;提供模块,用于按照所述预设话术规则提供至少一个来自交互数据库的问询语句,其中,所述交互数据库中包括:根据心理学话术规则预先设置的具有对应关系的问询语句和应答语句;第三确定模块,用于根据所述用户基于所述问询语句反馈的输入数据,确定所述用户的第二心理辅导方案。
在本申请的一个实施例中,还提出了一种计算机可读的存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在本申请的一个实施例中,还提出了一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本申请实施例,对获取的样本数据进行聚类标注,以确定样本数据的类别标签;提供包含类别标签的选项;根据用户对类别标签的选择确定用户对应的第一心理辅导方案。解决了心理识别领域中的样本数据需要对每一个数据进行标注,导致工作量极大且效率极低的问题,通过聚类算法对样本数据进行聚类后标注,大大提高了标注的效率和准确性,根据不同标签与心理辅导方案的对应,在用户选择标签后确定对应的辅导方案,可以实现针对不同用户的个性化心理辅导。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例的一种心理辅导方案的确定方法的移动终端的硬件结构框图;
图2是根据本申请实施例中一种可选的心理辅导方案的确定方法的流程图;
图3是根据本申请实施例中又一种可选的心理辅导方案的确定方法的流程图;
图4是根据本申请实施例的一种可选的心理辅导方案的确定装置的结构框图;
图5是根据本申请实施例的又一种可选的心理辅导方案的确定装置的结构框图;
图6是根据本申请实施例的一种可选的电子装置结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本申请实施例的一种心理辅导方案的确定方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本申请实施例中的心理辅导方案的确定方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
本申请实施例提供了一种心理辅导方案的确定方法。图2是根据本申请实施例中一种可选的心理辅导方案的确定方法的流程图,如图2所示,该方法包括:
步骤S202,对获取的样本数据进行聚类标注,以确定样本数据的类别标签,其中,样本数据用于描述事件和/或心情;
步骤S204,提供包含类别标签的选项;
步骤S206,根据用户对类别标签的选择确定用户对应的第一心理辅导方案。
需要说明的是,本申请实施例中涉及的样本数据,可以是通过WEB爬虫技术,从各类社交网站、百科网站中爬取相关的事件数据与心情数据。经过去噪、标准化等数据预处理,保留一定数据作为样本数据。例如“看到别人上了普高,我上了技校,我自卑,朋友远离”,“放不下女朋友的过去,又不想放手”等涉及到学业、感情的数据。
本申请实施例中方法的执行主体可以是心理机器人,该心理机器人可以通过任意形式的应用程序实现,例如,APP,微信小程序,或搭载在预设终端中的固有程序等方式呈现。具体而言,本申请实施例提供的方法所涉及执行终端可以包括用户终端和服务器,服务器可以为云服务器,也可以为本地服务器。
用户终端,用于搭载心理机器人,并与用户之间进行交互,以实现对用户的心理治疗/辅导。用户设备包括但不限于手机、平板电脑、PC、可穿戴设备、室内大屏终端、户外大屏终端等。
服务器,用于根据用户的输入数据确定用户所期望的心理治疗/辅导方式或适于用户的心理治疗/辅导方式,以及后续根据选定的方式对用户进行心理治疗/辅导。
一种可选的实施方式中,上述步骤S202可以通过以下步骤实现:
S1,获取包含事件数据和/或心情数据的样本数据,样本数据包括以下至少之一的形式:文本、语音、图像、视频;
S2,通过变压器的双向编码器BERT对样本数据进行处理,以确定各个样本数据的句向量,其中,句向量为样本数据的特征表示;
S3,将句向量输入聚类算法,生成多个类别簇,其中,类别簇用于对不同类别的事件数据和不同类别的心情数据进行分类;
S4,对每一类别簇中属于同一类别的样本数据进行标注,确定样本数据的类别标签。
需要说明的是,类别标签可以是在样本数据聚类前确定好的,也可以是按照样本数据聚类后确定的,计算机根据聚类后每一类别的关键词,对应到类别标签,确定每一类别的类别标签,也可以由人工来进行类别标签的纠正,将人工纠正后的类别标签和相应的关键词输入标注类别标签的模型,通过不断的机器学习和验证,最终确定样本数据的类别标签。
需要说明的是,BERT是一种微调的多层双向Transformer编码器,属于语言模型的一种,相比较一些传统的语言模型word2vec、ELMO、GPT2等,在多项自然语言处理任务上都展现出最优的表现,并且可以有效的表示文本句子的语义信息。
一种可选的实施方式中,对每一类别簇中属于同一类别的样本数据进行标注,确定样本数据的类别标签,可以通过以下步骤实现:
S1,通过遍历样本数据,设定不同的类别标签,其中,类别标签包括事件标签和心情标签;
S2,对每一类别簇中属于同一类别的事件数据进行标注,确定对应的事件标签;
S3,对每一类别簇中属于同一类别的心情数据进行标注,确定对应的心情标签。
需要说明的是,获取的样本数据中,可以是仅描述事件的数据,例如“今天去参加考试了,考的不太好”,此时可以仅标注事件标签,例如“学业”、“事业”;可以是仅描述心情的数据,例如“今天有点难过”,此时可以仅标注心情标签,例如“伤心”、“难过”;也可以是同时包含事件和心情的数据,例如“今天求婚成功了,好开心”,此时可以同时标注事件标签和心情标签。
一种可选的实施方式中,将句向量输入聚类算法,生成多个类别簇可以通过以下步骤实现:
通过每个类别簇的误差平方和SSE指标确定类别簇个数K值的大小,其中,SSE指标用于指示每个类别簇内所有样本数据的聚类误差,SSE可以通过以下公式确定:
Figure 646893DEST_PATH_IMAGE001
,
Figure 377082DEST_PATH_IMAGE002
表示第
Figure 219137DEST_PATH_IMAGE003
个簇,
Figure 427395DEST_PATH_IMAGE004
表示属于第
Figure 304084DEST_PATH_IMAGE003
个簇的质心, 所述质心表示
Figure 939596DEST_PATH_IMAGE002
中所有样本数据的均值,
Figure 268946DEST_PATH_IMAGE005
表示第
Figure 546475DEST_PATH_IMAGE003
个簇的样本数据;
将句向量输入K-means算法进行聚类运算。
一种可选的实施方式中,将句向量输入K-means算法进行聚类运算可以通过以下步骤实现:
Step1. 确定K值后,从包含样本数据的数据集中随机选取K个点为质心;
Step2. 遍历数据集中所有的样本数据,计算每一个样本数据与质心的距离,选取距离最近的第一质心为一类,其中,距离计算公式余弦相似度如下:
Figure 277671DEST_PATH_IMAGE006
n表示向量的维度,
Figure 84084DEST_PATH_IMAGE007
分别表示一个样本数据的向量;
Step3. 选取每一个类别簇中的中心位置作为第二质心;
Step4. 确定第一质心和第二质心之间的距离是否小于或等于预设阈值,当小于或等于预设阈值时,结束聚类运算,当大于预设阈值时,重复Step1到Step4。
本申请实施例中生成多个类别簇可以使用K-means算法,以生成样本数据的句向量作为聚类算法的输入,通过手肘法选取合适的K值。手肘法的核心思想是随着K值的不断增加,样本的划分会更加精细,每个簇的误差平方以及SSE指标(指示该类别簇聚类的效果)会持续降低。因此当K值小于真实簇值时,SSE指标下降的幅度会较大;当K值大于真实簇值时,SSE指标下降的幅度会降低。引起幅度降低的K值则是最佳的簇值。K的值可通过多次试验确定。
一种可选的实施方式中,在用户没有选择心情标签或事件标签进而无法提供有效的第一心理辅导方案的情况下,按照预设话术规则提供至少一个来自交互数据库的问询语句,其中,交互数据库中包括:根据心理学话术规则预先设置的具有对应关系的问询语句和应答语句;
根据用户基于问询语句反馈的输入数据,确定用户的第二心理辅导方案。
需要说明的是,如果向用户提供了类别标签,但是用户没有选择任意一项,或者只选了事件没有选心情,或者只选了心情没有选事件,无法明确用户当前的心理状态,进而无法根据类别标签来对应心理辅导方案时,可以通过与用户进行交互沟通的方式,明确用户当前的心理状态,进而根据用户的性格特点、精神状态等,由心理机器人推荐适合用户的心理辅导方案。
一种可选的实施方式中,在按照预设话术规则提供至少一个来自交互数据库的问询语句之前,所述方法还包括:
确定与用户进行交互的主题,其中,主题至少包括以下之一:用户性格、用户生活状态、用户近期精神状态,不同的主题对应于不同的预设话术规则。
一种可选的实施方式中,在确定与用户进行交互的主题为用户性格的情况下,按照预设话术规则提供至少一个来自交互数据库的问询语句包括:
S1,获取用户基于问询语句反馈的第一输入数据;
S2,根据所第一输入数据确定用户的性格特征,其中,性格特征包括以下至少之一的分类方式:外倾或内倾,感觉或直觉,思维或情感,判断或知觉;
S3,使用用户的性格特征对应的预设话术规则,提供至少一个问询语句。
一种可选的实施方式中,在确定与用户进行交互的主题为用户生活状态的情况下,按照预设话术规则提供至少一个来自交互数据库的问询语句包括:
S1,获取用户基于问询语句反馈的第二输入数据,或,获取用户的关联软件数据;
S2,根据第二输入数据或关联软件数据确定用户的生活状态倾向;
S3,使用用户的生活状态倾向对应的预设话术规则,提供至少一个问询语句。
需要说明的是,关联软件数据,可以是用户的社交软件、购物软件、健身软件、音乐或视频的娱乐软件等软件平台的数据。
一种可选的实施方式中,在确定与用户进行交互的主题为用户近期精神状态的情况下,按照预设话术规则提供至少一个来自交互数据库的问询语句包括:
S1,获取用户基于问询语句反馈的第三输入数据;
S2,根据第三输入数据确定用户在指定时间段内的心理状态和心理趋势;
S3,使用用户在指定时间段内的心理状态和心理趋势对应的预设话术规则,提供至少一个问询语句。
一种可选的实施方式中,根据用户基于问询语句反馈的输入数据,确定用户的第二心理辅导方案包括:
根据用户基于不同的主题交互后反馈的输入数据,确定对应于不同主题的倾向标签,根据倾向标签形成用户的用户画像,根据用户画像确定用户的第二心理辅导方案;或
根据用户基于不同的主题交互后反馈的输入数据,确定对应于不同主题的倾向值,将对应于不同主题的倾向值进行综合评估后确定用户的最终倾向值,根据最终倾向值确定所述用户的第二心理辅导方案。
本申请实施例的另一个可选方案中,心理机器人可以不向用户提供标签选项,或者用户直接跳过标签选项,选择直接与心理机器人进行交流。图3是根据本申请实施例中又一种可选的心理辅导方案的确定方法的流程图,如图3所示,该方法包括:
步骤S302,确定与用户进行交互的主题,其中,主题至少包括以下之一:用户性格、用户生活状态、用户近期精神状态,不同的主题对应于不同的预设话术规则;
步骤S304,按照预设话术规则提供至少一个来自交互数据库的问询语句,其中,交互数据库中包括:根据心理学话术规则预先设置的具有对应关系的问询语句和应答语句;
步骤S306,根据用户基于问询语句反馈的输入数据,确定用户的第二心理辅导方案。
上述方法的具体实施方式如下:
S31,心理机器人按照预设话术与用户进行交互,交互主题包括但不限于:用户性格、用户生活状态、用户近期精神状态;上述交互主题的先后顺序不作限定。
一方面,以用户性格为例,心理机器人以选择式提问的方式询问用户的性格,提问的方式包括:1)外倾和内倾,2)感觉和直觉,3)思维和情感,4)判断和知觉。
1)外倾和内倾
外倾和内倾的区别在于心理能量的聚焦于外部还是内部。具体而言,两种倾向在聊天中差异性在于,外倾型的人会更沉浸在聊天之中,也会更多的创造出新的聊天话题,感觉就像有说不完的话一样;内倾型的人在聊天中更多的是充当一个倾听者的角色。
基于此,心理机器人在与用户交互过程中,可以不限定话题与用户进行交互,根据用户反馈的积极性判断用户属于外倾还是内倾,例如,反馈的频率,反馈的字数,是否有主动进行自身想法的分享,是否有主动扩展话题等,如用户积极互动,则用户偏向于外倾型,如用户习惯倾听,则用户偏向于内倾型。
2)感觉和直觉
感觉和直觉的区别在于获取信息的方式是感官还是推理。具体而言,两种倾向在聊天中差异性在于,感觉型的人更注重描述感官获得的信息;直觉型的人则更关注的是事物之间的联系。
基于此,心理机器人在于用户交互过程中,可以通过某一具体话题与用户进行交互,并询问用户的感受,例如,以上周末的安排作为话题,如用户反馈内容为周末玩的很开心,或风景很漂亮,则用户偏向于感觉型,如用户反馈内容为周末的具体行程或发生关系的人或事,则用户偏向于直觉型。
3)思维和情感
思维和情感的区别在于获取信息的方式是感官还是推理。具体而言,两种倾向在聊天中差异性在于,思维型的人更加理性,情感型的人更加感性。
基于此,心理机器人在于用户交互过程中,可以某一具体对象与用户进行交互,并询问用户的评价,例如,就用户提到的某个影片询问用户喜欢的理由,如用户反馈内容为剧情、演技、特效等,则用户偏向于思维型;如用户反馈内容为我就是喜欢,或者,有某个我喜欢的明星出演所以我喜欢,则用户偏向于情感型。
4)判断和知觉
判断和知觉的区别在于对信息的处理方式。具体而言,两种倾向在聊天中差异性在于,判断型的人一般都是循规蹈矩的,而知觉型的人更加随性。
基于此,心理机器人在于用户交互过程中,可以某一具体话题与用户进行交互,并询问用户的处理方式,例如,询问用户“计划观看A电影,临时买票的时候买成了B电影”,如用户选择退票或以后再看,则用户偏向于判断型,如用户选择观看B电影,则用户偏向于知觉型。
关于以上四类倾向,心理机器人可以根据用户的反馈对该用户形成不同的倾向标签,根据多个倾向标签形成用户画像,根据用户画像以确定用户的心理;或者,也可以根据用户的反馈以对用户赋予不同的倾向值,根据多个倾向类别的倾向值综合确定用户最终的倾向值,进而根据该倾向值确定用户的心理。
另一方面,以用户生活状态为例,心理机器人可以询问用户的日常作息时间,是否规律,爱好,习惯的放松形式,以确定用户的用户生活状态倾向,进而选择合适用户的心理治疗/辅导方式。以正念治疗为例,习惯于独处或作息规律的用户进行正念治疗的效果较好,习惯于运动或作息不定的用户进行正念治疗的效果较差。
同时,也可以在获得相应权限的情形下,读取用户终端中APP的分类,在一示例中,用户终端中安装有阅读类APP,且使用频率超过预设阈值,则可初步判定用户倾向于独处与思考,则该用户进行正念治疗的效果较好;在另一示例中,用户终端中安装有健身类APP与社交类APP,且使用频率超过预设阈值,则可初步判定用户倾向于运动与交际,则该用户进行正念治疗的效果有限。
另一方面,以用户近期精神状态为例,由于影响用户心理的事件往往与用户在一定周期内的整体心理状况是有关联的,心理机器人可通过询问用户近期的心理状态,以确定用户的近期的心理趋势,进而选择合适用户的心理治疗/辅导方式。上述心理机器人询问的过程基于精神评估的测评表,包括强迫症状、人际关系敏感、抑郁、焦虑、敌对、恐怖、偏执等倾向性;心理机器人可以以闲聊的方式询问用户上述倾向,并由用户在从无、很轻、中等、偏重、严重中进行选择,心理机器人根据用户的反馈评价用户各个倾向上的测评分,进而得到可评估用户近期精神状态的测评总分。
需要说明的是,以上用户性格、用户生活状态、用户近期精神状态的判断,也可以直接将相关的倾向与介绍呈现给用户,供用户主动进行选择。
S32,根据上述交互过程中用户在用户性格、用户生活状态、用户近期精神状态等主题上的反馈,确定用户的整体倾向,进而推荐一种适合用户的心理治疗/辅导方式。
上述S32中,用户在用户性格、用户生活状态、用户近期精神状态等主题上的反馈可以通过特征向量的方式表示,例如,外倾和内倾所设置的交互中,用户的不同回答(用户的回答可以以心理机器人向用户呈现的多个选项的方式收集)可以分别标记为特征向量[0,1],以此,即可收集用于表征用户在不同交互主题下的倾向的多个特征向量,多个特征向量即形成该用户的特征向量分布。
在执行步骤S31之前,可根据样本用户与心理机器人的交互获得一定的交互样本数据,样本用户与心理机器人的交互过程同上,在此不再赘述。上述交互样本数据包括每一个样本用户的特征向量分布,以及由心理学人员根据该向量为该样本用户推荐的心理治疗/辅导方式。对于心理治疗/辅导方式相同的特征向量分布所对应的样本用户,可通过聚类算法生成多个类别簇(可以通过类似于前述对需要标注的样本数据进行聚类的K-means算法来实现,此处不再重复),每个类别簇对应一类样本用户的倾向性。对每个类别簇,需计算出质心与最大边缘点的特征距离max_distance。在上述步骤S32中,在确定某一新用户的特征向量分布后,即需确定该特征向量分布与每一类别簇的质心的距离,如距离小于该类别簇对应的max_distance,则可确定该用户的整体心理倾向符合该类别簇的对应的心理治疗/辅导方式,并将该类别簇的对应的心理治疗/辅导方式向该用户推荐该类别簇所对应的心理治疗/辅导方式。
示例性实施例1
S100,通过WEB爬虫技术,从各类社交网站、百科网站中爬取相关的事件数据与心情数据。经过去噪、标准化等数据预处理,保留一定数据作为样本数据。
1) 事件数据
在心理治疗过程中,需要知道用户因为发生了什么事引起心情的变化,因此需要询问用户发生的具体事件,并根据具体事件设置固定的应答话术。例如:
AI(心理机器人):在你感受到焦虑时,你的脑海里浮现了什么想法呢。
User(用户): 看到别人上了普高,我上了技校,我自卑,朋友远离。
其中User所说的话术就是具体的事件,所对应的标签是事件-学业。在研发前期缺少这样的用户事件数据,因此需要通过收集此类数据,遍历各类事件。下述表1所展示的就是部分事件数据。
表1
Figure 900730DEST_PATH_IMAGE009
2) 心理数据
心理数据更多表示的是用户的心情状况,下述表2所展示的就是部分心理数据。
表2
Figure 462510DEST_PATH_IMAGE011
上表中的数据主要以非结构化数据为主,来源于国内在线心理治疗相关的垂直站点。对于数据的收集,本申请使用的是基于Scrapy框架的网络爬虫技术。爬虫首先以给定的初始站点为输入,通过数据解析模块对页面进行解析。数据解析模块主要分为对数据的解析以及对链接的解析,其中对数据的解析即根据定义的规则获取有效的信息数据;对链接的解析即解析出下一个需要爬取的网站URL。最终通过网络爬虫技术共爬取事件数据、心理数据1453条数据。
利用正则等技术手段对网络文本数据进行预处理、去除URL标识符、空格符、特殊符号等噪音数据;通过人力选取出其中有效的数据,并对句子进行切分等操作,最终获取如上表的数据格式。
S101,通过BERT对S100中的样本数据进行处理,以确定各个样本数据的句向量,并以该句向量作为样本数据的特征表示。
1) Bert句向量
Bert是一种通用的基于transformer结构的预训练语言模型,并且在11个NLP任务上都取得了最优效果。Bert预训练任务主要分为两个独立的任务:Masked LanguageModel、Next Sentence Prediction。
1.1) Masked Language Model
MLM是一种类似于完形填空的任务,对于每一个句子都会mask15%的词,用于上下文预测。例如对于句子“害怕见人,每天过得好痛苦”,会做如下处理:
A,80%时间使用[mask]代替句子中的词:
害怕 见 人,每天 过得 好 [mask]
B,10%时间使用其他词代替句子中的词:
害怕 见 人,每天 过得 好 今天
C,10%时间使用原来的句子:
害怕 见 人,每天 过得 好 痛苦
1.2) Next Sentence Prediction
随机选取文本中的一些句子对A和B,其中50%的B是接在A之后正常的句子,而50%的B是从语料库中随机选取的句子,此任务用于学习句子之间的相关性。
对于传统意义上的句向量,更多采用的是word embedding加权平均的方式,无法理解具体场景下的上下文语境。比如苹果出现在商业相关的语境下表达的是公司,而在事物的语境下表达的是某一种水果,但是传统意义上生成的embedding相同。Bert句向量的优点在于可以理解具体语境下的语义信息。
2) 句向量生成
本申请使用的是谷歌发布的中文bert预训练模型,模型的具体配置为layer=12,hidden size=768, attention head=12。生成句向量的部分结果如下表3所示。
表3
Figure 48212DEST_PATH_IMAGE013
Figure 25526DEST_PATH_IMAGE015
S102,通过聚类算法生成多个类别簇。本申请使用的是K-means算法,以S102中生成样本数据的句向量作为聚类算法的输入。通过手肘法选取合适的K值。手肘法的核心思想是随着K值的不断增加,样本的划分会更加精细,每个簇的误差平方以及SSE指标(指示该类别簇聚类的效果)会持续降低。因此当K值小于真实簇值时,SSE指标下降的幅度会较大;当K值大于真实簇值时,SSE指标下降的幅度会降低。引起幅度降低的K值则是最佳的簇值。K的值可通过多次试验确定。
上述K-means算法中, SSE可以通过以下公式确定:
Figure 595048DEST_PATH_IMAGE001
Figure 683221DEST_PATH_IMAGE016
表示第
Figure 389009DEST_PATH_IMAGE003
个簇,
Figure 537224DEST_PATH_IMAGE004
表示属于第
Figure 328463DEST_PATH_IMAGE003
个簇的质心,所述质心表示
Figure 220327DEST_PATH_IMAGE016
中所有样本数据 的均值,
Figure 780621DEST_PATH_IMAGE005
表示第
Figure 99738DEST_PATH_IMAGE003
个簇的样本数据。
上述S102中的聚类过程具体如下:
1.1,首先确定K值,即预先估计数据集经过聚类可以分为K个类别。在事件数据集表1上,K值的选择以此是3,4,5,6,7,8,For k in (3,4,5,6,7,8)。
1.2,从数据集中随机选取K个点为质心,例如:当k=3时,可以选择user0003,user0006,user0012为质心。
1.3,遍历数据集中所有的事件数据,计算每一个事件数据与质心的距离,选取最近的一个质心为一类;距离计算公式余弦相似度如下:
Figure 112693DEST_PATH_IMAGE017
其中,n表示向量的维度,在本申请中n=768;
Figure 808248DEST_PATH_IMAGE018
表示每一个数据的向量,x和y 分别表示普通向量和质心向量,可以是x为质心向量,也可以是y为质心向量,由bert句向量 表示,详见表3。通过上述公式计算的相似度的结果例如:
sim(user0001,user0003)= 0.8734791;或者,
sim(user0001,user0012)= 0.77313604。
1.4,对于每一个簇选取一个中心位置,即计算其中心向量,作为新的质心。
1.5,设置一个阈值
Figure 957470DEST_PATH_IMAGE019
,计算新的质心与之前质心的距离是否小于该阈值。
当小于该阈值,则认为模型达到稳定,聚类结束;当大于该阈值,则重复执行1.2 - 1.5,当重复步数达到某一预定的值
Figure 978646DEST_PATH_IMAGE020
时,聚类结束。在本申请中,
Figure 478898DEST_PATH_IMAGE019
设定为1e-4;
Figure 712564DEST_PATH_IMAGE020
设定为 300。
S103,对于步骤S102中生成多个类别簇,可由人工对每一类别簇中属于同一类别的样本数据进行标注,确定其类别标签。类别标签包括心理标签与事业标签,心情标签诸如焦虑、开心、生气等;事件标签诸如情感、学业、关系等。
基于bert句向量的K-means算法,最终确定事件数据的K值为5,心情数据的K值为6。标注人员对数据进行标注。由聚类算法生成多个类别,每个类别中句子同属于同一类别,由打标人员对其进行标注,确定其类别标签,心情标签诸如焦虑、开心、生气等;事件标签诸如情感、学业、关系等,部分结果如下表4所示。
表4
Figure DEST_PATH_IMAGE022
S104,获得S103中的标签后,由心理学人员重新将对S101中的每一样本数据打上相应的标签,以形成带有标签的样本数据。例如,对于上述“学习不好,没有真心朋友,我在小学就比较孤僻,一直不敢交朋友”可直接根据S103中确定的标签,为其赋予关系标签,但如心理学人员考虑到,该情形实质上更贴合学业,则可为其赋予学业标签。
S105,通过向用户提供带有上述类别标签的选项,根据用户的选择,确定合适用户的心理治疗/辅导方式。
具体而言,可由心理学人员明确每种标签所适用的心理治疗/咨询的方式,也可以由计算机根据关键词进行匹配,并为每种标签设置相应的话术,该话术用于心理机器人引导用户采用相应的方式进行心理治疗/辅导。例如,情感与关系标签可推荐用户进行正念治疗,学业标签可推荐用户进行CBT认知疗法治疗等。
示例性实施例2
S100至S104同示例性实施例1,不再赘述。
S105,某用户使用心理机器人,向心理机器人输入“我在工作中总是被安排不喜欢的事情”,没有选择对应的标签选项,心理机器人无法有效进行识别。此时,心理机器人跳转至交互流程,根据上述步骤S31至S32,确定适合用户的心理辅导/治疗的方式。
示例性实施例3
S100至S104同示例性实施例1,不再赘述。
S105,通过上述带有标签的样本数据即可作为分类器的训练样本,以进行分类器的训练,进而通过完成训练的分类器对用户使用过程中的输入数据进行分类识别以确定用户的心理,并选择合适用户的心理治疗/辅导方式。
具体而言,可由心理学人员明确每种标签所适用的心理治疗/咨询的方式,并为每种标签设置相应的话术,该话术用于心理机器人引导用户采用相应的方式进行心理治疗/辅导。例如,情感与关系标签可推荐用户进行正念治疗,学业标签可推荐用户进行CBT认知疗法治疗等。
S106,某用户使用心理机器人,向心理机器人输入“放不下女朋友的过去,又不想放手”。心理机器人通过上述步骤S105训练所得的分类器对上述输入内容进行分类识别,确定其分类的标签对应为情感,故根据S105中的示例,可故推荐正念训练给该用户。
示例性实施例4
S100至S105同示例性实施例1,不再赘述。
S106,某用户使用心理机器人,向心理机器人输入“我今天和她表白了,她说我是一个好人”,心理机器人通过上述步骤S100至S105训练所得的分类器对上述输入内容进行分类,该输入内容与分类器中类别2存在一定的相关度(设定为0.55),由于该输入内容虽然存在一定的相似度,但相似度并不理想。此时,可进一步跳转至交互流程,根据上述步骤S31至S32,确定适合用户的心理辅导/治疗的方式。如果上述分类器中类别2对应的为正念治疗,经过交互流程后推荐的心理辅导/治疗的方式也为正念治疗,故两者综合,可推荐正念治疗作为推荐给用户的心理辅导/治疗的方式。
示例性实施例5
S100至S105同示例性实施例3,不再赘述。
S106,某用户使用心理机器人,向心理机器人输入“她说我是一个好人”,心理机器人通过上述步骤S100至S105训练所得的分类器对上述输入内容进行分类,该输入内容与分类器中类别2(对应正念治疗)存在一定的相关度(设定为0.49),由于该输入内容虽然存在一定的相似度,但相似度并不理想。此时,可进一步跳转至方案2流程交互流程,根据上述步骤S31至S32,确定适合用户的心理辅导/治疗的方式为CBT认知疗法治疗。
由于上述输入内容与类别2的相似度低于阈值,故可以将交互流程后确定的CBT认知疗法治疗作为推荐给用户的心理辅导/治疗的方式。
对于本示例性实施例中用户的输入内容,可进一步将该输入内容与最终推荐的CBT认知疗法治疗输入分类器中进行训练,以提供分类器进行分类的全面性与准确性。
示例性实施例6
直接按照预设话术与用户进行交互,根据用户的反馈确定用户的整体心理倾向,以推荐一种适合用户的心理治疗/辅导方式。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述心理辅导方案的确定方法的心理辅导方案的确定装置。该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图4是根据本申请实施例的一种可选的心理辅导方案的确定装置的结构框图,如图4所示,该装置包括:
标注模块402,用于对获取的样本数据进行聚类标注,以确定样本数据的类别标签,其中,样本数据用于描述事件和/或心情;
第一提供模块404,用于提供包含类别标签的选项;
第一确定模块406,用于根据用户对类别标签的选择确定用户对应的第一心理辅导方案。
图5是根据本申请实施例的又一种可选的心理辅导方案的确定装置的结构框图,如图5所示,该装置包括:
第二确定模块502,用于确定与用户进行交互的主题,其中,所述主题至少包括以下之一:用户性格、用户生活状态、用户近期精神状态,不同的所述主题对应于不同的预设话术规则;
第二提供模块504,用于按照所述预设话术规则提供至少一个来自交互数据库的问询语句,其中,所述交互数据库中包括:根据心理学话术规则预先设置的具有对应关系的问询语句和应答语句;
第三确定模块506,用于根据所述用户基于所述问询语句反馈的输入数据,确定所述用户的第二心理辅导方案。
根据本申请实施例的又一个方面,还提供了一种用于实施上述心理辅导方案的确定方法的电子装置,上述电子装置可以但不限于应用于服务器中。如图6所示,该电子装置包括存储器602和处理器604,该存储器602中存储有计算机程序,该处理器604被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,对获取的样本数据进行聚类标注,以确定样本数据的类别标签,其中,样本数据用于描述事件和/或心情;
S2,提供包含类别标签的选项;
S3,根据用户对类别标签的选择确定用户对应的第一心理辅导方案。
可选地,在本实施例中,上述处理器还可以被设置为通过计算机程序执行以下步骤:
S1,确定与用户进行交互的主题,其中,主题至少包括以下之一:用户性格、用户生活状态、用户近期精神状态,不同的主题对应于不同的预设话术规则;
S2,按照预设话术规则提供至少一个来自交互数据库的问询语句,其中,交互数据库中包括:根据心理学话术规则预先设置的具有对应关系的问询语句和应答语句;
S3,根据用户基于问询语句反馈的输入数据,确定用户的第二心理辅导方案。
可选地,本领域普通技术人员可以理解,图6所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图6其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图6中所示更多或者更少的组件(如网络接口等),或者具有与图6所示不同的配置。
其中,存储器602可用于存储软件程序以及模块,如本申请实施例中的心理辅导方案的确定方法和装置对应的程序指令/模块,处理器604通过运行存储在存储器602内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的心理辅导方案的确定方法。存储器602可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器602可进一步包括相对于处理器604远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器602具体可以但不限于用于储存心理辅导方案的确定方法的程序步骤。作为一种示例,如图6所示,上述存储器602中可以但不限于包括上述心理辅导方案的确定装置中的标注模块402、第一提供模块404和第一确定模块406等,还可以包括上述心理辅导方案的确定装置中的第二确定模块502、第二提供模块504和第三确定模块506等。此外,还可以包括但不限于上述心理辅导方案的确定装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置606用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置606包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置606为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子装置还包括:显示器608,用于显示可疑帐号的告警推送;和连接总线610,用于连接上述电子装置中的各个模块部件。
本申请的实施例还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,对获取的样本数据进行聚类标注,以确定样本数据的类别标签,其中,样本数据用于描述事件和/或心情;
S2,提供包含类别标签的选项;
S3,根据用户对类别标签的选择确定用户对应的第一心理辅导方案。
可选地,在本实施例中,上述存储介质还可以被设置为存储用于执行以下步骤的计算机程序:
S1,确定与用户进行交互的主题,其中,主题至少包括以下之一:用户性格、用户生活状态、用户近期精神状态,不同的主题对应于不同的预设话术规则;
S2,按照预设话术规则提供至少一个来自交互数据库的问询语句,其中,交互数据库中包括:根据心理学话术规则预先设置的具有对应关系的问询语句和应答语句;
S3,根据用户基于问询语句反馈的输入数据,确定用户的第二心理辅导方案。
可选地,存储介质还被设置为存储用于执行上述实施例中的方法中所包括的步骤的计算机程序,本实施例中对此不再赘述。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (20)

1.一种心理辅导方案的确定方法,其特征在于,包括:
对获取的样本数据进行聚类标注,以确定所述样本数据的类别标签,其中,所述样本数据用于描述事件和/或心情;
提供包含所述类别标签的选项;
根据用户对所述类别标签的选择确定所述用户对应的第一心理辅导方案。
2.根据权利要求1所述的方法,其特征在于,所述对获取的样本数据进行聚类标注,以确定所述样本数据的类别标签包括:
获取包含事件数据和/或心情数据的样本数据,所述样本数据包括以下至少之一的形式:文本、语音、图像、视频;
通过变压器的双向编码器BERT对所述样本数据进行处理,以确定各个样本数据的句向量,其中,所述句向量为所述样本数据的特征表示;
将所述句向量输入聚类算法,生成多个类别簇,其中,所述类别簇用于对不同类别的所述事件数据和不同类别的所述心情数据进行分类;
对每一所述类别簇中属于同一类别的所述样本数据进行标注,确定所述样本数据的类别标签。
3.根据权利要求2所述的方法,其特征在于,所述对每一所述类别簇中属于同一类别的所述样本数据进行标注,确定所述样本数据的类别标签包括:
通过遍历所述样本数据,设定不同的类别标签,其中,所述类别标签包括事件标签和心情标签;
对每一所述类别簇中属于同一类别的所述事件数据进行标注,确定对应的事件标签;
对每一所述类别簇中属于同一类别的所述心情数据进行标注,确定对应的心情标签。
4.根据权利要求2所述的方法,其特征在于,所述将所述句向量输入聚类算法,生成多个类别簇包括:
通过每个类别簇的误差平方和SSE指标确定类别簇个数K值的大小,其中,所述SSE指标用于指示每个类别簇内所有样本数据的聚类误差,所述SSE可以通过以下公式确定:
Figure 36404DEST_PATH_IMAGE001
,
Figure 953544DEST_PATH_IMAGE002
表示第
Figure 467702DEST_PATH_IMAGE003
个簇,
Figure 659649DEST_PATH_IMAGE004
表示属于第
Figure 474021DEST_PATH_IMAGE003
个簇的质心,所述质心表示
Figure 30905DEST_PATH_IMAGE005
中所有样本数据的均 值,
Figure 297938DEST_PATH_IMAGE006
表示第
Figure 293576DEST_PATH_IMAGE003
个簇的样本数据;
将所述句向量输入K-means算法进行聚类运算。
5.根据权利要求4所述的方法,其特征在于,所述将所述句向量输入K-means算法进行聚类运算包括:
Step1. 确定K值后,从包含所述样本数据的数据集中随机选取K个点为质心;
Step2. 遍历所述数据集中所有的样本数据,计算每一个所述样本数据与所述质心的距离,选取距离最近的第一质心为一类,其中,距离计算公式余弦相似度如下:
Figure 696875DEST_PATH_IMAGE007
n表示向量的维度,
Figure 690239DEST_PATH_IMAGE008
分别表示一个样本数据的向量;
Step3. 选取每一个所述类别簇中的中心位置作为第二质心;
Step4. 确定所述第一质心和所述第二质心之间的距离是否小于或等于预设阈值,当小于或等于所述预设阈值时,结束聚类运算,当大于所述预设阈值时,重复Step1到Step4。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述根据用户对所述类别标签的选择确定所述用户对应的第一心理辅导方案之后,所述方法还包括:
在所述用户没有选择心情标签或事件标签进而无法提供有效的第一心理辅导方案的情况下,按照预设话术规则提供至少一个来自交互数据库的问询语句,其中,所述交互数据库中包括:根据心理学话术规则预先设置的具有对应关系的问询语句和应答语句;
根据所述用户基于所述问询语句反馈的输入数据,确定所述用户的第二心理辅导方案。
7.根据权利要求6所述的方法,其特征在于,所述按照预设话术规则提供至少一个来自交互数据库的问询语句之前,所述方法还包括:
确定与所述用户进行交互的主题,其中,所述主题至少包括以下之一:用户性格、用户生活状态、用户近期精神状态,不同的所述主题对应于不同的所述预设话术规则。
8.根据权利要求7所述的方法,其特征在于,在确定与所述用户进行交互的主题为用户性格的情况下,按照预设话术规则提供至少一个来自交互数据库的问询语句包括:
获取所述用户基于所述问询语句反馈的第一输入数据;
根据所述第一输入数据确定所述用户的性格特征,其中,所述性格特征包括以下至少之一的分类方式:外倾或内倾,感觉或直觉,思维或情感,判断或知觉;
使用所述用户的性格特征对应的所述预设话术规则,提供至少一个所述问询语句。
9.根据权利要求7所述的方法,其特征在于,在确定与所述用户进行交互的主题为用户生活状态的情况下,按照预设话术规则提供至少一个来自交互数据库的问询语句包括:
获取所述用户基于所述问询语句反馈的第二输入数据,或,获取所述用户的关联软件数据;
根据所述第二输入数据或所述关联软件数据确定所述用户的生活状态倾向;
使用所述用户的生活状态倾向对应的所述预设话术规则,提供至少一个所述问询语句。
10.根据权利要求7所述的方法,其特征在于,在确定与所述用户进行交互的主题为用户近期精神状态的情况下,按照预设话术规则提供至少一个来自交互数据库的问询语句包括:
获取所述用户基于所述问询语句反馈的第三输入数据;
根据所述第三输入数据确定所述用户在指定时间段内的心理状态和心理趋势;
使用所述用户在指定时间段内的心理状态和心理趋势对应的所述预设话术规则,提供至少一个所述问询语句。
11.根据权利要求7所述的方法,其特征在于,所述根据所述用户基于所述问询语句反馈的输入数据,确定所述用户的第二心理辅导方案包括:
根据所述用户基于不同的主题交互后反馈的所述输入数据,确定对应于不同主题的倾向标签,根据所述倾向标签形成所述用户的用户画像,根据所述用户画像确定所述用户的第二心理辅导方案;或,
根据所述用户基于不同的主题交互后反馈的所述输入数据,确定对应于不同主题的倾向值,将对应于不同主题的所述倾向值进行综合评估后确定所述用户的最终倾向值,根据所述最终倾向值确定所述用户的第二心理辅导方案。
12.一种心理辅导方案的确定方法,其特征在于,包括:
确定与用户进行交互的主题,其中,所述主题至少包括以下之一:用户性格、用户生活状态、用户近期精神状态,不同的所述主题对应于不同的预设话术规则;
按照所述预设话术规则提供至少一个来自交互数据库的问询语句,其中,所述交互数据库中包括:根据心理学话术规则预先设置的具有对应关系的问询语句和应答语句;
根据所述用户基于所述问询语句反馈的输入数据,确定所述用户的第二心理辅导方案。
13.根据权利要求12所述的方法,其特征在于,在确定与所述用户进行交互的主题为用户性格的情况下,按照所述预设话术规则提供至少一个来自交互数据库的问询语句包括:
获取所述用户基于所述问询语句反馈的第一输入数据;
根据所述第一输入数据确定所述用户的性格特征,其中,所述性格特征包括以下至少之一的分类方式:外倾或内倾,感觉或直觉,思维或情感,判断或知觉;
使用所述用户的性格特征对应的所述预设话术规则,提供至少一个所述问询语句。
14.根据权利要求12所述的方法,其特征在于,在确定与所述用户进行交互的主题为用户生活状态的情况下,按照所述预设话术规则提供至少一个来自交互数据库的问询语句包括:
获取所述用户基于所述问询语句反馈的第二输入数据,或,获取所述用户的关联软件数据;
根据所述第二输入数据或所述关联软件数据确定所述用户的生活状态倾向;
使用所述用户的生活状态倾向对应的所述预设话术规则,提供至少一个所述问询语句。
15.根据权利要求12所述的方法,其特征在于,在确定与所述用户进行交互的主题为用户近期精神状态的情况下,按照所述预设话术规则提供至少一个来自交互数据库的问询语句包括:
获取所述用户基于所述问询语句反馈的第三输入数据;
根据所述第三输入数据确定所述用户在指定时间段内的心理状态和心理趋势;
使用所述用户在指定时间段内的心理状态和心理趋势对应的所述预设话术规则,提供至少一个所述问询语句。
16.根据权利要求12至15任一项所述的方法,其特征在于,所述根据所述用户基于所述问询语句反馈的输入数据,确定所述用户的第二心理辅导方案包括:
根据所述用户基于不同的主题交互后反馈的所述输入数据,确定对应于不同主题的倾向标签,根据所述倾向标签形成所述用户的用户画像,根据所述用户画像确定所述用户的第二心理辅导方案;或
根据所述用户基于不同的主题交互后反馈的所述输入数据,确定对应于不同主题的倾向值,将对应于不同主题的所述倾向值进行综合评估后确定所述用户的最终倾向值,根据所述最终倾向值确定所述用户的第二心理辅导方案。
17.一种心理辅导方案的确定装置,其特征在于,包括:
标注模块,用于对获取的样本数据进行聚类标注,以确定所述样本数据的类别标签,其中,所述样本数据用于描述事件和/或心情;
第一提供模块,用于提供包含所述类别标签的选项;
第一确定模块,用于根据用户对所述类别标签的选择确定所述用户对应的第一心理辅导方案。
18.一种心理辅导方案的确定装置,其特征在于,包括:
第二确定模块,用于确定与用户进行交互的主题,其中,所述主题至少包括以下之一:用户性格、用户生活状态、用户近期精神状态,不同的所述主题对应于不同的预设话术规则;
第二提供模块,用于按照所述预设话术规则提供至少一个来自交互数据库的问询语句,其中,所述交互数据库中包括:根据心理学话术规则预先设置的具有对应关系的问询语句和应答语句;
第三确定模块,用于根据所述用户基于所述问询语句反馈的输入数据,确定所述用户的第二心理辅导方案。
19.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至16任一项中所述的方法。
20.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至16任一项中所述的方法。
CN202110141784.XA 2021-02-02 2021-02-02 心理辅导方案的确定方法及装置、存储介质、电子装置 Active CN112466435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110141784.XA CN112466435B (zh) 2021-02-02 2021-02-02 心理辅导方案的确定方法及装置、存储介质、电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110141784.XA CN112466435B (zh) 2021-02-02 2021-02-02 心理辅导方案的确定方法及装置、存储介质、电子装置

Publications (2)

Publication Number Publication Date
CN112466435A true CN112466435A (zh) 2021-03-09
CN112466435B CN112466435B (zh) 2022-05-13

Family

ID=74802616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110141784.XA Active CN112466435B (zh) 2021-02-02 2021-02-02 心理辅导方案的确定方法及装置、存储介质、电子装置

Country Status (1)

Country Link
CN (1) CN112466435B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7240691B1 (ja) 2021-09-08 2023-03-16 山東大学 データドライブの能動配電網異常状態検知方法及びシステム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050033608A1 (en) * 2003-08-04 2005-02-10 Jeremy Sherr Homoeopathic analysis and synthesis software
US20130204536A1 (en) * 2010-06-30 2013-08-08 University Of Saskatchewan Methods of kinome analysis
CN108877801A (zh) * 2018-06-14 2018-11-23 南京云思创智信息科技有限公司 基于多模态情绪识别系统的多轮对话语义理解子系统
CN109492109A (zh) * 2018-11-22 2019-03-19 北京神州泰岳软件股份有限公司 一种信息热点挖掘方法及装置
CN111477329A (zh) * 2020-03-31 2020-07-31 北京智能工场科技有限公司 一种基于图文结合评估心理状态的方法
CN111564202A (zh) * 2020-04-30 2020-08-21 深圳市镜象科技有限公司 基于人机对话的心理疏导方法、心理疏导终端和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050033608A1 (en) * 2003-08-04 2005-02-10 Jeremy Sherr Homoeopathic analysis and synthesis software
US20130204536A1 (en) * 2010-06-30 2013-08-08 University Of Saskatchewan Methods of kinome analysis
CN108877801A (zh) * 2018-06-14 2018-11-23 南京云思创智信息科技有限公司 基于多模态情绪识别系统的多轮对话语义理解子系统
CN109492109A (zh) * 2018-11-22 2019-03-19 北京神州泰岳软件股份有限公司 一种信息热点挖掘方法及装置
CN111477329A (zh) * 2020-03-31 2020-07-31 北京智能工场科技有限公司 一种基于图文结合评估心理状态的方法
CN111564202A (zh) * 2020-04-30 2020-08-21 深圳市镜象科技有限公司 基于人机对话的心理疏导方法、心理疏导终端和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7240691B1 (ja) 2021-09-08 2023-03-16 山東大学 データドライブの能動配電網異常状態検知方法及びシステム
JP2023042527A (ja) * 2021-09-08 2023-03-27 山東大学 データドライブの能動配電網異常状態検知方法及びシステム

Also Published As

Publication number Publication date
CN112466435B (zh) 2022-05-13

Similar Documents

Publication Publication Date Title
CN111444709B (zh) 文本分类方法、装置、存储介质及设备
Zhou et al. Trusting virtual agents: The effect of personality
CN108536681B (zh) 基于情感分析的智能问答方法、装置、设备及存储介质
Bazeley Mixed methods in my bones”: Transcending the qualitative-quantitative divide
Mehl Quantitative text analysis.
Vinciarelli et al. A survey of personality computing
Onan et al. Weighted word embeddings and clustering‐based identification of question topics in MOOC discussion forum posts
Chen et al. Mining students' learning patterns and performance in Web-based instruction: a cognitive style approach
US20210097468A1 (en) Generating sentiment metrics using emoji selections
Quasim et al. RETRACTED ARTICLE: Emotion-based music recommendation and classification using machine learning with IoT Framework
Wagner et al. Semantic stability in social tagging streams
CN112364234B (zh) 一种在线讨论的自动分组系统
Yang et al. Integrating image and textual information in human–robot interactions for children with autism spectrum disorder
CN108845986A (zh) 一种情感分析方法、设备及系统、计算机可读存储介质
CN110309114A (zh) 媒体信息的处理方法、装置、存储介质和电子装置
CN113392331A (zh) 文本处理方法及设备
Wang et al. Leverage social media for personalized stress detection
CN112466435B (zh) 心理辅导方案的确定方法及装置、存储介质、电子装置
CN112860213B (zh) 音频的处理方法和装置、存储介质及电子设备
CN109829033A (zh) 数据展示方法和终端设备
CN112685551A (zh) 语料库构建方法、聊天机器人会话方法及相关装置
Lola et al. Chatbot for fitness management using IBM Watson
JP2021533489A (ja) フィードバックを収集するためのコンピュータ実装システム及び方法
Negru A conceptual architecture of an arduino-based social-emotional interactive system
Weichbroth et al. A note on the affective computing systems and machines: a classification and appraisal

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant