CN114202402A - 行为特征预测方法及装置 - Google Patents

行为特征预测方法及装置 Download PDF

Info

Publication number
CN114202402A
CN114202402A CN202110647920.2A CN202110647920A CN114202402A CN 114202402 A CN114202402 A CN 114202402A CN 202110647920 A CN202110647920 A CN 202110647920A CN 114202402 A CN114202402 A CN 114202402A
Authority
CN
China
Prior art keywords
behavior
data
characteristic
feature
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110647920.2A
Other languages
English (en)
Inventor
周小涵
姚俊展
郑杰标
王婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110647920.2A priority Critical patent/CN114202402A/zh
Publication of CN114202402A publication Critical patent/CN114202402A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Technology Law (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种行为特征预测方法及装置,涉及金融领域,方法包括:利用预设的人格量表从目标客户端获取客户的人格数据;对所述的人格数据进行特征提取生成人格数据初始特征集合;根据所述的初始特征集合和预先训练的行为特征预测模型确定行为特征预测结果;其中,所述的行为特征预测模型为利用从目标客户端获取的客户的人格数据进行特征标签确定建立的行为特征预测模型。本发明将多种层次的行为特征数据结合起来,将底层数据与上层语义信息相结合,达到更加全面、具有说服力的预测,为如何给客户提供更加个性化的服务有着非常好的指导意义。

Description

行为特征预测方法及装置
技术领域
本发明涉及数据处理技术,具体的讲是一种行为特征预测方法及装置。
背景技术
随着社会的发展,人民资产的累计,越来越多人开始重视资产管理,人们产生交易互动的几率大大增加。怎么能使得用户得到更加个性化、更加舒适的服务,是一直在思考的问题。而造成用户在目标场景下“个性化”实践难的原因,主要在于其有限的交互和反馈方式,如何建立一个在有限交互及反馈数据情况下,快速实现用户的“个性化”定位方式是必须解决的问题。
通过目标客户行为特征预测人格,可以同时满足希望更好的服务客户以更快更好的方式留住客户,和客户希望得到更舒心更个性化服务的两种诉求。
发明内容
有鉴于现有技术中行为预测的缺陷,本发明提供了一种行为特征预测方法,包括:
利用预设的人格量表从目标客户端获取目标客户的行为特征数据;
对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合;
根据所述的初始特征集合和预先训练的行为特征预测模型确定行为特征预测结果;其中,所述的行为特征预测模型为利用从目标客户端获取的目标客户的行为特征历史数据进行模型训练确定的行为特征预测模型。
本发明实施例中,所述的人格量表包括:BFI-10量表、BFI量表、NEO-FFI量表、NEO-PI-R量表;
所述的行为特征数据包括:客户基本信息特征数据、无语义行为特征数据及高层语义行为特征数据;
所述的无语义行为特征数据包括:动作行为特征数据、声音行为特征数据。
本发明实施例中,所述的对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合包括:
利用皮尔逊相关系数按预设的选取参数对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合;其中,所述的预设的选取参数包括:特征的相关性参数及显著性参数。
本发明实施例中,所述的根据所述的初始特征集合和预先训练的行为特征预测模型确定行为特征预测结果包括:
利用预先训练的行为特征预测模型对所述的初始特征集合进行特征标签确定生成最优特征集;
根据确定的最优特征集确定行为特征预测结果数据。
本发明实施例中,所述的利用从目标客户端获取的目标客户的行为特征数据进行特征标签确定建立的行为特征预测模型包括:
根据所述的历史数据利用网格搜索算法确定JMLLC-LS多标签模型的超参数;
利用遗传算法确定所述历史数据的初始特征集;
利用所述的超参数和初始特征集对JMLLC-LS多标签模型进行训练确定行为特征预测模型。
同时,本发明还提供一种行为特征预测装置,包括:
数据获取模块,用于利用预设的人格量表从目标客户端获取目标客户的行为特征数据;
初始特征提取模块,用于对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合;
预测模块,用于根据所述的初始特征集合和预先训练的行为特征预测模型确定行为特征预测结果;其中,所述的行为特征预测模型为利用从目标客户端获取的目标客户的行为特征历史数据进行模型训练确定的行为特征预测模型。
本发明实施例中,所述的初始特征提取模块对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合包括:
利用皮尔逊相关系数按预设的选取参数对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合;其中,所述的预设的选取参数包括:特征的相关性参数及显著性参数。
本发明实施例中,所述预测模块包括:
标签特征确定单元,用于利用预先训练的行为特征预测模型对所述的初始特征集合进行特征标签确定生成最优特征集;
预测数据确定单元,用于根据确定的最优特征集确定行为特征预测结果数据。
本发明实施例中,所述的装置还包括:预测模型确定模块,用于利用从目标客户端获取的目标客户的行为特征历史数据进行模型训练确定行为特征预测模型;其包括:
网格搜索单元,用于根据所述的历史数据利用网格搜索算法确定JMLLC-LS多标签模型的超参数;
初始特征集确定单元,用于利用遗传算法确定所述历史数据的初始特征集;
模型训练单元,用于利用所述的超参数和初始特征集对JMLLC-LS多标签模型进行训练确定行为特征预测模型。
同时,本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法。
同时,本发明还提供一种计算机可读存储介质,计算机可读存储介质存储有执行上述方法的计算机程序。
本发明提供了一种基于目标场景客户行为的预测模型,基于目标场景下行为特征的多标签行为特征预测模型研究。将多种层次的目标客户行为特征数据结合起来,将底层数据与上层语义信息相结合,达到更加全面、具有说服力的预测,对于如何给客户提供更加“个性化”的服务有着非常好的指导意义。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的行为特征预测方法的流程图;
图2为本发明实施例中的示意图;
图3为本发明提供的行为特征预测装置的框图;
图4为本发明实施例提供的电子设备示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
针对现有技术存在的缺陷,本发明的目的之一在于提供一种确定目标场景下用户行为特征与人格心理之间的关系,建立基于目标场景下行为特征的人格预测模型,对目标客户提供“个性化”服务提供研究支持。
如图1所示,本发明提供的行为特征预测方法,包括:
步骤S101,利用预设的人格量表从目标客户端获取目标客户的行为特征数据;
步骤S102,对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合;
步骤S103,根据所述的初始特征集合和预先训练的行为特征预测模型确定行为特征预测结果;其中,所述的行为特征预测模型为利用从目标客户端获取的目标客户的行为特征历史数据进行模型训练确定的行为特征预测模型。
本发明利用人格计算相关研究中的人格量表从目标客户端获取目标客户的行为特征数据,对从中抽取适用于目标场景下的行为特征进行特征提取,利用预先训练的行为特征预测模型确定行为特征预测结果,用最少的时间成本在众多行为特征中选取出最适合当前场景下的人格计算特征集,利用确定的行为特征预测结果如何给客户提供更加“个性化”的服务有着非常好的指导意义。
具体的,本发明实施例中,所述的人格量表包括:BFI-10量表、BFI量表、NEO-FFI量表、NEO-PI-R量表;
所述的行为特征数据包括:客户基本信息特征数据、无语义行为特征数据及高层语义行为特征数据;
所述的无语义行为特征数据包括:动作行为特征数据、声音行为特征数据。
本发明实施例中,所述的对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合包括:
利用皮尔逊相关系数按预设的选取参数对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合;其中,所述的预设的选取参数包括:特征的相关性参数及显著性参数。
具体的,本发明实施例中,对采集到的目标场景下客户行为数据进行处理,剔除异常数据,本发明实施例中采用皮尔逊相关系数的方法,进行初步的特征筛选。具体的,本发明实施例中,选取在各人格特质维度上显著性大于0.1,且相关性小于0.05 的被试行为特征,作为初始特征集合。对于人格数据,本发明实施例采用BFI-44人格量表进行收集。
本发明实施例中,所述的根据所述的初始特征集合和预先训练的行为特征预测模型确定行为特征预测结果包括:
利用预先训练的行为特征预测模型对所述的初始特征集合进行特征标签确定生成最优特征集;
根据确定的最优特征集确定行为特征预测结果数据。
本发明实施例中,所述的利用从目标客户端获取的目标客户的行为特征数据进行特征标签确定建立的行为特征预测模型包括:
根据所述的历史数据利用网格搜索算法确定JMLLC-LS多标签模型的超参数;
利用遗传算法确定所述历史数据的初始特征集;
利用所述的超参数和初始特征集对JMLLC-LS多标签模型进行训练确定行为特征预测模型。
具体的,针对采用经过皮尔逊相关系数筛选过的初始特征集,使用遗传算法、网格搜索与JMLLC-LS多标签算法相结合的方式,建立基于目标场景下客户行为特征的多标签人格预测模型,通过使用遗传算法,可以用最少的时间成本在众多行为特征中选取出最适合当前场景下的人格计算特征集。
JMLLC-LS为多标记分类和标记相关性的联合学习(JMLLC)多标签分类算法,该算法首先将多标签预测问题转换为多个二分类的单标签预测问题,并同时在训练过程中考虑标签之间相关性对预测结果的影响。构建了基于类别标记变量的有向条件依赖网络,使得标记分类器之间,以及标记分类器和标记相关性之间可以联合学习,从而增强学习效果和提高预测结果的准确性。
本发明实施例建立的基于目标场景下客户行为特征的多标签人格预测模型,提供了分析目标场景客户行为特征与人格关系之间的定性与定量的关系的方法,提出了从多层次的目标场景行为特征中,通过遗传算法,提取最终人格计算模型所需要的特征集的方法。提出并建立了基于目标场景客户行为特征的多标签人格预测模型及操作的具体方法步骤,研究了多重层级的客户行为特征对大五人格的综合预测,并在预测模型中充分考虑人格特质间的相关性对人格预测结果的影响。
“人格”一词来自于拉丁语“personality”,在拉丁语中指剧院中演员使用的面具。人格是一种稳定的、相互联系的,包含了生理及心理两个方面的心理学构念。人格是心理学家从人类多变的外在行为、思维、意识、情绪等的内在属性中总结出的外在概念。人格被认为是具有个体差异性、在成年后相对稳定不变的、可以被量化计算的。由于人格的以上特性,在很多领域,人们通过人格计算来解决“个性化”的相关问题。人格计算是处理人类人格的技术,是人机交互领域等的基础问题之一。人格计算的研究可以追溯到2000年,在2010年后至今,人格计算都是当今的研究热点之一。人格计算在广告及商品的个性化推荐、教学辅助系统等方面有着广泛的应用。
一个人的行为是其人格的外在表现,通过人类多变的行为可以分析预测一个人的人格,心理学上认为,人格相似的两个个体具有更强的吸引力及信任感。因此通过预测人格的方式,可以达到为客户提供“个性化”服务的目的。
一方面,针对于人类行为预测人格的研究已经比较成熟,理论上证实了人类行为预测人格的可行性,为本发明实施例中采集用户行为特征提供了更加便利的条件;另一方面,客户在目标场景下的行为数据层次丰富,丰富的行为特征数据所蕴含的人格特性也更加丰富,也可以提高预测结果的准确性,因此本发明实施例所提方法具有很大的扩展性、更多的使用场景及更大量的数据。
现有人格模型中最具代表性的人格模型是大五人格模型。大五人格模型是基于心理学理论中的人格特质论建立的,人格特质论是现有人格计算研究领域的研究基础,大五人格模型发展较为成熟,经过了心理学家多次的论证证实大五人格模型可以描述个体的差异性,并且大五人格模型量表使得人格可以被量化,这是人格计算研究的必要条件。鉴于大五人格模型的这些特性,本发明实施例选择使用大五人格模型对被试人格进行描述。大五人格的各维度描述如下:
外向性(Extraversion):外向性人格者热爱社交、乐观自信;而相反的内向性人格者更加含蓄稳健。
宜人性(Agreeableness):宜人性人格者在人际关系中更加具有责任感、更容易被他人信赖接纳、乐于助人、富有同情心;而低宜人性人格者缺乏合作精神、粗鲁且性格急躁、为人多疑、喜操控他人、报复心较强。
尽责性(Consciousness):尽责性人格者更加自律严禁、自我把握力强、做事有计划性、守时守信;而非尽责性人格者更倾向于懒惰、爱享受,做事无目标、粗心。
神经质(Neurotism):神经质性人格者更容易出现不良的情绪反应,更易产生心理压力、无法容忍失败;而非神经质性人格者情绪更加稳定,不易出现极端的情绪反应。
开放性(Openness):开放性人格者喜欢独立思考、具有较高的想象力和创造力、对于已有的经验和约定俗成的习俗抱有探索和开放的态度;而非开放性人格者更倾向于选择熟悉的事务、喜欢依据经验做事,接受新事物的能力较低。
现有的人格分析研究中有如下一些缺点:
一、对于通过人类行为特征数据进行人格计算的相关研究,选取的行为数据特征大多只集中在一到两个行为层次,没有将各个层级的数据结合起来使用。越丰富的行为数据所能表达的有效人格信息越多,现有研究不能做到结合各维度数据来达到更好的人格计算效果。
二、现有人格计算研究中,很多研究是集中在以英语为母语的国家,国内的相关研究相对较少。并且在目标场景下通过研究用户行为来进行人格计算是目前的研究空白。
三、已有研究中,没有将人格计算方法作为目标场景下“个性化”服务的支持的研究。
四、已有研究中,对于预测人格所需要的数据的收集要么不具备被试的针对性,要么收集成本高。
本发明实施例的目的在于,基于目标场景下用户行为特征与人格心理之间的关系,建立基于目标场景下行为特征的人格预测模型,为对客户提供个性化服务提供研究支持。
基于此,需要解决以下一些问题:已有人格计算相关研究中的哪些行为特征更适合应用于目标场景下;目标场景下哪些层次的行为特征相结合可以更好的预测人格;怎样建立基于目标场景下的行为特征的多标签人格预测模型。
基于此,本发明实施例提供了一种基于目标场景客户行为的人格预测模型,其主要包括以下步骤:
步骤一,数据采集、预处理及人格计算方法研究;
步骤二,基于目标场景下行为特征的多标签人格预测模型研究。
本发明实施例提供一种基于目标场景下客户行为特征的人格预测模型,为使发明的目的、技术方案和优点更加清楚,下面将本发明实施例中建立人格预测模型做进一步的详细描述。
为了建立基于目标场景下客户行为特征的人格预测模型,本发明实施例中首先需要整理现有人格计算相关研究中的行为特征,从中抽取适用于目标场景下的行为特征,并分析收集特征所需要的硬件设备。
首先,数据采集,本发明实施例通过预先设置的人格量表,采集用于模型建立的行为特征数据,以对被试的行为特征数据进行评估和量化。
具体的,本发明实施例中可使用的大五人格量表有:BFI-10(10道题目)、BFI (44道题)、NEO-FFI(60道题)、NEO-PI-R(240道题)。
考虑到题目数量以及问卷的语言版本,本发明一实施例采用选择BFI大五人格问卷量表。
本实施例结合现有行为特征预测人格的相关研究,提供一种适合于目标场景下人格计算的多层次行为特征提取方法,图2所示,为本发明实施例描述的行为特征的提取方法流程图:
采集目标场景客户活动数据;
获取客户活动数据中的客户基本信息特征;
对于以上特征,只需要相关的数据采集软件采集相关数据。
对采集到的目标场景下客户行为数据进行处理,剔除异常数据,本发明实施例中采用皮尔逊相关系数的方法,进行初步的特征筛选。
本实施例中,选取在各人格特质维度上显著性大于0.1,且相关性小于0.05的被试行为特征,作为初始特征集合。对于人格行为特征数据,本实施例采用BFI-44人格量表进行收集。
基于目标场景下客户行为特征的多标签人格预测模型:
为了建立基于目标场景下客户行为特征的多标签人格预测模型,本实施例采用经过皮尔逊相关系数筛选过的初始特征集,使用遗传算法、网格搜索与JMLLC-LS多标签算法相结合的方式,建立基于目标场景下客户行为特征的多标签人格预测模型。
本实施例通过使用遗传算法,可以用最少的时间成本在众多行为特征中选取出最适合当前场景下的人格计算特征集。
具体的,本发明实施例中利用网格搜索确定JMLLC-LS多标签算法的最优的超参数,利用遗传算法用来找本发明实施例场景下最优的特征集。JMLLC-LS算法用来做多标签人格预测模型。
本发明实施例中,利用网格搜索确定JMLLC-LS多标签算法的超参数(初始的网格搜索通过枚举的方式给的超参数,此时并不一定是最优的超参数)和利用遗传算法确定特征集(利用遗传算法初始给定的特征集,此时不一定为最优)以后,训练 JMLLC-LS算法,并计算精度,用精度作为遗传算法的误差函数。用误差函数判断哪一次迭代的超参数和特征集是最好的。
具体的,本发明一实施例中,预设遗传算法和网格搜索要迭代的次数,具体次数可以通过修改步长来改变,其实就是一个网格搜索里面嵌套一个遗传算法,遗传算法再嵌套一个JMLLC-LS算法。所以迭代次数是:网格搜索的迭代次数与遗传算法迭代次数的乘积。
本发明实施例中,JMLLC-LS算法为多标记分类和标记相关性的联合学习 (JMLLC)多标签分类算法,该算法首先将多标签预测问题转换为多个二分类的单标签预测问题,并同时在训练过程中考虑标签之间相关性对预测结果的影响。构建了基于类别标记变量的有向条件依赖网络,使得标记分类器之间,以及标记分类器和标记相关性之间可以联合学习,从而增强学习效果和提高预测结果的准确性。
JMLLC-LS算法预测函数如下:
Figure RE-GDA0003506271400000091
其中,W=[w1,…,wL],sl=[sl,1,…,sl,L]T,b=[b1,…,bL],W为d×L的矩阵,表示预测函数的权重向量,sl和b为1×L的矩阵,S表示标签的相关性权重向量。
得到学习模型如下:
Figure RE-GDA0003506271400000092
Figure RE-GDA0003506271400000101
Figure RE-GDA0003506271400000102
其中,V是损失函数;
B的作用是控制模型复杂度;
C的作用是控制信息量的大小;
‖wl2的作用是控制单个标签中信息量的大小;
||∑k≠lsl,kwk||2的作用是控制与l相关的标签中信息量的大小;
D的作用是控制相关系数的大小。
该算法使用最小二乘损失函数(即JMLLC-LS算法内部的损失函数的训练逻辑),得到模型如下:
Figure RE-GDA0003506271400000103
求解过程如下:
首先固定S,求解W:
Figure RE-GDA0003506271400000104
对W求导可以得到:
Figure RE-GDA0003506271400000105
然后固定W,求解S:
Figure BDA0003109947590000127
对S求导可以得到:
(WTXTXW+(λ12)WTW+λ3Id)S=WTXTX+λ2WTWel (公式7)
其中Id为d×d的单位矩阵。
表1描述了本发明实施例中基于目标场景下的人格计算基本流程的伪代码。
其中,表示大五人格初始相关性的I5,本发明实施例使用图2所示的皮尔逊相关性系数计算结果作为初始化输入,JMLLC-LS算法中待计算的正则化参数λ1,λ2,λ3(即JMLLC-LS算法里面需要的超参数)使用网格搜索,预设初始搜索范围为 [0.001,500],步长为0.001。
表1基于JMLLC-LS的多标签伪代码
Figure RE-GDA0003506271400000111
Figure RE-GDA0003506271400000121
表1中伪代码的第2行到第11行介绍了本发明结合网格搜索选择超参数、遗传算法选择特征以及JMLLC-LS算法解决目标场景下人格预测的问题。
计算过程:从公式(4)开始,λ1,λ2,λ3来自网格搜索,S的初始值来自预先获取的大五人格初始相关性I5(见表1的第7行),X是特征数据,Y是标签数据,d 是特征空间维度,L是标签个数,I是单位矩阵,el是第L个元素为1其余为0的L 维度列向量。
即结合三种算法同时运行,使用网格搜索(GS)选择JMLLC-LS算法的超参数 (λ1,λ2,λ3)(表1的第3行)。使用遗传算法(GA)选择特征集(表1的第6行),作为JMLLC-LS算法的输入。通过JMLLC-LS算法建立多标签人格预测模型,对每个被试的行为特征数据进行预测,第7-11行介绍了JMLLC-LS算法的训练过程。 JMLLC-LS算法的结果用于ACC值(精度)的计算(表1的第14行),并将该计算结果,作为遗传算法适应度函数的一部分(表1的第15行)。重复迭代前面的过程 100次,当迭代结束后,选取适应度函数最优的一组对应的特征集bestf和JMLLC-LS 算法的超参数λbest(表1的第26行)。
最后算法输出的bestf即为目标场景下人格计算最优特征集,λbest为JMLLC-LS 算法最优正则化参数。
本发明相比于之前的方案,其优点在于:
一.本发明将多种层次的目标客户行为特征数据结合起来,将底层数据与上层语义信息相结合,达到更加全面、具有说服力的预测,并首次将通过行为特征的人格计算方法应用到目标场景中,并提供了具体的实施方案。对于目标如何给客户提供更加个性化的服务有着非常好的指导意义。
二.本发明所使用的硬件设施是基于网点现有硬件条件,可以在被试用户同意知情的情况下,以一种不被打扰觉的方式收集数据,使得预测结果更加准确。
三.本发明详细总结并讨论了目标场景下与人格计算相关的各层次的客户行为,通过皮尔逊相关系数的方法,从丰富的行为特征中获得了目标场景下客户行为与人格之间关系的新知识。
四.本发明建立了基于目标场景下客户行为特征的多标签人格预测模型,本研究提出了分析目标场景客户行为特征与人格关系之间的定性与定量的关系的方法,提出了从多层次的目标场景行为特征中,通过遗传算法,提取最终人格计算模型所需要的特征集的方法。提出并建立了基于目标场景客户行为特征的多标签人格预测模型及操作的具体方法步骤,研究了多重层级的目标场景客户行为特征对大五人格的综合预测,并在预测模型中充分考虑人格特质间的相关性对人格预测结果的影响。
同时,本发明还提供一种行为特征预测装置,如图3所示,包括:
数据获取模块301,用于利用预设的人格量表从目标客户端获取目标客户的行为特征数据;
初始特征提取模块302,用于对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合;
预测模块303,用于根据所述的初始特征集合和预先训练的行为特征预测模型确定行为特征预测结果;其中,所述的行为特征预测模型为利用从目标客户端获取的目标客户的行为特征历史数据进行模型训练确定的行为特征预测模型。
本发明实施例中,所述的初始特征提取模块对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合包括:
利用皮尔逊相关系数按预设的选取参数对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合;其中,所述的预设的选取参数包括:特征的相关性参数及显著性参数。
本发明实施例中,所述预测模块包括:
标签特征确定单元,用于利用预先训练的行为特征预测模型对所述的初始特征集合进行特征标签确定生成最优特征集;
预测数据确定单元,用于根据确定的最优特征集确定行为特征预测结果数据。
本发明实施例中,所述的装置还包括:预测模型确定模块,用于利用从目标客户端获取的目标客户的行为特征历史数据进行模型训练确定行为特征预测模型;其包括:
网格搜索单元,用于根据所述的历史数据利用网格搜索算法确定JMLLC-LS多标签模型的超参数;
初始特征集确定单元,用于利用遗传算法确定所述历史数据的初始特征集;
模型训练单元,用于利用所述的超参数和初始特征集对JMLLC-LS多标签模型进行训练确定行为特征预测模型。
对本领域技术人员而言,通过前述实施例的描述可清楚获知本发明提供的装置的实现方式,在此不再赘述。
需要说明的是,本公开行为特征预测的方法和装置可用于金融领域在目标客户的行为特征的预测,也可用于除金融领域之外的任意领域的行为特征预测,本公开行为特征预测方法和装置的应用领域不做限定。
本实施例还提供一种电子设备,该电子设备可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该电子设备可以参照前述方法及装置的实施例,其内容被合并于此,重复之处不再赘述。
图4为本发明实施例的电子设备600的系统构成的示意框图。如图4所示,该电子设备600可以包括中央处理器100和存储器140;存储器140耦合到中央处理器100。值得注意的是,该图是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
一实施例中,目标客户的行为特征预测功能可以被集成到中央处理器100中。其中,中央处理器100可以被配置为进行如下控制:
利用预设的人格量表从目标客户端获取目标客户的行为特征数据;
对所述的人格数据进行特征提取生成人格数据初始特征集合;
根据所述的初始特征集合和预先训练的行为特征预测模型确定行为特征预测结果;其中,所述的行为特征预测模型为利用从目标客户端获取的目标客户的行为特征历史数据进行模型训练确定的行为特征预测模型。
在另一个实施方式中,目标客户的行为特征预测装置可以与中央处理器100分开配置,例如可以将目标客户的行为特征预测装置配置为与中央处理器100连接的芯片,通过中央处理器的控制来实现目标客户的行为特征预测功能。
如图4所示,该电子设备600还可以包括:通信模块110、输入单元120、音频处理单元130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图4中所示的所有部件;此外,电子设备600还可以包括图4中没有示出的部件,可以参考现有技术。
如图4所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器100接收输入并控制电子设备600 的各个部件的操作。
其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140 存储的该程序,以实现信息存储或处理等。
输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。
存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140 的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130 可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。
本发明实施例还提供一种计算机可读程序,其中当在电子设备中执行所述程序时,所述程序使得计算机在所述电子设备中执行如上面实施例所述的目标客户的行为特征预测方法。
本发明实施例还提供一种存储有计算机可读程序的存储介质,其中所述计算机可读程序使得计算机在电子设备中执行上面实施例所述的目标客户的行为特征预测。
以上参照附图描述了本发明的优选实施方式。这些实施方式的许多特征和优点根据该详细的说明书是清楚的,因此所附权利要求旨在覆盖这些实施方式的落入其真实精神和范围内的所有这些特征和优点。此外,由于本领域的技术人员容易想到很多修改和改变,因此不是要将本发明的实施方式限于所例示和描述的精确结构和操作,而是可以涵盖落入其范围内的所有合适修改和等同物。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等) 上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (11)

1.一种行为特征预测方法,其特征在于,所述的方法包括:
利用预设的人格量表从目标客户端获取目标客户的行为特征数据;
对所述的行为特征数据进行特征提取生成行为数据初始特征集合;
根据所述的初始特征集合和预先训练的行为特征预测模型确定行为特征预测结果;其中,所述的行为特征预测模型为利用从目标客户端获取的目标客户的行为特征历史数据进行模型训练确定的行为特征预测模型。
2.如权利要求1所述的行为特征预测方法,其特征在于,所述的人格量表包括:BFI-10量表、BFI量表、NEO-FFI量表、NEO-PI-R量表;
所述的行为特征数据包括:客户基本信息特征数据、无语义行为特征数据及高层语义行为特征数据;
所述的无语义行为特征数据包括:动作行为特征数据、声音行为特征数据。
3.如权利要求1所述的行为特征预测方法,其特征在于,所述的对所述的行为特征数据进行特征提取生成行为数据初始特征集合包括:
利用皮尔逊相关系数按预设的选取参数对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合;其中,所述的预设的选取参数包括:特征的相关性参数及显著性参数。
4.如权利要求1所述的行为特征预测方法,其特征在于,所述的根据所述的初始特征集合和预先训练的行为特征预测模型确定行为特征预测结果包括:
利用预先训练的行为特征预测模型对所述的初始特征集合进行特征标签确定生成最优特征集;
根据确定的最优特征集确定行为特征预测结果数据。
5.如权利要求1所述的行为特征预测方法,其特征在于,所述的利用从目标客户端获取的目标客户的行为特征历史数据进行模型训练确定行为特征预测模型包括:
根据所述的历史数据利用网格搜索算法确定JMLLC-LS多标签模型的超参数;
利用遗传算法确定所述历史数据的初始特征集;
利用所述的超参数和初始特征集对JMLLC-LS多标签模型进行训练确定行为特征预测模型。
6.一种行为特征预测装置,其特征在于,所述的装置包括:
数据获取模块,用于利用预设的人格量表从目标客户端获取客户的行为特征数据;
初始特征提取模块,用于对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合;
预测模块,用于根据所述的初始特征集合和预先训练的行为特征预测模型确定行为特征预测结果;其中,所述的行为特征预测模型为利用从目标客户端获取的目标客户的行为特征历史数据进行模型训练确定的行为特征预测模型。
7.如权利要求6所述的行为特征预测装置,其特征在于,所述的初始特征提取模块对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合包括:
利用皮尔逊相关系数按预设的选取参数对所述的行为特征数据进行特征提取生成行为特征数据初始特征集合;其中,所述的预设的选取参数包括:特征的相关性参数及显著性参数。
8.如权利要求6所述的行为特征预测装置,其特征在于,所述预测模块包括:
标签特征确定单元,用于利用预先训练的行为特征预测模型对所述的初始特征集合进行特征标签确定生成最优特征集;
预测数据确定单元,用于根据确定的最优特征集确定行为特征预测结果数据。
9.如权利要求6所述的行为特征预测装置,其特征在于,所述的装置还包括:预测模型确定模块,用于利用从目标客户端获取的目标客户的行为特征历史数据进行模型训练确定行为特征预测模型;其包括:
网格搜索单元,用于根据所述的历史数据利用网格搜索算法确定JMLLC-LS多标签模型的超参数;
初始特征集确定单元,用于利用遗传算法确定所述历史数据的初始特征集;
模型训练单元,用于利用所述的超参数和初始特征集对JMLLC-LS多标签模型进行训练确定行为特征预测模型。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至5任一项所述方法的计算机程序。
CN202110647920.2A 2021-06-10 2021-06-10 行为特征预测方法及装置 Pending CN114202402A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110647920.2A CN114202402A (zh) 2021-06-10 2021-06-10 行为特征预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110647920.2A CN114202402A (zh) 2021-06-10 2021-06-10 行为特征预测方法及装置

Publications (1)

Publication Number Publication Date
CN114202402A true CN114202402A (zh) 2022-03-18

Family

ID=80645791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110647920.2A Pending CN114202402A (zh) 2021-06-10 2021-06-10 行为特征预测方法及装置

Country Status (1)

Country Link
CN (1) CN114202402A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115499396A (zh) * 2022-11-16 2022-12-20 北京红棉小冰科技有限公司 具有人格特征的信息生成方法及装置
CN117252287A (zh) * 2023-08-04 2023-12-19 上海零数众合信息科技有限公司 一种基于联邦皮尔逊相关性分析的指标预测方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115499396A (zh) * 2022-11-16 2022-12-20 北京红棉小冰科技有限公司 具有人格特征的信息生成方法及装置
CN115499396B (zh) * 2022-11-16 2023-04-07 北京红棉小冰科技有限公司 具有人格特征的信息生成方法及装置
CN117252287A (zh) * 2023-08-04 2023-12-19 上海零数众合信息科技有限公司 一种基于联邦皮尔逊相关性分析的指标预测方法及系统

Similar Documents

Publication Publication Date Title
Van Everdingen et al. Modeling global spillover of new product takeoff
CN109376844A (zh) 基于云平台和模型推荐的神经网络自动训练方法和装置
US20230080271A1 (en) Audience-based optimization of communication media
WO2021155691A1 (zh) 用户画像生成方法、装置、存储介质及设备
JP7157239B2 (ja) 感情認識機械を定義するための方法及びシステム
CN114202402A (zh) 行为特征预测方法及装置
CN111460267B (zh) 对象识别方法、装置和系统
CN115577316A (zh) 一种基于多模态数据融合的用户人格预测方法与应用
Sekhar et al. Emotion recognition through human conversation using machine learning techniques
Al Mazidi et al. Study of general education diploma students’ performance and prediction in Sultanate of Oman, based on data mining approaches
CN105308591A (zh) 来自社交交互的关系强度的动态性
Yang et al. Quantitative study of music listening behavior in a smartphone context
Kumar et al. Analysis of machine learning algorithms for facial expression recognition
KR20220135150A (ko) 사용자 맞춤형 문화 예술 컨텐츠 큐레이션을 제공하고, 사용자와 함께 관람할 메이트를 추천하기 위한 방법 및 장치
CN114398909A (zh) 用于对话训练的问题生成方法、装置、设备和存储介质
KR102210772B1 (ko) 온라인 데이터에 기반한 사용자 성 정체성 예측 장치 및 방법
Alwadei et al. Designing a tool to address the depression of children during online education
Aleixo et al. Artificial intelligence applied to digital marketing
Nasiri et al. DENOVA: Predicting Five-Factor Model using Deep Learning based on ANOVA
WO2021071428A1 (en) System and method for innovation, creativity, and learning as a service
Krzeminska Personalizing smart services based on data-driven personality of user
Alghalibi et al. Deep Tweets Analyzer Model for Twitter Mood Visualization and Prediction Based Deep Learning Approach
Singh et al. A Survey on: Personality Prediction from Multimedia through Machine Learning
Tarka et al. On the Unstructured Big Data Analytical Methods in Firms: Conceptual Model, Measurement, and Perception
US12020267B2 (en) Method, apparatus, storage medium, and device for generating user profile

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination