CN109284693A - 基于字迹关键点的金融行为预测方法、装置、电子设备 - Google Patents

基于字迹关键点的金融行为预测方法、装置、电子设备 Download PDF

Info

Publication number
CN109284693A
CN109284693A CN201811012065.2A CN201811012065A CN109284693A CN 109284693 A CN109284693 A CN 109284693A CN 201811012065 A CN201811012065 A CN 201811012065A CN 109284693 A CN109284693 A CN 109284693A
Authority
CN
China
Prior art keywords
key point
writing
client
text
banking operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811012065.2A
Other languages
English (en)
Inventor
解笑
徐国强
邱寒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201811012065.2A priority Critical patent/CN109284693A/zh
Publication of CN109284693A publication Critical patent/CN109284693A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

本申请实施例提供了一种基于字迹关键点的金融行为预测方法、装置、电子设备。该方法包括:识别客户的字迹图片中的文字和用于确定文字的结构的关键点,并提取关键点在字迹图片中的位置信息;根据关键点的位置信息确定用于表征书写习惯的笔迹特征;根据预设的笔迹特征与金融行为的对应关系以及笔迹特征确定客户的金融行为预测信息。本申请实施例通过关键点识别技术识别客户签字的关键点,通过分析关键点的位置信息得到表征用户书写习惯的笔迹特征,进而根据能够反映客户金融行为的笔迹特征预测客户可能的金融行为,从而向用户推荐合适的金融产品,实现了金融产品的精准推荐,有助于提高交易成交率,同时降低了推销成本。

Description

基于字迹关键点的金融行为预测方法、装置、电子设备
技术领域
本申请涉及人工智能技术领域,具体而言,本发明涉及一种基于字迹关键点的金融行为预测方法、装置、电子设备。
背景技术
传统的金融产品推荐大多采用人工推荐的方式,在推销过程中需要推销人员通过聊天等方式进一步了解客户的性格、风险承受力等信息,以便向用户推荐合适的金融产品。而现有的大部分推销人员显然缺乏相关的心理学知识和分析能力,导致推销人员无法对客户的性格进行有效准确地分析。推销过程中,如果推销人员沟通方式不够恰当,还可能会造成客户的抵触心理,不利于产品的推荐。
传统的人工推荐产品的方式需耗费大量的人力成本,而且很难在较短时间内熟悉和掌握客户对金融产品的偏好,因此,无法精准地将满足客户需求和偏好的金融产品推荐给客户。
发明内容
本申请提供了一种基于字迹关键点的金融行为预测的方法、装置、电子设备及计算机可读存储介质,可以解决如何精准地向客户推荐金融产品的问题。所述技术方案如下:
第一方面,本申请提供了一种基于字迹关键点的金融行为预测的方法,该方法包括:
识别客户的字迹图片中的文字和用于确定文字的结构的关键点,并提取关键点在字迹图片中的位置信息;
根据关键点的位置信息确定用于表征书写习惯的笔迹特征;
根据预设的笔迹特征与金融行为的对应关系以及笔迹特征确定客户的金融行为预测信息。
第二方面,本申请提供了一种基于字迹关键点的金融行为预测的装置,该装置包括:
关键点提取模块,用于识别客户的字迹图片中的文字和用于确定文字的结构的关键点,并提取关键点在字迹图片中的位置信息;
笔迹特征提取模块,用于根据关键点的位置信息确定用于表征书写习惯的笔迹特征;
金融行为预测模块,用于根据预设的笔迹特征与金融行为的对应关系以及笔迹特征确定客户的金融行为预测信息。
第三方面,本申请提供了一种电子设备,该电子设备包括:一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个应用程序配置用于:执行本申请第一方面所示的基于字迹关键点的金融行为预测方法。
第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现本申请第一方面所示的基于字迹关键点的金融行为预测的方法。
本申请实施例提供的技术方案带来的有益效果是:通过关键点识别技术识别客户签字的关键点,通过分析关键点的位置信息得到表征用户书写习惯的笔迹特征,进而根据能够反映客户金融行为的笔迹特征预测客户可能的金融行为,从而向用户推荐合适的金融产品,实现了金融产品的精准推荐,有助于提高交易成交率,同时降低了推销成本。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种基于字迹关键点的金融行为预测方法的流程示意图;
图2为本申请实施例提供的一种基于字迹关键点的金融行为预测装置的结构示意图;
图3为本申请实施例提供的另一种基于字迹关键点的金融行为预测装置的结构示意图;
图4为本申请实施例提供的一种基于字迹关键点的金融行为预测的电子设备的结构示意图;
图5为给汉字“我”标注的25个关键点的示意图;
图6为汉字“我”对应的图片中的各个像素点与标注的关键点之间的二维偏移向量的示意图;
图7为关键区域内的二维偏移向量的示意图。
图8是汉字“我”中某一关键点的识别结果。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
实施例一
本申请实施例提供了一种基于字迹关键点的金融行为预测的方法,如图1所示,该方法包括:
步骤S101、识别客户的字迹图片中的文字和用于确定文字的结构的关键点,并提取关键点在字迹图片中的位置信息;
步骤S102、根据关键点的位置信息确定用于表征书写习惯的笔迹特征;
步骤S103、根据预设的笔迹特征与金融行为的对应关系以及笔迹特征确定客户的金融行为预测信息。
其中,通过现有的文字识别方法,如OCR(Optical Character Recognition,光学字符识别)识别字迹图片中的文字。
其中,文字的每个笔画均包括多个关键点,通过这多个关键点表示文字各个笔画在字迹图片中的位置,进而得到整个文字的结构以及在字迹图片中的位置。例如,图5示意了汉字“我”对应的关键点。字迹图片可以是客户在银行等金融机构办理业务时留下的签字。
其中,通过分析各个关键点之间的位置关系,可以确定字迹工整度、字间距、字的整体偏向等笔迹特征。而笔迹特征往往能够反映用户的某种特征,例如:字间距较小的客户安全感较弱、侵犯意识小,投资理财时更保守,偏好风险小的金融产品;而字间距较大的客户安全感较强、有一定的侵犯意识,投资理财时抗风险能力强,偏好风险较高的金融产品。例如,字迹工整度较高的客户,为人更加踏实稳重,购买金融产品时会谨慎衡量,因此可以向这样的客户推荐风险较高的金融产品;而字迹工整度较低的客户较为冒进,不适合向其推荐高风险的金融产品。
其中,金融行为是指客户会购买哪种类型金融产品,如存款、基金、保险、股票、期货等。一般可以从以下几个方面划分金融产品的类型:风险等级、收益等级、投资周期。
本实施例的基于字迹关键点的金融行为预测方法,通过关键点识别技术识别客户签字的关键点,通过分析关键点的位置信息得到表征用户书写习惯的笔迹特征,进而根据能够反映客户金融行为的笔迹特征预测客户可能的金融行为,从而向用户推荐合适的金融产品,实现了金融产品的精准推荐,有助于提高交易成交率,同时降低了推销成本。
实施例二
本申请实施例提供了另一种可能的实现方式,在实施例一的基础上,还包括实施例二所示的方法。
其中,步骤S101包括:
步骤S1010、识别客户的字迹图片中的文字。
步骤S1011、将客户的字迹图片分割为仅包含单个文字的子图。
步骤S1012、将子图输入关键点预测模型,得到该子图中的文字对应的关键点。
步骤S1013、根据子图与字迹图片的位置关系,确定该子图的关键点在字迹图片中的位置信息。
在识别关键点前,先将包含多个文字的字迹图片分割为多个仅包含单个文字的子图,通过关键点预测模型逐一识别子图中的单个文字的关键点,得到各个文字的关键点在子图中的位置信息,再根据子图与字迹图片的位置关系,将关键点在子图中的位置信息转换为关键点在字迹图片中的位置信息。通过关键点预测模型逐一识别单个文字的关键点,有助于提高文字关键点的识别精度。
进一步地,在步骤S1012之前,本实施例的方法还包括以下步骤:确定从字迹图片中识别到的各个文字对应的关键点数量,根据各个文字对应的关键点数量确定包含各个文字的子图对应的关键点预测模型。
相应地,步骤S1012具体包括:将子图输入与该子图对应的关键点预测模型,得到该子图中的文字对应的关键点。
其中,预先构建了关键点数据库,该关键点数据库中存储有大量常用字以及各个字对应的关键点数量,例如,“我”的关键点数量为25,“李”的关键点数量为20,“一”的关键点数量为4。同时,针对不同数量的关键点训练了多个关键点预测模型。为区分各个关键点预测模型,能预测一个关键点的关键点预测模型称为M1模型,能预测两个关键点的关键点预测模型称为M2模型,以此类推。
例如,识别到字迹图片中包含的文字为“李”和“一”,通过查询关键点数据库得到“李”对应的关键点数量为20,“一”对应的关键点数量为4;将“李”对应的子图输入M20模型,M20模型输出“李”的20个关键点在子图中的位置信息,将“一”对应的子图输入M4模型,M4模型输出“一”的4个关键点在子图中的位置信息。
其中,所有关键点预测模型均选用“漏斗”型卷积神经网络,该“漏斗”型卷积神经网络包括:Resnet101和转置卷积。关键点预测模型的输入为图片,关键点预测模型的输出层包含3×K个通道,K为关键点数量,即针对每个关键点,模型会输出3个参量值,其中一个参量值为概率矩阵,其它两个参量值为输入图片中的像素点相对于关键点在x和y方向的偏移量,这两个参量值组合在一起即为二维偏移向量。关键点预测模型输出的概率矩阵的维度与输入图片的维度一致,例如,输入图片是大小为200×200,则输出的概率矩阵的维度也为200×200。
关键点预测模型输出的概率矩阵由hk(xi)组成,hk(xi)表示第i个像素点是第k个关键点的概率,hk(xi)的取值范围为0到1。xi为第i个像素点在输入图片中的坐标位置,lk为关键点在输入图中的坐标位置。输入图片中第i个像素点与第k个关键点之间的二维偏移向量记为Fk(xi)。
以MN模型为例,将包含单个文字的子图输入MN模型,先通过训练好的Resnet101提取子图中的高维特征,再对提取的高维特征进行转置卷积,得到N个概率矩阵和N个二维偏移向量。
然后,根据概率矩阵和二维偏移向量计算关键点的位置。具体过程为:通过公式(1)计算第i个像素点是第k个关键点的概率fk(xi):
其中,G函数为双线性插值核,为归一化因子。公式(1)实际是一种Hough投票,即子图中的每个像素点j都会为每个关键点k的位置估计进行投票,随着每个像素点j的不断加权,综合影响着关键点k的位置。
最后,从得到的fk(x1)、……fk(xi)、……中取最大值fk(xp),该最大值fk(xp)对应的坐标位置xp即为第k个关键点在子图中的位置信息。
其中,关键点预测模型的训练方法包括:
首先,标注常用字的关键点,将标注好的常用字作为训练模型的样本数据。在字迹关键点预测技术中,不同的字有不同的笔画,对应不同的关键点个数。例如汉字“一”对应一个笔画,可在笔画“横”上标注4个关键点(起始点、中点1、中点2、终止点),而汉字“二”对应两个笔画,可标注8个关键点。如图5所示,示意了为“我”字标注的25个关键点。
然后,根据标注的关键点的数量对样本数据进行分组,得到多个训练集,不同训练集用来训练不同的关键点预测模型。以识别的关键点数量为K的MK模型为例为例,其训练过程如下:
将训练集SK中的样本数据输入“漏斗”型卷积神经网络,得到输出的K个概率矩阵,K个二维偏移向量。
根据样本数据中预先标注的关键点的位置,计算得到各个关键点对应的二维偏移向量lk-xi
通过损失函数计算卷积神经网络输出的二维偏移向量Fk(xi)与根据预先标注的关键点得到的二维偏移向量lk-xi的不一致程度,采用的损失函数为:
L(θ)=λhLh(θ)+λ0L0(θ) (2)
其中,λh,λ0是平衡损失函数项的标量因子,此处可取λh=4,λ0=1。其中,
其中,H是Huber损失函数,k表示第k个关键点。xi为第i个像素点在输入图片中的坐标位置,lk为第k个关键点在输入图中的坐标位置,R为第k个关键点在输入图片中覆盖的半径,半径R覆盖的区域为关键区域,||xi-lk||代表了第i个像素点与第k个关键点之间的距离,例如坐标位置xi为(1,1)和lk为(1,3),则||xi-lk||=2,则第i个像素点与k个关键点之间的距离为2。
随后,采用随机梯度下降(SGD,stochastic gradient descent)的方法来优化神经网络的权重,使得通过损失函数计算得到的损失值最小,最终得到训练好的MK模型。
图6为汉字“我”对应的图片中的各个像素点与标注的关键点(图5中的1号关键点50)的二维偏移向量的示意图。图6中,颜色越深代表该像素点与1号关键点50之间的距离越小。实际标注的第k个关键点周围半径R内的区域为关键区域,实际计算过程中发现,在关键区域内的像素点的hk(xi)值较大,关键区域外的像素点的hk(xi)值接近于0,基于公式(1)可知,关键区域外的像素点对最终结果的影响几乎为0,因此,在训练关键点预测模型时,可以仅使用关键区域内的二维偏移向量进行训练,以便提高训练效率。
图7为关键点50对应的关键区域内的二维偏移向量的示意图。
图8是根据图7中的关键点50对应的概率矩阵和二维偏移向量共同计算得到的关键点50在汉字“我”对应的图片中的位置。
进一步地,步骤S102包括:根据各个文字的关键点在字迹图片中的位置信息,确定各个文字的笔迹特征,根据字迹图片中所有文字的笔迹特征,确定用于表征该客户的书写习惯的第一笔迹特征。
其中,第一笔迹特征用于描述单个字的笔迹特征。第一笔迹特征包括但不限于以下内容:字迹工整度、特殊笔画特征、个性笔画特征。
例如,客户的字迹图片中包含两个文字“李”和“一”,根据“李”的20个关键点的位置信息,得到“李”这个字的笔迹特征,根据“一”的4个关键点的位置信息,得到“一”这个字的笔迹特征,其中,笔迹特征包括字迹工整度、特殊笔画特征、个性笔画特征等多个维度;然后,将“李”和“一”对应的笔迹特征中各个维度的值进行融合,得到描述用户单个文字的笔迹特征的第一笔迹特征,例如,对于各个字的字迹工整度可以进行加权平均处理,对于特殊笔画特征和个性笔画特征可以进行累加处理。
其中,可采用以下方法计算各个文字的字迹工整度:
方法一:将通过关键点预测模型输出的关键点数量与该文字在关键点数据库中标注的关键点数量进行比较,以检查该文字的关键点是否齐全,例如:通过关键点预测模型识别到客户写的“我”字有20个关键点,但在关键点数据库中,“我”字应该有25个关键点,则判定客户写的“我”字的字迹工整度较差,或者,根据关键点缺失的数量对客户写的“我”字进行打分,用打分的分值表示字迹工整度。
需要说明的是,本实施例中,设定了每个关键点预测模型输出的关键点数量,但是,在识别过程中,关键点预测模型不一定能够识别到所有的关键点。例如,通过M25模型识别“我”这个字时,由于客户字迹潦草,导致M25模型仅能够识别出24个关键点,甚至更少。
方法二:预先存储了多个字的正楷字体对应的关键点,作为标准关键点。计算通过关键点预测模型识别到的该字的关键点与该字对应的标准关键点之间的距离,若距离较近,则表示字迹工整,若距离较远,则表示字迹潦草。同样,可以根据模型输出的关键点与标准关键点的距离远近,对这个字进行打分,用打分的分值表示字迹工整度。
方法三:综合上述方法一得到的字迹工整度和方法二得到的字迹工整度,得到最终的字迹工整度。
其中,特殊笔画特征是指预先设定的一些特殊笔画具备的特殊特征。例如,预先设定了“撇”为特殊笔画,且特殊特征为“撇”的长度特征,在识别的文字中确定是否存在该特殊笔画“撇”,若存在特殊笔画“撇”,则基于特殊笔画“撇”对应的关键点的位置信息,计算该特殊笔画的长度,得到长度特征。某些特殊笔画的特征能反映出人的某种特征,例如汉字“我”中的笔画“横”和“斜钩”较长时,表明这个人的自我意识强、欲望重,较为坚定,而“横”和“斜钩”较长短时则相反。
其中,个性笔画特征是指与一般人的书写方式存在较大差异的笔画。确定个性笔画特征的方法包括:根据客户字迹图片中的文字对应的关键点确定该文字的各个笔画,将该客户的各个笔画与数据库中预存的各个笔画的惯常笔迹做比对,若存在较大差异,则该客户存在个性笔画,可设定根据个性笔画的数量确定个性笔画特征的分值。
进一步地,步骤S102包括:根据各个文字的关键点在字迹图片中的位置信息,确定各个文字在字迹图片中的分布信息,根据各个文字在字迹图片中的分布信息,确定用于表征该客户的书写习惯的第二笔迹特征。
其中,第二笔迹特征用于描述多个字之间的位置关系。第二笔迹特征包括但限于以下内容:字间距、整体偏向。字间距是指字与字之间的间距。整体偏向是指所有文字在字迹图片中的整体位置的分布,如所有字都偏左,或所有字都偏上。
其中,根据各个文字的关键点在字迹图片中的位置信息,确定各个文字在字迹图片中的分布信息,可以是:计算各个文字的关键点的位置信息的平均值,得到各个文字的中心点的坐标,即各个文字在字迹图片中的分布信息。通过计算各个文字中心点之间的距离得到字间距,通过计算各个文字中心点在字迹图片中的分布情况得到整体偏向。
进一步地,步骤S102包括:根据各个文字的关键点在字迹图片中的位置信息,确定各个文字的笔迹特征,根据字迹图片中所有文字的笔迹特征,确定用于表征该客户的书写习惯的第一笔迹特征;根据各个文字的关键点在字迹图片中的位置信息,确定各个文字在字迹图片中的分布信息,根据各个文字在字迹图片中的分布信息,确定用于表征该客户的书写习惯的第二笔迹特征;融合第一笔迹特征和第二笔迹特征得到该客户的笔迹特征。
进一步地,步骤S103包括:将笔迹特征与预设的性格预测规则进行比较,以确定该客户的性格特征,根据预设的性格特征与金融行为的对应关系以及该客户的性格特征确定该客户的金融行为预测信息。
心理学研究表明,一个人的笔迹特征可以从一定程度上反映这个人的性格,例如字迹工整的字体代表着为人踏实、风险较低等等,而字迹不工整代表着这个人的风险较高、较为激进。因此,基于心理学研究结果,本实施例的方法预先设置了性格预测规则,性格预测规则包括各种笔迹特征对应的一个或多个性格特征,以及各个笔迹特征与其对应的性格特征的对应关系。
例如,将字迹的字间距与预设的距离阈值进行比较,若字迹的字间距小于预设的阈值,表明这个人安全感较弱、侵犯意识小,标注这个客户的性格特征为保守;若字间距大于预设的距离阈值,表明这个人安全感较强、有一定的侵犯意识,标注这个客户的性格特征为激进。
将客户的特殊笔画特征与预设的特殊笔画规则进行比较,确定该客户的性格特征。例如,预先设定了笔画“斜钩”为特殊笔画,特殊笔画规则为:当“斜钩”较长时表明人的自我意识强、欲望重,对应的性格特征为坚定,当“斜钩”较短时,对应的性格特征为犹豫。
例如,字迹的整体偏向偏左,表明人的思想活跃,但行动能力较弱,对应的性格特征为被动;字迹的整体偏向偏上,人的性格特征为积极主动。
例如,当个性笔画特征的分值超过预设数量时,该客户的性格特征为特例独行。
例如,当字迹工整度高于预设的工整度阈值时,表明该客户比较踏实、风险系数较低,对应的性格特征为谨慎;当字迹工整度利于预设的工整度阈值时,表明该客户风险系数较高、为人较为激进,对应的性格特征为冲动。
以上只是举例说明了几个笔迹特征与性格特征之间的性格预测规则,本实施例的方法不限于上述列举的性格预测规则。
预先为每种金融产品标注上对应的性格特征。实际应用时,根据客户的笔迹特征确定性格特征,基于金融产品上标注的性格特征,预测客户可能会购买的金融产品,将与客户的性格特征匹配的金融产品推荐给客户。
进一步地,步骤S103包括:将笔迹特征输入预先构建的分类器,确定与笔迹特征对应的金融行为预测信息。
其中,预先构建的分类器可选用现有的分类方法实现,如:决策树分类器、选择树分类器、线性分类器等。例如,将笔迹特征向量化后,输入通过基于概率函数构建的分类器,能够得到笔迹特征在各类金融行为上的概率值。基于概率函数构建的性格分类器的训练过程具体包括:为预先采集到的笔迹特征标注可能的金融行为;将笔迹特征向量输入概率函数,例如f(x,W,b)=Wx+b,得到对金融行为的预测值f(x,W,b);通过Hinge Loss(铰链损失)函数计算预测值f(x,W,b)与标注的金融行为的差异度,采用随机梯度下降(SGD,stochastic gradient descent)的方法不断优化概率函数的参数W和b,使得概率函数输出的预测值与标注的金融行为的差异度最小。其中,概率函数f(x,W,b)=Wx+b为描述笔迹特征和金融行为之间映射关系的函数,矩阵W被称为权重(weights),向量b被称为偏差向量(bias vector)。W大小为[K×V]的矩阵,b的大小为[K×1]的向量,K为金融行为的类别数量,V为笔迹特征的数量。
其中,可基于风险率、收益率、投资周期等多个方面的数据对金融产品进行分类,每一个类别对应一种金融行为,每一类别下包括至少一个金融产品。
进一步地,本实施例的方法还包括以下步骤:获取客户的用户画像。
其中,用户画像包括:信用等级、理财偏好、风险承受能力、资产信息、消费习惯、生活习惯等多维度的信息。可通过分析客户的职业、收入、喜好、存款、所在地、社交圈、是否有车、是否有贷款、是否有医疗保障、是否有保险、社保信息、个人征信等信息、历史购买金融产品等信息,获得客户的用户画像,具体可采用现有的数据分析方法实现,在此不再赘述。
相应地,步骤103还包括:根据预设的笔迹特征与金融行为的对应关系、该客户的用户画像以及该客户的笔迹特征,确定该客户的金融行为预测信息。具体可通过预设规则或分类器的方法实现,在此不再赘述。
在获取到客户笔迹特征的基础上增加了用户画像,使得预测的金融行为更加准确,进而有针对性地向客户推送金融产品。
实施例三
本申请实施例提供了一种基于字迹关键点的金融行为预测装置,如图2所示,该基于字迹关键点的金融行为预测装置20可以包括:
关键点提取模块201,用于识别客户的字迹图片中的文字和用于确定文字的结构的关键点,并提取关键点在字迹图片中的位置信息;
笔迹特征提取模块202,用于根据关键点的位置信息确定用于表征书写习惯的笔迹特征;
金融行为预测模块203,用于用于根据预设的笔迹特征与金融行为的对应关系以及笔迹特征确定客户的金融行为预测信息。
本实施例提供的基于字迹关键点的金融行为预测装置,通过关键点识别技术识别客户签字的关键点,通过分析关键点的位置信息得到表征用户书写习惯的笔迹特征,进而根据能够反映客户金融行为的笔迹特征预测客户可能的金融行为,从而向用户推荐合适的金融产品,实现了金融产品的精准推荐,有助于提高交易成交率,同时降低了推销成本。
进一步地,如图3所示,关键点提取模块201包括:
文字识别单元2010,用于识别客户的字迹图片中的文字;
图片分割单元2011,用于将客户的字迹图片分割为仅包含单个文字的子图;
关键点提取单元2012,用于将子图输入关键点预测模型,得到该子图中的文字对应的关键点;
位置映射单元2013,用于根据子图与字迹图片的位置关系,确定关键点在字迹图片中的位置信息。
进一步地,关键点提取模块201还包括模型选择单元2014。
其中,模型选择单元2014用于确定从字迹图片中识别到的各个文字对应的关键点数量,根据各个文字对应的关键点数量确定包含各个文字的子图对应的关键点预测模型。
相应地,关键点提取单元2012用于将子图输入与该子图对应的关键点预测模型,得到该子图中的文字对应的关键点。
进一步地,笔迹特征提取模块202具体用于:根据各个文字的关键点在字迹图片中的位置信息,确定各个文字的笔迹特征,根据字迹图片中所有文字的笔迹特征,确定用于表征客户的书写习惯的第一笔迹特征。
进一步地,笔迹特征提取模块202具体用于:根据各个文字的关键点在字迹图片中的位置信息,确定各个文字在字迹图片中的分布信息,根据各个文字在字迹图片中的分布信息,确定客户的第二笔迹特征。
进一步地,笔迹特征提取模块202具体用于:根据各个文字的关键点在字迹图片中的位置信息,确定各个文字的笔迹特征,根据字迹图片中所有文字的笔迹特征,确定用于表征客户的书写习惯的第一笔迹特征;根据各个文字的关键点在字迹图片中的位置信息,确定各个文字在字迹图片中的分布信息,根据各个文字在字迹图片中的分布信息,确定用于表征客户的书写习惯的第二笔迹特征。
进一步地,金融行为预测模块203具体用于:将客户的笔迹特征与预设的性格预测规则进行比较,以确定客户的性格特征,根据预设的性格特征与金融行为的对应关系以及客户的性格特征确定客户的金融行为预测信息。
进一步地,金融行为预测模块203具体用于:将笔迹特征输入预先构建的分类器,预测与笔迹特征对应的金融行为。
进一步地,本实施例的装置还包括用户画像获取模块,用于获取客户的用户画像。
相应地,金融行为预测模块203具体用于:根据预设的笔迹特征与金融行为的对应关系、用户画像以及笔迹特征,确定客户的金融行为预测信息。
本实施例的基于字迹关键点的金融行为预测装置可执行本申请实施例一至实施例二中任一实施例所示的基于人脸的性格预测方法,其实现原理相类似,此处不再赘述。
实施例四
本申请实施例提供了一种电子设备,如图4所示,图4所示的电子设备40包括:处理器401和存储器403。其中,处理器401和存储器403相连,如通过总线402相连。可选地,电子设备40还可以包括收发器404。需要说明的是,实际应用中收发器404不限于一个,该电子设备40的结构并不构成对本申请实施例的限定。
其中,处理器401应用于本申请实施例中,用于实现图2所示的关键点提取模块201、笔迹特征提取模块202、金融行为预测模块203的功能。收发器404包括接收机和发射机。
处理器401可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器401也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线402可包括一通路,在上述组件之间传送信息。总线402可以是PCI总线或EISA总线等。总线402可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器403可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
可选地,存储器403用于存储执行本申请方案的应用程序代码,并由处理器401来控制执行。处理器401用于执行存储器403中存储的应用程序代码,以实现图2所示实施例提供的基于字迹关键点的金融行为预测装置的动作。
与现有技术相比,本申请实施例提供的电子设备,通过关键点识别技术识别客户签字的关键点,通过分析关键点的位置信息得到表征用户书写习惯的笔迹特征,进而根据能够反映客户金融行为的笔迹特征预测客户可能的金融行为,从而向用户推荐合适的金融产品,实现了金融产品的精准推荐,有助于提高交易成交率,同时降低了推销成本。
可选地,处理器401用于执行存储器403中存储的应用程序代码,以实现图3所示实施例提供的基于字迹关键点的金融行为预测装置的动作,在此不再赘述。
实施例五
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现实施例一所示的方法。
本申请实施例提供了一种计算机可读存储介质,与现有技术相比,通过关键点识别技术识别客户签字的关键点,通过分析关键点的位置信息得到表征用户书写习惯的笔迹特征,进而根据能够反映客户金融行为的笔迹特征预测客户可能的金融行为,从而向用户推荐合适的金融产品,实现了金融产品的精准推荐,有助于提高交易成交率,同时降低了推销成本。
可选地,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现实施例二所示的方法,在此不再赘述。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种基于字迹关键点的金融行为预测方法,其特征在于,包括如下步骤:
识别客户的字迹图片中的文字和用于确定所述文字的结构的关键点,并提取所述关键点在所述字迹图片中的位置信息;
根据所述关键点的位置信息确定用于表征书写习惯的笔迹特征;
根据预设的笔迹特征与金融行为的对应关系以及所述笔迹特征确定所述客户的金融行为预测信息。
2.根据权利要求1所述的方法,其特征在于,所述识别用于确定所述文字的结构的关键点,并提取所述关键点在所述字迹图片中的位置信息,包括:
将客户的字迹图片分割为仅包含单个文字的子图;
将所述子图输入关键点预测模型,得到所述子图中的文字对应的关键点;
根据所述子图与所述字迹图片的位置关系,确定所述子图的关键点在所述字迹图片中的位置信息。
3.根据权利要求2所述的方法,其特征在于,在所述将所述子图输入关键点预测模型,得到所述子图中的文字对应的关键点之前,所述方法还包括:
确定从所述字迹图片中识别到的各个文字对应的关键点数量;
根据各个文字对应的关键点数量确定包含各个文字的子图对应的关键点预测模型;
所述将所述子图输入关键点预测模型,得到所述子图中的文字对应的关键点,包括:
将所述子图输入与所述子图对应的关键点预测模型,得到所述子图中的文字对应的关键点。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据所述关键点的位置信息确定用于表征书写习惯的笔迹特征,包括如下至少一种方法:
根据各个文字的关键点在所述字迹图片中的位置信息,确定各个文字的笔迹特征,根据所述字迹图片中所有文字的笔迹特征,确定用于表征所述客户的书写习惯的第一笔迹特征;
或,
根据各个文字的关键点在所述字迹图片中的位置信息,确定各个文字在所述字迹图片中的分布信息,根据各个文字在所述字迹图片中的分布信息,确定用于表征所述客户的书写习惯的第二笔迹特征。
5.根据权利要求1所述的方法,其特征在于,所述根据预设的笔迹特征与金融行为的对应关系以及所述笔迹特征确定所述客户的金融行为预测信息,包括:
将所述笔迹特征与预设的性格预测规则进行比较,以确定所述客户的性格特征,根据预设的性格特征与金融行为的对应关系以及所述客户的性格特征确定所述客户的金融行为预测信息。
6.根据权利要求1所述的方法,其特征在于,所述根据预设的笔迹特征与金融行为的对应关系以及所述笔迹特征确定所述客户的金融行为预测信息,包括:
将所述笔迹特征输入预先构建的分类器,确定与所述笔迹特征对应的金融行为预测信息。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述客户的用户画像;
所述根据预设的笔迹特征与金融行为的对应关系以及所述笔迹特征确定所述客户的金融行为预测信息,包括:
根据预设的笔迹特征与金融行为的对应关系、所述用户画像以及所述笔迹特征,确定所述客户的金融行为预测信息。
8.一种基于字迹关键点的金融行为预测装置,其特征在于,包括:
关键点提取模块,用于识别客户的字迹图片中的文字和用于确定所述文字的结构的关键点,并提取所述关键点在所述字迹图片中的位置信息;
笔迹特征提取模块,用于根据所述关键点的位置信息确定用于表征书写习惯的笔迹特征;
金融行为预测模块,用于根据预设的笔迹特征与金融行为的对应关系以及所述笔迹特征确定所述客户的金融行为预测信息。
9.一种电子设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于:执行根据权利要求1至7中任一项所述的基于字迹关键点的金融行为预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述权利要求1至7中任一项所述的基于字迹关键点的金融行为预测方法。
CN201811012065.2A 2018-08-31 2018-08-31 基于字迹关键点的金融行为预测方法、装置、电子设备 Pending CN109284693A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811012065.2A CN109284693A (zh) 2018-08-31 2018-08-31 基于字迹关键点的金融行为预测方法、装置、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811012065.2A CN109284693A (zh) 2018-08-31 2018-08-31 基于字迹关键点的金融行为预测方法、装置、电子设备

Publications (1)

Publication Number Publication Date
CN109284693A true CN109284693A (zh) 2019-01-29

Family

ID=65183392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811012065.2A Pending CN109284693A (zh) 2018-08-31 2018-08-31 基于字迹关键点的金融行为预测方法、装置、电子设备

Country Status (1)

Country Link
CN (1) CN109284693A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111605505A (zh) * 2020-02-25 2020-09-01 江苏大学 基于深度学习的主动式气囊拉带装置及其控制方法
CN113128296A (zh) * 2019-12-31 2021-07-16 重庆傲雄在线信息技术有限公司 一种电子手写签字模糊标签化识别系统
CN115063809A (zh) * 2022-06-13 2022-09-16 深圳市星桐科技有限公司 一种文本识别方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106346A (zh) * 2013-02-25 2013-05-15 中山大学 一种基于离线手写图片分割与识别的性格预测系统
CN107436866A (zh) * 2016-05-25 2017-12-05 阿里巴巴集团控股有限公司 理财产品的推荐方法及装置
CN108133013A (zh) * 2017-12-22 2018-06-08 平安养老保险股份有限公司 信息处理方法、装置、计算机设备和存储介质
JP2018114232A (ja) * 2017-01-20 2018-07-26 株式会社リコー 診断装置、プログラム及び診断システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106346A (zh) * 2013-02-25 2013-05-15 中山大学 一种基于离线手写图片分割与识别的性格预测系统
CN107436866A (zh) * 2016-05-25 2017-12-05 阿里巴巴集团控股有限公司 理财产品的推荐方法及装置
JP2018114232A (ja) * 2017-01-20 2018-07-26 株式会社リコー 診断装置、プログラム及び診断システム
CN108133013A (zh) * 2017-12-22 2018-06-08 平安养老保险股份有限公司 信息处理方法、装置、计算机设备和存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128296A (zh) * 2019-12-31 2021-07-16 重庆傲雄在线信息技术有限公司 一种电子手写签字模糊标签化识别系统
CN113128296B (zh) * 2019-12-31 2023-05-09 重庆傲雄在线信息技术有限公司 一种电子手写签字模糊标签化识别系统
CN111605505A (zh) * 2020-02-25 2020-09-01 江苏大学 基于深度学习的主动式气囊拉带装置及其控制方法
CN111605505B (zh) * 2020-02-25 2022-03-22 江苏大学 基于深度学习的主动式气囊拉带装置及其控制方法
CN115063809A (zh) * 2022-06-13 2022-09-16 深圳市星桐科技有限公司 一种文本识别方法、装置、设备及存储介质
CN115063809B (zh) * 2022-06-13 2024-06-28 深圳市星桐科技有限公司 一种文本识别方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Chen et al. Encoding candlesticks as images for pattern classification using convolutional neural networks
Netzer et al. When words sweat: Identifying signals for loan default in the text of loan applications
Vasilev et al. Python Deep Learning: Exploring deep learning techniques and neural network architectures with Pytorch, Keras, and TensorFlow
Gorunescu Data Mining: Concepts, models and techniques
Tiwari Supervised learning: From theory to applications
CN109284693A (zh) 基于字迹关键点的金融行为预测方法、装置、电子设备
Ishaq et al. Extensive hotel reviews classification using long short term memory
CN109154945A (zh) 基于数据属性的新连接推荐
Tsinaslanidis et al. Technical analysis for algorithmic pattern recognition
Awwad et al. Exploring fairness in machine learning for international development
CN114330354A (zh) 一种基于词汇增强的事件抽取方法、装置及存储介质
Klaas Machine learning for finance: principles and practice for financial insiders
Cai et al. MIFAD-net: multi-layer interactive feature fusion network with angular distance loss for face emotion recognition
CN117217807B (zh) 一种基于多模态高维特征的不良资产估值方法
Oyuna et al. Forecasting the crude oil prices volatility with stochastic volatility models
Odonkor et al. Stock returns and long-range dependence
Panda et al. A GARCH modelling of volatility and M-GARCH approach of stock market linkages of North America
CN105335630B (zh) 身份识别方法及身份识别装置
Shrivastav Measuring the determinants for the survival of Indian banks using machine learning approach
CN109635289A (zh) 词条分类方法及审计信息抽取方法
CN112463966B (zh) 虚假评论检测模型训练方法、检测方法及装置
CN112115258B (zh) 一种用户的信用评价方法、装置、服务器及存储介质
CN113052692A (zh) 数据处理的方法、装置、电子设备及计算机可读存储介质
Rajaei Identification of fraud in banking data and financial institutions using classification algorithms
Kamal et al. A Comprehensive Review on Summarizing Financial News Using Deep Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40002606

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20231208

AD01 Patent right deemed abandoned