CN106021927A - 一种基于大数据的皮纹分析处理方法 - Google Patents
一种基于大数据的皮纹分析处理方法 Download PDFInfo
- Publication number
- CN106021927A CN106021927A CN201610342338.4A CN201610342338A CN106021927A CN 106021927 A CN106021927 A CN 106021927A CN 201610342338 A CN201610342338 A CN 201610342338A CN 106021927 A CN106021927 A CN 106021927A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- analysis
- subjects
- fingerprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于大数据的皮纹分析处理方法,包括:采集皮纹信息数据、心理行为数据以及行为特征数据,并根据采集得到的数据进行建模,得到统一分析模型;根据统一分析模型进行数据分析,按照分析结果得到自适应模型;通过所述自适应模型对所述统一分析模型中采集得到的对应数据进行处理;还包括,对所述采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化。本发明能够解决被试群体的样本量较小、被试群体的变化以及处理效率低下的问题。本发明基于计算机软件和互联网技术的大数据方法,可处理千万量级被试者的数据。并通过建立统一分析模型和自适应模型对结果进行分析,并不断迭代进行分析模型优化。
Description
技术领域
本发明涉及计算机领域,特别涉及基于大数据的皮纹分析处理方法。
背景技术
皮纹心理学是指以皮纹学、心理学、脑神经科学、遗传学和行为学为基础的一门综合性学科。它的成果也是辅助心理学研究的一个重要工具。而且在经历了多年的发展和行业应用之后,皮纹心理学已被广泛应用在儿童教育、心理咨询、升学择业、职业规划、人才培养等众多领域。
皮纹心理学的研究方法就是传统心理学研究所应用的统计分类的方法。通常就是以几十名到上百名被试者为样本群体,根据皮纹的特征数据和实验所关注的被试者的心理和行为学特征进行相关性研究,从而给出具有哪些皮纹特征的被试者在某种心理和行为学特征上表现是一致的。而心理和行为学特征的评定则通常是通过主观测试题来实现的。这样,通过逐步的积累就形成了皮纹心理学的核心模型,即包括了皮纹信息和心理、行为学特征的关联关系模型。有了这样的核心模型,就可以指导心理学研究人员或心理咨询师全方位地了解目标被试者的心理和行为特征。
但目前的模型存在如下几方面的缺点:
1.被试群体的样本量太小:在如今纷繁复杂的社会环境中,几十甚至几百的被试者群体所呈现出的规律无法可靠地扩展到更有应用价值和意义的目标群体中。几十万、几百万甚至更高数量级的被试群体所呈现的结果才更有统计学意义。
2.被试群体的变化导致隐含的问题:在目前所发表的各种研究成果中,每一次实验都是以一个时间和空间聚集在一起的小群体作为被试,比如一个学校几个班级的学生,一个养老院的若干老人,一个体育训练队的若干运动员等等。而每一次实验的研究目标又是不同的。所以,如果把所有研究的结果组合成一个系统化的模型,从严格意义上来讲必然是存在一定偏差的。这种偏差的根源就在于每个单独的研究成果是在彼此独立和割裂的时空环境下产生的。
3.研究的效率过于低下。有些传统的研究方法会跟踪一个被试群体几个月甚至若干年的时间来搜集其心理和行为的发展变化的情况。这一漫长的过程中会存在诸多不可预测的环境因素影响实验的进程和结果,比如被试者减少,不同的成长环境带来的噪声因素等。这样就会导致几年的研究投入毫无结果,或者结果可信度不够。
而大数据对于解决心理学领域的问题,有着以下几点特殊意义:
第一,是指被试群体数量非常巨大,一般是以百万量级起步的;
第二,是搜集到的信息量非常巨大,通常要比被试群体的数量多一个量级;
第三,就是各种用于分析的数据的来源是多样的,比如被试者的遗传信息、主观评测数据、社交网络数据、消费行为数据等等。
发明内容
本发明要解决的技术问题是,基于大数据分析、处理,皮纹心理学的方法,能够解决被试群体的样本量较小、被试群体的变化以及处理效率低下的问题。
解决上述技术问题,本发明提供了一种基于大数据的皮纹分析处理方法,包括:
采集皮纹信息数据、心理行为数据以及行为特征数据,并根据采集得到的数据进行建模,得到统一分析模型;
根据统一分析模型进行数据分析,按照分析结果得到自适应模型;
通过所述自适应模型对所述统一分析模型中采集得到的对应数据进行处理;
还包括,对所述采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化。
更进一步,所述皮纹信息数据包括如下步骤:
采集被试者的皮纹信息并通过网络服务器上传至后台服务器;
和/或通过在线和线下测评的方式采集被试者的心理行为数据;
和/或对被试者的互联网访问行为得到行为特征数据。
更进一步,对皮纹信息数据、心理行为数据、行为特征数据以及基础信息数据进行组织和存储;同时将上述数据同步至云端。
更进一步,分析处理方法还包括,将上述采集得到的皮纹信息数据和行为特征数据,按照统一分析模型为框架进行组织并存储在数据库中时,进行数据集成、清洗,并且在统一分析模型中标记上述控制模块中数据的约束条件。
更进一步,分析处理方法还包括,根据统一分析模型中的数据集合作为对象执行多维度数据分析,得到各维度概念的具体分类,以及不同维度之间的关联关系和因果规则。
更进一步,所述处理的方式包括,修正采集过程中的粒度,以及调整采集目标。
更进一步,所述优化的过程包括,调整所述模型中的参数,以及调整模型中的概念、相互关系。
更进一步,所述统一分析模型按照如下方法建立,
通过将所述统一分析模型建立元模型层、集成模型层以及分析模型层,
根据所述元模型层,定义统一分析模型的基本元数据;通过所述集成模型层,根据皮纹信息数据和心理行为数据,按照被试者以时间和空间作为索引,进行被试者的完整肖像数据;将分析模型层,根据所述元模型层中的基本元数据和集成模型层中的完整肖像数据,得到分析模型集合。
更进一步,所述自适应模型按照如下方式进行建立:
根据所述统一分析模型获得被试者多维度数据;
按照多维度数据中的行为特征,进行被试者的分析结论、效度以及相关性的自适应更改;
在上述处理过程中基于不同的目标或者应用场景建立自适应模型。
更进一步,采集皮纹信息的采集装置设置于移动终端或者PC端,以及组织和存放采集数据通过互联网上传至云端或者储存在本地
本发明的有益效果:
1)由于在本发明中的基于大数据的皮纹心理学分析处理方法,包括:采集皮纹信息数据、心理行为数据以及行为特征数据,并根据采集得到的数据进行建模,得到统一分析模型;根据统一分析模型进行数据分析,按照分析结果得到自适应模型;通过所述自适应模型对所述统一分析模型中采集得到的对应数据进行处理;还包括,对所述采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化。通过采用基于计算机软件和互联网技术的大数据方法,可以轻松处理千万量级被试者的数据。
2)由于根据统一分析模型进行数据分析,分析结果得到自适应模型。所以不论是主观评测还是外部数据,都是一个持续性的过程,而且完全不受地域的限制,因此从宏观上看,时间和空间上都可以形成一个常态。这样得出的分析结果就更有意义。
3)由于对所述采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化。采用大数据的方法执行高效,即便是数据量如此庞大,也可以在很短时间内完成一轮分析,所以不会引入噪声因素。而且独特数据积累和迭代优化的能力使得模型能够不断进化。
4)由于所述统一分析模型包括:元模型层、集成模型层以及分析模型层,在收集的数据因为来源复杂、无法对其统一地管理和分析时,需要构建一个统一的数据分析模型,同时随着数据源和数据格式的变动,模型的扩展能力也需要得到保障。
附图说明
图1是本发明一实施例中的基于大数据的皮纹分析处理方法流程示意图。
图2是图1中的皮纹信息数据采集方式示意图。
图3是图1中的数据储存方式示意图。
图4是本发明一优选实施例中的基于大数据的皮纹分析处理方法流程示意图。
图5是本发明一优选实施例中的基于大数据的皮纹分析处理方法流程示意图。
图6是本发明另一优选实施例中的基于大数据的皮纹分析处理方法流程示意图。
图7是本发明另一优选实施例中的基于大数据的皮纹分析处理方法流程示意图。
图8是本发明另一优选实施例中的基于大数据的皮纹分析处理方法流程示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
请参考图1是本发明一实施例中的基于大数据的皮纹分析处理方法流程示意图。
本实施例中的一种基于大数据的皮纹分析处理方法,包括:
S100采集皮纹信息数据、心理行为数据以及行为特征数据,并根据采集得到的数据进行建模,得到统一分析模型;所述采集得到的皮纹信息数据,可通过人的指纹、掌纹和足纹信息,来分析人的性格特征、学习能力、思维方式、智能特点、人格特征等,目标是让人能够更好地了解和认识自己。从心理测量的角度来看,皮纹信息数据具有极高的信度和较高的效度。原因在于,人的皮纹信息是遗传信息,几乎终生不变,尤其是指纹信息,不受时间和环境的影响,多次测量的结果都是一致的,所以信度极高。在经历了多年的发展和行业应用之后,皮纹信息数据已被广泛应用在儿童教育、心理咨询、升学择业、职业规划、人才培养等众多领域。所述心理行为数据的采集,比如通过主观测试的题目,让用户答题并将答题结果自动上传到云端或者后台服务器。所述行为特征数据的采集,通过与被试者相关的互联网使用记录来搜集用户的一些日常行为数据,比如购物数据、投资数据、出行数据、社交行为数据等。实现这种方式首先要参与研究的被试者提供互联网应用的授权,然后再对接相关系统自动化地获取数据。通过心理咨询的方式获取被试者深度的心理状态数据。这些数据也可通过软件系统上传到云端。
在一些实施例中,基于Ouath协议,得到第三方授权和认证后,进行被试者网络访问记录、数据的获取。
在一些实施例中,通过解析URL地址进行被试者访问服务,获取得到访问记录和被试者行为数据。
在一些实施例中,通过网络爬虫,Larbin、Nutch、Heritrix、WebSPHINX、Mercator、PolyBot等,抓取被试者的行为数据。
在一些实施例中,所述采集皮纹信息数据包括但不限于,指纹信息,掌纹信息等,并上传到云端数据库。
在一些实施例中,采集皮纹信息数据是收集信息的第一步,需要特殊的设备搜集皮纹特征数据,优选地,可以采用纹采集仪,掌纹采集仪,摄像头等。比如用户通过手机上的摄像头能够采集得到待测试者的虹膜信息或者人脸信息,并按照人脸信息或者虹膜信息对待测试者进行识别。
在一些实施例中,心理行为数据以及行为特征数据是为了采集和分析目标相关的信息,包括但不限于主观测试数据,互联网使用数据,以及临床心理咨询的档案数据等。
S101根据统一分析模型进行数据分析,按照分析结果得到自适应模型;
S102通过所述自适应模型对所述统一分析模型中采集得到的对应数据进行处理;
在一些实施例中,基于统一分析模式和各种分析工具,可以通过不断处理和分析数据得出一系列有意义的结论。这些结论都是面向某类或某几类研究目标或应用场景的,就构成了自适应模型。比如,自适应模型可以包括但不限于,亲子教育、升学就业、人际沟通、企业用人、血型、职业测评、心理测评及心理咨询、身心灵成长等方面。
在一些实施例中,所述统一分析模型包括:元模型层、集成模型层以及分析模型层,在所述元模型层中,定义统一分析模型的基本元数据;比如,个人信息相关:
{性别}、{生日}、{血型}、{学历}、{专业}、{职业}
再比如,智力相关:
{语言}、{记忆}、{逻辑}、{空间想象能力}
在所述集成模型层中,根据皮纹信息数据和心理行为数据,按照被试者以时间和空间作为索引,进行被试者的完整肖像数据;
在集成模型层中构建分为三个层次,第一个层次就是针对单个被试者的核心数据的组织;第二个层次就是组织单个被试者的后天成长数据;第三个层次就是组织被试者的社会化信息。
在分析模型层中,根据所述元模型层中的基本元数据和集成模型层中的完整肖像数据,得到分析模型集合。在所述分析模型层中会有很多个独立的分析模型,形成分析模型集合。
还包括,S103对所述采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化。在这一过程中,可以启发式地调整所述统一分析模型中的参数,甚至调整模型概念和相互关系,这就是优化模型的过程。这一过程需要反复多次进行,以便得到更有意义的结果。这里的一个重要关键就是结果的可靠性验证。
所述迭代包括:a)考虑整个系统的采集是持续且自动化进行的,所以数据量在不断增大,也就是说被试者的群体在不断扩大;b)将上一轮的分析结果在下一轮可以用更大的数据集合来验证;c)具体分析判断时如果某个结果是有意义的,则在更大数据集中就应该表现出更高的得分,比如更强的统计相关性;通过上述迭代思路就可以将验证和优化过程统一起来了,使得整个评估过程非常高效。
可以看出,本实施例中的通过采用基于计算机软件和互联网技术的大数据方法,可以轻松处理千万量级被试者的数据。由于根据统一分析模型进行数据分析,分析结果得到自适应模型。所以不论是主观评测还是外部数据,都是一个持续性的过程,而且完全不受地域的限制,因此从宏观上看,时间和空间上都可以形成一个常态。这样得出的分析结果就更有意义。由于对所述采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化。采用大数据的方法执行高效,即便是数据量如此庞大,也可以在很短时间内完成一轮分析,所以不会引入噪声因素。而且独特数据积累和迭代优化的能力使得模型能够不断进化。
请参考图2是图1中的皮纹信息数据采集方式示意图。
皮纹信息数据包括如下步骤进行采集:
S200采集被试者的皮纹信息并通过网络服务器上传至后台服务器;
和/或S201通过在线和线下测评的方式采集被试者的心理行为数据;
和/或S202对被试者的互联网访问行为得到行为特征数据。
在一些实施例中,步骤S200通过采集被试者的指纹、掌纹、虹膜信息、脸部信息等,作为皮纹数据采集的依据。
在一些实施例中,步骤S201包括但不限于,通过主观评测和用户咨询过程中回答问题得到的相关数据,以及被试者的自身数据。测试包括但不限于:性格特征测试、学习能力测试、思维方式测试、智能特点测试、人格特测试征等。将测试结果通过选择项或者判断项的方式在本地或者云端进行存放。
在一些实施例中,步骤S201包括但不限于,基于名到上百名被试者为样本群体,根据皮纹的特征数据和实验所关注的被试者的心理和行为学特征进行相关性研究,从而给出具有哪些皮纹特征的被试者在某种心理和行为学特征上表现是一致的。
在一些实施例中,步骤S201包括但不限于,通过主观测试题来实现心理和行为学特征的评定样本,直接采集样本中的数据作为测评和被试档案的数据来源。
在一些实施例中,步骤S202包括互联网访问行为数据,比如用户在社交网络、电商、视频网站等上的行为数据。通过访问URL或者第三方授权的方式进行外部数据收集。
请参考图3是图1中的数据储存方式示意图。
在本实施例中的数据储存方式包括如下步骤:
对皮纹信息数据300、心理行为数据301、行为特征数据302以及基础信息数据303进行组织和存储;同时将上述数据同步至云端304。所述采集得到的皮纹信息数据300,可通过人的指纹、掌纹和足纹信息,来分析人的性格特征、学习能力、思维方式、智能特点、人格特征等,目标是让人能够更好地了解和认识自己。从心理测量的角度来看,皮纹信息数据具有极高的信度和较高的效度。原因在于,人的皮纹信息是遗传信息,几乎终生不变,尤其是指纹信息,不受时间和环境的影响,多次测量的结果都是一致的,所以信度极高。在经历了多年的发展和行业应用之后,皮纹信息数据已被广泛应用在儿童教育、心理咨询、升学择业、职业规划、人才培养等众多领域。所述心理行为数据301的采集,比如通过主观测试的题目,让用户答题并将答题结果自动上传到云端或者后台服务器。所述行为特征数据302的采集,通过与被试者相关的互联网使用记录来搜集用户的一些日常行为数据,比如购物数据、投资数据、出行数据、社交行为数据等。实现这种方式首先要参与研究的被试者提供互联网应用的授权,然后再对接相关系统自动化地获取数据。通过心理咨询的方式获取被试者深度的心理状态数据。这些数据也可通过软件系统上传到云端304。
请参考图4是本发明一优选实施例中的基于大数据的皮纹分析处理方法流程示意图。
在本实施例中的基于大数据的皮纹分析处理方法,包括:
S100采集皮纹信息数据、心理行为数据以及行为特征数据,并根据采集得到的数据进行建模,得到统一分析模型;
S101根据统一分析模型进行数据分析,按照分析结果得到自适应模型;
S102通过所述自适应模型对所述统一分析模型中采集得到的对应数据进行处理;
S103对所述采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化;
S401将上述采集得到的皮纹信息数据和行为特征数据,
S402按照统一分析模型为框架进行组织并存储在数据库中时,进行数据集成、清洗,并且在统一分析模型中标记上述控制模块中数据的约束条件。对于可辨识的噪声数据进行清洗(去除、修正和补充)。
在一些实施例中,统一分析模型中的模型会标记数据必要性约束和逻辑一致性约束,以保证数据的可分析性。如果违反逻辑一致性并且是必要的,就需要修正数据;如果违法逻辑一致性但不是必要的,那么可以酌情去除数据;如果是必要的,但数据缺失,那么就需要补充数据。
在一些实施例中,照统一分析模型进行数据集成的方法包括,条形码数据、二维码数据、RFID数据、传感器数据、非结构化数据等。
在一些实施例中,将所述S100中得到的数据,通过S101构建的模型为框架进行组织并存储在数据库中。关键在于数据的清洗的工作,以便后续的分析过程能够更加顺畅,结果更加准确。清洗数据主要是去除不必要的数据,修正有错误的数据和补充必要的数据。在所述统一分析模型层中建立的模型会标记数据必要性约束和逻辑一致性约束,以保证数据的可分析性。如果违反逻辑一致性并且是必要的,就需要修正数据;如果违法逻辑一致性但不是必要的,那么可以酌情去除数据;如果是必要的,但数据缺失,那么就需要补充数据。
在一些实施例中,所述去除包括但不限于数据去重、数据去除、数据删除等。所述修正包括但不限于基于误差的数据修正,数据平均值修正等。所述补充包括但不限于对数据的增加、对数据的完善。
请参考图5是本发明一优选实施例中的基于大数据的皮纹分析处理方法流程示意图。
在本实施例中的基于大数据的皮纹分析处理方法包括如下的步骤:
S100采集皮纹信息数据、心理行为数据以及行为特征数据,并根据采集得到的数据进行建模,得到统一分析模型;
S101根据统一分析模型进行数据分析,按照分析结果得到自适应模型;
S102通过所述自适应模型对所述统一分析模型中采集得到的对应数据进行处理;
S103对所述采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化;
S501根据统一分析模型中的数据集合作为对象执行多维度数据分析;
S502得到各维度概念的具体分类,以及不同维度之间的关联关系和因果规则。
在步骤S502中的所述维度就是统一分析模型中的元模型层的多定义的不同层面。比如,一个被试者的皮纹信息就是一个维度,他的先天智能特征又是一个维度,他的性格特点也是一个维度等。多维分析就是要找出这些不同维度之间内在的因果或关联关系。比如,具有哪一种纹型特征的人群会在某一种或某几种先天智能方面独具优势,从而如何影响甚至塑造性格特征的。通过分析上述关系的技术手段包括但不限于:多元统计、时间序列分析、聚类挖掘、机器学习等。比如,针对一个被试者的皮纹信息就是一个维度,他的先天智能特征又是一个维度,他的性格特点也是一个维度的一个分析目标,通常可以采用多元统计的方法,以纹型特征作为自变量,智能特征作为因变量进行简单的相关性分析;或者也可以以纹型和智能特征分别作为自变量,以性格特征作为因变量进行复合的相关性分析。
在一些实施例中,如果相关性的分析不能得出有意义的结论,则再使用聚类挖掘的方法对先天智能或人格特征进行更加精细的分类。
请参考图6是本发明另一优选实施例中的基于大数据的皮纹分析处理方法流程示意图。
在本实施例中的基于大数据的皮纹分析处理方法流程包括:
S100采集皮纹信息数据、心理行为数据以及行为特征数据,并根据采集得到的数据进行建模,得到统一分析模型;
S101根据统一分析模型进行数据分析,按照分析结果得到自适应模型;
S102通过所述自适应模型对所述统一分析模型中采集得到的对应数据进行处理;
S103对所述采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化;
S601修正采集过程中的粒度,以及调整采集目标。
在步骤S102中的由于在实际研究的过程中发现,一些采集到的数据并没有和研究目标产生很强的相关性,甚至是不相关的,因此就需在步骤S601中对部分的采集内容和方法进行优化,主要包括修正采集粒度和调整采集目标。
请参考图7是本发明另一优选实施例中的基于大数据的皮纹分析处理方法流程示意图。
S100采集皮纹信息数据、心理行为数据以及行为特征数据,并根据采集得到的数据进行建模,得到统一分析模型;
S101根据统一分析模型进行数据分析,按照分析结果得到自适应模型;
S102通过所述自适应模型对所述统一分析模型中采集得到的对应数据进行处理;
S103对所述采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化;
S701调整所述模型中的参数,以及调整模型中的概念、相互关系。步骤S701包括对统一分析模型以及自适应模型的优化,评估的方式包括但不限于:迭代分析,优化模型。在这一过程中,可以启发式地调整所述统一分析模型中的参数,甚至调整模型概念和相互关系,这就是优化模型的过程。这一过程需要反复多次进行,以便得到更有意义的结果。这里的一个重要关键就是结果的可靠性验证。
所述迭代包括:a)考虑整个系统的采集是持续且自动化进行的,所以数据量在不断增大,也就是说被试者的群体在不断扩大;b)将上一轮的分析结果在下一轮可以用更大的数据集合来验证;c)具体分析判断时如果某个结果是有意义的,则在更大数据集中就应该表现出更高的得分,比如更强的统计相关性;通过上述迭代思路就可以将验证和优化过程统一起来了,使得整个评估过程非常高效。
请参考图8是本发明另一优选实施例中的基于大数据的皮纹分析处理方法流程示意。
在本实施例中的基于大数据的皮纹分析处理方法包括如下的步骤:
S100采集皮纹信息数据、心理行为数据以及行为特征数据,并根据采集得到的数据进行建模,得到统一分析模型;
S101根据统一分析模型进行数据分析,按照分析结果得到自适应模型;
S102通过所述自适应模型对所述统一分析模型中采集得到的对应数据进行处理;进入S701调整所述模型中的参数,以及调整模型中的概念、相互关系
S103对所述采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化;在步骤S601修正采集过程中的粒度,以及调整采集目标。
在本实施例中,所述统一分析模型包括:元模型层、集成模型层以及分析模型层,
在所述元模型层中,定义统一分析模型的基本元数据;在所述元模型层中定义了用户描述整个数据模型概念的基本元素。比如对于一个被试个体来说,若需要描述他的皮纹信息,就需要手指、指纹纹型、脊线数量、手掌ADT角度等;又比如,若需要描述他的个人基本信息,就需要姓名、性别、生日、血型、学历、专业、职业等信息;再比如,若需要评估他智能特征和水平,就需要语言、记忆、逻辑、空间想象能力等信息;再比如,若需要描述他的性格特点,就需要内向、外向,直觉、感觉,理性、感性等信息。
在所述集成模型层中,根据皮纹信息数据和心理行为数据,按照被试者以时间和空间作为索引,进行被试者的完整肖像数据;基于元模型层建立的概念体系,就可以在集成模型层建立以被试者为核心的集成模型层。
比如第一个层次就是针对单个被试者的核心数据的组织,其中核心数据主要包括元模型层中所定义的个人基本信息、皮纹信息,以及通过皮纹信息推导出的先天智能、人格特征、学习类型和风格等信息。核心数据表示了单个被试者先天所拥有的属性,不会随着时间的变化而变化。
比如第二个层次就是组织单个被试者的后天成长数据。
比如第三个层次就是组织被试者的社会化信息。
在分析模型层中,根据所述元模型层中的基本元数据和集成模型层中的完整肖像数据,得到分析模型集合。在分析模型层中,一个分析模型是为了一个或一系列研究或分析目标专门设计的,所以在分析模型层中会有很多个独立的分析模型,形成分析模型集合。
在上述步骤中相对机械化,但关键是要做一些数据清洗的工作,以便后续的分析过程能够更加顺畅,结果更加准确。清洗数据主要是去除不必要的数据,修正有错误的数据和补充必要的数据。
在一些实施例中,统一分析模型中的模型会标记数据必要性约束和逻辑一致性约束,以保证数据的可分析性。如果违反逻辑一致性并且是必要的,就需要修正数据;如果违法逻辑一致性但不是必要的,那么可以酌情去除数据;如果是必要的,但数据缺失,那么就需要补充数据。
作为本实施例中的优选,在统一分析模型数据中的所述统一分析模型包括:元模型层、集成模型层以及分析模型层,
在所述元模型层中,定义统一分析模型的基本元数据。具体地,元模型层定义了用户描述整个数据模型概念的基本元素。比如针对一个被试个体来说,如果需要描述他的皮纹信息,就需要手指、指纹纹型、脊线数量、手掌ADT角度等;如果需要描述他的个人基本信息,就需要姓名、性别、生日、血型、学历、专业、职业等信息;如果需要评估他智能特征和水平,就需要语言、记忆、逻辑、空间想象能力等信息;如果需要描述他的性格特点,就需要内向、外向,直觉、感觉,理性、感性等信息。
在一些实施例中,可以通过将上述的概念在所述元模型层进行定义。
另外,还包括其它信息,比如被试个体在成长过程中所经历的事件,就需要时间、地点、环境、事件类别等数据来表达,上述概念同样需要在元模型层中定义清楚。
在本实施例中,对于每一个概念的定义都要包括如何对相应的信息进行量化,以便分析系统的执行。
具体地,比如,脊线数量和ADT的测量和数据存储方法,某一种性格特征倾向和打分等。在所述元模型层有了这些准确的概念定义,就可以无二义地表达下述的集成层的模型。
在所述集成模型层中,根据皮纹信息数据和心理行为数据,按照被试者以时间和空间作为索引,进行被试者的完整肖像数据;基于上述元模型层建立的概念体系,就可以在集成模型层建立以被试者为核心的模型系统。所述的模型系统的构建分为三个层次:
第一个层次就是针对单个被试者的核心数据的组织,核心数据主要包括元模型层中所定义的个人基本信息、皮纹信息,以及通过皮纹信息推导出的先天智能、人格特征、学习类型和风格等信息。核心数据表示了单个被试者先天所拥有的属性,不会随着时间的变化而变化。
第二个层次就是组织单个被试者的后天成长数据。后天成长数据可以通过被试者所经历的时间、空间和关键事件来描述。比如一个30岁的成年人从出生到当下在时间维度上肯定是经历了发展心理学所定义的若干阶段(不同的学说定义的阶段往往不同,只要采用一套有意义的权威的理论即可,比如埃里克森的毕生发展的8个阶段,这在元模型层会有完整的定义);在空间维度上可能会经历若干次生活环境的变迁,比如,从出生的家乡到求学的城市再到工作的城市(对成长环境这种空间信息的描述也可以通过元模型所定义的概念来实现);最后是一些影响被试者身心成长的事件也需要组织起来,比如父母离异或一些较严重的疾病史等等。后天成长数据的来源主要就是主观测评和通过用户咨询所积累的被试者档案数据。
第三个层次就是组织被试者的社会化信息。这里主要包括被试者的社会行为和社会关系数据。社会行为如在网络上的消费和娱乐行为,以及日常生活中的工作、运动、旅游等行为。社会行为会被具体化为一系列的标签关联到被试者身上,比如剁手党、驴友、工作狂等等。社会关系就是被试者的家人、朋友、同事等建立起的社会关系网络。
在一些实施例中,所述自适应模型按照如下方式进行建立:
根据所述统一分析模型获得被试者多维度数据;
按照多维度数据中的行为特征,进行被试者的分析结论、效度以及相关性的自适应更改;
在上述处理过程中基于不同的目标或者应用场景建立自适应模型。
基于统一分析模式和各种分析工具,可以通过不断处理和分析数据得出一系列有意义的结论。该些结论都是面向某类或某几类研究目标或应用场景的,就构成了自适应模型。比如,在面向儿童教育的应用场景中,具有某几种皮纹类型的处于学前期的儿童,在没有遭遇过家庭变故或疾病困扰的前提下,具有某些特殊的行为特征:好动,喜欢冒险等。而这一过程的自适应特征则体现在,随着处理数据的不断增加,有些结论会被增强,也就是相关性得分提高,效度提高;有些则可能会被减弱,相关性得分降低,效度降低等。当结论的效度降低到某一个阈值(典型的如50%)之后就需要调整参数、结构或彻底将其剔除。这样不仅可以去除不准确因素,也可以为新的结论留出更多的空间。因此,自适应模型就可以在这样的自适应过程中不断提高质量。
更进一步,所述模型评估模块102还用以对采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化;
优化过程包括,调整上述模型中的参数,以及调整上述模型概念、相互关系。所述优化过程包括了自适应模型的建立流程,根据所述统一分析模型获得被试者多维度数据;按照多维度数据中的行为特征,进行被试者的分析结论、效度以及相关性的自适应更改;在上述处理过程中基于不同的目标或者应用场景建立自适应模型。
更进一步,所述控制模块中用以采集皮纹信息的采集装置设置于移动终端或者PC端,这样可以方便对被试者的信息进行采集,被试者只要通过手机就能够实现皮纹信息的收集。所述数据库模块中用以组织和存放采集数据通过互联网上传至云端或者储存在本地,基于采集得到的大数据,进行面向云端的储放方式。
进入S501根据统一分析模型中的数据集合作为对象执行多维度数据分析;
S502得到各维度概念的具体分类,以及不同维度之间的关联关系和因果规则。所述维度就是统一分析模型中的元模型层的多定义的不同层面。比如,一个被试者的皮纹信息就是一个维度,他的先天智能特征又是一个维度,他的性格特点也是一个维度等。多维分析就是要找出这些不同维度之间内在的因果或关联关系。比如,具有哪一种纹型特征的人群会在某一种或某几种先天智能方面独具优势,从而如何影响甚至塑造性格特征的。通过分析上述关系的技术手段包括但不限于:多元统计、时间序列分析、聚类挖掘、机器学习等。比如,针对一个被试者的皮纹信息就是一个维度,他的先天智能特征又是一个维度,他的性格特点也是一个维度的一个分析目标,通常可以采用多元统计的方法,以纹型特征作为自变量,智能特征作为因变量进行简单的相关性分析;或者也可以以纹型和智能特征分别作为自变量,以性格特征作为因变量进行复合的相关性分析。
或者进入S401将上述采集得到的皮纹信息数据和行为特征数据,
S402按照统一分析模型为框架进行组织并存储在数据库中时,进行数据集成、清洗,并且在统一分析模型中标记上述控制模块中数据的约束条件。对于可辨识的噪声数据进行清洗(去除、修正和补充)。
经过采集过程的优化,就有必要重新对数据进行分析,以便得出更加准确和有意义的结果。在这一过程中,可能会启发式地调整模型参数,甚至调整模型概念和相互关系,这就是优化模型的过程。这一过程需要反复多次进行,以便得到更有意义的结果。这里的一个重要关键就是结果的可靠性验证。因为整个系统的采集是持续且自动化进行的,所以数据量在不断增大,也就是说被试者的群体在不断扩大。上一轮的分析结果在下一轮可以用更大的数据集合来验证。如果某个结果是有意义的,那么它在更大数据集中就应该表现出更高的得分,比如更强的统计相关性。这样,通过迭代就可以将验证和优化过程统一起来了,非常高效。
所属领域的普通技术人员应当理解:以上,所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于大数据的皮纹分析处理方法,其特征在于,包括:
采集皮纹信息数据、心理行为数据以及行为特征数据,并根据采集得到的数据进行建模,得到统一分析模型;
根据统一分析模型进行数据分析,按照分析结果得到自适应模型;
通过所述自适应模型对所述统一分析模型中采集得到的对应数据进行处理;
还包括,对所述采集数据进行迭代分析,对所述统一分析模型和自适应模型进行优化。
2.根据权利要求1所述的基于大数据的皮纹分析处理方法,其特征在于,所述皮纹信息数据包括如下步骤:
采集被试者的皮纹信息并通过网络服务器上传至后台服务器;
和/或通过在线和线下测评的方式采集被试者的心理行为数据;
和/或对被试者的互联网访问行为得到行为特征数据。
3.根据权利要求1所述的基于大数据的皮纹分析处理方法,其特征在于,对皮纹信息数据、心理行为数据、行为特征数据以及基础信息数据进行组织和存储;同时将上述数据同步至云端。
4.根据权利要求1所述的基于大数据的皮纹分析处理方法,其特征在于,还包括,将上述采集得到的皮纹信息数据和行为特征数据,按照统一分析模型为框架进行组织并存储在数据库中时,进行数据集成、清洗,并且在统一分析模型中标记上述控制模块中数据的约束条件。
5.根据权利要求1所述的基于大数据的皮纹分析处理方法,其特征在于,还包括,根据统一分析模型中的数据集合作为对象执行多维度数据分析,得到各维度概念的具体分类,以及不同维度之间的关联关系和因果规则。
6.根据权利要求1所述的基于大数据的皮纹分析处理方法,其特征在于,所述处理的方式包括,修正采集过程中的粒度,以及调整采集目标。
7.根据权利要求1所述的基于大数据的皮纹分析处理方法,其特征在于,所述优化的过程包括,调整所述模型中的参数,以及调整模型中的概念、相互关系。
8.根据权利要求1所述的基于大数据的皮纹分析处理方法,其特征在于,所述统一分析模型按照如下方法建立,
通过将所述统一分析模型建立元模型层、集成模型层以及分析模型层,
根据所述元模型层,定义统一分析模型的基本元数据;通过所述集成模型层,根据皮纹信息数据和心理行为数据,按照被试者以时间和空间作为索引,进行被试者的完整肖像数据;将分析模型层,根据所述元模型层中的基本元数据和集成模型层中的完整肖像数据,得到分析模型集合。
9.根据权利要求1所述的基于大数据的皮纹分析处理方法,其特征在于,
根据所述统一分析模型获得被试者多维度数据;
按照多维度数据中的行为特征,进行被试者的分析结论、效度以及相关性的自适应更改;
在上述处理过程中基于不同的目标或者应用场景建立自适应模型。
10.根据权利要求1所述的基于大数据的皮纹分析处理方法,其特征在于,
采集皮纹信息的采集装置设置于移动终端或者PC端,
以及组织和存放采集数据通过互联网上传至云端或者储存在本地。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610342338.4A CN106021927A (zh) | 2016-05-21 | 2016-05-21 | 一种基于大数据的皮纹分析处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610342338.4A CN106021927A (zh) | 2016-05-21 | 2016-05-21 | 一种基于大数据的皮纹分析处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106021927A true CN106021927A (zh) | 2016-10-12 |
Family
ID=57095565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610342338.4A Pending CN106021927A (zh) | 2016-05-21 | 2016-05-21 | 一种基于大数据的皮纹分析处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106021927A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975792A (zh) * | 2016-05-21 | 2016-09-28 | 北京大脑智库教育科技有限公司 | 一种基于大数据的皮纹分析处理装置、方法 |
CN115150439A (zh) * | 2022-09-02 | 2022-10-04 | 北京电科智芯科技有限公司 | 感知数据的解析方法、系统及存储介质、电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101576940A (zh) * | 2009-06-16 | 2009-11-11 | 蔡昂融 | 一种基于指纹信息的优势评测系统 |
CN103778555A (zh) * | 2014-01-21 | 2014-05-07 | 北京集奥聚合科技有限公司 | 基于用户标签的用户属性挖掘方法和系统 |
CN103902566A (zh) * | 2012-12-26 | 2014-07-02 | 中国科学院心理研究所 | 一种基于微博用户行为的人格预测方法 |
CN104715129A (zh) * | 2013-12-13 | 2015-06-17 | 中国科学院心理研究所 | 基于移动设备使用行为的心理健康状态评估系统和方法 |
-
2016
- 2016-05-21 CN CN201610342338.4A patent/CN106021927A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101576940A (zh) * | 2009-06-16 | 2009-11-11 | 蔡昂融 | 一种基于指纹信息的优势评测系统 |
CN103902566A (zh) * | 2012-12-26 | 2014-07-02 | 中国科学院心理研究所 | 一种基于微博用户行为的人格预测方法 |
CN104715129A (zh) * | 2013-12-13 | 2015-06-17 | 中国科学院心理研究所 | 基于移动设备使用行为的心理健康状态评估系统和方法 |
CN103778555A (zh) * | 2014-01-21 | 2014-05-07 | 北京集奥聚合科技有限公司 | 基于用户标签的用户属性挖掘方法和系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975792A (zh) * | 2016-05-21 | 2016-09-28 | 北京大脑智库教育科技有限公司 | 一种基于大数据的皮纹分析处理装置、方法 |
CN115150439A (zh) * | 2022-09-02 | 2022-10-04 | 北京电科智芯科技有限公司 | 感知数据的解析方法、系统及存储介质、电子设备 |
CN115150439B (zh) * | 2022-09-02 | 2023-01-24 | 北京电科智芯科技有限公司 | 感知数据的解析方法、系统及存储介质、电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107967572A (zh) | 一种基于教育大数据的智能服务器 | |
CN108109089A (zh) | 一种教育可计算方法 | |
CN112256755A (zh) | 一种基于深度学习的学生异常行为分析方法 | |
CN108132989A (zh) | 一种基于教育大数据的分布式系统 | |
Zhu et al. | Creating Persona Skeletons from Imbalanced Datasets-A Case Study using US Older Adults' Health Data | |
CN106055875A (zh) | 一种基于大数据的皮纹分析处理装置 | |
CN112185558A (zh) | 基于深度学习的心理健康及康复评定方法、装置及介质 | |
CN109409709A (zh) | 智能职称评定系统 | |
Rastogi | Fundamentals Of Biostatistics 2Nd Ed | |
CN106021927A (zh) | 一种基于大数据的皮纹分析处理方法 | |
CN117524471A (zh) | 基于行为特征的健康管理方法 | |
CN105975792A (zh) | 一种基于大数据的皮纹分析处理装置、方法 | |
Inyang et al. | Visual association analytics approach to predictive modelling of students’ academic performance | |
Preetha | Data Analysis on Student's Performance based on Health status using Genetic Algorithm and Clustering algorithms | |
Graco et al. | Toward knowledge-driven data mining | |
Heckbert | Experimental economics and agent-based models | |
Fryback | Decision maker, quantify thyself! | |
Mohanty et al. | Basic Statistics 2nd Edition | |
Kavya et al. | Student Personality Analysis In Blended Mode Using Big Five | |
Alves et al. | Interactive protocol for acquisition of migraine diaries with a mobile app and machine learning data analysis | |
Jianyun | Big data assisted online teaching platform for ideological and political theory course in universities | |
CN110634541A (zh) | 一种口腔健康数据采集及分析方法 | |
CN109345104A (zh) | 一种用户能力提升方法、系统及存储介质 | |
CN110037653A (zh) | 用于便携式智能可穿戴设备的睡眠质量评估方法与装置 | |
CN116798633B (zh) | 创伤数据安全风险评估系统构建方法和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161012 |
|
RJ01 | Rejection of invention patent application after publication |