CN112750518A - 一种基于心理行为特征识别的谈话(询问)方法 - Google Patents
一种基于心理行为特征识别的谈话(询问)方法 Download PDFInfo
- Publication number
- CN112750518A CN112750518A CN201911039294.8A CN201911039294A CN112750518A CN 112750518 A CN112750518 A CN 112750518A CN 201911039294 A CN201911039294 A CN 201911039294A CN 112750518 A CN112750518 A CN 112750518A
- Authority
- CN
- China
- Prior art keywords
- recognition
- conversation
- voice
- inquiry
- emotion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000001360 synchronised effect Effects 0.000 claims abstract description 22
- 230000008909 emotion recognition Effects 0.000 claims description 55
- 230000006399 behavior Effects 0.000 claims description 35
- 230000004424 eye movement Effects 0.000 claims description 22
- 230000008921 facial expression Effects 0.000 claims description 22
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000000926 separation method Methods 0.000 claims description 4
- 230000008451 emotion Effects 0.000 abstract description 42
- 238000007726 management method Methods 0.000 abstract description 9
- 238000013500 data storage Methods 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000002996 emotional effect Effects 0.000 description 41
- 230000006870 function Effects 0.000 description 23
- 230000004927 fusion Effects 0.000 description 9
- 210000004556 brain Anatomy 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000007717 exclusion Effects 0.000 description 3
- 210000003128 head Anatomy 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000007639 printing Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/70—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mental therapies, e.g. psychological therapy or autogenous training
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/16—Devices for psychotechnics; Testing reaction times ; Devices for evaluating the psychological state
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/18—Eye characteristics, e.g. of the iris
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
- G10L15/25—Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/63—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/04—Synchronising
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Child & Adolescent Psychology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Psychiatry (AREA)
- Hospice & Palliative Care (AREA)
- Psychology (AREA)
- Social Psychology (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Developmental Disabilities (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Engineering & Computer Science (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Educational Technology (AREA)
- Ophthalmology & Optometry (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
Abstract
一种基于心理行为特征识别的谈话(询问)方法:主要包括语音采集设备、视频采集设备、谈话(询问)终端主机、打印机、显示设备等其他附件。谈话(询问)终端主机包括语音识别模块、情绪特征识别模块、心理行为识别模块、同步录音录像模块、系统管理模块。本发明的目的是解决目前谈话(询问)中,为不可记录的心理行为状态,以及文本数据和音视频数据保存和备份提供一种智能化的技术,为执法、医疗、教育、心理咨询等行业提供了一个智能的谈话(询问)方法。
Description
技术领域
本发明涉及情绪分析技术领域,更为具体地,涉及一种基于心理行为特征识别的询问方法。
背景技术
伴随科学技术飞速的发展和人们逐渐对计算机越来越依赖,人类与计算机之间的“沟通”变得更加受科学家们的关注。目前在执法、医疗、教育、心理咨询等行业的谈话(询问),通过面对面的语音相互交流,采用人工笔记的记录来实现谈话(询问)内容的备案保存和管理,并且不能对谈话(询问)过程的文本和音视频实现同步保存和备份管理;同时对谈话(询问) 的心理行为特征的判断主要是供过人眼的直觉感受判断,以及人的听觉器官对语义的获取再通过大脑的理解,来综合判断对方在谈话(询问)之中的心理行为反应。目前,人们的谈话 (询问)方式的缺点是谈话(询问)内容需要人工笔记记录,笔记记录时间比谈话(询问) 速度慢,影响谈话(询问)的效果,同时现有的谈话(询问)模式,判断谈话(询问)对方的心理行为特征是个人凭大脑的直觉感受来判断,可能存在每个人的大脑直觉判断有所出入,同时在大脑直觉判断上对不同程度的心理行为特征的判断没有一个明确的数据指标。因此,目前谈话(询问)应用场景中没有提出有效的有关心理行为的评价解决方案。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于心理行为特征识别的谈话(询问) 方法应用于谈话(询问)场景,以加强谈话(询问)双方的多途径多方式的心理行为特征的识别。本发明的目的是解决目前谈话(询问)中,为不可记录的心理行为状态提供一种可视化智能化的人工评价技术,为执法、医疗、教育、心理咨询等行业提出了一个智能的谈话(询问)解决方案。
本发明目的是通过以下技术方案来实现:
一种基于心理行为特征识别的谈话(询问)方法:主要包括语音采集设备、视频采集设备、询问终端主机、打印机、显示设备等其他附件。
视频采集设备主要是结合语音采集设备同步实现对实时音视频的信息采集。
询问终端主机主要包括语音识别模块、情绪特征识别模块、心理行为识别模块、同步录音录像模块、系统管理模块等功能。语音识别模块主要功能把谈话内容转换成文本信息,替代人工记录谈话内容。情绪特征识别模块主要包括有语音情感识别功能、人脸面部表情识别功能、文本情感识别、眼动轨迹情感识别、姿态情感识别等功能的一种或者任意多模态的组合;其中姿态情感识别包括头部姿态、形体姿态、手势姿态、步行姿态等其中的一种或者多种。语音情感识别模块主要作用通过语音采集设备采集的语音信息,通过情绪识别模块的语音情感识别功能识别采集的语音情感特征;视频采集设备采集的视频信息通过情绪识别的人脸面部表情识别功能识别人脸面部表情情感特征;文本情感识别功能对语音采集设备采集的语音信息,通过语音识别转换成文本信息后,通过文本情感特征数据库的特征情感识别;眼动轨迹情感识别对视频采集设备采集的眼动轨迹进行情感特征的识别;姿态情感识别根据视频采集的姿态行文信息根据姿态情感数据库进行姿态情感特征识别;情感识别模块根据同步的语音情感特征、面部表情特征、文本情感特征、眼动轨迹情感特征、姿态情感特征的相同情感特征的映射特征融合,通过多核函数和权重的计算,得到语音情感特征、人脸面部表情情感特征、文本情感特征、眼动轨迹情感特征、姿态情感特征等多维度情感特征融合的谈话 (询问)情感状态。心理行为数据库是心理专家根据视频信息的声音压力、语音文本内容、面部表情情感特征、眼动轨迹情感特征、姿态情感特征等多维度实时信息的经验集成判断,建立的心理行为特征的数据库,心理专家也可以结合相关的语音情感识别工具、面部表情识别工具以及语音文本情感识别工具、眼动轨迹情感识别工具、姿态情感识别工具的综合运用,实现对多维度情感特征的专家判断后,结合心理行为数据库的应用,完成多维度谈话(询问) 心理行为数据的标注;例如标注可以是紧张、害怕、犹豫、期待、撒谎、分心、冲突、排斥等,心理行为数据库的主要功能是根据采集识别的多维度情感融合特征识别谈话(询问)心理行为特征。同步录音录像模块,采集谈话(询问)中的视频及音频数据实现同步的数据保存和备份,并与语音识别模块识别的文本数据一起实现对谈话(询问)过程中同步音视频和文本数据的保存和备份。系统管理模块,对数据来源模块经过系统处理后生成的结果进行查看、统计和日志管理,以及数据的输出。
打印设备:对数据结果的接收后打印输出便于纸质文件的保存。
显示设备:主要用于对采集、分析及管理的数据进行显示。
进一步的,包括:
语音采集设备可以是拾音器、麦克风、电话或者其他录音设备;麦克风包括一种矩阵式麦克风,通过内置角色分离算法,把相互谈话人员的声音独立隔离出2路或多路独立的音频,传输给询问终端主机。
本发明的有益效果是:
(1)本发明通过语音识别功能和同步录音录像模块同步记录谈话(询问)的音视频和文本数据,以便保存和备份当次谈话的文本和音视频数据。
(2)本发明通过情感识别模块对谈话(询问)对象实时的情感特征进行识别,通过心理行为特征数据库对识别的情感特征进行心理行为特征识别,以记录谈话(询问)对象在某段谈话(询问)时间内的心理行为特征和对应的心理行为特征值;例如在紧张、害怕、犹豫、期待、撒谎、分心、冲突、排斥等评价指标中的数值来记录与评价其心理行为的活动。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的装置结构框图。
图2为本发明的心理行为特征识别流程图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。本说明书中公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
下面将详细描述本发明的具体实施例,应当注意,这里描述的实施例只用于举例说明,并不用于限制本发明。在以下描述中,为了提供对本发明的透彻理解,阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实例中,为了避免混淆本发明,未具体描述公知的电路,软件或方法。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在对实施例进行描述之前,需要对一些必要的术语进行解释。例如:
若本申请中出现使用“第一”、“第二”等术语来描述各种元件,但是这些元件不应当由这些术语所限制。这些术语仅用来区分一个元件和另一个元件。因此,下文所讨论的“第一”元件也可以被称为“第二”元件而不偏离本发明的教导。应当理解的是,若提及一元件“连接”或者“联接”到另一元件时,其可以直接地连接或直接地联接到另一元件或者也可以存在中间元件。相反地,当提及一元件“直接地连接”或“直接地联接”到另一元件时,则不存在中间元件。
在本申请中出现的各种术语仅仅用于描述具体的实施方式的目的而无意作为对本发明的限定,除非上下文另外清楚地指出,否则单数形式意图也包括复数形式。
当在本说明书中使用术语“包括”和/或“包括有”时,这些术语指明了所述特征、整体、步骤、操作、元件和/或部件的存在,但是也不排除一个以上其他特征、整体、步骤、操作、元件、部件和/或其群组的存在和/或附加。
如图1~2所示:
一种基于心理行为特征识别的谈话(询问)方法:主要包括语音采集设备、视频采集设备、询问终端主机、打印机、显示设备等其他附件。
视频采集设备主要是结合语音采集设备同步实现对实时视频的信息采集。
询问终端主机主要包括语音识别模块、情绪特征识别模块、心理行为识别模块、同步录音录像模块、系统管理模块等功能。语音识别模块主要功能把谈话内容转换成文本信息,替代人工记录谈话内容。情绪特征识别模块主要包括有语音情感识别功能、人脸面部表情识别功能、文本情感识别、眼动轨迹情感识别、姿态情感识别等功能的一种或者任意多模态的组合;其中姿态情感识别包括头部姿态、形体姿态、手势姿态、步行姿态等其中的一种或者多种。语音情感识别模块主要作用通过语音采集设备采集的语音信息,通过情绪识别模块的语音情感识别功能识别采集的语音情感特征;视频采集设备采集的视频信息通过情绪识别的人脸面部表情识别功能识别人脸面部表情情感特征;文本情感识别功能对语音采集设备采集的语音信息,通过语音识别转换成文本信息后,通过文本情感特征数据库的特征情感识别;眼动轨迹情感识别对视频采集设备采集的眼动轨迹进行情感特征的识别;姿态情感识别根据视频采集的姿态行文信息根据姿态情感数据库进行姿态情感特征识别;情感识别模块根据同步的语音情感特征、面部表情特征、文本情感特征、眼动轨迹情感特征、姿态情感特征的相同情感特征的映射特征融合,通过多核函数和权重的计算,得到语音情感特征、人脸面部表情情感特征、文本情感特征、眼动轨迹情感特征、姿态情感特征等多维度情感特征融合的谈话 (询问)情感状态。心理行为数据库是心理专家根据视频信息的声音压力、语音文本内容、面部表情情感特征、眼动轨迹情感特征、姿态情感特征等多维度实时信息的经验集成判断,建立的心理行为特征的数据库,心理专家也可以结合相关的语音情感识别工具、面部表情识别工具以及语音文本情感识别工具、眼动轨迹情感识别工具、姿态情感识别工具的综合运用,实现对多维度情感特征的专家判断后,结合心理行为数据库的应用,完成多维度谈话(询问) 心理行为数据的标注;例如标注可以是紧张、害怕、犹豫、期待、撒谎、分心、冲突、排斥等,心理行为数据库的主要功能是根据采集识别的多维度情感融合特征识别谈话(询问)心理行为特征。同步录音录像模块,采集谈话(询问)中的视频及音频数据实现同步的数据保存和备份,并与语音识别模块识别的文本数据一起实现对谈话(询问)过程中同步音视频和文本数据的保存和备份。系统管理模块,对数据来源模块经过系统处理后生成的结果进行查看、统计和日志管理,以及数据的输出。
打印设备:对数据结果的接收后打印输出便于纸质文件的保存。
显示设备:主要用于对采集、分析及管理的数据进行显示。
进一步的,包括:
语音采集设备可以是拾音器、麦克风、电话或者其他录音设备;麦克风包括一种矩阵式麦克风,通过内置角色分离算法,把相互谈话人员的声音独立隔离出2路或多路独立的音频,传输给询问终端主机。
实施例1
如图1~2所示,一种基于心理行为特征识别的询问装置,包括:
语音采集设备、视频采集设备、询问终端主机、打印机、显示设备等其他附件。
视频采集设备主要是结合语音采集设备同步实现对实时视频的信息采集。
询问终端主机主要包括语音识别模块、情绪特征识别模块、心理行为识别模块、同步录音录像模块、系统管理模块等功能。语音识别模块主要功能把谈话内容转换成文本信息,替代人工记录谈话内容。情绪特征识别模块主要包括有语音情感识别功能、人脸面部表情识别功能、文本情感识别、眼动轨迹情感识别、姿态情感识别等功能的一种或者任意多模态的组合;其中姿态情感识别包括头部姿态、形体姿态、手势姿态、步行姿态等其中的一种或者多种。语音情感识别模块主要作用通过语音采集设备采集的语音信息,通过情绪识别模块的语音情感识别功能识别采集的语音情感特征;视频采集设备采集的视频信息通过情绪识别的人脸面部表情识别功能识别人脸面部表情情感特征;文本情感识别功能对语音采集设备采集的语音信息,通过语音识别转换成文本信息后,通过文本情感特征数据库的特征情感识别;眼动轨迹情感识别对视频采集设备采集的眼动轨迹进行情感特征的识别;姿态情感识别根据视频采集的姿态行文信息根据姿态情感数据库进行姿态情感特征识别;情感识别模块根据同步的语音情感特征、面部表情特征、文本情感特征、眼动轨迹情感特征、姿态情感特征的相同情感特征的映射特征融合,通过多核函数和权重的计算,得到语音情感特征、人脸面部表情情感特征、文本情感特征、眼动轨迹情感特征、姿态情感特征等多维度情感特征融合的谈话 (询问)情感状态。心理行为数据库是心理专家根据视频信息的声音压力、语音文本内容、面部表情情感特征、眼动轨迹情感特征、姿态情感特征等多维度实时信息的经验集成判断,建立的心理行为特征的数据库,心理专家也可以结合相关的语音情感识别工具、面部表情识别工具以及语音文本情感识别工具、眼动轨迹情感识别工具、姿态情感识别工具的综合运用,实现对多维度情感特征的专家判断后,结合心理行为数据库的应用,完成多维度谈话(询问) 心理行为数据的标注;例如标注可以是紧张、害怕、犹豫、期待、撒谎、分心、冲突、排斥等,心理行为数据库的主要功能是根据采集识别的多维度情感融合特征识别谈话(询问)心理行为特征。同步录音录像模块,采集谈话(询问)中的视频及音频数据实现同步的数据保存和备份,并与语音识别模块识别的文本数据一起实现对谈话(询问)过程中同步音视频和文本数据的保存和备份。系统管理模块,对数据来源模块经过系统处理后生成的结果进行查看、统计和日志管理,以及数据的输出。
打印设备:对数据结果的接收后打印输出便于纸质文件的保存。
显示设备:主要用于对采集、分析及管理的数据进行显示。
进一步的,包括:
语音采集设备可以是拾音器、麦克风、电话或者其他录音设备;麦克风包括一种矩阵式麦克风,通过内置角色分离算法,把相互谈话人员的声音独立隔离出2路或多路独立的音频,传输给询问终端主机。
在本实施例中的其余技术特征,本领域技术人员均可以根据实际情况进行灵活选用和以满足不同的具体实际需求。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实现本发明。
对于前述的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和单元并不一定是本申请所必须的。
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法实现所描述的功能,但是这种实现不应超出本发明的范围。所揭露的系统、模块和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例,仅仅是示意性的,例如,所述单元的划分,可以仅仅是一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接以说通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述分立部件说明的单元可以是或者也可以不收物理上分开的,作为单元显示的部件可以是或者可以不收物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例的方案的目的。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、 ROM、RAM等。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (8)
1.一种基于心理行为特征识别的谈话(询问)方法,其特征在于,包括语音采集设备、视频采集设备、询问终端主机、打印机、显示设备等其他附件。
2.根据权利要求1所述的一种基于心理行为特征识别的谈话(询问)方法,其特征在于,语音采集设备可以是拾音器、麦克风、电话、录音笔等。
3.根据权利要求1所述的一种基于心理行为特征识别的谈话(询问)方法,其特征在于,询问终端主机包括语音识别模块、情绪特征识别模块、心理行为识别模块、同步录音录像模块、系统管理模块等功能。
4.根据权利要求2所述的一种基于心理行为特征识别的谈话(询问)方法,其特征在于,麦克风包括一种矩阵式麦克风,通过内置角色分离算法,可以把相互谈话人员的声音独立隔离出2路或多路独立的音频,传输给谈话(询问)终端主机。
5.根据权利要求3所述的一种基于心理行为特征识别的谈话(询问)方法,其特征在于,情绪特征识别模块主要包括有语音情感识别功能、人脸面部表情识别功能、文本情感识别、眼动轨迹情感识别、姿态情感识别等功能的一种或者任意多模态的组合。
6.根据权利要求3所述的一种基于心理行为特征识别的谈话(询问)方法,其特征在于,姿态情感识别包括头部姿态、形体姿态、手势姿态、步行姿态等其中的一种或者多种。
7.根据权利要求3所述的一种基于心理行为特征识别的谈话(询问)方法,其特征在于,语音识别模块和同步录音录像模块对谈话(询问)时间内的谈话(询问)的文本数据和实时同步音频视数据实现同步数据的保存和备份。
8.根据权利要求6所述的一种基于心理行为特征识别的谈话(询问)方法,其特征在于心理行为特征可以是紧张、害怕、犹豫、期待、撒谎、分心、冲突、排斥等。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911039294.8A CN112750518A (zh) | 2019-10-31 | 2019-10-31 | 一种基于心理行为特征识别的谈话(询问)方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911039294.8A CN112750518A (zh) | 2019-10-31 | 2019-10-31 | 一种基于心理行为特征识别的谈话(询问)方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112750518A true CN112750518A (zh) | 2021-05-04 |
Family
ID=75640154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911039294.8A Pending CN112750518A (zh) | 2019-10-31 | 2019-10-31 | 一种基于心理行为特征识别的谈话(询问)方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112750518A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113554334A (zh) * | 2021-08-02 | 2021-10-26 | 上海明略人工智能(集团)有限公司 | 用于评价用户录音行为的方法及系统、装置、服务器、存储介质 |
CN115299947A (zh) * | 2022-09-06 | 2022-11-08 | 济南大学 | 基于多模态生理数据的心理量表置信度评估方法及系统 |
-
2019
- 2019-10-31 CN CN201911039294.8A patent/CN112750518A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113554334A (zh) * | 2021-08-02 | 2021-10-26 | 上海明略人工智能(集团)有限公司 | 用于评价用户录音行为的方法及系统、装置、服务器、存储介质 |
CN115299947A (zh) * | 2022-09-06 | 2022-11-08 | 济南大学 | 基于多模态生理数据的心理量表置信度评估方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Avots et al. | Audiovisual emotion recognition in wild | |
US10614526B2 (en) | Video-voice preparation of electronic tax return summary | |
Schmid Mast et al. | Social sensing for psychology: Automated interpersonal behavior assessment | |
US9760766B2 (en) | System and method for interpreting interpersonal communication | |
CN103530912A (zh) | 一种具有情绪识别功能的考勤系统及方法 | |
US9380257B2 (en) | Portable electronic equipment and method of recording media using a portable electronic equipment | |
CN112016367A (zh) | 一种情绪识别系统、方法及电子设备 | |
US20210271864A1 (en) | Applying multi-channel communication metrics and semantic analysis to human interaction data extraction | |
CN112750518A (zh) | 一种基于心理行为特征识别的谈话(询问)方法 | |
CN108537508A (zh) | 会议记录方法及系统 | |
US20230011923A1 (en) | System for providing a virtual focus group facility | |
US20190008466A1 (en) | Life log utilization system, life log utilization method, and recording medium | |
CN107910006A (zh) | 语音识别方法、装置和多信源语音区分识别系统 | |
CN116543445B (zh) | 一种演讲者面部表情分析方法、系统、设备及存储介质 | |
CN112786045B (zh) | 用于会议记录的设备、服务器、方法及系统 | |
US11163822B2 (en) | Emotional experience metadata on recorded images | |
CN111583932A (zh) | 一种基于人声模型的声音分离方法和装置以及设备 | |
JP4649944B2 (ja) | 動画像処理装置、動画像処理方法およびプログラム | |
CN111312260A (zh) | 一种人声分离方法和装置以及设备 | |
CN111583953A (zh) | 一种基于声纹特征的人声分离方法和装置以及设备 | |
JP3936295B2 (ja) | データベース作成装置 | |
CN117289804B (zh) | 虚拟数字人面部表情管理方法、装置、电子设备及介质 | |
WO2022180862A1 (ja) | ビデオセッション評価端末、ビデオセッション評価システム及びビデオセッション評価プログラム | |
WO2022180859A1 (ja) | ビデオセッション評価端末、ビデオセッション評価システム及びビデオセッション評価プログラム | |
WO2022180852A1 (ja) | ビデオセッション評価端末、ビデオセッション評価システム及びビデオセッション評価プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210504 |
|
WD01 | Invention patent application deemed withdrawn after publication |