CN110222331B - 谎言识别方法及装置、存储介质、计算机设备 - Google Patents

谎言识别方法及装置、存储介质、计算机设备 Download PDF

Info

Publication number
CN110222331B
CN110222331B CN201910346425.0A CN201910346425A CN110222331B CN 110222331 B CN110222331 B CN 110222331B CN 201910346425 A CN201910346425 A CN 201910346425A CN 110222331 B CN110222331 B CN 110222331B
Authority
CN
China
Prior art keywords
lie
file
sentence
text file
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910346425.0A
Other languages
English (en)
Other versions
CN110222331A (zh
Inventor
朱文和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910346425.0A priority Critical patent/CN110222331B/zh
Publication of CN110222331A publication Critical patent/CN110222331A/zh
Application granted granted Critical
Publication of CN110222331B publication Critical patent/CN110222331B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种谎言识别方法及装置、存储介质、计算机设备,该方法包括:获取样本音频文件以及与样本音频文件对应的标签;将样本音频文件转换为文本文件;对文本文件进行句子分割处理,得到与文本文件对应的句子文本文件;根据句子文本文件,构建句子文本文件对应的特征矩阵;根据特征矩阵以及特征矩阵对应的标签,训练谎言识别模型,其中,特征矩阵对应的标签为与特征矩阵相应的句子文本文件所在的样本音频文件对应的标签;根据训练后的谎言识别模型,对待识别音频文件进行识别,得出与待识别音频文件对应的识别结果。本申请利用句子特征矩阵进行模型训练,能够结合说话内容中的语序表达、语言组织特点实现谎言识别。

Description

谎言识别方法及装置、存储介质、计算机设备
技术领域
本申请涉及谎言识别技术领域,尤其是涉及到一种谎言识别方法及装置、存储介质、计算机设备。
背景技术
一直以来,如何识别一个人是否在说谎,在日常的生活生产中都是一个重要的问题。例如通过配备质检人员对服务人员与客户之间的通话内容进行监控识别,通过客户是否说谎以确定客户是否正在进行欺诈行为,以起到反欺诈目的。
目前谎言识别领域中,对基于说话内容的谎言识别的研究尚在探索阶段,通常是通过这种人工质检的方式识别客户是否在进行欺诈作为,处理过程效率低,且需配备专业的质检人员,人工成本高。
发明内容
有鉴于此,本申请提供了一种谎言识别方法及装置、存储介质、计算机设备,能够依据说话者的说话内容,判断说话者是否说谎。
根据本申请的一个方面,提供了一种获取样本音频文件以及与所述样本音频文件对应的标签;
将所述样本音频文件转换为文本文件;
对所述文本文件进行句子分割处理,得到与所述文本文件对应的句子文本文件;
根据所述句子文本文件,构建所述句子文本文件对应的特征矩阵;
根据所述特征矩阵以及所述特征矩阵对应的标签,训练谎言识别模型,其中,所述特征矩阵对应的标签为与所述特征矩阵相应的所述句子文本文件所在的所述样本音频文件对应的所述标签;
根据训练后的所述谎言识别模型,对待识别音频文件进行识别,得出与所述待识别音频文件对应的识别结果。
根据本申请的另一方面,提供了一种样本获取模块,用于获取样本音频文件以及与所述样本音频文件对应的标签;
文件转换模块,用于将所述样本音频文件转换为文本文件;
句子分割模块,用于对所述文本文件进行句子分割处理,得到与所述文本文件对应的句子文本文件;
矩阵构建模块,用于根据所述句子文本文件,构建所述句子文本文件对应的特征矩阵;
训练模块,用于根据所述特征矩阵以及所述特征矩阵对应的标签,训练谎言识别模型,其中,所述特征矩阵对应的标签为与所述特征矩阵相应的所述句子文本文件所在的所述样本音频文件对应的所述标签;
识别模块,用于根据训练后的所述谎言识别模型,对待识别音频文件进行识别,得出与所述待识别音频文件对应的识别结果。
依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述谎言识别方法。
依据本申请再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述谎言识别方法。
借由上述技术方案,本申请提供的一种谎言识别方法及装置、存储介质、计算机设备,首先对样本音、视频文件进行文本文件转换,并对文本文件进行句子分割,从而构建每个句子的特征矩阵作为模型训练样本,然后利用得到的特征矩阵训练谎言识别模型,最后通过谎言识别模型对待识别的音频文件进行识别,判断待识别音频文件中的说话内容是否为谎言。本申请通过利用样本音频文件,构建句子特征矩阵,从而根据句子特征矩阵训练谎言识别模型实现谎言识别,相比于现有技术中的人工检验方式,本申请利用句子特征矩阵进行模型训练,能够结合说话内容中的语序表达、语言组织特点实现谎言识别,识别效果更好,识别精度更高。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种谎言识别方法的流程示意图;
图2示出了本申请实施例提供的另一种谎言识别方法的流程示意图;
图3示出了本申请实施例提供的一种谎言识别装置的结构示意图;
图4示出了本申请实施例提供的另一种谎言识别装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本实施例中提供了一种谎言识别方法,如图1所示,该方法包括:
步骤101,获取样本音频文件以及与样本音频文件对应的标签。
本申请实施例通过谎言识别模型进行谎言识别,模型需要通过谎言样本进行训练,因此,为了建立训练样本,首先获取样本音频文件,及其对应的标签,标签具体可以包括谎言标签和非谎言标签,另外,除了音频文件外,样本文件还可以是视频文件。
步骤102,将样本音频文件转换为文本文件。
人在说谎时,说话内容、面部表情、肢体语言以及声音情绪等方面与说真话时都会有所区别,本申请实施例针对说话内容进行谎言的识别。获取到样本音频文件(或样本视频文件)后,将其转换为文本文件,以供后续利用样本文件中的说话内容以及对应的标签信息进行谎言模型的训练。
步骤103,对文本文件进行句子分割处理,得到与文本文件对应的句子文本文件。
在本实施例中,按照文本文件中的标点信息,对文本文件进行句子分割处理,实现对文本文件的拆分,使得一份文本文件变为若干个句子文本文件,需要说明的是,每个句子文本文件对应的标签可以与其对应的文本文件的标签一致。另外,每个句子文本文件的标签也可以是专业人员参考样本音频文件的标签,对每个句子文本文件进行重新标注得到的。
步骤104,根据句子文本文件,构建句子文本文件对应的特征矩阵。
利用将文本文件拆分后得到的句子文本文件,分别对每个句子文本文件构建相应的特征矩阵,特征矩阵用以表达该句子的特征。
步骤105,根据特征矩阵以及特征矩阵对应的标签,训练谎言识别模型,其中,特征矩阵对应的标签为与特征矩阵相应的句子文本文件所在的谎言样本音频文件对应的标签。
将句子文本文件的特征矩阵以及相应的标签信息作为训练样本,训练谎言识别模型,从而利用训练后的谎言识别模型实现谎言识别。
步骤106,根据训练后的谎言识别模型,对待识别音频文件进行识别,得出与待识别音频文件对应的识别结果。
针对待识别音频文件(或视频文件),可以按照上述的步骤102至步骤104中利用样本音频文件构建特征矩阵的方法,将待识别音频文件进行文本转换以及进一步的进行句子分割和句子特征矩阵,然后将句子特征矩阵分别输入至训练后的谎言识别模型中,根据待识别音频文件对应的每个句子的句子特征矩阵的识别结果,分析待识别音频文件是否为谎言。
通过应用本实施例的技术方案,首先对样本音、视频文件进行文本文件转换,并对文本文件进行句子分割,从而构建每个句子的特征矩阵作为模型训练样本,然后利用得到的特征矩阵训练谎言识别模型,最后通过谎言识别模型对待识别的音频文件进行识别,判断待识别音频文件中的说话内容是否为谎言。本申请通过利用样本音频文件,构建句子特征矩阵,从而根据句子特征矩阵训练谎言识别模型实现谎言识别,相比于现有技术中,对说话内容中出现的词语进行分析判断说话内容是否为谎言,本申请利用句子特征矩阵进行模型训练,能够结合说话内容中的语序表达、语言组织特点实现谎言识别,识别效果更好。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,提供了另一种谎言识别方法,如图2所示,该方法包括:
步骤201,获取样本音频文件以及与样本音频文件对应的标签。
步骤202,解析样本音频文件,得到按照时间顺序排列的非空音频和空白音频。
人在说谎时除了会表现出与正常说话时不一样的语序表达习惯、语言组织特征外,在组织说谎语言时也会表现出与正常表达不一样的语言停顿特征。因此,本申请实施例对样本音频文件进行解析,依照时间顺序得到若干个非空音频和空白音频,其中,非空音频为说话者说话时的音频,空白音频为说话者停顿时的音频。本申请实施例添加了停顿时间这个特征,有助于构建更准确的训练样本,而训练样本的好坏对最终提高训练效果有重要影响。
步骤203,检测每一段空白音频的持续时长,并根据持续时长确定与每一段空白音频对应的空白标记。
利用样本视频、音频文件转换文本文件时,除了将说话者的说话内容进行转换外,还需对说话者在说话过程中的停顿时间进行检测即检测每一段空白音频的持续时长,当说话过程中存在停顿时间超过预设值的情况时,根据停顿时间的具体时长确定与其对应的空白标记,其中,这个空白标记可以根据停顿时间的长短来确定,例如停顿时间在0.5S-1S时对应为第一空白标记,1S-1.5S时对应为第二空白标记。
步骤204,将每一段非空音频转换成对应的文本,并按照时间顺序将每一段非空音频对应的文本和每一段空白音频对应的空白标记进行排列,得到样本音频文件对应的文本文件。
按照非空音频和空白音频出现的时间顺序,将上述依据停顿时间转换为的空白标记插入到对应的文本信息中,生成样本音频文件对应的文本文件,文本文件不仅包括了说话内容还包括了说话者说话的停顿特征。
步骤205,对文本文件进行句子分割处理,得到与文本文件对应的句子文本文件。
按照文本文件中的标点信息,例如句号,对文本文件进行句子分割,将每一份完整的文本文件拆分成一个或多个句子文本文件。
步骤206,根据句子文本文件,提取句子文本文件对应的特征词以及空白标记。
对于每个句子文本文件,依次从中提取出句子文本中出现的特征词和空白标记,以供后续构建句子对应的特征矩阵。
步骤207,根据与特征词对应的特征词向量以及与空白标记对应的空白标记向量,构建句子文本文件的特征矩阵。
步骤2071,计算特征词以及空白标记的总数量。
为了对每个句子文本文件对应的特征矩阵进行规范化,在建立特征矩阵之前,需要统计每个句子文本中出现的特征词和空白标记的总数量,从而进行补充和截取,以使每个句子文本对应的特征向量的维度一致,方便进行训练。
步骤2072,若总数量大于或等于预设数量,则按照预设数量和特征词以及空白标记在句子文本文件中的先后顺序,截取句子文本文件对应的特征词以及空白标记,并根据截取后的特征词对应的特征词向量以及空白标记对应的空白标记向量,构建句子文本文件的特征矩阵。
步骤2073,若总数量小于预设数量,则计算预设数量与总数量之差得到缺失数量,并根据与特征词对应的特征词向量、与空白标记对应的空白标记向量以及缺失数量的预设向量维度的0向量,构建句子文本文件的特征矩阵。
由于每个句子的长短是不一致的,需要将每个句子的特征矩阵的维度进行统一才能进行后续的模型训练。具体地,如果句子文本的单词较少,则使用0向量补齐至预设维度;如果句子文本的单词较多,则进行尾部截断,截取预设维度的特征向量。例如预设维度为100×300,那么如果一句话只包含60个单词,需要将0元素对矩阵中后40行的元素进行补齐,如果一句话包含110个单词,需要去掉后10个单词,只保留前100个单词对应的特征矩阵。
需要说明的是,本申请实施例中通过词嵌入工具GloVe进行特征矩阵的构建。按照GloVe工具中存储的单词对应的向量,构建特征矩阵,另外,在构建句子文本的特征词向量时,空白标记不会被切词切掉,不同的空白标记也对应有不同的特征向量,有其对应的与任何单词、标点符号都不同的300维的向量,使得最终提取的每个句子文本的特征矩阵即包含单词和标点的特征,也包含停顿时间的特征。
步骤208,根据特征矩阵以及特征矩阵对应的标签,训练谎言识别模型,其中,特征矩阵对应的标签为与特征矩阵相应的句子文本文件所在的谎言样本音频文件对应的标签。
在本申请实施例中,谎言识别模型选用支持向量机模型,具体地,标签具体包括谎言标签和非谎言标签,谎言识别模型的构造方法包括:将特征矩阵映射变换为高维空间中的特征向量;在高维空间中确定一个使得谎言标签对应的特征矩阵和非谎言标签对应的特征矩阵的几何间隔达到最大的最优超平面;几何间隔最大时的约束条件为:,其中,/>表示任一特征矩阵i对应的标签,若标签为谎言标签,则/>=1,若标签为非谎言标签,则/>=-1,/>,N表示特征矩阵的数量,/>为系数矩阵,/>为特征矩阵,/>为截距矩阵,/>表示非负松弛变量;谎言识别模型的目标函数为:,其中,C>0为自定义惩罚因子。
按照上述的构造支持向量机模型的方法建立谎言识别模型后,利用步骤207中得到的训练样本对谎言识别模型进行训练得出最优超平面的系数矩阵和截距矩阵,从而可以利用训练后的谎言识别模型。
步骤209,将待识别音频文件转换为对应的待识别文本文件;
步骤210,按照待识别文本文件中的标点信息,对待识别文本文件进行句子分割处理,得到对应的待识别句子文本文件;
步骤211,根据待识别句子文本文件,构建待识别句子文本文件对应的待识别特征矩阵。
在本申请实施例中,具体地,步骤209至步骤211中为了利用训练后的谎言识别模型对待识别音频文件进行识别,需要将待识别音频文件按照步骤201至步骤207中根据样本音频文件建立相应的特征矩阵的方式,构建与待识别音频文件对应的特征矩阵。
步骤212,分别将每个待识别特征矩阵输入至训练后的谎言识别模型中,得出与每个待识别句子文本文件对应的识别结果。
将每个待识别句子文本文件对应的特征矩阵分别输入至训练后的谎言识别模型中,从而得到每个待识别句子的识别结果,也就是说,对于一段待识别的音频文件,将其拆解为多个句子后,分别识别每个句子是否存在说谎行为。
步骤213,统计待识别句子文本文件的总数量以及识别结果为谎言的待识别句子文本文件的数量,计算识别结果为谎言的待识别句子文本文件占全部的待识别句子文本文件的比例。
分别统计待识别句子文本文件的总数量以及谎言识别模型判断为说谎的句子文本文件的数量,从而计算说谎的句子文本文件数量占整个待识别句子文本文件的总数量的比例,例如一段音频文件拆解为20个句子文件,其中有16句被判断为说谎,那么这个比例就为16/20=80%。
步骤214,若比例超过预设谎言阈值,则待识别音频文件存在谎言,否则,待识别音频文件不存在谎言。
为了增强本申请实施例谎言识别的鲁棒性,减少因识别模型不够精确导致的误判,本申请实施例引入预设谎言阈值,只有说谎文本文件超过这个预设谎言阈值时,待识别音频文件才被认为存在谎言,否则认为待识别音频文件为非谎言文件。例如预设谎言阈值为50%,则当说谎文本文件占比为80%时,认为待识别音频文件为说谎文件。
通过应用本实施例的技术方案,充分考虑了人在说谎时的语言表达特征,例如语序表达、停顿时长等,对样本音频文件进行文本转换、停顿时长标记、句子分割、句子特征构建,从而利用句子特征矩阵训练谎言识别模型,最终实现利用训练后的谎言识别模型对待识别音频文件的谎言识别,本申请实施例以说话内容中的每个句子为最小单位,充分挖掘包括语序表达、词语顺序、停顿时长等句子特征,实现了对说话内容的谎言识别,有助于提升谎言识别准确率。
进一步的,作为图1方法的具体实现,本申请实施例提供了一种谎言识别装置,如图3所示,该装置包括:样本获取模块31、文件转换模块32、句子分割模块33、矩阵构建模块34、训练模块35、识别模块36。
样本获取模块31,用于获取样本音频文件以及与样本音频文件对应的标签;
文件转换模块32,用于将样本音频文件转换为文本文件;
句子分割模块33,用于对文本文件进行句子分割处理,得到与文本文件对应的句子文本文件;
矩阵构建模块34,用于根据句子文本文件,构建句子文本文件对应的特征矩阵;
训练模块35,用于根据特征矩阵以及特征矩阵对应的标签,训练谎言识别模型,其中,特征矩阵对应的标签为与特征矩阵相应的句子文本文件所在的样本音频文件对应的标签;
识别模块36,用于根据训练后的谎言识别模型,对待识别音频文件进行识别,得出与待识别音频文件对应的识别结果。
在具体的应用场景中,如图4所示,文件转换模块32,具体包括:解析单元321、检测单元322、文本排列单元323。
解析单元321,用于解析样本音频文件,得到按照时间顺序排列的非空音频和空白音频;
检测单元322,用于检测每一段空白音频的持续时长,并根据持续时长确定与每一段空白音频对应的空白标记;
文本排列单元323,用于将每一段非空音频转换成对应的文本,并按照时间顺序将每一段非空音频对应的文本和每一段空白音频对应的空白标记进行排列,得到样本音频文件对应的文本文件。
矩阵构建模块34,具体包括:提取单元341、矩阵构建单元342。
提取单元341,用于根据句子文本文件,提取句子文本文件对应的特征词以及空白标记;
矩阵构建单元342,用于根据与特征词对应的特征词向量以及与空白标记对应的空白标记向量,构建句子文本文件的特征矩阵,其中,特征词向量与空白标记向量为预设向量维度。
矩阵构建单元342,具体用于计算特征词以及空白标记的总数量;
若总数量大于或等于预设数量,则按照预设数量和特征词以及空白标记在句子文本文件中的先后顺序,截取句子文本文件对应的特征词以及空白标记,并根据截取后的特征词对应的特征词向量以及空白标记对应的空白标记向量,构建句子文本文件的特征矩阵;
若总数量小于预设数量,则计算预设数量与总数量之差得到缺失数量,并根据与特征词对应的特征词向量、与空白标记对应的空白标记向量以及缺失数量的预设向量维度的0向量,构建句子文本文件的特征矩阵。
在具体的应用场景中,如图4所示,识别模块36,具体包括:文本转换单元361、句子分割单元362、特征矩阵构建单元363、识别单元364、计算单元365、判断单元366。
文本转换单元361,用于将待识别音频文件转换为对应的待识别文本文件;
句子分割单元362,用于按照待识别文本文件中的标点信息,对待识别文本文件进行句子分割处理,得到对应的待识别句子文本文件;
特征矩阵构建单元363,用于根据待识别句子文本文件,构建待识别句子文本文件对应的待识别特征矩阵;
识别单元364,用于分别将每个待识别特征矩阵输入至训练后的谎言识别模型中,得出与每个待识别句子文本文件对应的识别结果;
计算单元365,用于统计待识别句子文本文件的总数量以及识别结果为谎言的待识别句子文本文件的数量,计算识别结果为谎言的待识别句子文本文件占全部的待识别句子文本文件的比例;
判断单元366,用于若比例超过预设谎言阈值,则待识别音频文件存在谎言,否则,待识别音频文件不存在谎言。
在本申请实施例中,具体地,标签具体包括谎言标签和非谎言标签,谎言识别模型的构造方法包括:
将特征矩阵映射变换为高维空间中的特征向量;
在高维空间中确定一个使得谎言标签对应的特征矩阵和非谎言标签对应的特征矩阵的几何间隔达到最大的最优超平面;
几何间隔最大时的约束条件为:
其中,表示任一特征矩阵i对应的标签,若标签为谎言标签,则/>=1,若标签为非谎言标签,则/>=-1,/>,N表示特征矩阵的数量,/>为系数矩阵,/>为特征矩阵,为截距矩阵,/>表示非负松弛变量;
谎言识别模型的目标函数为:
其中,C>0为自定义惩罚因子。
需要说明的是,本申请实施例提供的一种谎言识别装置所涉及各功能单元的其他相应描述,可以参考图1和图2中的对应描述,在此不再赘述。
基于上述如图1和图2所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1和图2所示的谎言识别方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1、图2所示的方法,以及图3、图4所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该计算机设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1和图2所示的谎言识别方法。
可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该计算机设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理和保存计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现首先对样本音、视频文件进行文本文件转换,并对文本文件进行句子分割,从而构建每个句子的特征矩阵作为模型训练样本,然后利用得到的特征矩阵训练谎言识别模型,最后通过谎言识别模型对待识别的音频文件进行识别,判断待识别音频文件中的说话内容是否为谎言。本申请通过利用样本音频文件,构建句子特征矩阵,从而根据句子特征矩阵训练谎言识别模型实现谎言识别,相比于现有技术中的人工检验方式,本申请利用句子特征矩阵进行模型训练,能够结合说话内容中的语序表达、语言组织特点实现谎言识别,识别效果更好,识别精度更高。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (8)

1.一种谎言识别方法,其特征在于,包括:
获取样本音频文件以及与所述样本音频文件对应的标签;
解析所述样本音频文件,得到按照时间顺序排列的非空音频和空白音频;检测每一段所述空白音频的持续时长,并根据所述持续时长确定与每一段所述空白音频对应的空白标记;将每一段所述非空音频转换成对应的文本,并按照所述时间顺序将每一段所述非空音频对应的文本和每一段所述空白音频对应的空白标记进行排列,得到所述样本音频文件对应的文本文件;
对所述文本文件进行句子分割处理,得到与所述文本文件对应的句子文本文件;
根据所述句子文本文件,提取所述句子文本文件对应的特征词以及所述空白标记;计算所述特征词以及所述空白标记的总数量;
若所述总数量大于或等于预设数量,则按照所述预设数量和所述特征词以及所述空白标记在所述句子文本文件中的先后顺序,截取所述句子文本文件对应的所述特征词以及所述空白标记,并根据截取后的所述特征词对应的特征词向量以及所述空白标记对应的空白标记向量,构建所述句子文本文件的特征矩阵,其中,所述特征词向量与所述空白标记向量为预设向量维度;
若所述总数量小于所述预设数量,则计算所述预设数量与所述总数量之差得到缺失数量,并根据与所述特征词对应的特征词向量、与所述空白标记对应的空白标记向量以及所述缺失数量的长度为所述预设向量维度且元素为0的向量,构建所述句子文本文件的特征矩阵;
根据所述特征矩阵以及所述特征矩阵对应的标签,训练谎言识别模型,其中,所述特征矩阵对应的标签为与所述特征矩阵相应的所述句子文本文件所在的所述样本音频文件对应的所述标签;
根据训练后的所述谎言识别模型,对待识别音频文件进行识别,得出与所述待识别音频文件对应的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据训练后的所述谎言识别模型,对待识别音频文件进行识别,得出与所述待识别音频文件对应的识别结果,具体包括:
将所述待识别音频文件转换为对应的待识别文本文件;
按照所述待识别文本文件中的标点信息,对所述待识别文本文件进行句子分割处理,得到对应的待识别句子文本文件;
根据所述待识别句子文本文件,构建所述待识别句子文本文件对应的待识别特征矩阵;
分别将每个所述待识别特征矩阵输入至训练后的所述谎言识别模型中,得出与每个所述待识别句子文本文件对应的识别结果;
统计所述待识别句子文本文件的总数量以及所述识别结果为谎言的所述待识别句子文本文件的数量,计算所述识别结果为谎言的所述待识别句子文本文件占全部的所述待识别句子文本文件的比例;
若所述比例超过预设谎言阈值,则所述待识别音频文件存在谎言,否则,所述待识别音频文件不存在谎言。
3.根据权利要求2所述的方法,其特征在于,所述标签具体包括谎言标签和非谎言标签,所述谎言识别模型的构造方法包括:
将所述特征矩阵映射变换为高维空间中的特征向量;
在所述高维空间中确定一个使得所述谎言标签对应的所述特征矩阵和所述非谎言标签对应的所述特征矩阵的几何间隔达到最大的最优超平面;
所述几何间隔最大时的约束条件为:
其中,yi表示任一所述特征矩阵i对应的标签,若所述标签为所述谎言标签,则yi=1,若所述标签为所述非谎言标签,则yi=-1,i=1,2,…,N,N表示所述特征矩阵的数量,WT为系数矩阵,Xi为所述特征矩阵,b为截距项,ξi表示非负松弛变量;
所述谎言识别模型的目标函数为:
其中,C>0为自定义惩罚因子。
4.一种谎言识别装置,其特征在于,包括:
样本获取模块,用于获取样本音频文件以及与所述样本音频文件对应的标签;
文件转换模块,用于解析所述样本音频文件,得到按照时间顺序排列的非空音频和空白音频;检测每一段所述空白音频的持续时长,并根据所述持续时长确定与每一段所述空白音频对应的空白标记;将每一段所述非空音频转换成对应的文本,并按照所述时间顺序将每一段所述非空音频对应的文本和每一段所述空白音频对应的空白标记进行排列,得到所述样本音频文件对应的文本文件;
句子分割模块,用于对所述文本文件进行句子分割处理,得到与所述文本文件对应的句子文本文件;
矩阵构建模块,用于:根据所述句子文本文件,提取所述句子文本文件对应的特征词以及所述空白标记;计算所述特征词以及所述空白标记的总数量;
若所述总数量大于或等于预设数量,则按照所述预设数量和所述特征词以及所述空白标记在所述句子文本文件中的先后顺序,截取所述句子文本文件对应的所述特征词以及所述空白标记,并根据截取后的所述特征词对应的特征词向量以及所述空白标记对应的空白标记向量,构建所述句子文本文件的特征矩阵,其中,所述特征词向量与所述空白标记向量为预设向量维度;
若所述总数量小于所述预设数量,则计算所述预设数量与所述总数量之差得到缺失数量,并根据与所述特征词对应的特征词向量、与所述空白标记对应的空白标记向量以及所述缺失数量的长度为所述预设向量维度且元素为0的向量,构建所述句子文本文件的特征矩阵;
训练模块,用于根据所述特征矩阵以及所述特征矩阵对应的标签,训练谎言识别模型,其中,所述特征矩阵对应的标签为与所述特征矩阵相应的所述句子文本文件所在的所述样本音频文件对应的所述标签;
识别模块,用于根据训练后的所述谎言识别模型,对待识别音频文件进行识别,得出与所述待识别音频文件对应的识别结果。
5.根据权利要求4所述的装置,其特征在于,识别模块,具体包括:文本转换单元、句子分割单元、特征矩阵构建单元、识别单元、计算单元、判断单元;
文本转换单元,用于将待识别音频文件转换为对应的待识别文本文件;
句子分割单元,用于按照待识别文本文件中的标点信息,对待识别文本文件进行句子分割处理,得到对应的待识别句子文本文件;
特征矩阵构建单元,用于根据待识别句子文本文件,构建待识别句子文本文件对应的待识别特征矩阵;
识别单元,用于分别将每个待识别特征矩阵输入至训练后的谎言识别模型中,得出与每个待识别句子文本文件对应的识别结果;
计算单元,用于统计待识别句子文本文件的总数量以及识别结果为谎言的待识别句子文本文件的数量,计算识别结果为谎言的待识别句子文本文件占全部的待识别句子文本文件的比例;
判断单元,用于若比例超过预设谎言阈值,则待识别音频文件存在谎言,否则,待识别音频文件不存在谎言。
6.根据权利要求5所述的装置,其特征在于,标签具体包括谎言标签和非谎言标签,谎言识别模型的构造方法包括:
将特征矩阵映射变换为高维空间中的特征向量;
在高维空间中确定一个使得谎言标签对应的特征矩阵和非谎言标签对应的特征矩阵的几何间隔达到最大的最优超平面;
几何间隔最大时的约束条件为:
其中,yi表示任一特征矩阵i对应的标签,若标签为谎言标签,则yi=1,若标签为非谎言标签,则yi=-1,i=1,2,…,N,N表示特征矩阵的数量,WT为系数矩阵,Xi为特征矩阵,b为截距项,ξi表示非负松弛变量;
谎言识别模型的目标函数为:
其中,C>0为自定义惩罚因子。
7.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至3中任一项所述的谎言识别方法。
8.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至3中任一项所述的谎言识别方法。
CN201910346425.0A 2019-04-26 2019-04-26 谎言识别方法及装置、存储介质、计算机设备 Active CN110222331B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910346425.0A CN110222331B (zh) 2019-04-26 2019-04-26 谎言识别方法及装置、存储介质、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910346425.0A CN110222331B (zh) 2019-04-26 2019-04-26 谎言识别方法及装置、存储介质、计算机设备

Publications (2)

Publication Number Publication Date
CN110222331A CN110222331A (zh) 2019-09-10
CN110222331B true CN110222331B (zh) 2024-05-14

Family

ID=67820103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910346425.0A Active CN110222331B (zh) 2019-04-26 2019-04-26 谎言识别方法及装置、存储介质、计算机设备

Country Status (1)

Country Link
CN (1) CN110222331B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112259083B (zh) * 2020-10-16 2024-02-13 北京猿力未来科技有限公司 音频处理方法及装置
CN112329746B (zh) * 2021-01-04 2021-04-16 中国科学院自动化研究所 多模态谎言检测方法、装置、设备
CN112329748B (zh) * 2021-01-04 2021-04-30 中国科学院自动化研究所 面向交互场景的自动谎言检测方法、装置、设备及介质
CN115944536B (zh) * 2023-03-10 2023-06-09 武汉凝创科技有限公司 一种精神障碍患者服药行为监控方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263308B1 (en) * 2000-03-20 2001-07-17 Microsoft Corporation Methods and apparatus for performing speech recognition using acoustic models which are improved through an interactive process
CN106055538A (zh) * 2016-05-26 2016-10-26 达而观信息科技(上海)有限公司 主题模型和语义分析相结合的文本标签自动抽取方法
CN108717406A (zh) * 2018-05-10 2018-10-30 平安科技(深圳)有限公司 文本情绪分析方法、装置及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4843867B2 (ja) * 2001-05-10 2011-12-21 ソニー株式会社 文書処理装置、文書処理方法および文書処理プログラム、ならびに、記録媒体
US7693717B2 (en) * 2006-04-12 2010-04-06 Custom Speech Usa, Inc. Session file modification with annotation using speech recognition or text to speech

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263308B1 (en) * 2000-03-20 2001-07-17 Microsoft Corporation Methods and apparatus for performing speech recognition using acoustic models which are improved through an interactive process
CN106055538A (zh) * 2016-05-26 2016-10-26 达而观信息科技(上海)有限公司 主题模型和语义分析相结合的文本标签自动抽取方法
CN108717406A (zh) * 2018-05-10 2018-10-30 平安科技(深圳)有限公司 文本情绪分析方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
测谎者的无意识加工对谎言识别的影响;梅宏玉;吴嵩;;心理科学进展(11);第139-149页 *

Also Published As

Publication number Publication date
CN110222331A (zh) 2019-09-10

Similar Documents

Publication Publication Date Title
CN110222331B (zh) 谎言识别方法及装置、存储介质、计算机设备
CN110147726B (zh) 业务质检方法和装置、存储介质及电子装置
CN110781276B (zh) 文本抽取方法、装置、设备及存储介质
WO2019104890A1 (zh) 结合音频分析和视频分析的欺诈识别方法、装置及存储介质
EP3346463A1 (en) Identity verification method and apparatus based on voiceprint
CN106782615B (zh) 语音数据情感检测方法和装置及系统
CN104598644B (zh) 喜好标签挖掘方法和装置
CN110110038B (zh) 话务预测方法、装置、服务器及存储介质
CN109192225B (zh) 语音情感识别和标注的方法及装置
CN105657129A (zh) 通话信息获取方法和装置
CN106960248B (zh) 一种基于数据驱动预测用户问题的方法及装置
CN111312256A (zh) 语音身份识别的方法、装置及计算机设备
CN111126553A (zh) 智能机器人面试方法、设备、存储介质及装置
CN109660865B (zh) 为视频自动打视频标签的方法及装置、介质和电子设备
CN110807314A (zh) 文本情感分析模型训练方法、装置、设备及可读存储介质
CN108090099B (zh) 一种文本处理方法及装置
CN111309905A (zh) 一种对话语句的聚类方法、装置、电子设备及存储介质
CN111292751A (zh) 语义解析方法及装置、语音交互方法及装置、电子设备
CN110459223B (zh) 数据跟踪处理方法、设备、存储介质及装置
CN110287318B (zh) 业务操作的检测方法及装置、存储介质、电子装置
CN111524503B (zh) 音频数据的处理方法、装置、音频识别设备和存储介质
CN110489747A (zh) 一种图像处理方法、装置、存储介质及电子设备
CN111522942A (zh) 文本分类模型的训练方法、装置、存储介质及计算机设备
CN110111778B (zh) 一种语音处理方法、装置、存储介质及电子设备
CN111488501A (zh) 一种基于云平台的电商统计系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant