CN109145306A - 文本驱动的三维表情生成方法 - Google Patents
文本驱动的三维表情生成方法 Download PDFInfo
- Publication number
- CN109145306A CN109145306A CN201811055990.3A CN201811055990A CN109145306A CN 109145306 A CN109145306 A CN 109145306A CN 201811055990 A CN201811055990 A CN 201811055990A CN 109145306 A CN109145306 A CN 109145306A
- Authority
- CN
- China
- Prior art keywords
- emotion
- word
- text
- emotional
- vocabulary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种文本驱动的三维表情生成方法,包括:获取文本,对文本进行分词,得到词集;在词集中提取出所有情感词汇、修饰每个情感词汇的否定词和程度词;确定每一个情感词汇的情感属性;计算情感词汇的情感值;计算情感词汇的组合情感值;确定文本整体的情感类别;计算文本的整体情感值;获取预设的中性表情对应的表情向量,以得到第一表情向量;获取文本的整体情感类别对应的表情向量,以得到第二表情向量;根据本文的整体情感值、第一表情向量和第二表情向量,计算文本对应的表情向量;根据文本对应的表情向量生成文本对应的三维表情。本发明可以准确的分析文本表达的情感,并根据文本表达的情感生成对应的三维表情图像。
Description
技术领域
本发明涉及自然语言处理技术与情感计算领域,更具体地,涉及一种文本驱动的三维表情生成方法。
背景技术
虚拟现实(Virtual Reality,VR)技术是以计算机技术为基础,同时结合了图形图像、人工智能等多种技术,扩展了人类认识、模拟世界的能力。虚拟现实技术从20世纪60~70年代开始兴起,90年代开始形成和发展,在仿真训练、工业设计、交互体验等多个应用领域解决了一些重大或普遍性需求,目前在理论技术与应用开展等方面都取得了很大的进展。随着VR技术的不断发展,三维虚拟人物的应用场景也越来越广泛,在影视制作、广告特效、三维游戏中均获得了较好应用效果,人们希望能够与三维虚拟人物拥有更加真实化、实时化的交互体验,例如三维虚拟人物能够与人类一样拥有不同情绪感知。一个人理解其他人的情绪/心理状态的非语言沟通方法之一是面部表情。人脸表情复杂多样并且能够通过表情实现与周围环境的互动,虚拟人物相比于机器人来说,具有更大的灵活性,且易于设计,因此合成表情生动逼真的三维虚拟人脸形象一直都是计算机图像学的热点问题。
近年来可以通过触感装置等设备实现对三维虚拟人物的表情控制,但是大多数的人机交互系统并没有像人类那样的感知能力,人类可以根据谈话内容具有不同的情感状态,并做出相应的表情,有助于实现人与人之间的和谐互动。因此,构造出能理解文本情感并使三维虚拟人物能够具有对应的三维表情,是目前需要解决的技术问题。
发明内容
有鉴于此,本发明提供了一种文本驱动的三维表情生成方法,解决了现有技术中虚拟表情图像无法理解文本的情感并做出相应的表情的问题。
为了解决上述问题,本发明提供了一种文本驱动的三维表情生成方法:包括以下步骤:
一种文本驱动的三维表情生成方法,包括:
获取文本,其中,所述文本中至少包含一个情感词汇;
对所述文本进行分词,得到所述文本对应的词集;
在所述词集中提取出所述情感词汇,得到情感词汇集;
在所述词集中提取出修饰每个所述情感词汇的否定词和程度词,其中,当所述情感词汇同时被所述否定词和所述程度词修饰时,获取修饰同一所述情感词汇的所述否定词和所述程度词的修饰顺序;
确定所述情感词汇集中各个所述情感词汇的情感属性,其中,每个所述情感词汇的所述情感属性包括所述情感词汇所属的情感类别以及所述情感词汇在所述情感类别下的情感等级和极性,其中,预设多个所述情感类别、多个所述情感等级和多个所述极性,每个所述情感类别至少包括一个所述情感词汇,一个所述情感词汇至少属于一个所述情感类别,每个所述情感词汇在其所属的所述情感类别中对应一个所述情感等级和一个所述极性,多个所述极性包括中性、褒义和贬义;
根据所述情感词汇的情感属性计算所述情感词汇的情感值;
根据所述情感词汇的情感值、修饰所述情感词汇的否定词和程度词以及修饰同一所述情感词汇的所述否定词和所述程度词的修饰顺序,计算所述情感词汇的组合情感值;
确定所述情感词汇集中各个所述情感词汇对应的所述情感类别,其中,当所述情感词汇只属于一个所述情感类别时,所述情感词汇所属的所述情感类别为所述情感词汇对应的所述情感类别,当所述情感词汇属于两个或两个以上的所述情感类别时,根据所述情感词汇在每个所属的所述情感类别中的所述情感等级和所述极性,计算各个所属的所述情感类别的类别判定参数,并根据所述类别判定参数从各个所属的所述情感类别中,选择一个所述情感类别作为所述情感词汇对应的所述情感类别;
针对所述情感词汇集中所有所述情感词汇对应的所述情感类别,计算同一种所述情感类别所对应的所述情感词汇的数量;
当存在一种所述情感类别所对应的所述情感词汇的数量,是各种所述情感类别所对应的所述情感词汇的数量中的最大值时,对应所述最大值的所述情感类别为所述文本的整体情感类别;
当各种所述情感类别所对应的所述情感词汇的数量相等时,选择所述组合情感值最大的所述情感词汇对应的所述情感类别为所述文本的整体情感类别;
在所述情感词汇集中选出与所述文本的整体情感类别一致的情感词汇作为目标情感词汇,其中,所有目标情感词汇构成目标情感词汇集;根据所述目标情感词汇的组合情感值计算所述文本的整体情感值;
获取预设的中性表情对应的表情向量,以得到第一表情向量;
获取所述文本的所述整体情感类别对应的表情向量,以得到第二表情向量;
根据所述本文的整体情感值、所述第一表情向量和所述第二表情向量,计算所述文本对应的表情向量;
根据所述文本对应的表情向量生成所述文本对应的三维表情。
进一步的,采用以下公式计算所述情感词汇的情感值:
其中,Sk为所述情感词汇集中第k个所述情感词汇的情感值,n表示第k个所述情感词汇属于的所述情感类别的数量,αi和βi分别依次表示第k个所述情感词汇在其所属的第i个所述情感类别中对应的所述情感等级和所述极性的值,中性的值0、褒义的值为1,贬义的值为-1,n为正整数,i大于等于1且小于等于n,k为正整数。
进一步的,采用以下公式计算所述情感词汇的组合情感值:
Pk=(-1)l*W*Sk*m
其中,Pk和Sk分别依次为所述情感词汇集中第k个所述情感词汇的组合情感值和情感值,l表示修饰第k个所述情感词汇的否定词的数量,W表示修饰第k个所述情感词汇的程度词的程度值,其中,预设多个程度值,每个所述程度词对应一个所述程度值,当第k个所述情感词汇的没有程度词修饰时,W=1,m为无量纲参数,l和k均为正整数。
进一步的,当第k个所述情感词汇没有被否定词和程度词修饰、仅有否定词修饰、仅有程度词修饰或被先程度词后否定词的修饰顺序修饰时,m=1,当第k个所述情感词汇被先否定词后程度词的修饰顺序修饰时,m=0.5。
进一步的,采用以下公式计算所述文本的整体情感值:
其中,E为所述文本的整体情感值,K为所述情感词汇集中情感词汇的数量,Pk为所述目标情感词汇集中第k个所述目标情感词汇的组合情感值,K为正整数,k大于等于1且小于等于K。
进一步的,采用以下公式计算类别判定参数:
Yki=αiβi
其中,Yki为所述情感词汇集中第k个所述情感词汇所属的第i个情感类别的类别判定参数,αi和βi分别依次表示第k个所述情感词汇在其所属的第i个所述情感类别中对应的所述情感等级和所述极性的值,中性的值0、褒义的值为1,贬义的值为-1,k和i均为正整数。
进一步的,在计算所述文本的整体情感值之后,计算所述文本对应的表情向量之前,所述方法还包括:对所述文本的整体情感值进行归一化处理;
采用以下公式计算所述文本对应的表情向量:
F=EF1+(1-E)F2
其中,F为所述文本对应的表情向量,E为归一化处理后的所述文本的整体情感值,F1为所述第一表情向量,F2为所述第二表情向量。
进一步的,所述第一表情向量:F1={f11,f21,...,fG1};
所述第二表情向量:F2={f12,f22,...,fG2};
所述文本对应的表情向量:
F={Ef11+(1-E)f12,Ef21+(1-E)f22,...,EfG1+(1-E)fG2};
其中,G为大于1的正整数。
进一步的,多个所述情感类别由喜、怒、哀、惧、恶和惊共六类组成。
进一步的,对所述文本进行分词,得到所述文本对应的词集的步骤包括:对所述文本进行分词,得到多个词汇;将所述多个词汇中的停用词和生僻词去除,得到所述文本对应的词集;
在所述词集中提取出所述情感词汇的步骤包括:在所述词集中查找预设情感词汇词典中的词,以提取所述情感词汇,其中,所述预设情感词汇词典包括若干所述情感词汇;
在所述词集中提取出修饰每个所述情感词汇的否定词和程度词的步骤包括:在所述词集中查找预设否定词词典中的词,以提取所述否定词;在所述词集中查找预设程度词词典中的词,以提取所述程度词,其中,所述预设否定词词典包括若干所述否定词,所述预设程度词典包括若干所述程度。
与现有技术相比,本发明提供的文本驱动的三维表情生成方法,至少实现了如下的有益效果:
一、本发明将文本中所有的情感词汇提取出来并计算每一个情感词汇的情感值,根据每一个词汇的情感值计算文本整体的情感值,从而可以综合分析文本中每一个情感词汇所表达的情感,准确的分析文本整体所表达的情感;
二、本发明还获取所有修饰情感词汇的程度词和否定词,从而在多种复杂的语言环境下,可以准确的判断每一个情感词汇所表达的情感,避免了由于否定词的存在将文本所表达的情感完全颠倒的情况;
三、对于一个情感词汇具有多种情感分类的情况,本实施例通过类别判定参数对多种情感类别进行统一判定,选出最能体现情感词汇所表达的情感类别,对文本的情感类别的分析更加准确;
四、采用本发明所提供的方法,可以生成不同强度的三维表情,对文本的情感分析更加精确和具体。
当然,实施本发明的任一产品必不特定需要同时达到以上所述的所有技术效果。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是文本驱动的三维表情生成方法流程图;
图2是另一种文本驱动的三维表情生成方法流程图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
实施例1:
本实施例提供了一种文本驱动的三维表情生成方法,如图1所示为文本驱动的三维表情生成方法的流程图,包括以下步骤:
S101:获取文本,其中,文本中至少包含一个情感词汇。
S102:对文本进行分词,得到文本对应的词集;例如对于一段文本,分词即去掉“的”、“了”等助词之后,得到的若干个词汇组成词集。
S103:在词集中提取出所有情感词汇,得到情感词汇集。词集中可能存在其他不是情感词汇的词汇,例如一些名词和动词等,在所有词汇中提取出情感词汇组成情感词汇集。
S104:在词集中提取出修饰每个情感词汇的否定词和程度词,其中,当情感词汇同时被否定词和程度词修饰时,获取修饰同一情感词汇的否定词和程度词的修饰顺序。
具体的,程度词可以包括“略微”、“较”、“一般”、“稍微”、“多”、“非常”、“特别”、“极其”等,否定词可以包括“没有”、“并非”“不”等,情感词之前可能只有程度词,例如“很高兴”,可能只有否定词,例如“不高兴”,也可能同时有程度词和否定词,此时否定词和程度词的顺序尤为重要,顺序不同会对整个文本的情感产生很大的影响。例如“不特别高兴”和“特别不高兴”。因此需要获取否定词和程度词的先后顺序关系,进而准确的对该情感词汇的情感类别和情感强度进行判断。
S105:确定情感词汇集中各个情感词汇的情感属性,其中,每个情感词汇的情感属性包括情感词汇所属的情感类别以及情感词汇在情感类别下的情感等级和极性。
其中,预设多个情感类别、多个情感等级和多个极性,每个情感类别至少包括一个情感词汇,一个情感词汇至少属于一个情感类别,情感类别可以包括喜、怒、哀、惧、恶和惊等,例如“高兴”属于类别“喜”,“害怕”属于类别“惧”,每一个类别之内的情感词汇可以分为多个情感等级,用于表示情感的强烈程度,本实施例将情感等级分为1、2、3···h共h个情感等级,h为正整数,h的值越大代表强烈程度越高。极性包括中性、褒义和贬义。每一个情感词汇在一个类别下都对应三种极性中的一种。
S106:根据情感词汇的情感属性计算情感词汇的情感值;
情感值主要由情感词汇的情感等级和极性来决定,情感类别用于对情感词汇的情感分类进行标记。
S107:根据情感词汇的情感值、修饰情感词汇的否定词和程度词以及修饰同一情感词汇的否定词和程度词的修饰顺序,计算情感词汇的组合情感值;
对于其中一个情感词汇,组合情感值用于描述该情感词汇联系其上下文所表达出的实际的情感,例如,对于情感词汇“高兴”,假设在“高兴”之前存在程度词和否定词“非常不”,那么该情感词汇表达出的情感发生了反转,因此对于文本中的每一个情感词汇,要想准确地分析该情感词汇所表达的情感,则必须分析修饰该情感词汇的程度词和否定词,以及程度词和否定词的顺序,以此来计算每一个情感词汇的组合情感值。
S108:确定情感词汇集中各个情感词汇对应的情感类别,其中,当情感词汇只属于一个情感类别时,情感词汇所属的情感类别为情感词汇对应的情感类别,当情感词汇属于两个或两个以上的情感类别时,根据情感词汇在每个所属的情感类别中的情感等级和极性,计算各个所属的情感类别的类别判定参数,并根据类别判定参数从各个所属的情感类别中,选择一个情感类别作为情感词汇对应的情感类别;
对于一个情感词汇,该情感词汇可能属于一个情感类别,也可能属于两个或多个情感类别,对于一个情感词汇只属于一个情感类别的情况,可以直接以该情感类别作为该情感词汇的情感类别;对于一个情感词汇属于多个情感类别的情况,例如对于情感词汇“战祸”,对应的情感类别有“惧”、“恶”、“哀”等,每一个情感类别均对应一个情感等级和极性,根据该情感词汇所对应的每一个情感类别的情感等级和极性,计算每一个情感类别的类别判定参数,比如上述情感词汇“战祸”具有三个情感类别,那么对于情感词汇“战祸”就可以得到三个类别判定参数,在三个类别判定参数中,按照预定的规则选择一个类别判定参数所对应的情感类别作为情感词汇“战祸”所属的情感类别,该预定规则能够体现出情感词汇主要所属的情感类别。
S109:针对情感词汇集中所有情感词汇对应的情感类别,计算同一种情感类别所对应的情感词汇的数量;
情感词汇及中的每个情感词汇都会对应一个情感类别,可能存储多个情感词汇对应同一个情感类别,因而,在该步骤中,针对每个情感类别进行统计,统计出每个情感类别所对应的情感词汇的数量。
S110:当存在一种情感类别所对应的情感词汇的数量,是各种情感类别所对应的情感词汇的数量中的最大值时,对应最大值的情感类别为文本的整体情感类别;
S111:当各种情感类别所对应的情感词汇的数量相等时,选择组合情感值最大的情感词汇对应的情感类别为文本的整体情感类别;
步骤S109和S110用于统计情感词汇集中同一种情感类别所对应的情感词汇的数量,并以数量最多的情感类别作文文本整体的情感类别,当然还可能存在两个或多个数量最多的情感类别。对于存在一个数量最多的情感类别的情况,直接取数量最多的情感类别作为文本的情感类别;对于存在两个或多个数量最多的情感类别的情况,则需要分析数量最多的每一个情感类别所对应的情感词汇的组合情感值,例如一个文本中共有四个情感词汇,其中两个情感词汇属于情感类别“哀”,另外两个情感词汇属于情感类别“惧”,此时两个情感类别的数量相同,则需要分别分析属于“哀”的两个情感词汇的组合情感值以及属于“惧”的两个情感词汇的组合情感值,可以得到四个组合情感值,在这四个组合情感值中取组合情感值最大的情感词汇所对应得情感类别,作为文本的情感类别。需要说明的是,本实施例仅以四个情感词汇作为举例,对于情感类别是其他个数的文本,可以按照相同的方法判定文本所属的情感类别。
S112:在情感词汇集中选出与文本的整体情感类别一致的情感词汇作为目标情感词汇,其中,所有目标情感词汇构成目标情感词汇集;根据所述目标情感词汇的组合情感值计算所述文本的整体情感值;
每一个情感词汇都可以计算出一个组合情感值,由于一个文本中可能存在多个情感词汇,所以组合情感值仅仅可以表达一个情感词汇所表达的情感,并不能准确地表示整个文本所表达的情感。因此在所有情感词汇中选出与文本情感类别一致的情感词汇作为目标情感词汇,根据目标情感词汇的组合情感值计算文本的整体情感值。
S113:获取预设的中性表情对应的表情向量,以得到第一表情向量;
在该步骤中,可根据三维虚拟人物的不同或应用场景的不同等,预设有相同的或不同的多个中性表情对应的表情向量,在该处,为了与其他表情向量进行区分,命名为第一表情向量。
S114:获取文本的整体情感类别对应的表情向量,以得到第二表情向量;
每一个三维表情的图像都由表情向量构成,第一表情向量对应的是三维表情中的中性表情;每个情感类别也会对应一个表情向量,在得出文本的整体情感类别后,即可以得到该整体情感类别所对应的表情向量,该处命名为第二表情向量,第一表情向量和第二表情向量共同决定文本所对应的三维表情的图像。
S115:根据本文的整体情感值、第一表情向量和第二表情向量,计算文本对应的表情向量;
在该步骤中,利用本文的整体情感值和第二表情向量,对第一表情向量进行调制,最终计算出文本对应的表情向量。
S116:根据文本对应的表情向量生成文本对应的三维表情。
表情向量的图形化显示即为三维表情的图像,在得出文本所对应的表情向量后,将表情向量图形化显示后,即可得到三维表情的图像。因此,在虚拟三维人物的面部将表情向量可视化之后,所体现的就是对应的三维表情。
实施例2:
本实施例在实施例1的基础上,提供了一种优选的文本驱动的三维表情生成方法,如图2所示为另一种文本驱动的三维表情生成方法的流程图,包括以下步骤:
S201:获取文本,其中,文本中至少包含一个情感词汇。
S202:对文本进行分词,得到文本对应的词集;例如对于一段文本,分词即去掉“的”“了”等助词之后,得到的若干个词汇组成词集。
S203:在词集中提取出所有情感词汇,得到情感词汇集;词集中可能存在其他不是情感词汇的词汇,例如一些名词和动词等,在所有词汇中提取出情感词汇组成情感词汇集。
S204:在词集中提取出修饰每个情感词汇的否定词和程度词,其中,当情感词汇同时被否定词和程度词修饰时,获取修饰同一情感词汇的否定词和程度词的修饰顺序;
程度词可以包括“略微”、“较”、“一般”、“稍微”、“多”、“非常”、“特别”、“极其”等,否定词可以包括“没有”、“并非”“不”等,情感词之前可能只有程度词,例如“很高兴”,可能只有否定词,例如“不高兴”,也可能同时有程度词和否定词,此时否定词和程度词的顺序尤为重要,顺序不同会对整个文本的情感产生很大的影响。例如“不特别高兴”和“特别不高兴”。因此需要获取否定词和程度词的先后顺序关系,进而准确的对该情感词汇的情感类别和情感强度进行判断。
S205:确定情感词汇集中各个情感词汇的情感属性,其中,每个情感词汇的情感属性包括情感词汇所属的情感类别以及情感词汇在情感类别下的情感等级和极性。
其中,预设多个情感类别、多个情感等级和多个极性,每个情感类别至少包括一个情感词汇,一个情感词汇至少属于一个情感类别,情感类别可以包括喜、怒、哀、惧、恶和惊等,例如“高兴”属于类别“喜”,“害怕”属于类别“惧”,每一个类别之内的情感词汇可以分为多个情感等级,用于表示情感的强烈程度,本实施例将情感等级分为1、2、3···h共h个情感等级,h为正整数,h的值越大代表强烈程度越高。极性包括中性、褒义和贬义。每一个情感词汇在一个类别下都对应三种极性中的一种。
S206:根据情感词汇的情感属性计算情感词汇的情感值;具体采用以下公式计算:
其中,Sk为情感词汇集中第k个情感词汇的情感值,n表示第k个情感词汇属于的情感类别的数量,αi和βi分别依次表示第k个情感词汇在其所属的第i个情感类别中对应的情感等级和极性的值,中性的值0、褒义的值为1,贬义的值为-1,n为正整数,i大于等于1且小于等于n,k为正整数。通过公式(1)可以计算出每一个情感词汇的情感值,并且对于褒义的情感词汇,计算出的情感值为正数,对于贬义的情感词汇,计算出的情感值为负数,在后续对情感词汇进行分析时,可以通过情感值得正负号情况判断情感词汇的极性。
S207:根据情感词汇的情感值、修饰情感词汇的否定词和程度词以及修饰同一情感词汇的否定词和程度词的修饰顺序,采用以下公式计算情感词汇的组合情感值;
Pk=(-1)l*W*Sk*m (2)
其中,Pk和Sk分别依次为情感词汇集中第k个情感词汇的组合情感值和情感值,l表示修饰第k个情感词汇的否定词的数量,W表示修饰第k个情感词汇的程度词的程度值,m为无量纲参数,l和k均为正整数。
其中,对于所有程度词预设有多个程度值,每个程度词对应一个程度值,当第k个情感词汇的没有程度词修饰时,W=1;本实施例将程度词的程度值根据其强度大小分为1、2、3、···p共p类,p可以为任意一个正整数,例如可以将程度词分为五类,没有程度词时,W=1,当程度词为“略微”或“稍微”时,为第二类程度词,此时W=2,当程度词为“较”或“比较”时,为第三类程度词,此时W=3,当程度词为“多”或“格外”时,为第四类程度词,此时W=5,当程度词为“倍加”、“十分”或者“及其”时,为第五类程度词,此时W=5。以上仅为举例说明,W的值也可以按照其他倍数递增,例如1、3、9、27等等。
当第k个情感词汇没有被否定词和程度词修饰、仅有否定词修饰、仅有程度词修饰或被先程度词后否定词的修饰顺序修饰时,m=1,当第k个情感词汇被先否定词后程度词的修饰顺序修饰时,m=0.5。具体的,m=1可以包括的情况有“开心”、“不开心”、“太开心”、“太不开心”和“没有不开心”,m=0.5可以包括的情况有“不太开心”,即先被否定词修饰,后被程度词修饰的情况。
通过公式(2)可以准确的计算出每一个情感词汇与修饰该情感词汇的修饰词组合之后所表达的情感值。
S208:确定情感词汇集中各个情感词汇对应的情感类别,其中,当情感词汇只属于一个情感类别时,情感词汇所属的情感类别为情感词汇对应的情感类别,当情感词汇属于两个或两个以上的情感类别时,根据情感词汇在每个所属的情感类别中的情感等级和极性,计算各个所属的情感类别的类别判定参数,并根据类别判定参数从各个所属的情感类别中,选择一个情感类别作为情感词汇对应的情感类别。
采用以下公式计算类别判断参数:
Yki=αiβi (4)
其中,Yki为情感词汇集中第k个情感词汇所属的第i个情感类别的类别判定参数,αi和βi分别依次表示第k个情感词汇在其所属的第i个情感类别中对应的情感等级和极性的值,中性的值0、褒义的值为1,贬义的值为-1,k和i均为正整数。
对于一个情感词汇,该情感词汇可能属于一个情感类别,也可能属于两个或多个情感类别,对于一个情感词汇只属于一个情感类别的情况,可以直接以该情感类别作为该情感词汇的情感类别;对于一个情感词汇属于多个情感类别的情况,例如对于情感词汇“战祸”,对应的情感类别有“惧”、“恶”、“哀”等,每一个情感类别均对应一个情感等级和极性,根据该情感词汇所对应的每一个情感类别的情感等级和极性,计算每一个情感类别的类别判定参数Yki,比如上述情感词汇“战祸”具有三个情感类别,那么对于情感词汇“战祸”就可以得到三个类别判定参数,在三个类别判定参数中,对每一个类别判定参数取绝对值之后进行比较,取绝对值最大的类别判定参数所对应的类别作为该情感词汇的情感类别。例如对于情感词汇“战祸”,最后求出的类别判定参数中,“惧”的类别判定参数为5,“恶”的类别判定参数为3,“哀’的类别判定参数为4,那么取绝对值最大的类别判定参数“惧”作为情感词汇“战祸”的情感类别。对于情感词汇属于其他个数的情感类别的情况,均按照此方法选取情感词汇的情感类别,通过此方法选取出的情感类别能够体现出情感词汇主要所属的情感类别。
S209:针对情感词汇集中所有情感词汇对应的情感类别,计算同一种情感类别所对应的情感词汇的数量;
情感词汇及中的每个情感词汇都会对应一个情感类别,可能存储多个情感词汇对应同一个情感类别,因而,在该步骤中,针对每个情感类别进行统计,统计出每个情感类别所对应的情感词汇的数量。
S210:当存在一种情感类别所对应的情感词汇的数量,是各种情感类别所对应的情感词汇的数量中的最大值时,对应最大值的情感类别为文本的整体情感类别;
S211:当各种情感类别所对应的情感词汇的数量相等时,选择组合情感值最大的情感词汇对应的情感类别为文本的整体情感类别;
步骤S210和S2113用于统计情感词汇集中同一种情感类别所对应的情感词汇的数量,并以数量最多的情感类别作文文本整体的情感类别,当然还可能存在两个或多个数量最多的情感类别。对于存在一个数量最多的情感类别的情况,直接取数量最多的情感类别作为文本的情感类别;对于存在两个或多个数量最多的情感类别的情况,则需要分析数量最多的每一个情感类别所对应的情感词汇的组合情感值,例如一个文本中共有四个情感词汇,其中两个情感词汇属于情感类别“哀”,另外两个情感词汇属于情感类别“惧”,此时两个情感类别的数量相同,则需要分别分析属于“哀”的两个情感词汇的组合情感值以及属于“惧”的两个情感词汇的组合情感值,可以得到四个组合情感值,在这四个组合情感值中取组合情感值最大的情感词汇所对应得情感类别,作为文本的情感类别。需要说明的是,本实施例仅以四个情感词汇作为举例,对于情感类别是其他个数的文本,可以按照相同的方法判定文本所属的情感类别。
S212:在情感词汇集中选出与文本的整体情感类别一致的情感词汇作为目标情感词汇,其中,所有目标情感词汇构成目标情感词汇集;根据所述目标情感词汇的组合情感值计算所述文本的整体情感值;具体采用以下公式进行计算:
其中,E为文本的整体情感值,K为情感词汇集中情感词汇的数量,Pk为目标情感词汇集中第k个目标情感词汇的组合情感值,K为正整数,k大于等于1且小于等于K。
每一个情感词汇都可以计算出一个组合情感值,由于一个文本中可能存在多个情感词汇,所以组合情感值仅仅可以表达一个情感词汇所表达的情感,并不能准确地表示整个文本所表达的情感,通过选出文本中与文本的整体情感类别一致的情感词汇作为目标情感词汇,再将所有目标情感词汇的组合情感值代入公式(3)即可得到文本整体的情感值,文本整体的情感值可以更加准确的表达文本整体的情感。
S213:对文本的整体情感值进行归一化处理;
在计算出文本整体的情感值以后,对文本的情感值进行归一化处理可以使文本的整体情感值处于0~1的范围内,这样在对多个文本进行分析时,得到的多个文本的整体情感值都可以处于0~1的区间内,这样对于不同的文本,可以采用同一个标准衡量文本最终的整体情感值。
S214:获取预设的中性表情对应的表情向量,以得到第一表情向量;第一表情向量为F1={f11,f21,...,fG1};
在该步骤中,可根据三维虚拟人物的不同或应用场景的不同等,预设有相同的或不同的多个中性表情对应的表情向量,在该处,为了与其他表情向量进行区分,命名为第一表情向量。
S215:获取文本的整体情感类别对应的表情向量,以得到第二表情向量;第二表情向量为F2={f12,f22,...,fG2};每一个三维表情的图像都由表情向量构成,第一表情向量对应的是三维表情中的中性表情;每个情感类别也会对应一个表情向量,在得出文本的整体情感类别后,即可以得到该整体情感类别所对应的表情向量,该处命名为第二表情向量,第一表情向量和第二表情向量共同决定文本所对应的三维表情的图像。
S216:根据本文的整体情感值、第一表情向量和第二表情向量,采用以下公式计算文本对应的表情向量:
F=EF1+(1-E)F2 (5)
其中,F为文本对应的表情向量,E为归一化处理后的文本的整体情感值,F1为第一表情向量,F2为第二表情向量。将F1和F2分别代入公式(5)中可得
F={Ef11+(1-E)f12,Ef21+(1-E)f22,...,EfG1+(1-E)fG2} (6)
在该步骤中,利用文本的整体情感值和第二表情向量,对第一表情向量进行调制,最终计算出文本对应的表情向量。
S217:根据文本对应的表情向量生成文本对应的三维表情。
表情向量的图形化显示即为三维表情的图像,在得出文本所对应的表情向量后,将表情向量图形化显示后,即可得到三维表情的图像。因此,在虚拟三维人物的面部将表情向量可视化之后,所体现的就是对应的三维表情。
通过上述实施例可知,本发明提供的文本驱动的三维表情生成方法,至少实现了如下的有益效果:
一、本实施例将文本中所有的情感词汇提取出来并计算每一个情感词汇的情感值,根据每一个词汇的情感值计算文本整体的情感值,从而可以综合分析文本中每一个情感词汇所表达的情感,准确的分析文本整体所表达的情感;
二、本实施例还获取所有修饰情感词汇的程度词和否定词,从而在多种复杂的语言环境下,可以准确的判断每一个情感词汇所表达的情感,避免了由于否定词的存在将文本所表达的情感完全颠倒的情况;
三、对于一个情感词汇具有多种情感分类的情况,本实施例通过类别判定参数对多种情感类别进行统一判定,选出最能体现情感词汇所表达的情感类别。
四、通过本实施例提供的方法,可以生成不同强度的三维表情,对文本的情感分析更加精确和具体。
实施例3:
本实施例在实施例1和实施例2的基础上,提供了一种优选的文本驱动的三维表情生成方法,相关之处可以参考实施例1和实施例2的描述。本实施例在对文本进行分词,提取出文本中对应的词集的步骤,提供了一种优选的方法。具体包括以下步骤:将多个词汇中的停用词和生僻词去除,得到所述文本对应的词集。
实施例4:
本实施例在实施例1和实施例2的基础上,提供了一种优选的文本驱动的三维表情生成方法,相关之处可以参考实施例1和实施例2的描述。本实施例在对从词集中提取出情感词汇的步骤,提供了一种优选的方法,具体包括以下步骤:
在词集中查找预设情感词汇词典中的词,以提取所述情感词汇,其中,预设情感词汇词典包括若干所述情感词汇;预设的情感词典可以为目前中文领域常用的知网情感词典(HOWNET)、清华大学李军中文褒贬义词典(TSING)、台湾大学中文情感极性词典(NTUSD)、大连理工大学中文情感词汇本体库等。
实施例5:
本实施例在实施例1和实施例2的基础上,提供了一种优选的文本驱动的三维表情生成方法,相关之处可以参考实施例1和实施例2的描述。本实施例在从词集中提取出修饰每个所述情感词汇的否定词和程度词的步骤,提供了一种优选的方法,具体包括以下步骤:
在词集中查找预设否定词词典中的词,以提取所述否定词;在词集中查找预设程度词词典中的词,以提取所述程度词,其中,所述预设否定词词典包括若干所述否定词,预设程度词典包括若干个程度词。
虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。
Claims (10)
1.一种文本驱动的三维表情生成方法,其特征在于,包括:
获取文本,其中,所述文本中至少包含一个情感词汇;
对所述文本进行分词,得到所述文本对应的词集;
在所述词集中提取出所述情感词汇,得到情感词汇集;
在所述词集中提取出修饰每个所述情感词汇的否定词和程度词,其中,当所述情感词汇同时被所述否定词和所述程度词修饰时,获取修饰同一所述情感词汇的所述否定词和所述程度词的修饰顺序;
确定所述情感词汇集中各个所述情感词汇的情感属性,其中,每个所述情感词汇的所述情感属性包括所述情感词汇所属的情感类别以及所述情感词汇在所述情感类别下的情感等级和极性,其中,预设多个所述情感类别、多个所述情感等级和多个所述极性,每个所述情感类别至少包括一个所述情感词汇,一个所述情感词汇至少属于一个所述情感类别,每个所述情感词汇在其所属的所述情感类别中对应一个所述情感等级和一个所述极性,多个所述极性包括中性、褒义和贬义;
根据所述情感词汇的情感属性计算所述情感词汇的情感值;
根据所述情感词汇的情感值、修饰所述情感词汇的否定词和程度词以及修饰同一所述情感词汇的所述否定词和所述程度词的修饰顺序,计算所述情感词汇的组合情感值;
确定所述情感词汇集中各个所述情感词汇对应的所述情感类别,其中,当所述情感词汇只属于一个所述情感类别时,所述情感词汇所属的所述情感类别为所述情感词汇对应的所述情感类别,当所述情感词汇属于两个或两个以上的所述情感类别时,根据所述情感词汇在每个所属的所述情感类别中的所述情感等级和所述极性,计算各个所属的所述情感类别的类别判定参数,并根据所述类别判定参数从各个所属的所述情感类别中,选择一个所述情感类别作为所述情感词汇对应的所述情感类别;
针对所述情感词汇集中所有所述情感词汇对应的所述情感类别,计算同一种所述情感类别所对应的所述情感词汇的数量;
当存在一种所述情感类别所对应的所述情感词汇的数量,是各种所述情感类别所对应的所述情感词汇的数量中的最大值时,对应所述最大值的所述情感类别为所述文本的整体情感类别;
当各种所述情感类别所对应的所述情感词汇的数量相等时,选择所述组合情感值最大的所述情感词汇对应的所述情感类别为所述文本的整体情感类别;
在所述情感词汇集中选出与所述文本的整体情感类别一致的情感词汇作为目标情感词汇,其中,所有目标情感词汇构成目标情感词汇集;根据所述目标情感词汇的组合情感值计算所述文本的整体情感值;
获取预设的中性表情对应的表情向量,以得到第一表情向量;
获取所述文本的所述整体情感类别对应的表情向量,以得到第二表情向量;
根据所述本文的整体情感值、所述第一表情向量和所述第二表情向量,计算所述文本对应的表情向量;
根据所述文本对应的表情向量生成所述文本对应的三维表情。
2.根据权利要求1所述的文本驱动的三维表情生成方法,其特征在于,采用以下公式计算所述情感词汇的情感值:
其中,Sk为所述情感词汇集中第k个所述情感词汇的情感值,n表示第k个所述情感词汇属于的所述情感类别的数量,αi和βi分别依次表示第k个所述情感词汇在其所属的第i个所述情感类别中对应的所述情感等级和所述极性的值,中性的值0、褒义的值为1,贬义的值为-1,n为正整数,i大于等于1且小于等于n,k为正整数。
3.根据权利要求1所述的文本驱动的三维表情生成方法,其特征在于,采用以下公式计算所述情感词汇的组合情感值:
Pk=(-1)l*W*Sk*m
其中,Pk和Sk分别依次为所述情感词汇集中第k个所述情感词汇的组合情感值和情感值,l表示修饰第k个所述情感词汇的否定词的数量,W表示修饰第k个所述情感词汇的程度词的程度值,其中,预设多个程度值,每个所述程度词对应一个所述程度值,当第k个所述情感词汇的没有程度词修饰时,W=1,m为无量纲参数,l和k均为正整数。
4.根据权利要求3所述的文本驱动的三维表情生成方法,其特征在于,
当第k个所述情感词汇没有被否定词和程度词修饰、仅有否定词修饰、仅有程度词修饰或被先程度词后否定词的修饰顺序修饰时,m=1,当第k个所述情感词汇被先否定词后程度词的修饰顺序修饰时,m=0.5。
5.根据权利要求1所述的文本驱动的三维表情生成方法,其特征在于,采用以下公式计算所述文本的整体情感值:
其中,E为所述文本的整体情感值,K为所述情感词汇集中情感词汇的数量,Pk为所述目标情感词汇集中第k个所述目标情感词汇的组合情感值,K为正整数,k大于等于1且小于等于K。
6.根据权利要求1所述的文本驱动的三维表情生成方法,其特征在于,采用以下公式计算类别判定参数:
Yki=αiβi
其中,Yki为所述情感词汇集中第k个所述情感词汇所属的第i个情感类别的类别判定参数,αi和βi分别依次表示第k个所述情感词汇在其所属的第i个所述情感类别中对应的所述情感等级和所述极性的值,中性的值0、褒义的值为1,贬义的值为-1,k和i均为正整数。
7.根据权利要求1所述的文本驱动的三维表情生成方法,其特征在于,
在计算所述文本的整体情感值之后,计算所述文本对应的表情向量之前,所述方法还包括:对所述文本的整体情感值进行归一化处理;
采用以下公式计算所述文本对应的表情向量:
F=EF1+(1-E)F2
其中,F为所述文本对应的表情向量,E为归一化处理后的所述文本的整体情感值,F1为所述第一表情向量,F2为所述第二表情向量。
8.根据权利要求7所述的文本驱动的三维表情生成方法,其特征在于,
所述第一表情向量:F1={f11,f21,...,fG1};
所述第二表情向量:F2={f12,f22,...,fG2};
所述文本对应的表情向量:
F={Ef11+(1-E)f12,Ef21+(1-E)f22,...,EfG1+(1-E)fG2};
其中,G为大于1的正整数。
9.根据权利要求1所述的文本驱动的三维表情生成方法,其特征在于,
多个所述情感类别由喜、怒、哀、惧、恶和惊共六类组成。
10.根据权利要求1所述的文本驱动的三维表情生成方法,其特征在于,
对所述文本进行分词,得到所述文本对应的词集的步骤包括:对所述文本进行分词,得到多个词汇;将所述多个词汇中的停用词和生僻词去除,得到所述文本对应的词集;
在所述词集中提取出所述情感词汇的步骤包括:在所述词集中查找预设情感词汇词典中的词,以提取所述情感词汇,其中,所述预设情感词汇词典包括若干所述情感词汇;
在所述词集中提取出修饰每个所述情感词汇的否定词和程度词的步骤包括:在所述词集中查找预设否定词词典中的词,以提取所述否定词;在所述词集中查找预设程度词词典中的词,以提取所述程度词,其中,所述预设否定词词典包括若干所述否定词,所述预设程度词典包括若干所述程度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811055990.3A CN109145306A (zh) | 2018-09-11 | 2018-09-11 | 文本驱动的三维表情生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811055990.3A CN109145306A (zh) | 2018-09-11 | 2018-09-11 | 文本驱动的三维表情生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109145306A true CN109145306A (zh) | 2019-01-04 |
Family
ID=64824746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811055990.3A Pending CN109145306A (zh) | 2018-09-11 | 2018-09-11 | 文本驱动的三维表情生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109145306A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114047851A (zh) * | 2021-11-15 | 2022-02-15 | 北京字跳网络技术有限公司 | 表情处理方法、装置、电子设备、存储介质和产品 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663046A (zh) * | 2012-03-29 | 2012-09-12 | 中国科学院自动化研究所 | 一种面向微博短文本的情感分析方法 |
CN105843796A (zh) * | 2016-03-28 | 2016-08-10 | 北京邮电大学 | 一种微博情感倾向分析方法及装置 |
CN106202584A (zh) * | 2016-09-20 | 2016-12-07 | 北京工业大学 | 一种基于标准词典和语义规则的微博情感分析方法 |
CN106598944A (zh) * | 2016-11-25 | 2017-04-26 | 中国民航大学 | 一种民航安保舆情情感分析方法 |
WO2017101342A1 (zh) * | 2015-12-15 | 2017-06-22 | 乐视控股(北京)有限公司 | 情感分类方法及装置 |
CN107729320A (zh) * | 2017-10-19 | 2018-02-23 | 西北大学 | 一种基于时序分析用户会话情感趋势的表情符号推荐方法 |
-
2018
- 2018-09-11 CN CN201811055990.3A patent/CN109145306A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663046A (zh) * | 2012-03-29 | 2012-09-12 | 中国科学院自动化研究所 | 一种面向微博短文本的情感分析方法 |
WO2017101342A1 (zh) * | 2015-12-15 | 2017-06-22 | 乐视控股(北京)有限公司 | 情感分类方法及装置 |
CN105843796A (zh) * | 2016-03-28 | 2016-08-10 | 北京邮电大学 | 一种微博情感倾向分析方法及装置 |
CN106202584A (zh) * | 2016-09-20 | 2016-12-07 | 北京工业大学 | 一种基于标准词典和语义规则的微博情感分析方法 |
CN106598944A (zh) * | 2016-11-25 | 2017-04-26 | 中国民航大学 | 一种民航安保舆情情感分析方法 |
CN107729320A (zh) * | 2017-10-19 | 2018-02-23 | 西北大学 | 一种基于时序分析用户会话情感趋势的表情符号推荐方法 |
Non-Patent Citations (2)
Title |
---|
刘翠娟: "基于微博文本数据分析的社会群体情感可视计算方法研究", 《北京大学学报》 * |
徐琳宏 等: "情感词汇本体的构造", 《情报学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114047851A (zh) * | 2021-11-15 | 2022-02-15 | 北京字跳网络技术有限公司 | 表情处理方法、装置、电子设备、存储介质和产品 |
CN114047851B (zh) * | 2021-11-15 | 2024-02-06 | 北京字跳网络技术有限公司 | 表情处理方法、装置、电子设备、存储介质和产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jiao et al. | A proposal for Kansei knowledge extraction method based on natural language processing technology and online product reviews | |
Gobron et al. | From sentence to emotion: a real-time three-dimensional graphics metaphor of emotions extracted from text | |
Purchase | Twelve years of diagrams research | |
CN106570496A (zh) | 情绪识别方法和装置以及智能交互方法和设备 | |
Liu et al. | Sentiment recognition for short annotated GIFs using visual-textual fusion | |
CN107491435A (zh) | 基于计算机自动识别用户情感的方法及装置 | |
CN107480136A (zh) | 一种应用于电影剧本中情感曲线分析的方法 | |
Shen et al. | The influence of artificial intelligence on art design in the digital age | |
CN114969282B (zh) | 基于富媒体知识图谱多模态情感分析模型的智能交互方法 | |
Liang | Intelligent emotion evaluation method of classroom teaching based on expression recognition | |
Ruwa et al. | Affective visual question answering network | |
Dzogang et al. | Expressions of graduality for sentiments analysis—A survey | |
Kumamoto | Design of impression scales for assessing impressions of news articles | |
CN109145306A (zh) | 文本驱动的三维表情生成方法 | |
El-Assady et al. | Semantic color mapping: A pipeline for assigning meaningful colors to text | |
Gobron et al. | An Interdisciplinary VR-architecture for 3D Chatting with Non-verbal Communication. | |
Rehm et al. | Culturally aware agent communication | |
Qamar et al. | Emotion detection from text using fuzzy logic | |
Kadir et al. | Transformation of Text-to-3D Graphics | |
O’HALLORAN et al. | Discourse Analysis and Semiotics | |
Pastra et al. | Vision-Language Integration in AI: a reality check | |
Li et al. | Poetry stylistic analysis technique based on term connections | |
Haryanto et al. | Synthesis of Compound Facial Expressions Based on Indonesian Sentences Using Multinomial Naïve Bayes Model and Dominance Threshold Equations. | |
Arief et al. | Emotion Expression xpression xpression of Three Dimensional imensional imensional Face Model Using Naive Bayes and Fuzzy Logic | |
Lyu et al. | Human vs. LMMs: Exploring the Discrepancy in Emoji Interpretation and Usage in Digital Communication |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190104 |