CN108009231B - 一种影视剧本人物情绪识别方法 - Google Patents

一种影视剧本人物情绪识别方法 Download PDF

Info

Publication number
CN108009231B
CN108009231B CN201711225304.8A CN201711225304A CN108009231B CN 108009231 B CN108009231 B CN 108009231B CN 201711225304 A CN201711225304 A CN 201711225304A CN 108009231 B CN108009231 B CN 108009231B
Authority
CN
China
Prior art keywords
emotion
movie
script
score
scores
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711225304.8A
Other languages
English (en)
Other versions
CN108009231A (zh
Inventor
李乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Film & Television Data Evaluation Center Co ltd
Original Assignee
Xi'an Film & Television Data Evaluation Center Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Film & Television Data Evaluation Center Co ltd filed Critical Xi'an Film & Television Data Evaluation Center Co ltd
Priority to CN201711225304.8A priority Critical patent/CN108009231B/zh
Publication of CN108009231A publication Critical patent/CN108009231A/zh
Application granted granted Critical
Publication of CN108009231B publication Critical patent/CN108009231B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/358Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Abstract

本发明公开了一种影视剧本人物情绪识别方法,涉及软件开发技术领域,通过建立合理的技术指标,利用数据挖掘,自然语言处理技术,实现对影视剧本内容自动化进行分析评估,科学、快速、准确的评估结果,大大提高了影视剧本分析评估工作的效率,减少了人力和时间的消耗,降低情感词库的依赖。此外,通过可视化的效果展示评估结果,方便阅读和理解。可视化的效果展示还可促进发现新的技术指标,对影视剧本进行进一步的深入分析,提升影视剧本分析评估的深度和广度,促进影视剧本创作质量和市场价值的提高。

Description

一种影视剧本人物情绪识别方法
技术领域
本发明涉及软件开发技术领域,特别是涉及一种影视剧本人物情绪识别方法。
背景技术
在影视剧本中,人物情绪识别技术目前主要采用人工阅读剧本、分析影视剧本人物情绪的变化、结合专家评估意见进行人物情绪识别。由于人物情绪表现复杂度高,细粒度非常强,识别难度较大,受评估分析人员的主观喜好、文学修养、教育背景等影响比较大,针对同一种剧本的人物情绪识别结果存在比较大的差异;利用剧本主题、情感词、情绪词库等特征作为情绪识别的依据,甚至有可能得到完全相反的结论。
在分析影视剧本人物情绪模型的过程中,需要考虑情绪词库,进行影视剧本的情绪匹配。这种利用情绪词库的情绪识别技术在准确度上依赖于词库的质量和词库大小,在时间方面消耗较大,且由于主观影响,不同人对语料库的标注产生不同信息,影响分类的结果。
此外评估过程还需要与剧本作者、专家或业内人士进行深入沟通,需要不断进行文字修改和完善评估报告,评估中的数据和基于数据生成的图表不断变化,导致评估过程整体效率不高。
通过以上分析,可以看出现有的影视剧本中人物情绪识别技术存在以下的弊端:
a.评估过程和评估报告受评估人员影响比较大,缺乏标准。
b.获取数据和分析数据需要消耗大量人力和时间成本。
c.缺乏合适的数据处理工具,评估工作整体效率不高。
d.严重依赖情绪词库的判断,对情绪词库的质量要求很高。
发明内容
本发明实施例提供了一种影视剧本人物情绪识别方法,可以解决现有技术中存在的问题。
本发明提供了一种影视剧本人物情绪识别方法,该方法包括以下步骤:
步骤1,对影视剧本的文本数据进行预处理,将多行数据的对白转换为一行,形成一人一句的对白数据;
步骤2,特征提取,获取情绪得分,该步骤具体包括:
(1)通过分词计算步骤1预处理过的每一句剧本的得分,得到剧本情绪得分指标,并提取相应的人物形成人物列表;
(2)根据剧本内容计算文本情绪得分,建立情绪得分表,形成情绪得分字段表;
(3)对情绪得分实现聚类分析,将得分持续处于某一阈值段的情绪得分打上标签;
(4)根据标签、得分形成情绪标签库;
(5)对情绪标签库和情绪标签做关联,形成改造后的对白情绪标签库;
(6)计算场景数量,作为影视剧本拍摄难度指标;
(7)根据场景、剧集、情绪标签、人物列表实现字段关联,得到最终的情绪得分。
优选地,所述方法还包括:将步骤2中的计算结果以可视化方式进行展现。
本发明实施例中的一种影视剧本人物情绪识别方法,根据专家评估的经验和依据,数字化的解读,建立情绪识别模型,以剧本对话内容作为数据分析对象,以情绪得分作为分析指标,利用情绪模型识别方法,实现影视剧本中人物情绪的定量和定性分析。
通过提取情绪分析指标进行定量分析可达到以下目的:
a.建立情绪得分指标,进行影视剧本的数字化分析,减少词库和人为因素对评估结果的干扰。
b.使用软件技术实现分析指标的快速计算,获取情绪得分数据、生成图表,减少人工分析评估的工作量、提高数据的准确性。
c.优化情绪得分分析指标,发现数据之间的内在联系,获取更多的评估结论,达到分析评估精细化、准确化的目的。
d.通过建立在情绪模型上的可视化信息展示方式,准确识别情绪,研究新的分析评估方法。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种影视剧本人物情绪识别方法,该方法包括以下步骤:
步骤1,对影视剧本的文本数据进行预处理,将多行数据的对白转换为一行,形成一人一句的对白数据;
步骤2,特征提取,获取情绪得分,该步骤具体包括:
(1)通过分词计算步骤1预处理过的每一句剧本的得分,得到剧本情绪得分指标,并提取相应的人物形成人物列表;
(2)根据剧本内容计算文本情绪得分,建立情绪得分表,形成情绪得分字段表;
(3)对情绪得分实现聚类分析,将得分持续处于某一阈值段的情绪得分打上标签;
(4)根据标签、得分形成情绪标签库;
(5)对情绪标签库和情绪标签做关联,形成改造后的对白情绪标签库;
(6)计算场景数量,作为影视剧本拍摄难度指标;
(7)根据场景、剧集、情绪标签、人物列表实现字段关联,得到最终的情绪得分。
步骤3,将步骤2中的计算结果以可视化方式进行展现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程来描述的。应理解可由计算机程序指令实现每一流程以及流程的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在一个流程或多个流程中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在一个流程或多个流程中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在一个流程或多个流程中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (2)

1.一种影视剧本人物情绪识别方法,其特征在于,该方法包括以下步骤:
步骤1,对影视剧本的文本数据进行预处理,将多行数据的对白转换为一行,形成一人一句的对白数据;
步骤2,特征提取,获取情绪得分,该步骤具体包括:
(1)通过分词计算步骤1预处理过的每一句剧本的得分,得到剧本情绪得分指标,并提取相应的人物形成人物列表;
(2)根据剧本内容计算文本情绪得分,建立情绪得分表,形成情绪得分字段表;
(3)对情绪得分实现聚类分析,将得分持续处于某一阈值段的情绪得分打上标签;
(4)根据标签、得分形成情绪标签库;
(5)对情绪标签库和情绪标签做关联,形成改造后的对白情绪标签库;
(6)计算场景数量,作为影视剧本拍摄难度指标;
(7)根据场景、剧集、情绪标签、人物列表实现字段关联,得到最终的情绪得分。
2.如权利要求1所述的影视剧本人物情绪识别方法,其特征在于,所述方法还包括:将步骤2中的计算结果以可视化方式进行展现。
CN201711225304.8A 2017-11-29 2017-11-29 一种影视剧本人物情绪识别方法 Active CN108009231B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711225304.8A CN108009231B (zh) 2017-11-29 2017-11-29 一种影视剧本人物情绪识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711225304.8A CN108009231B (zh) 2017-11-29 2017-11-29 一种影视剧本人物情绪识别方法

Publications (2)

Publication Number Publication Date
CN108009231A CN108009231A (zh) 2018-05-08
CN108009231B true CN108009231B (zh) 2021-05-18

Family

ID=62054725

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711225304.8A Active CN108009231B (zh) 2017-11-29 2017-11-29 一种影视剧本人物情绪识别方法

Country Status (1)

Country Link
CN (1) CN108009231B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346327A (zh) * 2014-10-23 2015-02-11 苏州大学 一种文本情绪复杂度的确定方法及装置
CN104504112A (zh) * 2014-12-30 2015-04-08 何业文 影院信息采集系统
CN104536953A (zh) * 2015-01-22 2015-04-22 苏州大学 一种文本情绪极性的识别方法及装置
CN105893582A (zh) * 2016-04-01 2016-08-24 深圳市未来媒体技术研究院 一种社交网络用户情绪判别方法
CN106658129A (zh) * 2016-12-27 2017-05-10 上海智臻智能网络科技股份有限公司 基于情绪的终端控制方法、装置及终端
CN107392423A (zh) * 2017-06-13 2017-11-24 中国传媒大学 基于智能标签的剧本评价系统及评价方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7272575B2 (en) * 2001-07-13 2007-09-18 Lilly Mae Vega Method and system for facilitating service transactions

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346327A (zh) * 2014-10-23 2015-02-11 苏州大学 一种文本情绪复杂度的确定方法及装置
CN104504112A (zh) * 2014-12-30 2015-04-08 何业文 影院信息采集系统
CN104536953A (zh) * 2015-01-22 2015-04-22 苏州大学 一种文本情绪极性的识别方法及装置
CN105893582A (zh) * 2016-04-01 2016-08-24 深圳市未来媒体技术研究院 一种社交网络用户情绪判别方法
CN106658129A (zh) * 2016-12-27 2017-05-10 上海智臻智能网络科技股份有限公司 基于情绪的终端控制方法、装置及终端
CN107392423A (zh) * 2017-06-13 2017-11-24 中国传媒大学 基于智能标签的剧本评价系统及评价方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于脑电信号的情绪识别研究;苏建新;《中国优秀硕士学位论文全文数据库·信息科技辑》;20160515;全文 *

Also Published As

Publication number Publication date
CN108009231A (zh) 2018-05-08

Similar Documents

Publication Publication Date Title
CN110147726B (zh) 业务质检方法和装置、存储介质及电子装置
Zhao et al. Temporal action detection with structured segment networks
US20190035431A1 (en) Apparatus, systems, and methods for integrating digital media content
Angelova et al. Image segmentation for large-scale subcategory flower recognition
MX2016003981A (es) Metodo y dispositivo para capacitar un clasificador, reconocimiento de tipo.
CN108182175B (zh) 一种文本质量指标获取方法及装置
CN104503998B (zh) 针对用户查询句的类型识别方法及装置
CN107943865A (zh) 一种适用于多场景、多类型的音频分类标签方法及系统
CN110705286A (zh) 一种基于评论信息的数据处理方法及装置
CN104850617B (zh) 短文本处理方法及装置
CN104915420B (zh) 知识库数据处理方法及系统
US20190073354A1 (en) Text segmentation
CN106649270A (zh) 舆情监测分析方法
CN111159332A (zh) 一种基于bert的文本多意图识别方法
CN110569502A (zh) 一种违禁广告语的识别方法、装置、计算机设备及存储介质
CN107885723A (zh) 对话角色区分方法和系统
CN111914760B (zh) 一种在线课程视频资源构成的解析方法及系统
CN107766565A (zh) 对话角色区分方法与系统
Wu et al. A surface defect detection based on convolutional neural network
CN108563688B (zh) 一种影视剧本人物情绪识别方法
CN110689018A (zh) 一种智能阅卷系统及其处理方法
CN116415017A (zh) 基于人工智能的广告敏感内容审核方法及系统
CN114639152A (zh) 基于人脸识别的多模态语音交互方法、装置、设备及介质
CN116860706B (zh) 一种实验数据文本存储方法及系统
Gu et al. Deepfake video detection using audio-visual consistency

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant