CN108549630A - 一种影视剧本故事翻转点的识别方法 - Google Patents

一种影视剧本故事翻转点的识别方法 Download PDF

Info

Publication number
CN108549630A
CN108549630A CN201810269004.8A CN201810269004A CN108549630A CN 108549630 A CN108549630 A CN 108549630A CN 201810269004 A CN201810269004 A CN 201810269004A CN 108549630 A CN108549630 A CN 108549630A
Authority
CN
China
Prior art keywords
emotion
drama
label
story
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810269004.8A
Other languages
English (en)
Other versions
CN108549630B (zh
Inventor
李乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Film And Television Data Evaluation Center Co Ltd
Original Assignee
Xi'an Film And Television Data Evaluation Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Film And Television Data Evaluation Center Co Ltd filed Critical Xi'an Film And Television Data Evaluation Center Co Ltd
Priority to CN201810269004.8A priority Critical patent/CN108549630B/zh
Publication of CN108549630A publication Critical patent/CN108549630A/zh
Application granted granted Critical
Publication of CN108549630B publication Critical patent/CN108549630B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种影视剧本故事翻转点的识别方法,通过建立语料库,情感模型,测试语料库,将剧本内容进行分行处理后,通过机器学习形成情感模型,得到情感标签库,根据情感得分进行傅里叶变换,对细微的故事反转进行判断。通过上述方式,本发明提供一种影视剧本故事翻转点的识别方法,通过自然语言处理技术和文本挖掘算法,分析整个剧本的情感表达以及人物情感变化,并利用情感的波动准确识别影视剧剧本中的故事场景反转、剧本矛盾冲突以及剧本定位,有效提高影视剧本故事场景反转点识别的效率和准确度,方便进行人物情感、故事反转点,矛盾冲突等进行分析。

Description

一种影视剧本故事翻转点的识别方法
技术领域
本发明涉及软件开发领域,尤其涉及一种影视剧本故事翻转点的识别方法。
背景技术
影视剧本的分析评估中涉及到对人物分析,人物名称分散在剧本内容中,常见的剧本中可能包括中文姓名、汉语译名,外文名、称呼名、省略名等,目前剧本中的人物提取主要通过人工阅读做记录来提取,存在以下弊端:
a.影视剧本中单独分析相应的语句判断相应的故事翻转存在一定的错误判断,准确率不高。
b.剧本故事翻转都是基于词库对文本做出判断,大都是基于形容词的判断,在判断语句情感中忽略了其他词性词语对文本情感的贡献。
c.故事翻转依赖种子词语集合的个数和种子词语的质量。
d.故事翻转采用评价词语,但是评价词语在大语料库中分布等现象不容易归纳。
发明内容
本发明主要解决的技术问题是提供一种影视剧本故事翻转点的识别方法,通过自然语言处理技术和文本挖掘算法,分析整个剧本的情感表达以及人物情感变化,并利用情感的波动准确识别影视剧剧本中的故事场景反转、剧本矛盾冲突以及剧本定位,有效提高影视剧本故事场景反转点识别的效率和准确度,方便进行人物情感、故事反转点,矛盾冲突等进行分析。通过建立语料库,情感模型,测试语料库,将剧本内容进行分行处理后,通过机器学习形成情感模型,得到情感标签库,根据情感得分进行傅里叶变换,对细微的故事反转进行判断。使用本发明的方法提高了剧本故事翻转点的识别,以及人物矛盾冲突的识别和剧本诊断分析的速度,节约了专家评估的时间。同时在剧本中定位出故事翻转点,还可用于影视剧本中大故事,小故事,人物命运的判断与识别。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种影视剧本故事翻转点的识别方法,包括以下步骤:
步骤一:提取影视剧本中的对白句,将对白句进行中文分词,根据中文分词构建初始语料库;
步骤二:按打分模型为初始语料库内的语料打分,向初始语料库追加评分项,构建学习语料库,所述打分模型为词性模型或语法模型;
步骤三:根据学习语料库内的语料评分,以人工方式对部分对白句添加专家评价标签,构建测试语料库;
步骤四:读取影视剧本的对白信息,构建情感模型,以测试语料库中的专家评价标签为标准,对情感模型进行准确性评价检测,获得情感模型准确率结果;
步骤五:对准确率低于设定阈值的情感模型进行参数调优,使情感模型准确率趋近于测试语料库;
步骤六:根据情感表现类型和情感强度对测试语料库中未匹配标签的语料,使用机器学习中的标签技术,基于情感模型,添加以正、负评分数值表示的标签以及得分值,构建情感标签语料库;
步骤七:读取情感标签语料库中的每个对白句的标签及得分,对得分进行傅里叶变换生成情感得分走势图,对相邻标签值出现正负相异的交错位置进行标记,标记点记为情感反转点;
步骤八:读取全部情感反转点信息,为每个情感反转点关联原始剧本内容位置,构建出情感反转点信息表;
步骤九:读取情感反转点信息表,将满足阈值条件的标签合并为情节点标签,将情节点标签值正负相异的交错位置定义为情节反转点;
步骤十:读取情节反转点信息,将包括在设定阈值范围内的情节点标签合并为故事翻转点标签,为每个故事翻转点标签关联原始剧本内容位置,构建出故事翻转点信息表。
本发明的有益效果是:本发明提供的一种影视剧本故事翻转点的识别方法,通过自然语言处理技术和文本挖掘算法,分析整个剧本的情感表达以及人物情感变化,并利用情感的波动准确识别影视剧剧本中的故事场景反转、剧本矛盾冲突以及剧本定位,有效提高影视剧本故事场景反转点识别的效率和准确度,方便进行人物情感、故事反转点,矛盾冲突等进行分析。通过建立语料库,情感模型,测试语料库,将剧本内容进行分行处理后,通过机器学习形成情感模型,得到情感标签库,根据情感得分进行傅里叶变换,对细微的故事反转进行判断。使用本发明的方法提高了剧本故事翻转点的识别,以及人物矛盾冲突的识别和剧本诊断分析的速度,节约了专家评估的时间。同时在剧本中定位出故事翻转点,还可用于影视剧本中大故事,小故事,人物命运的判断与识别。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明实施例包括:
一种影视剧本故事翻转点的识别方法,包括以下步骤:
步骤一:提取影视剧本中的对白句,将对白句进行中文分词,根据中文分词构建初始语料库;
步骤二:按打分模型为初始语料库内的语料打分,向初始语料库追加评分项,构建学习语料库,所述打分模型为词性模型或语法模型;
步骤三:根据学习语料库内的语料评分,以人工方式对部分对白句添加专家评价标签,构建测试语料库;
步骤四:读取影视剧本的对白信息,构建情感模型,以测试语料库中的专家评价标签为标准,对情感模型进行准确性评价检测,获得情感模型准确率结果;
步骤五:对准确率低于设定阈值的情感模型进行参数调优,使情感模型准确率趋近于测试语料库;
步骤六:根据情感表现类型和情感强度对测试语料库中未匹配标签的语料,使用机器学习中的标签技术,基于情感模型,添加以正、负评分数值表示的标签以及得分值,构建情感标签语料库;
步骤七:读取情感标签语料库中的每个对白句的标签及得分,对得分进行傅里叶变换生成情感得分走势图,对相邻标签值出现正负相异的交错位置进行标记,标记点记为情感反转点;
步骤八:读取全部情感反转点信息,为每个情感反转点关联原始剧本内容位置,构建出情感反转点信息表;
步骤九:读取情感反转点信息表,将满足阈值条件的标签合并为情节点标签,将情节点标签值正负相异的交错位置定义为情节反转点;
步骤十:读取情节反转点信息,将包括在设定阈值范围内的情节点标签合并为故事翻转点标签,为每个故事翻转点标签关联原始剧本内容位置,构建出故事翻转点信息表。
综上所述,本发明提供了一种影视剧本故事翻转点的识别方法,通过自然语言处理技术和文本挖掘算法,分析整个剧本的情感表达以及人物情感变化,并利用情感的波动准确识别影视剧剧本中的故事场景反转、剧本矛盾冲突以及剧本定位,有效提高影视剧本故事场景反转点识别的效率和准确度,方便进行人物情感、故事反转点,矛盾冲突等进行分析,通过建立语料库,情感模型,测试语料库,将剧本内容进行分行处理后,通过机器学习形成情感模型,得到情感标签库,根据情感得分进行傅里叶变换,对细微的故事反转进行判断。使用本发明的方法提高了剧本故事翻转点的识别,以及人物矛盾冲突的识别和剧本诊断分析的速度,节约了专家评估的时间。同时在剧本中定位出故事翻转点,还可用于影视剧本中大故事,小故事,人物命运的判断与识别。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (1)

1.一种影视剧本故事翻转点的识别方法,其特征在于,包括以下步骤:
步骤一:提取影视剧本中的对白句,将对白句进行中文分词,根据中文分词构建初始语料库;
步骤二:按打分模型为初始语料库内的语料打分,向初始语料库追加评分项,构建学习语料库,所述打分模型为词性模型或语法模型;
步骤三:根据学习语料库内的语料评分,以人工方式对部分对白句添加专家评价标签,构建测试语料库;
步骤四:读取影视剧本的对白信息,构建情感模型,以测试语料库中的专家评价标签为标准,对情感模型进行准确性评价检测,获得情感模型准确率结果;
步骤五:对准确率低于设定阈值的情感模型进行参数调优,使情感模型准确率趋近于测试语料库;
步骤六:根据情感表现类型和情感强度对测试语料库中未匹配标签的语料,使用机器学习中的标签技术,基于情感模型,添加以正、负评分数值表示的标签以及得分值,构建情感标签语料库;
步骤七:读取情感标签语料库中的每个对白句的标签及得分,对得分进行傅里叶变换生成情感得分走势图,对相邻标签值出现正负相异的交错位置进行标记,标记点记为情感反转点;
步骤八:读取全部情感反转点信息,为每个情感反转点关联原始剧本内容位置,构建出情感反转点信息表;
步骤九:读取情感反转点信息表,将满足阈值条件的标签合并为情节点标签,将情节点标签值正负相异的交错位置定义为情节反转点;
步骤十:读取情节反转点信息,将包括在设定阈值范围内的情节点标签合并为故事翻转点标签,为每个故事翻转点标签关联原始剧本内容位置,构建出故事翻转点信息表。
CN201810269004.8A 2018-03-29 2018-03-29 一种影视剧本故事翻转点的识别方法 Active CN108549630B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810269004.8A CN108549630B (zh) 2018-03-29 2018-03-29 一种影视剧本故事翻转点的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810269004.8A CN108549630B (zh) 2018-03-29 2018-03-29 一种影视剧本故事翻转点的识别方法

Publications (2)

Publication Number Publication Date
CN108549630A true CN108549630A (zh) 2018-09-18
CN108549630B CN108549630B (zh) 2021-07-30

Family

ID=63517289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810269004.8A Active CN108549630B (zh) 2018-03-29 2018-03-29 一种影视剧本故事翻转点的识别方法

Country Status (1)

Country Link
CN (1) CN108549630B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324662A (zh) * 2013-04-18 2013-09-25 中国科学院计算技术研究所 社会媒体事件的动态观点演变的可视化方法及设备
CN104636425A (zh) * 2014-12-18 2015-05-20 北京理工大学 一种网络个体或群体情绪认知能力预测与可视化方法
CN105512111A (zh) * 2015-06-23 2016-04-20 崔笑言 一种关键词分析法及其应用
CN106250379A (zh) * 2015-06-08 2016-12-21 中外名人文化产业集团有限公司 中国电视剧剧本数据分析法
US20170031941A1 (en) * 2015-04-27 2017-02-02 International Business Machines Corporation Database storage reclaiming program
CN107368965A (zh) * 2017-07-18 2017-11-21 杭州火剧科技有限公司 一种剧本数据处理方法、装置及应用其的计算机设备
CN107392423A (zh) * 2017-06-13 2017-11-24 中国传媒大学 基于智能标签的剧本评价系统及评价方法
CN107480136A (zh) * 2017-08-02 2017-12-15 陈雷 一种应用于电影剧本中情感曲线分析的方法
CN107766330A (zh) * 2017-10-25 2018-03-06 西安影视数据评估中心有限公司 一种进行影视剧本质量分析的系统及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324662A (zh) * 2013-04-18 2013-09-25 中国科学院计算技术研究所 社会媒体事件的动态观点演变的可视化方法及设备
CN104636425A (zh) * 2014-12-18 2015-05-20 北京理工大学 一种网络个体或群体情绪认知能力预测与可视化方法
US20170031941A1 (en) * 2015-04-27 2017-02-02 International Business Machines Corporation Database storage reclaiming program
CN106250379A (zh) * 2015-06-08 2016-12-21 中外名人文化产业集团有限公司 中国电视剧剧本数据分析法
CN105512111A (zh) * 2015-06-23 2016-04-20 崔笑言 一种关键词分析法及其应用
CN107392423A (zh) * 2017-06-13 2017-11-24 中国传媒大学 基于智能标签的剧本评价系统及评价方法
CN107368965A (zh) * 2017-07-18 2017-11-21 杭州火剧科技有限公司 一种剧本数据处理方法、装置及应用其的计算机设备
CN107480136A (zh) * 2017-08-02 2017-12-15 陈雷 一种应用于电影剧本中情感曲线分析的方法
CN107766330A (zh) * 2017-10-25 2018-03-06 西安影视数据评估中心有限公司 一种进行影视剧本质量分析的系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张小倩: "情感极性转移现象研究及应用", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
赵志诚: "故事视频的语义分析与提取", 《中国博士学位论文全文数据库信息科技辑》 *

Also Published As

Publication number Publication date
CN108549630B (zh) 2021-07-30

Similar Documents

Publication Publication Date Title
Group MIP: A method for identifying metaphorically used words in discourse
Winford Back to the past: The BEV/creole connection revisited
House Translation quality assessment: A model revisited
Jarvis Comparison-based and detection-based approaches to transfer research
CN110287319B (zh) 基于情感分析技术的学生评教文本分析方法
Rah et al. Processing of the reduced relative clause versus main verb ambiguity in L2 learners at different proficiency levels
CN104503998B (zh) 针对用户查询句的类型识别方法及装置
CN108170660A (zh) 多语言排版的显示方法、装置、浏览器、终端及介质
CN104317882B (zh) 一种决策级中文分词融合方法
CN109460552A (zh) 基于规则和语料库的汉语语病自动检测方法及设备
CN111143531A (zh) 一种问答对构建方法、系统、装置及计算机可读存储介质
Korecky-Kröll et al. Morphonotactic and phonotactic processing in German-speaking adults
Wang et al. Automatic plagiarism detection for spoken responses in an assessment of english language proficiency
CN107894976A (zh) 一种基于Bi‑LSTM的混合语料分词方法
Prakash et al. Mining of bilingual Indian Web documents
Koda How to do research on second language reading
CN112015882A (zh) 文言文题目自动生成方法和系统
CN108549630A (zh) 一种影视剧本故事翻转点的识别方法
JP2019510301A (ja) トピックを区別するための方法及び機器
CN110705306A (zh) 一种作文文题一致性的测评方法
Wang et al. Application of an automatic plagiarism detection system in a large-scale assessment of English speaking proficiency
CN106844333A (zh) 一种基于语义及语法结构的语句分析方法及系统
Jaspers The colour of Dutch: Some limits and opportunities of identifying Dutch ethnolects
Sharif et al. An effective hybrid approach based on machine learning techniques for auto-translation: Japanese to English
Alsudais Image classification in Arabic: exploring direct English to Arabic translations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A method for identifying turning points of film and television script stories

Effective date of registration: 20220606

Granted publication date: 20210730

Pledgee: Xi'an investment and financing Company limited by guarantee

Pledgor: XI'AN FILM & TELEVISION DATA EVALUATION CENTER CO.,LTD.

Registration number: Y2022610000299

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Granted publication date: 20210730

Pledgee: Xi'an investment and financing Company limited by guarantee

Pledgor: XI'AN FILM & TELEVISION DATA EVALUATION CENTER CO.,LTD.

Registration number: Y2022610000299