CN111368523A - 一种影视剧本排版格式转换方法及装置 - Google Patents

一种影视剧本排版格式转换方法及装置 Download PDF

Info

Publication number
CN111368523A
CN111368523A CN201811597410.3A CN201811597410A CN111368523A CN 111368523 A CN111368523 A CN 111368523A CN 201811597410 A CN201811597410 A CN 201811597410A CN 111368523 A CN111368523 A CN 111368523A
Authority
CN
China
Prior art keywords
user
format
movie
script
typesetting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811597410.3A
Other languages
English (en)
Inventor
于子朔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiatai Technology Beijing Co ltd
Original Assignee
Jiatai Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiatai Technology Beijing Co ltd filed Critical Jiatai Technology Beijing Co ltd
Priority to CN201811597410.3A priority Critical patent/CN111368523A/zh
Publication of CN111368523A publication Critical patent/CN111368523A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)

Abstract

本发明公开了一种影视剧本排版格式转换方法及装置。该方法中可以通过排版格式识别,分析用户的影视剧本文档,得到预处理文件;而后根据用户对排版格式的期望,调取与用户期望相匹配的排版格式预置;进而利用调取的排版格式预置对预处理文件进行处理,得到符合用户排版格式期望的影视剧本文档。根据本发明,可以不必对影视剧本可能出现的各种排版格式转换操作分别进行检测并做出相应的处理,而是通过统一的排版格式转换技术方案对其进行整体转换,实施复杂度低并且响应速度快。

Description

一种影视剧本排版格式转换方法及装置
技术领域
本发明涉及软件开发技术领域,更具体地,涉及一种文档排版格式转换的方法及装置,尤其是影视剧本排版格式的转换。
背景技术
影视剧本作为一种文字作品类型,在排版格式上有自身的特殊性。一部影视剧本通常包含六种剧本组成元素:场景、动作、人物、对话、注释、转场。为了方便写作、阅读及使用,通常需要分别对这六种剧本组成元素的排版(包括字体、字号、颜色、字距、行距、文字样式、文字位置、段落缩进、段距、段落样式、段落位置以及其他排版参数和属性)进行设置,从而形成一种便于写作、阅读及使用的排版格式。这种排版格式被影视行业称之为“剧本格式”。影视行业发展到目前为止,可知的影视剧本格式包括:“好莱坞剧本格式”、“大陆剧本格式”、“中国台湾剧本格式”、“香港剧本格式”、“小说格式”以及影视剧本作者按照个人习惯形成的大量“个人格式”。各不相同的剧本格式给持有不同剧本格式习惯的人造成了阅读及使用上的困难,影响了工作效率。因此,为了满足不同人群对剧本格式的要求,需要对影视剧本的排版格式进行一次或者多次的转换和调整。
目前,解决影视剧本排版格式转换的途径包括:(1)安装在电脑端以及手机、Pad等移动端的文本类客户端应用软件,如 Office Word、WPS等;(2)被称为云文档、Saas的文本类云端应用软件,如石墨文档等。就目前而言,无论是客户端应用软件还是云端应用软件,实施影视剧本排版格式转换可采用的方法包括:
1.通过人工,对影视剧本文档中的所有内容逐一检查,找出影视剧本文档所包含的每一个剧本组成元素,并分别标注为一种样式,然后对所标注的每一种样式进行逐一设置,从而完成整个转换操作;
2.通过预先收集或设置,得到某种剧本排版格式的文档模板,然后通过人工,对影视剧本文档中的所有内容逐一检查,找出影视剧本文档中所包含的每一个剧本组成元素,并通过文档模板中预设的样式,对每一个剧本组成元素实施转换,从而完成整个转换操作。
从上述的两种方法至少可以看出两点明显不足:
1.无论采用方法1还是方法2,找出影视剧本文档中所有的剧本组成元素必须通过人工,对整个影视剧本内容进行逐一判断、认定,而一部影视剧本的组成元素少则几千多则几十万,对于现有的方法而言,工作量庞大、实施复杂度高而且容易出错,尤其是在需要将影视剧本文档转换成多种排版格式时,劣势更为突出;
2.无论采用方法1还是方法2,在剧本组成元素确定之后,对剧本组成元素的排版实施转换的过程同样存在效率不高而且容易出错的问题。
因此,发明人认为,有必要针对影视剧本排版格式转换,发明一种便捷、高效的方法及装置。
发明内容
本发明的一个目的是提供一种影视剧本排版格式转换的新技术方案,用以解决现有技术下,影视剧本排版格式转换的方法实施复杂度高、效率低、容易出错的问题。
本发明所提出的新技术方案具体表现在两个方面。
第一方面,本发明提出了一种影视剧本排版格式转换方法,实施步骤包括:
通过排版格式识别,分析用户的影视剧本文档,得到预处理文件;
根据用户对排版格式的期望,调取与用户期望相匹配的排版格式预置;
利用调取的排版格式预置对预处理文件进行处理,得到符合用户排版格式期望的影视剧本文档。
第二方面,本发明提出了一种影视剧本排版格式转换装置,该装置用于实现第一方面所述的任意一项影视剧本排版格式转换方法,该装置包括:
1,排版格式识别单元,用于识别和分析用户的影视剧本文档;
2,预处理单元,用于将排版格式识别单元的分析结果和用户的影视剧本文档的文本内容编译或打包成预处理文件;
3,中央处理单元,用于响应用户指令、调度本装置内的各个单元以及负责与本装置外的程序、软件、元件或设备进行交互;
4,排版格式转换单元,用于执行排版格式的转换操作,并生成符合用户排版格式期望的影视剧本文档;
5,数据单元,用于存储排版格式预置,以及本装置所产生的或所需要的数据;
6,显示单元,用于展示本装置的运行,提供本装置与用户之间的交互界面;
7,排版格式训练单元,通过用户使用本装置时所产生的行为、动作和数据,对本装置的各单元进行训练,提升本装置的能力和效率。
本发明人发现,在现有的技术中,尚未存在一种影视剧本排版格式转换的方法或装置可以不必分别针对影视剧本的每一个剧本组成元素(包括场景、动作、人物、对话、注释、转场等)逐一查找并进行转换操作,而是通过一套整体的排版格式转换技术方案完成影视剧本的排版格式转换,转换过程实施复杂度低、响应速度快。因此,本发明所要实现的技术任务或者所要解决的技术问题是本领域技术人员从未想到的或者没有预期到的,故本发明是一种新的技术方案。
下面,结合本说明书的附图对本发明的示例性实施例进行详细描述,以便更清晰地解释本发明。
附图说明
为了更清晰地解释实施例中的技术方案,现在对实施例中所需要使用的附图做简单的介绍。在附图中:
图1是通过本发明实现影视剧本排版格式转换的一个实例示意图;
图2是本发明提出的影视剧本排版格式转换方法的实现过程流程图;
图3是本发明提出的影视剧本排版格式转换方法的一个具体实施逻辑图;
图4是本发明提出的影视剧本排版格式转换装置的示意性架构图。
具体实施方式
现在,参照附图详细阐述本发明的各个示例性实施例。需要指出的是,本说明书的示例性实施例及其说明和附图仅仅是示例性地用于解释本说明书,绝不构成对本发明以及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备一般不作详解,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
本说明书中的所有示例性实施例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。
在本发明所提出的技术方案中,用户可以根据自己对影视剧本排版格式的期望,通过本发明所提出的影视剧本排版格式转换方法或装置,对影视剧本文档的排版格式进行转换,从而得到符合用户排版格式期望的影视剧本文档,如图1所示。
图1是通过本发明实现影视剧本排版格式转换的一个实例示意图。图1展示了一个示例性实施例:用户通过本发明所提出的影视剧本排版格式转换方法或装置将“大陆剧本格式”的影视剧本文档转换为“好莱坞剧本格式”的影视剧本文档。
从图1可以看出,S101大陆剧本格式的影视剧本文档片段经过S102本发明所提出的影视剧本排版格式转换方法或装置进行排版格式转换,并转换成S103好莱坞格式的影视剧本文档片段之后,剧本文档的排版格式发生了显著变化,包括:
1. 字号、段落位置、段距等设置,在S103中,所有段落的文字都是同一字号,而转换后的S103,根据“好莱坞剧本格式”的规范,场景段落的字号发生了改变,另外,人物段落“原始人A”以及对话段落“我们究竟还要走多久”的段落位置和段距也根据“好莱坞剧本格式”的规范做了相应调整;
2. 规范措辞及符号,S101中的场景用语“一大早”在 S103中被替换成了规范措辞“清晨”,S101中的场景用语“外景”在 S103中被替换成了规范措辞“外”,并且根据“好莱坞剧本格式”的规范,为场景段落添加了两处规范化的分节符“.”和“-”;
3. 词组排列顺序,场景段落的词组排列顺序也根据“好莱坞剧本格式”的规范作了相应调整,将词组顺序“远古雪原”-“一大早”-“外景”调整为“外.”-“远古雪原”-“清晨”。
为了更详细地展示本发明的实施,下面从影视剧本排版格式转换方法、影视剧本排版格式转换装置两个方面分别说明。
<一种影视剧本排版格式转换方法>
图2是本发明提出的影视剧本排版格式转换方法的实现过程流程图,步骤如下。
S201:通过排版格式识别,分析用户的影视剧本文档,得到预处理文件。
在本实施例中,用户的影视剧本文档可以是通过剧本软件、文本编辑软件或者文本编辑器编辑或者呈现的文字作品,其介质包括但不限于纯文本、富文本、PDF、图片以及文本类软件或剧本类软件的格式文件。
在S201中,分析用户的影视剧本文档是通过字符编码(Text recognition)、 OCR(Optical Character Recognition)、语义分析(Semantic Analysis)及其他相关技术实现,通过上述各项技术,对用户的影视剧本文档实施识别、分析。具体实施包括以下两方面。
第一方面,通过排版格式识别,对影视剧本文档的文字进行分析。
针对用户的影视剧本文档在文字呈现上所表现出的特征,如:字体、字号、文字颜色、字距、行距、文字样式、文字位置、段落缩进、段距、段落样式、段落位置以及其他排版参数和属性进行识别、分析,找出用户的影视剧本文档中每一个段落或者单元属于哪一种剧本组成元素(剧本组成元素包括但不限于:场景、动作、人物、对话、注释、转场),并生成对应数据。
第二方面,通过排版格式识别,对影视剧本文档进行语义分析。
针对用户的影视剧本文档在语义层面所表现出的特征,如“外景”、“内景”、“白天”、“晚上”等剧本特性关键词和关键语句进行识别,通过分析,找到包含剧本特性关键词和关键语句的文本内容与剧本组成元素之间的对应关系,并生成对应数据。
在S201中,得到预处理文件的实施,是在上述通过排版格式识别对影视剧本文档的文字进行分析和对影视剧本文档进行语义分析的基础之上,将分析结果和影视剧本文档的文本内容通过数据编译或数据打包等技术生成一个预处理文件。
S202:根据用户对排版格式的期望,调取与用户期望相匹配的排版格式预置。
排版格式预置是一种预先收集并处理的影视剧本排版格式数据包,每一种影视剧本排版格式对应一个排版格式预置,排版格式预置将与之对应的影视剧本排版格式的剧本组成元素做了设定,包括但不限于:字体、字号、颜色、字距、行距、文字样式、文字位置、段落缩进、段距、段落样式、段落位置以及其他排版参数和属性。例如,“大陆剧本格式”的排版格式预置中,剧本组成元素“人物”的文字样式是“标准”,段落位置是“0”。而“好莱坞剧本格式”的排版格式预置中,剧本组成元素“人物”的文字样式是“加粗”,段落位置是“192”。
当用户选择了某一个排版格式预置,本方法将调取此预置的数据。
在本发明中,步骤S202可以通过至少两种方式实施。
方式1:通过列表、选项等选择界面,向用户展示预先收集或用户自定义的排版格式预置,供用户对排版格式的期望进行选择,如“好莱坞剧本格式”、“大陆剧本格式”、“香港剧本格式”,当用户在列表或选项中选中某种排版格式预置之后,本方法调取与之对应的排版格式预置。
方式2:不向用户提供列表、选项等选择界面,而是将预先收集或用户自定义的排版格式预置通过设计,形成一种循环排列规则,然后利用传感技术,通过用户的动作或行为来感知和执行用户对排版格式预置的选择操作,并调取与之对应的排版格式预置。在本发明中,可利用的传感技术包括但不限于:陀螺仪(Gyro-sensor)、加速传感器(Accelerationsensor)、重力传感器(Gravity sensor)。下面,以本方法应用在手机软件中为例,说明方式2的具体实施。
本例中,有三种排版格式预置通过设计,形成以下的循环排列规则:
“好莱坞剧本格式”——>“大陆剧本格式”——>“香港剧本格式”——>“好莱坞剧本格式”。
本例中,选择了陀螺仪(Gyro-sensor)来感知和执行用户对排版格式预置的选择操作,并设置陀螺仪(Gyro-sensor)的触发动作为摇一摇。
当用户对手机执行第一次摇一摇动作,本方法通过陀螺仪感知用户对排版格式预置的选择指令,并执行排版格式预置的循环规则,选中“好莱坞剧本格式”;
当用户对手机执行第二次摇一摇动作,本方法通过陀螺仪感知用户对排版格式预置的选择指令,并执行排版格式预置的循环规则,选中“大陆剧本格式”;
当用户对手机执行第三次摇一摇动作,本方法通过陀螺仪感知用户对排版格式预置的选择指令,并执行排版格式预置的循环规则,选中“香港剧本格式”;
当用户对手机执行第四次摇一摇动作,本方法通过陀螺仪感知用户对排版格式预置的选择指令,并执行排版格式预置的循环规则,选中“好莱坞剧本格式”。
以上可以看出,相对于方式1,利用了传感技术的方式2可以为用户提供更为快捷的交互体验。
S203:利用调取的排版格式预置对预处理文件进行处理,得到符合用户排版格式期望的影视剧本文档。
当步骤 S202完成之后,本方法将直接进入步骤 S203。S203的实施包括以下三个关键点。
关键点1:解析排版格式预置,得到排版格式转换方案。
通过调取排版格式预置中对剧本组成元素的设定,形成一套针对各个剧本组成元素的排版设置参数。比如调取的排版格式预置是“好莱坞剧本格式”,那么得到的排版格式转换方案中,部分剧本组成元素的排版设置参数如下:
剧本组成元素“场景”的设置参数:字体(黑体)、字号(18)、文字样式(加粗)、段落位置(0)、行距(12)、段距(36);
剧本组成元素“动作”的设置参数:字体(黑体)、字号(12 )、文字样式(标准)、段落位置(24 )、行距(12 )、段距(24);
剧本组成元素“人物”的设置参数:字体(黑体)、字号(14)、文字样式(加粗)、段落位置(192)、行距(12)、段距(12);
剧本组成元素“对话”的设置参数:字体(黑体)、字号(12)、文字样式(标准)、段落位置(120)、行距(12)、段距(12);
剧本组成元素“注释”的设置参数:字体(黑体)、字号(12)、文字样式(斜体)、段落位置(160)、行距(12)、段距(12);
剧本组成元素“转场”的设置参数:字体(黑体)、字号(14)、文字样式(加粗)、段落位置(右对齐)、行距(12)、段距(12)。
另外,在得到的排版格式转换方案中还包含与之对应的剧本排版格式所具有的语义及其他规范数据。例如,在“好莱坞剧本格式”的规范数据中,场景段落中的“白天”一词被规范为“日”,“外景”一词被规范为“外”。
关键点2:解析预处理文件,得到需要进行排版格式转换的对象。
通过调取预处理文件中对用户的影视剧本文档的分析结果,将剧本文档中的所有段落或单元进行分类,形成排版格式转换对象。例如,在预处理文件中记录了用户的影视剧本文档中共有7768个段落或单元,其中包括场景段落120个、动作段落3800个、人物段落1900个、对话段落1900个、注释段落30个、转场段落18个。当通过本方法将这7768个段落或单元进行分类之后,包含7768个段落或单元的影视剧本文档被化简为六个排版格式转换对象。
关键点3:将排版格式转换方案实施于需要进行排版格式转换的对象,完成转换,并生成符合用户排版格式期望的影视剧本文档。
关键点1和关键点2完成之后,根据关键点1得到的排版格式转换方案对关键点2得到的转换对象进行整体、批量地处理,然后生成处理完成后的影视剧本文档。
并且,在关键点3中,本方法可以通过语义分析,对影视剧本文档中可能存在的不规范的剧本措辞、用语进行替换,替换为规范措辞、用语。例如:将不规范的场景段落用语“一大早”替换为“清晨”。
同样,在关键点3中,本方法也可以通过语义分析,对影视剧本文档中可能存在的多余、可删除的符号、空格进行删除。例如,在“大陆剧本格式”的影视剧本文档中,人物与对话之间会标注一个分界符“:”,通过本方法将“大陆剧本格式”的影视剧本文档转换为“好莱坞剧本格式”的影视剧本文档时,分界符“:”会被自动删除。
通过 S203 得到符合用户排版格式期望的影视剧本文档后,用户可以对排版格式转换结果进行查看,如果符合用户期望,则排版格式转换操作完成,如果不符合用户期望,用户可以对不符合期望的具体细节进行人工调整。
从上述实施例可以明显看出,如果利用当下现有的技术对包含了7768个段落或单元的影视剧本文档实施排版格式转换,只能先人工地对7768个段落货单元进行逐个检查,识别出它们所对应的剧本组成元素,然后再进行逐个转换,这无疑是一项庞大的任务。而通过本发明所提出的方法,7768个段落被化简成了六个排版格式转换对象,然后利用排版格式预置对六个对象实施同步转换,这一系列操作的响应速度可达毫秒级,而且不需要人工介入。
另外,需要指出的是,上述S201、S202、S203三个步骤在陈述上显得冗长,但在实际运用中的执行速度可达秒级,尤其是在步骤 S202中运用方式2时,当用户摇一摇手机,手机屏幕便会立刻显示转换结果,即:符合用户排版格式期望的影视剧本文档。
为了更形象地说明本发明所提出的影视剧本排版格式转换方法在转换过程中的实施逻辑,下面结合图3进一步陈述。
图3是本发明提出的影视剧本排版格式转换方法的一个具体实施逻辑图。
图3形象地展示了通过本方法将“大陆剧本格式”转换为“好莱坞剧本”格式的逻辑过程,现在结合图3进一步说明通过本方法进行影视剧本排版格式转换的三个步骤。
步骤1,通过排版格式识别,分析用户的影视剧本文档,得到预处理文件。
S301是大陆剧本格式的影视剧本文档片段。
S302形象化地展示了本方法通过排版格式识别对S301进行识别、分析后编译或打包而成的预处理文件。从 S302可以看出,本方法通过排版格式识别,得到了S301的各部分内容所对应的剧本组成元素,如图中S302所示:
剧本内容“远古雪原”所对应的剧本组成元素为:“场景”中的地点;
剧本内容“一大早”所对应的剧本组成元素为:“场景”中的时间;
剧本内容“外景”所对应的剧本组成元素为:“场景”中的场别;
剧本内容“茫茫雪原,天地混沌,远处,出现……”所对应的剧本组成元素为:“动作”;
剧本内容“原始人 A”所对应的剧本组成元素为:“人物”;
剧本内容“我们究竟还要走多久”所对应的剧本组成元素为:“对话”;
剧本内容“原始人 B 看了一眼原始人 A,没说话……”所对应的剧本组成元素为:“动作”。
其中,剧本内容“原始人 A:我们究竟还要走多久”是通过语义分析,将其判定为“人物”+ “对话”的复合元素,并将其分解为两个剧本组成元素,而符号“:”被划定为人物与对话的分界符。
S302只是形象化地展示了预处理文件中包含的内容,在实际应用中,预处理文件是一个将影视剧本的文本内容和分析结果打包或编译而成的数据文件。
步骤2,根据用户对排版格式的期望,调取与用户期望相匹配的排版格式预置。
在图2的实施例陈述中,提到了实现步骤2所包括的两种具体实施方式,并对方式2利用传感技术作了详细说明,在本实施例的S303中,步骤2采用了方式1 通过列表、选项等选择界面,向用户展示预先收集或用户自定义的排版格式预置。
S303展示的是本方法提供的部分排版格式预置列表,用户在 S303中选中所期望的“好莱坞剧本格式”之后,本方法便会调取“好莱坞剧本格式”的排版格式预置。
步骤3,利用调取的排版格式预置对预处理文件进行处理,得到符合用户排版格式期望的影视剧本文档。
S304展示的是步骤3的处理结果。步骤3在本实施例中的具体实施是:
首先,通过解析S303“好莱坞剧本格式”预置中对剧本组成元素的设定,形成一套针对各个剧本组成元素的排版设置参数,例如在“好莱坞剧本格式”预置中,剧本组成元素“人物”的设置参数为:字体(黑体)、字号(14)、文字样式(加粗)、段落位置(192)、行距(12)、段距(12);
同时,通过解析预处理文件中的数据,得到需要进行排版格式转换的对象,例如,在S302预处理文件中,来自S301的剧本片段共有5个段落或单元,其中场景段落1个、动作段落2个、人物段落1个、对话段落1个;
最后,将 S303“好莱坞剧本格式”预置中各个剧本组成元素的设置参数分别实施于S302预处理文件的五个段落,便将 S301大陆剧本格式的影视剧本片段转换成了如 S304所示的好莱坞剧本格式的影视剧本片段。
在S304中体现的本次排版格式转换的结果如下:
1. 字号、段落位置、段距等设置,在S103中,所有段落的文字都是同一字号,而转换后的S103,根据“好莱坞剧本格式”的规范,场景段落的字号发生了改变,另外,人物段落“原始人A”以及对话段落“我们究竟还要走多久”的段落位置和段距也根据“好莱坞剧本格式”的规范做了相应调整;
2. 规范措辞及符号,S101中的场景用语“一大早”在 S103中被替换成了规范措辞“清晨”,S101中的场景用语“外景”在 S103中被替换成了规范措辞“外”,并且根据“好莱坞剧本格式”的规范,为场景段落添加了两处规范化的分节符“.”和“-”;
3. 词组排列顺序,场景段落的词组排列顺序也根据“好莱坞剧本格式”的规范作了相应调整,将词组顺序“远古雪原”-“一大早”-“外景”调整为“外.”-“远古雪原”-“清晨”。
上述已经结合附图和一个具体的例子说明了本发明所提出的影视剧本排版格式转换方法,通过排版格式识别,分析用户的影视剧本文档,得到预处理文件;根据用户对排版格式的期望,调取与用户期望相匹配的排版格式预置;利用调取的排版格式预置对预处理文件进行处理,得到符合用户排版格式期望的影视剧本文档。根据本方法,可以不必对影视剧本可能出现的各种排版格式转换操作分别进行检测并做出相应的处理,而是通过统一的排版格式转换技术方案对其进行整体转换,实施复杂度低并且响应速度快。
本发明还提出了一种影视剧本排版格式转换装置,下面,结合图4继续说明。
<一种影视剧本排版格式转换装置>
图4是本发明提出的影视剧本排版格式转换装置的示意性架构图。
图4所展示的影视剧本排版格式转换装置用于执行本发明提出的任何一项影视剧本排版格式转换方法,但绝不对本发明提出的影视剧本排版格式转换方法构成任何限制,并且,图4所展示的影视剧本排版格式转换装置仅仅是示例性示意图,绝不构成对本发明的任何不当限制。
从图4可以看出,本发明提出的影视剧本排版格式转换装置包括七个单元(也可以被称之为模块、构件、元件、组件或其他同义称谓)。这七个单元构成了一个实现影视剧本排版格式转换的开发架构,本说明书所指的开发架构可以是软件开发架构,也可以是硬件开发架构。
作为软件开发架构,本装置可作为一个开发者工具包(Software DevelopmentKit 简称SDK)集成在电脑端、手机端以及其他移动终端和智能穿戴设备的应用软件中,同时,本装置也完全可以构成一个独立的应用软件,在电脑端、手机端以及其他移动端和智能穿戴设备上运行。
而作为硬件开发架构,组成本装置的七个单元则通过硬件化的芯片、电路及其他元件来实现,进而集成于或单独开发成智能机器人、智能音箱等硬件设备。
介于在本装置中,作为硬件开发架构与作为软件开发架构二者的底层原理和逻辑相同,下面以软件开发架构为例,对本装置进一步说明,硬件架构不再赘述。
下面结合图4,分别说明组成本装置的七个单元。
S401:排版格式识别单元,用于识别和分析用户的影视剧本文档。
S401排版格式识别单元通过字符编码(Text recognition)、 OCR (OpticalCharacter Recognition)语义分析(Semantic Analysis)及其他相关技术,对用户的影视剧本文档实施识别、分析。具体实施包括以下两个方面。
第一方面:通过排版格式识别单元,对影视剧本文档的文字进行分析。
针对用户的影视剧本文档在文字呈现上所表现出的特征,如:字体、字号、文字颜色、字距、行距、文字样式、文字位置、段落缩进、段距、段落样式、段落位置以及其他排版参数和属性进行识别,通过分析,找出用户的影视剧本文档中每一个段落或者单元属于哪一种剧本组成元素(剧本组成元素包括但不限于:场景、动作、人物、对话、注释、转场),并生成对应数据。
第二方面:通过排版格式识别单元,对影视剧本文档进行语义分析。
针对用户的影视剧本文档在语义层面所表现出的特征,如“外景”、“内景”、“白天”、“晚上”等剧本特性关键词和关键语句进行识别,通过分析,找到包含剧本特性关键词和关键语句的文本内容与剧本组成元素之间的对应关系,并生成对应数据。
需要指出的是,上述第一方面对影视剧本文档的文字进行分析和第二方面对影视剧本文档进行语义分析可以同步运行。
有一种情况是,用户的影视剧本文档是由本装置所生成,因此用户的影视剧本文档中已经包含了可被本装置识别的排版格式数据(这一点将在 S405排版格式转换单元具体说明),当S401排版格式识别单元识别出用户的影视剧本文档是由本装置所生成,S401排版格式识别单元会跳过识别、分析的操作,直接将用户的影视剧本文档提交给S403中央处理单元。
S402:预处理单元,用于将S401排版格式识别单元的分析结果和用户的影视剧本文档的文本内容编译或打包成预处理文件。
当 S401文本识别单元完成对影视剧本文档的文字分析和对影视剧本文档的语义分析之后,预处理单元便将S401的分析结果和用户的影视剧本文档的文本内容编译或打包成一个预处理文件。
在某些情况下,特别是当本装置作为软件开发架构时,S402预处理单元可以和S401排版格式识别单元合并为一个单元,也可以和 S403中央处理单元合并为一个单元,但即使合并,在功能上依然应该被看作不同的单元属性。
S403:中央处理单元,用于响应用户指令、调度本装置内的各个单元以及负责与本装置外的程序、软件、元件或设备进行交互。
S403中央处理单元是本装置的中枢单元,S403中央处理单元的职能包括:
a.响应用户指令,例如,响应用户的影视剧本文档并启动本装置;
b.与用户进行交互,例如,为用户提供排版格式预置列表,供用户选择,然后接收用户的选择并做出反应,反应可以是接收指令也可以是向用户提出更进一步的反馈;
c.调度本装置的其他单元,例如,从S404数据单元调取排版格式预置然后交给S405排版格式转换单元实施排版格式转换操作;
d.负责与本装置外的程序、软件、元件或设备进行交互,例如,当本装置应用在手机软件中时,可以通过中央处理单元,与手机内置的陀螺仪(Gyro-sensor)交换数据和指令,以便用户通过摇一摇手机的动作实现转换影视剧本排版格式的快捷操作。
S404:数据单元,用于存储排版格式预置,以及本装置所产生的或所需要的数据。
S404数据单元最典型的职能是储存排版格式预置,排版格式预置的来源包括:本装置预置的;用户通过自定义生成的;本装置通过收集用户在使用本装置的过程中所产生的相关数据,由S407排版格式训练单元分析并编译而成的。
另外,S404数据单元还会储存本装置所产生的或所需要的数据,例如S407排版格式训练单元所产生的数据,这一点在S407排版格式训练单元再做说明。
需要指出的是,在实施本装置时,S404数据单元可以部署在本地,也可以部署在云端。
S405:排版格式转换单元,用于执行排版格式的转换操作,并生成符合用户排版格式期望的影视剧本文档。由 S405所生成的影视剧本文档可以是本装置所专有的格式文件,也可以是纯文本、富文本、PDF、图片以及文本类软件或剧本类软件的格式文件。
S405排版格式转换单元的工作流程包括以下两个步骤。
1.接收S403中央处理单元的指令,从S404数据单元提供的排版格式预置中调取剧本组成元素的数据,然后与S402预处理单元生成的预处理文件进行匹配,并将预处理文件中各剧本组成元素的排版设置替换为排版格式预置中的相应数值。
2.将处理后的数据编译成符合用户排版格式期望的影视剧本文档。在此过程中,S405排版格式转换单元会将一份排版格式数据一同编译进这份新的影视剧本文档,以便用户下一次对这份影视剧本文档进行排版格式转换时可以跳过 S401排版格式识别单元直接进入 S403中央处理单元,提高工作效率和准确度。
需要指出的是,通过上述可以看出,如果通过将本发明所提出的方法或装置集成于支持文本编辑功能的软件、程序、设备中,或者以本发明所提出的方法或装置为基础开发支持文本编辑功能的软件、程序、设备,那么在利用这些软件、程序、设备写作或编辑影视剧本的同时就可以设定排版格式,于是,由这些软件、程序、设备写作或编辑的影视剧本文档已经包含了可被本发明所提出的方法或装置读取的排版格式数据,不必实施方法中的第一步骤排版格式识别、装置中的排版格式识别单元和预处理单元,然而,本发明所提出的方法及装置并不因为方法中的第一步骤、装置中的排版格式识别单元和预处理单元的缺失而影响本方法和本装置的任何权益。
另外,在某些情况下,特别是当本装置作为软件开发架构时,S405排版格式转换单元可以和S403中央处理单元合并为一个单元,但即使合并,在功能上依然应该被看作不同的单元属性。
S406:显示单元,用于展示本装置的运行,提供本装置与用户之间的交互界面。
S406显示单元提供本装置与用户之间的交互界面,展示本装置的运行状态及结果。由于 S406显示单元不具备复杂的实现逻辑和技术,在此不多赘述。
S407:排版格式训练单元,通过用户使用本装置时所产生的行为、动作和数据,对本装置的各单元进行训练,提升本装置的能力和效率。
最显而易见的训练对象就是S401排版格式识别单元,通过对S401排版格式识别单元进行训练,提升S401排版格式识别单元的能力和效率。下面,通过三个实例稍作详解。
实例1:当用户不满意本装置的影视剧本排版格式转换结果,并对转换结果进行人工调整时,S407排版格式训练单元开始实时收集用户的操作并进行分析,生成相应的处理方案,进而实施于用户接下来的操作过程。例如,用户对通过本装置转换而成的剧本文档中的剧本组成元素“场景”的字号不满意,当用户通过人工将剧本文档中的某一个“场景”的字号调整为“三号”,S407排版格式训练单元通过分析得出结论:用户所期望的场景字号设置是“三号”,然后S407排版格式训练单元将这一结论生成一个处理方案:将所有场景的字号统一设置为“三号”,并实施操作。这样,用户只需通过一次修改,剧本文档中的所有场景便随之修改了。当然,上述例子仅仅涉及到用户的一种操作,在实际运用中,可能会存在多种、多项操作同步进行,原理和逻辑相同,在此不多赘述。
实例2:当用户不满意本装置的影视剧本排版格式转换结果,然后人工完成了所有的修改并确认之后,S407排版格式训练单元会将本次因用户修改所形成的新的排版格式规范编译成一个排版格式预置,提交给S404数据单元储存,以便用户下次直接调取。
实例3:当本装置未能识别出用户的影视剧本文档中的某个或某些剧本组成元素,用户通过人工,赋予其剧本组成元素之后,S407排版格式训练单元会对用户所认定的剧本组成元素对象进行分析,找出特征,并形成相应的识别数据,然后将识别数据提交给 S401排版格式识别单元,以便S401排版格式识别单元下一次运行时提高识别率。例如,用户的影视剧本文档中出现了这样一句文本:“老路晌头儿从屋里到屋外”,S401排版格式识别单元通过分析,对这一句文本的理解是:“一个叫老路的人在晌头儿的时候从屋里到屋外”,因此,S401排版格式识别单元将这一句文本识别成剧本组成元素中的“动作”,然后本装置以此为依据对其做了相应的转换。但是,用户通过人工修改,将这一句文本从“动作”修改为“场景”,于是S407排版格式训练单元会对这一句文本进行分析,找出其中的原因,并得出结论,“老路”不是人名,而是地名,是“场景”段落中的地点;“晌头儿”是场景段落中的时间;“从屋里到屋外”是场景段落中的场别,对应的规范措辞是“内/外”。然后,S407排版格式训练单元会将此次的分析结果形成一组数据发送给 S401排版格式识别单元,以便S401排版格式识别单元下一次运行时提高识别率。
从以上对本发明所提出的影视剧本排版格式转换装置的说明可以看出,本发明所提出的影视剧本排版格式转换装置是一个具备学习能力的智能装置,它可以在用户使用本装置的同时收集用户的行为、动作以及使用数据,并对其进行分析处理,生成学习模型,以此逐步掌握用户的使用习惯及个性,从而更高效、更准确地为用户提供服务。另外,由于用户之间的使用差异,本装置在不同用户的使用过程中所产生的学习结果也不尽相同,因此,经过不同用户的使用,本装置会体现出不同的个性化特征。
为了描述的方便,描述以上装置时以功能分为各种步骤、流程、单元(或者是元件、组件、模块)分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
以上陈述了本发明的各实施例,在一些情况下,在权利要求书中记载的流程或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现本发明所期望的结果。另外,在附图中描绘的流程或步骤并非严格遵照其连续顺序才能实现本发明所期望的结果,在某些实施方式中,多任务处理和并行处理也是可行的。
以上陈述了本发明的各实施例,陈述是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所陈述的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员而言许多修改和变更都是显而易见的。本说明书所使用的术语旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使技术领域的其他普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求书限定。
本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全软件实施例、完全硬件实施例、或结合软件和硬件方面的实施例的形式。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、装置或者设备不仅包括那些要素而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、装置或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”指向的要素,并不排除在包括所述要素的过程、方法、装置或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于本发明所提出的影视剧本排版格式转换装置的实施例而言,由于其逻辑基本相似于本发明所提出的影视剧本排版格式转换方法实施例,所以在描述上相对简单,相关之处参见本方法实施例的部分说明即可。
以上所述均为本说明书的一个或多个实施例,并不用于限制本说明书。本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进,均应包含在本说明书的权利要求范围之内。

Claims (10)

1.一种影视剧本排版格式转换方法,其特征在于,该方法包括以下步骤:
通过排版格式识别,分析用户的影视剧本文档,得到预处理文件;
根据用户对排版格式的期望,调取与用户期望相匹配的排版格式预置;
利用调取的排版格式预置对预处理文件进行处理,得到符合用户排版格式期望的影视剧本文档。
2.根据权利要求1所述的方法,其特征在于,所述用户的影视剧本文档为影视剧本类的文字作品,其介质包括但不限于纯文本、富文本、PDF、图片以及文本类软件或剧本类软件的格式文件。
3.根据权利要求1所述的方法,其特征在于,通过排版格式识别,分析用户的影视剧本文档包括:
通过排版格式识别,对影视剧本文档的文字进行分析,包括但不限于:字体、字号、文字颜色、字距、行距、文字样式、文字位置、段落缩进、段距、段落样式、段落位置以及其他排版参数和属性,从中得到影视剧本文档的剧本组成元素的数据,剧本组成元素包括但不限于:场景、动作、人物、对话、注释、转场。
4.根据权利要求1所述的方法,其特征在于,通过排版格式识别,分析用户的影视剧本文档还包括:
通过排版格式识别,对影视剧本文档进行语义分析,从中得到文本内容与剧本组成元素之间的对应关系,进而得到影视剧本文档的剧本组成元素的数据,剧本组成元素包括但不限于:场景、动作、人物、对话、注释、转场。
5.根据权利要求1所述的方法,其特征在于,所述排版格式预置是一种预先收集并处理的影视剧本排版格式数据包,每一种影视剧本排版格式对应一个排版格式预置,排版格式预置将与之对应的影视剧本排版格式的剧本组成元素做了设定,包括但不限于:字体、字号、颜色、字距、行距、文字样式、文字位置、段落缩进、段距、段落样式、段落位置以及其他排版参数和属性。
6.根据权利要求1所述的方法,其特征在于,根据用户对排版格式的期望,调取与用户期望相匹配的排版格式预置的具体实施包括:为用户提供预先收集的或用户自定义的排版格式预置,通过用户的选择,理解用户对排版格式转换的期望,并调取用户选中的排版格式预置。
7.根据权利要求6所述的方法,其特征在于,所述具体实施尤其包括利用传感技术,通过用户的动作和行为实现快捷交互,在本发明中,可利用的传感技术包括但不限于:陀螺仪(Gyro-sensor)、加速传感器(Acceleration sensor)、重力传感器(Gravity sensor)。
8.根据权利要求1所述的方法,其特征在于,利用调取的排版格式预置对预处理文件进行处理,得到符合用户排版格式期望的影视剧本文档,步骤包括:
a. 解析排版格式预置,得到排版格式转换方案;
b. 解析预处理文件,得到需要进行排版格式转换的对象;
c. 将排版格式转换方案实施于需要进行排版格式转换的对象,完成转换,并生成符合用户排版格式期望的影视剧本文档。
9.根据权利要求8所述的利用调取的排版格式预置对预处理文件进行处理,得到符合用户排版格式期望的影视剧本文档,其特征在于,还包括:
通过语义分析,对影视剧本文档中可能存在的不规范的剧本措辞、用语进行替换,替换为规范措辞、用语;
通过语义分析,对影视剧本文档中可能存在的多余、可删除的符号、空格进行删除;
通过语义分析,对影视剧本文档中可能存在的不规范的词组排列顺序进行调整。
10.一种影视剧本排版格式转换装置,其特征在于,该装置用于实现权利要求1-9所述的任意一项方法,该装置包括:
排版格式识别单元,用于识别和分析用户的影视剧本文档;
预处理单元,用于将排版格式识别单元的分析结果和用户的影视剧本文档的文本内容编译或打包成预处理文件;
中央处理单元,用于响应用户指令、调度本装置内的各个单元以及负责与本装置外的程序、软件、元件或设备进行交互;
排版格式转换单元,用于执行排版格式的转换操作,并生成符合用户排版格式期望的影视剧本文档;
数据单元,用于存储排版格式预置,以及本装置所产生的或所需要的数据;
显示单元,用于展示本装置的运行,提供本装置与用户之间的交互界面;
排版格式训练单元,通过用户使用本装置时所产生的行为、动作和数据,对本装置的各单元进行训练,提升本装置的能力和效率。
CN201811597410.3A 2018-12-26 2018-12-26 一种影视剧本排版格式转换方法及装置 Pending CN111368523A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811597410.3A CN111368523A (zh) 2018-12-26 2018-12-26 一种影视剧本排版格式转换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811597410.3A CN111368523A (zh) 2018-12-26 2018-12-26 一种影视剧本排版格式转换方法及装置

Publications (1)

Publication Number Publication Date
CN111368523A true CN111368523A (zh) 2020-07-03

Family

ID=71209880

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811597410.3A Pending CN111368523A (zh) 2018-12-26 2018-12-26 一种影视剧本排版格式转换方法及装置

Country Status (1)

Country Link
CN (1) CN111368523A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232032A (zh) * 2020-09-04 2021-01-15 科航(苏州)信息科技有限公司 docx文档的内容样式自动转换方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1501285A (zh) * 2002-09-24 2004-06-02 精工爱普生株式会社 排版系统、排版程序和排版方法
CN101872340A (zh) * 2009-04-23 2010-10-27 北京大学 一种基于版面格式模板的排版方法及装置
CN104239284A (zh) * 2014-09-15 2014-12-24 广州市西美信息科技有限公司 一种图文自动排版的方法和装置
CN106681979A (zh) * 2016-11-23 2017-05-17 广州阿里巴巴文学信息技术有限公司 文章排版方法、设备、可编程设备及文章发布平台
CN107133198A (zh) * 2017-06-05 2017-09-05 广东电网有限责任公司东莞供电局 一种文档的排版和格式转换方法
CN109002430A (zh) * 2018-07-10 2018-12-14 西安影视数据评估中心有限公司 影视剧本统筹分页方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1501285A (zh) * 2002-09-24 2004-06-02 精工爱普生株式会社 排版系统、排版程序和排版方法
CN101872340A (zh) * 2009-04-23 2010-10-27 北京大学 一种基于版面格式模板的排版方法及装置
CN104239284A (zh) * 2014-09-15 2014-12-24 广州市西美信息科技有限公司 一种图文自动排版的方法和装置
CN106681979A (zh) * 2016-11-23 2017-05-17 广州阿里巴巴文学信息技术有限公司 文章排版方法、设备、可编程设备及文章发布平台
CN107133198A (zh) * 2017-06-05 2017-09-05 广东电网有限责任公司东莞供电局 一种文档的排版和格式转换方法
CN109002430A (zh) * 2018-07-10 2018-12-14 西安影视数据评估中心有限公司 影视剧本统筹分页方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
潘若瑛等: "多模板多格式论文校验与自动排版系统的研究", 《微型电脑应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232032A (zh) * 2020-09-04 2021-01-15 科航(苏州)信息科技有限公司 docx文档的内容样式自动转换方法
CN112232032B (zh) * 2020-09-04 2023-08-18 科航(苏州)信息科技有限公司 docx文档的内容样式自动转换方法

Similar Documents

Publication Publication Date Title
CN109918607B (zh) 页面搭建方法及装置、介质和计算设备
AU2016203856B2 (en) System and method for automating information abstraction process for documents
US11734584B2 (en) Multi-modal construction of deep learning networks
CN112149399B (zh) 基于rpa及ai的表格信息抽取方法、装置、设备及介质
CN107480162B (zh) 基于人工智能的搜索方法、装置、设备及计算机可读存储介质
US7680333B2 (en) System and method for binary persistence format for a recognition result lattice
CN111190522A (zh) 从自然语言请求生成三维数字内容
CN111625226B (zh) 一种基于原型的人机交互设计实现方法及系统
US10902188B2 (en) Cognitive clipboard
CN110096275B (zh) 一种页面处理方法及装置
CN114820881A (zh) 图片的生成方法、智能终端及其计算机可读存储介质
JP7309811B2 (ja) データ注釈方法、装置、電子機器および記憶媒体
CN115495069A (zh) 基于模型驱动的煤炭工业软件流程实现方法、装置及设备
CN106776779B (zh) 基于Mac平台的JSON数据生成实体文件的方法
CN102323858B (zh) 识别输入时修改项的输入方法、终端及系统
CN111368523A (zh) 一种影视剧本排版格式转换方法及装置
CN109063059A (zh) 行为日志处理方法、装置及电子设备
EP3104285A1 (en) System and method for automating information abstraction process for documents
CN102246158A (zh) 用户指定的短语输入学习
CN111142871A (zh) 一种前端页面开发系统、方法、设备、介质
CA2932310A1 (en) System and method for automating information abstraction process for documents
CN115543291A (zh) 一种界面模板套件的开发应用方法及装置
CN114443022A (zh) 生成页面搭建区块的方法及电子设备
CN111898762B (zh) 深度学习模型目录创建
CN117891531B (zh) 用于saas软件的系统参数配置方法、系统、介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200703