CN102455847A - 基于语义的视觉效果产生系统 - Google Patents
基于语义的视觉效果产生系统 Download PDFInfo
- Publication number
- CN102455847A CN102455847A CN2010105172491A CN201010517249A CN102455847A CN 102455847 A CN102455847 A CN 102455847A CN 2010105172491 A CN2010105172491 A CN 2010105172491A CN 201010517249 A CN201010517249 A CN 201010517249A CN 102455847 A CN102455847 A CN 102455847A
- Authority
- CN
- China
- Prior art keywords
- semantic
- data
- image
- semanteme
- visual effect
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明是有关于一种基于语义的视觉效果产生系统,包含一语义处理模块,及一视觉处理模块。该语义处理模块包括一语义分类单元;该语义分类单元用以将相关于一来源数据的一语义数据组的内容进行分类,以产生一语义类别联集。该视觉处理模块包括一视觉参数产生单元,及一视觉后制单元;该视觉参数产生单元用以根据该语义类别联集得到一视觉参数组;该视觉后制单元用以根据该视觉参数组产生至少一视觉效果,并将该来源数据的一影像数据结合该视觉效果后进行显示。
Description
技术领域
本发明涉及一种视觉效果产生系统,特别是涉及一种基于语义的视觉效果产生系统。
背景技术
由于网际网路蓬勃发展,各种多媒体数据,可以借由网路平台获得;而目前也存在一些语义分析技术,可对该等多媒体数据进行语义分析,以获得相关的语义数据(或称诠释数据(metadada)),前述语义数据一般用于对与其相关的该等多媒体数据进行描述、分类,或组织,以加速后续对于该等多媒体数据的检索。
如US 7065250所揭露的一种自动化影像诠释及检索系统,对数位影像及视讯数据进行分析后,将数位影像及视讯数据以语义标记(semanticlabel)诠释,以供后续的程序使用,例如,基于内容的检索(content-basedretrieval),及视讯摘要的产生(video abstract generation)。
然而,上述语义数据除了用于检索的用途之外,还可反映该等多媒体数据的情境、情感、意象等内涵;若能将语义数据进一步用于视觉相关的后处理,将为使用者带来更深一层的视觉感受。
由此可见,上述现有的视觉效果产生系统在结构与使用上,显然仍存在有不便与缺陷,而亟待加以进一步改进。为了解决上述存在的问题,相关厂商莫不费尽心思来谋求解决之道,但长久以来一直未见适用的设计被发展完成,而一般产品又没有适切结构能够解决上述问题,此显然是相关业者急欲解决的问题。因此如何能创设一种新型的基于语义的视觉效果产生系统,实属当前重要研发课题之一,亦成为当前业界极需改进的目标。
发明内容
本发明的目的在于,克服现有的视觉效果产生系统存在的缺陷,而提供一种新型的基于语义的视觉效果产生系统,所要解决的技术问题是提供一种基于语义的视觉效果产生系统,非常适于实用。
本发明的目的及解决其技术问题是采用以下技术方案来实现的。依据本发明提出的一种基于语义的视觉效果产生系统,其包含:
一语义处理模块,包括一语义分类单元,该语义分类单元用以接收相关于一来源数据的一语义数据组,并用以对该语义数据组进行语义/类别对应分类,以将该语义数据组的内容对应分类至所属的至少一语义类别,借此产生包括该语义类别的一语义类别联集,该来源数据包括一影像数据,及一声音数据与一文字数据两者其中至少一者;及
一视觉处理模块,包括一视觉参数产生单元,及一视觉后制单元,该视觉参数产生单元用以接收该语义类别联集,并根据该语义类别联集以得到一视觉参数组,该视觉后制单元用以根据该视觉参数组产生至少一视觉效果,并将该来源数据的该影像数据结合该视觉效果后进行显示。
本发明的目的及解决其技术问题还可采用以下技术措施进一步实现。
较佳地,依据本发明的一个较佳实施例,前述的基于语义的视觉效果产生系统,其中所述的语义处理模块还包括一影像分析器,用以对该来源数据的该影像数据进行分析以得到该语义数据组,其中,对于该影像数据的其中一影像,该影像分析器求得对应该影像的一亮度值,该语义数据组包括对应该影像的该亮度值,且该语义分类单元根据预先建立的一亮度值/类别对应关联,将该亮度值对应分类至所属的语义类别。
较佳地,依据本发明的一个较佳实施例,前述的基于语义的视觉效果产生系统,其中所述的语义处理模块还包括一影像分析器,用以对该来源数据的该影像数据进行分析以得到该语义数据组,其中,对于该影像数据的其中一影像,该影像分析器求得对应该影像的一对比值,该语义数据组包括对应该影像的该对比值,且该语义分类单元根据预先建立的一对比值/类别对应关联,将该对比值对应分类至所属的语义类别。
较佳地,依据本发明的一个较佳实施例,前述的基于语义的视觉效果产生系统,其中所述的语义处理模块还包括一影像分析器,用以对该来源数据的该影像数据进行分析以得到该语义数据组,其中,对于该影像数据的其中一影像,该影像分析器根据预先建立的一影像物件集合进行比对,以自该影像中撷取出至少一重要物件,该语义数据组包括该重要物件,该语义分类单元根据预先建立的一影像物件/类别对应关联,将该重要物件对应分类至所属的语义类别。
较佳地,依据本发明的一个较佳实施例,前述的基于语义的视觉效果产生系统,其中所述的语义处理模块还包括一声音分析器,该来源数据包括该影像数据及该声音数据,该声音分析器用以对该声音数据进行分析以得到该语义数据组,其中,对于该声音数据的其中一声音段,该声音分析器求得对应该声音段的至少一频率,该语义数据组包括对应该声音段的该频率,该语义分类单元根据预先建立的一频率/类别对应关联,将该频率对应分类至所属的语义类别。
较佳地,依据本发明的一个较佳实施例,前述的基于语义的视觉效果产生系统,其中所述的语义处理模块还包括一声音分析器,该来源数据包括该影像数据及该声音数据,该声音分析器用以对该声音数据进行分析以得到该语义数据组,其中,对于该声音数据的其中一声音段,该声音分析器求得对应该声音段的至少一振幅,该语义数据组包括对应该声音段的该振幅,该语义分类单元根据预先建立的一振幅/类别对应关联,将该振幅对应分类至所属的语义类别。
较佳地,依据本发明的一个较佳实施例,前述的基于语义的视觉效果产生系统,其中所述的语义处理模块还包括一文字分析器,该来源数据包括该影像数据及该文字数据,该文字分析器用以对该文字数据进行分析以得到该语义数据组,其中,对于该文字数据的其中一文字段,该文字分析器根据预先建立的一关键字集合进行比对,以自该文字段中撷取出至少一关键字,该语义数据组包括对应该文字段的该关键字,该语义分类单元根据预先建立的一关键字/类别对应关联,将该关键字对应分类至所属的语义类别。
较佳地,依据本发明的一个较佳实施例,前述的基于语义的视觉效果产生系统,其中所述的语义处理模块还包括一文字分析器,该来源数据包括该影像数据及该文字数据,该文字分析器用以对该文字数据进行分析以得到该语义数据组,其中,对于该文字数据的其中一文字段,该文字分析器求得对应该文字段的一文字速度,该语义数据组包括对应该文字段的该文字速度,该语义分类单元根据预先建立的一文字速度/类别对应关联,将该文字速度对应分类至所属的语义类别。
较佳地,依据本发明的一个较佳实施例,前述的基于语义的视觉效果产生系统,其中所述的视觉效果为对该来源数据的该影像数据进行影像调整处理的一单张影像特效,该视觉参数产生单元根据预先建立的一语义类别/调整参数关联,及该语义类别联集,以得到该视觉参数组。
较佳地,依据本发明的一个较佳实施例,前述的基于语义的视觉效果产生系统,其中所述的视觉效果为用于与该来源数据的该影像数据进行叠合显示的一语义强化字幕,该视觉参数产生单元根据预先建立的一语义类别/字幕参数关联,及该语义类别联集,以得到该视觉参数组。
较佳地,依据本发明的一个较佳实施例,前述的基于语义的视觉效果产生系统,其中所述的视觉参数组包括对应该语义强化字幕的一字体大小、一颜色、一字型,及一字幕特效其中至少一者。
较佳地,依据本发明的一个较佳实施例,前述的基于语义的视觉效果产生系统,其中所述的来源数据包括该影像数据及该文字数据,该视觉效果为对该文字数据进行调整处理的一文字调整特效,该视觉参数产生单元根据预先建立的一语义类别/文字参数关联,及该语义类别联集,以得到该视觉参数组。
本发明与现有技术相比具有明显的优点和有益效果。由以上可知,为达到上述目的,本发明提供了一种基于语义的视觉效果产生系统包含:一语义处理模块,及一视觉处理模块。该语义处理模块包括一语义分类单元;该语义分类单元用以接收相关于一来源数据的一语义数据组,并用以对该语义数据组进行语义/类别对应分类,以将该语义数据组的内容对应分类至所属的至少一语义类别,借此产生包括该语义类别的一语义类别联集,其中,该来源数据包括一影像数据,及一声音数据与一文字数据两者其中至少一者。该视觉处理模块包括一视觉参数产生单元,及一视觉后制单元;该视觉参数产生单元用以接收该语义类别联集,并根据该语义类别联集以得到一视觉参数组,该视觉后制单元用以根据该视觉参数组产生至少一视觉效果,并将该来源数据的该影像数据结合该视觉效果后进行显示。
借由上述技术方案,本发明基于语义的视觉效果产生系统至少具有下列优点及有益效果:借由该语义处理模块及该视觉处理模块,产生反映该来源数据内涵的该视觉效果,并将该来源数据的该影像数据与该视觉效果结合后进行显示,可为使用者带来更深一层的视觉感受。
综上所述,本发明是有关于一种基于语义的视觉效果产生系统,包含一语义处理模块,及一视觉处理模块。该语义处理模块包括一语义分类单元;该语义分类单元用以将相关于一来源数据的一语义数据组的内容进行分类,以产生一语义类别联集。该视觉处理模块包括一视觉参数产生单元,及一视觉后制单元;该视觉参数产生单元用以根据该语义类别联集得到一视觉参数组;该视觉后制单元用以根据该视觉参数组产生至少一视觉效果,并将该来源数据的一影像数据结合该视觉效果后进行显示。本发明在技术上有显著的进步,并具有明显的积极效果,诚为一新颖、进步、实用的新设计。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1是说明本发明基于语义的视觉效果产生系统的一较佳实施例的系统图。
图2是说明对应本发明较佳实施例的一语义的视觉效果产生方法的流程图。
图3是说明一来源数据的一影像数据的其中一影像,及一文字数据的其中一文字段的示意图。
图4是说明依据本发明较佳实施例,将该来源数据的该影像数据结合各种视觉效果的示意图。
图5是配合图4说明一动画字幕特效的示意图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于语义的视觉效果产生系统其具体实施方式、结构、特征及其功效,详细说明如后。
有关本发明的前述及其他技术内容、特点及功效,在以下配合参考图式的较佳实施例的详细说明中将可清楚的呈现。为了方便说明,在以下的实施例中,相同的元件以相同的编号表示。
下面结合附图及实施例对本发明进行详细说明:
参阅图1,本发明基于语义的视觉效果产生系统的较佳实施例包含一来源数据分类模块1、耦接于该来源数据分类模块1的一语义处理模块2,及耦接于该语义处理模块2的一视觉处理模块3。在本较佳实施例中,该基于语义的视觉效果产生系统以软体方式实施,其实施态样为内储基于语义的视觉效果产生程式的程式产品,当一电子装置(例如,电脑的处理器,图未示)载入该程式并执行后,可完成该来源数据分类模块1、该语义处理模块2,及该视觉处理模块3的功能。
该来源数据分类模块1用以接收一来源数据,并对该来源数据进行分类,其中,该来源数据包括一影像数据,及一声音数据与一文字数据两者其中至少一者,该影像数据可为静态影像,或包括一连串影像的视讯。在本较佳实施例中,该来源数据为一数位多媒体数据,其包括一影像数据、一声音数据,及一文字数据。
该语义处理模块2包括一影像分析器21、一声音分析器22、一文字分析器23、耦接于该影像、声音及文字分析器21-23的一语义分类单元24、耦接于该影像分析器21的一影像物件数据库25、耦接于文字分析器23的一关键字数据库26,及耦接于该语义分类单元24的一语义/类别数据库27。
该影像分析器21、该声音分析器22,及该文字分析器23用以接收已分类的该来源数据,并分别对其影像、声音及文字数据进行语义分析,以得到相关于该来源数据的一语义数据组。其中,该影像分析器21、该声音分析器22,及该文字分析器23所进行的处理进一步描述如下。
该影像分析器21用以对该来源数据的该影像数据进行分析以得到该语义数据组,其中,对于该影像数据的其中一影像,该影像分析器21求得对应该影像的一亮度值及一对比值,并根据储存于该影像物件数据库25内的一影像物件(image object)集合进行比对,以自该影像中撷取出至少一重要物件(key object);该语义数据组包括对应该影像的该亮度值、该对比值,及该重要物件。在本较佳实施例中,该影像分析器21求得该影像中所有像素(pixel)的亮度(luminance)的一平均值作为该亮度值;求得所有像素的亮度中一最大亮度与一最小亮度的一差值作为该对比值。该影像物件集合预先建立并储存于该影像物件数据库25中,该影像物件集合包括日常生活中常见的影像物件,例如,交通工具、人、建筑设施等,该影像物件数据库25还可随着使用上的需要而扩充并更新内容。
该声音分析器22用以对该来源数据的该声音数据进行分析以得到该语义数据组,其中,对于该声音数据的其中一声音段(audio segmentation),该声音分析器22求得对应该声音段的至少一频率(frequency)及至少一振幅(amplitude);该语义数据组还包括对应该声音段的该频率及该振幅。在本较佳实施例中,该频率为该声音段中频率值为较高者,该振幅该声音段中振幅值为较大者。
该文字分析器23用以对该来源数据的该文字数据进行分析以得到该语义数据组,其中,对于该文字数据的其中一文字段(word segmentation),该文字分析器23根据一关键字(key word)集合进行比对,以自该文字段中撷取出具有代表性的至少一关键字;该文字分析器23还根据该文字段持续的一时间间隔及一总字数,以求得对应该文字段的一文字速度;该语义数据组还包括对应该文字段的该关键字及该文字速度。在本较佳实施例中,该关键字集合预先建立并储存于该关键字数据库26中,该关键字集合包括常用的关键词汇,例如,专有名词、地名等,该关键字数据库26还可随着使用上的需要而扩充并更新内容。
该语义分类单元24用以对该语义数据组进行语义/类别对应分类,以将该语义数据组的内容对应分类至所属的至少一语义类别,借此产生包括该语义类别的一语义类别联集(union)。在本较佳实施例中,该语义分类单元24根据一语义/类别关联(relation)组,对该语义数据组进行语义/类别对应分类,且产生的该语义类别联集包括多数个语义类别。其中,该语义/类别关联组预先建立并储存于该语义/类别数据库27中,该语义/类别关联组包括一亮度值/类别对应关联、一对比值/类别对应关联、一影像物件/类别对应关联、一频率/类别对应关联、一振幅/类别对应关联、一关键字/类别对应关联,及一文字速度/类别对应关联;该语义/类别关联组借由统计大量的数位多媒体数据建立而成,主要是用于将该语义数据组的内容对应至有特定意义的语义类别,该语义/类别关联组如下表1所示。
表1
该视觉处理模块3包括一视觉参数产生单元31,及耦接于该视觉参数产生单元31的一视觉后制单元32。
该视觉参数产生单元31用以接收该语义类别联集,并根据该语义类别联集的该等语义类别产生一视觉参数组。其中,该视觉参数产生单元31根据预先建立的一语义类别/调整参数关联、一语义类别/字幕参数关联、一语义类别/文字参数关联,及该语义类别联集的各语义类别,以得到该视觉参数组。在本较佳实施例中,该语义类别/调整参数关联、该语义类别/字幕参数关联,及语义类别/文字参数关联为整合于程式的多数个判断条件,不过,该语义类别/调整参数关联、该语义类别/字幕参数关联,及语义类别/文字参数关联也可预先建立于一数据库(图未示)中,并不限于本较佳实施例所揭露;该语义类别/调整参数关联是根据该语义类别联集中各语义类别,及其等的交集或联集,对应判断出用以调整单张影像的该视觉参数组,其包括一特效滤镜(filter)、一背景对比调整参数、一背景亮度调整参数组;该语义类别/字幕参数关联是根据该语义类别联集中各语义类别,及其等的交集或联集,对应判断出与一语义强化字幕相关的该视觉参数组,其包括对应该语义强化字幕的一字体大小、一颜色、一字型,及一字幕特效其中至少一者。
该视觉后制单元32用以根据该视觉参数组产生至少一视觉效果,并将该来源数据的该影像数据结合该视觉效果后一同输出并显示,其中,该视觉效果可为动态视觉效果或静态视觉效果。该视觉效果包括用于对该影像数据进行影像调整处理的一单张影像特效、用于与该影像数据进行叠合显示的该语义强化字幕,及用于对该文字数据进行调整处理的一文字调整特效其中至少一者。值得一提的是,该视觉后制单元32的详细实作方式为熟习此项技术者所熟知,且目前已存在许多与视觉后制相关的软体,所以不在此赘述。
参阅图1、图2,与图3,对应上述较佳实施例,以下配合一基于语义的视觉效果产生方法及一应用范例,以对该来源数据分类模块1、该语义处理模块2,及该视觉处理模块3彼此间的互动作出说明。其中,该基于语义的视觉效果产生方法包含下列步骤。
如步骤S41所示,该来源数据分类模块1对一来源数据进行分类,以得到一影像数据、一声音数据,及一文字数据。
在本应用范例中,该来源数据为一附有字幕的数位影音数据,该影像数据的其中一影像5及该文字数据的其中一文字段6如图3所示;其中,该文字段6为一段字幕的内容,即,“剑湖山游乐场将加码演出火药爆破秀”,该声音数据的其中一声音段为对应该文字段6的一段声音。
如步骤S42所示,该语义处理模块2的该影像分析器21、该声音分析器22,及该文字分析器23分别对步骤S41分类出的该影像、声音及文字数据进行语义分析,以得到相关于该来源数据的一语义数据组。
在本应用范例中,该语义数据组包括:对应该影像5的一亮度值(假设值为135)、一对比值(假设值为90)与一重要物件51(假设为一摩天轮)、对应该声音段的一频率(假设为350赫兹)与两个振幅(假设分别为70分贝及80分贝)、多个关键字(假设为剑湖山、火药、爆破秀),及一文字速度(假设为80字/分)。
如步骤S43所示,该语义处理模块2的该语义分类单元24根据表1所示的该语义/类别关联组,分别将步骤S42求得的该亮度值、该对比值、该重要物件、该频率、该振幅、该等关键字,及该文字速度对应分类至所属的多数个语义类别,并产生出包括该等语义类别的一语义类别联集。
在本应用范例中,该亮度值(135)分类至一亮度类别_3,其指示该影像5的亮度为高亮度;该对比值(90)分类至一对比类别_5,其指示该影像5的对比为中偏高对比;该重要物件51(摩天轮)分类至一影像物件类别_2,其指示该影像5与游乐场有关;该频率(350赫兹)分类至一频率类别_6,其指示该声音段为高亢的女性声音;该等振幅(70分贝及80分贝)同样分类至一振幅类别_7,其指示该声音段为大音量;该等关键字(剑湖山、火药、爆破秀)分别分类至一关键字类别_7、一关键字类别_10,及一关键字类别_3,其等分别指示一游乐场名称、一专有名词,及一活动名称;该文字速度(80字/分)分类至一文字速度类别_4,其指示说话速度为快速。
又,假设根据预先进行的统计,“高亮度”代表该影像5的意象为快乐、“中偏高对比”代表该影像5的意象为快乐或活泼、“与游乐场有关”代表该影像5的意象为快乐、“高亢”代表的情绪为兴奋或激动、“大音量”代表的情绪为激动、“游乐场名称、专有名词,及活动名称”代表的情境为热闹、“快速的说话速度”代表的情绪为兴奋或激动。该语义分类单元24所产生的该语义类别联集表示如下:{亮度类别_3,对比类别_5,影像物件类别_2}+剑湖山{关键字类别_7}+火药{振幅类别_7,关键字类别_10}+爆破秀{频率类别_6,振幅类别_7,关键字类别_3},由此可知,该语义类别联集可反映出该来源数据的内涵。
如步骤S44所示,该视觉处理模块3的该视觉参数产生单元31根据该语义类别/调整参数关联、该语义类别/字幕参数关联、该语义类别/文字参数关联,及步骤S43求得的该语义类别联集的该等语义类别,得到该视觉参数组。
在本应用范例中,该视觉参数产生单元31根据该语义类别/调整参数关联,及该亮度类别_3、该对比类别_5、该影像物件类别_2进行判断,所得到的该视觉参数组为用以将该影像5的背景调亮的一背景亮度调整参数组;该视觉参数产生单元31根据该语义类别/字幕参数关联,及该频率类别_6、该振幅类别_7、该关键字类别_7、该文字速度类别_4进行判断,所得到的该视觉参数组包括一字体大小为大字体、一颜色为橘色、一字型为粗体阴影,及一字幕特效为火焰特效;再者,由于该语义类别联集中,火药{振幅类别_7,关键字类别_10}+爆破秀{频率类别_6,振幅类别_7,关键字类别_3}指示出火药及爆破秀不但是关键字,且被以较大音量、较高频率念出,所以,该视觉参数产生单元31选择这两笔关键字作为一字幕内容;该视觉参数产生单元31根据该语义类别/文字参数关联,及该关键字类别_7进行判断,所得到的该视觉参数组为:对该文字数据中对应该关键字类别_7的文字(即,剑湖山)进行一字体加大的调整参数组。
参阅图1、图2,与图4,如步骤S45-S46所示,该视觉处理模块3的该视觉后制单元32根据步骤S44求得的该视觉参数组产生对应的数种视觉效果,并将该来源数据的该影像数据结合该等视觉效果后一同输出并显示。
在本应用范例中,该视觉后制单元32根据该背景亮度调整参数组调亮该影像5的一背景52以供后续输出及显示;该视觉后制单元32还根据该字体大小、该颜色、该字型、该字幕特效,及该字幕内容产生如图4所示的一语义强化字幕7,并将该语义强化字幕7叠合于该影像5以供后续输出及显示;该视觉后制单元32还根据该字体加大的调整参数组,对该文字数据6中对应该关键字类别_7的文字61进行字体加大;不过,该文字调整特效并不限于对该文字数据的特定文字作字体调整,也可对该文字数据6进行新增或删除等调整,举例来说,若与该文字数据6相关的语义类别指示为不文雅的字眼,针对这些不文雅的字眼可进行打叉、删除,或置换为空格(space)。
参阅图1、图4,与图5,该视觉参数产生单元31所产生的该字幕特效也可为动画字幕特效,该视觉后制单元32可根据该字幕特效产生具有动画效果的该语义强化字幕7,像是,图4与图5该语义强化字幕7中,“爆破秀”的阴影部分可以来回旋转;而该视觉参数产生单元31所产生的该字幕特效也可为特定的一动画特效,像是,图4与图5中可以抖动闪烁的火焰特效。
值得一提的是,在本范例中,以单张影像5进行说明,但是,该视觉后制单元32也可对包括一连串影像的视讯进行类似的处理,并不限于本范例所揭露。
综上所述,本发明具有下述功效:
借由该语义处理模块2产生该语义类别联集,并借由该视觉处理模块3产生对应的该视觉效果以对该来源数据进行视觉强化处理后输出;让使用者可以同时看到该来源数据,以及反映出该来源数据的内涵的视觉效果,的确带给使用者更深一层的视觉感受,所以确实能达成本发明的目的。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (12)
1.一种基于语义的视觉效果产生系统,其特征在于其包含:
一语义处理模块,包括一语义分类单元,该语义分类单元用以接收相关于一来源数据的一语义数据组,并用以对该语义数据组进行语义/类别对应分类,以将该语义数据组的内容对应分类至所属的至少一语义类别,借此产生包括该语义类别的一语义类别联集,该来源数据包括一影像数据,及一声音数据与一文字数据两者其中至少一者;及
一视觉处理模块,包括一视觉参数产生单元,及一视觉后制单元,该视觉参数产生单元用以接收该语义类别联集,并根据该语义类别联集以得到一视觉参数组,该视觉后制单元用以根据该视觉参数组产生至少一视觉效果,并将该来源数据的该影像数据结合该视觉效果后进行显示。
2.如权利要求1所述的基于语义的视觉效果产生系统,其特征在于其中所述的语义处理模块还包括一影像分析器,用以对该来源数据的该影像数据进行分析以得到该语义数据组,其中,对于该影像数据的其中一影像,该影像分析器求得对应该影像的一亮度值,该语义数据组包括对应该影像的该亮度值,且该语义分类单元根据预先建立的一亮度值/类别对应关联,将该亮度值对应分类至所属的语义类别。
3.如权利要求1所述的基于语义的视觉效果产生系统,其特征在于其中所述的语义处理模块还包括一影像分析器,用以对该来源数据的该影像数据进行分析以得到该语义数据组,其中,对于该影像数据的其中一影像,该影像分析器求得对应该影像的一对比值,该语义数据组包括对应该影像的该对比值,且该语义分类单元根据预先建立的一对比值/类别对应关联,将该对比值对应分类至所属的语义类别。
4.如权利要求1所述的基于语义的视觉效果产生系统,其特征在于其中所述的语义处理模块还包括一影像分析器,用以对该来源数据的该影像数据进行分析以得到该语义数据组,其中,对于该影像数据的其中一影像,该影像分析器根据预先建立的一影像物件集合进行比对,以自该影像中撷取出至少一重要物件,该语义数据组包括该重要物件,该语义分类单元根据预先建立的一影像物件/类别对应关联,将该重要物件对应分类至所属的语义类别。
5.如权利要求1所述的基于语义的视觉效果产生系统,其特征在于其中所述的语义处理模块还包括一声音分析器,该来源数据包括该影像数据及该声音数据,该声音分析器用以对该声音数据进行分析以得到该语义数据组,其中,对于该声音数据的其中一声音段,该声音分析器求得对应该声音段的至少一频率,该语义数据组包括对应该声音段的该频率,该语义分类单元根据预先建立的一频率/类别对应关联,将该频率对应分类至所属的语义类别。
6.如权利要求1所述的基于语义的视觉效果产生系统,其特征在于其中所述的语义处理模块还包括一声音分析器,该来源数据包括该影像数据及该声音数据,该声音分析器用以对该声音数据进行分析以得到该语义数据组,其中,对于该声音数据的其中一声音段,该声音分析器求得对应该声音段的至少一振幅,该语义数据组包括对应该声音段的该振幅,该语义分类单元根据预先建立的一振幅/类别对应关联,将该振幅对应分类至所属的语义类别。
7.如权利要求1所述的基于语义的视觉效果产生系统,其特征在于其中所述的语义处理模块还包括一文字分析器,该来源数据包括该影像数据及该文字数据,该文字分析器用以对该文字数据进行分析以得到该语义数据组,其中,对于该文字数据的其中一文字段,该文字分析器根据预先建立的一关键字集合进行比对,以自该文字段中撷取出至少一关键字,该语义数据组包括对应该文字段的该关键字,该语义分类单元根据预先建立的一关键字/类别对应关联,将该关键字对应分类至所属的语义类别。
8.如权利要求1所述的基于语义的视觉效果产生系统,其特征在于其中所述的语义处理模块还包括一文字分析器,该来源数据包括该影像数据及该文字数据,该文字分析器用以对该文字数据进行分析以得到该语义数据组,其中,对于该文字数据的其中一文字段,该文字分析器求得对应该文字段的一文字速度,该语义数据组包括对应该文字段的该文字速度,该语义分类单元根据预先建立的一文字速度/类别对应关联,将该文字速度对应分类至所属的语义类别。
9.如权利要求1所述的基于语义的视觉效果产生系统,其特征在于其中所述的视觉效果为对该来源数据的该影像数据进行影像调整处理的一单张影像特效,该视觉参数产生单元根据预先建立的一语义类别/调整参数关联,及该语义类别联集,以得到该视觉参数组。
10.如权利要求1所述的基于语义的视觉效果产生系统,其特征在于其中所述的视觉效果为用于与该来源数据的该影像数据进行叠合显示的一语义强化字幕,该视觉参数产生单元根据预先建立的一语义类别/字幕参数关联,及该语义类别联集,以得到该视觉参数组。
11.如权利要求10所述的基于语义的视觉效果产生系统,其特征在于其中所述的视觉参数组包括对应该语义强化字幕的一字体大小、一颜色、一字型,及一字幕特效其中至少一者。
12.如权利要求1所述的基于语义的视觉效果产生系统,其特征在于其中所述的来源数据包括该影像数据及该文字数据,该视觉效果为对该文字数据进行调整处理的一文字调整特效,该视觉参数产生单元根据预先建立的一语义类别/文字参数关联,及该语义类别联集,以得到该视觉参数组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105172491A CN102455847A (zh) | 2010-10-15 | 2010-10-15 | 基于语义的视觉效果产生系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105172491A CN102455847A (zh) | 2010-10-15 | 2010-10-15 | 基于语义的视觉效果产生系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102455847A true CN102455847A (zh) | 2012-05-16 |
Family
ID=46039085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010105172491A Pending CN102455847A (zh) | 2010-10-15 | 2010-10-15 | 基于语义的视觉效果产生系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102455847A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103927372A (zh) * | 2014-04-24 | 2014-07-16 | 厦门美图之家科技有限公司 | 一种基于用户语义的图像处理方法 |
CN108366284A (zh) * | 2017-01-25 | 2018-08-03 | 晨星半导体股份有限公司 | 影像处理装置以及影像处理方法 |
CN111813470A (zh) * | 2020-06-12 | 2020-10-23 | 北京邮电大学 | 一种初始交互界面优化方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1710613A (zh) * | 2004-06-16 | 2005-12-21 | 甲尚股份有限公司 | 自动产生动画的系统与方法 |
CN1716976A (zh) * | 2004-06-30 | 2006-01-04 | 阿瓦雅技术公司 | 智能铃声 |
WO2006064455A1 (en) * | 2004-12-14 | 2006-06-22 | Koninklijke Philips Electronics N.V. | Method and system for synthesizing a video message |
CN1860504A (zh) * | 2003-09-30 | 2006-11-08 | 皇家飞利浦电子股份有限公司 | 用于视听内容合成的系统和方法 |
CN101546587A (zh) * | 2008-03-25 | 2009-09-30 | 国际商业机器公司 | 在播放歌曲时自动显示视觉元素的方法和装置 |
CN101820475A (zh) * | 2010-05-25 | 2010-09-01 | 拓维信息系统股份有限公司 | 基于智能语义理解的手机彩信生成方法 |
-
2010
- 2010-10-15 CN CN2010105172491A patent/CN102455847A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1860504A (zh) * | 2003-09-30 | 2006-11-08 | 皇家飞利浦电子股份有限公司 | 用于视听内容合成的系统和方法 |
CN1710613A (zh) * | 2004-06-16 | 2005-12-21 | 甲尚股份有限公司 | 自动产生动画的系统与方法 |
CN1716976A (zh) * | 2004-06-30 | 2006-01-04 | 阿瓦雅技术公司 | 智能铃声 |
WO2006064455A1 (en) * | 2004-12-14 | 2006-06-22 | Koninklijke Philips Electronics N.V. | Method and system for synthesizing a video message |
CN101546587A (zh) * | 2008-03-25 | 2009-09-30 | 国际商业机器公司 | 在播放歌曲时自动显示视觉元素的方法和装置 |
CN101820475A (zh) * | 2010-05-25 | 2010-09-01 | 拓维信息系统股份有限公司 | 基于智能语义理解的手机彩信生成方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103927372A (zh) * | 2014-04-24 | 2014-07-16 | 厦门美图之家科技有限公司 | 一种基于用户语义的图像处理方法 |
CN103927372B (zh) * | 2014-04-24 | 2017-09-29 | 厦门美图之家科技有限公司 | 一种基于用户语义的图像处理方法 |
CN108366284A (zh) * | 2017-01-25 | 2018-08-03 | 晨星半导体股份有限公司 | 影像处理装置以及影像处理方法 |
CN111813470A (zh) * | 2020-06-12 | 2020-10-23 | 北京邮电大学 | 一种初始交互界面优化方法及装置 |
CN111813470B (zh) * | 2020-06-12 | 2021-03-23 | 北京邮电大学 | 一种初始交互界面优化方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6370943B2 (ja) | 人工知能に基づく検索結果放送方法及び装置 | |
CN106570106A (zh) | 一种输入过程中将语音信息转化为表情的方法和装置 | |
CN109035919B (zh) | 一种协助用户解决问题的智能装置及系统 | |
CN106250553A (zh) | 一种服务推荐方法及终端 | |
US20210160581A1 (en) | Method and data processing apparatus | |
CN111739556B (zh) | 一种语音分析的系统和方法 | |
CN104836720A (zh) | 交互式通信中进行信息推荐的方法及装置 | |
JP2013521567A (ja) | クライアント・コンピューティング・デバイスを含むシステム、メディア・オブジェクトにタグ付けする方法、および音声タグ付きメディア・オブジェクトを含むデジタル・データベースをサーチする方法 | |
US20040163035A1 (en) | Method for automatic and semi-automatic classification and clustering of non-deterministic texts | |
CN109801349B (zh) | 一种声音驱动的三维动画角色实时表情生成方法和系统 | |
CN109614482A (zh) | 标签的处理方法、装置、电子设备及存储介质 | |
CN103942328B (zh) | 一种视频检索方法及视频装置 | |
CN102855317A (zh) | 一种基于演示视频的多模式索引方法及系统 | |
CN106027485A (zh) | 基于语音交互的富媒体展示方法及系统 | |
CN109920409A (zh) | 一种声音检索方法、装置、系统及存储介质 | |
CN106611603A (zh) | 一种音频处理方法及装置 | |
JP2017016296A (ja) | 画像表示装置 | |
CN107767850A (zh) | 一种演唱评分方法及系统 | |
CN113238654A (zh) | 基于多模态的反应式响应生成 | |
CN102455847A (zh) | 基于语义的视觉效果产生系统 | |
Jänicke et al. | SoundRiver: semantically‐rich sound illustration | |
CN104866091B (zh) | 一种用于在计算机设备中输出音效信息的方法和装置 | |
CN113450804A (zh) | 语音可视化方法、装置、投影设备及计算机可读存储介质 | |
CN111353070B (zh) | 视频标题的处理方法、装置、电子设备及可读存储介质 | |
CN111914115B (zh) | 一种声音信息的处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120516 |