CN110891202B - 分段方法、分段系统及非暂态电脑可读取媒体 - Google Patents

分段方法、分段系统及非暂态电脑可读取媒体 Download PDF

Info

Publication number
CN110891202B
CN110891202B CN201910104946.5A CN201910104946A CN110891202B CN 110891202 B CN110891202 B CN 110891202B CN 201910104946 A CN201910104946 A CN 201910104946A CN 110891202 B CN110891202 B CN 110891202B
Authority
CN
China
Prior art keywords
image
content
mark
sound
paragraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910104946.5A
Other languages
English (en)
Other versions
CN110891202A (zh
Inventor
詹诗涵
柯兆轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Delta Electronics Inc
Original Assignee
Delta Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Delta Electronics Inc filed Critical Delta Electronics Inc
Priority to SG10201906347QA priority Critical patent/SG10201906347QA/en
Publication of CN110891202A publication Critical patent/CN110891202A/zh
Application granted granted Critical
Publication of CN110891202B publication Critical patent/CN110891202B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • G06F16/437Administration of user profiles, e.g. generation, initialisation, adaptation, distribution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Image Analysis (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开内容关于一种分段方法、分段系统及非暂态电脑可读取媒体。该分段方法包含下列步骤:接收影片内容;其中,影片内容包含影像信号以及声音信号;针对影像数据进行分段处理,以产生至少一影像段落标记;针对该声音数据进行分段处理,以产生至少一声音段落标记;以及比较该至少一影像段落标记的一影像标记时间与该至少一声音段落标记的一声音标记时间之间的差异,以产生至少一影片内容标记。

Description

分段方法、分段系统及非暂态电脑可读取媒体
技术领域
本公开内容关于一种分段方法、分段系统及非暂态电脑可读取媒体,且特别是有关于一种针对视频源的分段方法、分段系统及非暂态电脑可读取媒体。
背景技术
线上学习平台是指一种将众多学习资料存储于伺服器中,让使用者能通过网际网络连线至伺服器,以随时浏览学习资料的网络服务。在现行的各类线上学习平台中,提供的学习资料类型包含影片、音频、简报、文件或论坛。
由于线上学习平台中储存的学习资料数量庞大,为了能够方便使用者的使用,需要针对学习资料的影音内容进行自动分段。因此,如何根据学习影片的声音内容以及影像内容之间的关联性进行处理,达到将学习影片自动分段是本领域待解决的问题。
发明内容
本公开内容的第一方面在于提供一种分段方法。该分段方法包含下列步骤:接收影片内容;其中,影片内容包含影像数据以及声音数据;针对影像数据进行分段处理,以产生至少一影像段落标记;针对该声音数据进行分段处理,以产生至少一声音段落标记;以及比较该至少一影像段落标记的一影像标记时间与该至少一声音段落标记的一声音标记时间之间的差异,以产生至少一影片内容标记。
本公开内容的第二方面在于提供一种分段系统,其包含储存单元以及处理器。储存单元用以储存视频源以及至少一影片内容标记。处理器与储存单元电性连接,用以接收影片内容;其中,影片内容包含影像数据以及声音数据,处理器包含:影像分段单元、声音分段单元以及段落标记产生单元。影像分段单元用以针对影像数据进行分段处理,以产生至少一影像段落标记。声音分段单元与影像分段单元电性连接,用以针对声音数据进行分段处理,以产生至少一声音段落标记。段落标记产生单元与影像分段单元以及声音分段单元电性连接,用以比较至少一影像段落标记的影像标记时间与至少一声音段落标记的声音标记时间之间的差异,以产生至少一影片内容标记。
本申请的第三方面在于提供一种非暂态电脑可读取媒体,包含至少一指令程序,由处理器执行至少一指令程序以实行一分段方法,该分段方法包含以下步骤:接收影片内容;其中,影片内容包含影像数据以及声音数据;针对影像数据进行分段处理,以产生至少一影像段落标记;针对该声音数据进行分段处理,以产生至少一声音段落标记;以及比较该至少一影像段落标记的一影像标记时间与该至少一声音段落标记的一声音标记时间之间的差异,以产生至少一影片内容标记。
本公开的分段方法、分段系统及非暂态电脑可读取媒体,其主要是改进以往利用人工方式进行影片段落标记,耗费大量人力以及时间的问题。分别针对影像信号以及声音信号进行段落标记,再根据影像信号的段落标记以及声音信号的段落标记产生影片内容标记,达到将学习影片自动分段的功能。
附图说明
为让本申请内容的上述和其他目的、特征、优点与实施例能更明显易懂,对本申请的附图说明如下:
图1为根据本申请的一些实施例所绘示的分段系统的示意图;
图2为根据本申请的一些实施例所绘示的分段方法的流程图;
图3为根据本申请的一些实施例所绘示的步骤S220的流程图;
图4为根据本申请的一些实施例所绘示的步骤S222的流程图;
图5A为根据本申请的一些实施例所绘示的步骤S223的流程图;
图5B为根据本申请的一些实施例所绘示的步骤S223的流程图;以及
图6为根据本申请的一些实施例所绘示的步骤S230的流程图。
【附图标记说明】
100:分段系统
110:储存单元
130:处理器
DB:课程数据库
131:影像分段单元
132:声音分段单元
133:段落标记产生单元
200:分段方法
S210~S240、S221~S223、S2221~S2223、S2231a~S2233a、S2231b~S2233b、S231~S233:步骤
具体实施方式
以下将参照图示披露本申请的多个实施方式,为明确说明起见,许多实务上的细节将在以下叙述中一并说明。然而,应了解到,这些实务上的细节不应用以限制本申请。也就是说,在本公开内容部分实施方式中,这些实务上的细节是非必要的。此外,为简化图示起见,一些公知惯用的结构与元件在图示中将以简单示意的方式被绘示。
于本文中,当一元件被称为“连接”或“耦接”时,可指“电性连接”或“电性耦接”。“连接”或“耦接”亦可用以表示两个或多个元件间相互搭配操作或互动。此外,虽然本文中使用“第一”、“第二”、…等用语描述不同元件,该用语仅是用以区别以相同技术用语描述的元件或操作。除非上下文清楚指明,否则该用语并非特别指称或暗示次序或顺位,亦非用以限定本发明。
请参阅图1。图1为根据本申请的一些实施例所绘示的分段系统100的示意图。如图1所绘示,分段系统100包含存储单元110以及处理器130。存储单元110电性连接至处理器130,存储单元110用以存储视频源、至少一影片内容标记以及课程数据库DB。
承上述,处理器130包含影像分段单元131、声音分段单元132以及段落标记产生单元133。声音分段单元132与影像分段单元131以及段落标记产生单元133电性连接。于本发明各实施例中,存储装置110可以实施为存储装置、硬盘、随身盘、存储卡等。处理器130可以实施为集成电路如微控制单元(microcontroller)、微处理器(microprocessor)、数字信号处理器(digital signal processor)、特殊应用集成电路(application specificintegrated circuit,ASIC)、逻辑电路或其他类似元件或上述元件的组合。
请参阅图2。图2为根据本申请的一些实施例所绘示的分段方法200的流程图。于一实施例中,图2所示的分段方法200可以应用于图1的分段系统100上,处理器130用以根据下列分段方法200所描述的步骤,针对影像数据以及声音信号进行段落标记以产生影片内容标记。如图2所示,分段方法200首先执行步骤S210接收影片内容。于一实施例中,影片内容包含影像数据以及声音数据。处理器130会分别针对影像数据以及声音数据进行处理,在接下来的步骤中会先针对影像数据进行计算,再针对声音数据进行计算,但本公开不限于此,也可以先针对声音数据进行计算,再针对影像数据进行计算。
接着,分段方法200执行步骤S220针对影像数据进行分段处理,以产生至少一影像段落标记。于一实施例中,步骤S220还包含步骤S221~S223,请一并参考图3,图3为根据本申请的一些实施例所绘示的步骤S220的流程图。如图3所示,分段方法200进一步执行步骤S221,选取M个单位的影像数据,并将被选取的影像数据分为当前影像段落。于一实施例中,M个单位以M秒来说明,M个单位也可以实施为M个帧,本公开不以此为限。M秒可以根据影片内容的时间长度进行调整,在此M秒以30秒为例,因此在此步骤中将第0秒的影像数据~第30秒的影像数据作为当前影像段落。
接着,分段方法200执行步骤S222针对当前影像段落的内容进行判断,以产生影像内容结果。其中影像内容结果包含动态内容以及静态内容。于一实施例中,步骤S222还包含步骤S2221~S2223,请一并参考图4,图4为根据本申请的一些实施例所绘示的步骤S222的流程图。如图4所示,分段方法200进一步执行步骤S2221,于当前影像段落中选取T个单位,计算T个单位内的影像的相似度,产生影像差异结果。于一实施例中,T个单位以T秒来说明,T个单位也可以实施为T个帧,本公开不以此为限。举例而言,T秒在此以3秒为例,并假设每秒有60帧,差异计算可以是第1秒的第30帧的影像的灰阶值与第0秒的第30帧的影像的灰阶值相减可以产生第1秒的影像差异值,并可以仅利用第1秒的影像差异值作为影像差异结果以判断影像的内容。于另一实施例中,除了利用第1秒的影像差异值之外,可以再利用第2秒的影像差异值以及第3秒的影像差异值作为影像差异结果以判断影像的内容,由上述可知,利用的影像差异值越多可以更精准的判断影像的内容。
接着,分段方法200执行步骤S2222,如果影像差异结果大于第一影像门槛值,将当前影像段落的内容判定为动态内容。接续上方实施例,如果影像差异值大于第一影像门槛值,表示前后两秒的画面差异很大,因此当前影像段落的内容有可能是动态内容。接着,分段方法200执行步骤S2223如果影像差异结果不大于该第一影像门槛值,将当前影像段落的内容判定为静态内容。于一实施例中,如果影像差异值小于或等于第一影像门槛值,表示前后两秒的画面是属于类似的画面,因此当前影像段落的内容有可能是静态内容,表示画面不太有改变。
接着,分段方法200执行步骤S223,基于影像内容结果针对影像数据探测变化内容,并在变化内容的时间位置产生至少一影像段落标记。于一实施例中,步骤S223还包含步骤S2231a~S2233a,请一并参考图5A,图5A为根据本申请的一些实施例所绘示的步骤S223的流程图。如图5A所示,分段方法200进一步执行步骤S2231a如果当前影像段落的内容为动态内容,计算第M个单位的影像与第M+1个单位的影像之间的相似度,以产生影像差异值。接续上述实施例,M秒以30秒为例,当前影像段落是从第0秒的影像数据~第30秒的影像数据,第M秒的影像数据即为第30秒的影像数据,第M+1秒的影像数据即为第31秒的影像数据。在此情况下可以选择第31秒的第30帧的影像的灰阶值与第30秒的第30帧的影像的灰阶值相减,以产生影像差异值,也可以选择其他帧的影像以计算影像差异值。
承上述,分段方法200进一步执行步骤S2232a如果影像差异值大于第二影像门槛值,将第M+1个单位的影像与当前影像段落合并。接续上方实施例,如果前述的影像差异值大于第二影像门槛值,表示当前影像段落的下一秒的影像仍然是属于动态影像,因此可以将第31秒的影像数据合并进入当前影像段落。接着,分段方法200进一步执行步骤S2233a如果影像差异值不大于第二影像门槛值,在第M+1个单位的影像的时间位置产生至少一影像段落标记,并选取M个单位的该影像数据,将被选取的影像数据分为下一影像段落。承上述,如果前述的影像差异值小于或等于第二影像门槛值,表示当前影像段落的下一秒的影像可能是属于静态影像,因此需要在将影像数据第31秒的时间位置,产生影像段落标记,如此一来当前执行段落变成第31秒的影像数据~第60秒的影像数据。
承上述,步骤S223还包含步骤S2231b~S2233b,请一并参考图5B,图5B为根据本申请的一些实施例所绘示的步骤S223的流程图。如图5B所示,分段方法200进一步执行步骤S2231b,如果当前影像段落的内容为静态内容,计算第M个单位的影像与第M+1个单位的影像之间的相似度,以产生影像差异值。步骤S2231b的操作与步骤S2231a的操作相同,在此不在赘述。
承上述,分段方法200进一步执行步骤S2232b,如果影像差异值不大于第二影像门槛值,将第M+1个单位的影像与当前影像段落合并。接续上方实施例,如果前述的影像差异值小于或等于第二影像门槛值,表示当前影像段落的下一秒的影像仍然是属于静态影像,因此可以将第31秒的影像数据合并进入当前影像段落。接着,分段方法200进一步执行步骤S2233b如果影像差异值大于第二影像门槛值,在第M+1个单位的影像的时间位置产生至少一影像段落标记,并选取M个单位的该影像数据,将被选取的影像数据分为下一影像段落。承上述,如果前述的影像差异值大于第二影像门槛值,表示当前影像段落的下一秒的影像可能是属于动态影像,因此需要在将影像数据第31秒的时间位置,产生影像段落标记,如此一来当前执行段落变成第31秒的影像数据~第60秒的影像数据。
于另一实施例中,可以利用峰值信噪比(Peak signal-to-noise ratio,PSNR)、结构相似性指标(Structural similarity index,SSIM)、影像的纹理或色泽、或是特定的形状(pattern)等方式,来比较影像之间的相似度,本公开不限于此。
接着,分段方法200进一步执行步骤S230针对声音数据进行分段处理,以产生至少一声音段落标记。其中,步骤S230还包含步骤S231~S233,请进一步参考图6,图6为根据本申请的一些实施例所绘示的步骤S230的流程图。如图6所示,分段方法200进一步执行步骤S231将声音数据分别转换成声音时域信号以及声音频域信号。于一实施例中,可以利用傅立叶转换将声音数据转换成频域信号,但不限于此。经过傅立叶转换过的信号是不连续的信号,因此可以用来探测音色与音调的差异,作为判断声音段落标记的依据。
承上述,分段方法200进一步执行步骤S232从声音时域信号中选取时域区段,并判断时域区段的振幅是否小于第一门槛值,如果时域区段的振幅小于第一门槛值,产生至少一声音段落标记。于此实施例中,利用视窗(window)从声音时域信号中选取时域区段,举例而言,可以将视窗的大小设定为5秒钟,因此时域区段即为5秒钟的声音时域信号。接着,判断5秒钟的声音时域信号(时域区段)的振幅是否小于第一门槛值,如果小于第一门槛值,表示被视窗框选到的5秒钟的声音时域信号,可能是无声的区段,表示声音时域信号可能有中断情况发生。因此可以在时域区段的振幅小于门槛值时,产生声音段落标记。
承上述,分段方法200进一步执行步骤S233从声音频域信号中选取第一频域区段以及第二频域区段,计算第一频域区段与第二频域区段的频谱强度差异值(相位大小)是否大于第二门槛值,若超过第二门槛值,产生至少一声音段落标记。于此实施例中,利用视窗从声音频域信号中选取频域区段。举例而言,可以将视窗的大小设定为m秒钟,因此第一频域区段以及第二频域区段即为m秒钟的声音频域信号(两者选取的声音频域信号不同)。声音时域信号以及声音频域信号所利用的视窗大小(长度)可以不同,也可以相同,本公开不限于此。接着,判断第一频域区段以及第二频域区段的频谱强度差异值是否超过第二门槛值。如果大于第二门槛值,表示被视窗框选到的m秒钟的声音频域信号,可能有不同的音色或是音高,表示可能有不同人声出现。因此可以在频域区段的频谱强度差异值大于第二门槛值时,产生声音段落标记。
接着,分段方法200进一步执行步骤S240比较至少一影像段落标记的影像标记时间与至少一声音段落标记的声音标记时间之间的差异,以产生至少一影片内容标记。于一实施例中,步骤S220以及步骤S230分别针对影像数据以及声音数据进行段落标记,在此步骤中需要将影像段落标记与声音段落标记整合以产生影片内容标记。举例而言,如果影像数据总共分成五个段落,并且影像段落标记分别是段落一的(00:45)、段落二的(01:56)、段落三的(03:25)、段落四的(05:10)以及段落五的(05:55),而声音数据总共分成四个段落,声音段落标记分别是段落一的(02:02)、段落二的(03:12)、段落三的(04:30)以及段落四的(05:00)。假设门槛值是为15秒,如此一来,在段落二的影像段落标记01:56与段落一的声音段落标记02:02之间的差异在门槛值内,可以根据两者的时间差异的平均值作为影片内容标记,因此视频源具有段落一的影片内容标记(01:59)。接着可以继续找到段落三的影像段落标记03:25与段落二的声音段落标记03:12之间的差异在门槛值内,段落四的影像段落标记05:10与段落四的声音段落标记05:00之间的差异在门槛值内,因此可以分别产生段落二的影片内容标记(03:18)以及段落三的影片内容标记(05:05)。由上述可知,段落一的影像段落标记00:45、段落五的影像段落标记05:55以及段落三的声音段落标记04:30与其他标记之间的时间差异大于门槛值,因此是属于被忽略的段落标记。最后,将分好的影片内容标记储存至储存单元110的课程数据库DB中。
由上述本申请的实施方式可知,主要是改进以往利用人工方式进行影片段落标记,耗费大量人力以及时间的问题。分别针对影像数据以及声音数据进行段落标记,再根据影像数据的段落标记以及声音数据的段落标记产生影片内容标记,达到将学习影片自动分段的功能。
另外,上述例示包含依序的示范步骤,但这些步骤不必依所显示的顺序被执行。以不同顺序执行这些步骤皆在本公开内容的考量范围内。在本公开内容的实施例的精神与范围内的情况下,可视情况增加、取代、变更顺序及/或省略这些步骤。
虽然本公开内容已以实施方式披露如上,但其并非用以限定本发明内容,任何本领域普通技术人员,在不脱离本发明内容的精神和范围内的情况下,当可作各种更动与润饰,因此本发明内容的保护范围当视随附的权利要求书所界定者为准。

Claims (9)

1.一种分段方法,包含:
接收一影片内容;其中,该影片内容包含一影像数据以及一声音数据;
针对该影像数据进行分段处理,以产生至少一影像段落标记;
针对该声音数据进行分段处理,以产生至少一声音段落标记;以及
比较该至少一影像段落标记的一影像标记时间与该至少一声音段落标记的一声音标记时间之间的差异,以产生至少一影片内容标记,其中,所述针对该影像数据进行分段处理,以产生该至少一影像段落标记,还包含:
选取M个单位的该影像数据,并将被选取的影像数据分为一第一影像段落;
针对该第一影像段落的内容进行判断,以产生一影像内容结果;其中该影像内容结果包含一动态内容以及一静态内容;以及
基于该影像内容结果针对该影像数据探测一变化内容,并根据该变化内容的时间位置产生该至少一影像段落标记,其中,所述针对该第一影像段落的内容进行判断,以产生该影像内容结果,还包含:
于该第一影像段落中选取T个单位,计算T个单位内的影像的相似度,产生一影像差异结果;
如果该影像差异结果大于一第一影像门槛值,将该第一影像段落的内容判定为该动态内容;以及
如果该影像差异结果不大于该第一影像门槛值,将该第一影像段落的内容判定为该静态内容。
2.如权利要求1所述的分段方法,其中,所述基于该影像内容结果针对该影像数据探测该变化内容,并根据该变化内容的时间位置产生该至少一影像段落标记,还包含:
如果该第一影像段落的内容为该动态内容,计算一第M个单位的影像与一第M+1个单位的影像之间的相似度,以产生一影像差异值;
如果该影像差异值大于一第二影像门槛值,将该第M+1个单位的影像与该第一影像段落合并;以及
如果该影像差异值不大于该第二影像门槛值,在该第M+1个单位的影像的时间位置产生该至少一影像段落标记,并选取M个单位的该影像数据,将被选取的影像数据分为一第二影像段落。
3.如权利要求1所述的分段方法,其中,所述基于该影像内容结果针对该影像数据探测该变化内容,并在该变化内容的时间位置产生该至少一影像段落标记,还包含:
如果该第一影像段落的内容为该静态内容,计算一第M个单位的影像与一第M+1个单位的影像之间的相似度,以产生一影像差异值;
如果该影像差异值不大于一第二影像门槛值,将该第M+1个单位的影像与该第一影像段落合并;以及
如果该影像差异值大于该第二影像门槛值,在该第M+1个单位的影像的时间位置产生该至少一影像段落标记,并选取M个单位的该影像数据,将被选取的影像数据分为一第二影像段落。
4.如权利要求1所述的分段方法,其中,所述针对该声音数据进行分段处理,以产生该至少一声音段落标记,还包含:
将该声音数据分别转换成一声音时域信号以及一声音频域信号;
从该声音时域信号中选取一时域区段,并判断该时域区段的振幅是否小于一第一门槛值,如果该时域区段的振幅小于该第一门槛值,产生一声音段落标记;以及
从该声音频域信号中选取一第一频域区段以及一第二频域区段,并判断该第一频域区段与该第二频域区段的频谱强度差异值是否大于一第二门槛值,如果该第一频域区段与该第二频域区段的频谱强度差异值大于该第二门槛值,产生一声音段落标记。
5.一种分段系统,包含:
一储存单元,用以储存一影片内容以及至少一影片内容标记;以及
一处理器,与该储存单元电性连接,用以接收该影片内容;其中,该影片内容包含一影像数据以及一声音数据,该处理器包含:
一影像分段单元,用以针对该影像数据进行分段处理,以产生至少一影像段落标记;
一声音分段单元,与该影像分段单元电性连接,用以针对该声音数据进行分段处理,以产生至少一声音段落标记;以及
一段落标记产生单元,与该影像分段单元以及该声音分段单元电性连接,用以比较该至少一影像段落标记的一影像标记时间与该至少一声音段落标记的一声音标记时间之间的差异,以产生该至少一影片内容标记,其中,该影像分段单元还用以选取M个单位的该影像数据,并将被选取的影像数据分为一第一影像段落,接着针对该第一影像段落的内容进行判断,以产生一影像内容结果;其中该影像内容结果包含一动态内容以及一静态内容;以及基于该影像内容结果针对该影像数据探测一变化内容,并根据该变化内容的时间位置产生该至少一影像段落标记,其中,该影像分段单元还用以于该第一影像段落中选取T个单位,计算T个单位内的影像的相似度,产生一影像差异结果;如果该影像差异结果大于一第一影像门槛值,将该第一影像段落的内容判定为该动态内容;以及如果该影像差异结果不大于该第一影像门槛值,将该第一影像段落的内容判定为该静态内容。
6.如权利要求5所述的分段系统,其中,该影像分段单元还用以在该第一影像段落的内容为该动态内容时,计算一第M个单位的影像与一第M+1个单位之间的相似度,以产生一影像差异值;如果该影像差异值大于一第二影像门槛值,将该第M+1个单位的影像与该第一影像段落合并;以及如果该影像差异值不大于该第二影像门槛值,在该第M+1个单位的影像的时间位置产生该至少一影像段落标记,并选取M秒的该影像数据,将被选取的影像数据分为一第二影像段落。
7.如权利要求5所述的分段系统,其中,该影像分段单元还用以在该第一影像段落的内容为该静态内容时,计算一第M个单位的影像与该第M+1个单位的影像之间的相似度,以产生一影像差异值;如果该影像差异值不大于一第二影像门槛值,将该第M+1个单位的影像与该第一影像段落合并;以及如果该影像差异值大于该第二影像门槛值,在该第M+1个单位的影像的时间位置产生该至少一影像段落标记,并选取M个单位的该影像数据,将被选取的影像数据分为一第二影像段落。
8.如权利要求5所述的分段系统,其中,该声音分段单元还用以将该声音数据分别转换成一声音时域信号以及一声音频域信号,从该声音时域信号中选取一时域区段,并判断该时域区段的振幅是否小于一第一门槛值,如果该时域区段的振幅小于该第一门槛值,产生一声音段落标记;以及从该声音频域信号中选取一第一频域区段以及一第二频域区段,并判断该第一频域区段与该第二频域区段的频谱强度差异值是否大于一第二门槛值,如果该第一频域区段与该第二频域区段的频谱强度差异值大于该第二门槛值,产生一声音段落标记。
9.一种非暂态电脑可读取媒体,包含至少一指令程序,由一处理器执行该至少一指令程序以实行一分段方法,所述分段方法包含:
接收一影片内容;其中,该影片内容包含一影像数据以及一声音数据;
针对该影像数据进行分段处理,以产生至少一影像段落标记;
针对该声音数据进行分段处理,以产生至少一声音段落标记;以及
比较该至少一影像段落标记的一影像标记时间与该至少一声音段落标记的一声音标记时间之间的差异,以产生至少一影片内容标记,其中,所述针对该影像数据进行分段处理,以产生该至少一影像段落标记,还包含:
选取M个单位的该影像数据,并将被选取的影像数据分为一第一影像段落;
针对该第一影像段落的内容进行判断,以产生一影像内容结果;其中该影像内容结果包含一动态内容以及一静态内容;以及
基于该影像内容结果针对该影像数据探测一变化内容,并根据该变化内容的时间位置产生该至少一影像段落标记,其中,所述针对该第一影像段落的内容进行判断,以产生该影像内容结果,还包含:
于该第一影像段落中选取T个单位,计算T个单位内的影像的相似度,产生一影像差异结果;
如果该影像差异结果大于一第一影像门槛值,将该第一影像段落的内容判定为该动态内容;以及
如果该影像差异结果不大于该第一影像门槛值,将该第一影像段落的内容判定为该静态内容。
CN201910104946.5A 2018-09-07 2019-02-01 分段方法、分段系统及非暂态电脑可读取媒体 Active CN110891202B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
SG10201906347QA SG10201906347QA (en) 2018-09-07 2019-07-09 Segmentation method, segmentation system and non-transitory computer-readable medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201862728082P 2018-09-07 2018-09-07
US62/728,082 2018-09-07

Publications (2)

Publication Number Publication Date
CN110891202A CN110891202A (zh) 2020-03-17
CN110891202B true CN110891202B (zh) 2022-03-25

Family

ID=69745778

Family Applications (5)

Application Number Title Priority Date Filing Date
CN201910104946.5A Active CN110891202B (zh) 2018-09-07 2019-02-01 分段方法、分段系统及非暂态电脑可读取媒体
CN201910105173.2A Pending CN110889034A (zh) 2018-09-07 2019-02-01 数据分析方法及数据分析系统
CN201910104937.6A Active CN110888896B (zh) 2018-09-07 2019-02-01 数据搜寻方法及其数据搜寻系统
CN201910105172.8A Pending CN110895654A (zh) 2018-09-07 2019-02-01 分段方法、分段系统及非暂态电脑可读取媒体
CN201910266133.6A Pending CN110888994A (zh) 2018-09-07 2019-04-03 多媒体数据推荐系统及多媒体数据推荐方法

Family Applications After (4)

Application Number Title Priority Date Filing Date
CN201910105173.2A Pending CN110889034A (zh) 2018-09-07 2019-02-01 数据分析方法及数据分析系统
CN201910104937.6A Active CN110888896B (zh) 2018-09-07 2019-02-01 数据搜寻方法及其数据搜寻系统
CN201910105172.8A Pending CN110895654A (zh) 2018-09-07 2019-02-01 分段方法、分段系统及非暂态电脑可读取媒体
CN201910266133.6A Pending CN110888994A (zh) 2018-09-07 2019-04-03 多媒体数据推荐系统及多媒体数据推荐方法

Country Status (4)

Country Link
JP (3) JP6829740B2 (zh)
CN (5) CN110891202B (zh)
SG (5) SG10201905236WA (zh)
TW (5) TWI699663B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI756703B (zh) * 2020-06-03 2022-03-01 南開科技大學 數位學習系統及其方法

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07311539A (ja) * 1994-05-17 1995-11-28 Hitachi Ltd 教材編集支援システム
KR100250540B1 (ko) * 1996-08-13 2000-04-01 김광수 캡션 비디오 cd 재생장치를 이용한 외국어 받아쓰기 학습방법
JP2002041823A (ja) * 2000-07-27 2002-02-08 Nippon Telegr & Teleph Corp <Ntt> 情報配信装置、情報受信装置及び情報配信システム
JP3685733B2 (ja) * 2001-04-11 2005-08-24 株式会社ジェイ・フィット マルチメディアデータ検索装置、マルチメディアデータ検索方法およびマルチメディアデータ検索プログラム
JP2002341735A (ja) * 2001-05-16 2002-11-29 Alice Factory:Kk ブロードバンド・ディジタル・ラーニング・システム
CN1432932A (zh) * 2002-01-16 2003-07-30 陈雯瑄 英文测验及成绩评估方法及系统
TW200411462A (en) * 2002-12-20 2004-07-01 Hsiao-Lien Wang A method for matching information exchange on network
KR101109023B1 (ko) * 2003-04-14 2012-01-31 코닌클리케 필립스 일렉트로닉스 엔.브이. 콘텐트 분석을 사용하여 뮤직 비디오를 요약하는 방법 및 장치
JP4471737B2 (ja) * 2003-10-06 2010-06-02 日本電信電話株式会社 グループ化条件決定装置と方法およびそれを用いたキーワード拡張装置と方法ならびにコンテンツ検索システムおよびコンテンツ情報提供システムと方法ならびにプログラム
JP4426894B2 (ja) * 2004-04-15 2010-03-03 株式会社日立製作所 文書検索方法、文書検索プログラムおよびこれを実行する文書検索装置
JP2005321662A (ja) * 2004-05-10 2005-11-17 Fuji Xerox Co Ltd 学習支援装置および方法
JP2006003670A (ja) * 2004-06-18 2006-01-05 Hitachi Ltd 教育コンテンツ提供システム
JP2008535017A (ja) * 2005-03-31 2008-08-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 以前の試験に基づき講義を増補させる方法
US9058406B2 (en) * 2005-09-14 2015-06-16 Millennial Media, Inc. Management of multiple advertising inventories using a monetization platform
WO2008023470A1 (fr) * 2006-08-21 2008-02-28 Kyoto University Procédé de recherche de phrase, moteur de recherche de phrase, programme informatique, support d'enregistrement et stockage de document
TW200825900A (en) * 2006-12-13 2008-06-16 Inst Information Industry System and method for generating wiki by sectional time of handout and recording medium thereof
JP5010292B2 (ja) * 2007-01-18 2012-08-29 株式会社東芝 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法
JP5158766B2 (ja) * 2007-10-23 2013-03-06 シャープ株式会社 コンテンツ選択装置、テレビジョン、コンテンツ選択プログラム及び記憶媒体
TW200923860A (en) * 2007-11-19 2009-06-01 Univ Nat Taiwan Science Tech Interactive learning system
CN101382937B (zh) * 2008-07-01 2011-03-30 深圳先进技术研究院 基于语音识别的多媒体资源处理方法及其在线教学系统
US8140544B2 (en) * 2008-09-03 2012-03-20 International Business Machines Corporation Interactive digital video library
CN101453649B (zh) * 2008-12-30 2011-01-05 浙江大学 压缩域视频流的关键帧提取方法
JP5366632B2 (ja) * 2009-04-21 2013-12-11 エヌ・ティ・ティ・コミュニケーションズ株式会社 検索サポートキーワード提示装置、方法及びプログラム
JP5493515B2 (ja) * 2009-07-03 2014-05-14 富士通株式会社 携帯端末装置、情報検索方法および情報検索プログラム
CN102822882B (zh) * 2010-01-15 2016-02-03 阿波洛集团公司 动态推荐学习内容
JP2012038239A (ja) * 2010-08-11 2012-02-23 Sony Corp 情報処理装置、情報処理方法、及び、プログラム
US8839110B2 (en) * 2011-02-16 2014-09-16 Apple Inc. Rate conform operation for a media-editing application
CN102222227B (zh) * 2011-04-25 2013-07-31 中国华录集团有限公司 基于视频识别与提取影片图像的系统
CN102348049B (zh) * 2011-09-16 2013-09-18 央视国际网络有限公司 检测视频片断切点位置的方法及装置
CN102509007A (zh) * 2011-11-01 2012-06-20 北京瑞信在线系统技术有限公司 多媒体教学评估方法及系统、装置以及多媒体教学系统
JP5216922B1 (ja) * 2012-01-06 2013-06-19 Flens株式会社 学習支援サーバ、学習支援システム、及び学習支援プログラム
US9846696B2 (en) * 2012-02-29 2017-12-19 Telefonaktiebolaget Lm Ericsson (Publ) Apparatus and methods for indexing multimedia content
US20130263166A1 (en) * 2012-03-27 2013-10-03 Bluefin Labs, Inc. Social Networking System Targeted Message Synchronization
US9058385B2 (en) * 2012-06-26 2015-06-16 Aol Inc. Systems and methods for identifying electronic content using video graphs
TWI513286B (zh) * 2012-08-28 2015-12-11 Ind Tech Res Inst 影片續播方法及系統
CN102937972B (zh) * 2012-10-15 2016-06-22 上海外教社信息技术有限公司 一种视听字幕制作系统及方法
WO2014100893A1 (en) * 2012-12-28 2014-07-03 Jérémie Salvatore De Villiers System and method for the automated customization of audio and video media
JP6205767B2 (ja) * 2013-03-13 2017-10-04 カシオ計算機株式会社 学習支援装置、学習支援方法、学習支援プログラム、学習支援システム、およびサーバ装置
TWI549498B (zh) * 2013-06-24 2016-09-11 wu-xiong Chen Variable audio and video playback method
CN104572716A (zh) * 2013-10-18 2015-04-29 英业达科技有限公司 影音文件播放的系统及其方法
KR101537370B1 (ko) * 2013-11-06 2015-07-16 주식회사 시스트란인터내셔널 녹취된 음성 데이터에 대한 핵심어 추출 기반 발화 내용 파악 시스템과, 이 시스템을 이용한 인덱싱 방법 및 발화 내용 파악 방법
US20150206441A1 (en) * 2014-01-18 2015-07-23 Invent.ly LLC Personalized online learning management system and method
CN104123332B (zh) * 2014-01-24 2018-11-09 腾讯科技(深圳)有限公司 搜索结果的显示方法及装置
US9892194B2 (en) * 2014-04-04 2018-02-13 Fujitsu Limited Topic identification in lecture videos
US9253511B2 (en) * 2014-04-14 2016-02-02 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods for performing multi-modal video datastream segmentation
JP6334431B2 (ja) * 2015-02-18 2018-05-30 株式会社日立製作所 データ分析装置、データ分析方法、およびデータ分析プログラム
US20160239155A1 (en) * 2015-02-18 2016-08-18 Google Inc. Adaptive media
CN104978961B (zh) * 2015-05-25 2019-10-15 广州酷狗计算机科技有限公司 一种音频处理方法、装置及终端
CN105047203B (zh) * 2015-05-25 2019-09-10 广州酷狗计算机科技有限公司 一种音频处理方法、装置及终端
TWI571756B (zh) * 2015-12-11 2017-02-21 財團法人工業技術研究院 用以分析瀏覽記錄及其文件之方法及其系統
CN105978800A (zh) * 2016-07-04 2016-09-28 广东小天才科技有限公司 一种向移动终端推送题目的方法、系统和服务器
CN106202453B (zh) * 2016-07-13 2020-08-04 网易(杭州)网络有限公司 一种多媒体资源推荐方法和装置
CN106231399A (zh) * 2016-08-01 2016-12-14 乐视控股(北京)有限公司 视频分割方法、设备以及系统
CN106331893B (zh) * 2016-08-31 2019-09-03 科大讯飞股份有限公司 实时字幕显示方法及系统
CN108122437A (zh) * 2016-11-28 2018-06-05 北大方正集团有限公司 自适应学习方法及装置
CN107256262B (zh) * 2017-06-13 2020-04-14 西安电子科技大学 一种基于物体检测的图像检索方法
CN107623860A (zh) * 2017-08-09 2018-01-23 北京奇艺世纪科技有限公司 多媒体数据分割方法和装置

Also Published As

Publication number Publication date
JP6829740B2 (ja) 2021-02-10
TWI699663B (zh) 2020-07-21
CN110895654A (zh) 2020-03-20
TW202011231A (zh) 2020-03-16
SG10201907250TA (en) 2020-04-29
CN110891202A (zh) 2020-03-17
TWI696386B (zh) 2020-06-11
JP2020042771A (ja) 2020-03-19
TW202011749A (zh) 2020-03-16
TW202011232A (zh) 2020-03-16
TWI700597B (zh) 2020-08-01
TW202011222A (zh) 2020-03-16
JP2020042770A (ja) 2020-03-19
TWI709905B (zh) 2020-11-11
CN110888896A (zh) 2020-03-17
JP2020042777A (ja) 2020-03-19
CN110889034A (zh) 2020-03-17
CN110888994A (zh) 2020-03-17
CN110888896B (zh) 2023-09-05
TWI725375B (zh) 2021-04-21
SG10201905523TA (en) 2020-04-29
SG10201905532QA (en) 2020-04-29
TW202011221A (zh) 2020-03-16
SG10201906347QA (en) 2020-04-29
SG10201905236WA (en) 2020-04-29

Similar Documents

Publication Publication Date Title
CN107945198B (zh) 用于标注点云数据的方法和装置
CN108460098B (zh) 信息推荐方法、装置和计算机设备
CN111836118B (zh) 视频处理方法、装置、服务器及存储介质
CN111641869B (zh) 视频分镜方法、装置、电子设备和计算机可读存储介质
US11599726B1 (en) System and method for detecting portability of sentiment analysis system based on changes in a sentiment confidence score distribution
US10769247B2 (en) System and method for interacting with information posted in the media
CN109597902A (zh) 图片审核方法、装置、设备及存储介质
CN110891202B (zh) 分段方法、分段系统及非暂态电脑可读取媒体
CN110263218A (zh) 视频描述文本生成方法、装置、设备和介质
CN106778777B (zh) 一种车辆匹配方法及系统
CN111814759A (zh) 人脸质量标签值的获取方法、装置、服务器及存储介质
CN113159146A (zh) 样本生成、目标检测模型训练、目标检测方法及装置
CN110475139B (zh) 一种视频字幕的遮挡方法、装置、存储介质及电子设备
US20210192385A1 (en) Automated machine learning tagging and optimization of review procedures
CN111914850B (zh) 图片特征提取方法、装置、服务器和介质
CN116978028A (zh) 视频处理方法、装置、电子设备及存储介质
US11935300B2 (en) Techniques for generating candidate match cuts
CN110414845B (zh) 针对目标交易的风险评估方法及装置
Moghimi et al. Shadow detection based on combinations of hessenberg decomposition and principal component analysis in surveillance applications
CN115375987B (zh) 一种数据标注方法、装置、电子设备及存储介质
CN114202728B (zh) 一种视频检测方法、装置、电子设备及介质
CN113257276B (zh) 一种音频场景检测方法、装置、设备及存储介质
CN104166849B (zh) 一种电子文档识别方法及装置
CN113407765B (zh) 视频分类方法、装置、电子设备和计算机可读存储介质
CN116863143A (zh) 域适应语义分割的方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant