CN103838808A - 信息处理装置、信息处理方法和程序 - Google Patents

信息处理装置、信息处理方法和程序 Download PDF

Info

Publication number
CN103838808A
CN103838808A CN201310579095.2A CN201310579095A CN103838808A CN 103838808 A CN103838808 A CN 103838808A CN 201310579095 A CN201310579095 A CN 201310579095A CN 103838808 A CN103838808 A CN 103838808A
Authority
CN
China
Prior art keywords
importance
scene
image
signal conditioning
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310579095.2A
Other languages
English (en)
Inventor
田中和政
田中健司
中村幸弘
高桥义博
深沢健太郎
吉田恭助
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN103838808A publication Critical patent/CN103838808A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种信息处理装置和信息处理方法。所述信息处理装置包括:多个特征量提取部,它们被构造用来从内容中提取多个特征量;显示控制部,其被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示;以及选择部,其被构造用来选择显示或不显示与所述特征量相关的信息。所述显示控制部控制场景的重要性的显示,所述重要性是基于与所述选择部选择的与所述特征量相关的所述信息的显示或不显示而得到的。根据本发明,能够容易地掌握内容的实体。

Description

信息处理装置、信息处理方法和程序
技术领域
本发明涉及信息处理装置、信息处理方法和程序。特别地,涉及能够使内容的实体易于被掌握的信息处理装置、信息处理方法和程序。
背景技术
用于确认动态图像内容的实体的预览屏幕一般包括:预览区域,其用于再现动态图像;和时间线区域,其具有用于指示时间线内的再现位置的滑块。
为了掌握内容的实体,用户能够再现动态图像以确认预览,或者为了更快地掌握,用户能够使用滑块移动再现位置以确认内容的实体。然而,根据内容的长度可能需要长时间来掌握上述实体。
另一方面,根据作为相关技术的日本专利特开平第11-284948号公报或日本专利特开第2000-308003号公报,由于能够沿着时间线显示与场景变化相对应的图像,所以客户能够确认在哪里有怎样的视频。
发明内容
然而,内容的长度或内容的场景变化的数量可能导致与场景变化对应的图像数量的增加,从而导致用户难以掌握内容的实体。
鉴于以上状况提出了本发明,期望提高用于掌握内容的实体的可操作性。
本发明的实施例提供了一种信息处理装置,该信息处理装置包括:多个特征量提取部,它们被构造用来从内容中提取多个特征量;显示控制部,其被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示;以及选择部,其被构造用来选择显示或不显示与所述特征量相关的信息。所述显示控制部控制场景的重要性的显示,所述重要性是基于与所述选择部选择的与所述特征量相关的所述信息的显示或不显示而得到的。
所述显示控制部可以根据所述重要性来改变与所述特征量相关的信息的显示。
所述显示控制部可以根据所述重要性控制作为与所述特征量相关的所述信息的场景头图像的显示。
所述显示控制部可以以具有高的所述重要性的场景头图像的尺寸大于具有低的所述重要性的场景头图像的尺寸的方式显示具有高的所述重要性的场景头图像。
所述显示控制部可以将具有高的所述重要性的场景头图像显示在具有低的所述重要性的场景头图像的前面。
所述显示控制部可以根据所述重要性控制对象图像的显示,在所述对象图像中预定对象被检测作为与所述特征量相关的所述信息。
所述显示控制部可以以具有高的所述重要性的对象图像的尺寸大于具有低的所述重要性的对象图像的尺寸的方式显示具有高的所述重要性的对象图像。
所述显示控制部可以将具有高的所述重要性的对象图像显示在具有低的所述重要性的对象图像的前面。
在沿着时间线连续检测具有高的所述重要性的对象图像的情况下,所述显示控制部可以在连续检测具有高的所述重要性的对象图像的区间内显示一个以上具有高的所述重要性的对象图像。
所述信息处理装置还可以包括被构造用来改变所述重要性的权重的变更部。所述显示控制部可以根据被所述变更部改变了权重的所述重要性来改变与所述特征量相关的所述信息的显示。
所述信息处理装置还可以包括被构造用来提取与所述重要性相对应的场景的场景提取部。
所述信息处理装置还可以包括摘要生成部,其被构造用来收集由所述场景提取部提取的场景,并且生成摘要动态图像。
所述信息处理装置还可以包括元数据生成部,其被构造用来生成摘要元数据,所述摘要元数据包括被所述场景提取部提取的场景的起点和终点。
所述信息处理装置还可以包括缩略图生成部,其根据被所述场景提取部提取的场景的图像生成代表所述内容的缩略图图像。
所述信息处理装置还可以包括被构造用来改变所述重要性的权重的变更部。所述场景提取部可以提取根据被所述变更部改变了权重的所述重要性的场景。
本公开的实施例提供了一种信息处理方法,所述方法包括步骤:信息处理装置从内容中提取多个特征量;由所述信息处理装置控制所述内容的图像和与所述内容的所述特征量相关的信息的显示;由所述信息处理装置选择显示或不显示与所述特征量相关的信息;并且由所述信息处理装置控制场景的重要性的显示,所述重要性是基于与已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。
本公开的实施例提供了一种程序,所述程序使得计算机能够起到如下部件的作用:多个特征量提取部,它们被构造用来从内容中提取多个特征量;显示控制部,其被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示;以及选择部,其被构造用来选择显示或不显示与所述特征量相关的信息。所述显示控制部控制场景的重要性的显示,所述重要性是基于与所述选择部已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。
根据本公开的一个实施例,从内容中提取多个特征量,并且控制所述内容的图像和与所述内容的特征量相关的信息的显示。然后,选择显示或不显示与所述特征量相关的信息,并且控制场景的重要性的显示,所述重要性是基于选择显示或不显示与特征量相关的信息而得到的。
根据本公开的实施例,能够容易地掌握内容的实体。
附图说明
图1是示出了采用了本发明的信息处理装置的构造例;
图2是图示了信息处理装置的内容输入处理的流程图;
图3是图示了预览显示处理的流程图;
图4是图示了预览屏幕的重新显示处理的流程图;
图5示出了预览屏幕的示例;
图6示出了预览屏幕的示例;
图7示出了场景变化图像显示部的显示示例;
图8示出了场景变化图像显示部的另一显示示例;
图9示出了面部图像显示部的显示例;
图10示出了面部图像显示部的显示例;
图11示出了采用本发明的信息处理装置的构造例;
图12是图示了预览显示处理的流程图;
图13是图示了摘要生成处理的流程图;
图14示出了摘要生成显示部的显示示例;
图15示出了摘要生成显示部的另一显示示例;
图16图示了另一摘要生成方法;以及
图17是示出了计算机的配置示例的框图。
具体实施方式
下面,参照附图详述本发明的优选实施例。注意,在本申请文件和附图中,以相同的附图标记来表示具有基本相同的功能和结构的结构元件,并且省略了对这些结构元件的重复说明。
以下,将说明用于实施本发明的实施例(以下称作实施例)。按照如下顺序进行说明。
1.第一实施例(根据重要性的预览屏幕)
2.第二实施例(根据重要性的摘要生成)
3.第三实施例(计算机)
1.第一实施例(根据重要性的预览屏幕)
[本发明的信息处理装置的构造]
图1示出了应用本发明的信息处理装置的构造例。
图1所示的信息处理装置11在用于预览内容的屏幕中沿着时间线显示通过诸如图像识别、语音识别和字符识别等识别技术从内容中提取的内容的特征量。信息处理装置11例如由个人计算机构成。
在图1的示例中,信息处理装置11包括内容输入部21、内容存档22、特征量提取部23-1至23-3、内容特征量数据库24、显示控制部25、操作输入部26、显示部27、特征量提取部28以及检索部29。
内容输入部21从没有图示出的外部等接收内容,并将所接收的内容提供给特征量提取部23-1至23-3。此外,内容输入部21将所接收的内容登记在内容存档22中。
内容存档22中登记有来自内容输入部21的内容。
特征量提取部23-1至23-3对内容进行图像识别、语音识别、字符识别等,以提取包括图像特征量、语音特征量等的多个特征量中的各特征量。特征量提取部23-1至23-3将提取的内容的特征量登记在内容特征量数据库24中。本文中,特征量提取部23-1至23-3包括三个特征量提取部,但是特征量提取部的数量不限于三个,而是根据所提取的特征量的类型(数量)而变化。以下,当不必相互区分时,将特征量提取部23-1至23-3称作特征量提取部23。
内容特征量数据库24中登记有由特征量提取部23提取的内容的特征量。
显示控制部25响应于来自操作输入部26的用户指令分别从内容存档22和内容特征量数据库24取出将被预览的内容以及该内容的特征量。显示控制部25基于被取出的内容的预览图像和关于该内容的特征量的信息来生成预览屏幕,并且控制显示部27显示生成的预览屏幕。在显示预览屏幕的过程中,当通过操作输入部26(用户通过操作输入部26发出指令)将文本或图像信息输入提供给特征量提取部28时,显示控制部25接收响应于输入的信息而从检索部29提供的检索结果。显示控制部25基于检索结果来显示预览屏幕。
此外,在显示预览屏幕的过程中,当因用户指令而通过操作输入部26将文本或图像信息输入提供给特征量提取部28时,显示控制部25接收响应于输入的信息而从检索部29提供的检索结果。显示控制部25基于检索结果来重新显示预览屏幕。在显示预览屏幕的过程中,显示控制部25基于检索结果和通过操作输入部26输入的且由用户选择显示或不显示的特征量来重新显示预览屏幕。此时,显示控制部25根据用户选择的特征量来判定各场景的重要性,并根据所述重要性来重新显示预览屏幕。
此外,在显示预览屏幕的过程中,显示控制部25基于通过操作输入部26对特征量输入的校正等对内容特征量数据库24中登记的信息进行修正和更新等。
操作输入部26例如包括鼠标、层叠在显示部27上的触摸面板等。操作输入部26将响应于用户操作的信号提供给显示控制部25。显示部27显示由显示控制部25生成的预览屏幕。
特征量提取部28提取从显示控制部25提供的且用户为之发出指令的文本或图像信息的特征量,并将该特征量提供给检索部29。检索部29针对与来自特征量提取部28的特征量类似的特征量对内容特征量数据库24进行检索,并将检索结果提供给显示控制部25。
[信息处理装置的操作]
接下来,将参照图2的流程图说明信息处理装置11的内容输入处理。
在步骤S11中,内容输入部21从没有图示出的外部等接收内容。内容输入部21将接收到的内容提供给特征量提取部23-1至23-3。
在步骤S12中,特征量提取部23-1至23-3对来自内容输入部21的内容进行图像识别、语音识别、字符识别等,以提取包括图像特征量、语音特征量等特征量中的各特征量。在步骤S13中,特征量提取部23-1至23-3将提取的内容特征量登记在内容特征量数据库24中。
在步骤S14中,内容输入部21将接收的内容登记在内容存档22中。
参照图3的流程图,说明通过使用如上所述注册的内容和内容特征量进行的内容的预览显示处理。
用户对操作输入部26进行操作来选择将被预览的内容。通过操作输入部26将用户选择的内容的信息提供至显示控制部25。
在步骤S31中,显示控制部25根据来自操作输入部26的信息来选择内容。在步骤S32中,显示控制部25从内容存档22获取在步骤S31中选择的内容。
在步骤S33中,显示控制部25从内容特征量数据库24获取在步骤S31中选择的内容的特征量。
在步骤S34中,显示控制部25显示预览屏幕。换言之,显示控制部25基于获取的内容和获取的内容的特征量生成预览屏幕并控制显示部27显示生成的预览屏幕(稍后将要说明的图5中所示的预览屏幕51),在所述预览屏幕中,沿着时间线显示关于各种特征量的信息。这里,沿着时间线显示的不仅是特征量信息,还有与特征量有关的信息。与特征量有关的信息包括特征量信息、使用特征量获得的信息或使用特征量检索到的结果。
在步骤S35中,显示控制部25进行预览屏幕的重新显示处理。在稍后将参照图4说明的所述预览屏幕的重新显示处理中,在步骤S35的处理中,在显示部27上显示预览屏幕(稍后将要说明的图6中所示的预览屏幕51),该预览屏幕响应于从操作输入部26提供的用户指令已被更新。
在步骤S36中,显示控制部25判定预览屏幕的显示是否终止。在步骤S36中,如果用户凭借操作输入部26发出用于终止的指令,则判定预览屏幕的显示终止,并终止预览屏幕的显示。
另一方面,在步骤S36中,如果判定预览屏幕的显示未终止,则处理返回至步骤S35并重复步骤S35及接下来的步骤。
接下来,将参照图4的流程图说明图3的步骤S35中的预览屏幕的重新显示处理。
在步骤S51中,显示控制部25判定是否通过操作输入部26输入了待检索文本。如果在步骤S51中判定输入了待检索文本,则显示控制部25将输入的待检索文本的信息提供给特征量提取部28,处理前进至步骤S52。
在步骤S52中,特征量提取部28和检索部29通过语音和OCR进行检索。即,在此情况下,特征量提取部28将来自显示控制部25的待检索文本原样提供给检索部29。检索部29针对待检索文本对内容特征量数据库24进行语音检索或字符识别结果检索,并将检索结果提供给显示控制部25。然后,处理前进至步骤S56。
如果在步骤S51中判定未输入待检索文本,则处理前进至步骤S53。在步骤S53中,显示控制部25判定是否凭借操作输入部26输入待检索图像。如果在步骤S53中判定输入了待检索图像,则显示控制部25将输入的待检索图像的信息提供给特征量提取部28,处理前进至步骤S54。
在步骤S54中,特征量提取部28和检索部29检索类似的图像。换言之,在此情况下,特征量提取部28提取从显示控制部25提供的待检索图像的特征量,并将提取的待检索图像的特征量提供给检索部29。检索部29使用待检索图像的特征量针对类似的图像检索内容特征量数据库24,并将检索结果提供给显示控制部25。然后,处理前进至步骤S56。
如果在步骤S53中判定未输入待检索图像,则处理前进至步骤S55。在步骤S55中,显示控制部25判定是否凭借操作输入部26选择了显示特征量。
可由用户选择显示还是不显示将在预览屏幕中沿着时间线显示的特征量(与特征量有关的信息)。如果用户选择显示各特征量中的至少一者,则在步骤S55中判定选择显示特征量,处理前进至步骤S56。
在步骤S56中,显示控制部25重新显示预览屏幕。换言之,在步骤S52之后,在步骤S56中,在将待检索文本的检索结果添加至将要沿时间线显示的特征量(与特征量有关的信息)的状态下,重新显示预览屏幕。此外,在步骤S54之后,在步骤S56中,在将待检索图像的检索结果添加至将要沿时间线显示的特征量的状态下,重新显示预览屏幕。此外,在步骤S55之后,在步骤S56中,在根据用户的选择显示或不显示将要沿时间线显示的特征量的状态下,重新显示预览屏幕。此后,处理返回至图3的步骤S35。
如果在步骤S55中判定未选择显示特征量,则预览屏幕的重新显示处理终止,并且处理返回至图3中的步骤S35。
[预览屏幕的示例]
图5示出了预览屏幕的示例。
图5的示例例如示出了在图3的步骤S34等中说明的预览屏幕51。
预览屏幕51包括:预览显示部61,在其中能够对内容的动态图像进行预览;和时间线显示部62,其位于预览显示部61的下方并且通过选择左上方标签而被显示。
预览显示部61响应于对设置在预览显示部61正下方的操作按钮(再现按钮、快进按钮、速退按钮、停止按钮等)的用户操作,再现并预览内容的动态图像。预览显示部61显示用于在所显示的内容中选择面部的框71,所述面部在后述的面部图像显示部85中经过面部识别。
时间线显示部62沿着时间线显示与由图1中的特征量提取部23-1至23-3提取的多个特征量相关的信息。而且,在时间线上设置有线63,线63表示当前在预览显示部61中显示的图像(帧)的位置,用户能够通过查看线63来掌握内容在时间线上的再现位置。
此外,在时间线显示部62右侧显示的是特征量列表64,特征量列表64使得能够对时间线显示部62上的显示或不显示进行选择。用户能够在布置于该列表左侧的框中打勾或不打勾以选择显示或不显示与特征量有关的信息并且仅显示与期望的特征量有关的信息。
注意,在图5的示例中,仅特征量列表64中的从上数第四个框“相关性”未被选中。即,图5的时间线显示部62不显示通过选中“相关性”而被显示的重要性显示部91(后述的图6)。
此外,摘要生成显示部65实际上设置在与时间线显示部62相同的位置处,但在图5的示例中未图示。通过选择设置在摘要生成显示部65和时间线显示部62的左上方的标签,可显示摘要生成显示部65以替代时间线显示部62。
能够显示稍后将参照图14详细说明的摘要生成显示部65以使得生成摘要动态图像等。
时间线显示部62从顶部开始依次包括场景变化图像显示部81、语音波形显示部82、文本检索结果显示部83、图像检索结果显示部84、面部图像显示部85、对象图像显示部86、人物语音区域显示部87以及相机动作信息显示部88。这些显示部均是用于显示与特征量有关的信息的显示部。
通过勾选特征量列表64中的“缩略图(Thumbnail)”以在时间线显示部62中显示场景变化图像显示部81。在场景变化图像显示部81中,在时间线上显示通过场景变化得到的各场景的头帧图像的缩略图图像作为一个特征量。注意,下文中将场景头图像(scene head image)称作场景变化图像。
通过勾选特征量列表64中的“波形(Wave form)”以在时间线显示部62中显示语音波形显示部82。在语音波形显示部82中,在时间线上显示内容的语音波形作为一个特征量。
通过勾选特征量列表64中的“关键词识别(Keyword Spotting)”以在时间线显示部62中显示文本检索结果显示部83。在文本检索结果显示部83中,被显示的是基于根据语音识别或字符识别的特征量针对用户通过操作操作输入部26输入的文本(在图5的示例的情况下的“总统(president)”)而检索内容特征量数据库24的结果。
通过勾选特征量列表64中的“图像识别(Image Spotting)”以在时间线显示部62中显示图像检索结果显示部84。在图像检索结果显示部84中,被显示的是基于根据图像识别的特征量针对与用户通过操作操作输入部26所选择的图像类似的场景而检索内容特征量数据库24的结果(的缩略图图像)。
通过勾选特征量列表64中的“面部(Face)”以在时间线显示部62中显示面部图像显示部85。在面部图像显示部85中,被显示的是来自内容特征量数据库24的与根据面部识别的特征量类似的特征量(的缩略图图像),该特征量是通过识别由预览显示部61中的框71选择的面部而获得的。
通过勾选特征量列表64中的“国会山(Capitol Hill)”以在时间线显示部62中显示对象图像显示部86。本文中,在图5的示例中,“国会山”是对象的示例,但对象不限于“国会山”且可由用户指定。在对象图像显示部86中,被显示的是基于根据对用户指定的对象(在图5的情况下的“国会山”)的识别的特征量检索内容特征量数据库24的结果(的缩略图图像)。
注意,示出了分别显示面部图像和对象图像的示例,但面部也是对象之一。面部图像显示部85和对象图像显示部86中显示的图像可以是通过对来自原始图像的提取对象进行剪辑而获得的图像(缩略图图像)。
通过勾选特征量列表64中的“人物语音(Human Voice)”以在时间线显示部62中显示人物语音区域显示部87。在人物语音区域显示部87中,被显示的是通过根据语音识别的特征量而得到的人物语音区域或音乐区域等。这里,如图5所示,人物语音区域显示部87不仅可显示人讲话的区域,还可显示根据讲话者的性别或年龄的标记。
通过勾选特征量列表64中的“相机动作(Camera Motion)”以在时间线显示部62中显示相机动作信息显示部88。在相机动作信息显示部88中,被显示的是具有诸如水平摇摄、俯仰拍摄或变焦等相机和相机镜头的动作信息(以下,称作相机动作信息)的区域,所述动作信息是根据相机动作识别的特征信息。作为相机动作信息,还可使用感测在拍摄内容时的相机动作等的传感器的信息。
在预览屏幕51中,沿着时间线显示能够从内容中提取的诸如作为示例的上述特征量的各种特征量和使用这些特征量获得的信息。
然而,在上述预览屏幕51中,在图5中的场景变化图像显示部81、面部图像显示部85和对象图像显示部86中显示的缩略图图像根据内容的长度、场景变化的数量或检测的对象的数量而互不相同。这使得难以核查每个图像,从而导致难以掌握内容的实体。
因此,在本发明中,在场景变化图像显示部81、面部图像显示部85和对象图像显示部86中沿时间线显示的包括缩略图图像的图像是根据用户选择的特征量而有效地显示的。
在本发明中,例如,根据用户选择的特征量,通过改变尺寸以及前后位置关系等来有效地显示沿着时间线显示的图像。
用户在特征量列表64中选择的特征量是被判断为在掌握内容的实体中对于用户重要的特征量。例如,如果显示有人的图片是重要的,则通过面部检测获得的人出现的场景是重要的;如果说出特定词语的场景是重要的,则通过语音识别中的文本检索而提取的场景是重要的。
因此,显示控制部25判定与用户选择的特征量相对应的场景是重要场景,并且与越多特征量相对应的场景是越重要的场景,以此来判定每个场景的重要性。
这里,此时,可对每个特征量进行重要性加权,且可显示用于操作每个特征量的加权的滑块,以使得用户能够任意操作加权来判定重要性。
在如图6中所示的时间线显示部62中显示了如上所述判定的重要性。
图6示出了预览屏幕的另一示例。在图6的示例中,在时间线显示部62中,与图5的时间线显示部62的不同之处在于:在语音波形显示部82与文本检索结果显示部83之间新设置了重要性显示部91。
这里,图6中的时间线显示部62除上述部分以外的其它部分与图5中的时间线显示部62基本相同。
通过勾选特征量列表64中的“相关性”以在时间线显示部62中显示重要性显示部91。重要性显示部91显示通过以下处理所获得的重要性,所述处理即:判定与用户在特征量列表64中选择的特征量相对应的场景是重要场景,并且判定与越多特征量相对应的场景是越重要的场景,以确定每个场景的重要性。这里,将重要性分为三个级别,并且重要性3表示最高重要性。
例如,重要性显示部91以如下方式显示对每个场景判定的重要性,所述方式即,实心黑色区域是最重要(重要性3)场景,接下来,细阴影线区域是重要性2的场景,斜阴影线区域是重要性1的场景。
然后,显示控制部25利用这种重要性来改变场景变化图像显示部81、面部图像显示部85或对象图像显示部86中的与特征量有关的信息的显示。换言之,在场景变化图像显示部81、面部图像显示部85或对象图像显示部86中,通过利用这种重要性,越重要的场景的图像被显示得更大和/或被显示在越前面。
接下来,将参照图7说明在场景变化图像显示部81中对重要性的利用。在图7中的示例中,在场景变化图像显示部81中从左侧开始显示有缩略图图像101至缩略图图像108。
图7的A示出了在不考虑重要性的情况下的场景变化图像显示部81。换言之,在图7的A的场景变化图像显示部81中,以相同的尺寸以及沿着时间线的前后关系显示任何场景变化的缩略图图像。即,作为按照时间顺序的第一个缩略图图像的缩略图图像101布置在最后面,作为按照时间顺序的最后一个缩略图图像的缩略图图像108布置在最前面。
图7的B示出了在放大了重要场景的缩略图图像的情况下的场景变化图像显示部81。换言之,在图7的B的场景变化图像显示部81中,最重要场景的缩略图图像103被显示得尺寸比其它缩略图图像大。重要场景的缩略图图像101、106被显示得尺寸仅次于缩略图图像103。此外,次重要场景的缩略图图像102、104、107被显示得尺寸大于不重要场景的缩略图图像105、108。
图7的C示出了从图7的B中的显示变化来的,在垂直居中地显示各个缩略图图像101至108的情况下的的场景变化图像显示部81。
图8的D示出了从图7的C中的显示变化来的,在将越重要的场景的缩略图图像显示在越前面的情况下的场景变化图像显示部81。换言之,在图8的D的场景变化图像显示部81中,在最前面显示最重要场景的缩略图图像103,在次前面显示重要场景的缩略图图像101、106。此外,在再次前面显示次重要场景的缩略图图像102、104、107,在最后面显示不重要场景的缩略图图像105、108。然而,实际上隐藏了缩略图图像102、104、105。
图8的E示出了从图8的D的显示变化来的,在根据重要性错开图像的上端来显示从而不会完全隐藏任何缩略图图像的情况下的场景变化图像显示部81。
换言之,在图8的E的场景变化图像显示部81中,以这样的方式显示各个缩略图图像:在图8的D的情况下被隐藏的缩略图图像102、104、105存在于缩略图图像101、103、106的后面。
这里,图8的E的示例示出了通过错开上端来显示的示例,而类似地,也可错开并显示下端。
类似于图8的D中的显示,图8的F示出了在缩略图图像102、104、105被隐藏的情况下的场景变化图像显示部81。然而,在图8的F中的场景变化图像显示部81的情况下,以这样的方式表示被隐藏的缩略图图像的场景:在指示鼠标位置的箭头M响应于用户操作而悬停在被隐藏的缩略图图像的场景上时,使用虚线显示被隐藏的缩略图图像的轮廓。此外,在指示鼠标位置的箭头M响应于用户操作而悬停在被显示的轮廓上时,与之对应的缩略图图像被显示在最前面。
如上所述,由于根据基于用户选择的特征量的重要性来显示场景变化图像显示部81中的场景变化图像(缩略图图像),用户能够容易地掌握内容的实体。
注意,关于场景变化图像显示部81中的缩略图图像,以上说明了这样的示例:其中,根据用户在特征量列表64中选择的特征量来判定重要性。另一方面,关于面部图像显示部85和对象图像显示部86中的缩略图图像,各对象(也包括面部)的特性可由用户选择,将与所选择的特性相对应的对象图像(缩略图图像)判定为最重要图像。
例如,为根据面部识别的面部图像提取关于面部的更详细特性,包括性别、年龄、笑脸判定或人名。为根据对象识别的对象图像提取关于对象的更详细特性,包括对象的专有名称或对象的颜色。在人物语音信息的情况下,提取包括男声或女声、讲话者或音乐识别等特性。在相机动作信息的情况下,提取包括水平摇摄、俯仰拍摄、拉进变焦或拉远变焦等特性。
此外,关于面部图像显示部85和对象图像显示部86中的缩略图图像,如上所述提取的特性被配置为可选择的,以使得将与用户选择的特性对应的图像(缩略图图像)判定为重要图像。根据以此方式判定的重要性,能够以改变尺寸或改变显示的前后侧的方式来显示各个图像。
图9示出了在选择特定人物作为一个详细特性的情况下的面部图像显示部85的示例。
换言之,在图9的面部图像显示部85中,从各面部图像中提取特定人物的面部图像,并且被提取的面部图像被显示得尺寸大于其它的面部图像。
这使得用户对于对象图像也能够容易地识别重要场景。
此外,将参照图10说明面部图像显示部85和对象图像显示部86中的对象图像(缩略图图像)。
例如,在作为对象图像的示例的图5中的面部图像显示部85的情况下,对于提取出面部图像的所有帧图像,沿着时间线显示缩略图图像。即,如图10的A中所示,连续显示同一对象(特定人物的面部)从而以重叠的方式显示对象图像。
为解决这一问题,识别被检测的对象的同一性,且在同一对象连续出现的区域内,显示控制部25显示如图10的B中所示的多个连续的对象图像中的有代表性的一个。然后,显示控制部25显示用于所述区间的箭头、矩形等标记。
这里,被选择作为代表性对象图像的是连续对象图像中的最前图像或中间图像、在对象检测中具有对象识别的最高精度的图像、连续对象图像中的最平均的图像或者由于用户对对象特性的选择而被判定为重要的图像。
作为用于显示上述区间的矩形,例如,显示一系列对象图像的代表性颜色。例如,根据被检测对象中频繁出现的颜色或对象的背景部分中频繁出现的颜色等来确定代表性颜色。这里,在同一对象连续出现的区间中,如果由于检测精度而未在非常短的区间内检测出对象,则可对所述区间进行插值,以将所述区间判定为从中检测出对象的区间。
此外,如果其中有同一对象出现的区间长并且能够互不重叠地显示两个对象图像,则被显示的对象图像的数量不限于一个。在类似这样的情况下,如图10的C中所示,例如,可显示同一对象出现的区间中的最前图像和最后图像。
此外,如果其中有同一对象出现的区间长,或者还可通过放大(zoomin)时间线来延长其中有同一对象出现的区间,则被显示的对象图像不限于一个代表性图像。在类似这样的情况下,如图10的D中所示,根据区间的长度,与待填充的区间内的间隔相对应的时刻的对象图像可以被显示在该时刻处。这使得显示控制部25能够根据区间的长度以一定间隔来显示多个对象图像而不使这些图像重叠。
在如图10的B至图10的D中所示的互不重叠地显示同一对象的连续的图像的情况下,还能够按照根据用户选择的特性判定的对象图像的重要性以改变尺寸或者改变显示的前后侧的方式来显示。在类似这样的情况下,显示控制部25判定在其中有同一对象出现的区间内的同一对象的重要性,并以改变图像的尺寸或改变显示的前后侧的方式来显示。或者,显示控制部25可以判定其中有同一对象出现的区间内的每个图像的重要性,如果每个图像的重要性互不相同,则允许在所述区间内的重叠以将更重要的图像显示得更大且更靠前。或者,考虑到将以此方式显示的图像,显示控制部25在其它的对象图像不重叠的情况下在某时刻以如下方式显示其它的对象图像:即,区间内的与该时刻相对应的间隔被填充。
如上所述,在用户确认动态图像内容的实体的预览屏幕中,沿着时间线显示与所述内容的各种特征量有关的信息,从而使用户能够容易地掌握内容的实体。
而且,用户能够对各特征量进行选择或者对重要性进行加权并选择特征量,以选择用户认为重要的场景;根据该重要的场景,能够以改变尺寸或改变显示的前后侧的方式来显示场景变化图像。这使得能够容易地识别对于用户重要的场景,从而能够更有效地掌握内容的实体。
此外,关于从内容中提取的对象,能够以较少重叠的方式显示被检测对象,并且能够根据用户选择的特性来判定重要性从而以改变尺寸或改变显示的前后侧的方式显示重要图像。这样,能够更有效地掌握内容的实体。
2.第二实施例(根据重要性的摘要生成)
[本发明的信息处理装置配置]
图11示出了应用了本发明的信息处理装置的另一构造例。
在图11的示例中,类似于图1的信息处理装置11,信息处理装置111在用于预览内容的屏幕中沿着时间线显示与通过诸如图像识别、语音识别和字符识别等识别技术提取的方式从内容中提取的内容特征量相关的信息。
而且,类似于图1的信息处理装置11,信息处理装置111根据用户选择的特征量来判定各场景的重要性。然而,此时,与图1的信息处理装置11不同的是,信息处理装置111提取与上述重要性相对应的场景,并收集被提取的场景以生成摘要动态图像或者记录起点和终点作为元数据。
信息处理装置111包括内容输入部21、内容存档22、特征量提取部23-1至23-3、内容特征量数据库24、显示控制部25、操作输入部26、显示部27、特征量提取部28以及检索部29,这与图1的信息处理装置11是相同的。
信息处理装置111增加了重要场景判定部121和摘要生成部122,这与图1的信息处理装置11不同。
换言之,在显示预览屏幕时,显示控制部25基于检索结果和通过操作输入部26输入的且由用户选择显示或不显示的特征量(与特征量有关的信息)来重新显示预览屏幕。此时,显示控制部25根据用户选择的特征量来判定各场景的重要性,并重新显示显示有重要性的图6的预览屏幕51。
此外,当收到用户通过操作输入部26请求摘要生成的信号时,显示控制部25在预览屏幕51中显示摘要生成显示部65。然后,在通过用户通过操作输入部26收到用户期望的重要性的时候,显示控制部25控制重要场景判定部121以提取与上述重要性相对应的场景,并且在摘要生成显示部65中显示被提取的场景的缩略图图像。
重要场景判定部121根据显示控制部25提取与重要性相对应的场景,并将被提取的场景提供给显示控制部25和摘要生成部122。例如,重要场景判定部121存储被提取的重要场景的起点和终点的信息作为内容特征量数据库24中的元数据。或者,重要场景判定部121通过利用从这些场景中拍摄的静止图像来生成代表内容的一个以上缩略图图像。
或者,摘要生成部122使用从重要场景判定部121提供的场景来生成摘要动态图像。生成的摘要动态图像被记录在未图示的存储部中。
换言之,在将判定的重要性分为多个级别的情况下,显示控制部25选择用户所需的重要性。然后,重要场景判定部121提取与重要性相对应的场景以存储该场景的元数据,或生成缩略图图像,或者摘要生成部122生成摘要动态图像。
[信息处理装置的操作]
注意,与参照图2在上文中说明的信息处理装置11的内容输入处理基本类似地进行信息处理装置111的内容输入处理,且省略了对信息处理装置111的内容输入处理的说明以防止重复说明。
接着,参照图12的流程图说明信息处理装置111中的内容的预览显示处理。这里,图12中的步骤S111至S115以及S118进行与图3的步骤S31~S36基本相同的处理,于是,适当省略了对步骤S111~S115以及S118的说明以防止重复说明。
在步骤S111中,显示控制部25根据来自操作输入部26的信息选择内容。在步骤S112中,显示控制部25从内容存档22获取在步骤S111中选择的内容。
在步骤S113中,显示控制部25从内容特征量数据库24获取在步骤S111中所选择的内容的特征量。
在步骤S114中,显示控制部25显示预览屏幕。换言之,显示控制部25基于获取的内容和获取的内容特征量来生成其中沿着时间线显示关于各种特征量的信息的预览屏幕,并控制显示部27显示生成的预览屏幕(图5所示的预览屏幕51)。
在步骤S115中,显示控制部25进行上文中参照图4说明的预览屏幕的重新显示处理。在步骤S115的处理中,在显示部27显示预览屏幕,所述预览屏幕响应于从操作输入部26提供的用户指令而被更新。换言之,通过根据用户在特征量列表64中选择的特征量来判定以得到重要性,在显示部27中显示显示有重要性的图6中的预览屏幕51。
在步骤S116中,显示控制部25判定是否将要生成摘要。
例如,用户对操作输入部26进行操作以在预览屏幕51中的设置于时间线显示部62和摘要生成显示部65的左上方的标签中选择摘要生成显示部65的标签。
响应于此,显示控制部25在步骤S116中判定将要生成摘要,处理前进至步骤S117。在步骤S117中,重要场景判定部121和摘要生成部122进行摘要生成处理。稍后将参照图13说明该摘要生成处理。根据被选择的重要性,步骤S117中的处理生成摘要动态图像,存储元数据或生成缩略图图像。
如果未选择摘要生成显示部65的标签,则在步骤S116中判定不生成摘要并跳过步骤S117的处理,处理前进至步骤S118。
在步骤S118中,显示控制部25判断预览屏幕的显示是否终止。如果用户通过操作输入部26发出终止的指令,则在步骤S118中,判定预览屏幕的显示终止,且终止预览屏幕的显示。
另一方面,在步骤S118中,如果判定预览屏幕的显示未终止,则处理返回至步骤S115且重复步骤S115及接下来的步骤。
下面将参照图13的流程图说明图12中的步骤S117的摘要生成处理。
例如,在图12中的步骤S115中,重新显示预览屏幕51,且在图6中的重要性显示部91中显示重要性。当在该预览屏幕51中选择摘要生成显示部65的标签时,如图14中所示地显示摘要生成显示部65以替代时间线显示部62。
在图14中的摘要生成显示部65中,场景的重要性的带被显示并叠加在所有场景变化图像中的各者上。这里,将重要性分为三个级别,重要性3表示最高重要性。
图14的实心黑色带对应于图6中的重要性显示部91中的实心黑色区域,且表示最重要(重要性3)场景。图14的细阴影线带对应于图6中的重要性显示部91中的细阴影线区域,且表示重要性2的场景。此外,图14的斜阴影线带对应于图6中的重要性显示部91中的斜阴影线区域,且表示重要性1的场景。
这里,在图14的示例中,在重要性低于重要性1的场景上未叠加带。
然后,例如,用户选择重要性。例如,如图15的A所示,在摘要生成显示部65的右侧显示的是重要性选择部141,其用于从“most(最重要)”、“more(较重要)”和“relevant(适当)”中选择优先级(重要性)。
用户对操作输入部26进行操作以在重要性选择部141中选择重要性。响应于此操作,显示控制部25在步骤S132中控制重要场景判定部121以提取与重要性相对应的场景。关于提取的场景的信息被提供给显示控制部25,并且如图15的A至图15的C所示,显示控制部25显示重要性选择部141。
例如,如果选择“relevant”,则提取重要性1以上的场景的缩略图图像,如图15的A所示,摘要生成显示部65显示重要性1以上的场景的缩略图图像。例如,如果选择“more”,则提取重要性2以上的场景的缩略图图像,如图15的B所示,摘要生成显示部65显示重要性2以上的场景的缩略图图像。例如,如果选择“最重要”,则提取重要性3以上的场景的缩略图图像,如图15的C所示,摘要生成显示部65在其中显示重要性3以上的场景的缩略图图像。
然后,在步骤S133-1中,重要场景判定部121通过利用从这些场景拍摄的静止图像来生成代表内容的一个以上缩略图图像。
或者,在步骤S133-2中,重要场景判定部121存储关于所提取的重要场景的起点和终点的信息作为内容特征量数据库24中的元数据。
或者,在步骤S133-3中,摘要生成部122使用从重要场景判定部121提供的场景来生成摘要动态图像。将所生成的摘要动态图像记录在未图示的存储部中。
这里,并列示出了步骤S133-1至S133-3的处理,这是因为可以进行任何一个处理,且可以并行进行至少两个处理。
在步骤S134中,显示控制部25判断摘要生成处理是否终止。例如,用户对操作输入部26进行操作以在预览屏幕51中的设置于时间线显示部62和摘要生成显示部65的左上方的标签中选择时间线显示部62的标签。
响应于此操作,显示控制部25在步骤S134中判定摘要生成处理终止,且显示代替摘要生成显示部65的时间线显示部62以终止摘要生成处理。
另一方面,如果在步骤S134中判定摘要生成处理未终止,则处理返回至步骤S131并重复步骤S131及接下来的步骤。
如上所述,用户能够根据所需场景来选择重要性,并根据提取的场景生成摘要。或者,用户能够存储关于提取的场景的起点和终点的信息作为元数据以在其它应用等中使用。而且,例如场景变化图像等代表性图像能够被用于生成代表内容的一个以上缩略图图像。由于该缩略图图像是从重要场景中提取的,所以相比于相关技术中的场景的最前图像是缩略图图像的方法,能够获得如下效果:即,仅通过观看缩略图图像就能够容易地获知内容的实体。
这里,关于重要性的选择,能够显示从在切换重要性时提取的场景生成的摘要动态图像的长度,能够选择重要性以使得动态图像的长度接近用户期望的长度,并且能够生成摘要动态图像。
或者,用户能够在信息处理装置111中预先输入期望的长度,自动选择重要性以使得根据所述重要性生成长度与该长度接近的摘要动态图像,并且生成摘要。
[摘要生成的另一例]
接下来说明用于更容易地生成摘要的另一方法,其中,能够使用用户选择的一个以上图像来提取类似的场景并生成摘要。
例如,在图5中的预览屏幕51中的图像检索结果显示部84中,关于用户检索与输入图像类似的场景的特征量,不仅可输入一个图像还可输入多个图像以检索与各图像类似的场景。然后,能够从类似场景的检索结果中提取相关区域作为重要场景,从而生成摘要动态图像和缩略图图像。
图16中的示例图示了这样的示例,其中,输入四个特征图像151~154,且检索与各图像类似的场景以从检索到的类似场景中提取重要场景。
沿着时间线141显示的是与图像154类似的场景的区间154A、与图像151类似的场景的区间151A、与图像153类似的场景的区间153A以及与图像152类似的场景的区间152A。然后,在上述区间中,通过选择参数来提取实心黑色的区间161以作为摘要动态图像的素材区间,所述参数包括检测精度、误检测区间的噪声校正以及用户在特定时段内对区间的选择。
作为其它特征量,能够使用场景变化信息、关于声音中断的信息等以更灵活、适当地提取场景。根据这些提取的区间中的场景,能够生成摘要动态图像和缩略图图像,并且能够提取重要场景的起点和终点。
如上所述,由于利用诸如语音识别和图像识别等识别技术从动态图像内容中提取各种特征量以使得用户能够任意选择各特征量,因此,能够更详细地反映用户的意图以提取内容的重要场景。
此外,由于从用户任意选择的一个以上特征图像中检索类似的场景,因此能够灵活地选择用户想要的重要场景。
关于动态图像内容,对这种重要性的利用使得能够生成更加反映用户的意图的缩略图图像和摘要动态图像。
上述一系列处理可通过硬件来执行,也可通过软件来执行。当一系列处理由软件来执行时,将构成这种软件的程序安装在计算机中。这里,“计算机”的表述包括其中装有专用硬件的计算机以及当安装有各种程序时能够执行各种功能的通用个人计算机等。
3.第三实施例(计算机)
[计算机的配置示例]
图17图示了通过程序执行上述一系列处理的计算机的硬件的配置示例。
在计算机300中,中央处理单元(CPU)301、只读存储器(ROM)302和随机存取存储器(RAM)303通过总线304相互连接。
输入/输出接口305也连接至总线304。输入单元306、输出单元307、存储单元308、通信单元309以及驱动器310连接至输入/输出接口305。
输入单元306由键盘、鼠标、麦克风等构成。输出单元307由显示器、扬声器等构成。存储单元308由硬盘、非易失性存储器等构成。通信单元309由网络接口等构成。驱动器310驱动可移动记录介质311,诸如磁盘、光盘、磁光盘、半导体存储器等。
在如上所述配置的计算机中,CPU 301将例如存储在存储单元308中的程序经由输入/输出接口305和总线304加载至RAM 303,并执行所述程序。由此,进行上述一系列处理。
作为一个示例,可通过将由计算机(CPU 301)执行的程序记录在作为封装介质的可移动记录介质311等中来提供该程序。还可经由诸如局域网、互联网或数字卫星广播等有线或无线传输介质来提供程序。
在计算机中,通过将可移动记录介质311加载至驱动器310中,能够将程序经由输入/输出接口305安装至存储单元308中。还能够使用通信单元309从有线或无线传输介质接收程序,并将程序安装至存储单元308中。作为另一选择,可将程序预先安装至ROM 302或存储单元308中。
应当注意,由计算机执行的程序可以是根据本申请文件中说明的顺序按照时间顺序处理的程序,或者是并行处理或在诸如请求时等必要时刻被处理的程序。
在本发明中,用于说明上述系列处理的步骤可以包括根据记载的顺序依时间顺序进行的处理以及不依时间顺序而是并行或单独进行的处理。
本发明的实施例不限于上述实施例。本领域技术人员应当理解,依据设计要求和其它因素,可以在本发明随附的权利要求或其等同物的范围内进行各种修改、组合、次组合以及改变。
例如,本发明可采用云计算的构造,所述云计算由多个装置通过网络分配和连接一个功能来进行处理。
此外,可由一个装置或通过分配多个装置来执行上述流程图中说明的每个步骤。
此外,在一个步骤中包括多个处理的情况下,可由一个装置或通过分配多个装置来执行所述一个步骤中包括的多个处理。
此外,可将以上作为单个器件(或处理单元)说明的元件分成被构造为多个器件(或处理单元)。相反地,以上作为多个器件(或处理单元)说明的元件可共同被构造为一个器件(或处理单元)。此外,可将除上述元件以外的元件添加至各器件(或处理单元)。而且,给定器件(或处理单元)的元件的一部分可以被包含在另一器件(或另一处理单元)的元件中,只要系统的整体构造或操作基本相同即可。换言之,本发明的实施例不限于上述实施例,在不脱离本技术的范围内可进行各种改变和修改。
虽然参照附图详述了本发明的优选实施例,但本发明不限于此。本领域技术人员应当明白,在所附权利要求或等同物的技术范围内,可以存在各种变型例或修正例。应当理解的是,这些变型例或修正例也属于本发明的技术范围内。
此外,本发明还可如下构造。
(1)一种信息处理装置,其包括:
多个特征量提取部,它们被构造用来从内容中提取多个特征量;
显示控制部,所述显示控制部被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示;以及
选择部,所述选择部被构造用来选择显示或不显示与所述特征量相关的信息;
其中,所述显示控制部控制场景的重要性的显示,所述重要性是基于与所述选择部选择的与所述特征量相关的所述信息的显示或不显示而得到的。
(2)根据(1)所述的信息处理装置,其中,
所述显示控制部根据所述重要性来改变与所述特征量相关的信息的显示。
(3)根据(2)所述的信息处理装置,其中,
所述显示控制部根据所述重要性控制作为与所述特征量相关的所述信息的场景头图像的显示。
(4)根据(3)所述的信息处理装置,其中,
所述显示控制部以具有高的所述重要性的场景头图像的尺寸大于具有低的所述重要性的场景头图像的尺寸的方式显示具有高的所述重要性的场景头图像。
(5)根据(3)所述的信息处理装置,其中,
所述显示控制部将具有高的所述重要性的场景头图像显示在具有低的所述重要性的场景头图像的前面。
(6)根据(2)所述的信息处理装置,其中,
所述显示控制部根据所述重要性控制对象图像的显示,在所述对象图像中预定对象被检测作为与所述特征量相关的所述信息。
(7)根据(6)所述的信息处理装置,其中,
所述显示控制部以具有高的所述重要性的对象图像的尺寸大于具有低的所述重要性的对象图像的尺寸的方式显示具有高的所述重要性的对象图像。
(8)根据(6)所述的信息处理装置,其中,
所述显示控制部将具有高的所述重要性的对象图像显示在具有低的所述重要性的对象图像的前面。
(9)根据(6)所述的信息处理装置,其中,
在沿着时间线连续检测具有高的所述重要性的对象图像的情况下,所述显示控制部在连续检测具有高的所述重要性的对象图像的区间内显示一个以上具有高的所述重要性的对象图像。
(10)根据(1)至(9)中任一项所述的信息处理装置,还包括:
变更部,所述变更部被构造用来改变所述重要性的权重;
其中,所述显示控制部根据被所述变更部改变了权重的所述重要性来改变与所述特征量相关的所述信息的显示。
(11)根据(1)所述的信息处理装置,还包括:
场景提取部,所述场景提取部被构造用来提取与所述重要性相对应的场景。
(12)根据(11)所述的信息处理装置,还包括:
摘要生成部,所述摘要生成部被构造用来收集由所述场景提取部提取的场景,并且生成摘要动态图像。
(13)根据(11)所述的信息处理装置,还包括:
元数据生成部,所述元数据生成部被构造用来生成摘要元数据,所述摘要元数据包括被所述场景提取部提取的场景的起点和终点。
(14)根据(11)所述的信息处理装置,还包括:
缩略图生成部,所述缩略图生成部根据被所述场景提取部提取的场景的图像生成代表所述内容的缩略图图像。
(15)根据(11)至(14)中任一项所述的信息处理装置,还包括:
变更部,所述变更部被构造用来改变所述重要性的权重;
其中,所述场景提取部提取根据被所述改变部改变了权重的所述重要性的场景。
(16)一种信息处理方法,所述方法包括以下步骤:
信息处理装置从内容中提取多个特征量;
由所述信息处理装置控制所述内容的图像和与所述内容的所述特征量相关的信息的显示;
由所述信息处理装置选择显示或不显示与所述特征量相关的信息;并且
由所述信息处理装置控制场景的重要性的显示,所述重要性是基于与已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。
(17)一种程序,所述程序使得计算机能够起到如下部件的作用:
多个特征量提取部,它们被构造用来从内容中提取多个特征量;
显示控制部,所述显示控制部被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示;以及
选择部,所述选择部被构造用来选择显示或不显示与所述特征量相关的信息;
其中,所述显示控制部控制场景的重要性的显示,所述重要性是基于与所述选择部已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。
本申请包含与2012年11月26日向日本专利局提交的日本优先权专利申请JP 2012-257826所公开的内容相关的主题,因此将该日本优先权申请的全部内容以引用的方式并入本文。

Claims (18)

1.一种信息处理装置,其包括:
多个特征量提取部,它们被构造用来从内容中提取多个特征量;
显示控制部,所述显示控制部被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示;以及
选择部,所述选择部被构造用来选择显示或不显示与所述特征量相关的信息;
其中,所述显示控制部控制场景的重要性的显示,所述重要性是基于与所述选择部选择的与所述特征量相关的所述信息的显示或不显示而得到的。
2.如权利要求1所述的信息处理装置,其中,
所述显示控制部根据所述重要性来改变与所述特征量相关的所述信息的显示。
3.如权利要求2所述的信息处理装置,其中,
所述显示控制部根据所述重要性控制作为与所述特征量相关的所述信息的场景头图像的显示。
4.如权利要求3所述的信息处理装置,其中,
所述显示控制部以具有高的所述重要性的场景头图像的尺寸大于具有低的所述重要性的场景头图像的尺寸的方式显示具有高的所述重要性的场景头图像。
5.如权利要求3所述的信息处理装置,其中,
所述显示控制部将具有高的所述重要性的场景头图像显示在具有低的所述重要性的场景头图像的前面。
6.如权利要求5所述的信息处理装置,其中,所述显示控制部能够使用虚线显示被隐藏的具有低的所述重要性的场景头图像轮廓。
7.如权利要求2所述的信息处理装置,其中,
所述显示控制部根据所述重要性控制对象图像的显示,在所述对象图像中预定对象被检测作为与所述特征量相关的所述信息。
8.如权利要求7所述的信息处理装置,其中,
所述显示控制部以具有高的所述重要性的对象图像的尺寸大于具有低的所述重要性的对象图像的尺寸的方式显示具有高的所述重要性的对象图像。
9.如权利要求7所述的信息处理装置,其中,
所述显示控制部将具有高的所述重要性的对象图像显示在具有低的所述重要性的对象图像的前面。
10.如权利要求7所述的信息处理装置,其中,
在沿着时间线连续检测具有高的所述重要性的对象图像的情况下,所述显示控制部在连续检测具有高的所述重要性的对象图像的区间内显示一个以上具有高的所述重要性的对象图像。
11.如权利要求1至9中任一项所述的信息处理装置,还包括:
变更部,所述变更部被构造用来改变所述重要性的权重;
其中,所述显示控制部根据被所述变更部改变了权重的所述重要性来改变与所述特征量相关的所述信息的显示。
12.如权利要求1所述的信息处理装置,还包括:
场景提取部,所述场景提取部被构造用来提取与所述重要性相对应的场景。
13.如权利要求12所述的信息处理装置,还包括:
摘要生成部,所述摘要生成部被构造用来收集由所述场景提取部提取的场景,并且生成摘要动态图像。
14.如权利要求12所述的信息处理装置,还包括:
元数据生成部,所述元数据生成部被构造用来生成摘要元数据,所述摘要元数据包括被所述场景提取部提取的场景的起点和终点。
15.如权利要求12所述的信息处理装置,还包括:
缩略图生成部,所述缩略图生成部根据被所述场景提取部提取的场景的图像生成代表所述内容的缩略图图像。
16.如权利要求12至15中任一项所述的信息处理装置,还包括:
变更部,所述变更部被构造用来改变所述重要性的权重;
其中,所述场景提取部提取根据被所述改变部改变了权重的所述重要性的场景。
17.一种信息处理方法,所述方法包括以下步骤:
信息处理装置从内容中提取多个特征量;
由所述信息处理装置控制所述内容的图像和与所述内容的所述特征量相关的信息的显示;
由所述信息处理装置选择显示或不显示与所述特征量相关的信息;并且
由所述信息处理装置控制场景的重要性的显示,所述重要性是基于与已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。
18.一种程序,所述程序使得计算机能够起到如下部件的作用:
多个特征量提取部,它们被构造用来从内容中提取多个特征量;
显示控制部,所述显示控制部被构造用来控制所述内容的图像和与所述内容的所述特征量相关的信息的显示;以及
选择部,所述选择部被构造用来选择显示或不显示与所述特征量相关的信息;
其中,所述显示控制部控制场景的重要性的显示,所述重要性是基于与所述选择部已经选择的与所述特征量相关的所述信息的显示或不显示而得到的。
CN201310579095.2A 2012-11-26 2013-11-18 信息处理装置、信息处理方法和程序 Pending CN103838808A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012-257826 2012-11-26
JP2012257826A JP2014106637A (ja) 2012-11-26 2012-11-26 情報処理装置および方法、並びにプログラム

Publications (1)

Publication Number Publication Date
CN103838808A true CN103838808A (zh) 2014-06-04

Family

ID=50774438

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310579095.2A Pending CN103838808A (zh) 2012-11-26 2013-11-18 信息处理装置、信息处理方法和程序

Country Status (3)

Country Link
US (1) US20140149865A1 (zh)
JP (1) JP2014106637A (zh)
CN (1) CN103838808A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106231233A (zh) * 2016-08-05 2016-12-14 北京邮电大学 一种基于权值的实时融屏方法
CN106775243A (zh) * 2016-12-16 2017-05-31 厦门幻世网络科技有限公司 一种信息处理方法及电子设备
CN114979496A (zh) * 2019-04-22 2022-08-30 夏普株式会社 电子设备

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9185387B2 (en) 2012-07-03 2015-11-10 Gopro, Inc. Image blur based on 3D depth information
US9728230B2 (en) * 2014-02-20 2017-08-08 International Business Machines Corporation Techniques to bias video thumbnail selection using frequently viewed segments
US9685194B2 (en) 2014-07-23 2017-06-20 Gopro, Inc. Voice-based video tagging
US10074013B2 (en) 2014-07-23 2018-09-11 Gopro, Inc. Scene and activity identification in video summary generation
US9734870B2 (en) 2015-01-05 2017-08-15 Gopro, Inc. Media identifier generation for camera-captured media
JP6062474B2 (ja) * 2015-03-20 2017-01-18 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
US9639560B1 (en) 2015-10-22 2017-05-02 Gopro, Inc. Systems and methods that effectuate transmission of workflow between computing platforms
US10078644B1 (en) 2016-01-19 2018-09-18 Gopro, Inc. Apparatus and methods for manipulating multicamera content using content proxy
US9787862B1 (en) * 2016-01-19 2017-10-10 Gopro, Inc. Apparatus and methods for generating content proxy
US9871994B1 (en) 2016-01-19 2018-01-16 Gopro, Inc. Apparatus and methods for providing content context using session metadata
US10129464B1 (en) 2016-02-18 2018-11-13 Gopro, Inc. User interface for creating composite images
KR20170098079A (ko) * 2016-02-19 2017-08-29 삼성전자주식회사 전자 장치 및 전자 장치에서의 비디오 녹화 방법
US9972066B1 (en) 2016-03-16 2018-05-15 Gopro, Inc. Systems and methods for providing variable image projection for spherical visual content
US10402938B1 (en) 2016-03-31 2019-09-03 Gopro, Inc. Systems and methods for modifying image distortion (curvature) for viewing distance in post capture
US9838730B1 (en) 2016-04-07 2017-12-05 Gopro, Inc. Systems and methods for audio track selection in video editing
US10229719B1 (en) 2016-05-09 2019-03-12 Gopro, Inc. Systems and methods for generating highlights for a video
US9953679B1 (en) 2016-05-24 2018-04-24 Gopro, Inc. Systems and methods for generating a time lapse video
US9922682B1 (en) 2016-06-15 2018-03-20 Gopro, Inc. Systems and methods for organizing video files
US9967515B1 (en) 2016-06-15 2018-05-08 Gopro, Inc. Systems and methods for bidirectional speed ramping
US10045120B2 (en) 2016-06-20 2018-08-07 Gopro, Inc. Associating audio with three-dimensional objects in videos
US10395119B1 (en) 2016-08-10 2019-08-27 Gopro, Inc. Systems and methods for determining activities performed during video capture
US9953224B1 (en) 2016-08-23 2018-04-24 Gopro, Inc. Systems and methods for generating a video summary
US10268898B1 (en) 2016-09-21 2019-04-23 Gopro, Inc. Systems and methods for determining a sample frame order for analyzing a video via segments
US10282632B1 (en) 2016-09-21 2019-05-07 Gopro, Inc. Systems and methods for determining a sample frame order for analyzing a video
US10397415B1 (en) 2016-09-30 2019-08-27 Gopro, Inc. Systems and methods for automatically transferring audiovisual content
US10044972B1 (en) 2016-09-30 2018-08-07 Gopro, Inc. Systems and methods for automatically transferring audiovisual content
US11106988B2 (en) 2016-10-06 2021-08-31 Gopro, Inc. Systems and methods for determining predicted risk for a flight path of an unmanned aerial vehicle
US10002641B1 (en) 2016-10-17 2018-06-19 Gopro, Inc. Systems and methods for determining highlight segment sets
JP6270975B2 (ja) * 2016-12-14 2018-01-31 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
US10339443B1 (en) 2017-02-24 2019-07-02 Gopro, Inc. Systems and methods for processing convolutional neural network operations using textures
US9916863B1 (en) 2017-02-24 2018-03-13 Gopro, Inc. Systems and methods for editing videos based on shakiness measures
US10360663B1 (en) 2017-04-07 2019-07-23 Gopro, Inc. Systems and methods to create a dynamic blur effect in visual content
JP6946729B2 (ja) * 2017-05-12 2021-10-06 富士通株式会社 情報処理装置、情報処理システム及び情報処理方法
US10395122B1 (en) 2017-05-12 2019-08-27 Gopro, Inc. Systems and methods for identifying moments in videos
US10614114B1 (en) 2017-07-10 2020-04-07 Gopro, Inc. Systems and methods for creating compilations based on hierarchical clustering
US10402698B1 (en) 2017-07-10 2019-09-03 Gopro, Inc. Systems and methods for identifying interesting moments within videos
US10743085B2 (en) * 2017-07-21 2020-08-11 Microsoft Technology Licensing, Llc Automatic annotation of audio-video sequences
CN109756767B (zh) * 2017-11-06 2021-12-14 腾讯科技(深圳)有限公司 预览数据播放方法、装置及存储介质
US10897639B2 (en) * 2018-12-14 2021-01-19 Rovi Guides, Inc. Generating media content keywords based on video-hosting website content
KR20210108691A (ko) * 2020-02-26 2021-09-03 한화테크윈 주식회사 영상 검색 장치 및 이를 포함하는 네트워크 감시 카메라 시스템
WO2023189520A1 (ja) * 2022-03-30 2023-10-05 ソニーグループ株式会社 情報処理システム、情報処理方法、及び、プログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3472659B2 (ja) * 1995-02-20 2003-12-02 株式会社日立製作所 映像供給方法および映像供給システム
JP4227241B2 (ja) * 1999-04-13 2009-02-18 キヤノン株式会社 画像処理装置及び方法
US6964021B2 (en) * 2000-08-19 2005-11-08 Lg Electronics Inc. Method and apparatus for skimming video data
US7203380B2 (en) * 2001-11-16 2007-04-10 Fuji Xerox Co., Ltd. Video production and compaction with collage picture frame user interface
JPWO2005050986A1 (ja) * 2003-11-19 2007-07-12 独立行政法人情報通信研究機構 映像内容の提示方法及び装置
WO2005069172A1 (ja) * 2004-01-14 2005-07-28 Mitsubishi Denki Kabushiki Kaisha 要約再生装置および要約再生方法
US7945142B2 (en) * 2006-06-15 2011-05-17 Microsoft Corporation Audio/visual editing tool
JP5010292B2 (ja) * 2007-01-18 2012-08-29 株式会社東芝 映像属性情報出力装置、映像要約装置、プログラムおよび映像属性情報出力方法
JP5421627B2 (ja) * 2009-03-19 2014-02-19 キヤノン株式会社 映像データ表示装置及びその方法
US8881013B2 (en) * 2009-04-30 2014-11-04 Apple Inc. Tool for tracking versions of media sections in a composite presentation
JP2011055190A (ja) * 2009-09-01 2011-03-17 Fujifilm Corp 画像表示装置及び画像表示方法
JP2011239075A (ja) * 2010-05-07 2011-11-24 Sony Corp 表示装置、表示方法及びプログラム
JP5649425B2 (ja) * 2010-12-06 2015-01-07 株式会社東芝 映像検索装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106231233A (zh) * 2016-08-05 2016-12-14 北京邮电大学 一种基于权值的实时融屏方法
CN106231233B (zh) * 2016-08-05 2019-12-20 北京邮电大学 一种基于权值的实时融屏方法
CN106775243A (zh) * 2016-12-16 2017-05-31 厦门幻世网络科技有限公司 一种信息处理方法及电子设备
CN106775243B (zh) * 2016-12-16 2020-02-11 厦门黑镜科技有限公司 一种信息处理方法及电子设备
CN114979496A (zh) * 2019-04-22 2022-08-30 夏普株式会社 电子设备

Also Published As

Publication number Publication date
US20140149865A1 (en) 2014-05-29
JP2014106637A (ja) 2014-06-09

Similar Documents

Publication Publication Date Title
CN103838808A (zh) 信息处理装置、信息处理方法和程序
CN109803180B (zh) 视频预览图生成方法、装置、计算机设备及存储介质
US11317139B2 (en) Control method and apparatus
CN1538351B (zh) 为视频序列生成视频缩略图的方法和计算机
CN101783886B (zh) 信息处理设备、信息处理方法和程序
US8935169B2 (en) Electronic apparatus and display process
US20150378544A1 (en) Automated Content Detection, Analysis, Visual Synthesis and Repurposing
US9313444B2 (en) Relational display of images
KR20110043612A (ko) 이미지 처리
JP2009118060A (ja) 画像表示装置、画像表示方法、および画像表示システム
KR20100018988A (ko) 멀티미디어 디지털 콘텐츠의 축약정보 추출시스템과 축약 정보를 활용한 다중 멀티미디어 콘텐츠 디스플레이 시스템 및 그 방법
KR101440168B1 (ko) 개요 및 리포트를 이미 포함하는 시청각 도큐먼트의 새로운 개요를 생성하기 위한 방법 및 상기 방법을 구현할 수 있는 수신기
US9131207B2 (en) Video recording apparatus, information processing system, information processing method, and recording medium
CN105814905B (zh) 用于使使用信息在装置与服务器之间同步的方法和系统
CN105556947A (zh) 用于色彩检测以生成文本色彩的方法和装置
CN110418148B (zh) 视频生成方法、视频生成设备及可读存储介质
JP2006079460A (ja) 電子アルバム表示システム、電子アルバム表示方法、電子アルバム表示プログラム、画像分類装置、画像分類方法、及び画像分類プログラム
CN113992973A (zh) 视频摘要生成方法、装置、电子设备和存储介质
EP3185137A1 (en) Method, apparatus and arrangement for summarizing and browsing video content
JP5146282B2 (ja) 情報処理装置、表示制御方法、及びプログラム
JP2012178028A (ja) アルバム作成装置、アルバム作成装置の制御方法、及びプログラム
US20140189769A1 (en) Information management device, server, and control method
JP2008090526A (ja) 会議情報保存装置、システム、会議情報表示装置及びプログラム
WO2018035829A1 (zh) 一种广告播放装置
CN114245174B (zh) 视频预览方法以及相关设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140604