CN102369551B - 信息处理装置及信息处理方法 - Google Patents

信息处理装置及信息处理方法 Download PDF

Info

Publication number
CN102369551B
CN102369551B CN201180001636.2A CN201180001636A CN102369551B CN 102369551 B CN102369551 B CN 102369551B CN 201180001636 A CN201180001636 A CN 201180001636A CN 102369551 B CN102369551 B CN 102369551B
Authority
CN
China
Prior art keywords
mentioned
region
input area
track
movement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180001636.2A
Other languages
English (en)
Other versions
CN102369551A (zh
Inventor
宫本慎吾
山本雅哉
三浦康史
永田峰久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of CN102369551A publication Critical patent/CN102369551A/zh
Application granted granted Critical
Publication of CN102369551B publication Critical patent/CN102369551B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • G06F16/7335Graphical querying, e.g. query-by-region, query-by-sketch, query-by-trajectory, GUIs for designating a person/face/object as a query predicate

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

信息处理装置(10)是基于为了包围在运动图像内容中移动的对象而由用户输入的轨迹决定包含在该运动图像内容中的图像内的关注区域的信息处理装置(10),具备受理表示用户对显示中的运动图像内容输入的轨迹的输入数据的输入部(11)、和通过将由输入数据表示的轨迹确定的区域即输入区域修正来决定关注区域的修正部(12)。

Description

信息处理装置及信息处理方法
技术领域
本发明涉及基于为了包围在运动图像内容中移动的对象而由用户输入的轨迹决定包含在运动图像内容中的图像内的关注区域的信息处理装置及信息处理方法。
背景技术
近年来,通过数字技术和因特网的发展及运动图像投稿站点的流行,用户在TV(电视)广播的视听以外利用运动图像内容的机会戏剧性地增加。目前,用户在YouTube(注册商标)那样的运动图像投稿站点或Google(注册商标)那样的检索站点中输入键字,检索希望的内容。但是,通过该方法不能检索不能键字化的要素。所以,研究了能够更简单可靠地检索运动图像内容的方法。例如,有从某个运动图像内容中直接检索其他运动图像内容那样的方法。以往,作为从运动图像内容中检索别的运动图像内容的方法,公开了使用构成运动图像内容的1张静止图像的再一部分的区域检索运动图像内容的方法(例如参照专利文献1)。
现有技术文献
专利文献1:日本特开2008-146491号公报
发明内容
发明要解决的课题
在上述以往的方法中,在用户想要对运动图像内容内的某个区域关注而检索的情况下,需要使用鼠标等的输入机构包围该对象而进行指定。但是,由于运动图像内容内的对象正在运动,所以用来包围该对象的轨迹的输入紊乱,有由输入的轨迹确定的区域并不一定是适当的区域的问题。
所以,本发明是解决上述以往的问题的发明,目的是提供一种能够基于为了包围在运动图像内容中移动的对象而由用户输入的轨迹决定包含在运动图像内容中的图像内的关注区域的信息处理装置及信息处理方法。
解决课题的手段
为了达到上述目的,有关本发明的一技术方案的信息处理装置,是基于为了包围在运动图像内容中移动的对象而由用户输入的轨迹决定包含在上述运动图像内容中的图像内的关注区域的信息处理装置,具备:输入部,受理表示用户对显示中的上述运动图像内容输入的轨迹的输入数据;修正部,通过将由上述输入数据表示的轨迹确定的区域即输入区域修正,决定关注区域。
根据该结构,通过将由输入数据表示的轨迹确定的区域即输入区域修正能够决定关注区域。因而,在输入区域不是适当的区域的情况下,能够将输入区域修正,能够适当地决定关注区域。
此外,优选的是,上述输入数据是表示上述用户经过包含在上述运动图像内容中的多张图像输入的轨迹的数据;上述信息处理装置还具备计算上述多张图像中的上述输入区域内的像的移动量及移动方向的运动计算部;上述修正部通过使用计算出的上述移动量及上述移动方向将上述输入区域修正而决定上述关注区域。
根据该结构,能够使用输入区域内的像的移动量及移动方向将输入区域修正。一般而言,在输入区域内包含有用户想要包围的对象。因而,根据该结构,能够根据对象的运动而将输入区域修正。由此,即使在因对象的运动而轨迹的输入紊乱的情况下,也能够使用该运动将输入区域修正,所以能够适当地决定关注区域。即,能够适当地决定包含对象的关注区域。
此外,优选的是,上述修正部将根据上述移动量及上述移动方向使上述输入区域移动后的移动区域与上述输入区域的交集决定为上述关注区域。在此情况下,例如也可以是,上述修正部将使上述输入区域向上述移动方向移动上述移动量后的上述移动区域与上述输入区域的交集决定为上述多个图像中的最后的图像中的上述关注区域。此外,例如也可以是,上述修正部将使上述输入区域向上述移动方向的相反方向移动上述移动量后的上述移动区域与上述输入区域的交集决定为上述多个图像中的最初的图像中的上述关注区域。
根据这些结构,能够将使输入区域根据移动量及移动方向移动后的移动区域与输入区域的交集决定为关注区域。因而,即使是受对象的运动影响而输入区域变大到需要以上的情况,也能够将包含对象的区域、比输入区域小的区域决定为关注区域。结果,能够适当地决定关注区域。
此外,优选的是,上述修正部通过根据上述移动量及上述移动方向将上述输入区域压缩而决定上述关注区域。在此情况下,例如也可以是,上述修正部通过将上述输入区域向上述移动方向压缩上述移动量,决定上述多个图像中的最后的图像中的上述关注区域。此外,例如也可以是,上述修正部通过将上述输入区域向上述移动方向的相反方向压缩上述移动量,决定上述多个图像中的最初的图像中的上述关注区域。
根据这些结构,通过根据移动量及移动方向将输入区域压缩,能够决定关注区域。因而,即使是受对象的运动而输入区域变大到需要以上的情况,也能够将包含对象的区域、比输入区域小的区域决定为关注区域。结果,能够适当地决定关注区域。
此外,优选的是,上述运动计算部基于对上述多张图像中的至少最初的1张图像输入的轨迹选择至少1个像素群,计算所选择的像素群的移动量及移动方向作为上述输入区域内的像的移动量及移动方向。
根据该结构,能够基于对多张图像中的至少最初的1张图像输入的轨迹选择至少1个像素群。因而,能够基于在对象较大地运动前输入的轨迹选择像素群。通过使用这样选择的像素群计算移动量及移动方向,能够计算适应于对象的运动的移动量及移动方向。因而,通过使用这样计算的移动量及移动方向将输入区域修正,能够适当地决定关注区域。
此外,优选的是,上述运动计算部与上述输入并行计算上述移动量及上述移动方向,上述修正部与上述输入并行将上述输入区域修正。
根据该结构,能够与用户的输入并行将输入区域修正。
此外,优选的是,上述输入数据是表示上述用户经过包含在上述运动图像内容中的多张图像输入的轨迹的数据;上述修正部在经过上述多张图像的上述输入完成后,通过基于上述输入数据表示的轨迹的形状将上述输入区域修正,决定上述关注区域。
根据该结构,由于能够基于轨迹的形状将输入区域修正,所以不需要计算移动量及移动方向。因而,能够减轻计算负荷。
此外,优选的是,上述修正部将上述输入数据表示的轨迹近似为椭圆,在被输入了上述椭圆的长轴与上述轨迹的交点中的距上述轨迹的起点最远的交点的图像中,将距上述起点最远的交点的附近的区域决定为上述关注区域。
根据该结构,将轨迹近似为椭圆,在被输入了该椭圆的长轴与轨迹的交点中的距轨迹的起点最远的交点的图像中,能够将距起点最远的交点的附近的区域决定为关注区域。因而,能够将用来包围对象的轨迹开始闭合的位置的附近的区域决定为关注区域。即,可以考虑对象存在于轨迹开始闭合的位置,所以能够适当地决定为包含对象的关注区域。
此外,优选的是,上述修正部通过将上述输入数据表示的轨迹补充,来决定上述关注区域。
根据该结构,通过将用户输入的轨迹补充,能够决定关注区域。因而,能够在对象较大地运动之前适当地决定关注区域。
此外,优选的是,上述修正部通过将上述输入数据表示的轨迹近似为椭圆,将上述轨迹补充。
根据该结构,通过将用户输入的轨迹近似为椭圆,能够将该轨迹补充。在用户为了将运动的对象包围而输入轨迹的情况下,一般该轨迹的形状容易成为椭圆。此外,如果是椭圆,则能够用比较少的点数近似。因而,通过将用户输入的轨迹近似为椭圆,能够适当地决定关注区域。
此外,优选的是,上述修正部基于上述输入数据决定用来决定上述关注区域的算法,通过按照所决定的算法将上述输入区域修正,来决定上述关注区域。
根据该结构,能够基于输入数据适应性地决定用来决定关注区域的算法,能够更适当地决定关注区域。
此外,上述信息处理装置也可以构成为集成电路。
另外,本发明不仅能够作为这样的信息处理装置实现,还能够作为以这样的信息处理装置具备的特征性的构成要素的动作为步骤的信息处理方法实现。此外,本发明也可以作为使计算机执行包含在信息处理方法中的各步骤的程序实现。并且,当然可以将这样的程序经由CD-ROM(CompactDisc Read Only Memory)等的非暂时性的记录介质或因特网等的传送介质分发。
发明效果
根据本发明,能够基于为了包围在运动图像内容中移动的对象而由用户输入的轨迹适当地决定包含在运动图像内容中的图像内的关注区域。
附图说明
图1是表示本发明的实施方式1的信息处理装置的功能结构的框图。
图2是表示由本发明的实施方式1的信息处理装置进行的整体的处理的流程的流程图。
图3是表示本发明的实施方式1的输入过程的详细的处理的流程的流程图。
图4是表示本发明的实施方式1的输入数据表示的轨迹的一例的图。
图5是表示本发明的实施方式1的运动计算过程的详细的处理的流程的流程图。
图6是用来说明在本发明的实施方式1中选择的像素群的图。
图7是表示本发明的实施方式1的像素群的移动量及移动方向的计算结果的一例的图。
图8是表示本发明的实施方式1的像素群的移动量及移动方向的计算结果的一例的图。
图9是用来对本发明的实施方式1的修正部进行的输入区域的修正处理进行说明的图。
图10是表示本发明的实施方式1的变形例1的输入数据表示的轨迹的一例的图。
图11是表示在本发明的实施方式1的变形例1中选择的像素群的一例的图。
图12是表示在本发明的实施方式1的变形例2中确定的输入区域的一例的图。
图13是表示在本发明的实施方式1的变形例2中选择的像素群的一例的图。
图14是表示本发明的实施方式1的变形例3的运动计算过程的详细的处理的流程的流程图。
图15是表示在本发明的实施方式1的变形例3中选择的像素群的一例的图。
图16是表示本发明的实施方式1的变形例3的像素群的移动量及移动方向的计算结果的一例的图。
图17是表示本发明的实施方式1的变形例3的像素群的移动量及移动方向的计算结果的一例的图。
图18是用来对本发明的实施方式1的变形例4的修正部进行的输入区域的修正处理说明的图。
图19是用来对本发明的实施方式1的变形例5的修正部进行的输入区域的修正处理说明的图。
图20是用来对本发明的实施方式1的变形例6的修正部进行的输入区域的修正处理说明的图。
图21是用来对本发明的实施方式1的变形例7的修正部进行的输入区域的修正处理说明的图。
图22是表示本发明的实施方式2的信息处理装置的功能结构的框图。
图23是表示本发明的实施方式2的运动计算过程的详细的处理的流程的流程图。
图24是用来说明在本发明的实施方式2中选择的像素群的图。
图25是用来说明在本发明的实施方式2中计算输入区域内的像的移动量及移动方向的处理的图。
图26是用来说明在本发明的实施方式2中计算输入区域内的像的移动量及移动方向的处理的图。
图27是用来说明在本发明的实施方式2中将输入区域修正的处理的图。
图28是表示本发明的实施方式3的信息处理装置的功能结构的框图。
图29是表示由本发明的实施方式3的信息处理装置进行的整体的处理的流程的流程图。
图30是表示本发明的实施方式3的输入数据表示的轨迹的一例的图。
图31是表示本发明的实施方式3的修正过程的详细的处理的流程的流程图。
图32是用来说明在本发明的实施方式3中选择用来将输入区域修正的图像的处理的图。
图33A是表示在本发明的实施方式3中将输入区域修正的方法的一例的图。
图33B是表示在本发明的实施方式3中将输入区域修正的方法的一例的图。
图33C是表示在本发明的实施方式3中将输入区域修正的方法的一例的图。
图34是表示本发明的实施方式4的信息处理装置的功能结构的框图。
图35是表示本发明的实施方式4的修正过程的详细的处理的流程的流程图。
图36是表示在本发明的实施方式4中被补充后的轨迹包围的关注区域的一例的图。
图37是表示本发明的实施方式5的信息处理装置的功能结构的框图。
图38是表示本发明的实施方式5的修正过程的详细的处理的流程的流程图。
图39是用来说明在本发明的实施方式5中决定算法的方法的一例的图。
图40是用来说明在本发明的实施方式5中决定算法的方法的另一例的图。
图41是用来说明在本发明的实施方式5中决定算法的方法的再另一例的图。
图42是表示有关本发明的一形态的信息处理装置的功能结构的框图。
具体实施方式
以下,参照附图对本发明的实施方式进行说明。
(实施方式1)
本发明的实施方式1的信息处理装置100基于为了包围在运动图像内容中移动的对象而由用户输入的轨迹,决定包含在运动图像内容中的图像内的关注区域。特别是,在本实施方式中,信息处理装置100在用户完成输入后,通过使用作为由输入的轨迹确定的区域的输入区域内的像的移动量及移动方向修正该输入区域,来决定关注区域。
另外,所谓包含在运动图像内容中的图像,是指构成运动图像的图片。此外,所谓输入区域内的像,是指由包含在作为图片内的一部分区域的输入区域内的像素形成的图像(像)。此外,所谓对象,是指在运动图像内容中表示的对象物(例如人、动物、交通工具、标记等)。
以下,参照附图对本发明的实施方式1的信息处理装置进行说明。
图1是表示本发明的实施方式1的信息处理装置100的功能结构的框图。
[信息处理装置的内部结构]
信息处理装置100具备运动图像内容取得部110、解码部120、显示部160、运动计算部140、修正部150、及输入部130。
输入机构190是用于用户向信息处理装置100输入关注区域的遥控器、鼠标、或键盘那样的具体的输入机构。此外,在信息处理装置100具备触摸面板的情况下,输入机构190也可以是接触笔那样的触笔、或用户的手指。进而,输入机构190也可以是用来能够进行通过姿势或声音的操作的装置。
运动图像内容取得部110从广播、网络、或二次存储装置等取得用户视听的运动图像内容。
解码部120将运动图像内容取得部110取得的运动图像内容解码。
输入部130经由输入机构190从用户受理输入数据。具体而言,输入部130受理表示用户对显示中的运动图像内容输入的轨迹的输入数据。在本实施方式中,输入数据是表示用户经过(わたる)包含在运动图像内容中的多张的图像输入的轨迹的数据。
运动计算部140计算输入区域内的像的移动量及移动方向。即,运动计算部140计算输入区域内的像的移动量及移动方向。另外,在本实施方式中,运动计算部140通过计算包含在输入区域中的像素群的移动量及移动方向,计算输入区域内的像的移动量及移动方向。对移动量及移动方向的计算方法的详细情况在后面叙述。
另外,所谓输入区域,是通过输入数据表示的轨迹确定的区域。在本实施方式中,所谓输入区域,是由输入数据表示的轨迹包围的区域。此外,所谓像素群,是指由一定数量的像素构成的像素的组。
修正部150通过使用运动计算部140计算出的、输入区域内的像的移动量及移动方向将输入区域修正,决定关注区域。并且,修正部150将这样决定的关注区域向显示部160输出。此外,修正部150也可以将这样决定的关注区域向外部的图像检索装置等输出。另外,关于输入区域的修正方法的详细情况在后面叙述。
显示部160显示解码部120解码的运动图像内容、和由输入部130受理的输入数据表示的轨迹。进而,显示部显示表示由修正部150决定的关注区域的信息。
[信息处理装置的整体动作]
接着,对如以上那样构成的信息处理装置100的各种动作进行说明。
图2是表示由本发明的实施方式1的信息处理装置100进行的整体的处理的流程的流程图。信息处理装置100执行受理输入数据的输入过程(步骤S210)、计算输入区域内的像素群的移动量及移动方向的运动计算过程(步骤S220)、和将输入区域修正的修正过程(步骤S230)。
[输入过程]
首先,对输入过程(步骤S210)详细地叙述。图3是表示本发明的实施方式1的输入过程(步骤S210)的详细的处理的流程的流程图。
当用户使用输入机构190开始轨迹的输入时,信息处理装置100的输入部130受理表示输入的轨迹的输入数据。并且,输入部130将受理的输入数据向运动计算部140和显示部160发送(步骤S310)。在用户继续输入的期间中,输入部130对运动计算部140和显示部160持续发送输入数据(步骤S320)。另外,显示部160将接受到的输入数据原样叠加在运动图像内容中而显示。
图4是表示本发明的实施方式1的输入数据表示的轨迹的一例的图。具体而言,图4是表示为了将在运动图像内容中移动的对象包围而用户经过多张图像输入轨迹的经过的一例的图。
在包含在运动图像内容中的3张图像(图像X、X+1、及X+2)中,对象420在水平方向上从左向右移动。用户输入轨迹410、411、及412,以使其将该对象420包围。最终,用户受对象的运动影响而输出包围比对象大得多的区域的椭圆形的轨迹412。
[运动计算过程]
接着,对运动计算过程(步骤S220)详细叙述。图5是表示本发明的实施方式1的运动计算过程(步骤S220)的详细的处理的流程的流程图。
[记录输入开始/完成时的图像]
运动计算部140当从输入部130开始了输入数据的接收时,参照从运动图像内容取得部110并行接收的运动图像内容,将在用户开始输入的定时显示的图像(以下称作“最初的图像”)的ID记录(步骤S510)。接着,运动计算部140当从输入部130完成了输入数据的接收时(步骤S520),参照从运动图像内容取得部110并行接收的运动图像内容,将在用户完成输入的定时显示的图像(以下称作“最后的图像”)的ID记录(步骤S530)。
[像素群的选择]
接着,运动计算部140选择用来计算输入区域内的像的移动量及移动方向的像素群(步骤S540)。具体而言,运动计算部140基于输入数据表示的轨迹确定输入区域。这里,运动计算部140将被输入数据表示的轨迹包围的区域确定为输入区域。并且,运动计算部140在从最初的图像到最后的图像之间的全部的图像中,选择包含在输入区域中的像素群。另外,这里,在包含在输入区域中的像素群中,包括至少其一部分的像素包含在输入区域中的像素群。
图6是用来说明在本发明的实施方式1中选择的像素群的图。如图6所示,运动计算部140在图像X、X+1、及X+2的各自中,从包含在图像中的多个像素群之中,选择哪怕是一部分包含在输入区域中的像素群(被阴影显示的像素群)。
[移动量及移动方向的计算]
接着,运动计算部140通过计算在步骤S540中选择的像素群的移动量及移动方向,计算输入区域内的像的移动量及移动方向(步骤S550)。
计算在某个图像中选择的像素群的移动量及移动方向作为该图像的相对于之前的图像的相对的移动量及移动方向。因而,例如在对图像N~图像N+m输入了轨迹的情况下,在图像N+1~图像N+m中计算像素群的移动量及移动方向。
例如,在图6中计算的像素群的移动量及移动方向为图像X+1的相对于图像X的移动量及移动方向、和图像X+2的相对于图像X+1的移动量及移动方向。
图7是表示本发明的实施方式1的像素群的移动量及移动方向的计算结果的一例的图。在图像X和图像X+1之间有移动的只是像素群A~I。例如,图像X的像素群A0移动到图像X+1的像素群A1。因而,像素群A1的相对于像素群A0的移动量及移动方向在x方向上为5像素群的量、在y方向上为0像素群的量。同样,像素群B1~I1的相对于像素群B0~I0的移动量及移动方向也分别在x方向上为5像素群的量、在y方向上为0像素群的量。其他像素群的移动量是0。
此外,图8是表示本发明的实施方式1的像素群的移动量及移动方向的计算结果的一例的图。与图像X+1的相对于图像X的移动量及移动方向同样,像素群A2~I2的相对于像素群A1~I1的移动量及移动方向也分别在x方向上为5像素群的量、在y方向上为0像素群的量。此外,其他像素群的移动量是0。
并且,运动计算部140按照图像计算这样计算出的像素群的移动量及移动方向的平均值。并且,运动计算部140计算所计算出的各图像的平均值的总和作为图像X~X+2的输入区域内的像的移动量及移动方向。
这里,对按照图像计算像素群的移动量及移动方向的平均值、计算该平均值的总和的方法详细叙述。
运动计算部140首先按照图像计算多个像素群的移动量及移动方向的平均值。此时,运动计算部140将没有移动的像素群忽视而导出平均值。即,运动计算部140按照图像计算移动量比0大的像素群的移动量及移动方向的平均值。
接着,运动计算部140计算所计算出的各图像的平均值的总和作为输入区域内的像的移动量及移动方向。例如,在图7及图8中,如以下这样计算输入区域内的像的移动量及移动方向。
图像X+1的平均值=(像素群A1的移动量及移动方向(5,0)+像素群B1的移动量及移动方向(5,0)+像素群C1的移动量及移动方向(5,0)+像素群D1的移动量及移动方向(5,0)+像素群E1的移动量及移动方向(5,0)+像素群F1的移动量及移动方向(5,0)+像素群G1的移动量及移动方向(5,0)+像素群H1的移动量及移动方向(5,0)+像素群I1的移动量及移动方向)(5,0)/9=(5,0)
图像X+2的平均值=(像素群A2的移动量及移动方向(5,0)+像素群B2的移动量及移动方向(5,0)+像素群C2的移动量及移动方向(5,0)+像素群D2的移动量及移动方向(5,0)+像素群E2的移动量及移动方向(5,0)+像素群F2的移动量及移动方向(5,0)+像素群G2的移动量及移动方向(5,0)+像素群H2的移动量及移动方向(5,0)+像素群I2的移动量及移动方向(5,0))/9=(5,0)
输入区域内的像的移动量及移动方向=图像X+1的平均值(5,0)+图像X+2的平均值(5,0)=(10,0)
另外,运动计算部140并不一定需要通过上述那样的方法计算输入区域内的像的移动量及移动方向。例如,运动计算部140也可以计算包含在输入区域中的全部的像素群(包括没有运动的像素群)的移动量及移动方向的平均值的总和作为输入区域内的像的移动量及移动方向。
[修正过程]
接着,对修正过程(步骤S230)详细地叙述。修正部150将对应于计算出的移动量及移动方向使输入区域移动的移动区域与输入区域的交集决定为关注区域。具体而言,修正部150在被输入了轨迹的多个图像中的最后的图像上使输入区域向移动方向移动移动量。并且,修正部150将移动前后的区域的交集决定为关注区域。
图9是用来对本发明的实施方式1的修正部150进行的输入区域的修正处理说明的图。修正部150计算使输入区域900向计算出的移动方向移动计算出的移动量、即向x方向移动10像素量后的移动区域910。接着,修正部150将输入区域900与移动区域910的交集决定为关注区域920。
如以上这样,根据本实施方式的信息处理装置100,能够将由为了将对象包围而由用户输入的轨迹确定的输入区域修正为用户本来想要的关注区域。
此外,根据本实施方式的信息处理装置100,能够使用输入区域内的像的移动量及移动方向将输入区域修正。一般而言,在输入区域内包含用户想要包围的对象。因而,根据信息处理装置100,能够对应于对象的运动而将输入区域修正。由此,即使是因对象的运动而轨迹的输入紊乱的情况,也能够利用该运动将输入区域修正,所以能够适当地决定关注区域。即,能够将用户想要的区域、即包含对象的区域适当地决定为关注区域。
进而,根据本实施方式的信息处理装置100,能够将对应于移动量及移动方向而使输入区域移动后的移动区域与输入区域的交集决定为关注区域。因而,即使是受对象的运动影响而输入区域变大到所需以上的情况,也能够将包含对象的区域、比输入区域小的区域决定为关注区域。结果,能够适当地决定关注区域。
并且,只要将这样决定的关注区域向图像检索装置等输出,就能够高效率地检测与用户想要指定的对象关联的图像内容(静止图像内容或运动图像内容)。
接着,以下对实施方式1的变形例进行说明。另外,在以下的各变形例的说明中,以与实施方式1不同的点为中心进行说明,对于与实施方式1同样的点适当地省略图示及说明。
(实施方式1的变形例1)
在实施方式1的变形例1中,根据输入的轨迹确定输入区域、选择包含在输入区域中的像素群的处理与上述实施方式1不同。当用户使用输入机构190输入轨迹时,并不一定如图4那样输入椭圆形的轨迹。例如,也可以想到输入图10所示那样的轨迹的情形。所以,在本变形例中,运动计算部140将输入数据表示的轨迹近似为椭圆,将被该椭圆包围的区域确定为输入区域。以下,参照附图对本变形例的信息处理装置进行说明。
图10是表示本发明的实施方式1的变形例1的输入数据表示的轨迹的一例的图。具体而言,图10是表示用户经过多张图像的输入轨迹、以使其将在运动图像内容中移动的对象包围的经过的另一例的图。
在包含在运动图像内容中的3张图像(图像X、X+1、及X+2)中,与图4同样,对象在水平方向上从左向右移动。用户最初受对象的运动影响而输入轨迹。但是,最终用户在图像X+2中输入了包围对象的轨迹。在这样的情况下,运动计算部140难以根据输入数据表示的轨迹简单地确定输入区域。
所以,运动计算部140将输入数据表示的轨迹近似为包含全部那样的椭圆,将由该椭圆包围的区域确定为输入区域。另外,运动计算部140只要使用最小二乘法等一般的方法将轨迹近似为椭圆就可以。
图11是表示在本发明的实施方式1的变形例1中选择的像素群的一例的图。在本变形例中,运动计算部140如图11所示,从包含在图像中的多个像素群之中选择包含在被将用户输入的轨迹近似的椭圆包围的输入区域中的像素群。
如以上这样,根据本变形例的信息处理装置100,即使是用户输入的轨迹不是椭圆的情况,也能够适当地决定关注区域。
(实施方式1的变形例2)
在实施方式1的变形例2中,与上述变形例1同样,根据输入的轨迹确定输入区域,选择包含在输入区域中的像素群的处理与上述实施方式1不同。具体而言,在本变形例中,运动计算部140确定包含输入数据表示的轨迹的矩形状的区域作为输入区域。以下,参照附图对本变形例的信息处理装置进行说明。
图12是表示在本发明的实施方式1的变形例2中确定的输入区域的一例的图。在如图12那样将坐标系设定在图像中的情况下,运动计算部140在输入数据表示的轨迹中计算x坐标的最小值及最大值、和y坐标的最小值及最大值。运动计算部140将以分别组合了这样计算出的x坐标的最小值及最大值、和y坐标的最小值及最大值的4点为顶点的矩形状的区域确定为输入区域。
图13是表示在本发明的实施方式1的变形例2中选择的像素群的一例的图。在本变形例中,运动计算部140如图13所示,从包含在图像中的多个像素群中选择包含在通过由用户输入的轨迹确定的矩形状的输入区域中的像素群。
如以上这样,根据本变形例的信息处理装置100,在输入区域不是椭圆形状的情况下,也能够适当地决定关注区域。
(实施方式1的变形例3)
在实施方式1的变形例3中,选择用来计算输入区域内的像的移动量及移动方向的像素群的处理与上述实施方式1不同。具体而言,在本变形例中,运动计算部140基于对被输入了轨迹的多张图像中的至少最初的1张图像输入的轨迹选择至少1个像素群。以下,参照附图对本变形例的信息处理装置进行说明。
图14是表示本发明的实施方式1的变形例3的运动计算过程的详细的处理的流程的流程图。在图14中,对于与图5同样的处理赋予相同的标号而省略说明。
运动计算部140基于对被输入了轨迹的多张图像中的至少最初的1张图像输入的轨迹,选择至少1个像素群(S1440)。使用图15~图17详细地说明具体例。
图15是表示在本发明的实施方式1的变形例3中选择的像素群的一例的图。具体而言,图15表示在被输入了轨迹的图像X~X+2中的最初的图像X中选择的像素群。
如图15所示,由于用户对图像X输入的轨迹是输入途中的轨迹,所以没有形成闭区域。所以,运动计算部140选择从被输入的轨迹的一个端点沿垂直方向延伸的线段1500、从被输入的轨迹的另一个端点沿水平方向延伸的线段1510、和包含在由输入的轨迹包围的区域中的像素群1520。运动计算部140如图16及图17所示,计算这样选择的像素群1520的、图像X~X+2的移动量及移动方向,作为输入区域内的像的移动量及移动方向。
另外,运动计算部140并不一定需要基于对最初的1张图像输入的轨迹选择像素群。例如,运动计算部140也可以基于对最初的两张以上的图像输入的轨迹选择像素群。
此外,运动计算部140并不一定需要如上述那样计算像素群的移动量及移动方向。例如,运动计算部140也可以计算用Moving Picture ExpertsGroup(MPEG)等的影像压缩方式使用的宏块(8×8像素)单位的“运动矢量”作为8×8像素的像素群的移动量及移动方向。
如以上那样,根据本变形例的信息处理装置100,可以基于对多张图像中的至少最初的1张图像输入的轨迹选择至少1个像素群。因而,能够基于在对象较大地运动之前输入的轨迹选择像素群。通过使用这样选择的像素群计算移动量及移动方向,能够计算适应于对象的运动的移动量及移动方向。因而,通过使用这样计算出的移动量及移动方向将输入区域修正,能够适当地决定关注区域。
(实施方式1的变形例4)
在实施方式1的变形例4中,通过将输入区域修正而决定关注区域的处理与上述实施方式1不同。具体而言,在本变形例中,修正部150将使输入区域向与输入区域内的像的移动方向的相反方向移动了移动量后的移动区域与输入区域的交集决定为多个图像中的最初的图像中的关注区域。以下,参照附图对本变形例的信息处理装置进行说明。
图18是用来对本发明的实施方式1的变形例4的修正部150进行的输入区域的修正处理进行说明的图。如图18所示,修正部150在最初的图像X中,计算使输入区域1800向与计算出的移动方向的相反方向移动了计算出的移动量后的移动区域1810。接着,修正部150将输入区域1800与移动区域1810的交集决定为关注区域1820。
如以上这样,根据本变形例的信息处理装置100,能够起到与实施方式1同样的效果。
(实施方式1的变形例5)
在实施方式1的变形例5中,通过将输入区域修正而决定关注区域的处理与上述实施方式1不同。具体而言,在本变形例中,修正部150通过根据移动量及移动方向将输入区域压缩而决定关注区域。以下,参照附图对本变形例的信息处理装置进行说明。
图19是用来对本发明的实施方式1的变形例5的修正部150进行的输入区域的修正处理进行说明的图。如图19所示,修正部150通过根据计算出的移动量及移动方向将输入区域压缩而决定关注区域。具体而言,修正部150通过将输入区域向计算出的移动方向压缩计算出的移动量,决定用户输入了轨迹的多个图像中的最后的图像中的关注区域。
更具体地讲,首先,修正部150在最后的图像X+2中设定与计算出的移动方向平行的x’轴1910。接着,修正部150确定构成用户输入的轨迹1920的全部点中的、在x’轴上位于左端的点1930及位于右端的点1940、和使点1930向计算出的移动方向移动计算出的移动量后的点1950。接着,修正部150计算点1930与点1950的x’轴方向上的距离m、和点1940与点1950的x’轴方向上的距离n。最后,修正部150将点1940的x’坐标设为0,通过将构成轨迹1920的全部的点中的除了点1940以外的点的x’坐标缩小为n/(m+n),将用户输入的轨迹1920压缩为轨迹1960。这样,修正部150通过将输入区域1900压缩而决定关注区域1970。
如以上这样,根据本变形例的信息处理装置100,通过根据移动量及移动方向将输入区域压缩,能够决定关注区域。因而,即使是受对象的运动影响而输入区域变大到需要以上的情况,也能够将包含对象的区域、比输入区域小的区域决定为关注区域。结果,能够适当地决定关注区域。
另外,在本变形例中,修正部150在用户输入了轨迹的多个图像中的最后的图像中决定关注区域,但并不一定需要在最后的图像中决定关注区域。例如,修正部150也可以在比最后的图像靠前1张的图像中决定关注区域。此外,例如修正部150也可以确定用来包围对象的轨迹开始闭合时的图像、在所确定的图像中决定关注区域。
(实施方式1的变形例6)
在实施方式1的变形例6中,与上述变形例5同样,通过将输入区域修正来决定关注区域的处理与上述实施方式1不同。具体而言,在本变形例中,修正部150通过将输入区域向与移动方向的相反方向压缩移动量,来决定多个图像中的最初的图像中的关注区域。以下,参照附图对本变形例的信息处理装置进行说明。
图20是用来对本发明的实施方式1的变形例6的修正部150进行的输入区域的修正处理进行说明的图。如图20所示,修正部150通过将输入区域向与计算出的移动方向的相反方向压缩计算出的移动量,决定用户输入了轨迹的多个图像中的最初的图像中的关注区域。
更具体地讲,首先,修正部150在最初的图像X中设定与计算出的移动方向平行的x’轴2010。接着,修正部150确定构成用户输入的轨迹2020的全部点中的、在x’轴上位于左端的点2030及位于右端的点2040、和使点2040向与计算出的移动方向相反方向移动了计算出的移动量后的点2050。接着,修正部150计算点2030与点2050的x’轴方向上的距离m、和点2040与点2050的x’轴方向上的距离n。最后,修正部150将点2030的x’坐标设为0,通过将构成轨迹2020的全部的点中的除了点2040以外的点的x’坐标缩小为m/(m+n),将用户输入的轨迹2020压缩为轨迹2060。这样,修正部150通过将输入区域2000压缩来决定关注区域。
如以上这样,根据本变形例的信息处理装置100,能够起到与上述变形例6同样的效果。
(实施方式1的变形例7)
在实施方式1的变形例7中,与上述变形例5及6同样,通过将输入区域修正来决定关注区域的处理与上述实施方式1不同。另外,在本变形例中,如上述变形例2那样,输入区域的形状是矩形状。以下,参照附图对本变形例的信息处理装置进行说明。
图21是用来对本发明的实施方式1的变形例7的修正部150进行的输入区域的修正处理进行说明的图。如图21所示,修正部150通过将输入区域向计算出的移动方向压缩计算出的移动量,决定用户输入了轨迹的多个图像中的最初的图像中的关注区域。
具体而言,首先,修正部150在最后的图像X+2中,将输入区域2100的上边设定为x轴2120、将右边设定为y轴2130、将上边及右边的交点2140设定为原点。接着,修正部150确定使输入区域2100的左下侧的顶点2150向计算出的移动方向移动了计算出的移动量的点2160。接着,修正部150计算点2150与点2160的x轴方向上的距离m、和点2150与点2140的x轴方向上的距离n。此外,修正部150计算点2150与点2160的y轴方向上的距离q、和点2150与点2140的y轴方向上的距离p。最后,修正部150通过将构成轨迹2110的全部点的x坐标压缩n/(m+n)、将y坐标压缩p/(p+q),将轨迹2110压缩为轨迹2170。这样,修正部150通过将输入区域2100压缩来决定关注区域2180。
如以上这样,根据本变形例中的信息处理装置100,即使输入区域是矩形状,也能够与上述变形例5等同样适当地决定关注区域。
以上,对本发明的实施方式1的变形例1~7进行了说明,但只要没有矛盾,也可以将上述变形例1~7中的各构成要素组合。例如,信息处理装置100也可以如上述变形例3那样计算移动量及移动方向、如上述变形例5或6那样决定关注区域。
(实施方式2)
接着,对本发明的实施方式2进行说明。在本实施方式中,主要是计算输入区域内的像的移动量及移动方向的处理和将输入区域修正的处理与上述实施方式1不同。具体而言,在本实施方式中,运动计算部与用户的输入并行计算移动量及移动方向,修正部与用户的输入并行将输入区域修正。以下,参照附图对本实施方式的信息处理装置进行说明。
图22是表示本发明的实施方式2的信息处理装置2200的功能结构的框图。另外,在图22中,对于与图1同样的构成要素赋予相同的标号而适当省略说明。
信息处理装置2200具备运动图像内容取得部110、解码部120、显示部160、运动计算部2240、修正部2250、及输入部130。
运动计算部2240计算输入区域内的像的移动量及移动方向。具体而言,运动计算部2240与用户的输入并行,计算输入区域内的像的移动量及移动方向。在本实施方式中,运动计算部2240每当显示的图像切换时,计算输入区域内的像的移动量及移动方向。另外,关于移动量及移动方向的计算方法的详细情况在后面叙述。
修正部2250使用运动计算部2240计算出的输入区域内的像的移动量及移动方向,将输入区域修正。具体而言,修正部2250与用户的输入并行,将输入区域修正。在本实施方式中,修正部2250每当显示的图像切换而计算输入区域内的像的移动量及移动方向时,将输入区域修正。另外,关于输入区域的修正方法的详细情况在后面叙述。
接着,对如以上那样构成的信息处理装置2200的各种动作进行说明。另外,本实施方式的信息处理装置2200进行的整体的处理的流程与实施方式1的图2是同样的,所以省略图示。
对运动计算过程(步骤S220)详细叙述。图23是表示本发明的实施方式2的运动计算过程(步骤S220)的详细的处理的流程的流程图。
运动计算部2240在从输入部130开始输入数据的接收时(步骤S2310:是),参照从运动图像内容取得部110并行接收的运动图像内容,记录在用户开始输入的定时显示的图像(最初的图像)的ID(步骤S2320)。接着,运动计算部2240在从输入部130完成了输入数据的接收时(步骤S2330:是),参照从运动图像内容取得部110并行接收的运动图像内容,将在用户完成输入的定时显示的图像(最后的图像)的ID记录(步骤S2340)。
在不是开始输入数据的接收时(步骤S2310:否)、并且不是完成了输入数据的接收时的情况下(步骤S2330:否),运动计算部2240判断是否是显示部160显示的图像切换的定时(步骤S2350)。这里,在不是显示的图像切换的定时的情况下(步骤S2350:否),运动计算部2240回到步骤S2310的处理。
另一方面,在是显示的图像切换的定时的情况下(步骤S2350:是)、或者步骤S2340的处理结束后,运动计算部2240选择用来计算输入区域内的像的移动量及移动方向的像素群(步骤S2360)。并且,运动计算部2240计算所选择的像素群的移动量及移动方向(步骤S2370)。如果像素群的移动量及移动方向的计算完成,则信息处理装置2200立即进行输入区域的修正(步骤S230)。
这里,使用图24~图27详细叙述计算输入区域的像的移动量及移动方向的处理和将输入区域修正的处理。
图24是用来说明在本发明的实施方式2中选择的像素群的图。此外,图25及图26是用来说明在本发明的实施方式2中计算输入区域内的像的移动量及移动方向的处理的图。此外,图27是用来说明在本发明的实施方式2中将输入区域修正的处理的图。
如图24所示,运动计算部2240在图像X+1中确定输入区域。这里,仅通过用户到图像X+1为止输入的轨迹没有形成闭区域。所以,运动计算部2240将用户到图像X+1为止输入的轨迹如虚线所示那样补充,将由补充的轨迹包围的区域确定为输入区域。并且,运动计算部2240选择包含在所确定的输入区域中的像素群(被阴影显示的像素群)。另外,轨迹的补充方法是一例,只要是补充轨迹以使其包围对象,怎样补充都可以。
接着,运动计算部2240如图25所示,计算在图像X+1中选择的像素群的移动量及移动方向。另外,在图25中,与实施方式1的图7相比,选择的像素群不同,但像素群的移动量及移动方向的计算方法相同。接着,修正部2250如图27所示那样将输入区域修正。具体而言,修正部2250将由到图像X+1为止由用户输入的轨迹2700、从轨迹2700的一个端点沿水平方向延伸的线段2710、和从轨迹2700的另一个端点沿垂直方向延伸的线段2720包围的输入区域2730修正。
更具体地讲,修正部2250首先设定与由运动计算部2240计算出的输入区域内的像的移动方向平行的x’轴2740。
接着,修正部2250确定构成轨迹2700的全部点中的、在x’轴方向上位于左端的点2750及位于右端的点2760、和使点2750向计算出的移动方向移动计算出的移动量后的点2770。接着,修正部2250计算点2750与点2770的x’轴方向上的距离m、和点2760与点2770的x’轴方向上的距离n。最后,修正部2250将点2760的x’坐标设为0,通过将构成轨迹2700的全部点的x’坐标缩小为n/(m+n),将用户输入的轨迹2700压缩为轨迹2780。这样,修正部2250通过将输入区域2730压缩来决定关注区域2790。
此外,在显示中的图像从图像X+1切换为图像X+2之后,在图像X+2中,运动计算部2240如图24(c)所示,将由在图像X+1中修正后的轨迹和用户对显示中的图像X+2输入的轨迹包围的区域确定为输入区域。并且,运动计算部2240选择所确定的输入区域内的像素群。接着,运动计算部2240如图26所示,计算所选择的像素群的移动量及移动方向作为输入区域内的像的移动量及移动方向。
并且,修正部2250在图像X+2中,与图像X+1同样,通过将输入区域修正来决定关注区域。另外,修正部2250并不一定需要在图像X+2中将输入区域修正。即,修正部2250也可以将在图像X+1中修正后的区域决定为关注区域。
如以上这样,根据本实施方式的信息处理装置2200,能够与用户的输入并行而将输入区域修正。因而,例如也能够实时地显示关注区域,能够辅助用户适当地输入轨迹。
另外,在本实施方式中,修正部2250每当显示的图像切换时将输入区域修正。即,修正部2250按照1张图像将输入区域进行了修正,但并不一定需要按照1张图像将输入区域修正。例如,修正部2250也可以按照两张以上的图像将输入区域修正。此外,运动计算部2240也可以按照两张以上的图像计算移动量及移动方向。
(实施方式3)
接着,对本发明的实施方式3进行说明。在本实施方式中,修正部在用户的输入完成后,通过基于输入数据表示的轨迹的形状将输入区域修正,来决定关注区域。即,本实施方式的信息处理装置不使用输入区域内的像的移动量及移动方向而决定关注区域。以下,参照附图对本实施方式的信息处理装置进行说明。
图28是表示本发明的实施方式3的信息处理装置2800的功能结构的框图。另外,在图28中,对于与图1同样的构成要素赋予相同的标号而适当省略说明。
信息处理装置2800具备运动图像内容取得部110、解码部120、显示部160、修正部2850、及输入部130。
修正部2850将输入区域修正。具体而言,修正部2850通过在经过多张图像的用户的输入完成后、基于输入数据表示的轨迹将输入区域修正,来决定关注区域。在本实施方式中,修正部2850将输入数据表示的轨迹近似为椭圆,在被输入了该椭圆的长轴与该轨迹的交点的图像中,将交点附近的区域决定为关注区域。
接着,对信息处理装置2800的各种动作进行说明。对如以上那样构成的信息处理装置2800的各种动作进行说明。
图29是表示由本发明的实施方式3的信息处理装置2800进行的整体的处理的流程的流程图。另外,在图29中,对于与图2同样的处理赋予相同的标号而省略说明。
如图29所示,信息处理装置2800执行受理输入数据的输入过程(步骤S210)、和将输入区域修正的修正过程(步骤S2930)。
图30是表示本发明的实施方式3的输入数据表示的轨迹的一例的图。具体而言,图30是表示为了将在运动图像内容中移动的对象包围而用户经过多张图像输入轨迹的经过的一例的图。
在包含在运动图像内容中的4张图像(图像X、X+1、X+2、及X+3)中,对象3020在水平方向上从左向右移动。用户为了将该对象3020包围而输入轨迹3010、3011、3012、及3013。最终,用户受对象3020的运动影响而输入椭圆形的轨迹3013。
这里,对修正过程(步骤S2930)详细地叙述。图31是表示本发明的实施方式3的修正过程(步骤S2930)的详细的处理的流程的流程图。
修正部2850当从输入部130开始输入数据的接收时,参照从运动图像内容取得部110并行接收的运动图像内容,将在用户开始输入的定时显示的图像(最初的图像)的ID记录(步骤S510)。接着,修正部2850当从输入部130完成了输入数据的接收时(步骤S520),参照从运动图像内容取得部110并行接收的运动图像内容,将在用户完成了输入的定时显示的图像(最后的图像)的ID记录(步骤S530)。
接着,修正部2850从用户输入了轨迹的多个图像之中选择用来将输入区域修正的图像(步骤S3140)。具体而言,修正部2850在用户完成输入后,将输入数据表示的轨迹近似为椭圆,选择被输入了该椭圆的长轴与该轨迹的交点的图像。
图32是用来说明用来在本发明的实施方式3中选择将输入区域修正的图像的处理的图。修正部2850首先计算与用户最终输入的轨迹3013近似的椭圆3210。
并且,修正部2850确定计算出的椭圆的长轴3220与用户的输入的轨迹3013的两个交点中的、距轨迹3013的起点3230较远的交点3240。
接着,修正部2850选择在输入了所确定的交点3240的定时显示的图像X+2作为用来将输入区域修正的图像。
接着,修正部2850在所选择的图像中将输入区域修正(步骤S3150)。具体而言,修正部2850在所选择的图像中将所确定的交点的附近的区域决定为关注区域。
图33A~图33C分别是表示在本发明的实施方式3中将输入区域修正的方法的一例的图。
例如,如图33A所示,修正部2850在所选择的图像X+2中,将被内接于交点3240的附近的轨迹的圆包围的区域3310决定为关注区域。
此外,例如如图33B所示,修正部2850在所选择的图像X+2中,将直径的长度与椭圆3210的短径3320的长度相等的圆、并且被通过交点3240的圆包围的区域3330决定为关注区域。
此外,例如如图33C所示,修正部2850在所选择的图像X+2中,将长轴3220用从最初的图像X到所选择的图像X+2显示的图像的张数(这里是“3”)等分。并且,修正部2850将由通过分割点、并且与长轴3220正交的线段3340及3350与轨迹3013包围的区域中的、包含交点3240的区域3360决定为关注区域。
另外,修正部2850只要将输入数据表示的轨迹近似为椭圆、将输入区域修正到该椭圆的长轴与该轨迹的交点的附近的区域中就可以,并不限定于上述修正方法。
如以上这样,根据本实施方式的信息处理装置2800,由于能够基于轨迹的形状将输入区域修正,所以不需要计算移动量及移动方向。因而,能够减轻计算负荷。
进而,根据本实施方式的信息处理装置2800,将轨迹近似为椭圆,在被输入了该椭圆的长轴与轨迹的交点中的距轨迹的起点最远的交点的图像中,能够将距起点最远的交点的附近的区域决定为关注区域。因而,能够将用来包围对象的轨迹开始闭合的位置的附近的区域决定为关注区域。即,由于可以认为对象存在于轨迹开始闭合的位置,所以能够适当地决定为包含对象的关注区域。
(实施方式4)
接着,对本发明的实施方式4进行说明。在本实施方式中,修正部通过将输入数据表示的轨迹补充来决定关注区域。即,本实施方式的信息处理装置与上述实施方式3同样,不使用输入区域内的像的移动量及移动方向而决定关注区域。以下,参照附图对本实施方式的信息处理装置进行说明。
图34是表示本发明的实施方式4的信息处理装置3400的功能结构的框图。另外,在图34中,对于与图1同样的构成要素赋予相同的标号而适当省略说明。
信息处理装置3400具备运动图像内容取得部110、解码部120、显示部160、修正部3450、及输入部130。
修正部3450通过将输入数据表示的轨迹补充来决定关注区域。在本实施方式中,修正部3450通过将输入数据表示的轨迹近似为椭圆来补充该轨迹。
接着,对如以上那样构成的信息处理装置3400的各种动作进行说明。另外,本实施方式的信息处理装置3400进行的整体的处理的流程与实施方式3的图29是同样的,所以省略图示。
图35是表示本发明的实施方式4的修正过程(步骤S2930)的详细的处理的流程的流程图。
修正部3450判断是否能够将到当前显示的图像为止输入的轨迹补充而形成椭圆(步骤S3510)。即,修正部3450判断是否能够将轨迹近似为椭圆。这里,在将不能将轨迹补充而形成椭圆的情况下(步骤S3510:否),重复步骤S3510的处理。
另一方面,在能够将轨迹补充而形成椭圆的情况下(步骤S3510:是),修正部3450将被将轨迹补充而形成的椭圆包围的区域决定为关注区域(步骤S3520)。即,修正部3450通过将输入数据表示的轨迹近似为椭圆而将该轨迹补充,将被补充后的轨迹包围的区域决定为关注区域。
图36是表示被在本发明的实施方式4中补充的轨迹包围的关注区域的一例的图。修正部3450对轨迹3600添加曲线3610,以使其成为与输入数据表示的轨迹3600近似的椭圆。修正部3450将由这些轨迹3600和曲线3610包围的区域(阴影区域)决定为关注区域3620。
如以上这样,根据本实施方式的信息处理装置3400,通过将用户输入的轨迹补充,能够决定关注区域。因而,能够在对象较大地运动之前适当地决定关注区域。
进而,根据本实施方式的信息处理装置3400,通过将用户输入的轨迹近似为椭圆,能够将该轨迹补充。在用户为了将运动的对象包围而输入轨迹的情况下,一般该轨迹的形状容易成为椭圆。此外,如果是椭圆,则能够用比较少的点数近似。因而,通过将用户输入的轨迹近似为椭圆,能够适当地决定关注区域。
另外,修正部3450并不一定需要将轨迹近似为椭圆。例如,在用户预先知道以矩形状输入轨迹的情况下等,修正部3450也可以将轨迹近似为矩形。
(实施方式5)
接着,对本发明的实施方式5进行说明。在本实施方式中,修正部基于输入数据决定用来决定关注区域的算法,通过按照所决定的算法将输入区域修正来决定关注区域。以下,参照附图对本实施方式的信息处理装置进行说明。
图37是表示本发明的实施方式5的信息处理装置3700的功能结构的框图。另外,在图37中,对于与图1同样的构成要素赋予相同的标号而适当省略说明。
信息处理装置3700具备运动图像内容取得部110、解码部120、显示部160、运动计算部140、修正部3750、及输入部130。
修正部3750基于输入数据决定用来决定关注区域的算法。并且,修正部3750通过按照所决定的算法将输入区域修正来决定关注区域。
具体而言,修正部3750基于输入数据,决定是否如上述实施方式1或2那样使用输入区域内的像的移动量及移动方向将输入区域修正。
例如,修正部3750基于输入数据表示的轨迹的形状,决定是否使用移动量及移动方向将输入区域修正。此外,例如修正部3750基于输入区域内的像的移动量及移动方向的离差(ばらつき),决定是否使用移动量及移动方向将输入区域修正。
接着,对如以上那样构成的信息处理装置3700的各种动作进行说明。另外,本实施方式的信息处理装置3700进行的整体的处理的流程与实施方式1的图2是同样的,所以省略图示。
这里,对与实施方式1不同的处理不同的修正过程(步骤S230)详细叙述。图38是表示本发明的实施方式5的修正过程(步骤S230)的详细的处理的流程的流程图。
首先,修正部3750基于输入数据决定用来最适当地决定关注区域的算法(步骤S3810)。接着,修正部3750通过按照所决定的算法将输入区域修正来决定关注区域(步骤S3820)。
以下,使用图39~图41对决定算法的方法的一例进行说明。图39~图41分别是用来说明在本发明的实施方式5中决定算法的方法的一例的图。
例如,如图39所示,在有多个在输入区域内移动的对象的情况下,修正部3750决定为不使用移动量及移动方向将输入区域修正。具体而言,修正部3750在表示包含在输入区域中像素群的移动量及移动方向的离差的值是阈值以上的情况下,决定为不使用移动量及移动方向进行修正。另外,所谓表示离差的值,例如是方差或标准偏差。
在这样有多个在输入区域内移动的对象的情况下,难以计算用户想要包围的对象的移动量及移动方向。因而,修正部3750通过决定为不使用移动量及移动方向将输入区域修正,能够适当地决定关注区域。
此外,例如如图40所示,修正部3750判断是否能够将输入数据表示的轨迹近似为椭圆。例如,修正部3750通过判断表示基于输入数据表示的轨迹得到的椭圆、与该轨迹的差的值是否比预先设定的阈值大,判断是否能够将轨迹近似为椭圆。
这里,在不能将轨迹近似为椭圆的情况下,修正部3750决定为使用移动量及移动方向将输入区域修正。由此,即使在不能如实施方式4那样利用将轨迹补充的方法的情况下,修正部3750能够适当地决定关注区域。
此外,例如如图41所示,在对象的运动较复杂、形成轨迹歪斜的闭区域的情况下,修正部3750决定为不使用移动量及移动方向将输入区域修正。在这样的情况下,修正部3750如实施方式4那样,通过将轨迹补充来决定关注区域。
另外,上述的算法的决定方法是一例,修正部3750也可以基于不同的基准决定算法。
如以上这样,根据本实施方式的信息处理装置3700,能够基于输入数据适应性地决定用来决定关注区域的算法,能够更适当地决定关注区域。
以上,对有关本发明的一形态的信息处理装置基于实施方式进行了说明,但本发明并不限定于这些实施方式。只要不脱离本发明的主旨,对本实施方式实施了本领域的技术人员想到的各种变形后的形态、或者将不同的实施方式或其变形例的构成要素组合而构建的形态也包含在本发明的技术范围内。
例如,在上述实施方式1~5中,信息处理装置具备了运动图像内容取得部110、解码部120及显示部160,但并不一定必须具备这些构成要素。例如,如图42所示,信息处理装置10只要具备输入部11和修正部12就可以。在此情况下,信息处理装置10例如通过修正部12对显示装置等输出关注区域或关注区域内的像,也能够起到与上述实施方式同样的效果。
此外,在上述实施方式1~5中,显示部显示由修正部决定的关注区域,但并不一定需要显示关注区域。在此情况下,例如修正部也可以将关注区域或关注区域内的像向图像检索装置等发送。
此外,上述实施方式1~5的信息处理装置具备的构成要素的一部分或全部也可以由1个系统LSI(Large Scale Integration:大规模集成电路)构成。例如,信息处理装置也可以由具有输入部和修正部的系统LSI构成。
系统LSI是将多个结构部集成在1个芯片上而制造的超多功能LSI,具体而言是包括微处理器、ROM(Read Only Memory)、RAM(Ramdom AccessMemory)等而构成的计算机系统。在上述RAM中存储有计算机程序。通过上述微处理器按照上述计算机程序动作,系统LSI实现其功能。
另外,这里设为系统LSI,但根据集成度的差异,也有称作IC、LSI、超级LSI、超大规模LSI的情况。此外,集成电路化的方法并不限于LSI,也可以由专用电路或通用处理器实现。也可以利用在LSI制造后能够编程的FPGA(Field Programmable Gate Array)、或能够再构成LSI内部的电路单元的连接及设定的可重构处理器。
进而,如果因半导体技术的进步或派生的其他技术出现代替LSI的集成电路化的技术,则当然也可以使用该技术进行功能块的集成化。有可能是生物技术的应用等。
此外,本发明不仅能够作为具备这样的特征性的构成要素的信息处理装置实现,还能够作为以包含在信息处理装置中的特征性的构成要素进行的处理为步骤的信息处理方法实现。此外,也可以作为使计算机执行包含在信息处理方法中的特征性的各步骤的计算机程序实现。并且,当然也可以使这样的计算机程序经由CD-ROM等的计算机可读取的非暂时性的记录介质或因特网等的通信网络流通。
产业上的可利用性
有关本发明的一形态的信息处理装置作为基于为了包围在运动图像内容中移动的对象而由用户输入的轨迹适当地决定包含在运动图像内容中的图像内的关注区域的信息处理装置具有实用性。基恩人,作为利用所决定的关注区域检索与显示中的运动图像内容不同的运动图像内容的运动图像内容检索装置等也具有实用性。
符号说明
10、100、2200、2800、3400、3700信息处理装置
11、130输入部
12、150、2250、2850、3450、3750修正部
110运动图像内容取得部
120解码部
140、2240运动计算部
160显示部
190输入机构

Claims (17)

1.一种信息处理装置,基于为了包围在运动图像内容中移动的对象而由用户输入的轨迹,决定包含在上述运动图像内容中的图像内的关注区域,其特征在于,具备:
输入部,受理表示用户对显示中的上述运动图像内容输入的轨迹的输入数据;以及
修正部,通过将由上述输入数据表示的轨迹确定的区域即输入区域修正,从而决定关注区域,
上述输入数据是表示当顺序显示包含在上述运动图像内容中的多张图像时,为了包围经过上述多张图像而移动的对象,由上述用户输入的一个轨迹的数据,
上述信息处理装置还具备计算上述多张图像中的上述输入区域内的像的移动量及移动方向的运动计算部;
上述修正部将根据上述移动量及上述移动方向使上述输入区域移动后的移动区域与上述输入区域的交集决定为上述关注区域,
上述修正部(i)决定被用于决定上述关注区域的算法;(ii)按照所决定的上述算法,通过对输入区域进行修正来决定关注区域,该输入区域是由上述输入数据表示的轨迹所确定的区域,
上述修正部以如下的方式来决定上述算法,
(i)当表示包含在上述输入区域中的图像的移动量以及移动方向的偏差的值为阈值以上的情况下,上述修正部决定不使用包含在上述输入区域的图像的移动量和移动方向对上述输入区域进行修正;
(ii)当由上述用户输入的轨迹形成歪斜的闭区域的情况下,上述修正部决定不使用包含在上述输入区域的图像的移动量和移动方向对上述输入区域进行修正;
(iii)当不能将由上述用户输入的轨迹近似为椭圆的情况下,上述修正部决定使用包含在上述输入区域的图像的移动量和移动方向对上述输入区域进行修正。
2.如权利要求1所述的信息处理装置,其特征在于,
上述修正部在上述用户完成输入后将上述输入区域修正。
3.如权利要求1所述的信息处理装置,其特征在于,
上述修正部将使上述输入区域向上述移动方向移动上述移动量后的上述移动区域与上述输入区域的交集决定为上述多张图像中的最后的图像中的上述关注区域。
4.如权利要求1所述的信息处理装置,其特征在于,
上述修正部将使上述输入区域向上述移动方向的相反方向移动上述移动量后的上述移动区域与上述输入区域的交集决定为上述多张图像中的最初的图像中的上述关注区域。
5.如权利要求1、3、4中任一项所述的信息处理装置,其特征在于,
上述运动计算部基于对上述多张图像中的至少最初的1张图像输入的轨迹选择至少1个像素群,计算所选择的像素群的移动量及移动方向作为上述输入区域内的像的移动量及移动方向。
6.如权利要求2所述的信息处理装置,其特征在于,
上述修正部通过根据上述移动量及上述移动方向将上述输入区域压缩,从而决定上述关注区域。
7.如权利要求6所述的信息处理装置,其特征在于,
上述修正部通过将上述输入区域向上述移动方向压缩上述移动量,从而决定上述多张图像中的最后的图像中的上述关注区域。
8.如权利要求6所述的信息处理装置,其特征在于,
上述修正部通过将上述输入区域向上述移动方向的相反方向压缩上述移动量,从而决定上述多张图像中的最初的图像中的上述关注区域。
9.如权利要求6~8中任一项所述的信息处理装置,其特征在于,
上述运动计算部基于对上述多张图像中的至少最初的1张图像输入的轨迹选择至少1个像素群,计算所选择的像素群的移动量及移动方向作为上述输入区域内的像的移动量及移动方向。
10.如权利要求1所述的信息处理装置,其特征在于,
上述运动计算部与上述输入并行计算上述移动量及上述移动方向;
上述修正部与上述输入并行将上述输入区域修正。
11.如权利要求1所述的信息处理装置,其特征在于,
上述修正部在经过上述多张图像的上述输入完成后,通过基于上述输入数据表示的轨迹的形状将上述输入区域修正,决定上述关注区域。
12.如权利要求11所述的信息处理装置,其特征在于,
上述修正部将上述输入数据表示的轨迹近似为椭圆,在被输入了上述椭圆的长轴与上述轨迹的交点中的距上述轨迹的起点最远的交点的图像中,将距上述起点最远的交点的附近的区域决定为上述关注区域。
13.如权利要求1所述的信息处理装置,其特征在于,
上述修正部通过将上述输入数据表示的轨迹补充,来决定上述关注区域。
14.如权利要求13所述的信息处理装置,其特征在于,
上述修正部通过将上述输入数据表示的轨迹近似为椭圆,从而将上述轨迹补充。
15.如权利要求1所述的信息处理装置,其特征在于,
上述修正部基于上述输入数据决定用来决定上述关注区域的算法,通过按照所决定的算法将上述输入区域修正,来决定上述关注区域。
16.如权利要求1所述的信息处理装置,其特征在于,
上述信息处理装置构成为集成电路。
17.一种信息处理方法,基于为了包围在运动图像内容中移动的对象而由用户输入的轨迹,决定包含在上述运动图像内容中的图像内的关注区域,其特征在于,包括:
输入步骤,受理表示用户对显示中的上述运动图像内容输入的轨迹的输入数据;以及
修正步骤,通过将由上述输入数据表示的轨迹确定的区域即输入区域修正,从而决定关注区域,
上述输入数据是表示当顺序显示包含在上述运动图像内容中的多张图像时,为了包围经过上述多张图像而移动的对象,由上述用户输入的一个轨迹的数据,
上述信息处理方法还包括计算上述多张图像中的上述输入区域内的像的移动量及移动方向的运动计算步骤;
上述修正步骤将根据上述移动量及上述移动方向使上述输入区域移动后的移动区域与上述输入区域的交集决定为上述关注区域,
上述修正步骤(i)决定被用于决定上述关注区域的算法;(ii)按照所决定的上述算法,通过对输入区域进行修正来决定关注区域,该输入区域是由上述输入数据表示的轨迹所确定的区域,
上述修正步骤以如下的方式来决定上述算法,
(i)当表示包含在上述输入区域中的图像的移动量以及移动方向的偏差的值为阈值以上的情况下,上述修正步骤决定不使用包含在上述输入区域的图像的移动量和移动方向对上述输入区域进行修正;
(ii)当由上述用户输入的轨迹形成歪斜的闭区域的情况下,上述修正步骤决定不使用包含在上述输入区域的图像的移动量和移动方向对上述输入区域进行修正;
(iii)当不能将由上述用户输入的轨迹近似为椭圆的情况下,上述修正步骤决定使用包含在上述输入区域的图像的移动量和移动方向对上述输入区域进行修正。
CN201180001636.2A 2010-01-29 2011-01-13 信息处理装置及信息处理方法 Active CN102369551B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2010018147 2010-01-29
JP2010018146 2010-01-29
JP2010-018147 2010-01-29
JP2010-018146 2010-01-29
PCT/JP2011/000117 WO2011093013A1 (ja) 2010-01-29 2011-01-13 情報処理装置及び情報処理方法

Publications (2)

Publication Number Publication Date
CN102369551A CN102369551A (zh) 2012-03-07
CN102369551B true CN102369551B (zh) 2016-08-31

Family

ID=44319012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180001636.2A Active CN102369551B (zh) 2010-01-29 2011-01-13 信息处理装置及信息处理方法

Country Status (4)

Country Link
US (1) US8705794B2 (zh)
JP (1) JP5711136B2 (zh)
CN (1) CN102369551B (zh)
WO (1) WO2011093013A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021191975A1 (ja) * 2020-03-23 2021-09-30 Nttテクノクロス株式会社 体重推定装置、体重推定方法及びプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101384980A (zh) * 2006-02-17 2009-03-11 科乐美数码娱乐株式会社 轨迹信息处理装置、轨迹信息处理方法、信息记录介质及程序

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5198896A (en) * 1989-10-26 1993-03-30 Canon Kabushiki Kaisha Movement detection apparatus for detecting movement vectors from an image signal
US5708845A (en) * 1995-09-29 1998-01-13 Wistendahl; Douglass A. System for mapping hot spots in media content for interactive digital media program
US5970504A (en) * 1996-01-31 1999-10-19 Mitsubishi Denki Kabushiki Kaisha Moving image anchoring apparatus and hypermedia apparatus which estimate the movement of an anchor based on the movement of the object with which the anchor is associated
JP4226730B2 (ja) 1999-01-28 2009-02-18 株式会社東芝 物体領域情報生成方法及び物体領域情報生成装置並びに映像情報処理方法及び情報処理装置
US6570586B1 (en) * 1999-09-03 2003-05-27 Isurftv Bandwidth effective method for communicating interactive links
JP4112819B2 (ja) * 2000-05-11 2008-07-02 株式会社東芝 物体領域情報生成装置及び物体領域情報記述プログラム
KR100415266B1 (ko) * 2000-05-11 2004-01-16 가부시끼가이샤 도시바 물체영역정보 기술방법과 물체영역정보 생성장치 및 기록매체
US7058204B2 (en) * 2000-10-03 2006-06-06 Gesturetek, Inc. Multiple camera control system
JP4190819B2 (ja) * 2002-07-17 2008-12-03 Juki株式会社 電子部品実装装置及び画像認識方法の選択方法
JP4114720B2 (ja) * 2002-10-25 2008-07-09 株式会社ソニー・コンピュータエンタテインメント 画像生成方法および画像生成装置
JP2004227423A (ja) 2003-01-24 2004-08-12 Sony Corp ビデオコンテンツ配信システム及びビデオコンテンツ送受信方法
US20070025444A1 (en) 2005-07-28 2007-02-01 Shigeyuki Okada Coding Method
JP2008011455A (ja) * 2006-06-30 2008-01-17 Sanyo Electric Co Ltd 符号化方法
JP4961850B2 (ja) * 2006-06-15 2012-06-27 ソニー株式会社 動き検出方法、動き検出方法のプログラム、動き検出方法のプログラムを記録した記録媒体及び動き検出装置
JP2008146491A (ja) 2006-12-12 2008-06-26 Yahoo Japan Corp 情報提供装置、情報提供方法、及びコンピュータプログラム
US8229163B2 (en) * 2007-08-22 2012-07-24 American Gnc Corporation 4D GIS based virtual reality for moving target prediction
JP2009129039A (ja) 2007-11-21 2009-06-11 Hitachi Ltd コンテンツ格納装置及びコンテンツ格納方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101384980A (zh) * 2006-02-17 2009-03-11 科乐美数码娱乐株式会社 轨迹信息处理装置、轨迹信息处理方法、信息记录介质及程序

Also Published As

Publication number Publication date
US20120020525A1 (en) 2012-01-26
US8705794B2 (en) 2014-04-22
WO2011093013A1 (ja) 2011-08-04
JPWO2011093013A1 (ja) 2013-05-30
CN102369551A (zh) 2012-03-07
JP5711136B2 (ja) 2015-04-30

Similar Documents

Publication Publication Date Title
CN111010590B (zh) 一种视频裁剪方法及装置
CN110495166A (zh) 球形视频编辑
US8305457B2 (en) Image processing apparatus, dynamic picture reproduction apparatus, and processing method and program for the same
JP5628424B2 (ja) コンテンツ検索のためのシステム、方法、およびユーザインタフェース
US10419788B2 (en) Creation of virtual cameras for viewing real-time events
US8350929B2 (en) Image pickup apparatus, controlling method and program for the same
US20090184981A1 (en) system, method and computer program product for displaying images according to user position
JP5906843B2 (ja) キーワード検出装置、その制御方法および制御プログラム、並びに表示機器
CN103608748B (zh) 视觉搜索以及推荐用户界面和装置
CN105830093A (zh) 用于产生与非均匀大小的空间区相关的元数据的系统、方法及设备
CN107005741A (zh) 沉浸式缩放交互式电视
CN108307239B (zh) 一种视频内容推荐方法和装置
CN102971726A (zh) 从多领域搜索的内容排除的系统和方法
US20210266578A1 (en) Image compression method and image decompression method
CN111327917A (zh) 直播内容的预览方法、装置、设备及存储介质
CN111491208A (zh) 视频处理方法、装置、电子设备及计算机可读介质
Feng et al. LiveROI: region of interest analysis for viewport prediction in live mobile virtual reality streaming
JP5960691B2 (ja) 興味区間特定装置、興味区間特定方法、興味区間特定プログラム
US20160021388A1 (en) Video Encoding Method and Decoding Method and Apparatuses
CN102369551B (zh) 信息处理装置及信息处理方法
Irfan et al. Deepdive: A learning-based approach for virtual camera in immersive contents
CN112492382B (zh) 视频帧提取方法、装置、电子设备和存储介质
CN112839251B (zh) 一种电视及其与用户的交互方法
CN114143561A (zh) 一种超高清视频多视角漫游播放方法
CN116597515A (zh) 人体动作匹配方法、装置、直播系统、计算机设备及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20141010

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20141010

Address after: Seaman Avenue Torrance in the United States of California No. 2000 room 200

Applicant after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Applicant before: Matsushita Electric Industrial Co.,Ltd.

C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: Seaman Avenue Torrance in the United States of California No. 20000 room 200

Applicant after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Seaman Avenue Torrance in the United States of California No. 2000 room 200,

Applicant before: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM:

C14 Grant of patent or utility model
GR01 Patent grant