CN102073675B - 信息处理装置、信息处理方法、程序和信息处理系统 - Google Patents
信息处理装置、信息处理方法、程序和信息处理系统 Download PDFInfo
- Publication number
- CN102073675B CN102073675B CN201010549680.4A CN201010549680A CN102073675B CN 102073675 B CN102073675 B CN 102073675B CN 201010549680 A CN201010549680 A CN 201010549680A CN 102073675 B CN102073675 B CN 102073675B
- Authority
- CN
- China
- Prior art keywords
- parts
- display
- block
- structural units
- signal conditioning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本发明提供了信息处理装置、信息处理方法、程序和信息处理系统。提供了一种信息处理装置,其包括:结构分析部件,分析记述有与显示控制相关的信息并且包括多个结构单位的显示控制数据,并且提取显示控制数据中包括的结构单位;布局设定部件,基于由结构分析部件提取的结构单位来设定当在显示画面上显示该显示控制数据时使用的布局信息;关键字提取部件,与结构单位相对应的显示内容中提取关键字;以及内容搜索部件,搜索与由关键字提取部件提取的关键字相对应的图像内容。布局设定部件把由内容搜索部件搜索到的图像内容放置在显示有包括与该图像内容相对应的关键字的结构单位的显示区域中。
Description
技术领域
本发明涉及信息处理装置、信息处理方法、程序和信息处理系统。
背景技术
随着视频站点的普及,已经可以仅通过输入关键字就很容易地搜索视频内容,并且在因特网上观看视频内容已经变得很普遍了。因此,提出了从视频内容中提取关键字并且获取与所提取的关键字相关的内容的方法(例如,参见JP-A-2009-10797和JP-A-2009-157460)。
另外,将视频内容嵌入到网站、博客等等中已经变得很容易了,并且用户在查看网站的同时找到其感兴趣的视频内容也变得更容易了。
发明内容
然而,也存在这样的情况,即用户尝试找到与在没有嵌入诸如视频内容之类的图像内容的网站上记述的信息相关的图像内容。在此情况下,用户必须通过手工操作从记述的信息中提取可能与图像内容相关的关键字,并且通过使用搜索引擎来检测相关图像内容。因此,需要一种能够自动提取关键字并且高度准确地搜索用户所需求的图像内容的方法。
另外,即使当从某个网站提取了关键字并且检测到对应的图像内容时,在例如所提取的关键字的数目是两个或更多个的情况下,也很难理解这些关键字中的哪个与作为搜索结果获得的图像内容相关。
考虑到上述情况,希望提供一种能够以下述方式显示图像内容的新颖且改进的信息处理装置、信息处理方法、程序和信息处理系统:该方式使得作为搜索结果获得的图像内容与用于搜索图像内容的关键字之间的对应关系被明确示出。
根据本发明的一个实施例,提供了一种信息处理装置,其包括:结构分析部件,该结构分析部件分析记述有与显示控制相关的信息并且包括多个结构单位的显示控制数据,并且提取显示控制数据中包括的结构单位;布局设定部件,该布局设定部件基于由结构分析部件提取的结构单位来设定当在显示画面上显示该显示控制数据时使用的布局信息;关键字提取部件,该关键字提取部件从与结构单位相对应的显示内容中提取关键字;以及内容搜索部件,该内容搜索部件搜索与由关键字提取部件提取的关键字相对应的图像内容。布局设定部件把由内容搜索部件搜索到的图像内容放置在显示有包括与该图像内容相对应的关键字的结构单位的显示区域中。
信息处理装置还可包括所选主题判定部件,该所选主题判定部件判定显示画面上通过用户操作选择的所选区域中包括的显示内容。布局设定部件可生成位置信息作为布局信息,该位置信息包括指示出在显示画面上显示与每个结构单位相对应的显示内容的位置的坐标。所选主题判定部件可参考由布局设定部件生成的位置信息,并且当显示有与结构单位相对应的显示内容的区域的至少一部分被包括在所选区域中时可判定该结构单位被选择。
布局设定部件可基于所生成的位置信息,通过使用指示出在显示画面内的位置的坐标,来设定图像内容在显示区域内的放置位置。
布局设定部件可把与图像内容相关的信息和指示出图像内容在显示区域内的放置位置的信息额外记述在相应的结构单位中。
关键字提取部件可基于从中提取关键字的结构单位中包括的标签的类型来分析该结构单位的类型,并且当该标签是定义显示画面中的预定结构的标签时可从包括该标签的结构单位中提取至少一个关键字。
根据本发明的另一实施例,提供了一种信息处理方法,其包括以下步骤:分析记述有与显示控制相关的信息并且包括多个结构单位的显示控制数据,并且提取显示控制数据中包括的结构单位;基于结构单位来设定当在显示画面上显示该显示控制数据时使用的布局信息;从与结构单位相对应的显示内容中提取关键字;搜索与所提取的关键字相对应的图像内容;以及把搜索到的图像内容放置在显示有包括与该图像内容相对应的关键字的结构单位的显示区域中。
根据本发明的另一实施例,提供了一种程序,用于使计算机实现:结构分析功能,该结构分析功能分析记述有与显示控制相关的信息并且包括多个结构单位的显示控制数据,并且提取显示控制数据中包括的结构单位;布局设定功能,该布局设定功能基于由结构分析功能提取的结构单位来设定当在显示画面上显示该显示控制数据时使用的布局信息;关键字提取功能,该关键字提取功能从与结构单位相对应的显示内容中提取关键字;内容搜索功能,该内容搜索功能搜索与由关键字提取功能提取的关键字相对应的图像内容;以及图像内容放置功能,该图像内容放置功能把由内容搜索功能搜索到的图像内容放置在显示有包括与该图像内容相对应的关键字的结构单位的显示区域中。
根据本发明的另一实施例,提供了一种信息处理系统,包括:信息处理装置,该信息处理装置包括:结构分析部件,该结构分析部件分析记述有与显示控制相关的信息并且包括多个结构单位的显示控制数据,并且提取显示控制数据中包括的结构单位,以及布局设定部件,该布局设定部件基于由结构分析部件提取的结构单位来设定当在显示画面上显示该显示控制数据时使用的布局信息;以及内容管理服务器,该内容管理服务器包括:关键字提取部件,该关键字提取部件基于从信息处理装置发送来的结构单位的提取结果,从与所提取的结构单位相对应的显示内容中提取关键字,以及内容搜索部件,该内容搜索部件搜索与由关键字提取部件提取的关键字相对应的图像内容。布局设定部件把由内容管理服务器搜索到的图像内容放置在显示有包括与该图像内容相对应的关键字的结构单位的显示区域中。
根据本发明的上述实施例,作为搜索结果获得的图像内容被放置在包括与图像内容相对应的关键字的显示区域中,因此,作为搜索结果获得的图像内容和用于搜索这个作为搜索结果获得的图像内容的关键字之间的对应关系变得清楚。结果,根据本发明的实施例,可以增强用户的便利性。
附图说明
图1是示出根据本发明第一实施例的信息处理系统的说明图;
图2是示出根据该实施例的信息处理装置的配置的框图;
图3A是示出根据该实施例的信息处理装置的说明图;
图3B是示出根据该实施例的信息处理装置的说明图;
图4是示出根据该实施例的信息处理装置的说明图;
图5是示出根据该实施例的信息处理装置的说明图;
图6是示出根据该实施例的信息处理装置的说明图;
图7A是示出根据该实施例的信息处理装置的说明图;
图7B是示出根据该实施例的信息处理装置的说明图;
图8是示出根据该实施例的信息处理装置的说明图;
图9是示出根据该实施例的信息处理装置的说明图;
图10A是示出根据该实施例的信息处理装置的说明图;
图10B是示出根据该实施例的信息处理装置的说明图;
图11A是示出根据该实施例的信息处理装置的说明图;
图11B是示出根据该实施例的信息处理装置的说明图;
图12A是示出根据该实施例的信息处理装置的说明图;
图12B是示出根据该实施例的信息处理装置的说明图;
图13是示出根据该实施例的信息处理方法的流程图;
图14是示出根据该实施例的信息处理方法的流程图;
图15是示出根据该实施例的信息处理方法的流程图;
图16是示出根据该实施例的信息处理方法的流程图;
图17是示出根据该实施例的信息处理方法的流程图;
图18是示出根据该实施例的信息处理方法的第一修改例的流程图;并且
图19是示出根据本发明实施例的信息处理装置的硬件配置的框图。
具体实施方式
下面,将参考附图详细描述本发明的优选实施例。注意,在本说明书和附图中,用相同的标号来表示具有基本相同的功能和结构的结构元件,并且省略对这些结构元件的重复说明。
注意,将按以下顺序进行描述。
(1)第一实施例
(1-1)信息处理系统
(1-2)信息处理装置的配置
(1-3)显示画面的示例
(1-4)信息处理方法
(1-5)修改例
(2)根据本发明实施例的信息处理装置的硬件配置
(3)总结
(第一实施例)
<信息处理系统>
首先,参考图1,将详细描述根据本发明第一实施例的信息处理系统。图1是示出根据本实施例的信息处理系统的说明图。
根据本实施例的信息处理系统1如图1所示例如包括内容管理服务器3和信息处理装置10A、10B、10C等等(以下简称为信息处理装置10)。内容管理服务器3和信息处理装置10如图1所示连接到通信网络5。内容管理服务器3和信息处理装置10可以经由通信网络5向彼此发送各类信息/从彼此接收各类信息。
内容管理服务器3是管理以下各项的服务器:图像内容,包括诸如运动图片内容之类的视频内容和诸如照片内容之类的静止图像内容;以及与这些图像内容相关联的各类信息。内容管理服务器3响应于来自信息处理装置10的请求而向信息处理装置10提供内容管理服务器3管理的内容本身、内容的元数据等等。
通信网络5是通信线路网络,其将内容管理服务器3与信息处理装置10相连接并且使得其间可以进行双向通信。通信网络例如包括诸如因特网、电话线路网络、卫星通信网络和广播通信信道之类的公共线路网络,以及诸如WAN(广域网)、LAN(局域网)、IP-VPN(因特网协议-虚拟专用网)、以太网(注册商标)和无线LAN之类专用线路网络,并且可以是有线或无线的。即,根据本实施例的内容查看系统1可以是使用诸如因特网之类的公共线路网络的公共服务的一部分,或者可以是利用诸如LAN之类的本地网络的、未公开给第三方的私有系统。
信息处理装置10是经由通信网络5与内容管理服务器3通信的装置。另外,信息处理装置10从连接到通信网络5的各种服务器(未示出)获取各类数据,并且可允许用户查看由各种服务器管理的网站。另外,信息处理装置10请求与通信网络5相连的内容管理服务器3公开图像内容和与图像内容相关的各类信息,并且从内容管理服务器3获取内容和各类信息。在此情况下,如下所述,信息处理装置10能够自动从网站上记述的描述中提取关键字并且搜索并获取与所提取的关键字相关的图像内容。
信息处理装置10可以是任何装置,只要它是具有使用网络的通信功能的设备即可,设备的示例包括各类计算机设备、电视接收机、DVD/HDD/Blu-ray记录器、移动电话、PDA和数码相机。另外,信息处理装置10也可以是信息家电,比如家用视频游戏机或数码摄像机、电视广播调谐器或解码器等等。另外,信息处理装置10也可以是便携式设备,例如便携式游戏机、PHS、便携式视频/音频播放器等等。
另外,虽然在图1中信息处理装置10经由通信网络5连接到内容管理服务器3,但是信息处理装置10也可以不经由通信网络5而直接连接到内容管理服务器3。
另外,虽然在图1中连接到通信网络5的内容管理服务器3的数目是一个,但是本实施例并不限于上述情况,也可有两个或更多个内容管理服务器3连接到通信网络5。同样,虽然在图1中连接到通信网络5的信息处理装置10的数目是三个,但是本实施例并不限于上述情况,连接到通信网络5的信息处理装置10的数目可以是一个或者四个或更多个。
<信息处理装置的配置>
然后,参考图2至12B,将详细描述根据本实施例的信息处理装置的配置。图2是示出根据本实施例的信息处理装置的配置的框图。另外,图3A至12B各自是示出根据本实施例的信息处理装置的说明图。
注意,以下将以定义网页的内容的示例性HTML数据作为“记述有与显示控制相关的信息并且包括多个结构单位的显示控制数据”的示例来进行描述。然而,根据本发明实施例的显示控制数据并不限于此。
根据本实施例的信息处理装置10如图2所示例如主要包括应用控制部件101、显示控制部件107、所选主题判定部件109、关键字提取部件111、内容搜索部件113、通信部件115以及存储部件117。
应用控制部件101例如是由CPU(中央处理单元)、ROM(只读存储器)和RAM(随机访问存储器)实现的。应用控制部件101是控制诸如web浏览器之类的应用的控制部件,该web浏览器使得信息处理装置10的显示部件(未示出)显示HTML数据的内容。
应用控制部件101经由下文中将描述的通信部件115向管理HTML数据的服务器(web服务器)请求HTML数据,并且获取响应于该请求而从服务器发送来的HTML数据。所获取的HTML数据被应用控制部件101中包括的结构分析部件103和布局设定部件105所处理,并且经由下文中将描述的显示控制部件107被显示在显示部件(未示出)上。
应用控制部件101中包括的结构分析部件103例如是由CPU、ROM和RAM实现的。结构分析部件103是对由应用控制部件101从web服务器获取的HTML数据进行分析的处理部件。
此时,结构分析部件103利用被称为HTML解析器的解析器程序来分析HTML的结构。如已经描述的,HTML数据是利用定义结构单位的特定标签来记述的。因此,通过使用解析器程序,可以提取由标签限定的结构单位,或者可以分析结构单位之间的关系。结构分析部件103可以分析HTML数据,并且在适当时可以向web服务器请求外部资源。这里的外部资源例如是定义布局信息的样式表文件和定义脚本信息的脚本文件。
当如上所述的外部资源响应于该请求被从web服务器发送来时,应用控制部件101获取由web服务器发送的外部资源。当所获取的外部资源是CSS文件时,应用控制部件101应用CSS。另外,当所获取的外部资源是脚本文件时,应用控制部件101通过脚本引擎执行脚本处理。
在应用控制部件101执行这些处理之后,结构分析部件103利用作为分析的结果获得的关于结构单位的信息来构建DOM(文本对象模型)。
DOM是通过把由HTML解析器提取的HTML数据的结构单位链接起来而构建的树结构。更确切地说,DOM 12是用于处理HTML(或XML)的内容的结构的API(应用程序接口)。例如,让我们假定在HTML数据中包括用于定义网页的显示配置的多个结构单位。这些结构单位在结构分析部件103进行的分析处理中被提取,并且被相互链接并构建成DOM的形式。
注意,DOM的树结构是web浏览器所识别出的结构的概念性表述。用户实际看到的网页是由诸如web浏览器之类的应用的渲染引擎基于DOM的树结构来创建的。当结构分析部件103已构建了DOM,下文中将要描述的布局设定部件105已基于DOM的树结构调整了显示布局并且已将诸如图像数据和文本数据之类的内容嵌入到显示布局中的特定位置之后,显示网页的处理完成。
这里,根据本实施例的结构分析部件103通过关注关键字来执行分析处理,该关键字把诸如图3A所示的“div”标签和“span”标签之类的标签之间放置的信息定义为一组信息。
例如,在图3A所示的示例中,放置在<div>和</div>之间的“文本1”被视为一个区块。该区块如图3B所示例如表示定义了显示画面上的一个大区域(部分区域)的数据上的范围。在本实施例中,如上所述由特定标签定义的部分区域将被称为顶级区块(TL区块)。
另外,结构分析部件103通过关注顶级区块中包括的更详细区块来执行分析,并且判定是否存在被包括在作为父区块的顶级区块中的子区块。例如,结构分析部件103可以分析图3A所示的HTML数据,并且可以识别出在该HTML数据中存在四个TL区块。另外,结构分析部件103还可以识别出在TL区块1、3和4的每一个中只存在一个子区块,而在TL区块2中存在两个子区块。这样,结构分析部件103判定是否存在指示出HTML数据中包括的显示内容的区块(文档区块)。
结构分析部件103向布局设定部件105输出与作为对HTML数据的分析的结果而获得的结构单位(特别是文档区块)相关的信息。另外,与结构单位相关的信息还被输出到下文中将描述的所选主题判定部件109。
布局设定部件105例如是由CPU、ROM和RAM实现的。布局设定部件105使用由结构分析部件103执行的对HTML数据的分析处理的分析结果,并且设定在显示画面上显示与HTML数据相对应的内容时的布局。布局如上所述基于DOM的树结构被调整,并且布局设定部件105生成所决定的布局相关的布局信息。应用控制部件101基于由布局设定部件105生成的布局信息来运行HTML数据,并且请求显示控制部件107控制显示部件,因此,与HTML数据相对应的网页被显示在显示画面上。
当在设定HTML数据的布局时识别形成显示画面的每个区块的位置时,布局设定部件105生成指示出该位置的信息作为位置信息。例如,在当具有图3A所示的结构的HTML数据被显示在显示画面上时的布局被判定为图3B所示的布局的情况下,布局设定部件105确定在显示画面上显示的每个区块的四角的位置,并且生成指示出四角的信息作为位置信息。
区块的四角的位置表示在应用控制部件101控制的应用中区块的显示位置。显示位置可以依据信息处理装置10并且还依据应用而有所不同。因此,显示位置是依HTML数据的运行环境而定的。具体而言,如图3B所示,考虑一个坐标系统,其以任何一点(例如,显示画面的左上端点)作为坐标轴的原点,并且布局设定部件105记录指示出四角的位置的坐标来作为位置信息。结果,例如,图4的上方所示的表格作为与图3B所示的布局相关的位置信息被生成。图4的上方所示的表格包括指示出每个区块(文本1至文本5)的四角的位置的信息(上端、下端、左端、右端的坐标)。例如,图3B所示的“文本1”区块的上端对应于图3B中的B.TY,而下端对应于图3B中的B.BY。另外,图3B所示的“文本1”区块的左端对应于图3B中的B.LX,而右端对应于图3B中的B.RX。
另外,布局设定部件105可以通过关注一位置(上端、下端等等)来对如图4的上方所示的位置信息进行整理,从而获得如图4的下方所示的新位置信息。图4的下方所示的位置信息指示出当在特定方向上看显示画面时各自对应于一个区块的显示内容出现的顺序。例如,在关注“上端”一行的情况下,表明当从上向下看显示画面时,文本1和文本4的区块出现在相同高度(例如,图3B中的相同的Y坐标值),然后,文本2、文本5和文本3的区块出现。
当如图4的下方所示的位置信息被生成时,诸如下文中将描述的所选主题判定部件109之类的处理部件就可以容易地理解显示画面上各个区块的相对位置关系。
至此,已经详细描述了根据本实施例的应用控制部件101。
接下来,将详细描述根据本实施例的显示控制部件107。
显示控制部件107例如是由CPU、ROM和RAM实现的。显示控制部件107是对根据本实施例的信息处理装置10中包括的显示部件(未示出)执行显示控制的处理部件。显示控制部件107响应于由应用控制部件101通知给显示控制部件107的请求而使得显示部件显示与HTML数据相对应的网页。
所选主题判定部件109例如是由CPU、ROM和RAM实现的。当显示画面上显示的网页的一部分通过用户操作被选择时,所选主题判定部件109判定从网页的内容中选择了哪个文档区块。具体而言,当决定了显示画面上通过用户操作选择的区域(以下称之为所选区域S)时,所选主题判定部件109确定指示出所选区域S的四角的位置的信息。然后,所选主题判定部件109通过使用指示出所选区域S的四角的位置的信息和由布局设定部件105生成的位置信息,来判定是否存在这样的文档区块:该文档区块的至少一部分被包括在所选区域S内。在存在至少一部分被包括在所选区域S内的文档区块的情况下所选主题判定部件109将该文档区块判定为所选区块,并且把该所选区块内记述的内容判定为通过用户操作选择的所选内容。
考虑这样一种情况,其中存在一网页,其具有由图3A例示的HTML数据所定义的图3B所示的布局,并且用户尝试选择文本1、文本2和文本4的文档区块。当使用过去的方法时,存在这样的问题,即文本1至文本4这四个文档区块被选择,即使用户从文本1顶部附近到文本4底部附近执行了拖放操作以尝试选择文本1、文本3和文本4。发生这种情况是因为如图3A中的TL区块2所示,在一个TL区块中存在多个文档区块。在例如用户尝试选择分别在图3B中示出的文本3和文本5的文档区块的情况下,也发生这种问题。
然而,根据本实施例的所选主题判定部件109可以通过使用指示出每个文档区块的显示位置的信息和指示出所选区域S的位置的信息两者来适当地仅选择用户想要选择的文档区块。注意,所选主题的判定处理将在下文中再次详细描述。
所选主题判定部件109把这样判定的与所选主题相对应的文档区块的信息通知给下文中将描述的关键字提取部件111。
关键字提取部件111例如是由CPU、ROM和RAM实现的。关键字提取部件111使用从所选主题判定部件109通知来的所选文档区块的信息和从应用控制部件101获取的相应文档区块的内容(数据),并且从该文档区块中记述的字词中提取关键字。这里,任何适当的方法都可用作关键字提取部件111用于提取关键字的方法,例如可以使用诸如词素分析之类的技术。此外,通过使用定义由用户预先设定的提取条件等等的信息,可以适当地设定要提取的关键字的类型。
当从文档区块中提取关键字时,关键字提取部件111通过关注文档区块的结构来判定提取关键字的范围。例如,如图6的上方所示,在不存在用于定义文档区块中的特定结构的标签的情况下,关键字提取部件111从文档区块中的记述中自由提取关键字。例如,在存在如图6的上方所示的记述的情况下,关键字提取部件111提取诸如“Japan”、“Europe”、“Island”、“Hokkaido”和“Okinawa”之类的关键字。诸如新闻站点之类的网页的内容可以作为其中不存在用于定义特定结构的标签的HTML数据的示例。
另外,也可能发生这样的情况,其中所选区块是具有特定结构的区块,比如图7A所示的用于显示排名信息的内容的情况。该文档区块包括定义显示画面中的预定结构的标签,例如图7B的上方所示的<TABLE>标签、<li>标签(列表标签)和<OL>标签。因此,在所选区块内记述了特定标签的情况下,关键字提取部件111从由这些标签定义的更小的结构单位的每一个中提取关键字。
例如,在图7A和7B所示的示例中,在文档区块内构建有由<li>标签定义的三个小结构单位,作为定义排名的结构。因此,关键字提取部件111从由各<li>标签定义的更小结构单位的每一个中提取关键字。通过这样提取关键字,可以防止执行错误地仅偏重于一个特定结构内的关键字提取。
例如,在图7A和7B所示的示例中,图7B的下方所示的关键字是从分别与排名1、排名2和排名3相对应的结构单位中的每一个中均匀提取的。
如上所述关于所选区块是否包括定义预定结构的标签的分析例如可由HTML解析器执行。因此,关键字提取部件111可以通过使用关键字提取部件111可运行的HTML解析器来执行对所选区块的结构分析,或者可以请求应用控制部件101的结构分析部件103来执行对所选区块的结构分析。
注意,在所选区块内记述有特定标签的情况下,关键字提取部件111理解所提取的关键字与记述该所提取关键字的区块(由特定标签定义的区块)之间的对应关系,是很重要的。因此,如图8所示,例如,关键字提取部件111生成这样的数据:在该数据中,所提取的关键字和用于确定该关键字所在的区块的ID相互关联。在生成该数据的情况下,关键字提取部件111把指示出对应关系的数据记录在应用控制部件101可以参考的位置,例如下文中将描述的存储部件117。因此,当在显示画面上额外显示下文中将描述的图像内容时,应用控制部件101可以在适当的部分显示关键字。
关键字提取部件111把通过上述方法提取的关键字通知给下文中将描述的内容搜索部件113。
内容搜索部件113例如是由CPU、ROM和RAM实现的。内容搜索部件113使用从关键字提取部件111通知来的关键字并且搜索与该关键字相关的图像内容(静止图像内容、视频内容等等)。当检测到适当内容时,内容搜索部件113从内容管理服务器3获取与检测到的图像内容相对应的元数据。元数据例如包括指示出检测到的图像内容的数据本身的位置的信息和图像内容的缩略图像。内容搜索部件113把内容的搜索结果和包括所获取的缩略图像的元数据发送给应用控制部件101。
当获取了内容的搜索结果和包括缩略图像的元数据时,应用控制部件101开始用于基于所获取的信息在显示画面上显示搜索结果的处理。
应用控制部件101的布局设定部件105以下述方式来执行布局的重设:使作为搜索结果获得的图像内容的缩略图像被放置在与该图像内容相对应的关键字所在的区块内。例如,在图9所示的示例中,布局的重设以这样一种方式执行,使得与从与排名1相关的文章中提取的关键字相对应的内容的缩略图像P1被放置在与排名1相对应的区块内。同样,布局的重设以这样一种方式执行,使得在与排名2相对应的区块内,放置了相应内容的缩略图像P2,而在与排名3相对应的区块内,放置了相应内容的缩略图像P3。
注意,要显示的缩略图像可以是任何图像,只要该缩略图像的至少一部分存在于相应块内,以便可以清楚看到该内容与哪个块相关即可,不一定要缩略图像的全部存在于相应块内。
布局设定部件105可以通过使用图4所示的位置信息来设定缩略图像的显示位置。即,布局设定部件105可以通过参考其中将要显示缩略图像的文档区块的位置信息并且假定该文档区块的显示区域内的适当位置的坐标是缩略图像的中心,来设定缩略图像的布局。在图10A所示的示例中,布局设定部件105如下设定缩略图像的中心的坐标:X=文档区块的中心的X坐标;并且Y=0。布局设定部件105可以适当地将这些坐标设定为缩略图像的中心坐标。
另外,应用控制部件101可以改写HTML数据本身,并且可以在适当区块上显示搜索结果。在此情况下,例如,结构分析部件103通过使用XPath来判定相应关键字的位置,并且将使用适当标签的结构单位插入到相应的HTML数据或DOM中。通过参考其中插入了预定结构单位的HTML数据以及基于该HTML数据重生成的DOM,布局设定部件105可以重设新的布局。
例如,在图10B所示的示例中,结构分析部件103指定<body>标签→<div>标签→<ul>标签→<li>标签,并且把定义与搜索结果相对应的缩略图像的显示位置等等的结构单位(图中的粗体字)嵌入到HTML数据中。
在放置缩略图像时,应用控制部件101可以依据网页的结构、相应区块的结构、网页的设计等等来自由选择是指定坐标还是执行HTML数据的改写。
注意,虽然在图10B的示例中结构分析部件103将预定结构单位插入到HTML数据中,但结构分析部件103除了将结构单位插入到HTML数据中以外也可将结构单位插入到诸如CSS文件之类的适当的文件和数据中。
另外,也可能发生这样的情况,其中对于一个所提取关键字,搜索到了多个图像内容。在此情况下,如图11A所示,例如,应用控制部件101可以在显示缩略图像的同时显示诸如“前一个”按钮和“下一个”按钮之类的操作按钮,以便用户从多个缩略图像中选择一缩略图像。另外,如图11B所示,应用控制部件101可以在画面上以每个图像相对于紧挨其上的图像稍有位移的方式显示多个缩略图像,从而可允许用户选择期望的图像。此外,应用控制部件101还可以通过使用预先设定的优先级顺序以及诸如用户的搜索历史和查看历史之类的信息来选择要显示的缩略图像。
通过如上所述执行显示,用户就可以很容易地判定包括与搜索到的内容相对应的显示内容的区块。结果,根据本实施例的信息处理装置10可以增强用户的便利性。
然后,将描述通信部件115。
通信部件115例如是由CPU、ROM、RAM和通信设备实现的。通信部件115是控制在根据本实施例的信息处理装置10和设置在信息处理装置10外部的另一设备(例如,内容管理服务器3和其他各种服务器)之间执行的通信的处理部件。作为通信对方的其他设备可以是经由局域网连接到信息处理装置10的设备,或者可以是经由诸如因特网之类的公共网络连接到它的设备。通信部件115中的通信控制是基于预先在通信部件115和作为通信对方的设备之间设定的预定协议来执行的。
存储部件117是根据本实施例的信息处理装置10具有的存储设备的示例。在存储部件117中,适当地存储着:各种参数、正在进行的处理的记录等等,它们是在信息处理装置10执行某种处理时必然会存储的;或者各种数据库。根据本实施例的信息处理装置10中包括的各个处理部件可以自由地向存储部件117写入数据或从中读取数据。
至此,已经示出了本实施例的信息处理装置10的功能的示例。上述的每个结构元件可以利用通用材料和电路来构成,或者可以用专用于每个元件的功能的硬件来构成。另外,每个结构单元的功能可以完全由CPU等等来执行。因此,要使用的配置可以依据实现本发明时的技术水平来适当地改变。
注意,可以产生用于实现上述的本实施例的信息处理装置的各个功能的计算机程序,并且在个人计算机等等中实现该计算机程序。另外,还可以提供存储计算机程序的计算机可读记录介质。记录介质例如包括磁盘、光盘、磁光盘以及闪存。另外,计算机程序可以不使用记录介质来分发,并且例如可经由网络来分发。
<显示画面的示例>
然后,参考图12A和12B,将简要描述根据本实施例的信息处理装置10的显示画面的示例。
图12A示出了这样一个示例,其中,信息处理装置10通过由应用控制部件101运行和控制的web浏览器在显示画面上显示用户指定的网页。这里,假定用户操作诸如鼠标之类的输入设备并且指定如图中所示的所选区域S。然后,所选主题判定部件109基于所选区域S和每个文档区块的位置信息来判定哪些是所选区块,并且确定区块B1、B2和B3被选择。然后,关键字提取部件111从每个区块中提取关键字,并且通过在显示画面上显示对话框301来将所提取的关键字通知给用户。当用户进行请求开始搜索内容的处理时,内容搜索部件113使用适当的关键字,并且开始搜索静止图像内容、视频内容等等。
当作为搜索的结果确定适当的内容时,内容搜索部件113将搜索结果和所获取的元数据发送给应用控制部件101。应用控制部件101基于所获取的信息来执行布局的重设,并且使得显示部件显示如图12B所示的显示画面。在此情况下,与从区块B1中提取的关键字相对应的缩略图像303被放置在区块B1附近,并且与从区块B2中提取的关键字相对应的缩略图像305被放置在区块B2附近。另外,与从区块B3中提取的关键字相对应的缩略图像307被放置在区块B3附近。
根据本实施例的信息处理装置10形成显示画面并将其提供给用户,因此可以向用户提供与区块中记述的信息协同工作的图像内容。从而,根据本实施例的信息处理装置10可以增强用户的便利性。
<信息处理方法>
接下来,参考图13至17,将详细描述根据本实施例的信息处理装置10执行的信息处理方法。图13至17各自是示出根据本实施例的信息处理方法的流程图。
首先,参考图13,将描述整体流程。
当用户指定某个网页时,信息处理装置10的应用控制部件101从管理该网页的web服务器获取与该网页相对应的显示控制数据(HTML数据)。然后,应用控制部件101的结构分析部件103分析所获取的HTML数据,从而执行对网页的结构的分析(步骤S101)。结构分析部件103通过使用分析结果来构建DOM,并且将所构建的DOM输出到布局设定部件105。布局设定部件105基于输入的DOM来执行页面布局的设定,并且经由显示控制部件107在显示部件上显示该网页(步骤S103)。
这里,信息处理装置10在显示网页的同时等待,直到用户执行选择在显示画面中示出的显示内容的操作为止,并且判定是否开始内容搜索处理(步骤S105)。
当执行了用户操作并且要开始内容搜索处理时,所选主题判定部件109通过使用由用户选择的所选区域S的位置信息和由布局设定部件105生成的位置信息来确定所选区块(步骤S107)。
当用户选择的文档区块被所选主题判定部件109确定为所选区块时,关键字提取部件111对该所选区块中记述的内容执行词素分析,并且提取关键字(步骤S109)。
然后,内容搜索部件113通过使用由关键字提取部件111提取的关键字来从内容管理服务器3中搜索与该关键字相关的图像内容(步骤S111)。当获得搜索结果时,内容搜索部件113向应用控制部件101输出所获得的搜索结果和与该图像内容相关联的元数据。
当应用控制部件101被内容搜索部件113通知以内容的搜索结果时,应用控制部件101通过使用所通知的信息来执行页面的重布局(步骤S113)。当页面布局的重设被执行时,显示控制部件107在显示部件上重新显示其中放置有缩略图像的网页(步骤S115)。
在根据本实施例的信息处理方法中,通过遵循上述流程,与从显示内容中提取的关键字相对应的图像内容的缩略图像被显示在显示画面上。
[所选区块确定处理]
接下来,参考图14,将描述应用控制部件101与所选主题判定部件109合作执行的所选区块确定处理。
首先,应用控制部件101的结构分析部件103分析与在显示画面上显示的网页相对应的HTML数据,并且把该HTML数据中包括的信息划分成顶级区块(步骤S201)。然后,结构分析部件103分析每个顶级区块的结构并且提取顶级区块中包括的文档区块(步骤S203)。接下来,应用控制部件101的布局设定部件105确定显示各文档区块的位置,生成指示出各文档区块的显示位置的位置信息,并且基于坐标来重新排列这些位置信息(步骤S205)。通过参考这些位置信息,应用控制部件101和所选主题判定部件109可以容易地理解各文档区块的相对位置关系。
当用户选择显示画面上的显示内容时,所选主题判定部件109确定通过用户操作定义的所选区域S的范围(步骤S207)。然后,所选主题判定部件109执行把所确定的所选区域S的位置信息与文档区块的位置信息相比较的处理(步骤S209)。通过执行该比较处理,所选主题判定部件109确定通过用户操作选择的所选区块(步骤S211)。注意,下文中将参考图15单独描述该比较处理。
[位置信息比较处理]
然后,参考图15,将描述由所选主题判定部件109执行的位置信息比较处理。
首先,所选主题判定部件109把网页中存在的所有文档区块登记为所选区块的候选者(以下其中每一个将被称为选择候选者)(步骤S301)。然后,所选主题判定部件109执行以下描述的步骤S303。
在步骤S303中,判定是否存在被登记为选择候选者的文档区块。在不存在被登记为选择候选者的文档区块的情况下(即,在针对所有文档区块的判定都已完成的情况下),所选主题判定部件109完成位置信息比较处理。另外,在存在被登记为选择候选者的文档区块的情况下,所选主题判定部件109执行以下描述的步骤S305。
在仍有任何选择候选者的情况下,所选主题判定部件109选择要被用作以下执行的评估的对象的一个选择候选者(步骤S305)。
然后,所选主题判定部件109判定充当评估对象的选择候选者的上端的Y坐标(B.TY)的值是否等于或小于由用户选择的所选区域S的下端的Y坐标(S.BY)的值(步骤S307)。在不满足S.BY≥B.TY的情况下,所选主题判定部件109针对充当评估对象的选择候选者执行以下将描述的步骤S317。另外,在满足S.BY≥B.TY的情况下,所选主题判定部件109针对充当评估对象的选择候选者执行以下将描述的步骤S309。
接下来,所选主题判定部件109判定充当评估对象的选择候选者的下端的Y坐标(B.BY)的值是否等于或大于由用户选择的所选区域S的上端的Y坐标(S.TY)的值(步骤S309)。在不满足S.TY≤B.BY的情况下,所选主题判定部件109针对充当评估对象的选择候选者执行以下将描述的步骤S317。另外,在满足S.TY≤B.BY的情况下,所选主题判定部件109针对充当评估对象的选择候选者执行以下将描述的步骤S311。
然后,所选主题判定部件109判定充当评估对象的选择候选者的右端的X坐标(B.RX)的值是否等于或大于由用户选择的所选区域S的左端的X坐标(S.LX)的值(步骤S311)。在不满足S.LX≤B.RX的情况下,所选主题判定部件109针对充当评估对象的选择候选者执行以下将描述的步骤S317。另外,在满足S.LX≤B.RX的情况下,所选主题判定部件109针对充当评估对象的选择候选者执行以下将描述的步骤S313。
接下来,所选主题判定部件109判定充当评估对象的选择候选者的左端的X坐标(B.LX)的值是否等于或小于由用户选择的所选区域S的右端的X坐标(S.RX)的值(步骤S313)。在不满足S.RX≥B.LX的情况下,所选主题判定部件109针对充当评估对象的选择候选者执行以下将描述的步骤S317。另外,在满足S.RX≥B.LX的情况下,所选主题判定部件109针对充当评估对象的选择候选者执行以下将描述的步骤S315。
在满足步骤S313的判定条件的情况下,所选主题判定部件109把充当评估对象的选择候选者切换为通过用户操作选择的所选区块(步骤S315)。即,当该选择候选者被选择为所选区块时,意味着步骤S307至步骤S313中的四个判定条件都得到满足。另外,当四个判定条件都得到满足时,意味着(如从判定条件清楚可见)选择候选者的至少一部分被包括在所选区域S中。因此,充当了评估对象的一个选择候选者被从选择候选者中排除。当切换完成时,所选主题判定部件109返回到步骤S303并且继续处理。
另一方面,在步骤S307至步骤S313中的任何一个条件没有得到满足的情况下,所选主题判定部件109判定充当了评估对象的选择候选者不是用户选择的区块。所选主题判定部件109将这样的评估对象从选择候选者中排除(步骤S317)。因此,充当了评估对象的一个选择候选者被从选择候选者中排除。当排除完成时,所选主题判定部件109返回到步骤S303并且继续处理。
如上所述,在根据本实施例的所选区块确定处理中,通过使用文档区块的位置信息来对每个文档区块执行关于文档区块是否是所选区块的判定。因此,即使当用户执行延及若干个顶级区块的区块选择时,也不会再发生用户不想选择的区块被选择的情况,而这种情况在过去是会发生的。因此,根据本实施例的所选区块确定处理可以提供一种界面,其使得用户能够很容易且舒适地选择其想要选择的文档区块。
[关键字提取处理]
然后,参考图16,将描述由关键字提取部件111执行的关键字提取处理。
首先,关键字提取部件111分析由所选主题判定部件109确定的所选区块的结构(步骤S401),并且理解什么标签被用于定义文档区块。
然后,关键字提取部件111通过参考分析结果来判定所选区块是否是利用定义特定结构的标签来记述的(即,它是不是结构化区块)(步骤S403)。
在所选区块不是结构化区块的情况下,关键字提取部件111通过使用词素分析来分析该区块中记述的语句,并且提取关键字(步骤S405)。
另一方面,在所选区块是结构化区块的情况下,关键字提取部件111利用HTML解析器对所选区块的结构分类(步骤S407),通过使用词素分析来对分类的语句进行分析,并且提取关键字(步骤S409)。另外,关键字提取部件111以可以理解哪个关键字是从哪个结构中提取出来的方式来将所提取的关键字与所选区块的结构关联起来(步骤S411)。
从而,关键字提取部件111可以从所选区块中适当地提取适当的关键字。
[重布局处理]
然后,参考图17,将描述由应用控制部件101执行的重布局处理。
首先,应用控制部件101获取从内容搜索部件113发送来的内容的搜索结果和相关联的内容的元数据(步骤S501)。然后,应用控制部件101依据网页的结构、所选区块的结构、网页的设计等等来选择所获取的图像内容的缩略图像的显示方法(步骤S503)。
在与缩略图像相关的信息被直接额外记述在HTML数据等等中的情况下,应用控制部件101的结构分析部件103编辑文档树并且将适当的结构单位插入到预定部分中。布局设定部件105响应于新的HTML数据等等执行布局的重设,并且因此搜索到的内容的缩略图像可被显示在与所提取的关键字相对应的区块内(步骤S505)。
另一方面,在通过指定显示位置的坐标来显示缩略图像的情况下,布局设定部件105在参考文档区块的位置信息的同时通过使用坐标来指定要放置缩略图像的中心的位置。从而,搜索到的内容的缩略图像可被显示在与所提取的关键字相对应的区块内(步骤S507)。
至此,已经详细描述了根据本实施例的信息处理装置10所执行的信息处理方法。
<修改例>
接下来,参考图18,将简要描述根据本实施例的信息处理装置10的修改例。
在以上所示的第一实施例中,已经描述了信息处理装置10分析诸如HTML数据之类的显示控制数据的结构并且从所选文档区块中提取关键字的情况。然而,信息处理装置10可执行分析显示控制数据的结构并且判定所选主题的处理,并且可请求内容管理服务器3执行从作为该判定的结果而确定的所选主题中提取关键字的处理。
图18示出了根据本修改例的信息处理装置10中包括的一部分处理部件和根据本修改例的内容管理服务器3中包括的一部分处理部件。在本修改例中,信息处理装置10中包括的应用控制部件101和所选主题判定部件109确定通过用户操作选择的所选区块。然后,信息处理装置10把与所选区块相关的信息发送给内容管理服务器3,并且请求内容管理服务器3执行提取关键字的处理和搜索与所提取的关键字相关的内容的处理。
另一方面,以与第一实施例的关键字提取部件111相同的方式,接收到了该请求的内容管理服务器3的关键字提取部件151从与信息处理装置10所请求的所选区块相对应的文档内容中提取关键字。然后,关键字提取部件151把所提取的关键字通知给内容搜索部件153。内容搜索部件153通过使用元数据等等从存储部件155中存储的各种内容之中搜索与所通知的关键字相关的内容。当成功搜索到内容时,内容搜索部件153将检测到的内容通知给信息处理装置10。
以与根据第一实施例的应用控制部件101相同的方式,信息处理装置10的应用控制部件101响应于从内容管理服务器3通知来的搜索结果在适当的区块中显示缩略图像。
如上所述,HTML数据中包括的文档区块的显示位置等等依据web浏览器等等的应用并最终依据信息处理装置而有所不同。因此,希望信息处理装置10执行通过使用在信息处理装置10上显示的文档的显示位置来确定用户选择的内容的处理。然而,管理内容的服务器被请求执行之后的处理,因此可以减少要安装在信息处理装置10上的资源。
另外,在本发明的第一实施例中,已经描述了通过用户操作选择的所选区域S是矩形的情况。然而,所选区域S的形状并不限于此,所选区域S的形状可以是圆形或除四边形以外的多边形。另外,所选区域S的形状可以是用户利用触笔等等通过手写绘画来指定的具有任何形状的区域。即使在这些情况下,也可以利用定义所选区域S的坐标值和文档区块的位置坐标来确定所选区块。
(硬件配置)
接下来,将参考图19详细描述根据本发明实施例的信息处理装置10的硬件配置。图19是示出根据本发明实施例的信息处理装置10的硬件配置的框图。
信息处理装置10主要包括CPU 901、ROM 903和RAM 905。另外,信息处理装置10还包括主机总线907、桥接器909、外部总线911、接口913、输入设备915、输出设备917、存储设备919、驱动器921、连接端口923以及通信设备925。
CPU 901充当运算处理装置和控制设备,并且根据ROM 903、RAM905、存储设备919或可移除记录介质927中记录的各种程序来控制信息处理装置10的全部操作或一部分操作。ROM 903存储CPU 901使用的程序、操作参数等等。RAM 905主要存储在CPU 901运行时使用的程序和在运行期间适当改变的参数等等。它们经由由诸如CPU总线等等之类的内部总线构成的主机总线907相互连接。
主机总线907经由桥接器909连接到诸如PCI(外部组件互连/接口)总线之类的外部总线911。
输入设备915是被用户操作的操作装置,例如鼠标、键盘、触摸面板、按钮、开关和操纵杆。另外,输入设备915可以是使用例如红外光或其他无线电波的遥控装置(所谓的遥控器),或者可以是诸如移动电话或PDA之类的遵从信息处理装置10的操作的外部连接设备929。另外,输入设备915基于例如用户利用上述操作装置输入的信息来生成输入信号,并且是由用于将该输入信号输出到CPU 901的输入控制电路构成的。信息处理装置10的用户可以通过操作此输入装置915来向信息处理装置10中输入各种数据并且可以指示信息处理装置10执行处理。
输出设备917是由能够在视觉上或听觉上将所获取的信息通知给用户的设备构成的。这种设备的示例包括诸如CRT显示设备、液晶显示设备、等离子显示设备、EL显示设备和灯之类的显示设备、诸如扬声器和耳机之类的音频输出设备、打印机、移动电话、传真机等等。例如,输出设备917输出由信息处理装置10执行的各种处理所获得的结果。更具体而言,显示设备以文本或图像的形式显示由信息处理装置10执行的各种处理所获得的结果。另一方面,音频输出设备把诸如再现的音频数据和声音数据之类的音频信号转换成模拟信号,并且输出该模拟信号。
存储设备919是被配置为信息处理装置10的存储单元的示例的用于存储数据的设备,并且被用于存储数据。存储设备919例如是由诸如HDD(硬盘驱动器)之类的磁存储设备、半导体存储设备、光存储设备或磁光存储设备构成的。该存储设备919存储要被CPU 901运行的程序、各种数据以及从外界获得的各种数据。
驱动器921是用于记录介质的读/写器,并且被嵌入在信息处理装置10中或者从外部附接到它。驱动器921读取在诸如磁盘、光盘、磁光盘或半导体存储器之类的所附接的可移除记录介质927中记录的信息,并且将所读取的信息输出到RAM 905。另外,驱动器921可以在诸如磁盘、光盘、磁光盘或半导体存储器之类的所附接的可移除记录介质927中进行写入。可移除记录介质927例如是DVD介质、HD-DVD介质或Blu-ray介质。可移除记录介质927可以是CompactFlash(CF;注册商标)、闪存、SD存储卡(安全数字存储卡)等等。或者,可移除记录介质927可以是例如配备有非接触式IC芯片的IC卡(集成电路卡)或者电子机器。
连接端口923是用于使得设备可以直接连接到信息处理装置10的端口。连接端口923的示例包括USB(通用串行总线)端口、IEEE1394端口、SCSI(小型计算机系统接口)端口等等。连接端口923的其他示例包括RS-232C端口、光学音频端子、HDMI(高清晰度多媒体接口)端口等等。通过外部连接设备929连接到此连接端口923,信息处理装置10直接从外部连接设备929获得各种数据并且向外部连接设备929提供各种数据。
通信设备925是由例如用于连接到通信网络931的通信设备构成的通信接口。通信设备925例如是有线或无线LAN(局域网)、Bluetooth(注册商标)、WUSB(无线USB)的通信卡等等。或者,通信设备925可以是用于光通信的路由器、用于ADSL(非对称数字用户线路)的路由器、用于各种通信的调制解调器,等等。该通信设备925例如可以根据诸如TCP/IP之类的预定协议在因特网上与其他通信设备发送和接收信号等等。连接到通信设备925的通信网络931是由有线或无线连接的网络等等构成的,并且可以是例如因特网、家用LAN、红外通信、无线电波通信和卫星通信。
至此,已经示出了能够实现根据本发明实施例的信息处理装置10的功能的硬件配置的示例。以上所述的每个结构元件可以利用通用材料来构成,或者可以由专用于每个结构元件的功能的硬件来构成。因此,要使用的硬件配置可以根据实现本发明时的技术水平而适当地改变。
(总结)
如上所述,根据本发明的实施例的信息处理装置可以分析网页等等中包括的显示控制数据,并且可以自动地显示与形成数据的区块中记述的信息相关的图像内容的列表。
这样,当用户在查看网页时希望观看与该网页中记述的内容相关的视频时,用户可以通过利用拖放操作选择显示内容来很容易地搜索图像内容。
另外,搜索结果被显示在与检测到的内容相对应的关键字所在的区块附近,因此,用户可以很容易地判定与内容相关的信息。
本领域的技术人员应当理解,依据设计要求和其他因素,可以进行各种修改、组合、子组合和变更,只要它们处于所附权利要求或其等同物的范围之内即可。
本申请包含与2009年11月20日向日本专利局提交的日本优先权专利申请JP 2009-264819中公开的主题相关的主题,这里通过引用将该申请的全部内容并入。
Claims (6)
1.一种信息处理装置,包括:
结构分析部件,该结构分析部件分析记述有与显示控制相关的信息并且包括多个结构单位的显示控制数据,并且提取所述显示控制数据中包括的结构单位,其中,所述结构单位包括多个结构子单位;
布局设定部件,该布局设定部件基于由所述结构分析部件提取的结构单位来设定当在显示画面上显示所述显示控制数据时使用的布局信息;
关键字提取部件,该关键字提取部件从与结构单位相对应的显示内容中提取与每个结构子单元分别对应的关键字;以及
内容搜索部件,该内容搜索部件搜索与由所述关键字提取部件提取的关键字相对应的图像内容,
其中,所述布局设定部件把由所述内容搜索部件搜索到的图像内容放置在显示有包括与该图像内容相对应的关键字的结构单位的显示区域中。
2.根据权利要求1所述的信息处理装置,还包括
所选主题判定部件,该所选主题判定部件判定显示画面上通过用户操作选择的所选区域中包括的显示内容,
其中,所述布局设定部件生成位置信息作为所述布局信息,该位置信息包括指示出在所述显示画面上显示与每个结构单位相对应的显示内容的位置的坐标,并且
其中,所述所选主题判定部件参考由所述布局设定部件生成的位置信息,并且当显示有与结构单位相对应的显示内容的区域的至少一部分被包括在所述所选区域中时判定该结构单位被选择。
3.根据权利要求2所述的信息处理装置,
其中,所述布局设定部件基于所生成的位置信息,通过使用指示出在所述显示画面内的位置的坐标,来设定所述图像内容在所述显示区域内的放置位置。
4.根据权利要求2所述的信息处理装置,
其中,所述布局设定部件把与所述图像内容相关的信息和指示出所述图像内容在所述显示区域内的放置位置的信息额外记述在相应的结构单位中。
5.根据权利要求1所述的信息处理装置,
其中,所述关键字提取部件基于从中提取关键字的结构子单位中包括的标签的类型来分析该结构子单位的类型,并且当该标签是定义所述显示画面中的预定结构的标签时从包括该标签的结构子单位中提取至少一个关键字。
6.一种信息处理方法,包括以下步骤:
分析记述有与显示控制相关的信息并且包括多个结构单位的显示控制数据,并且提取所述显示控制数据中包括的结构单位,其中,所述结构单位包括多个结构子单位;
基于结构单位来设定当在显示画面上显示所述显示控制数据时使用的布局信息;
从与结构单位相对应的显示内容中提取与每个结构子单元分别对应的关键字;
搜索与所提取的关键字相对应的图像内容;以及
把搜索到的图像内容放置在显示有包括与该图像内容相对应的关键字的结构单位的显示区域中。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009-264819 | 2009-11-20 | ||
JP2009264819A JP2011108146A (ja) | 2009-11-20 | 2009-11-20 | 情報処理装置、情報処理方法、プログラムおよび情報処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102073675A CN102073675A (zh) | 2011-05-25 |
CN102073675B true CN102073675B (zh) | 2014-12-24 |
Family
ID=44032214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010549680.4A Expired - Fee Related CN102073675B (zh) | 2009-11-20 | 2010-11-15 | 信息处理装置、信息处理方法、程序和信息处理系统 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20110125731A1 (zh) |
JP (1) | JP2011108146A (zh) |
CN (1) | CN102073675B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5044707B1 (ja) * | 2011-03-31 | 2012-10-10 | 株式会社東芝 | 情報処理システム、情報処理装置およびプログラム |
US20120278162A1 (en) * | 2011-04-29 | 2012-11-01 | Microsoft Corporation | Conducting an auction of services responsive to positional selection |
US8635522B2 (en) * | 2011-05-12 | 2014-01-21 | Sybase, Inc. | Hybrid web container for cross-platform mobile applications |
JP2013026878A (ja) | 2011-07-22 | 2013-02-04 | Sony Corp | 情報処理装置、情報処理方法、及びプログラム |
JP2013030899A (ja) | 2011-07-27 | 2013-02-07 | Sony Corp | 情報処理装置、情報処理方法、及びプログラム |
WO2014127535A1 (en) | 2013-02-22 | 2014-08-28 | Google Inc. | Systems and methods for automated content generation |
JP6469952B2 (ja) * | 2014-02-21 | 2019-02-13 | ソニー株式会社 | 情報処理装置、および制御方法 |
JP2016143212A (ja) * | 2015-02-02 | 2016-08-08 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法、及び制御プログラム |
US10229209B2 (en) * | 2015-03-30 | 2019-03-12 | Airwatch Llc | Providing search results based on enterprise data |
US12002072B1 (en) * | 2015-09-16 | 2024-06-04 | Google Llc | Systems and methods for automatically managing placement of content slots in an information resource |
JP2017134578A (ja) * | 2016-01-27 | 2017-08-03 | 株式会社 ゆうちょ銀行 | 文書管理装置、文書管理方法及び文書管理プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1417709A (zh) * | 2001-11-07 | 2003-05-14 | 日本电气株式会社 | 信息检索系统及其信息检索方法 |
CN101021865A (zh) * | 2007-03-23 | 2007-08-22 | 上海汉光知识产权数据科技有限公司 | 数据检索结果显示方法及显示系统 |
CN101582075A (zh) * | 2009-06-24 | 2009-11-18 | 大连海事大学 | Web信息抽取系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8285082B2 (en) * | 2006-09-01 | 2012-10-09 | Getty Images, Inc. | Automatic identification of digital content related to a block of text, such as a blog entry |
US7818330B2 (en) * | 2007-05-09 | 2010-10-19 | Microsoft Corporation | Block tracking mechanism for web personalization |
US20100106568A1 (en) * | 2008-10-24 | 2010-04-29 | Cardlytics, Inc. | Offer Management System and Methods for Targeted Marketing Offer Delivery System |
US20110213655A1 (en) * | 2009-01-24 | 2011-09-01 | Kontera Technologies, Inc. | Hybrid contextual advertising and related content analysis and display techniques |
WO2011002456A1 (en) * | 2009-06-30 | 2011-01-06 | Hewlett-Packard Development Company, L.P. | Selective content extraction |
-
2009
- 2009-11-20 JP JP2009264819A patent/JP2011108146A/ja not_active Withdrawn
-
2010
- 2010-11-15 US US12/945,987 patent/US20110125731A1/en not_active Abandoned
- 2010-11-15 CN CN201010549680.4A patent/CN102073675B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1417709A (zh) * | 2001-11-07 | 2003-05-14 | 日本电气株式会社 | 信息检索系统及其信息检索方法 |
CN101021865A (zh) * | 2007-03-23 | 2007-08-22 | 上海汉光知识产权数据科技有限公司 | 数据检索结果显示方法及显示系统 |
CN101582075A (zh) * | 2009-06-24 | 2009-11-18 | 大连海事大学 | Web信息抽取系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102073675A (zh) | 2011-05-25 |
JP2011108146A (ja) | 2011-06-02 |
US20110125731A1 (en) | 2011-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102073675B (zh) | 信息处理装置、信息处理方法、程序和信息处理系统 | |
KR101953303B1 (ko) | 브라우징 액티비티에 기초하여 정합 애플리케이션을 식별하는 기법 | |
US9280523B2 (en) | System for conversion of website content | |
JP5571091B2 (ja) | サーチ結果の提供 | |
CN102591971B (zh) | 一种网页信息提取的方法和设备 | |
US10878044B2 (en) | System and method for providing content recommendation service | |
JP5027905B2 (ja) | 情報表示装置、情報表示方法、情報表示プログラム、記録媒体及び情報表示システム | |
RU2662632C2 (ru) | Представление документов фиксированного формата в формате с измененной компоновкой | |
KR101855147B1 (ko) | 사용자 선호도 분석 방법 및 그를 위한 디바이스 | |
US20130339840A1 (en) | System and method for logical chunking and restructuring websites | |
KR20190086741A (ko) | 검색 결과에 대한 애니메이션 스니핏 | |
KR101547496B1 (ko) | 웹 페이지 재구성 방법 및 장치 | |
KR20130059738A (ko) | 컨텐츠 분석에 따른 어플리케이션 추천 시스템 및 방법 | |
US20130232407A1 (en) | Systems and methods for producing, reproducing, and maintaining electronic books | |
JP2006065395A (ja) | ハイパーリンク生成装置、ハイパーリンク生成方法及びハイパーリンク生成プログラム | |
US20080163065A1 (en) | Using a light source to indicate navigation spots on a web page | |
JP2012064207A (ja) | ホスト装置及びホスト装置のコンテンツ表示方法 | |
US20130227391A1 (en) | Method and apparatus for displaying webpage | |
TWI427490B (zh) | 網頁檢視方法及系統,及其電腦程式產品 | |
US20160371237A1 (en) | Media content presentation by categorizing and formatting media types | |
CN103761257A (zh) | 基于移动浏览器的网页处理方法及系统 | |
JP2005275488A (ja) | 入力支援方法およびプログラム | |
CN104881453B (zh) | 一种识别网页类型的方法和装置 | |
KR101507779B1 (ko) | 모션 인식을 이용한 즐겨찾기 처리 방법 | |
US20140223274A1 (en) | Information processing device and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20141224 Termination date: 20161115 |