CN102073671B - 话题识别系统、装置和方法、客户终端和信息处理方法 - Google Patents
话题识别系统、装置和方法、客户终端和信息处理方法 Download PDFInfo
- Publication number
- CN102073671B CN102073671B CN201010546530.8A CN201010546530A CN102073671B CN 102073671 B CN102073671 B CN 102073671B CN 201010546530 A CN201010546530 A CN 201010546530A CN 102073671 B CN102073671 B CN 102073671B
- Authority
- CN
- China
- Prior art keywords
- topic
- information
- topic detection
- unit
- client terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 8
- 238000003672 processing method Methods 0.000 title claims abstract description 8
- 238000000034 method Methods 0.000 title abstract description 21
- 238000001514 detection method Methods 0.000 claims description 233
- 238000000605 extraction Methods 0.000 claims description 28
- 238000004891 communication Methods 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 8
- 238000012545 processing Methods 0.000 description 26
- 230000006870 function Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 10
- 238000013500 data storage Methods 0.000 description 9
- 210000000352 storage cell Anatomy 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000005055 memory storage Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000005755 formation reaction Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 240000004859 Gamochaeta purpurea Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了话题识别系统、装置和方法、客户终端和信息处理方法。提供了包括话题识别装置的网络装置,该话题识别装置包括:收集单元,该收集单元用于收集与网络上设置的对象话题相关的Web数据的位置信息;存储单元,该存储单元用于与已由收集单元收集的、和相等对象话题相关的一条或多条位置信息相关联地存储相等话题识别信息;以及话题识别单元,该话题识别单元用于获得某Web数据中所包含的链接信息,用于利用链接信息来从存储单元搜索位置信息,并且用于识别与搜索到的位置信息相关联的话题识别信息。
Description
技术领域
本发明涉及话题识别系统、话题识别装置、客户终端、程序、话题识别方法以及信息处理方法。
背景技术
近来,随着信息通信技术的发展,各种数据已经经由网络发送/接收。特别是随着诸如博客(blog)、SNS(社交网络服务)等之类的Web服务的成长,对于普通因特网用户而言,在网络上发送意见或评论变得容易。
在这样的Web服务中,每个用户都可自由地创建标题或文章来传送Web数据(例如,网络上的文章),这使得由于不同的短语和表达而难以确定每个Web数据涉及什么种类的话题(topic)。
例如,对于与戏剧“零秒出手(Buzzer Beater)”相关的Web数据,一个用户可提出一个标题“我看了零秒出手!”,而另一个用户可提出一个标题“剧集:零秒出手”。可能存在另一情况:一些人可代替“零秒出手”而简短地描述“零秒-哔(Buzzer-bee)”,并且其他人可利用广播时间的星期几和时间来表达该戏剧,例如“周一9点剧”,等等。因此,即使是针对同一戏剧创建的,Web数据也可包含各种方式的表达,这使得难以确定具有不同表达的多个Web数据是否是关于同一戏剧的。
关于以上的议题,日本未经实审专利申请公布No.2006-268201公开了两种方法以用于从描述文章的本体(body)的概要的RSS(RDF站点摘要)数据来计算多篇文章中的相似度,并且用于确定这些文章是否基于相同话题。第一方法是“基于文章的属性值来计算相似度的方法”,该方法分别为两篇文章的每个元素,例如标题、URL、更新日期/时间、作者等,来计算相似度,以便通过对每个相似度进行加权和做加法来计算两篇文章之间的相似度。第二方法是“基于链接参考来计算相似度的方法”,该方法从文章的概要的链接标志中所包含的URL来下载文章的本体,并且计算所下载的文章本体中包含的链接之间的相似度。
发明内容
然而,上述“基于文章的属性值来计算相似度的方法”需要计算相同属性之间的相似度,并且在数据的属性未被限定的情况下不能被应用。如果文章的每个元素都是以XML(可扩展置标语言)格式写的,则可以通过属性名(标志名)和属性值(标志值)来指定诸如标题、URL、更新日期/时间、作者等之类的属性。反之,以HTML写的文章则难以比较它们之间的每个属性,这是因为作为用于描述Web页面的置标语言的HTML没有数据的属性名。即使一些属性可被提取,表达和短语也会随着时间或随着迅速发展(boom)而改变,注意到表达中的差异之后,表达和短语就难以被计算出它的相似度。此外,关于属性值的输入,因为每个用户可自由地输入属性值,所以应当存在着输入错误,例如错误的字母、省略的字母等,这使得相似度的计算更加困难。
此外,上述“基于链接参考来计算相似度的方法”具有如下问题:当两篇文章包含与相同话题相关的不同链接信息时,相似度可能被低估。例如,作为关于戏剧“零秒出手”的文章中所包括的链接信息,容易想到指出戏剧“零秒出手”的官方网站的链接信息,然而存在着到各种网站的更多的其他链接信息,例如到在线百科全书中的“零秒出手”项目的链接信息等等。
鉴于以上所述的,希望提供能够具有更高准确性地识别网络上设置的Web数据的话题的、新颖且改进的话题识别系统、话题识别装置、客户终端、程序、话题识别方法以及信息处理方法。
根据本发明的一个实施例,提供了一种话题识别系统,该话题识别系统包括:客户终端,该客户终端包括:链接信息提取单元,该链接信息提取单元用于提取网络上设置的Web数据中所包含的链接信息;以及通信单元,该通信单元用于发送由链接信息提取单元提取的链接信息,以及话题识别装置,该话题识别装置包括:收集单元,该收集单元用于收集与对象话题相关的Web数据的位置信息;存储单元,该存储单元用于与已由收集单元收集的、和相等对象话题相关的一条或多条位置信息相关联地存储相等话题识别信息;接收单元,该接收单元用于接收从客户终端的通信单元发送的链接信息;识别单元,该识别单元用于利用由接收单元接收的链接信息来从存储单元搜索位置信息,并且用于识别与搜索到的位置信息相关联的话题识别信息;发送单元,该发送单元用于向客户终端发送由识别单元识别的话题识别信息。
接收单元可计算所收集的位置信息中的每一个的重要度,并且确定每个位置信息的重要度是否超过了规定基准。并且存储单元可存储与被确定为重要度已超过规定基准的位置信息相关联的话题识别信息。
识别单元可从存储单元搜索与由接收单元接收的链接信息一致的位置信息,并且在没有找到与链接信息一致的位置信息的情况下搜索与链接信息部分地一致的位置信息。
收集单元可基于对象话题的关键词来收集与对象话题相关的Web数据的位置信息。存储单元还可与对象话题的关键词相关联地存储已由收集单元收集的、和相等对象话题相关的一条或多条位置信息。当关键词被从客户终端接收到时,识别单元可从存储单元搜索与包含该关键词的话题识别信息相关联的位置信息。并且发送单元可向客户终端发送由识别单元搜索到的位置信息。
客户终端还可包括:内容存储单元,该内容存储单元用于与话题识别信息相关联地存储内容;以及搜索单元,该搜索单元用于从内容存储单元搜索与由话题识别装置发送的话题识别信息相关联的内容。
客户终端可向话题识别装置发送内容的元数据中所包含的位置信息,可从话题识别装置接收通过利用了该位置信息的搜索而识别出的话题识别信息,并且可使得内容存储单元与接收到的话题识别信息相关联地存储内容。
根据本发明的另一个实施例,提供了一种话题识别装置,该话题识别装置包括:收集单元,该收集单元用于收集与网络上设置的对象话题相关的Web数据的位置信息;存储单元,该存储单元用于与已由收集单元收集的、和相等对象话题相关的一条或多条位置信息相关联地存储相等话题识别信息;以及识别单元,该识别单元用于获得某Web数据中所包含的链接信息,用于利用链接信息来从存储单元搜索位置信息,并且用于识别与搜索到的位置信息相关联的话题识别信息。
根据本发明的另一个实施例,提供了一种客户终端,该客户终端包括:链接信息提取单元,该链接信息提取单元用于提取网络上设置的Web数据中所包含的链接信息;接收单元,该接收单元用于向话题识别装置发送由链接信息提取单元提取的链接信息,并且用于从话题识别装置接收通过利用了链接信息的搜索而识别出的话题识别信息,其中话题识别装置与和相等对象话题相关的Web数据的位置信息相关联地存储相等话题识别信息;内容存储单元,该内容存储单元用于与话题识别信息相关联地存储内容;以及搜索单元,该搜索单元用于从内容存储单元搜索与从话题识别装置接收的话题识别信息相关联的内容。
根据本发明的另一个实施例,提供了一种使计算机起到以下各项的作用的程序:收集单元,该收集单元用于收集与网络上设置的对象话题相关的Web数据的位置信息;存储单元,该存储单元用于与已由收集单元收集的、和相等对象话题相关的一条或多条位置信息相关联地存储相等话题识别信息;以及识别单元,该识别单元用于获得某Web数据中所包含的链接信息,用于利用链接信息来从存储单元搜索位置信息,并且用于识别与搜索到的位置信息相关联的话题识别信息。
根据本发明的另一个实施例,提供了一种使计算机起到以下各项的作用的程序:链接信息提取单元,该链接信息提取单元用于提取网络上设置的Web数据中所包含的链接信息;接收单元,该接收单元用于向话题识别装置发送由链接信息提取单元提取的链接信息,并且用于从话题识别装置接收通过利用了链接信息的搜索而识别出的话题识别信息,其中话题识别装置与和相等对象话题相关的Web数据的位置信息相关联地存储相等话题识别信息;内容存储单元,该内容存储单元用于与话题识别信息相关联地存储内容;以及搜索单元,该搜索单元用于从内容存储单元搜索与从话题识别装置接收的话题识别信息相关联的内容。
根据本发明的另一个实施例,提供了一种话题识别方法,该话题识别方法包括以下步骤:收集与网络上设置的对象话题相关的Web数据的位置信息;与已被收集的、和相等对象话题相关的一条或多条位置信息相关联地将相等话题识别信息存储进存储介质中;获得某Web数据中所包含的链接信息,并且利用链接信息来从存储单元搜索位置信息;以及识别与搜索到的位置信息相关联的话题识别信息。
根据本发明的另一个实施例,提供了一种信息处理方法,该信息处理方法包括以下步骤:提取网络上设置的Web数据中所包含的链接信息;向话题识别装置发送所提取的链接信息,其中话题识别装置与和相等对象话题相关的Web数据的位置信息相关联地存储相等话题识别信息;从话题识别装置接收通过利用了链接信息的搜索而识别出的话题识别信息;以及从与话题识别信息相关联地存储内容的存储介质,搜索与从话题识别装置接收的话题识别信息相关联的内容。
根据上述的本发明的实施例,可以具有更高准确性地识别网络上设置的Web数据的话题。
附图说明
图1是用于示出根据本发明的一个实施例的话题识别系统的配置的说明性示图;
图2是用于示出Web数据的具体示例的说明性示图;
图3是用于示出客户终端的硬件配置的框图;
图4是用于示出根据实施例的客户终端和话题识别装置的配置的功能框图;
图5是用于示出话题识别装置如何收集用于话题识别的数据的流程图;
图6是用于示出对象话题列表的具体示例的说明性示图;
图7是用于示出用于话题识别的数据的具体示例的说明性示图;
图8是用于示出客户终端如何将每个内容与话题ID相关联的流程图;
图9是用于示出客户终端和话题识别装置的话题识别的处理的序列图;并且
图10是用于示出话题识别系统的操作的被修改的示例的序列图。
具体实施方式
在下文中,将参考附图详细地描述本发明的优选实施例。注意,在本说明书和附图中,具有实质上相同功能和结构的结构元素被标示以相同的标号,并且对这些结构元素的重复说明被省略。
此外,在本说明书和附图中,具有实质上相同功能配置的多个结构元素有时候通过添加到相同号码上的不同字母而彼此区别。例如,具有实质相同功能配置的多个结构通过被称为客户端20A、20B而在必要的情况下被彼此区别。然而,在不必要在具有实质上相同功能配置的多个结构元素之间进行区别的情况下,仅仅相同的号码被添加于其上。例如,在不特别必要在客户端20A与20B之间进行区别的情况下,它们将会被共同地称为客户端20。
在下文中将以下面的顺序来描述本发明的优选实施例。
1.根据本发明的实施例的话题识别系统的配置
2.客户终端的硬件配置
3.客户终端和话题识别装置的功能
4.对每个处理的说明
4-1.收集用于话题识别的数据
4-2.注册与每个内容相关联的话题ID
4-3.话题识别的处理
5.被修改的示例
6.结论
<1.根据本发明的实施例的话题识别系统的配置>
首先,参考图1和图2,将说明根据本发明的一个实施例的话题识别系统1的配置。
图1是用于示出根据本发明的一个实施例的话题识别系统1的配置的说明性示图。如图1所示,根据本实施例的话题识别系统1包括话题识别装置10、网络12、客户终端20A和20B、Web服务器30A、30B和30C。
Web服务器30存储以HTML格式创建的Web数据,并且响应于来自客户终端20的请求而向客户终端20发送Web数据。例如,Web服务器30与博客服务器或SNS服务器相对应,同时Web数据与博客文章或SNS站点相对应。Web数据的其他示例是各种数据,例如关于相同话题的官方网站、在线百科全书等。注意,仅仅三个Web服务器30A、30B和30C在图1中被示出,然而,几百和几千个Web服务器30可连接至网络12。
在下文中,将参考图2来说明Web数据的具体示例。
图2是用于示出Web数据的具体示例的说明性示图。图2所示的Web数据42包括标题44、文章本体46和链接信息48。意见和评论经常在文章本体46中针对具体话题而出现,并且就对话题的内容的说明而言,诸如官方网站、在线百科全书、新闻网站等之类的其他网站经常被链接信息48引用。也就是说,诸如官方网站、在线百科全书、新闻网站等之类的其他网站的URL经常被包含在Web数据中作为链接信息。此外,除了其他网站的URL以外,Web数据还经常引用其他网站中所包含的图像或电影。在此情况下,HTML描述中的图像标志等包括了官方网站、在线百科全书、新闻网站等的URL。
客户终端20经由网络12而连接至Web服务器30,并且能够从Web服务器30获得Web数据以用于显示。注意,网络12是用于从连接至网络12的装置发送的信息的有线或无线传输路径。例如,网络12可包括诸如因特网、电话网络或卫星网络之类的公共网络,包括以太网(注册商标)在内的各种局域网(LAN),或者广域网(WAN)。此外,网络12可包括诸如因特网协议-虚拟专用网(IP-VPN)之类的租用线路网(leasedline network)。
此外,客户终端20执行对于识别哪个话题与Web数据有关而言必要的应用,Web数据例如由Web服务器30向公众释放的博客和SNS站点。对于识别话题来说必要的应用不被具体地限制,但是在本说明书中,重点放在此应用是搜索应用的情况上,该搜索应用从客户终端20存储的许多内容中搜索与某Web数据的话题相关的内容。
随着HDD(硬盘驱动器)的更大容量更小花费的近来趋势,客户终端20可存储极大量的内容。然而,越多的内容被存储,用户选择内容就越难。鉴于以上所述的,用于向用户推荐博客或SNS站点中流行的惹人注目的话题的上述搜索应用已经被期待。稍后将在“4.对每个处理的说明”中详细说明此搜索应用。
注意,在本说明书中,假设了内容是诸如电影之类的电影数据、电视节目、视频节目等的情况,然而内容不限于这些示例。例如,内容可以是诸如音乐、无线电节目等之类的音乐数据,静止图像数据,游戏,软件,等等。
图1示出个人计算机(PC)作为客户终端20A以及蜂窝电话作为客户终端20B,然而客户终端20既不限于PC也不限于蜂窝电话。例如,客户终端20可以是诸如家用视频处理装置(DVD记录机、盒式录像机(videocassette recorder)等)、个人数字助理(PDA)、家用游戏机、家用电器等之类的信息处理装置。此外,客户终端20可以是诸如个人手持电话系统(PHS)、便携音频回放装置、便携视频处理装置、便携游戏机等之类的信息处理装置。
话题识别装置10识别响应于来自客户终端20的请求而请求的Web数据的话题,并且向客户终端20发送指示所识别的话题的信息(话题ID)。话题识别装置10预先执行收集对于识别话题来说所必要的、用于话题识别的数据的处理,以实现这样的话题识别的处理。稍后将在“4-1.收集用于话题识别的数据”中详细说明收集用于话题识别的数据的处理,并且稍后将在“4-3.话题识别的处理”中详细说明话题识别的处理。
在图1所示的示例中,话题识别装置10被设置在网络12上,作为与执行应用的客户终端20不同的装置。也就是说,话题识别装置10以Web服务的形式而向网络12上的公众开放,并且这使得多个客户终端20能够接入到话题识别装置10。此外,话题识别装置10向公众释放了用于提供话题识别的功能的API(应用程序接口),该API使得话题识别的功能可用于从客户终端20被容易地使用。
如上所述,通过将话题识别装置10向网络12上的公众释放作为Web服务,话题识别的功能可由多个客户终端20使用,然而本发明不限于此示例。例如,在本发明的技术范围中,客户终端20还可被实现为具有话题识别和应用的两种功能。
<2.客户终端的硬件配置>
此前,参考图1和图2,已说明了根据本发明的一个实施例的话题识别系统1的配置。接下来,参考图3,将对话题识别系统1中所包括的客户终端20的硬件配置给出说明。
图3是用于示出客户终端20的硬件配置的框图。客户终端20包括CPU(中央处理单元)201、ROM(只读存储器)202、RAM(随机存取存储器)203以及主总线204。此外,客户终端20包括桥接器205、外部总线206、接口207、输入装置208、输出装置210、存储装置(HDD)211、驱动器212以及通信装置215。
CPU 201起到了算术处理单元和控制单元的作用,并且根据各种程序来控制客户终端20中的一般操作。CPU 201可以是微处理器。ROM 202存储要由CPU 201使用的程序和算术参数。RAM 203临时存储在CPU 201的操作期间要使用的程序、在该操作期间适当地变化的参数、等等。这些通过利用CPU总线等构成的主总线204来互相连接。
主总线204经由桥接器205而连接至诸如外围组件互连/接口(PCI)总线之类的外部总线206。这里,未必分离地构成主总线204、桥接器205和外部总线206。它们的功能可安装在单个总线上。
利用用于由用户输入信息的、诸如鼠标、键盘、触摸板、按钮、麦克风、开关和杆之类的输入装置,以及用于基于用户的输入来生成输入信号并用于输出信号至CPU 201的输入控制电路,来构成输入装置208。客户终端20的用户可通过操作输入装置208来输入各种数据并且指示客户终端20处理操作。
输出装置210包括显示装置,例如阴极射线管(CRT)显示装置、液晶显示(LCD)装置、有机发光二极管(OLED)装置、以及灯。此外,输出装置210包括音频输出装置,例如扬声器和头戴式耳机。例如,输出装置210输出被再现的内容。具体地,显示装置显示各种类型的信息,例如具有文本或图像的被再现的视频数据。同时,音频输出装置将被再现的音频数据等转换成音频并且输出音频。
存储装置211是被配置为根据本实施例的客户终端20的存储器单元的示例的、用于数据存储的装置。存储装置211可包括存储介质、在存储介质处记录数据的记录装置、从存储介质读出数据的读出装置、以及删除记录在存储介质处的数据的删除装置。例如,存储装置211被配置为具有硬盘驱动器(HDD)。存储装置211驱动硬盘并且存储要由CPU 201执行的程序以及各种数据。
驱动器212是用于存储介质的读出器/写入器,并且被客户终端20结合或被外部地附接到客户终端20上。驱动器212读出在诸如磁盘、光盘、磁光盘和半导体存储器之类的、被安装的可拆卸存储介质24处所存储的信息,并且输出信息至RAM 203。驱动器212可将信息写到可拆卸存储介质24上。
例如,通信装置215是利用要连接至网络12的通信装置等而构成的通信接口。这里,通信装置215可以是用于执行与线缆的通信的无线局域网(LAN)兼容通信装置、LTE(长期演进)兼容通信装置或者有线通信装置。
以上参考图3已说明了客户终端20的硬件配置。话题识别装置10的硬件可具有与客户终端20实质上相同的功能和结构,因此,对话题识别装置10的硬件的说明将被省略。
<3.客户终端和话题识别装置的功能>
接下来,将参考图4简要地说明客户终端20和话题识别装置10的功能。
图4是用于示出根据实施例的客户终端20和话题识别装置10的配置的功能框图。如图4所示,话题识别装置10包括通信单元116、收集单元120、用于话题识别的数据存储单元124和识别单元128。
通信单元116起到了与网络12上的客户终端20和Web服务器30发送/接收数据的发送单元和接收单元的作用。收集单元120收集与对象话题相关的URL(位置信息),作为用于话题识别的数据。然后存储单元124存储所收集的用于话题识别的数据。此外,识别单元128利用由用于话题识别的数据存储单元124存储的用于话题识别的数据,来识别从客户终端20请求的Web数据的话题。
客户终端20包括通信单元216、信息提取单元220、内容存储单元224、识别请求单元228、搜索单元232和再现单元236。
通信单元216起到了与网络12上的话题识别装置10和Web服务器30发送/接收数据的发送单元和接收单元的作用。信息提取单元220(链接信息提取单元、URL提取单元)提取在从Web服务器30获得的Web数据中所包括的链接信息。例如,当信息提取单元220从Web服务器30获得图2所示的Web数据42时,信息提取单元220从Web数据42提取链接信息48即“http://xxx.com”。
内容存储单元224是用于存储客户终端20获得的内容的存储介质。内容存储单元224与由话题识别装置10识别出的话题ID相关联地存储每个内容。注意,客户终端20可通过陆地数字广播、线缆TV广播、BS(广播卫星)数字广播、CS(通信卫星)数字广播等来获得内容。此外,客户终端20可获得经由网络12分布的内容。
此外,内容存储单元224可以是存储介质,例如非易失性存储器、磁盘、光盘、磁光(MO)盘等。例如,非易失性存储器可以是电可擦可编程只读存储器(EEPROM)和可擦可编程ROM(EPROM)。此外,磁盘可以是硬盘、盘状(discoid)磁盘等。此外,光盘可以是光碟(CD)、可记录数字多功能光碟(DVD-R)、蓝光(Blu-ray)碟(BD;注册商标)等等。
识别请求单元228为了由信息提取单元220获得的Web页面的话题识别而请求话题识别装置10,以从话题识别装置10获得指示Web页面的话题的信息。具体地,识别请求单元228发送由信息提取单元220提取的链接信息,并且从话题识别装置10获得基于链接信息而在话题识别装置10中识别的话题ID。
搜索单元232从内容存储单元224搜索与由识别请求单元228从话题识别装置10获得的话题ID相关联的内容,并且再现单元236再现由搜索单元232搜索到的内容。注意,客户终端20可显示包括了搜索单元232搜索到的内容的列表,以鼓励用户选择从列表选的内容。
<4.对每个处理的说明>
此前,已参考图4示意地说明了客户终端20和话题识别装置10的功能。接下来,将详细说明每个处理,例如收集用于话题识别的数据、与每个内容相关联的话题ID的注册、以及话题识别。
(4-1.收集用于话题识别的数据)
图5是用于示出话题识别装置10如何收集用于话题识别的数据的流程图。此收集处理是独立于话题识别处理的处理,并且被规则地执行以更新用于话题识别的数据。
如图5所示,话题识别装置10的收集单元120首先获得对象话题,并且生成对象话题列表(S304)。例如,收集单元120收集网络12上的电视节目的标题,以生成与电视节目相关的对象话题列表。具体地,收集单元120可通过从在线百科全书收集电视节目的项目,来生成对象话题列表。
代替地,收集单元120可收集由广播站提供的RSS数据,并且可基于RSS数据中包括的最近电视节目的标题来生成对象话题列表。此外,收集单元120可接收广播波以从广播波中包含的SI(服务信息)提取节目标题,并且可生成对象话题列表。此外,当用户或广播站在广播新节目的时候向话题识别装置10注册节目标题作为对象话题时,收集单元120可利用所注册的节目标题来生成对象话题列表。
图6是用于示出对象话题列表的具体示例的说明性示图。如图6所示,对象话题列表包括对象话题、更新日期/时间、以及话题ID。对象话题是作为示例的上述方法中所获得的节目标题。更新日期/时间是关于对象话题而执行先前更新的日期和时间。话题ID是唯一地分配给每个对象话题的话题识别信息。
当图6所示的对象话题列表已被获得时,也就是说当存在对象话题时(S308),收集单元120转移至S312中指示的处理。注意,S312之后的处理可对对象话题列表中包括的每个对象话题执行,或者可仅对过了某时间段还未被更新的对象话题来执行。
随后,收集单元120获得与对象话题列表中包括的对象话题有关的Web数据的URL的候选者(candidate)(S312)。这里,关于对象话题的Web数据是包括对象话题的信息的一种Web数据,并且可以是例如对象话题的官方网站或在线百科全书中的对象话题的项目页面。
更具体地,当对象话题是戏剧“零秒出手”时,可以列出由广播站提供的“零秒出手”的官方网站、在线百科全书中关于“零秒出手”的项目页面、“零秒出手”的演职人员的博客等,作为关于对象话题的Web数据。此外,当更详细地识别诸如“零秒出手”的“第三话”之类的话题时,官方网站中“第三话”的概要的页面等可与关于对象话题的Web数据相对应。
此外,除了Web页面的URL以外,与对象话题有关的Web数据的URL可包括图像或电影图像的URL。例如,与对象话题有关的Web数据的URL可以是官方网站中提供的预告片、场景图像、采访页面等的URL。
注意,收集单元120可利用作为对象话题的、对象话题列表中所包括的节目标题,来搜索以上的Web数据的URL的候选者。例如,收集单元120可通过在网络12上提供的搜索服务中输入对象话题作为关键词,来获得一组与对象话题相关的Web数据的URL的候选者。
在步骤S312之后,收集单元120为所获得的Web数据的URL的每个候选者计算重要度(S316)。这里,对于链接到较多数目的Web数据的Web数据的URL,以及对于具有较多数目的访问的Web数据的URL,重要度会被高估。注意,服务是给予提供网络12上的每个Web数据的重要度,并且收集单元120可从这些外部的服务来获得每个候选者的重要度。此外,收集单元120可通过对从多个外部服务获得的每个候选者的每个重要度进行加权和做加法,来计算最终重要度。
随后,收集单元120确定每个候选者的重要度是否超过阈值,以确定每个候选者是否重要(S320)。然后,用于话题识别的数据存储单元124与对象话题的话题ID相关联地存储一组与对象话题有关的Web数据的URL候选者之中的、其重要度超过阈值的URL,作为用于话题识别的数据(S324)。
图7是用于示出用于话题识别的数据的具体示例的说明性示图。如图7所示,用于话题识别的数据包括管ID、话题ID、URL和标题。管理ID是用于管理用于话题识别的数据的唯一ID。话题ID是被唯一地分配给每个对象话题的话题识别信息。用于话题识别的数据中包含的URL是被收集单元120收集的并且被确定为重要的Web页面的URL。标题例如是节目标题。具体地,图7所示的、其管ID为“1”的用于话题识别的数据具有话题ID“10001”,与话题有关的Web数据的URL是“http://xxx.com/”,并且标题是“零秒出手”。
这里,以上述方法,虽然URL是针对不同Web页面的,但只要Web页面与相同对象话题相关,根据本实施例的话题识别装置10就与相同话题ID相关联地存储Web页面。例如,如图7所示,管理ID为“1”的用于话题识别的数据的URL不同于管理ID为“3”的用于话题识别的数据的URL,然而,因为两个URL都与同一“零秒出手”相关,所以它们可与相同话题ID“10001”相关联。这使得这些Web数据的话题被识别为相同的,即使与相同话题有关的多个Web数据中所包含的链接信息是不同的。
注意,在图7中,示例被示出为用于话题识别的数据包括管理ID、话题ID、URL和标题的情况,然而,本发明不限于此示例。例如,用于话题识别的数据可以不包括标题,并且可包括标志、详细信息、演员信息等。此外,标题可代替话题ID而被用作话题识别信息。
如上所述,根据本实施例的话题识别装置10可从网络12收集与对象话题有关的Web数据的URL候选者。此外,话题识别装置10确定每个候选者的重要度,并且仅仅将重要的候选者存储在用于话题识别的数据存储单元124上作为用于话题识别的数据。这可防止具有与对象话题的低相关性地相关联的Web数据的URL被存储在用于话题识别的数据存储单元124中的情况。结果,仅仅具有与对象话题的高相关性地相关联的URL可被存储为用于话题识别的数据,并且话题识别的处理的准确性预期得到改进。
(4-2.注册与每个内容相关联的话题ID)
图8是用于示出客户终端20如何将每个内容与话题ID相关联的流程图。如图8所示,首先,客户终端20的内容存储单元224存储由客户终端20获得的内容以及内容的元数据(S404)。这里,元数据中包含的URL非常可能是内容的官方网站的URL。此外,客户终端20可获得作为来自广播站的电子节目指南(EPG)的、叠加(superimpose)在内容上发送的元数据,并且它可从提供元数据的服务获得。
接下来,信息提取单元220提取元数据中包含的URL(S408)。然后,识别请求单元228向话题识别装置10请求与所提取的URL相关联的话题ID(S412)。具体地,识别请求单元228向话题识别装置10发送S408中提取的URL,并且话题识别装置10的识别单元128从用于话题识别的数据中搜索与从识别请求单元228接收的URL相关联的话题ID,以发送至客户终端20。在此之后,客户终端20的内容存储单元224与内容相关联地存储由识别请求单元228获得的话题ID(S416)。
因此,通过向话题识别装置10发送与内容有关的Web数据的URL,客户终端20可从话题识别装置10获得Web数据的话题ID,并且与内容相关联地存储话题ID。
(4-3.话题识别的处理)
图9是用于示出客户终端20和话题识别装置10的话题识别的处理的序列图。客户终端20中的话题识别的处理是客户终端20的应用中建立的处理,并且要被启动作为应用指导。例如,当应用要从许多内容中搜索与网络12上的Web页面的话题相关的内容以推荐给用户时,话题识别的处理将在应用规则地获得网络12上的话题的时候被执行。
具体地,如图9所示,客户终端20向Web服务器30请求Web数据(S504),并且从Web服务器30获得Web数据(S508)。这里,客户终端20可从预先注册的网站获得Web数据。例如,当客户终端20的用户注册了朋友的博客站点时,客户终端20可获得他/她的朋友的博客中的文章作为Web数据。或者,客户终端20可获得非常受欢迎的博客中的文章作为Web数据。
在步骤S508之后,客户终端20的信息提取单元220分析S508中获得的Web数据,并且提取Web数据中包含的链接信息(URL)(S512)。例如,如果Web数据是HTML格式的,则信息提取单元220从HTML文件中的标志中提取标志相关的链接。此外,信息提取单元220不仅提取链接标志,而且提取参考了外部网站的图像等的信息。
当链接信息被信息提取单元220提取时(S516),识别请求单元228向话题识别装置10请求对S508中获得的Web页面的话题识别(S520)。具体地,识别请求单元228向话题识别装置10发送包括了由信息提取单元220提取的链接信息的请求信息。
然后,话题识别装置10的识别单元128利用从客户终端20接收的请求信息中所包括的链接信息来识别话题(S524),并且向客户终端20发送通过话题识别提取的话题ID(S528)。具体地,识别单元128从用于话题识别的数据存储单元124搜索包含了与来自客户终端20的链接信息相等的URL的用于话题识别的数据,并且提取用于话题识别的数据中包含的话题ID。例如,当用于话题识别的数据存储单元124存储了图7所示的用于话题识别的数据并且来自客户终端20的链接信息是“http://xxx.com/”时,管ID为“1”的用于话题识别的数据将被搜索,并且用于话题识别的数据中包含的话题ID“10001”将被提取。
此外,如果包含了与来自客户终端20的链接信息相等的URL的用于话题识别的数据没有被找到,则识别单元128搜索包含了与链接信息部分相等的URL的用于话题识别的数据,以提取用于话题识别的数据中包括的话题ID。例如,当与“http://zzz.co.jp/xxx/yyy/”相等的URL未被找到时,识别单元128将URL的路径缩短成“http://zzz.co.jp/xxx/”并且搜索与“http://zzz.co.jp/xxx/”相等的URL。如果与“http://zzz.co.jp/xxx/”相等的URL也未被找到,则识别单元128进一步将URL的路径缩短成“http://zzz.co.jp/”并且搜索与“http://zzz.co.jp/”相等的URL。
注意,来自客户终端20的请求信息可包括多个链接信息。在此情况下,识别单元128可优先提取具有更多条数的链接信息的共同的话题ID。例如,如果请求信息包括五条链接信息,其中它们中的三个与“零秒出手”相关并且其余的两条链接信息与其他话题相关,则识别单元128可优先提取与“零秒出手”相关联的话题ID“10001”。
在步骤S528之后,客户终端20的识别请求单元228分析来自话题识别装置10的对请求的响应。具体地,例如,识别请求单元228分析作为来自话题识别装置10的响应而获得的XML数据,并且提取话题ID。
这使客户终端20能利用由话题识别装置10识别的话题ID来执行各种应用(S532)。例如,搜索单元232从内容存储单元224搜索与所识别的话题ID相关联的内容,并且再现单元236再现搜索到的内容,这使得可以向用户推荐与网络12上的热门话题有关的内容。
<5.被修改的示例>
此前,已说明了话题识别装置10具有话题识别的功能并且话题识别装置10被用于Web页面的话题识别的情况,然而,本发明不限于此示例。例如,话题识别装置10可用来编辑博客或SNS站点上的文章。具体地,当创建引用官方网站的文章时,如参考图10所说明的,官方网站的URL和图像的URL可从话题识别装置10获得以被嵌入进文章中。
图10是用于示出话题识别系统1的操作的被修改的示例的序列图。如图10所示,当新发帖(posting)时客户终端20接入至Web服务器30(S604),并且从Web服务器30获得用于新发帖的帖子形式(S608)。然后,当用户根据客户终端20中的帖子形式创建文章时(S612),假设用户希望将与文章的话题有关的Web数据的URL嵌进文章中作为链接信息。
在此情况下,客户终端20的识别请求单元228向话题识别装置10发送包括了用户所指定的关键词的请求信息(S616)。然后,话题识别装置10的识别单元128从用于话题识别的数据存储单元124搜索与请求信息中包含的关键词有关的URL(S620),并且发送搜索到的URL列表至客户终端20(S624)。
例如,当用户正在写与戏剧“零秒出手”有关的文章时,用户从客户终端20向话题识别装置10发送包括关键词“零秒出手”的请求信息。然后,话题识别装置10在用于话题识别的数据的标题中搜索请求信息中包括的关键词,将与通过话题ID搜索到的标题相关联的URL分组以发送至客户终端20。
在步骤S624之后,客户终端20从自话题识别装置10接收的URL中选择所希望的URL,并且将所选择的URL嵌入进文章(S628)。例如,客户终端20可将官方网站的URL粘贴进文章中作为链接信息,或者粘贴戏剧中的场景的图像。
根据被修改的示例的这样的应用,可以容易地将链接信息和图像粘贴进要发帖的文章中,而不用研究官方网站的URL以及图像中的每一个。此外,当这样的应用将会增加时,话题识别装置10中累积的URL要被粘贴进博客和SNS站点中的Web数据中,这使得识别话题更加容易。像这样的协同效果(synergistic effect)会被预期。
<6.结论>
根据上述实施例,可以利用Web数据中包含的链接信息和图像的URL,来识别向网络12上的公众开放的博客和SNS站点的Web数据的话题。因此,即使Web数据的描述中的记法(notation)或表达不同于通常的,也可以适当地识别Web数据的话题。
根据实施例,与相同话题ID相关联地在话题识别装置10中管理关于相同对象话题的多个不同Web页面的URL。因此,即使与相同话题有关的多条Web数据中所包含的链接信息是不同的,也可以识别出这些Web数据的话题是相同的。此外,根据以上的被修改的示例,通过将话题识别装置10用作用于识别URL的装置,可以容易地将链接信息和图像粘贴进要发帖的文章中,而不用研究官方网站的URL以及图像中的每一个。
以上参考附图已详细地说明了本发明的优选实施例,本发明不限于此示例。本领域的技术人员应当理解,各种修改、组合、子组合和变更可取决于设计需求和其他因素而发生,只要它们在所附权利要求或其等同物的范围内。
例如,话题识别系统1和客户终端20的处理中的每个步骤未必按序列图或流程图中描述的时间序列的顺序被处理。例如,话题识别系统1和客户终端20的处理的每个步骤可以按与序列图或流程图中描述的顺序不同的顺序被处理,或者可以并行地被处理。
此外,也可以创建程序以使得话题识别装置10和客户终端20中内置的、诸如CPU 201、ROM 202和RAM 203等之类的硬件履行与上述话题识别装置10和客户终端20的每个配置中的功能等同的功能。此外,用于存储计算机程序的存储介质将被提供。
本申请包含与2009年11月11日递交日本专利局的日本优先专利申请JP 2009-264239中所公开的主题相关的主题,该日本优先专利申请的全部内容由此通过引用而被结合。
Claims (10)
1.一种话题识别系统,包括:
客户终端,所述客户终端包括:
链接信息提取单元,用于提取网络上设置的Web数据中所包含的链接信息;以及
通信单元,用于发送由所述链接信息提取单元提取的链接信息,以及
话题识别装置,所述话题识别装置包括:
收集单元,用于收集与对象话题相关的Web数据的位置信息;
存储单元,用于将相等话题识别信息与已由所述收集单元收集的、和相等对象话题相关的一条或多条位置信息相关联地存储;
接收单元,用于接收从所述客户终端的所述通信单元发送的所述链接信息;
识别单元,用于利用由所述接收单元接收的所述链接信息来从所述存储单元中搜索位置信息,并且用于识别与搜索到的位置信息相关联的话题识别信息;
发送单元,用于向所述客户终端发送由所述识别单元识别的所述话题识别信息。
2.根据权利要求1所述的话题识别系统,
其中,所述收集单元计算所收集的位置信息中的每一个的重要度,并且判断每个位置信息的重要度是否超过了规定基准;并且
其中,所述存储单元将所述话题识别信息与重要度被判断为已超过所述规定基准的位置信息相关联地存储。
3.根据权利要求2所述的话题识别系统,
其中,所述识别单元从所述存储单元中搜索与由所述接收单元接收的链接信息相等的位置信息,并且在没有找到与所述链接信息相等的位置信息的情况下搜索与所述链接信息部分地相等的位置信息。
4.根据权利要求3所述的话题识别系统,
其中,所述收集单元基于所述对象话题的关键词来收集与所述对象话题相关的Web数据的位置信息,
其中,所述存储单元还将已由所述收集单元收集的、和相等对象话题相关的一条或多条位置信息与所述对象话题的关键词相关联地存储,
其中,当关键词被从所述客户终端接收到时,所述识别单元从所述存储单元中搜索与包含该关键词的话题识别信息相关联的位置信息,并且
其中,所述发送单元向所述客户终端发送由所述识别单元搜索到的位置信息。
5.根据权利要求3所述的话题识别系统,
其中,所述客户终端还包括:
内容存储单元,用于将内容与话题识别信息相关联地存储;以及
搜索单元,用于从所述内容存储单元中搜索与由所述话题识别装置发送的所述话题识别信息相关联的内容。
6.根据权利要求5所述的话题识别系统,
其中,所述客户终端向所述话题识别装置发送内容的元数据中所包含的位置信息,从所述话题识别装置接收通过利用了该位置信息的搜索而识别出的话题识别信息,并且使得所述内容存储单元将所述内容与接收到的话题识别信息相关联地存储。
7.一种话题识别装置,包括:
收集单元,用于收集与网络上设置的对象话题相关的Web数据的位置信息;
存储单元,用于将相等话题识别信息与已由所述收集单元收集的、和相等对象话题相关的一条或多条位置信息相关联地存储;以及
识别单元,用于获得特定Web数据中所包含的链接信息,用于利用所述链接信息来从所述存储单元搜索位置信息,并且用于识别与搜索到的位置信息相关联的话题识别信息。
8.一种客户终端,包括:
链接信息提取单元,用于提取网络上设置的Web数据中所包含的链接信息;
接收单元,用于向话题识别装置发送由所述链接信息提取单元提取的所述链接信息,并且用于从所述话题识别装置接收通过利用了所述链接信息的搜索而识别出的话题识别信息,其中所述话题识别装置将相等话题识别信息与和相等对象话题相关的Web数据的位置信息相关联地存储;
内容存储单元,用于将内容与话题识别信息相关联地存储;以及
搜索单元,用于从所述内容存储单元中搜索与从所述话题识别装置接收的话题识别信息相关联的内容。
9.一种话题识别方法,包括以下步骤:
收集与网络上设置的对象话题相关的Web数据的位置信息;
将相等话题识别信息与已被收集的、和相等对象话题相关的一条或多条位置信息相关联地将存储进存储介质中;
获得特定Web数据中所包含的链接信息,并且利用所述链接信息来从所述存储单元中搜索位置信息;以及
识别与搜索到的位置信息相关联的话题识别信息。
10.一种信息处理方法,包括以下步骤:
提取网络上设置的Web数据中所包含的链接信息;
向话题识别装置发送所提取的链接信息,其中所述话题识别装置将相等话题识别信息与和相等对象话题相关的Web数据的位置信息相关联地存储;
从所述话题识别装置接收通过利用了所述链接信息的搜索而识别出的话题识别信息;以及
从将内容与话题识别信息相关联地存储的存储介质,搜索与从所述话题识别装置接收的话题识别信息相关联的内容。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009264239A JP2011108117A (ja) | 2009-11-19 | 2009-11-19 | 話題特定システム、話題特定装置、クライアント端末、プログラム、話題特定方法、および情報処理方法 |
JP2009-264239 | 2009-11-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102073671A CN102073671A (zh) | 2011-05-25 |
CN102073671B true CN102073671B (zh) | 2014-06-25 |
Family
ID=44012080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010546530.8A Expired - Fee Related CN102073671B (zh) | 2009-11-19 | 2010-11-12 | 话题识别系统、装置和方法、客户终端和信息处理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20110119248A1 (zh) |
JP (1) | JP2011108117A (zh) |
CN (1) | CN102073671B (zh) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2538438A1 (en) | 2006-03-01 | 2007-09-01 | Legalview Assets, Limited | Systems and methods for media programming |
US10083248B2 (en) * | 2010-04-07 | 2018-09-25 | Excalibur Ip, Llc | Method and system for topic-based browsing |
US9996614B2 (en) | 2010-04-07 | 2018-06-12 | Excalibur Ip, Llc | Method and system for determining relevant text in a web page |
WO2012043650A1 (ja) * | 2010-09-29 | 2012-04-05 | 楽天株式会社 | 表示プログラム、表示装置、情報処理方法、記録媒体、および、情報処理装置 |
US20130054558A1 (en) * | 2011-08-29 | 2013-02-28 | Microsoft Corporation | Updated information provisioning |
US20140156627A1 (en) * | 2012-11-30 | 2014-06-05 | Microsoft Corporation | Mapping of topic summaries to search results |
EP2813953A1 (en) * | 2013-06-12 | 2014-12-17 | STV Central Limited | Accessing data relating to topics |
US10210146B2 (en) | 2014-09-28 | 2019-02-19 | Microsoft Technology Licensing, Llc | Productivity tools for content authoring |
US10402061B2 (en) | 2014-09-28 | 2019-09-03 | Microsoft Technology Licensing, Llc | Productivity tools for content authoring |
US10528597B2 (en) | 2014-09-28 | 2020-01-07 | Microsoft Technology Licensing, Llc | Graph-driven authoring in productivity tools |
JP5940135B2 (ja) * | 2014-12-02 | 2016-06-29 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 話題提示方法、装置及びコンピュータ・プログラム。 |
CN104408036B (zh) * | 2014-12-15 | 2019-01-08 | 北京国双科技有限公司 | 关联话题的识别方法和装置 |
CN104636476B (zh) * | 2015-02-13 | 2018-09-04 | 小米科技有限责任公司 | 推荐好友的方法及装置 |
US11803709B2 (en) | 2021-09-23 | 2023-10-31 | International Business Machines Corporation | Computer-assisted topic guidance in document writing |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1535433A (zh) * | 2001-07-04 | 2004-10-06 | 库吉萨姆媒介公司 | 基于分类的可扩展交互式文档检索系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4446188B2 (ja) * | 2005-07-19 | 2010-04-07 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
US20080071774A1 (en) * | 2006-09-20 | 2008-03-20 | John Nicholas Gross | Web Page Link Recommender |
JP2008146624A (ja) * | 2006-11-15 | 2008-06-26 | Sony Corp | コンテンツのフィルタリング方法、フィルタリング装置およびフィルタリングプログラム |
US8341185B2 (en) * | 2010-04-02 | 2012-12-25 | Nokia Corporation | Method and apparatus for context-indexed network resources |
-
2009
- 2009-11-19 JP JP2009264239A patent/JP2011108117A/ja not_active Withdrawn
-
2010
- 2010-11-10 US US12/943,331 patent/US20110119248A1/en not_active Abandoned
- 2010-11-12 CN CN201010546530.8A patent/CN102073671B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1535433A (zh) * | 2001-07-04 | 2004-10-06 | 库吉萨姆媒介公司 | 基于分类的可扩展交互式文档检索系统 |
Also Published As
Publication number | Publication date |
---|---|
CN102073671A (zh) | 2011-05-25 |
US20110119248A1 (en) | 2011-05-19 |
JP2011108117A (ja) | 2011-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102073671B (zh) | 话题识别系统、装置和方法、客户终端和信息处理方法 | |
KR100873882B1 (ko) | 전자 장치, 방송 프로그램 정보의 수집 방법, 그 수집프로그램을 기록한 컴퓨터 판독가능한 기록 매체 및 그수집 시스템 | |
US10371532B2 (en) | Method and apparatus for providing geospatial and temporal navigation | |
TWI441471B (zh) | 用於標記位置之方法 | |
KR100881107B1 (ko) | 전자 장치, 그 정보 열람 방법 및 정보 열람 프로그램을기록한 컴퓨터 판독가능한 기록 매체 | |
CN1647073B (zh) | 信息搜索系统、信息处理设备和方法、及信息搜索设备和方法 | |
CN104756503A (zh) | 通过经由社交媒体向最感兴趣的时刻中提供深度链接来帮助发现节目内容 | |
CN102265276A (zh) | 基于上下文的推荐系统 | |
TW201102956A (en) | Method and system for presenting content | |
CN103729403A (zh) | 用于更新用户简档的方法和系统 | |
US20100306073A1 (en) | Identifying and purchasing pre-recorded content | |
US20180239819A1 (en) | Music Search System, Music Search Method, Server Device, and Program | |
US20210067815A1 (en) | Content matching system | |
JP6369979B2 (ja) | データ処理装置、データ処理システム、データ表示装置、データ処理方法、表示方法およびプログラム | |
JP2012129982A (ja) | 推定装置、推定方法、並びにプログラム | |
CN102073673B (zh) | 数据处理系统、数据处理装置、程序和数据处理方法 | |
US20110153613A1 (en) | Information search apparatus and method using locational/societal relation-based automatic category generation | |
US8752091B2 (en) | Method for outputting electronic program guide and broadcasting receiver enabling of the method | |
KR101624172B1 (ko) | 컨텐츠 정보 관리 장치 및 방법 | |
KR101869332B1 (ko) | 사용자 맞춤형 멀티미디어 컨텐츠를 제공하는 방법 및 장치 | |
JP6480113B2 (ja) | データ処理システム、データ処理装置、および表示方法 | |
JP2007279788A (ja) | コンテンツの選択方法、選択プログラムおよび選択装置 | |
KR20180069621A (ko) | 필터링 및 태그 방식을 기반으로 사용자 맞춤형 멀티미디어 컨텐츠를 제공하는 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140625 Termination date: 20211112 |