CN101601038A - 关联词语提示装置 - Google Patents

关联词语提示装置 Download PDF

Info

Publication number
CN101601038A
CN101601038A CNA2008800040001A CN200880004000A CN101601038A CN 101601038 A CN101601038 A CN 101601038A CN A2008800040001 A CNA2008800040001 A CN A2008800040001A CN 200880004000 A CN200880004000 A CN 200880004000A CN 101601038 A CN101601038 A CN 101601038A
Authority
CN
China
Prior art keywords
word
association
attribute
dictionary
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008800040001A
Other languages
English (en)
Inventor
续木贵史
松浦聪
高田和丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101601038A publication Critical patent/CN101601038A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Abstract

用于进行适当的防止遗漏检索的关联词语提示装置(100)包括:节目信息记忆部(101),按每个节目来记忆节目信息(101a);信息划分部(103a),按每个节目信息(101a)中包含的单词的属性,生成以作为属于此属性的单词的基准单词和在节目内所共现的单词的集合为单位而组成的至少一个以上的小组;关联度计算部(103b),将按每个所述属性的按属性区分的联想词典(102a、102b、102c)存储在联想词典记忆部(102),该按每个所述属性的按属性区分的联想词典包括,按每个单词的属性的各个小组中的两个单词所共现的频度而算出的所述两个单词间的关联度和所述两个单词;检索条件取得部(104),取得检索单词和其属性;代替单词取得部(105),从与此被取得的属性对应的按属性区分的联想词典中选择代替单词;输出部(106),提示被选择的代替单词。

Description

关联词语提示装置
技术领域
本发明涉及制作由电子数据组成的联想词典的关联词语提示装置,尤其涉及制作表示与规定的单词相关联的其他单词的联想词典,并使用此联想词典,从而将相关联的其他单词作为关联单词来提示的关联词语提示装置。
背景技术
以往,存在从用户取得检索单词(检索条件),并从电视节目的一览表中检索与此检索单词相对应的节目的节目检索装置。
进而,提出了对用户提示与以前输入的检索单词相关联的多个关联单词,以便通过用户反复输入检索单词,从而能够检索所要的文章(节目)的关联词语提示装置(例如,参考专利文献1)。
用户通过从此关联词语提示装置所提示的多个关联单词中选择一个作为新的检索单词的关联单词,并将其输入到节目检索装置中,从而能够进行依据多个检索单词的节目的筛选检索或防止遗漏检索。
即,节目检索装置检索与用户输入的检索单词相对应的节目,从而将多个节目作为检索结果来提示。在此,在节目检索装置检索进行筛选检索的情况下,若用户输入下一个检索单词,则从作为针对以前输入的检索单词的检索结果的多个节目之中,检索并显示与下一个检索单词相对应的节目。另一方面,在节目检索装置进行防止遗漏检索的情况下,若用户输入下一个检索单词,则提示与下一个检索单词对应的多个节目和与以前的检索单词对应的多个节目之间的逻辑和。
上述专利文献1的关联词语提示装置在针对用户输入的检索单词的检索结果数量少的情况下,以防止遗漏检索为目的(防止遗漏检索的目的),提示成为下一个检索单词的候选的关联单词。
因此,例如,在从专利文献1的关联词语提示装置所提示的多个关联单词中,将一个关联单词作为下一个检索单词来选择的情况下,节目检索装置对此检索单词与以前的检索单词进行逻辑和连接并进行再次检索。在此,因为向用户提示的关联单词与用户输入的检索单词的关联性强,所以用户能够从最初取得的检索结果开始逐渐增加检索结果。
专利文献1:(日本)特开平10-334106号公报
但是,上述专利文献1的关联词语提示装置存在不能够使节目检索装置进行适当的防止遗漏检索的问题。
即,因为在以往的关联词语提示装置中根据节目内的共现关系,与检索单词有较强关联的关联单词被提示,所以即使节目检索装置利用这样的关联单词执行再次检索(防止遗漏检索),也会显示与以前的检索结果相差小的检索结果。即,在以往的关联词语提示装置中,即使在用户想要取得与由节目检索装置取得的检索结果不同的检索结果的情况下,也不能提示能够取得这样的检索结果的关联单词。
作为节目的一览表的节目信息按每个节目显示作为元数据的此节目的名称、出场演员的名字以及节目梗概等。以往的关联词语提示装置将每个节目的元数据作为一篇文章来使用,并使在节目(元数据)中共现的单词彼此相关联,利用相互信息量等算出这些单词彼此之间的关联度。
例如,如果单词A和单词B在同一节目中经常共现,则算出的单词A和单词B的关联度就大。而且,虽然在出现单词A的节目中经常出现单词B,但是如果单词B在不出现单词A的节目中经常出现,则算出的单词A和单词B的关联度小。即,关联度大的单词是彼此在节目中经常共现的单词。
图1是表示由以往的关联词语提示装置提示的关联词语的图。
例如,以往的关联词语提示装置针对检索单词“体育运动”提示排在前十位的关联度大的关联单词。这些关联度大的关联单词是,与检索单词“体育运动”在新闻节目或体育运动节目中经常共现的单词。
但是,因为在这些关联单词中,根据节目内的共现关系针对检索单词“体育运动”被算出大的关联度,所以出现检索单词“体育运动”的节目和出现关联单词的节目会有许多是重复的。例如,以关联单词“气象”而能够检索的节目的数量为44个,其中,以关联单词“体育运动”而能够检索的节目的数量为41个。因此,即使节目检索装置以检索单词“体育运动”来检索节目,进而使用关联单词“气象”来作为下一个检索单词以进行防止遗漏检索,以前的检索结果和此后的检索结果几乎没有变化,只有三个不同节目。
这样,在图1所示的十个关联单词之中的一半以上(在此例中为六个)的关联单词的每一个,以此关联单词能够检索的节目之中一半以上的节目与以检索单词“体育运动”能够检索的节目相重复。
即,在以往的关联词语提示装置中,即使为了防备用户不满意依据检索单词的检索结果,而向用户提示与此检索单词关联度大的关联单词,成为依据此关联单词的再次检索的检索结果与依据原来的检索单词的检索结果没有什么差异的情况的频度也会很多。
在此,在如此的以往的关联词语提示装置中,设想事先制作表示各个单词间的关联度的联想词典。即,关联词语提示装置包括制作表示各个单词间的关联度的词典的联想词典制作装置。
但是,如上所述,因为如此的以往的关联词语提示装置中的联想词典制作装置是根据节目内的共现关系计算出单词间的关联度,从而制作联想词典,所以不能使节目检索装置进行适当的防止遗漏检索。
发明内容
在此,本发明就是鉴于如此的问题而做出的发明,其目的在于,提供一种能够使节目检索装置进行适当的防止遗漏检索的关联词语提示装置。
为了达到上述目的,本发明所涉及的关联词语提示装置是一种关联词语提示装置,制作多个联想词典,所述联想词典包括多个单词和所述多个单词间的关联度,该关联词语提示装置具有以下特征:节目信息记忆单元,将作为由多个单词表示的节目内容的信息的节目信息,按每个所述节目进行记忆;分类单元,生成以基准单词和在节目内所共现的单词的集合为单位而组成的至少一个以上的小组,所述基准单词是指属于所述节目信息中包含的单词的属性的单词,所述至少一个以上的小组是按每个所述单词的属性而生成的;存储单元,在词典记忆单元中存储按每个所述属性的联想词典,该按每个所述属性的联想词典包括按每个所述单词的属性的各个小组中的两个单词间的关联度和所述两个单词,所述两个单词间的关联度按照所述两个单词所共现的频度而被算出;取得单元,取得检索单词和所述检索单词的属性;第一关联单词选择单元,将按每个所述属性的联想词典之中的、与所述取得单元所取得的属性相对应的所述联想词典之中的单词,作为第一关联单词进行选择;以及提示单元,提示所述第一关联单词选择单元所选择的所述第一关联单词。在此,在由所述存储单元存储的联想词典中,按每个属性,两个单词和所述两个单词间的关联度具有固有的关联性。
而且,所述关联词语提示装置也可以具有以下特征,还包括:第一关联度计算单元,按每个所述单词的属性,计算按照在所述分类单元所生成的各个小组中两个单词所共现的频度的、所述两个单词间的关联度,并制作使所述两个单词和所述关联度相关联来表示的所述联想词典。并且,也可以具有以下特征,所述第一关联单词选择单元,从与所述取得单元所取得的属性相对应的所述联想词典中,将单词作为所述第一关联单词进行选择,以使针对由所述取得单元取得的检索单词的关联度越大的单词就越被优先选择。
因此,在本发明所涉及的关联词语提示装置中,例如按每个种类或人名等,节目信息中所包含的多个单词被分类在各个小组中,根据此小组内的共现关系而算出单词间的关联度并制作联想词典。在此,与一个属性相对应的各个小组按每个作为存在于节目信息内的属于此属性的单词的基准单词来构成,此小组是在节目信息中与基准单词在节目内共现的单词的集合。因此,在如此制作的按每个属性的联想词典中,不是像以往那样根据节目内的共现关系来计算单词间的关联度,而是如上所述的,根据小组内的共现关系来计算单词间的关联度。即,不是根据所谓节目的范围,而是根据与基准单词共现的单词的集合,也就是说,根据所谓具有共同的使用方法或意思的单词的集合的范围中的共现关系来计算关联度。
其结果为,例如,能够使出现在同一节目中且即使出现在不同的节目中也与相同的单词(基准单词)以多频度所共现的单词间的关联度比只在节目内共现的单词间的关联度大。进而,在不于节目内共现但与相同的单词(基准单词)共现的频度比在节目内的单词的共现频度多的情况下,能够使虽然出现在不同的节目中,但与形同的单词(基准单词)以多频度所共现的单词彼此之间的关联度比在节目内共现的单词彼此之间的关联度大。
因此,在本发明所涉及的关联词语提示装置中,因为从与检索单词的属性相对应的如上所述的联想词典中,与此检索单词的关联度大的单词作为第一关联单词(代替单词)被选择并提示,所以能够抑制包含检索单词的多个节目与包含第一关联单词的多个节目的重复。即,节目检索装置在检索与检索单词相对应的节目并显示检索结果后,将本发明所涉及的关联词语提示装置所提示的第一关联单词作为下一个检索单词来选择,并在施行防止遗漏检索的情况下,能够显示与以前的检索结果中所包含的节目不同的、具有适当的关联性的多个节目。
而且,所述关联词语提示装置也可以具有以下特征,还包括:第二关联度计算单元,计算按照在所述节目信息所表示的各个节目中两个单词所共现的频度的、所述两个单词间的关联度,并制作使所述两个单词和所述关联度相关联来表示的节目联想词典,将所述节目联想词典存储在所述词典记忆单元;以及第二关联单词选择单元,从所述词典记忆单元所记忆的节目联想词典中,将单词作为第二关联单词进行选择,以使针对由所述取得单元取得的检索单词的关联度越大的单词就越被优先选择,所述提示单元还提示由所述第二关联单词选择单元选择的所述第二关联单词。
因此,表示根据节目内的共现关系而算出的单词间的关联度的节目联想词典被制作,将与检索单词的关联度大的单词作为第二关联单词(筛选单词)从此节目联想词典中被选择并被提示。其结果为,节目检索装置在检索与检索单词相对应的节目并显示检索结果后,将本发明所涉及的关联词语提示装置所提示的第二关联单词作为下一个检索单词来选择,并在施行筛选检索的情况下,能够适当地筛选以前的检索结果。
并且,所述关联词语提示装置也可以具有以下特征,还包括:节目选择单元,从所述节目信息所表示的多个节目之中,确定由用户选择的多个节目,所述取得单元按照多个单词的出现频度,从所述多个单词之中取得一个作为所述检索单词的单词,所述多个单词是为了表示由所述节目选择单元确定的多个节目的内容,而被使用于所述节目信息中的多个单词。
因此,在用户选择多个节目的情况下,由于从此多个节目中推断检索单词,所以不需要用户直接输入检索单词就能够使第一关联单词被提示。即,即使用户想不起明确的检索单词,只要选择所注目的节目,就能够使第一关联单词被提示。
而且,所述第一关联单词选择单元也可以具有以下特征,仅将与由所述取得单元取得的检索单词的属性相同的属性的单词作为所述第一关联单词进行选择。
因此,能够只使属于用户所注目的属性的单词作为第一关联单词被提示,在多个第一关联单词被提示的情况下,用户能够从其中容易地选择下一个检索单词。
并且,所述第一关联单词选择单元也可以具有以下特征,在由所述取得单元取得检索单词之前的预先决定了的期间,在其他的检索单词及所述其他的检索单词的属性被取得的情况下,进一步,从与所述其他的检索单词的属性对应的联想词典选择作为第三关联单词的单词,以使针对所述其他的检索单词的关联度越大的单词就越被优先选择,所述提示单元还提示由所述第一关联单词选择单元选择的第三关联单词。
因此,由于不仅提示针对最近的检索单词的第一关联单词,还提示针对在此之前的过去的检索单词(其他的检索单词)的第三关联单词,所以用户能够容易地将针对注目程度高的检索单词的关联单词作为下一个检索单词进行选择。
而且,所述第二关联单词选择单元也可以具有以下特征,仅将与由所述取得单元取得的检索单词的属性不同属性的单词作为所述第二关联单词进行选择。
因此,因为只使与检索单词的属性不同属性的单词作为第二关联单词(筛选单词)被提示,所以通过用户将此第二关联单词作为下一个检索单词来选择,从而能够依据与以前的检索单词的观点不同的观点来进行筛选检索。而且,例如即使多个第二关联单词被提示,由于它们的属性全部与检索单词的属性不同,所以在用户要依据与检索单词的观点不同的观点进行筛选检索的情况下,能够从这些多个第二关联单词中容易地选择下一个检索单词。
并且,所述关联词语提示装置也可以具有以下特征,还包括:检索单元,从所述节目信息中检索使用所述取得单元所取得的检索单词来表示内容的节目,所述第一及第二关联单词选择单元分别选择多个第一及第二关联单词,所述提示单元,在由所述检索单元检索的节目的数量越多的情况下,与所述第一关联单词相比就越多地提示所述第二关联单词;在由所述检索单元检索的节目的数量越少的情况下,与所述第二关联单词相比就越多地提示所述第一关联单词。
因此,由于被检索的节目的数量越多,被提示的第二关联单词(筛选单词)就越多,所以在通过节目检索装置多个节目作为检索结果被显示的情况下,用户能够从这些被提示的多个第一及第二关联单词之中,容易地选择用于筛选检索结果的下一个检索单词。并且,因为被检索的节目的数量越少,被提示的第一关联单词(代替单词)就越多,所以在通过节目检索装置较少的节目作为检索结果被显示的情况下,用户能够从这些被提示的多个第一及第二关联单词之中,容易地选择用于扩大检索结果的下一个检索单词。即,用户能够根据检索结果的状况容易地选择适当的下一个检索单词。
另外,本发明不仅能够作为如此的关联词语提示装置来实现,还能够作为制作此装置中的词典的方法或提示关联词语的方法、使计算机执行依据这些方法的处理的程序、存储这些程序的计算机可读取的存储介质、以及集成电路来实现。
本发明的关联词语提示装置,为了使与包含检索单词的节目不同的多个节目被检索,提示与检索单词相关联的关联单词,从而取得能够使节目检索装置进行适当的防止遗漏检索的有益效果。
附图说明
图1是表示由以往的关联词语提示装置提示的关联词语的图。
图2是表示本发明的实施例所涉及的关联词语提示装置的构成的框图。
图3是表示同上的节目信息的一个例子的图。
图4是表示在与属于同上的属性“种类”的各个单词对应的小组中,各个节目的单词属性群被分类后的状态的图。
图5是表示在与属于同上的属性“人名”的各个单词对应的小组中,各个节目的单词属性群被分类后的状态的图。
图6是表示在与属于同上的属性“国名·场所”的各个单词对应的小组中,各个节目的单词属性群被分类后的状态的图。
图7是表示同上的按A属性区分的联想词典的一个例子的图。
图8是表示同上的按B属性区分的联想词典的一个例子的图。
图9是表示同上的按C属性区分的联想词典的一个例子的图。
图10是表示由同上的输出部提示的内容的图。
图11是表示同上的联想词典制作部的工作的流程图。
图12是表示同上的关联词语提示装置提示与用户输入的检索单词相关联的代替单词的工作的流程图。
图13是用于说明同上的效果的说明图。
图14是表示在与属于同上的属性“种类”的各个单词对应的小组中,各个节目的单词属性群被分类后的状态的其他的例子的图。
图15是表示同上的变形例1所涉及的关联词语提示装置的构成的框图。
图16是表示同上的变形例1所涉及的节目联想词典的一个例子的图。
图17是表示由同上的变形例1所涉及的输出部提示的内容的图。
图18是表示同上的变形例2所涉及的关联词语提示装置的构成的框图。
图19是表示同上的变形例2所涉及的节目选择部所显示的画面的图。
图20是表示同上的变形例3所涉及的关联词语提示装置的构成的框图。
图21是表示同上的变形例3所涉及的单词比率表的一个例子的图。
图22是表示同上的变形例3所涉及的单词比率表的其他的例子的图。
图23是表示同上的变形例3所涉及的单词比率表的另一个其他的例子的图。
图24是表示同上的关联词语提示装置的适用例的设备的外形的图。
附图标记说明
100、100a、100b、100c 关联词语提示装置
101 节目信息记忆部
101a 节目信息
102 联想词典记忆部
102a 按A属性区分的联想词典
102b 按B属性区分的联想词典
102c 按C属性区分的联想词典
102d 节目联想词典
103、113 联想词典制作部
103a 信息划分部
103b 关联度计算部
103c 节目联想词典制作部
104、104a 检索条件取得部
105 代替单词取得部
106、132 输出部
111 筛选单词取得部
121 节目选择部
131 检索部
133 表存储部
133a 单词比率表
具体实施方式
以下,参照附图对本发明的实施例中的关联词语提示装置进行说明。
图2是表示本发明的实施例所涉及的关联词语提示装置的构成的框图。
此关联词语提示装置100是为了使节目检索装置进行适当的防止遗漏检索,而提示与检索单词相关联的关联单词的装置,如图2所示,包括节目信息记忆部101、联想词典记忆部102、联想词典制作部103、检索条件取得部104、代替单词取得部105、以及输出部106。
节目信息记忆部101记忆表示多个节目的一览表的节目信息101a。
联想词典制作部103制作按属性区分的联想词典(按A属性区分的联想词典102a、按B属性区分的联想词典102b以及按C属性区分的联想词典102c),该按属性区分的联想词典按照节目信息101a所包含的单词的每一个属性,表示此节目信息101a所包含的多个单词及此多个单词间的关联度,并在联想词典记忆部102中存储这些按属性区分的联想词典。再者,分别将按A属性区分的联想词典102a、按B属性区分的联想词典102b以及按C属性区分的联想词典102c总称为按属性区分的联想词典。
并且,属性是指用于将各个单词进行分类的节目名称以外的信息,例如,包括:单词“完全”及“特别”等所属于的属性“形容表现”;单词“新闻”及“记实”等所属于的属性“种类”;单词“播音员”及“导演”等所属于的属性“职业”;单词“美国”及“伏见稻荷神社”等所属于的属性“国名·场所”;以及单词“松下次郎”及“松下太郎”等所属于的属性“人名”等。
此联想词典制作部103包括:信息划分部103a和关联度计算部103b。
信息划分部103a按照节目信息101a所包含的单词的每一个属性,将节目信息101a所包含的多个单词划分为多个小组。即,信息划分部103a按照节目信息101a所包含的单词的每一个属性,将与属于此属性的单词、即基准单词在节目内共现的单词的集合作为小组,按照此基准单词的每一个来生成。
关联度计算部103b按每个节目信息101a所包含的单词的属性,计算按照在信息划分部103a所生成的各个小组中两个单词所共现的频度的此两个单词间的关联度。而且,关联度计算部103b在各个单词间进行这样的关联度的计算,从而制作使这些单词与关联度相关联来表示的按属性区分的联想词典,并在联想词典记忆部102中存储此按属性区分的联想词典。
检索条件取得部104按照用户的输入操作,取得成为检索条件的单词(检索单词)和此单词的属性。例如,这样的检索条件取得部104由键盘和滑鼠、遥控器等输入装置构成。
代替单词取得部105将与由检索条件取得部104取得的检索单词相关联的单词,从联想词典记忆部102所保持的与此检索单词的属性对应的按属性区分的联想词典中作为代替单词(关联单词)来取得。
输出部106向用户提示由代替单词取得部105取得的代替单词。例如,这样的输出部106包含CRT显示器、液晶显示器(LCD)、等离子体显示器(PDP)等显示单元来构成。
再者,在本实施例中,联想词典制作装置由节目信息记忆部101和联想词典制作部103构成。并且,在本实施例中,信息划分部103a作为分类单元被构成,关联度计算部103b作为第一关联度计算单元以及存储单元被构成。进而,在本实施例中,联想词典记忆部102作为词典记忆单元被构成,检索条件取得部104作为取得单元被构成,代替单词取得部105作为选择代替单词(第一关联单词)的第一关联单词选择单元被构成,输出部106作为提示代替单词(第一关联单词)的提示单元被构成。
图3是表示节目信息101a的一个例子的图。
如图3所示,按每个节目,节目信息101a包括:作为用于识别节目的标识符的节目ID、表示节目内容的元数据、节目的元数据中包含的各个单词以及由其属性组成的单词属性群。
节目ID例如以“01,02,03,…”等被显示,并被分配给各个节目。
并且,元数据包括:作为播放节目的日期的播放日、作为节目的开始时间的播放开始时间、节目名称、节目所属的种类、作为在节目中出场的出场演员的名字的出场演员名字、说明节目的梗概的节目梗概。
例如,节目信息101a包括作为元数据的且与节目ID“01”对应的:播放日“2006/8/22”、播放开始时间“12:00”、节目名称“松下太郎时间”、种类“综艺”、出场演员名字“松下太郎、松下三郎”、节目梗概“松下太郎邀请日本知名人士作为嘉宾并进行访谈。”而且,节目信息101a包括作为元数据的且与节目ID“02”对应的:播放日“2006/8/22”、播放开始时间“13:00”、节目名称“午间日本列岛”、种类“信息”、出场演员名字“松下花子、松下次郎”、节目梗概“日本列岛各地的实况转播。”并且,节目信息101a包括作为元数据的且与节目ID“03”对应的:播放日“2006/8/23”、播放开始时间“16:00”、节目名称“托付松下次郎”、种类“综艺”、出场演员名字“松下次郎、松下四郎”、节目梗概“松下次郎回答观众的咨询。还有健康信息。”
进而,例如,节目信息101a包括与节目ID“01”对应的:单词属性群“松下太郎/人名、综艺/种类、松下三郎/人名、日本/国名·场所、嘉宾/职业、访谈/种类”。另外,如“(单词)/(属性)”那样,单词和此单词的属性以“/”来隔开表示。例如,在“松下太郎/人名”中,“松下太郎”为单词,“人名”为此单词“松下太郎”的属性。
而且,节目信息101a包括与节目ID“02”对应的:单词属性群“日本/国名·场所、日本列岛/国名·场所、信息/种类、松下花子/人名、松下次郎/人名”。并且,节目信息101a包括与节目ID“03”对应的:单词属性群“松下次郎/人名、综艺/种类、松下四郎/人名、咨询/种类、健康/种类、信息/种类、健康信息/种类”。
在此,例如,也可以通过利用固有表现抽取技术或词素分析技术等,从元数据中抽取单词属性群的单词及其属性,从而使其包含在如上所述的节目信息101a中。
联想词典制作部103的信息划分部103a按照此节目信息101a所示的每个单词的属性(种类和人名、国名·场所等),将节目信息101a中包含的各个节目(节目ID)的单词属性群分类给与属于此属性的各个单词(基准单词)对应的小组。即,信息划分部103a按每个属性,将属于此属性的单词(基准单词)和在节目(单词属性群)中共现的多个单词分类在一个小组中。
图4是表示在与属于属性“种类”的各个单词对应的小组中,各个节目的单词属性群被分类后的状态的图。
例如,由于节目ID“01”的单词属性群及节目ID“03”的单词属性群分别包含属于属性“种类”的单词“综艺”,因此信息划分部103a将这些单词属性群分类给与“综艺/种类”对应的小组1。并且,由于节目ID“01”的单词属性群包含属于属性“种类”的单词“访谈”,因此信息划分部103a将此单词属性群分类给与“访谈/种类”对应的小组2。进而,由于节目ID“02”的单词属性群包含属于属性“种类”的单词“信息”,因此信息划分部103a将此单词属性群分类给与“信息/种类”对应的小组3。
即,在属性“种类”中,信息划分部103a将在节目(单词属性群)内与属于此属性“种类”的基准单词“综艺”共现的多个单词分类给小组1;将与属于此属性“种类”的其他的基准单词“访谈”在节目(单词属性群)内共现的多个单词分类给小组2;将与属于此属性“种类”的其他的基准单词“信息”在节目(单词属性群)内共现的多个单词分类给小组3。
在此,在本实施例中,信息划分部103a在将单词属性群分类成小组的情况下,为了使同样的单词不会被分类在同样的小组中,将单词属性群中包含的多个单词分类成小组。例如,信息划分部103a在将节目ID“01”的单词属性群分类给小组1之后,再将节目ID“03”的单词属性群分类给小组1。此时,因为在节目ID“03”的单词属性群中所包含的多个单词之中,单词“综艺”已经被分类给小组1,所以信息划分部103a将除去节目ID“03”的单词属性群中所包含的多个单词之中的单词“综艺”后剩下的单词分类给小组1。
图5是表示在与属于属性“人名”的各个单词对应的小组中,各个节目的单词属性群被分类后的状态的图。
例如,由于节目ID“01”的单词属性群包含属于属性“人名”的单词“松下太郎”,因此信息划分部103a将此单词属性群分类给与“松下太郎/人名”对应的小组1。并且,由于节目ID“01”的单词属性群包含属于属性“人名”的单词“松下三郎”,因此信息划分部103a将将此单词属性群分类给与“松下三郎/人名”对应的小组2。进而,由于节目ID“02”的单词属性群及节目ID“03”的单词属性群分别包含属于属性“人名”的单词“松下次郎”,因此信息划分部103a将这些单词属性群分类给与“松下次郎/人名”对应的小组3。
即,在属性“人名”中,信息划分部103a将在节目(单词属性群)内与属于此属性“人名”的基准单词“松下太郎”共现的多个单词分类给小组1;将与属于此属性“人名”的其他的基准单词“松下三郎”在节目(单词属性群)内共现的多个单词分类给小组2;将与属于此属性“人名”的其他的基准单词“松下次郎”在节目(单词属性群)内共现的多个单词分类给小组3。
图6是表示在与属于属性“国名·场所”的各个单词对应的小组中,各个节目的单词属性群被分类后的状态的图。
例如,由于节目ID“01”的单词属性群及节目ID“02”的单词属性群分别包含属于属性“国名·场所”的单词“日本”,因此信息划分部103a将这些单词属性群分类给与“日本/国名·场所”对应的小组1。而且,由于节目ID“02”的单词属性群包含属于属性“国名·场所”的单词“日本列岛”,因此信息划分部103a将此单词属性群分类给与“日本列岛/国名·场所”对应的小组2。
即,在属性“国名·场所”中,信息划分部103a将在节目(单词属性群)内与属于此属性“国名·场所”的基准单词“日本”共现的多个单词分类给小组1;将与属于此属性“国名·场所”的其他的基准单词“日本列岛”在节目(单词属性群)内共现的多个单词分类给小组2。
以下,将根据这样的分类按照每个属性制作的多个小组称为按属性区分的小组群。
再者,在本实施例中,虽然信息划分部103a为了使同样的单词不会被多个分类在同样的小组中,将单词属性群中包含的多个单词分类成小组,但是也可以为同样的单词被多个分类在同样的小组中。在此情况下,信息划分部103a在将单词属性群分类成小组的情况下,不用确认已经被分类给此小组的单词,而将单词属性群中包含的全部的单词分类给这个小组。
联想词典制作部103的关联度计算部103b按照每个如上所述的按属性区分的小组群(属性),计算出此按属性区分的小组群中包含的各个单词间的关联度,从而制作与此按属性区分的小组群对应的按属性区分的联想词典。
即,关联度计算部103b在制作一个按属性区分的联想词典的情况下,按照按属性区分的小组群中包含的两个单词的每个组合来计算单词彼此之间的关联度。并且,关联度计算部103b按照每个这样的组合,制作使此组合中包含的两个单词与针对这些单词计算出的关联度相关联来表示的按属性区分的联想词典,并存储在联想词典记忆部102中。
例如,关联度计算部103b通过利用交互信息内容(MI),来算出各个单词间的关联度。具体而言,若关联度计算部103b设包含单词W1和单词W2双方的小组的数量为a,设不包含单词W1而包含单词W2的小组的数量为b,设包含单词W1而不包含单词W2的小组的数量为c,设不包含单词W1和单词W2双方的小组的数量为d,设总共的小组数量为N(=a+b+c+d),则根据MI=log2(aN/((a+b)(a+c))),将交互信息内容(MI)作为关联度算出。
再者,关联度计算部103b也可以通过交互信息内容(MI)以外的一般的方法,例如,可以根据Dice-coefficient(戴斯系数)、加权Dice-coefficient、t-score(t分值)、x平方值、或对数似然比等算出关联度。
在按属性区分的小组群中,单词W1和单词W2之间的关联度是单词W1和单词W2共现的小组越多,关联度就越大的值。而且,例如,多数包含单词W1的小组中也包含单词W2,但是,在多数不包含单词W1的小组中包含单词W2的情况下,此关联度变小。即,所谓单词间的关联度大是表示这些单词在多个小组中共现,它们的关联较强。
例如,关联度计算部103b算出如图4所示的、属性“种类”的按属性区分的小组群中包含的单词“松下太郎”与单词“松下三郎”之间的关联度,或算出单词“松下太郎”与单词“综艺”之间的关联度,以及单词“松下太郎”与单词“访谈”之间的关联度等。其结果为,关联度计算部103b制作表示属性“种类”的在按属性区分的小组群中各个单词间的关联度的按A属性区分的联想词典102a。
图7是表示按A属性区分的联想词典102a的一个例子的图。
按A属性区分的联想词典102a使与属性“种类”对应的按属性区分的小组群之中的多组单词彼此之间,例如,使参加节目演出的出场演员名字或种类等单词彼此之间相关联,并表示这些单词间的关联度。
具体而言,按A属性区分的联想词典102a表示出:单词W1“松下太郎”与单词W2“松下三郎”之间的关联度“0.5”;单词W1“松下太郎”与单词W2“综艺”之间的关联度“0.4”;单词W1“松下太郎”与单词W2“访谈”之间的关联度“0.5”等。
另外,按A属性区分的联想词典102a还表示出各个单词的属性。并且,在此按A属性区分的联想词典102a中,关联度被表示的两个单词是被包含在同一小组中的单词。
而且,关联度计算部103b算出,如图5所示的属性“人名”的按属性区分的小组群中包含的单词“松下花子”与单词“松下次郎”之间的关联度,或单词“松下花子”与单词“日本”之间的关联度,以及单词“松下花子”与单词“信息”之间的关联度等。其结果为,关联度计算部103b制作表示属性“人名”的按属性区分的小组群中的各个单词间的关联度的按B属性区分的联想词典102b。
图8是表示按B属性区分的联想词典102b的一个例子的图。
按B属性区分的联想词典102b使与属性“人名”对应的按属性区分的小组群之中的多组单词彼此之间,例如,使参加节目演出的出场演员名字或种类等单词彼此之间相关联,并表示这些单词间的关联度。
具体而言,按B属性区分的联想词典102b表示出:单词W1“松下花子”与单词W2“松下次郎”之间的关联度“0.5”;单词W1“松下花子”与单词W2“日本”之间的关联度“0.2”;单词W1“松下花子”与单词W2“信息”之间的关联度“0.6”等。
另外,按B属性区分的联想词典102b还表示出各个单词的属性。并且,在此按B属性区分的联想词典102b中,关联度被表示的两个单词是被包含在同一小组中的单词。
而且,关联度计算部103b算出如图6所示的、属性“国名·场所”的按属性区分的小组群中包含的单词“松下太郎”与单词“松下三郎”之间的关联度,或算出单词“松下太郎”与单词“综艺”之间的关联度,以及单词“松下太郎”与单词“访谈”之间的关联度等。其结果为,关联度计算部103b制作表示属性“国名·场所”的在按属性区分的小组群中各个单词间的关联度的按C属性区分的联想词典102c。
图9是表示按C属性区分的联想词典102c的一个例子的图。
按C属性区分的联想词典102c使与属性“国名·场所”对应的按属性区分的小组群之中的多组单词彼此之间,例如,使参加节目演出的出场演员名字或种类等单词彼此之间相关联,并表示这些单词间的关联度。
具体而言,按C属性区分的联想词典102c表示出:单词W1“松下太郎”与单词W2“松下三郎”之间的关联度“0.5”;单词W1“松下太郎”与单词W2“综艺”之间的关联度“0.4”;单词W1“松下太郎”与单词W2“访谈”之间的关联度“0.5”等。
另外,按C属性区分的联想词典102c还表示出各个单词的属性。并且,在此按C属性区分的联想词典102c中,关联度被表示的两个单词是被包含在同一小组中的单词。
而且,在本实施例中,虽然是针对属性“种类”、“人名”以及“国名·场所”,分别制作按属性区分的联想词典,但是也可以针对其他的属性制作按属性区分的联想词典。例如,也可以将职业棒球或足球等体育运动的“队名”或“体育运动名”、交响乐团等的“乐团名”、委员会或组织等的“委员会名”或“组织名”、播音员或棒球选手等职业的“职业名”、强烈或特价等的“修饰词”等作为属性,从而制作与这些属性对应的按属性区分的联想词典。并且,也可以将此属性进行细化,例如设电视剧等的“角色名”或“主人公”、“配角”等为属性,以取代属性“人名”,来制作针对此属性的按属性区分的联想词典。
代替单词取得部105从联想词典记忆部102检索并找出与由检索条件取得部104取得的属性对应的按属性区分的联想词典。进而,代替单词取得部105从此按属性区分的联想词典中检索并作为代替单词(关联单词)取得,由检索条件取得部104取得的与检索单词具有阈值以上的关联度的单词。即,代替单词取得部105从与由检索条件取得部104取得的属性对应的按属性区分的联想词典中,作为代替单词(关联单词)来选择单词,以使针对由检索条件取得部104取得的检索单词的关联度越大的单词就越被优先选择。并且,代替单词取得部105使输出部106提示此取得后的代替单词。
图10是表示由输出部106提示的内容的图。
例如,输出部106与节目检索装置相连接,以显示由此节目检索装置检索的节目,并显示上述代替单词。再者,节目检索装置从由节目信息记忆部101的节目信息101a表示的多个节目之中,检索与用户输入的检索单词对应的节目。
这样的输出部106显示,表示由节目检索装置检索的节目的一览表的检索结果画面106a和表示代替单词的代替单词显示画面106b。
例如,在代替单词显示画面106b显示作为代替单词及其属性的“松下次郎/人名”以及“松下四郎/人名”等。
图11是表示联想词典制作部103的工作的流程图。
信息划分部103a按每个属性,将节目信息101a的各个单词属性群分类为多个小组(步骤S100)。即,信息划分部103a按每个属性,将与节目信息记忆部101的节目信息101a中包含的单词属性群内的属于此属性的单词(基准单词)共现的多个单词,分类给与此属性及基准单词对应的小组。如果存在多个属于此属性的单词(基准单词),则会生成与此基准单词的数量相等数量的小组。其结果为,按照每个属性来生成上述的按属性区分的小组群。
例如,如图4所示,信息划分部103a在属于属性“种类”的基准单词“综艺”存在于节目信息101a的单词属性群中的情况下,将此基准单词“综艺”和在单词属性群内共现的单词“松下太郎、综艺、松下三郎等”分类给与“综艺/种类”对应的小组1。进而,信息划分部103a在属于属性“种类”的基准单词“综艺”以外,节目信息101a中还存在属于属性“种类”的单词(信息、咨询、健康、健康信息)的情况下,将这些单词作为基准单词,并将此基准单词和在单词属性群内共现的多个单词分类给与此基准单词对应的小组。并且,信息划分部103a在节目信息101a中存在其他的属于属性(人名、国名·场所等)的单词的情况下,也针对这些属性进行如上所述的分类。
其次,关联度计算部103b从由上述信息划分部103a分类时所利用的多个属性之中选择一个属性(按属性区分的小组群)(步骤S102),选择按属性区分的小组群中包含的一个单词W1(步骤S104),并且选择按属性区分的小组群中包含的另一个单词W2(步骤S106)。
并且,关联度计算部103b根据在步骤S102选择的属性(按属性区分的小组群),算出在步骤S104选择的单词W1与在步骤S106选择的单词W2之间的关联度(步骤S108)。此后,关联度计算部103b使单词W1、W2与关联度相关联,并写入与此属性对应的按属性区分的联想词典中(步骤S110)。
例如,关联度计算部103b从节目信息101a中包含的单词的属性(种类、人名、国名·场所等)选择属性“种类”,并参照此属性的按属性区分的小组群,从而算出单词W1“松下太郎/人名”和单词W2“综艺/种类”之间的关联度。其结果为,例如,(单词W1、单词W2、关联度)作为(松下太郎/人名、综艺/种类、0.4)被写入按A属性区分的联想词典102a中。
关联度计算部103b在步骤S110之后,判别在按属性区分的小组群中是否存在没有作为单词W2被选择的单词(步骤S112)。在此,关联度计算部103b在判别为存在没有被选择的单词的情况下(步骤S112的“是”),反复进行从S106开始的处理。即,关联度计算部103b将此没有被选择的单词作为新的单词W2来选择。
另一方面,关联度计算部103b在判别为不存在没有被选择的单词的情况下(步骤S112的“否”),进一步判别在按属性区分的小组群中是否存在没有作为单词W1被选择的单词(步骤S114)。在此,关联度计算部103b在判别为存在没有被选择的单词的情况下(步骤S114的“是”),反复进行从步骤S104开始的处理。即,关联度计算部103b将此没有被选择的单词作为新的单词W1来选择。
而且,关联度计算部103b在判别为不存在没有被选择的单词的情况下(步骤S114的“否”),则判断为针对在步骤S102被选择的属性的按属性区分的联想词典已经完成,并判别在用于根据信息划分部103a的分类的多个属性(按属性区分的小组群)之中,是否存在没有被选择的属性(步骤S116)。
关联度计算部103b在判别为存在没有被选择的属性的情况下(步骤S116的“是”),反复进行从步骤S102开始的处理。另一方面,关联度计算部103b在判别为不存在没有被选择的属性的情况下(步骤S116的“否”),则判断为所有的按属性区分的联想词典已经完成,并结束处理。
其次,关于根据本实施例的关联词语提示装置100从按属性区分的联想词典取得代替单词时的工作进行说明。
图12是表示关联词语提示装置100提示与用户输入的检索单词相关联的代替单词的工作的流程图。
首先,检索条件取得部104按照用户的输入操作,取得检索单词和此检索单词的属性并输出到代替单词取得部105(步骤S201)。代替单词取得部105从与此属性对应的按属性区分的联想词典中,作为代替单词(关联单词),取得以阈值以上的关联度与此检索单词相关联的单词(步骤S202)。
例如,检索条件取得部104作为检索单词/属性,取得“松下花子/人名”。在此,联想词典记忆部102中存储有如图7-图9所示的按属性区分的联想词典。在此情况下,代替单词取得部105从与此属性“人名”对应的按B属性区分的联想词典102b中,作为代替单词,取得以阈值(例如0.5)以上的关联度与此检索单词“松下花子”相关联的单词“松下次郎”、“松下四郎”以及“信息”。
另外,代替单词取得部105可以不将以阈值以上的关联度与检索单词相关联的单词作为代替单词取得,而可以从与检索单词相关联的关联度大的单词开始,依次取得作为代替单词的、预先决定了的数量的单词。而且,虽然代替单词取得部105是从与检索条件取得部104所取得的属性对应的按属性区分的联想词典中取得代替单词,但是也可以从所有的按属性区分的联想词典中取得代替单词。
其次,输出部106向用户提示由代替单词取得部105取得的代替单词(步骤S203)。例如,输出部106向用户提示由代替单词取得部105取得的代替单词“松下次郎”、“松下四郎”以及“信息”。另外,输出部106在向用户提示代替单词的同时还提示此代替单词的属性。
如上所示,在本实施例中,按照每个节目信息101a的各个元数据中包含的单词,将属于此属性的多个单词分别作为基准单词,并设定与这些基准单词对应的小组,从而将节目信息101a的各个元数据中包含的多个单词分类给这些小组。并且,在本实施例中,按每个属性来计算在各个小组共现的单词彼此之间的关联度。因此,与只在节目内共现的单词间的相关联的关联度相比,能够使出现在同一节目中,且虽然出现在不同的节目中但由于与相同的单词(基准单词)共现而被相关联的单词间的关联度的一方的关联性更强。进而,即使只在节目内共现的单词但在彼此的出现频度低的情况下,虽然不在节目内共现但在相同的小组内共现多的单词彼此之间的关联度,比这些单词彼此之间的关联度的关联性更强。
其结果为,若节目检索装置在使用检索单词进行检索之后,使用由本实施例中的关联词语提示装置100提示的代替词语执行再次检索(防止遗漏检索),则此节目检索装置能够适当地显示抑制了与以前的检索结果(节目的一览表)的重复的、用户所关心的检索结果。
图13是用于说明本实施例的效果的说明图。
例如,在本实施例中的联想词典制作部103将表示3个月的地波六个频道的约10,000个节目的一览表作为节目信息101a来使用,并利用此电子节目表制作按属性区分的联想词典。如图13所示,如此制作的按属性区分的联想词典针对作为单词及其属性的“体育运动/种类”,显示关联度大的排在前十位的十个单词及其属性。
换言之,关联词语提示装置100将“体育运动/种类”作为检索单词及其属性来取得,并如图13所示,将与此检索单词关联度大的排在前十位的十个单词作为代替单词来提示。
在此,因为在这些被提示的关联单词中,根据上述小组内的共现关系,针对检索单词“体育运动”而算出大的关联度,因此能够抑制以检索单词“体育运动”检索的节目和以代替单词检索的节目的重复。
例如,以代替单词“专集”检索的节目数量是124个,其中,与以单词“体育运动”检索的节目相重复的节目数量只有5个。
即,本实施例中的关联词语提示装置100能够向用户提示,在不同于与用户输入的检索条件(检索单词)对应的节目的节目中出现的、且在小组内与相同的确定的单词(基准单词)共现多的代替单词。并且,因为这样的代替单词与检索单词的使用方法相似,所以也与检索单词的意思相似。
因此,在节目检索装置以检索单词“体育运动”检索节目,并且还以代替单词“专集”进行防止遗漏检索的情况下,能够显示以前的检索结果未包含的多个新的节目(119个节目)。
即,若节目检索装置利用由关联词语提示装置100提示的关联词语进行防止遗漏检索,就能够显示抑制了与以前的检索结果的重复的新的检索结果,并能够进行适当的防止遗漏检索。
再者,在信息划分部103a按每个属性,将属于此属性的单词(基准单词)和在节目(单词属性群)内共现的多个单词分类在一个小组中的情况下,也可以使此基准单词不包含在小组中。
图4是表示在与属于属性“种类”的各个单词对应的小组中,各个节目的单词属性群被分类后的状态的图。
例如,由于节目ID“01”的单词属性群及节目ID“03”的单词属性群分别包含属于属性“种类”1的单词“综艺”,因此信息划分部103a将这些单词属性群分类给与“综艺/种类”对应的小组1。并且,由于节目ID“01”的单词属性群包含属于属性“种类”的单词“访谈”,因此信息划分部103a将将此单词属性群分类给与“访谈/种类”对应的小组2。进而,由于节目ID“02”的单词属性群及节目ID“03”的单词属性群分别包含属于属性“种类”的单词“信息”,因此信息划分部103a将这些单词属性群分类给与“信息/种类”对应的小组3。
在此,如上所述,信息划分部103a在将单词属性群分类给小组之时,从单词属性群中除去此小组的基准单词,再将被除去了基准单词的单词属性群分类给此小组。例如,信息划分部103a在将节目ID“01”的单词属性群及节目ID“03”的单词属性群分类给小组1之时,从这些单词属性群中除去小组1的基准单词“综艺”;在将节目ID“01”的单词属性群分类给小组2之时,从此单词属性群中除去小组2的基准单词“访谈”;在将节目ID“02”的单词属性群及节目ID“03”的单词属性群分类给小组3之时,从这些单词属性群中除去小组3的基准单词“信息”。
如此,通过将被除去了基准单词的单词属性群分类给小组,能够减少直接共现的单词的共现次数,其结果为,能够使出现在不同的节目中的、与相同的单词(基准单词)共现的单词彼此具有更强的关联性。
(变形例1)
在此,对本实施例中的第一变形例进行说明。
本变形例所涉及的关联词语提示装置不仅提示用于防止遗漏的关联单词(代替单词),还提示用于筛选的关联单词(筛选单词)。总之,本变形例所涉及的联想词典制作部不仅制作用于代替单词的按属性区分的联想词典,还制作用于筛选单词的节目联想词典。
图15是表示本变形例所涉及的关联词语提示装置的构成的框图。
本变形例所涉及的关联词语提示装置100a包括:节目信息记忆部101、联想词典制作部113、联想词典记忆部102、检索条件取得部104、筛选单词取得部111、代替单词取得部105、输出部106。
即,本变形例所涉及的关联词语提示装置100a与上述实施例中的关联词语提示装置100相比,具备联想词典制作部113以取代联想词典制作部103,进而,还具备筛选单词取得部111。而且,本变形例所涉及的联想词典记忆部102在按属性区分的联想词典(按A属性区分的联想词典102a、按B属性区分的联想词典102b、按C属性区分的联想词典102c)以外,还存储有用于筛选单词的节目联想词典102d。
联想词典制作部113与上述实施例中的联想词典制作部103同样,具备信息划分部103a及关联度计算部103b,并且,还具备节目联想词典制作部103c。
节目联想词典制作部103c利用节目信息记忆部101的节目信息101a中包含的以每个节目为单位的元数据,按照各个节目的元数据中包含的两个单词的每一组合计算出单词彼此之间的关联度。并且,节目联想词典制作部103c按照每个组合,制作使此组合所包含的两个单词和针对这些单词计算出的关联度相关联来表示的节目联想词典102d,并存储在联想词典记忆部102。
即,本变形例所涉及的节目联想词典制作部103c将节目信息101a中包含的各个元数据如上述一个按属性区分的小组群中所包含的小组一样使用,以与关联度计算部103b同样的方法(交互信息内容等)计算出各个单词间的关联度。
筛选单词取得部111从节目联想词典102d取得作为筛选单词的、与由检索条件取得部104取得的检索单词以阈值以上的关联度相关联的单词。并且,输出部106向用户提示,由代替单词取得部105取得的代替单词和由筛选单词取得部111取得的筛选单词。
图16是表示节目联想词典102d的一个例子的图。
例如如图16所示,节目联想词典102d使在同一节目中出现的单词彼此之间相关联来表示。具体而言,节目联想词典102d表示出:单词W1“信息”与单词W2“松下次郎”之间的关联度“0.6”;单词W1“松下花子”与单词W2“日本”之间的关联度“0.2”;单词W1“松下花子”与单词W2“松下次郎”之间的关联度“0.8”等。另外,节目联想词典102d还表示出各个单词的属性。
例如,筛选单词取得部111在由检索条件取得部104取得作为检索单词及其属性的“松下花子/人名”的情况下,从节目联想词典102d取得作为筛选单词的、与此检索单词以阈值(例如为0.6)以上的关联度相关联的单词“信息”及“松下次郎”。输出部106向用户提示在筛选单词取得部111取得的筛选单词“信息”及“松下次郎”。另外,输出部106在向用户提示筛选单词的同时还可以提示此筛选单词的属性。
图17是表示由输出部106提示的内容的图。
例如,输出部106与节目检索装置相连接,以显示由此节目检索装置检索的节目,并显示上述代替单词及筛选单词。再者,节目检索装置从由节目信息记忆部101的节目信息101a表示的多个节目之中,检索与用户输入的检索单词对应的节目。
这样的输出部106显示,表示由节目检索装置检索的节目的一览表的检索结果画面106a,表示筛选单词的筛选单词显示画面106c,以及表示代替单词的代替单词显示画面106b。
例如,在筛选单词显示画面106c,作为筛选单词及其属性,显示“松下次郎/人名”及“信息/种类”。而且,在代替单词显示画面106b,作为代替单词及其属性,显示“松下四郎/人名”及“信息/种类”。
节目检索装置在此代替单词显示画面106b所显示的任一代替单词被选择的情况下,执行利用此代替单词的节目的防止遗漏检索;在筛选单词显示画面106c所显示的任一筛选单词被选择的情况下,执行利用此筛选单词的节目的筛选检索。
如此,在本变形例中,作为第二关联度计算单元被构成的节目联想词典制作部103c按照在由节目信息101a所示的各个节目中两个单词共现的频度,算出此两个单词间的关联度,从而制作使此两个单词和关联度相关联来表示的节目联想词典102d,并将此节目联想词典102d存储在联想词典记忆部102。并且,在本变形例中,作为第二关联度计算单元被构成的筛选单词取得部111从联想词典记忆部102中记忆的节目联想词典102d中将单词作为筛选单词(第二关联单词)进行选择,以使针对由检索条件取得部104取得的检索单词的关联度越大的单词,就越被优先选择。
因此,在本变形例中,制作了针对多个节目的分别共现的单词表示关联度大的节目联想词典102d,针对检索单词的关联度大的单词作为筛选单词从节目联想词典102d中被抽取并显示。
其结果为,如果节目检索装置利用本变形例所涉及的关联词语提示装置100a,就能够筛选针对检索条件(检索单词)而得到的检索结果(节目的一览表)。并且,因为关联词语提示装置100a所提示的筛选单词是与检索单词在多个节目中共现的关联性强的单词,所以能够逐渐对检索结果进行筛选,从而能够防止检索结果骤然减少。
另外,筛选单词取得部111可以不将以阈值以上的关联度与检索单词相关联的单词作为筛选单词取得,而可以从与检索单词相关联的关联度大的单词开始,依次取得作为筛选单词的、预先决定了的数量的单词。
同时,虽然输出部106向用户提示了筛选单词和代替单词双方的单词,但是也可以只向用户提示依据用户的操作的任一方。
(变形例2)
在此,对本实施例中的第二变形例进行说明。
本变形例所涉及的关联词语提示装置不是直接从用户取得检索单词和其属性,而是根据用户所选择的节目来推断检索单词和其属性。
图18是表示本变形例所涉及的关联词语提示装置的构成的框图。
本变形例所涉及的关联词语提示装置100b包括:节目信息记忆部101、联想词典制作部103、联想词典记忆部102、节目选择部121、检索条件取得部104a、代替单词取得部105、输出部106。
即,本变形例所涉及的关联词语提示装置100b与上述实施例中的关联词语提示装置100相比,具备检索条件取得部104a以取代检索条件取得部104,进而,还具备节目选择部121。
节目选择部121显示由节目信息记忆部101的节目信息101a表示的节目的一览表。节目选择部121在用户从此一览表中选择任一节目的情况下,将此被选择的节目的节目ID输出到检索条件取得部104a。
检索条件取得部104a从节目选择部121取得节目ID,并从节目信息记忆部101的节目信息101a中取出与此节目ID相对应的单词属性群。并且,检索条件取得部104a从此取出的单词属性群中,推断适于用户的检索单词和其属性。
例如,检索条件取得部104a取得多个节目ID,在从节目信息101a中取出了多个单词属性群的情况下,将这些多个单词属性群所包含的最多的单词和其属性作为适于用户的检索单词和其属性来推断。
图19是表示节目选择部121所显示的画面的图。
节目选择部121显示例如如图19所示的、节目信息记忆部101的节目信息101a所表示的节目的一览表。
具体而言,节目选择部121按照每个由节目信息101a表示的元数据的种类(综艺等),一并显示多个节目(播放日、节目名称、节目梗概等)。而且,若节目信息101a中包含各个节目的缩略图,则节目选择部121也显示此缩略图。并且,节目选择部121针对此一览表的各个节目,为了使用户能够选择节目,而附加复选框CB来显示。进而,节目选择部121显示用于使针对检索条件取得部104a的检索单词的推断开始的开始按钮SB。
若看到这样的节目选择部121的画面的用户,从此一览表中发现所瞩目的节目,则操作节目选择部121,并选择附加给此节目的复选框CB,从而使此复选框CB中显示勾选标记。并且,用户选择开始按钮SB。
其结果为,节目选择部121将与在复选框CB内显示着勾选标记的节目相对应的节目ID,例如节目ID“01”以及“10”输出到检索条件取得部104a。
如上所述,检索条件取得部104a取得从节目选择部121输出的节目ID“01”以及“10”。并且,检索条件取得部104a从节目信息记忆部101取得,与节目ID“01”对应的单词属性群“松下太郎/人名、综艺/种类、松下三郎/人名、日本/国名·场所、嘉宾/职业、访谈/种类”,和与节目ID“10”对应的单词属性群“松下太郎/人名、综艺/种类、世界/国名·场所”。
在检索条件取得部104a取得这样的两个单词属性群的情况下,例如,将作为在这些单词属性群之中包含最多的单词和其属性的“松下太郎/人名”或者“综艺/种类”,作为适于用户的检索单词和其属性来推断。
如此,在本变形例中,节目选择部121从节目信息101a所显示的多个节目之中,确定用户所选择的多个节目,检索条件取得部104按照多个单词的出现频度,从这些多个单词之中取得一个作为检索单词的单词,并确定此检索单词的属性,该多个单词是为了表示节目选择部121所确定的多个节目的内容而在节目信息101a中被使用的多个单词。
因此,在本变形例中,因为根据用户所选择的节目来推断检索单词及其属性,所以用户不用输入检索单词,而是通过选择用户所注目的节目,就能够使与此节目相关联的代替单词被提示。
再者,在本变形例中,虽然是检索条件取得部104a根据用户从节目信息101a所表示的多个节目之中选择的节目来推断检索单词,但是也可以是根据用户从依据节目检索装置的检索结果所包含的多个节目之中选择的节目,来推断检索单词。
例如,节目检索装置将如图19所示的节目的一览表作为检索结果,使输出部106显示。并且,若用户选择此一览表中显示的若干复选框,则输出部106从节目信息101a中取得与这些被选择的若干复选框对应的节目的节目ID,并输出到检索条件取得部104a。与上述同样,检索条件取得部104a利用这些节目ID和节目信息101a来推断检索单词。
(变形例3)
在此,对本实施例中的第三变形例进行说明。
本变形例所涉及的关联词语提示装置与变形例1的关联词语提示装置100a同样,提示筛选单词及代替单词,并按照依据检索条件来检索的节目的数量,而使被提示的筛选单词的数量和代替单词的数量的比率(单词比率)变化。
图20是表示本变形例所涉及的关联词语提示装置的构成的框图。
本变形例所涉及的关联词语提示装置100c包括:节目信息记忆部101、联想词典制作部113、联想词典记忆部102、检索条件取得部104、筛选单词取得部111、代替单词取得部105、检索部131、表存储部133、以及输出部132。
即,本变形例所涉及的关联词语提示装置100c与变形例1所涉及的关联词语提示装置100a相比,具备输出部132以取代输出部106,进而,还具备检索部131及表存储部133。
检索部131从节目信息记忆部101的节目信息101a中检索,由检索条件取得部104取得的检索单词被包含在单词属性群中的节目,并向输出部132输出被检索出的节目的数量。
表存储部133存储有单词比率表133a。此单词比率表133a将按照检索部131所检索的节目的数量的、应该向用户提示的筛选单词的数量(筛选单词数)和代替单词的数量(代替单词数)之间的比率作为单词比率来表示。
即,此单词比率表133a表示,在检索部131所检索的节目的数量多的情况下,向用户提示的筛选单词的数量应该比代替单词的数量多,相反,在检索部131所检索的节目的数量少的情况下,向用户提示的筛选单词的数量应该比代替单词的数量少。
输出部132取得从筛选单词取得部111及代替单词取得部105输出的多个筛选单词及代替单词,和从检索部131输出的节目的数量,以及表存储部133所存储的单词比率表133a。
并且,输出部132根据单词比率表133a,来确定按照从检索部131输出的节目的数量的单词比率。输出部132从由筛选单词取得部111及代替单词取得部105输出的多个筛选单词及代替单词之中,以从关联度大的开始的顺序,选择并显示筛选单词和代替单词,以便符合如上所述的所确定的单词比率。
图21是表示单词比率表133a的一个例子的图。
例如,如图21所示,单词比率表133a使检索部131所检索的节目的数量(检索结果数)和单词比率相关联来表示。
具体而言,若检索结果数为1000以上,则单词比率表133a表示单词比率“筛选单词数∶代替单词数=8∶2”;若检索结果数为500以上且不足1000,则表示单词比率“筛选单词数∶代替单词数=6∶4”。并且,若检索结果数为50以上且不足500,则单词比率表133a表示单词比率“筛选单词数∶代替单词数=4∶6”;若检索结果不足50,则表示单词比率“筛选单词数∶代替单词数=2∶8”。
例如,在检索部131将“小品/种类”作为从检索条件取得部104输出的检索单词及其属性来取得的情况下,从节目信息记忆部101中检索存在此“小品/种类”的节目。此时,若检索部131找到2000个节目,则将作为此节目的数量的检索结果数“2000”输出到输出部132。
输出部132在从检索部131取得检索结果数“2000”的情况下,根据单词比率表133a确定与检索结果数“2000”相对应的单词比率“8∶2”。
其结果为,输出部132从由筛选单词取得部111及代替单词取得部105所分别输出的多个筛选单词及代替单词之中,从关联度大的筛选单词和代替单词开始依次选择并显示,以便符合此被确定的单词比率“8∶2”。
再者,在上述例子中,虽然是单词比率表133a使检索结果数和单词比率相关联来显示,但是也可以以相对于全部节目数的检索结果数的比例代替检索结果数来显示。
图22是表示单词比率表133a的其他的例子的图。
此图22所示的单词比率表133a表示相对于全部节目数的检索结果数的比例和单词比率。在此,全部节目数是指节目信息记忆部101的节目信息101a所表示的全部的节目的数量。
例如,若相对于全部节目数的检索结果数的比例为0.75以上且不足1.0,则单词比率表133a表示单词比率“筛选单词数∶代替单词数=8∶2”;若相对于全部节目数的检索结果数的比例为0.5以上且不足0.75,则表示单词比率“筛选单词数∶代替单词数=6∶4”。
并且,在上述例子中,所然是单词比率表133a使检索结果数和单词比率相关联来显示,但是也可以以筛选单词数及代替单词数代替单词比率来显示。
图23是表示单词比率表133a的其他的例子的图。
此图23所示的单词比率表133a表示检索结果数和筛选单词数,以及代替单词数。
例如,若检索结果数为1000以上,则单词比率表133a表示筛选单词数为8以下且代替单词数为2以下;若检索结果数为500以上且不足1000,则表示筛选单词数为6以下且代替单词数为4以下。
这样,本变形例中,因为在检索结果数多的情况下,被表示的筛选单词比代替单词多,所以针对用户能够容易选择适当的筛选单词。其结果为,在节目检索装置中,通过选择筛选单词,来利用检索单词和筛选单词执行筛选检索,从而能够减少作为检索结果的节目的数量。而且,因为在检索结果数少的情况下,被表示的代替单词比筛选单词多,所以针对用户能够容易选择适当的代替单词。其结果为,在节目检索装置中,通过选择代替单词,来利用检索单词和代替单词执行防止遗漏检索,从而能够增加作为检索结果的节目的数量。总之,在本变形例中,能够提示符合用户的检索行为的关联单词(筛选单词或者代替单词)。
以上,关于本发明所涉及的关联词语提示装置,使用上述实施例及其变形例进行了说明,但是,本发明不仅限于此。
例如,在上述实施例及其变形例中,代替单词取得部105在由检索条件取得部104取得检索单词及其属性的情况下,从与此检索单词的属性相对应的按属性区分的联想词典中,取得作为代替单词的以阈值以上的关联度与检索单词相关联的单词。但是,代替单词取得部105也可以从此属性区分的联想词典中,只取得作为代替单词的、以阈值以上的关联度与检索单词相关联且与检索单词的属性相同的单词。
例如,代替单词取得部105在由检索条件取得部104作为检索单词及其属性取得“松下花子/人名”的情况下,从与此属性“人名”对应的如图8所示的按B属性区分的联想词典102b中,将以阈值(例如0.6)以上的关联度与检索单词“松下花子”相关联的、且与检索单词“松下花子”的属性“人名”相同的属性“人名”的单词作为代替单词来取得。
因此,能够只取得属于用户所注目的属性的单词来作为代替单词,进而,因为代替单词与检索单词属于相同的属性,所以能够容易地判断被提示的代替单词是否适合作为下一个检索单词。
例如,在用户想要以节目的出场演员名字来检索节目时,存在将“松下六郎/人名”输入节目检索装置中,用户不满意针对此输入的检索结果的情况。象这样的情况,即使属于与此检索单词的属性“人名”不同属性“国名·场所”的单词“世界”或,属于属性“种类”的单词“智力测验”被作为代替单词提示,由于被提示的代替单词的属性与用户想要输入的检索单词的属性“人名”不同,所以用户难以估计在将“世界”或“智力测验”作为下一个检索单词输入到节目检索装置的情况下,所取得的检索结果,其结果为,不容易选择被提示的代替单词。在此,如上所述,通过将属于与检索单词的属性“人名”相同的属性的单词“松下七郎”或“松下八郎”等作为代替单词来提示,用户能够容易地判断应该将哪个代替单词作为检索单词“松下六郎”的下一个检索单词来选择。
并且,在上述实施例及其变形例中,代替单词取得部105在由检索条件取得部104取得检索单词及其属性的情况下,从与此检索单词的属性相对应的按属性区分的联想词典中,取得作为代替单词的以阈值以上的关联度与检索单词相关联的单词。但是,代替单词取得部105还按每个过去的检索单词及其属性,从与此属性相对应的按属性区分的联想词典中,将以阈值以上的关联度阈此检索单词相关联的单词作为代替单词(第三关联单词)来取得,该过去的检索单词及其属性是在此检索单词及其属性被取得为止的预先规定的期间内被取得的。
在此情况下,关联词语提示装置具备用于对检索条件取得部104所取得的检索单词及其属性进行记忆的检索条件记忆部。检索条件取得部104每取得检索单词及其属性,就将其存储在此检索条件记忆部中,并在到该检索单词及其属性被存储为止的预先规定的期间之前,删除存储在此检索条件记忆部中的检索单词及其属性。
并且,如上所述,代替单词取得部105按每个存储在检索条件记忆部中的检索单词及其属性,从与此检索单词的属性对应的按属性区分的联想词典中,取得作为代替单词的、以阈值以上的关联度与此检索单词相关联的单词。
例如,检索条件取得部104作为检索单词及其属性取得“综艺/种类”,进而在此之后若取得“松下太郎/人名”,则将其存储在上述检索条件记忆部。并且,代替单词取得部105首先从与检索单词“综艺”的属性“种类”对应的按A属性区分的联想词典102a中,将以阈值以上的关联度与此检索单词“综艺”相关联的单词作为代替单词来取得,并从阈检索单词“松下太郎”的属性“人名”对应的按B属性区分的联想词典102b中,将以阈值以上的关联度与此检索单词“松下太郎”相关联的单词作为代替单词来取得。其结果为,输出部106显示从按A属性区分的联想词典102a取得的代替单词,和从按B属性区分的联想词典102b取得的代替单词。
因此,在用户对过去的检索单词的注目程度比最近输入的检索单词高,且不能满足于针对最近输入的检索单词的检索结果或代替单词的情况下,不用返回到针对注目程度高的过去的检索单词而提示代替单词的画面,就能够选择针对注目程度高的检索单词的代替单词。即,由于不仅提示针对最近的检索单词的代替单词,还提示针对在此之前的过去的检索单词的代替单词,所以用户能够容易地选择针对注目程度高的检索单词的代替单词。
再者,在上述的例子中,检索条件取得部104每取得检索单词及其属性,就将其存储在此检索条件记忆部中,并在到该检索单词及其属性被存储为止的预先规定的期间之前,删除了存储在此检索条件记忆部中的检索单词及其属性。但是,检索条件取得部104也可以根据FIFO(First-In First-Out:先进先出)来使用检索条件记忆部,在此检索条件记忆部中,按照被取得的顺序存储到预先规定的数量为止的所取得的检索单词及其属性。
而且,在变形例1及变形例3中,筛选单词取得部111从节目联想词典102d取得作为筛选单词的、与由检索条件取得部104取得的检索单词以阈值以上的关联度相关联的单词。但是,筛选单词取得部111也可以从节目联想词典102d中,只取得作为筛选单词的、以阈值以上的关联度与此检索单词相关联且与检索单词的属性不同的属性的单词。
例如,筛选单词取得部111在由检索条件取得部104取得检索单词“松下花子”及其属性“人名”的情况下,从图16所示的节目联想词典102d中,在以阈值(例如0.6)以上的关联度与此检索单词“松下花子”相关联的单词“信息”及其属性“种类”和单词“松下次郎”及其属性“人名”之中,将与检索单词的属性“人名”不同属性的单词“信息”作为筛选单词来取得。
因此,在根据节目检索装置的针对检索单词的检索结果数多的情况下,用户能够从关联词语提示装置所提示的筛选单词中容易地选择,能够以与此检索单词不同的观点(属性)来筛选检索结果的下一个检索单词。即,因为不会提示在概念上与检索单词对抗的筛选单词,所以用户能够从被提示的筛选单词中容易地选择用于筛选用户所估计的检索结果的下一个检索单词。
例如,用户想要视听“松下七郎”演出的节目,因而将作为检索单词及其属性的“松下七郎/人名”输入到节目检索装置中,其结果为,节目检索装置显示庞大数量的节目。
在这样的情况下,若作为筛选单词及其属性的“松下六郎/人名”或“松下八郎/人名”被提示,则因为被提示的筛选单词的属性“人名”与由用户输入的检索单词的属性“人名”相同,所以对用户而言,难以估计在将此筛选单词作为下一个检索单词来选择并执行筛选检索之时的检索结果。即,用户难以选择被提示的筛选单词。
然而,如上所述的,在属于与检索单词的属性不同属性的单词作为筛选单词被提示的情况下,与作为检索单词及其属性的“松下七郎/人名”有关联的、且属于与此属性“人名”不同属性“种类”的筛选单词“电视剧”或“综艺”,属于属性“国名·场所”的筛选单词“关西”等被提示。因此,因为与检索单词不同属性的筛选单词被提示,所以用户能够容易地估计在将被提示的筛选单词作为下一个检索单词来选择并执行筛选检索的情况下的检索结果,从而能够容易地选择筛选单词。
而且,在上述实施例及其变形例中,虽然是检索条件取得部104从用户直接取得检索单词,并且还直接取得此检索单词的属性,但是也可以是从用户只取得检索单词。在此情况下,检索条件取得部104按每个单词,保持表示此单词的属性的表。并且,检索条件取得部104在按照用户的输入操作取得检索单词的情况下,从表中检索与此检索单词相对应的属性,并将找到的属性和此检索单词输出到代替单词取得部105等。因此,能够节省用户的输入操作的时间。
本发明所涉及的关联词语提示装置能够将在与用户所输入的检索单词不同的节目中出现的、且与此检索单词的意思相似的单词作为关联单词向用户提示,能够适用于例如,如图24所示的,硬盘记录器或DVD记录器、TV、音频元件、能够上网视听节目的终端或提供服务的服务器装置等。

Claims (14)

1、一种关联词语提示装置,制作多个联想词典,所述联想词典包括多个单词和所述多个单词间的关联度,其特征在于,包括:
节目信息记忆单元,将节目信息按每个节目进行记忆,其中,该节目信息是由多个单词来表示所述节目的内容的信息;
分类单元,生成以基准单词和在节目内所共现的单词的集合为单位而组成的至少一个以上的小组,所述基准单词是指属于所述节目信息中包含的单词的属性的单词,所述至少一个以上的小组的生成是按每个所述单词的属性而进行的;
存储单元,在词典记忆单元中存储按每个所述属性的联想词典,该按每个所述属性的联想词典包括按每个所述单词的属性的各个小组中的两个单词间的关联度和所述两个单词,所述两个单词间的关联度按照所述两个单词所共现的频度而被算出;
取得单元,取得检索单词和所述检索单词的属性;
第一关联单词选择单元,将按每个所述属性的联想词典之中的、与所述取得单元所取得的属性相对应的所述联想词典之中的单词,作为第一关联单词进行选择;以及
提示单元,提示所述第一关联单词选择单元所选择的所述第一关联单词。
2、如权利要求1所述的关联词语提示装置,其特征在于,
在由所述存储单元存储的联想词典中,按每个属性,两个单词和所述两个单词间的关联度具有固有的关联性。
3、如权利要求1所述的关联词语提示装置,其特征在于,
所述分类单元从在所述小组中的节目内共现的单词之中,除去所述小组中的基准单词。
4、如权利要求1所述的关联词语提示装置,其特征在于,
所述关联词语提示装置还包括:
第一关联度计算单元,按每个所述单词的属性,计算按照在所述分类单元所生成的各个小组中两个单词所共现的频度的、所述两个单词间的关联度,并制作使所述两个单词和所述关联度相关联来表示的所述联想词典。
5、如权利要求4所述的关联词语提示装置,其特征在于,
所述第一关联单词选择单元,
从与所述取得单元所取得的属性相对应的所述联想词典中,将单词作为所述第一关联单词进行选择,以使针对由所述取得单元取得的检索单词的关联度越大的单词就越被优先选择。
6、如权利要求5所述的关联词语提示装置,其特征在于,
所述关联词语提示装置还包括:
第二关联度计算单元,计算按照在所述节目信息所表示的各个节目中两个单词所共现的频度的、所述两个单词间的关联度,并制作使所述两个单词和所述关联度相关联来表示的节目联想词典,将所述节目联想词典存储在所述词典记忆单元;以及
第二关联单词选择单元,从所述词典记忆单元所记忆的节目联想词典中,将单词作为第二关联单词进行选择,以使针对由所述取得单元取得的检索单词的关联度越大的单词就越被优先选择,
所述提示单元还提示由所述第二关联单词选择单元选择的所述第二关联单词。
7、如权利要求6所述的关联词语提示装置,其特征在于,
所述第二关联单词选择单元,
仅将与由所述取得单元取得的检索单词的属性不同属性的单词作为所述第二关联单词进行选择。
8、如权利要求6所述的关联词语提示装置,其特征在于,
所述关联词语提示装置还包括:
检索单元,从所述节目信息中检索使用所述取得单元所取得的检索单词来表示内容的节目,
所述第一及第二关联单词选择单元分别选择多个第一及第二关联单词,
所述提示单元,
在由所述检索单元检索的节目的数量越多的情况下,与所述第一关联单词相比就越多地提示所述第二关联单词;在由所述检索单元检索的节目的数量越少的情况下,与所述第二关联单词相比就越多地提示所述第一关联单词。
9、如权利要求5所述的关联词语提示装置,其特征在于,
所述取得单元按照用户的输入操作取得所述检索单词及所述检索单词的属性。
10、如权利要求5所述的关联词语提示装置,其特征在于,
所述关联词语提示装置还包括:
节目选择单元,从所述节目信息所表示的多个节目之中,确定由用户选择的多个节目,
所述取得单元按照多个单词的出现频度,从所述多个单词之中取得一个作为所述检索单词的单词,所述多个单词是为了表示由所述节目选择单元确定的多个节目的内容,而被使用于所述节目信息中的多个单词。
11、如权利要求5所述的关联词语提示装置,其特征在于,
所述第一关联单词选择单元,
仅将与由所述取得单元取得的检索单词的属性相同的属性的单词作为所述第一关联单词进行选择。
12、如权利要求5所述的关联词语提示装置,其特征在于,
所述第一关联单词选择单元,
在由所述取得单元取得检索单词之前的预先决定了的期间,在其他的检索单词及所述其他的检索单词的属性被取得的情况下,进一步,从与所述其他的检索单词的属性对应的联想词典选择作为第三关联单词的单词,以使针对所述其他的检索单词的关联度越大的单词就越被优先选择,
所述提示单元还提示由所述第一关联单词选择单元选择的第三关联单词。
13、一种关联词语提示方法,制作多个联想词典,并利用所述多个联想词典来提示与检索单词相关联的关联单词,所述联想词典包括多个单词和所述多个单词间的关联度,其特征在于,
使用节目信息记忆单元,所述节目信息记忆单元将节目信息按每个节目进行记忆,其中,该节目信息是由多个单词来表示所述节目的内容的信息;
所述关联词语提示方法包括:
分类步骤,生成以基准单词和在节目内所共现的单词的集合为单位而组成的至少一个以上的小组,所述基准单词是指属于所述节目信息中包含的单词的属性的单词,所述至少一个以上的小组的生成是按每个所述单词的属性而进行的;
存储步骤,在词典记忆单元中存储按每个所述属性的联想词典,该按每个所述属性的联想词典包括按每个所述单词的属性的各个小组中的两个单词间的关联度和所述两个单词,所述两个单词间的关联度按照所述两个单词所共现的频度而被算出;
取得步骤,取得检索单词和所述检索单词的属性;
关联单词选择步骤,将按每个所述属性的联想词典之中的、与在所述取得步骤取得的属性相对应的所述联想词典之中的单词,作为关联单词进行选择;以及
提示步骤,提示在所述关联单词选择步骤选择的所述关联单词。
14、一种程序,用于制作多个联想词典,并用于使用所述多个联想词典提示与检索单词相关联的关联单词,所述联想词典包括多个单词和所述多个单词间的关联度,其特征在于,
使用节目信息记忆单元,所述节目信息记忆单元将节目信息按每个节目进行记忆,,其中,该节目信息是由多个单词来表示所述节目的内容的信息;
所述程序使计算机执行以下步骤:
分类步骤,生成以基准单词和在节目内所共现的单词的集合为单位而组成的至少一个以上的小组,所述基准单词是指属于所述节目信息中包含的单词的属性的单词,所述至少一个以上的小组的生成是按每个所述单词的属性而进行的;
存储步骤,在词典记忆单元中存储按每个所述属性的联想词典,该按每个所述属性的联想词典包括按每个所述单词的属性的各个小组中的两个单词间的关联度和所述两个单词,所述两个单词间的关联度按照所述两个单词所共现的频度而被算出;
取得步骤,取得检索单词和所述检索单词的属性;
关联单词选择步骤,将按每个所述属性的联想词典之中的、与在所述取得步骤取得的属性相对应的所述联想词典之中的单词,作为关联单词进行选择;以及
提示步骤,提示在所述关联单词选择步骤选择的所述关联单词。
CNA2008800040001A 2007-08-03 2008-07-30 关联词语提示装置 Pending CN101601038A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP203588/2007 2007-08-03
JP2007203588 2007-08-03

Publications (1)

Publication Number Publication Date
CN101601038A true CN101601038A (zh) 2009-12-09

Family

ID=40341074

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008800040001A Pending CN101601038A (zh) 2007-08-03 2008-07-30 关联词语提示装置

Country Status (4)

Country Link
US (1) US8504357B2 (zh)
JP (1) JP4464463B2 (zh)
CN (1) CN101601038A (zh)
WO (1) WO2009019830A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102231147A (zh) * 2010-11-08 2011-11-02 百度在线网络技术(北京)有限公司 一种用于实时展现联想词的方法、设备及系统
CN102486784A (zh) * 2010-12-06 2012-06-06 耶宝智慧(北京)技术发展有限公司 信息请求方法和信息提供方法
CN103324646A (zh) * 2012-03-19 2013-09-25 株式会社东芝 检索支援装置及检索支援方法
CN104765834A (zh) * 2015-04-13 2015-07-08 天脉聚源(北京)传媒科技有限公司 一种信息搜索方法及装置
CN104765829A (zh) * 2015-04-13 2015-07-08 天脉聚源(北京)传媒科技有限公司 一种信息检索方法及装置
CN104765827A (zh) * 2015-04-13 2015-07-08 天脉聚源(北京)传媒科技有限公司 一种信息检索方法及装置
CN109902295A (zh) * 2019-02-01 2019-06-18 杭州晶一智能科技有限公司 一种基于网络信息的外语联想词库自训练方法
CN110582759A (zh) * 2017-06-06 2019-12-17 欧姆龙株式会社 得分计算单元、检索装置、得分计算方法和得分计算程序

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5018817B2 (ja) * 2009-03-27 2012-09-05 沖電気工業株式会社 情報処理装置、関連度計算方法、データ検索方法、及びプログラム
CN101887436B (zh) 2009-05-12 2013-08-21 阿里巴巴集团控股有限公司 一种检索方法和装置
JP2011018256A (ja) * 2009-07-10 2011-01-27 Aisin Aw Co Ltd 地点検索装置、地点検索方法及びプログラム
KR101789831B1 (ko) * 2010-12-24 2017-10-25 한국전자통신연구원 방송 컨텐츠 처리 장치 및 방법
US8626682B2 (en) * 2011-02-22 2014-01-07 Thomson Reuters Global Resources Automatic data cleaning for machine learning classifiers
US8473503B2 (en) * 2011-07-13 2013-06-25 Linkedin Corporation Method and system for semantic search against a document collection
JP5799733B2 (ja) * 2011-10-12 2015-10-28 富士通株式会社 認識装置、認識プログラムおよび認識方法
US9195647B1 (en) * 2012-08-11 2015-11-24 Guangsheng Zhang System, methods, and data structure for machine-learning of contextualized symbolic associations
JP5952343B2 (ja) * 2014-06-11 2016-07-13 ヤフー株式会社 検索装置、検索方法及び検索プログラム
KR102557574B1 (ko) * 2016-05-17 2023-07-20 엘지전자 주식회사 디지털 디바이스 및 그 제어 방법
JP6077163B2 (ja) * 2016-06-09 2017-02-08 ヤフー株式会社 検索装置、検索方法及び検索プログラム
JP7088644B2 (ja) * 2017-09-15 2022-06-21 ヤフー株式会社 提供装置、提供方法及び提供プログラム
US20210319785A1 (en) * 2020-04-10 2021-10-14 Collibra Nv Methods and systems for word edit distance embedding

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57194691A (en) * 1981-05-27 1982-11-30 Pioneer Electronic Corp Security system
JPH0756948A (ja) * 1993-08-09 1995-03-03 Fuji Xerox Co Ltd 情報検索装置
CN1122087A (zh) * 1994-07-21 1996-05-08 株式会社日立制作所 图像信息分配系统
JP3687118B2 (ja) 1994-12-01 2005-08-24 富士ゼロックス株式会社 関連語辞書作成装置および関連語辞書作成方法
JPH09120401A (ja) 1995-10-24 1997-05-06 Oki Electric Ind Co Ltd シソーラス作成装置
US6185531B1 (en) * 1997-01-09 2001-02-06 Gte Internetworking Incorporated Topic indexing method
JP3427674B2 (ja) * 1997-05-27 2003-07-22 富士ゼロックス株式会社 関連語提示装置及び関連語提示用プログラムを記録した媒体
JP3925996B2 (ja) * 1997-09-05 2007-06-06 松下電器産業株式会社 情報表示装置
US6513027B1 (en) * 1999-03-16 2003-01-28 Oracle Corporation Automated category discovery for a terminological knowledge base
US6463428B1 (en) * 2000-03-29 2002-10-08 Koninklijke Philips Electronics N.V. User interface providing automatic generation and ergonomic presentation of keyword search criteria
US7428023B2 (en) * 2001-04-19 2008-09-23 Digeo, Inc. Remote control device with integrated display screen for controlling a digital video recorder
JP3672023B2 (ja) * 2001-04-23 2005-07-13 日本電気株式会社 番組推薦システムおよび番組推薦方法
JP3717808B2 (ja) 2001-06-29 2005-11-16 株式会社日立製作所 情報検索システム
NO316480B1 (no) * 2001-11-15 2004-01-26 Forinnova As Fremgangsmåte og system for tekstuell granskning og oppdagelse
KR100828230B1 (ko) * 2001-11-23 2008-05-07 엘지전자 주식회사 디지털 방송 전송 시스템
US8332890B2 (en) * 2001-12-05 2012-12-11 International Business Machines Corporation Efficiently identifying television stations in a user friendly environment
JP2003204498A (ja) * 2002-01-07 2003-07-18 Sony Corp 遠隔操作システム、データ記録装置、処理状況通知方法、処理状況通知プログラム及び処理状況通知プログラム格納媒体
JP2003271631A (ja) 2002-03-13 2003-09-26 Ntt Data Technology Corp 特許文献検索方法及び装置
US7599689B2 (en) * 2002-04-22 2009-10-06 Nokia Corporation System and method for bookmarking radio stations and associated internet addresses
JP2004021915A (ja) 2002-06-20 2004-01-22 Ricoh Co Ltd 文書検索装置、文書検索システム、文書検索方法および記録媒体
JP2004029906A (ja) 2002-06-21 2004-01-29 Fuji Xerox Co Ltd 文書検索装置および方法
JP4406815B2 (ja) * 2002-06-26 2010-02-03 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
US20040001087A1 (en) * 2002-06-27 2004-01-01 Warmus James L. Methods and apparatus for electronic distribution of customized content via a broadcast signal
AU2003277587A1 (en) * 2002-11-11 2004-06-03 Matsushita Electric Industrial Co., Ltd. Speech recognition dictionary creation device and speech recognition device
US7437296B2 (en) * 2003-03-13 2008-10-14 Matsushita Electric Industrial Co., Ltd. Speech recognition dictionary creation apparatus and information search apparatus
JP2004355069A (ja) 2003-05-27 2004-12-16 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
JP2005005900A (ja) 2003-06-10 2005-01-06 Matsushita Electric Ind Co Ltd 番組検索装置および方法
KR100549315B1 (ko) * 2003-07-07 2006-02-02 엘지전자 주식회사 디지털 티브이의 채널 설정장치 및 방법
US20050071746A1 (en) * 2003-09-25 2005-03-31 Hart Peter E. Networked printer with hardware and software interfaces for peripheral devices
US7716696B2 (en) * 2003-12-15 2010-05-11 Canon Kabushiki Kaisha Television receiver, information processing method and program
JP3563737B2 (ja) 2003-12-24 2004-09-08 株式会社ジャストシステム 検索装置、検索方法、ならびに、情報記録媒体
US8346593B2 (en) * 2004-06-30 2013-01-01 Experian Marketing Solutions, Inc. System, method, and software for prediction of attitudinal and message responsiveness
US7617176B2 (en) * 2004-07-13 2009-11-10 Microsoft Corporation Query-based snippet clustering for search result grouping
CN100550014C (zh) 2004-10-29 2009-10-14 松下电器产业株式会社 信息检索装置
JP2006164044A (ja) 2004-12-09 2006-06-22 Nippon Telegr & Teleph Corp <Ntt> コンテンツ情報表示支援方法及び装置及びプログラム及びプログラムを格納した記憶媒体
JP2006163998A (ja) 2004-12-09 2006-06-22 Nippon Telegr & Teleph Corp <Ntt> 検索キーワード想起補助装置及び検索キーワード想起補助プログラム
JP3917648B2 (ja) 2005-01-07 2007-05-23 松下電器産業株式会社 連想辞書作成装置
JP2007183765A (ja) 2006-01-05 2007-07-19 Matsushita Electric Ind Co Ltd 関連語取得装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102231147A (zh) * 2010-11-08 2011-11-02 百度在线网络技术(北京)有限公司 一种用于实时展现联想词的方法、设备及系统
CN102486784A (zh) * 2010-12-06 2012-06-06 耶宝智慧(北京)技术发展有限公司 信息请求方法和信息提供方法
CN102486784B (zh) * 2010-12-06 2014-08-06 尹红伟 信息请求方法和信息提供方法
CN103324646A (zh) * 2012-03-19 2013-09-25 株式会社东芝 检索支援装置及检索支援方法
CN103324646B (zh) * 2012-03-19 2017-03-01 株式会社东芝 检索支援装置及检索支援方法
CN104765827A (zh) * 2015-04-13 2015-07-08 天脉聚源(北京)传媒科技有限公司 一种信息检索方法及装置
CN104765829A (zh) * 2015-04-13 2015-07-08 天脉聚源(北京)传媒科技有限公司 一种信息检索方法及装置
CN104765834A (zh) * 2015-04-13 2015-07-08 天脉聚源(北京)传媒科技有限公司 一种信息搜索方法及装置
CN104765827B (zh) * 2015-04-13 2018-01-05 天脉聚源(北京)传媒科技有限公司 一种信息检索方法及装置
CN104765829B (zh) * 2015-04-13 2018-06-19 天脉聚源(北京)传媒科技有限公司 一种信息检索方法及装置
CN104765834B (zh) * 2015-04-13 2019-01-18 天脉聚源(北京)传媒科技有限公司 一种信息搜索方法及装置
CN110582759A (zh) * 2017-06-06 2019-12-17 欧姆龙株式会社 得分计算单元、检索装置、得分计算方法和得分计算程序
CN110582759B (zh) * 2017-06-06 2024-01-12 欧姆龙株式会社 得分计算单元、检索装置、得分计算方法和得分计算程序
CN109902295A (zh) * 2019-02-01 2019-06-18 杭州晶一智能科技有限公司 一种基于网络信息的外语联想词库自训练方法

Also Published As

Publication number Publication date
JP4464463B2 (ja) 2010-05-19
US20100042405A1 (en) 2010-02-18
US8504357B2 (en) 2013-08-06
WO2009019830A1 (ja) 2009-02-12
JPWO2009019830A1 (ja) 2010-10-28

Similar Documents

Publication Publication Date Title
CN101601038A (zh) 关联词语提示装置
CN102265276B (zh) 基于上下文的推荐系统
JP3978221B2 (ja) 辞書作成装置および辞書作成方法
JP4436894B2 (ja) コンテンツ検索装置
JP4587236B2 (ja) 情報検索装置、情報検索方法、およびプログラム
CN101138233B (zh) 用于选择视听节目部分的方法和设备
US9654834B2 (en) Computing similarity between media programs
JP4945236B2 (ja) 映像コンテンツ表示装置、映像コンテンツ表示方法及びそのプログラム
JP4977589B2 (ja) 固有表現抽出装置、固有表現抽出方法、及びプログラム
JP5106455B2 (ja) コンテンツ推薦装置及びコンテンツ推薦方法
JPWO2006019101A1 (ja) コンテンツ関連情報取得装置、コンテンツ関連情報取得方法、およびコンテンツ関連情報取得プログラム
CN103052954A (zh) 推荐系统的基于简档内容检索
EP2113849A2 (en) Information processing apparatus and presenting method of related items
Rehman et al. OLAPing social media: The case of Twitter
CN101496011A (zh) 内容检索装置
JP2012129979A (ja) 区間作成装置、区間作成方法、及び区間作成プログラム
CN103384883A (zh) 利用Top-K处理使语义丰富
CN112287167A (zh) 视频推荐召回方法及装置
JP2005157463A (ja) データ分類方法、要約データ生成方法、データ分類装置、要約データ生成装置、データ分類プログラム、要約データ生成プログラム及び情報記録媒体
US8838616B2 (en) Server device for creating list of general words to be excluded from search result
JP2004362019A (ja) 情報推薦装置、情報推薦方法、情報推薦プログラム及び記録媒体
CN104602040B (zh) 一种节目单制定系统及方法
CN115705379A (zh) 智能推荐方法及装置、设备、存储介质
CN112163163A (zh) 多算法融合的信息推荐方法、装置和设备
JP2002175298A (ja) データ管理システム、データ管理方法、及び、プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20091209