CN100499761C - 信息处理设备和信息处理方法 - Google Patents

信息处理设备和信息处理方法 Download PDF

Info

Publication number
CN100499761C
CN100499761C CNB2007101049744A CN200710104974A CN100499761C CN 100499761 C CN100499761 C CN 100499761C CN B2007101049744 A CNB2007101049744 A CN B2007101049744A CN 200710104974 A CN200710104974 A CN 200710104974A CN 100499761 C CN100499761 C CN 100499761C
Authority
CN
China
Prior art keywords
information
program
user
vector
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2007101049744A
Other languages
English (en)
Other versions
CN101068323A (zh
Inventor
山本则行
宫崎充弘
斋藤真里
小池宏幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN101068323A publication Critical patent/CN101068323A/zh
Application granted granted Critical
Publication of CN100499761C publication Critical patent/CN100499761C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种信息处理设备、信息处理方法、程序和记录介质,产生代表节目的属性的节目向量。在步骤S11,接收EPG数据。在步骤S12,从EPG数据抽取产生节目向量PP所必需的元数据。在步骤S13,对包括在元数据中的内容标题进行词法分析,从而把内容和标题分解成单词。在步骤S14,对包括在元数据中的项目进行向量产生处理,从而产生节目向量PP。在步骤S15,根据与元数据相关的节目的类型,抽取效应向量。在步骤S16,使抽取的效应向量与产生的节目向量PP相关联,并结束处理。本发明可被应用于分发内容的分发服务器。

Description

信息处理设备和信息处理方法
本申请是申请号为200380108320.9、申请日为2003年12月12日、发明名称为“信息处理设备,信息处理方法,信息处理系统,记录介质和计算机程序”的发明的分案申请。
技术领域
本发明涉及信息处理设备,信息处理方法,信息处理系统,记录介质和计算机程序。更具体地说,本发明涉及作为适合于诸如自动记录和节目的推荐之类的应用的设备,为通常观看节目和电视广播和无线电广播的流式数据的用户而提供的信息处理设备,还涉及所述设备采用的信息处理方法,采用该设备的信息处理系统,实现所述方法的计算机程序,以及用于记录计算机程序的记录介质。
背景技术
按照惯例,为了向用户推荐电视和无线电广播中的节目,通过使用诸如EPG(电子节目指南)之类的节目信息(或者节目元数据)选择和用户喜欢的信息匹配的节目。向用户推荐节目的方法随着获得用户喜欢的数据的方法而变化。向用户推荐节目的方法的一个例子是初始兴趣编目方法,在该方法中,和用户的兴趣相关的信息首先被预先编目(catalog),并被用作向用户推荐节目的基础。向用户推荐节目的方法的另一例子是观看历史利用方法,该方法通过利用用户过去观看的节目的历史,向用户推荐节目。向用户推荐节目的方法的另一例子是通过使用其它用户的观看历史,向用户推荐节目的协同过滤方法。
在初始兴趣编目方法中,首先要求用户事先对诸如喜欢的节目的种类,喜爱的类型和喜欢的演员(talent)的姓名之类的信息编目。喜欢的节目的种类的例子是戏剧和综艺节目。喜爱的类型的例子是神秘剧和喜剧。随后,编目信息被用作识别和用户的兴趣相符的节目元数据的关键字。最后,获得将向用户推荐的节目的名称。
在观看历史利用方法中,每次用户观看节目时,所观看的节目的元数据被保存,当过去的元数据被保存到一定程度时,分析保存的元数据,从而获得诸如喜欢的节目的种类,喜爱的类型和喜欢的演员的姓名之类的信息。随后,获得的信息被用作识别和用户的喜爱相符的节目元数据的关键字。最后,获得将向用户推荐的节目的名称。
在诸如采用HDD(硬盘驱动器)的记录设备之类的设备中,不仅根据观看历史,而且在一些情况下还根据记录预约的历史或者诸如记录操作之类的用户操作的历史,获得和用户喜好相关的信息。这种情况下,能够把用户偶然观看的节目和用户感兴趣而有意观看的节目区分开,从而能够获得更好地反映用户的喜好的信息。用户偶然观看的节目不是因为用户对节目特别感兴趣和观看该节目而由用户设置的节目,而是由处于打开状态的电视接收器(或收音机)呈现的用户观看的节目。
在协同过滤方法中,第一用户首先搜索具有和第一用户的观看/操作历史相符的观看/操作历史的第二用户,获得第二用户的观看/操作历史。随后,在第二用户观看过的节目中选择第一用户还没有观看的节目,并推荐给第一用户。
另外,日本专利特许公开No.2001-160955提出了一种技术,从而,n维属性向量作为节目的属性被预先加入到广播节目中。随后比较选择向量和属性向量,从而选择要记录的节目或者要再现的节目。选择向量是根据用户最初记录的数据,以及由用户再现的节目或者预约记录的节目的属性向量表示的属性的平均值产生的向量。
但是,如果采用初始兴趣编目方法选择节目,那么选择的节目只代表用户最初对信息编目时,该用户具有的特定兴趣。另外,为了记录信息的细节,用户需要进行复杂的信息编目操作。从而,为了简化初始设置过程中,对要记录的信息编目的操作,需要减少要记录的信息的件数。从而,只能够推荐根据用户记录的粗略信息选择的节目。从而,选择和用户的喜好相符的节目的准确度较低。
另一方面,在诸如观看历史利用方法之类的其它方法中,仅仅利用根据用户的观看历史收集的多条元数据的总和或平均值,来选择推荐的节目。从而这种情况下,如果历史未被保存到一定的程度,那么不可能正确地推荐和用户的喜好相符的节目。另外,就观看历史利用方法来说,多条元数据之间的相关性并不敏感,导致不可能实现充分的个人化。除此之外,如果历史被积累,那么在一些情况下,由于历史项易于相互重叠,以及历史项均具有容易扩展为历史的元素,因此可能在加权值上形成偏差。容易相互重叠的历史项是容易被检测为用户的喜好的项目。容易相互重叠的历史项的一个例子是类型。另一方面,具有容易扩展为历史的元素的历史项是难以被检测为用户的喜好的项目。具有容易扩展为历史的元素的历史项的一个例子是表演者。
更具体地说,假定用户是实况广播员A的崇拜者。从而,该用户喜爱观看实况广播员A解说的球队B的棒球比赛的实况报道。这种情况下,信息“棒球比赛的实况报道”(它是类型)作为历史容易相互重叠。即,信息“棒球比赛的实况报道”容易被检测为用户的喜好。但是,信息“实况广播员A”(它是表演者)难以相互重叠。即,信息“实况广播员A”难以被检测为用户的喜好。从而,存在由另一实况广播员解说的球队B的棒球比赛的实况报道被推荐,而实况广播员A表演的综艺节目不被推荐的情况。
另外,如日本专利特许公开N0.2001-160955公开的那样,属性向量被预先加入到广播节目中。随后比较选择向量和属性向量,从而选择要记录的节目或者要再现的节目。选择向量是根据用户最初记录的数据,以及由用户再现的节目或者预约记录的节目的属性向量表示的属性的平均值产生的向量。另外在这种情况下,由于使用用户的操作历史,因此在一些情况下,由于历史项易于相互重叠,以及历史项均具有容易扩展为历史的元素,比如表演者,因此可能在加权值上形成偏差。
例如假定用户喜爱戏剧,并且只喜爱不表演戏剧的喜剧演员A的综艺节目。另外,假定用户观看这样的综艺节目和戏剧的比例为2:8。在关于这样的用户产生的选择向量中,经常表演戏剧的“表演者B”的信息作为历史相互重叠,而不是几乎不表演戏剧的喜剧演员A,尽管表演者B不是用户特别喜好的明星。从而,经常表演戏剧的“表演者B”参加演出的记录片节目优先于喜剧演员A作为表演者的综艺节目被推荐。
另外,对节目的选择来说重要的项目因用户而异。例如,对某一用户来说,重要的是表演者,而对另一用户来说,重要的是节目的内容。然而,由于按照相同的方式操作所有项目,因此在一些情况下,在推荐的节目中不能反映只有用户才有的喜好。
除此之外,由于协同过滤方法中利用的是另一用户的喜好,因此难以抽取详细表示每个用户的喜好的信息。
发明内容
为了解决上述问题,本发明的发明人考虑了选择与用户的喜好相符的节目的能力。
为了解决上述问题,本发明提供一种执行选择内容的处理的信息处理设备,包括:获得所述内容的包括多个项目的属性信息的获取装置;和利用预定的加权值信息计算由所述获取装置获得的所述属性信息与从用户获得的信息之间的相似度的计算装置,其中所述加权值信息规定在根据所述属性信息和包括所述属性信息所包括的多个所述项目当中的至少一部分的所述从用户获得的信息,计算作为每个所述项目的相似度的项目相似度,并且根据所述项目相似度计算所述属性信息与所述从用户获得的信息之间的相似度时,对应于多个所述项目的所述项目相似度各自的贡献程度。
本发明还提供一种执行选择内容的处理的信息处理设备的信息处理方法,包括:获得所述内容的包括多个项目的属性信息的获取步骤;和利用预定的加权值信息计算通过所述获取步骤的处理获得的所述属性信息与从用户获得的信息之间的相似度的计算步骤,其中所述加权值信息规定在根据所述属性信息和包括所述属性信息所包括的多个所述项目当中的至少一部分的所述从用户获得的信息,计算作为每个所述项目的相似度的项目相似度,并且根据所述项目相似度计算所述属性信息与所述从用户获得的信息之间的相似度时,对应于多个所述项目的所述项目相似度各自的贡献程度。
本发明还提供一种用于使计算机执行选择内容的处理的程序,包括:获得所述内容的包括多个项目的属性信息的获取步骤;和利用预定的加权值信息计算通过所述获取步骤的处理获得的所述属性信息与从用户获得的信息之间的相似度的计算步骤,其中所述加权值信息规定在根据所述属性信息和包括所述属性信息所包括的多个所述项目当中的至少一部分的所述从用户获得的信息,计算作为每个所述项目的相似度的项目相似度,并且根据所述项目相似度计算所述属性信息与所述从用户获得的信息之间的相似度时,对应于多个所述项目的所述项目相似度各自的贡献程度。
本发明还提供一种记录介质,记录了上述程序。
本发明还提供一种执行选择内容的处理的信息处理设备,包括:保存所述内容的包括多个项目的属性信息的第一存储装置;和利用预定的加权值信息计算由所述第一存储装置保存的所述属性信息与从用户获得的信息之间的相似度的计算装置,其中所述加权值信息规定在根据所述属性信息和包括所述属性信息所包括的多个所述项目当中的至少一部分的所述从用户获得的信息,计算作为每个所述项目的相似度的项目相似度,并且根据所述项目相似度计算所述属性信息与所述从用户获得的信息之间的相似度时,对应于多个所述项目的所述项目相似度各自的贡献程度。
本发明还提供一种执行选择内容的处理的信息处理方法,包括:保存所述内容的包括多个项目的属性信息的第一存储步骤;和利用预定的加权值信息计算通过所述第一存储步骤的处理保存的所述属性信息与从用户获得的信息之间的相似度的计算步骤,其中所述加权值信息规定在根据所述属性信息和包括所述属性信息所包括的多个所述项目当中的至少一部分的所述从用户获得的信息,计算作为每个所述项目的相似度的项目相似度,并且根据所述项目相似度计算所述属性信息与所述从用户获得的信息之间的相似度时,对应于多个所述项目的所述项目相似度各自的贡献程度。
本发明还提供一种用于使计算机执行选择内容的处理的程序,包括:保存所述内容的包括多个项目的属性信息的第一存储步骤;和利用预定的加权值信息计算通过所述第一存储步骤的处理保存的所述属性信息与从用户获得的信息之间的相似度的计算步骤,其中所述加权值信息规定在根据所述属性信息和包括所述属性信息所包括的多个所述项目当中的至少一部分的所述从用户获得的信息,计算作为每个所述项目的相似度的项目相似度,并且根据所述项目相似度计算所述属性信息与所述从用户获得的信息之间的相似度时,对应于多个所述项目的所述项目相似度各自的贡献程度。
本发明还提供一种记录介质,记录了上述程序。
根据本发明,提供一种根据关于内容的信息,产生内容的属性信息的第一信息处理设备,包括:
获得关于内容的信息的获取装置;
根据获取装置获得的关于内容的信息,产生包括多个项目的属性信息的属性信息产生装置;和
保存属性信息产生装置产生的属性信息的各个项目的第一加权值信息的第一存储装置,
其中第一加权值信息规定所述多个项目中的每一个对属性信息与用户的预定喜好信息之间的相似度的计算的贡献程度。
最好,信息处理设备还包括传送属性信息产生装置产生的属性信息的传输装置。
最好,传输装置从保存在第一存储装置中的多条第一加权值信息中抽取和内容的条件相符的一条第一加权值信息,并通过使抽取的一条第一加权值信息与属性信息产生装置产生的属性信息相关联,传送抽取的一条第一加权值信息。
最好,内容的条件是内容的类型。
最好,信息处理设备还包括从获取装置获得的关于内容的信息中抽取预定信息的抽取装置,其中属性信息产生装置把抽取装置抽取的预定信息转换成多个项目的每一个的向量,以便产生属性信息。
最好,属性信息产生装置从关于内容的信息中选择用单词表示的信息作为分析对象,并根据分析的结果产生属性信息。
最好,信息处理设备还包括:把包括多个项目的信息保存为用户的预定喜好信息的第二存储装置;和通过关于每个项目,计算保存在第二存储装置中的喜好信息与属性信息产生装置产生的属性信息之间的相似度,产生揭示与用户的喜好相符的内容的推荐信息的推荐信息产生装置。
最好,推荐信息产生装置通过使用保存在第一存储装置中的第一加权值信息,经由属性信息与喜好信息的比较,产生推荐信息。
最好,信息处理设备还包括:
获得用户进行的操作的历史的操作历史获取装置;
根据操作历史获取装置获得的用户所进行的操作的历史,产生用户的喜好信息的喜好信息产生装置;和
根据喜好信息产生装置产生的喜好信息,产生第二加权值信息的加权值信息产生装置,其中:
第二加权值信息指示多个项目中的每一个对属性信息与用户的喜好信息之间的相似度的计算的贡献程度;
推荐信息产生装置通过使用加权值信息产生装置产生的第二加权值信息,经由属性信息与喜好信息的比较,产生推荐信息。
根据本发明,提供一种根据关于内容的信息,产生内容的属性信息的信息处理设备用第一信息处理方法,所述信息处理方法包括:
获得关于内容的信息的获取步骤;
根据在获取步骤进行的处理中获得的关于内容的信息,产生包括多个项目的属性信息的属性信息产生步骤;
根据在获取步骤进行的处理中获得的关于内容的信息,以及根据内容拥有的条件,抽取规定多个项目中的每一个对属性信息与用户的预定喜好信息之间的相似度的计算的贡献程度的加权值信息的抽取步骤;和
使在抽取步骤进行的处理中抽取的加权值信息与在属性信息产生步骤进行的处理中产生的属性信息相关联的关联步骤。
根据本发明,提供一种用于存储由计算机执行的,以便进行根据关于内容的信息产生内容的属性信息的处理的计算机程序的第一记录介质,所述计算机程序包括:
获得关于内容的信息的获取步骤;
根据在获取步骤进行的处理中获得的关于内容的信息,产生包括多个项目的属性信息的属性信息产生步骤;
根据在获取步骤进行的处理中获得的关于内容的信息,以及根据内容拥有的条件,抽取规定多个项目中的每一个对属性信息与用户的预定喜好信息之间的相似度的计算的贡献程度的加权值信息的抽取步骤;和
使在抽取步骤进行的处理中抽取的加权值信息与在属性信息产生步骤进行的处理中产生的属性信息相关联的关联步骤。
根据本发明,提供一种由计算机执行的,以便进行根据关于内容的信息产生内容的属性信息的处理的第一计算机程序,所述计算机程序包括:
获得关于内容的信息的获取步骤;
根据在获取步骤进行的处理中获得的关于内容的信息,产生包括多个项目的属性信息的属性信息产生步骤;
根据在获取步骤进行的处理中获得的关于内容的信息,以及根据内容拥有的条件,抽取规定多个项目中的每一个对属性信息与用户的预定喜好信息之间的相似度的计算的贡献程度的加权值信息的抽取步骤;和
使在抽取步骤进行的处理中抽取的加权值信息与在属性信息产生步骤进行的处理中产生的属性信息相关联的关联步骤。
如上所述,获得关于内容的信息,并根据获得的关于内容的信息,产生包括多个项目的属性信息。随后,根据关于内容的信息,以及根据内容拥有的条件,使属性信息与规定多个前述项目中的每一个对属性信息与用户的预定喜好信息之间的相似度的计算的贡献程度的加权值信息相关联。
根据本发明,提供进行选择与用户的喜好相符的内容的处理的第二信息处理设备,包括:
获得用作内容的属性信息的包括多个项目的信息的获取装置;
保存用作用户的喜好信息的包括多个项目的信息的存储装置;
通过应用预定的加权值信息,计算作为用户的喜好信息保存在存储装置中的信息和获取装置获得的属性信息之间的相似度,产生揭示与用户的喜好相符的内容的推荐信息的推荐信息产生装置,
其中加权值信息规定多个项目中的每一个对属性信息与用户的喜好信息之间的相似度的计算的贡献程度。
最好,除了内容的属性信息之外,获取装置还获得加权值信息,推荐信息产生装置通过利用加权值信息,比较内容的属性信息与所述喜好信息,产生推荐信息。
最好,信息处理设备还包括:
获得用户进行的操作的历史的操作历史获取装置;
根据操作历史获取装置获得的用户所进行的操作的历史,产生用户的喜好信息的喜好信息产生装置;和
根据喜好信息产生装置产生的喜好信息,产生加权值信息的加权值信息产生装置,
其中推荐信息产生装置通过利用加权值信息产生装置产生的加权值信息,比较喜好信息与属性信息,产生推荐信息。
最好,加权值信息是揭示用户首选的特有喜好,而不是一般喜好的信息,所述特有喜好被用于选择内容的多条属性信息中的特定一条属性信息。
最好,加权值信息是揭示构成内容的属性信息的项目中对用户重要的一个项目的信息。
最好,加权值信息是揭示构成内容的属性信息的项目中,指示用户喜欢的内容的项目的信息。
最好,加权值信息是揭示构成内容的属性信息的项目中,指示用户不喜欢的内容的项目的信息。
最好,信息处理设备还包括接收来自用户的操作输入的操作输入装置,其中根据用户输入操作输入装置的操作输入,设置加权值信息。
根据本发明,提供一种进行选择与用户的喜好相符的内容的处理的信息处理设备用第二信息处理方法,所述信息处理方法包括:
获得设置加权值信息的信息的获取步骤,所述加权值信息规定对由多个项目构成的,用作与内容相关的属性信息的信息和由多个项目构成的,用作与用户相关的预定喜好信息的信息之间的相似度的计算的贡献程度,这里所述贡献是由多个项目中的每个项目引起的贡献;
根据在获取步骤进行的处理中获得的设置加权值信息的信息,计算属性信息和喜好信息之间的相似度的计算步骤;和
通过在计算步骤进行的处理中获得的计算结果的使用,产生揭示与用户的喜好相符的内容的推荐信息的推荐信息产生步骤。
根据本发明,提供一种保存将由计算机执行的,进行选择与用户的喜好相符的内容的处理的计算机程序的第二记录介质,所述计算机程序包括:
获得设置加权值信息的信息的获取步骤,所述加权值信息规定对由多个项目构成的,用作与内容相关的属性信息的信息和由多个项目构成的,用作与用户相关的预定喜好信息的信息之间的相似度的计算的贡献程度,这里所述贡献是由多个项目中的每个项目引起的贡献;
根据在获取步骤进行的处理中获得的设置加权值信息的信息,计算属性信息和喜好信息之间的相似度的计算步骤;和
通过在计算步骤进行的处理中获得的计算结果的使用,产生揭示与用户的喜好相符的内容的推荐信息的推荐信息产生步骤。
根据本发明,提供一种将由计算机执行的,进行选择与用户的喜好相符的内容的处理的计算机程序,所述计算机程序包括:
获得设置加权值信息的信息的获取步骤,所述加权值信息规定对由多个项目构成的,用作与内容相关的属性信息的信息和由多个项目构成的,用作与用户相关的预定喜好信息的信息之间的相似度的计算的贡献程度,这里所述贡献是由多个项目中的每个项目引起的贡献;
根据在获取步骤进行的处理中获得的设置加权值信息的信息,计算属性信息和喜好信息之间的相似度的计算步骤;和
通过在计算步骤进行的处理中获得的计算结果的使用,产生揭示与用户的喜好相符的内容的推荐信息的推荐信息产生步骤。
如上所述,为了产生揭示和用户的喜好相符的内容的推荐信息,通过使用规定多个下述项目中的每一个对计算的贡献程度的加权值信息,计算包括多个项目的用作内容的属性信息的信息与包括多个项目的用作用户的预定喜好信息的信息之间的相似度。
根据本发明,提供一种信息处理系统,所述信息处理系统包括根据关于内容的信息产生内容的属性信息的第一信息处理设备,和根据从第一信息处理设备接收的内容的属性信息,进行选择和用户的喜好相符的内容的处理的第二信息处理设备,
第一信息处理设备包括:
获得关于内容的信息的第一获取装置;
根据第一获取装置获得的关于内容的信息,产生包括多个项目的属性信息的属性信息产生装置;
保存属性信息产生装置产生的属性信息的各个项目的第一加权值信息的第一存储装置;和
从保存在第一存储装置中的多条第一加权值信息中抽取和内容拥有的条件相符的一条第一加权值信息,使抽取的第一加权值信息与属性信息产生装置产生的属性信息相关联,和传送第一加权值信息及属性信息的传输装置,
第二信息处理设备包括:
获得包括多个项目的内容的属性信息及第一加权值信息的第二获取装置;
保存用作用户的喜好信息的包括多个项目的信息的第二存储装置;和
通过至少应用第一加权值信息或不同于第一加权值信息的第二加权值信息,计算作为用户的喜好信息保存在第二存储装置中的信息和第二获取装置获得的属性信息之间的相似度,产生揭示与用户的喜好相符的内容的推荐信息的推荐信息产生装置,
其中第一加权值信息和第二加权值信息均规定多个项目中的每一个对属性信息与用户的喜好信息之间的相似度的计算的贡献程度。
如上所述,在第一信息处理设备中,获得关于内容的信息,并根据获得的关于内容的信息,产生包括多个项目的属性信息。随后,保存属性信息的各个项目的第一加权值信息。之后,从保存的多条第一加权值信息中抽取与内容拥有的条件相符的一条第一加权值信息,并使之与属性信息相关联。最后,相互关联的第一加权值信息和属性信息被传送给第二信息处理设备。另一方面,在第二信息处理设备中,用作内容的属性信息的包括多个项目的信息和第一加权值信息接收自第一信息处理设备,而用作用户的喜好信息的包括多个上述项目的信息被保存。随后,通过至少应用第一加权值信息或不同于第一加权值信息的第二加权值信息,计算保存的用户的喜好信息和属性信息之间的相似度,产生揭示与用户的喜好相符的内容的推荐信息。另外,第一加权值信息和第二加权值信息均规定多个上述项目中的每一个对属性信息与用户的喜好信息之间的相似度的计算的贡献程度。
根据本发明,提供进行处理,从而选择与用户的喜好相符的内容的第三信息处理设备,包括:
获得内容的属性信息的获取装置;和
根据表示用户的喜好的第一信息和表示一般喜好的第二信息,产生揭示用户的喜好相对于一般的喜好的偏差的第三信息的偏差信息产生装置。
最好,属性信息,第一信息和第三信息均包括多个项目;另外设置在信息处理设备中的选择装置通过利用第三信息,关于每个项目,计算属性信息与第一信息之间的相似度,选择与用户的喜好相符的内容。
最好,第一信息和第二信息均包括多个项目;偏差信息产生装置产生揭示具有第一信息和第二信息之间的低相似度的项目的信息作为第三信息。
最好,信息处理设备还包括:获得用户进行的操作的历史的操作历史获取装置;和根据操作历史获取装置获得的用户进行的操作的历史,产生第一信息的喜好信息产生装置。
最好,偏差信息产生装置通过下述操作产生第三信息:
关于每个预定的项目,对用户从属于预定组的内容中选择并观看的内容的数目计数,从而得到第一值,并把第一值用作第一信息;
关于每个预定的项目,对属于预定组的所有内容的数目计数,从而得到第二值,并把第二值用作第二信息;和
使用第二值使第一值归一化,从而得到第三信息。
最好,预定的一组内容是在预定的一段时间内广播或分发的一组内容。
最好,偏差信息产生装置通过下述操作产生第三信息:
把均由内容构成的每组作为预定的多组内容之一,所述多组内容是在不同的一段时间内广播或分发的多组内容;
计算预定的多组内容的第一值和第二值;
使用对应于第一值的,和第一值一样关于相同的一组内容计算的第二值,使每个第一值归一化,从而得到第三信息。
最好,每个预定的多组内容是在预定的一段时间内广播或分发的一组内容。
最好,第一信息是与内容相关的,揭示指示该内容是用户所喜欢的内容的项目的属性信息。
最好,第一信息是与内容相关的,揭示指示该内容是用户不喜欢的内容的项目的属性信息。
根据本发明,为进行处理,从而选择与用户的喜好相符的内容的信息处理设备提供第三信息处理方法,所述信息处理方法包括:
获得表示用户的喜好的第一信息的第一获取步骤;
获得表示一般喜好的第二信息的第二获取步骤;和
根据在第一获取步骤进行的处理中获得的第一信息和在第二获取步骤进行的处理中获得的第二信息,产生揭示用户的喜好相对于一般的喜好的偏差的第三信息的偏差信息产生步骤。
根据本发明,提供保存由计算机执行的,进行选择与用户的喜好相符的内容的处理的计算机程序的第三存储介质,所述计算机程序包括:
获得表示用户的喜好的第一信息的第一获取步骤;
获得表示一般喜好的第二信息的第二获取步骤;和
根据在第一获取步骤进行的处理中获得的第一信息和在第二获取步骤进行的处理中获得的第二信息,产生揭示用户的喜好相对于一般的喜好的偏差的第三信息的偏差信息产生步骤。
根据本发明,提供由计算机执行的,进行选择与用户的喜好相符的内容的处理的计算机程序,所述计算机程序包括:
获得表示用户的喜好的第一信息的第一获取步骤;
获得表示一般喜好的第二信息的第二获取步骤;和
根据在第一获取步骤进行的处理中获得的第一信息和在第二获取步骤进行的处理中获得的第二信息,产生揭示用户的喜好相对于一般的喜好的偏差的第三信息的偏差信息产生步骤。
如上所述,根据代表用户的喜好的第一信息和代表一般喜好的第二信息,产生揭示用户的喜好相对于一般喜好的偏差的第三信息。
附图说明
图1是说明电视节目广播和流式数据的分发的说明图;
图2是表示图1中所示的分发服务器的结构的方框图;
图3是说明节目向量产生处理1的流程图;
图4是说明EPG数据的说明图;
图5是说明节目向量的说明图;
图6是说明节目向量产生处理2的流程图;
图7是说明分组处理1的流程图;
图8是说明分组处理2的流程图;
图9是说明标题分组处理1的流程图;
图10是说明标题分组处理2的流程图;
图11是说明标题分组处理3的流程图;
图12是说明标题分组处理4的流程图;
图13是表示图1中所示的节目推荐处理设备的结构的方框图;
图14是说明正历史向量和负历史向量产生处理1的流程图;
图15是说明正历史向量的说明图;
图16是说明正历史向量和负历史向量产生处理2的流程图;
图17是说明匹配处理1的流程图;
图18是说明匹配处理2的流程图;
图19是说明匹配处理3的流程图;
图20是说明匹配处理4的流程图;
图21是说明匹配处理5的流程图;
图22是说明用户方效应(effect)向量产生处理1的流程图;
图23是说明用户方效应向量产生处理2的流程图;
图24是说明用户方效应向量产生处理3的流程图;
图25是说明用户方效应向量产生处理4的流程图;
图26是说明用户方负效应向量产生处理1的流程图;
图27是说明用户方负效应向量产生处理2的流程图;
图28是说明包括组推荐的匹配处理的流程图;
图29是说明利用用户模型的匹配处理的流程图;
图30是说明异常推荐处理的流程图;
图31是表示图1中所示的电视接收设备的结构的方框图;
图32是表示图1中所示的电视显示设备的结构的方框图;
图33是说明推荐信息显示处理的流程图;
图34是说明自动频道设置处理的流程图;
图35是表示图1中所示的记录/再现设备的结构的方框图;
图36是说明自动记录处理的流程图;
图37是表示分发服务器的另一典型结构的方框图;
图38是表示节目推荐处理设备的另一典型结构的方框图;
图39是说明分发电视节目广播和流式数据的另一典型网络的说明图;
图40是表示分发服务器的另一典型结构的方框图。
具体实施方式
下面参考附图说明本发明的一个实施例。
首先,参考图1说明电视节目广播和流式数据(streaming data)的分发。
广播站1以地波的形式发射节目广播,或者通过卫星2以卫星波的形式发射节目广播。图1只表示了一个广播站1。但是不必说,可存在多个广播站。电视(TV)接收设备4中采用的天线3接收以地波或卫星波的形式发射的节目广播。如果需要,广播信号可包括EPG(电子节目指南)。
分发服务器5从流式数据数据库6读取流式数据,并通过包括因特网和其它子网在内的网络8把流式数据传送给TV接收设备4。分发服务器5还读出EPG或者从元数据数据库7读出包括比EPG更详细的信息的元数据。EPG是和从广播站1广播的节目相关的信息。分发服务器5随后为每个节目产生一个节目向量PP,并通过网络8,把节目向量PP连同EPG数据一起传送给EPG接收设备9。
如果包括在叠加于节目的一般广播信号上的EPG中的信息的数量对于后面将说明的处理来说足够大,那么和叠加在一般广播信号上的EPG相同的数据可被用于所述处理。另一方面,如果包括在叠加于一般广播信号上的EPG中的信息的数量并未大到足以进行后面说明的处理,那么除了叠加在一般广播信号上的EPG之外,元数据可被用于所述处理,或者被用作独立数据。由于包括在叠加于一般广播信号上的EPG中的信息的数量没有大到足以进行后面说明的处理,因此在本实施例中,包括元数据的信息被用于所述处理,这样的信息被称为EPG数据。
EPG接收设备9把从分发服务器5接收的EPG数据提供给TV接收设备4。另外,EPG接收设备9把和EPG数据一起接收的节目向量PP提供给节目推荐处理设备10。
具有调谐器的TV接收设备4根据从具有操作部分的TV显示设备11或者同样具有操作部分的记录/再现设备12接收的指示用户选择的频道的控制信号,选择天线3以地波或卫星波的形式接收的广播信号,并接收选择的广播信号。TV接收设备4还通过网络8接收从分发服务器5传送的流式数据。另外,TV接收设备4从EPG接收设备9接收EPG数据,并把该数据提供给TV显示设备11或者记录/再现设备12。要注意的是,如果接收波包括EPG,那么TV接收设备4把EPG和包括在接收波中的节目信号分开,把EPG和节目信号提供给TV显示设备11或者记录/再现设备12。
节目推荐处理设备10从EPG接收设备9获得节目向量PP,并从TV显示设备11以及记录/再现设备12获得操作日志。节目推荐处理设备10随后根据节目向量PP和操作日志,或者根据用户进行的输入操作,产生推荐和用户的喜好相符的节目的推荐信息,并把推荐信息提供给TV显示设备11和记录/再现设备12。
根据用户输入的操作输入,TV显示设备11显示从TV接收设备4接收的广播信号或者从记录/再现设备12接收的再现信号。另外,根据从节目推荐处理设备10接收的推荐信息,TV显示设备11自动设置频道,并显示关于推荐节目的信息。TV显示设备11还把用作用户进行的操作的历史的操作日志提供给节目推荐处理设备10。
根据用户输入的操作输入,记录/再现设备12把从TV接收设备4接收的广播信号记录在安装的记录介质或者嵌入的记录介质,例如硬盘上。另外,根据从节目推荐处理设备10接收的推荐信息,记录/再现设备12自动把从TV接收设备4接收的广播信号记录到安装的记录介质或者嵌入的记录介质上。另一方面,记录/再现设备12还从安装的记录介质或者嵌入的记录介质再现节目,并把再现的节目提供给TV显示设备11以便显示该节目。除此之外,记录/再现设备12还把用作用户进行的操作的历史的操作日志提供给节目推荐处理设备10。
在上面的说明中,EPG接收设备9,TV接收设备4,节目推荐处理设备10,TV显示设备11和记录/再现设备12被说明成不同的设备。但是,这些设备不必被单独设计。例如,不必说,EPG接收设备9,TV接收设备4和TV显示设备11可被集成到具有嵌入式调谐器功能的TV接收器15-1的单一结构中。另外,记录/再现设备12可与TV接收器15-1集成,从而形成具有记录功能的TV接收器15-2。不必说,记录/再现设备12可以是包括具有大存储容量的硬盘的所谓硬盘记录器。此外,节目推荐处理设备10可与具有嵌入式调谐器功能的TV接收器15-1集成,从而形成TV接收器15-3,或者节目推荐处理设备10可与具有记录功能的TV接收器15-2集成,从而形成TV接收器15-4。
图2是表示分发服务器5的结构的方框图。
数据获取部分21从元数据数据库7或者流式数据数据库6获得数据,并把获得的数据提供给数据传输部分25。另外,数据获取部分21把EPG数据提供给元数据抽取部分22。此外,数据获取部分21进行处理,从而根据EPG数据的内容,把保存在元数据数据库7中的EPG数据集合成组。
元数据抽取部分22从接收自数据获取部分21的EPG数据中抽取产生节目向量PP所必需的元数据,并把抽取的数据提供给节目向量产生部分23。节目向量产生部分23根据元数据产生节目向量PP,并且如果需要的话,在把节目向量PP和保存在数据存储部分24中的节目方效应(effect)向量EfPP提供给数据传输部分25之前,使节目向量PP与节目方效应向量EfPP相关联。
如果需要的话,数据存储部分24被用于保存节目方效应向量EfPP,节目方效应向量EfPP都是产生节目向量PP所必需的信息数据。
从想出如何提高收视率的措施的制作方和广播方的观点来看,一般文艺节目配有强调强类型或内容要素的特性,综艺节目等配有强调强表演者要素的特性,戏剧节目配有强调强表演者和编剧要素的特性。为了正确地掌握节目的特征,必须利用这些特性。即,节目的类型确定在所进行的匹配过程中,构成节目的节目向量PP的哪些分量是重要的,以便推荐和用户的喜好相符的节目。换句话说,这样的重要分量因类型而异。
即,如果节目的类型是“一般文艺/记录片”,那么重要的项目(item)不是表演者,而是节目的内容和标题。另一方面,如果节目的类型是“综艺”,那么重要的项目是表演者。如果节目的类型是“戏剧”,那么重要的项目是表演者和编剧。当所述重要的项目被用于产生节目向量PP时,节目效应向量被设置成规定在每种类型的匹配过程中,每个项目的贡献程度,并被保存在数据存储部分24中。
数据传输部分25通过网络8把信息传送给EPG接收设备9或者TV接收设备4。传送的信息包括由数据获取部分21提供的EPG数据和流式数据,以及由节目向量产生部分23提供的节目效应向量EfPP。
如果需要,驱动器26与节目向量产生部分23连接。如果需要,磁盘31、光盘32、磁光盘33或半导体存储器34被安装在驱动器26上,使得数据可在驱动器26和磁盘31、光盘32、磁光盘33或半导体存储器34之间交换。
下面参考图3中所示的流程图,说明分发服务器5进行的节目向量产生处理1。
首先,在步骤S1,数据获取部分21获得包括来自元数据数据库7的元数据的EPG数据。
随后在步骤S2,元数据抽取部分22接收来自数据获取部分21的EPG数据,并从EPG数据抽取产生节目向量PP所需的元数据。随后,元数据抽取部分22把抽取的元数据提供给节目向量产生部分23。
图4表示了典型的元数据。元数据包括作为节目的类型的“Movie:Japnese film”和作为电影的名称的“Toukaidou Mitsuya Ghost-story”。元数据还包括已播日期,发行者,播出日期,广播电台的名称和广播时间。另外,除了描述节目内容的电影解说之外,元数据还包括导演的姓名,编剧的姓名,摄像师的姓名,负责音乐的人员的姓名和表演者的姓名。
随后,在步骤S3,如果需要,节目向量产生部分23对包括在元数据中的信息,例如名称和内容进行词法(morphological)分析,并把它们分解成单词。更具体地说,节目向量产生单元23把作为名称包括在元数据中的电影名分解成3个单词,即“Toukaidou”,“Mitsuya”和“ghost-story”。如图4中所示,元数据包括表述“59production ofSeihou,Masterpiece of horror show of Japanese film,depicting theworld of the famous Mitsuya ghost-story to fullness of formal beauty.”的信息。这种情况下,节目向量产生部分23抽取作为和内容有关的信息包括在该解说中的单词。抽取的单词是“Seihou”,“formal”,“beauty”,“fullness”,“famous”,“Mitsuya”,“ghost-story”,“world”,“depicting”,“Japanese film”,“horror”和“Masterpiece”。
随后,在下一步骤S4,节目向量产生部分23把包括在元数据中的项目转换成称为节目向量PP的向量。最后,结束处理的执行。产生的节目向量PP被提供给数据传输部分25,数据传输部分25随后通过网络8把节目向量PP传送给EPG接收设备9。具有所述项目的节目向量PP可具有包括被排列成1个数组的所有详细项目分量的格式。作为一种备选方案,项目被归入大项目中,所述大项目随后被转换成节目向量PP。
图5表示了对7个大项,即标题、类型、时间段、广播电台、表演者、编剧/作者/制片人和内容应用向量变换而获得的节目向量PP={Tm,Gm,Pm,Am,Km}。每个大项的内容被描述成:标题Tm={标题1,标题2,...},类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,一般文艺/记录片,新闻/报告,其它},时间段(小时)Hm={早晨,白天,晚间,黄金时段,深夜},广播电台(电视台)Sm={NNK General,NNK Educational,AsianTelevision,TTS,Buji,Telenichi,Touto,First NNK Satellite,Second NNKSatellite,WOWO},表演者(人员)Pm={A,B,...},编剧/作者/制片人Am={a,b,...},内容(关键字)Km={kw1,kw2,...}。
由于这7个大项中的类型,广播电台和时间段均具有可明确识别的类别,这些每个这些大项的详细项目可由数字向量表示。以广播电台为例。如上所述,广播电台是Sm={NNK General,NNKEducational,Asian Television,TTS,Buji,Telenichi,Touto,First NNKSatellite,Second NNK Satellite,WOWO}。例如,如果节目的广播电台是WOWO,那么广播电台向量可由广播电台Sm={0,0,0,0,0,0,0,0,0,1}表示。就类型来说,大项是Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,一般文艺/记录片,新闻/报告,其它}。如果节目的类型是一般文艺/记录片,那么类型向量可由类型Gm={0,0,0,0,0,0,1,0,0}表示。
另一方面,标题、表演者、编剧/作者/制片人和内容的大项都不能由数字向量表示。这种情况下,每个大项由包括作为向量分量的出现频率的向量表示。与由向量表示的句子中的单词相关的出现频率是该单词在句子中出现的频率。例如,标题的大项是标题={Toukaidou-1,Mitsuya-1,ghost-story-1},其中每个分量是一对单词和代表该单词的频率的数字。在本例中,分量Toukaidou-1意味着单词Toukaidou在由该向量表示的句子中出现一次。
节目向量PP如上所述被产生,随后被传送给EPG接收设备9。更具体地说,由前面参考图4说明的节目元数据产生的节目向量PP是节目向量PP={标题Tm={Toukaidou-1,Mitsuya-1,ghost-story-1},类型Gm={0,0,0,1,0,0,0,0,0},时间段Hm={0,0,0,0,1},广播电台Sm={0,0,0,0,0,0,0,0,0,1},表演者Pm={Katsumi Wakasugi-1,ShigeruAmami-1,Toshihiko Emi-1,Ryuujirou Nakamura-1和NorikoNishizawa-1},编剧/作者/制片人Am={Nobuo Nakagawa-1,ShochiOhnuki-1,Yoshihiro Ishida-1,Shoji Nishimoto-1,Chuta Watanabe-1},内容Km={Seihou-1,formal-1,beauty-1,fullness-1,famous-1,Mitsuya-1,ghost-story-1,world-1,depicting-1,Japanese-1,horror-1和masterpiece-1}}。
节目向量PP被传送给EPG接收设备9。
在如上所述产生的节目向量PP中,表演者向量Pm的主要分量可被特别加权。出于同样的原因,编剧/作者/制片人向量Am的导演可被特别加权。例如,表演者向量可由Pm={KatsumiWakasugi-3,Shigeru Amami-2,Toshihiko Emi-1,RyuujirouNakamura-1和Noriko Nishizawa-1}表示,编剧/作者/制片人向量可由Am={Nobuo Nakagawa-3,Shochi Ohnuki-1,Yoshihiro Ishida-1,ShojiNishimoto-1,Chuta Watanabe-1}表示。
另外,如上所述,节目的类型确定为了推荐与用户的喜好相符的节目而进行的匹配过程中,构成节目的节目向量PP的分量中哪些是重要的,换句话说,这样的重要分量因类型而异。节目方效应向量EfPP显示对每种类型来说,哪些分量是重要的。如果节目方效应向量EfPP被保存在数据存储部分24中,那么也可通过与节目向量PP相关联,传送节目方效应向量EfPP。对由节目向量PP代表的一组大项设置节目方效应向量EfPP。
假定节目向量PP={标题Tm,类型Gm,时间段Hm,广播电台Sm,表演者Pm,编剧/作者/制片人Am,内容Km}中的节目的类型是一般文艺/记录片。这种情况下,重要的项目是标题和内容。从而,节目方效应向量EfPP被设置成值{3,1,1,1,1,1,3},其中数字3是加权值。另一方面,如果节目的类型是综艺,那么重要的项目是表演者。这种情况下,节目方效应向量EfPP被设置成值{1,1,1,1,5,1,1},其中数字5是加权值。如果节目的类型是戏剧,那么重要的项目是表演者和编剧。这种情况下,节目方效应向量EfPP被设置成值{1,1,1,1,2,3,1},其中数字2是用于表演者的加权值,数字3是用于编剧的加权值。
通过参考图6中所示的流程图,下面的说明解释其中通过与节目向量PP相关联,传送节目方效应向量EfPP的情况的节目向量产生处理2。
在步骤S11-S14进行的处理与分别在参考图3说明的流程图的步骤S1-S4进行的处理相同。在这些步骤,如前所述,从元数据数据库7获得EPG数据,并从EPG数据抽取产生节目向量PP所必需的元数据。随后,如果需要,对包括在元数据中的信息进行词法分析,以便把信息分解成单词。包括在元数据中的信息的例子是标题和内容。随后,包括在元数据中的项目被转换成节目向量PP。
随后,在下一步骤S15,节目向量产生部分23根据与接收的元数据相关的节目的类型,从保存在数据存储部分24中的效应向量信息中抽取效应向量。如果节目的类型是综艺,那么从数据存储部分24抽取对表演者设置加权值5的效应向量EfPP={1,1,1,1,5,1,1}。
随后,在下一步骤S16,节目向量产生部分23使在步骤S15进行的处理中抽取的效应向量EfPP与在步骤S14进行的处理中产生的节目向量PP相关联。最后,结束处理的执行。
通过进行上述处理,节目向量PP被产生,并与根据节目的类型获得的对节目向量PP的重要项目设置加权值的节目方效应向量EfPP相关联。随后,通过网络8,节目向量PP和节目方效应向量EfPP被传送给EPG接收设备9。
节目向量PP如上所述产生。但是,通过根据节目的属性对节目分组,可用较少的处理,但是准确度较高地产生节目向量PP。
一般为了产生由具有相同类型的节目,例如在同一周内广播的连续剧组成的组,或者由在节目安排单元,例如13周中介绍相同表演者的节目组成的组,进行分组节目的处理。作为分组节目的处理的一个具体例子,通过参考图7的流程图,下面的说明解释连续剧的分组节目的分组处理1。
首先,在步骤S31,数据获取单元21从保存在元数据数据库7中的EPG数据中抽取和预定的分组条件相符的节目。作为预定分组条件的一个例子,该条件要求要被抽取的节目具有相同的标题,相同的广播电台,在所有工作日的相同广播时间或者在各周的相同日子的相同广播时间。
随后,在下一步骤S32,数据获取单元21把抽取的节目放入组中,并向节目的EPG数据附加组ID。
随后,在下一步骤S33,元数据抽取部分22抽取为了产生代表被识别为连续剧的一部分的节目,即第一节目或者由相同组ID识别的节目的第一广播的节目向量PP而需要的元数据。
随后,在下一步骤S34,进行前面参考图3或6中所示的流程图说明的节目向量产生处理。
随后,在下一步骤S35,节目向量产生部分23把第一广播的产生的节目向量PP固定并设置成由组ID识别的节目向量PP。最后,结束处理的执行。
通过进行上述处理,连续剧的节目被放入具有相同节目向量PP的组中。另外,可使组的ID和节目向量PP相互关联,并保存在数据存储部分24中。
特别地,在连续剧的EPG数据中,在许多情况下,第一内容是所有节目的描述,后续内容都只是相关节目的描述,而不是所有节目的描述。另外,对于每个节目来说,除了节目描述之外的元数据部分相同。从而,通过利用第一节目的EPG数据产生节目向量PP,不仅能够减少进行节目向量产生处理的次数,而且还能够产生高度准确地与节目的特性相符的节目向量PP。
图7是说明把公共ID加入连续剧的EPG数据中的处理的流程图。如果EPG数据已包括识别连续剧的信息,那么在步骤S31进行的处理可被消除。这种情况下,通过参考已包括在EPG数据中的用于识别连续剧的信息,公共ID被加入到连续剧的EPG数据中。
通过参考图8,下面的说明还关于不同于连续剧的元素,解释能够对节目进行分组的分组处理2。基于类型和表演者的分组如下所示。
首先,在步骤S51,数据获取部分21参考保存在元数据数据库7中的EPG数据,并把对应于节目的元数据的群集代码加入到节目的EPG数据中。
例如假定和连续剧的条件相符的节目被抽取。一般来说,连续剧的条件要求要被抽取的节目具有相同标题,相同广播电台,在所有工作日的相同广播时间或者在各周的相同日子的相同广播时间。对于识别成连续剧的节目的一组抽取节目,对应于连续剧的第一群集代码具有一般如下所述根据连续剧的广播时间确定的最低有效数位。如果构成连续剧的节目的广播时间是在所有工作日的相同时间,那么第一群集代码的最低有效数位是为1的代码。另一方面,如果构成连续剧的节目的广播时间是在各周的相同日子的相同广播时间,那么第一群集代码的最低有效数位是为2的代码。如果构成连续剧的节目的广播时间是除对应于代码1和2的时间之外的时间,例如在交替的星期或者日子,那么第一群集代码的最低有效数位是例如为3的代码。对于除连续剧之外的节目,第一群集代码的最低有效数位是例如为0的代码。
随后,参考记录在元数据数据库7中的元数据中的类型数据,以便确定对应于类型的第二群集代码中的最低有效数位中的第二数位。根据类型,第二群集代码中的最低有效数位中的第二数位被设置成例如为20的代码,为30的代码等等。第二群集代码中的最低有效数位中的第二数位是所谓的十位。
最后,参考记录在元数据数据库7中的元数据中的表演者数据,以便确定对应于表演者的第三群集代码中的最低有效数位中的第三数位,以及位序高于第三数位的其它数位。根据表演者,第三群集代码中的最低有效数位中的第三数位和位序高于第三数位的其它数位被设置成例如为2300的代码,为800的代码或者其它代码。第三群集代码中的最低有效数位中的第三数位是所谓的百位,位序高于第三数位的其它数位从而是位序高于百位的其它数位。
加入节目的EPG中的群集代码是上面描述的第一到第三群集代码的总和。
从而,在下一步骤S52,数据获取部分21通过检查分配给EPG的群集代码的第一数位是否为0,确定EPG是否是连续剧的EPG。
如果在步骤S52进行的处理中产生的确定结果指示节目是连续剧的节目,那么处理流程进入步骤S53和S54,执行分别和前面参考图7说明的流程图的步骤S33和S34相同的处理。即,第一广播的EPG被抽取,并进行前面参考图3或6中所示的流程图说明的节目向量产生处理。
随后,在下一步骤S55,节目向量产生部分23把第一广播的节目向量PP固定为连续剧的节目向量PP,并使产生的群集代码与节目向量PP相关联。最后,结束处理的执行。
另一方面,如果在步骤S52进行的处理中产生的确定结果指示节目不是连续剧的节目,那么处理流程进入步骤S56,执行前面参考图3或6中所示的流程图说明的节目向量产生处理。
随后,在下一步骤S57,节目向量产生部分23使产生的群集代码与节目向量PP相关联。最后,结束处理的执行。
通过进行上述处理,不仅可依据连续剧对节目向量PP分组,而且可依据类型和表演者对节目向量PP分组。另外,可使识别组的群集代码与该组的节目向量PP相关联。
在前面参考图2说明的分发服务器5中,如上参考图3-8所述那样产生节目向量PP。从而,总是能够以对应于新术语,新类型等的向量的形式,产生节目向量PP。产生的节目向量PP及其EPG数据通过网络8被传送给EPG接收设备,并被提供给节目推荐处理设备10。
另外,分组处理可包括将对标题进行的词法分析,以便把标题分解成单词,并向单词分配一个组ID。
下面参考图9中所示的流程图说明标题分组处理1。
首先,在步骤S61,数据获取部分21从通过参考保存在元数据数据库7中的EPG数据得到的编目元数据中抽取标题,并把标题提交给节目向量产生部分23。
随后,在下一步骤S62,节目向量产生部分23对标题进行词法分析,并把标题分解成单词。更具体地说,假定包括在元数据中的电影标题是“Toukaidou Mitsuya Ghost-story”。这种情况下,该标题被分解成下述3个单词/短语:“Toukaidou”,“Mitsuya”和“Ghost-story”。
随后,在下一步骤S63,节目向量产生部分23从作为分析的结果而获得的单词(或短语)中抽取一个单词(或者包括多个单词的短语),并从数据存储部分24抽取所抽取单词(或短语)的组ID。
包括多个单词的短语是一组单词。通过组合作为语法分析的结果而获得的单词产生该组单词。假定作为词法分析的结果获得的3个单词/短语是“Toukaidou”,“Mitsuya”和“Ghost-story”。这种情况下,该组单词可以是“Toukaidou Mitsuya”,“Toukaidou Ghost-story”或者“Mitsuya Ghost-story”。
随后,在下一步骤S64,节目向量产生部分23确定对应的组ID是否已从数据存储部分24被抽取。
如果在步骤S64进行的处理中产生的确定结果指示未从数据存储部分24抽取对应的组ID,那么处理流程进入步骤S65,节目向量产生部分23使新的组ID与抽取的单词(或者包括多个单词的抽取短语/单词组)相关联。这是因为没有对应的组ID已被保存在数据存储部分24中,并且与抽取的单词(或者包括多个单词的抽取短语/单词组)相关联。随后,节目向量产生部分23把该单词(或者包括多个单词的抽取短语/单词组)连同相关的组ID一起保存在数据存储部分24中。
另一方面,如果在步骤S64进行的处理中产生的确定结果指示已从数据存储部分24抽取了对应的组ID,那么处理流程进入步骤S66。在完成在步骤S65进行的处理之后,处理流程也进入步骤S66。在步骤S66,节目向量产生部分23确定是否已对构成标题的每个单词(或者每个单词组)抽取了一个组ID。
如果在步骤S66进行的处理中产生的确定结果指示还未对构成标题的每个单词(或者每个单词组)抽取一个组ID,那么处理流程返回步骤S63,再次执行步骤S63及后续步骤的处理。
另一方面,如果在步骤S66进行的处理中产生的确定结果指示已为构成标题的每个单词(或者每个单词组)抽取了一个组ID,那么处理流程进入步骤S67,节目向量产生部分23使抽取的组ID与节目向量PP相关联。最后,结束处理的执行。
通过进行上述处理,使构成标题的单词(或者单词组)的组ID与对应于该标题的节目向量PP相关联。数据传输部分25随后通过网络8把组ID和标题传送给TV接收设备4或者EPG接收设备9。
另外,具有类似标题的节目可被包括在相同组内。例如,通过比较作为对构成节目标题的单词进行的词法分析的结果而获得的节目标题单词,计算在预定的周期,例如2周、1个月或半年中出现的节目标题之间的相似度,标题为“Ginpachi,Second-Grade A Class Teacher”的连续剧可被放入和标题为“Ginpachi Special,Second-Grade A ClassTeacher”的特别节目相同的组中。只有当计算的相似度至少等于预定值时,连续剧和特别节目才被放入相同的组中。
通过参考图10中所示的流程图,下面的说明解释根据构成标题之一的单词和构成另一标题的单词之间的匹配度,对标题分组的标题分组处理2。
在步骤S401和S402进行的处理与分别在前面参考图9说明的流程图的步骤S61和S62进行的处理相同。即,数据获取部分21从通过参考保存在元数据数据库7中的EPG数据得到的编目元数据中抽取标题,并把标题提交给节目向量产生部分23。随后,节目向量产生部分23对每个标题进行词法分析,把每个标题分解成单词。
随后,在下一步骤S403,节目向量产生部分23计算从词法分析获得的标题的单词之间的匹配度。即,节目向量产生部分23找出代表标题之一的单词匹配另一标题的单词的匹配率。
更具体地说,我们以标题“Ginpachi,Second-Grade A ClassTeacher”和标题“Ginpachi Special,Second-Grade A Class Teacher”为例子。标题“Ginpachi,Second-Grade A Class Teacher”被分解成下述单词:“Ginpachi”,“Second”,“Grade”,“A”,“Class”和“Teacher”。另一方面,标题“Ginpachi Special,Second-Grade A Class Teacher”被分解成下述单词:“Ginpachi”,“Special”“Second”,“Grade”,“A”,“Class”和“Teacher”。随后,对单词“Ginpachi”,“Second”,“Grade”,“A”,“Class”和“Teacher”以及单词“Ginpachi”,“Special”“Second”,“Grade”,“A”,“Class”和“Teacher”进行词法分析,从而产生为6/7或者85.7%的匹配率。
随后,在下一步骤S404,节目向量产生部分23确定单词的匹配率是否至少等于预定值,例如70%。不必说,匹配率的阈值可以是不同于70%的值。
如果在步骤S404进行的处理中产生的确定结果指示单词的匹配率至少等于预定值,例如70%,那么处理流程进入步骤S405,节目向量产生部分23使相同的组ID与这些节目相关联。随后,节目向量产生部分23把匹配单词或者匹配单词组以及组ID一起保存在数据存储部分24中。
另一方面,如果在步骤S404进行的处理中产生的确定结果指示单词的匹配率小于预定值,例如70%,那么处理流程进入步骤S406。在步骤S405进行的处理结束之后,处理流程也进入步骤S406。在步骤S406,节目向量产生部分23确定标题之一的所有单词是否已与另一标题的所有单词进行比较。
如果在步骤S406进行的处理中产生的确定结果指示标题之一的所有单词还没有与另一标题的所有单词进行比较,那么处理流程返回步骤S403,再次进行步骤S403的处理以及后续步骤的处理。
另一方面,如果在步骤S406进行的处理中产生的确定结果指示标题之一的所有单词已与另一标题的所有单词进行了比较,那么结束处理的执行。
通过进行上述处理,使基于构成标题的单词的匹配率的组ID与具有该标题的节目的节目向量PP相关联。随后,数据传输部分25通过网络8,把组ID和标题传送给TV接收设备4或者EPG接收设备9。从而,具有类似标题的节目可被归入相同组中。具有类似标题的节目的例子是如上所述的连续剧和特别节目。
另外,通过根据构成标题的单词的匹配率产生组,具有相同标题的节目可被检测为同一组的节目,尽管EPG或元数据包括由半尺寸和全尺寸数字,半尺寸和全尺寸字符或小写字符和大写字符造成的符号外观差异。
此外,除了单词的匹配率之外,广播电台,节目类型或广播开始时间可被加入到分组条件中。我们以具有标题“News”的新闻节目为例。由于该标题只具有包括“News”在内的很少单词,因此在上面参考图10中所示的流程图解释的处理中,不同广播电台和不同形式的新闻节目可能会被检测为属于相同组的节目。从而,为了解决这个问题,只有相同广播电台广播的满足单词的匹配率的节目才被归入相同组中。
通过参考图11中所示的流程图,下面的说明解释除了根据构成标题之一的单词和构成另一标题的单词之间的匹配度之外,还根据要求相同广播电台的附加条件对标题分组的标题分组处理3。
在步骤S421到S424进行的处理与分别在前面参考图10说明的流程图的步骤S401到S404进行的处理相同。即,数据获取部分21从通过参考保存在元数据数据库7中的EPG数据得到的编目元数据中抽取标题,并把标题提交给节目向量产生部分23。随后,节目向量产生部分23对每个标题进行词法分析,把每个标题分解成单词。随后,节目向量产生部分23计算从词法分析获得的标题的单词之间的匹配度。即,节目向量产生部分23找出代表标题之一的单词匹配另一标题的单词的匹配率。随后,节目向量产生部分23确定单词的匹配率是否至少等于预定值,例如70%。
如果在步骤S424进行的处理中产生的确定结果指示单词的匹配率至少等于预定值,例如70%,那么处理流程进入步骤S425,节目向量产生部分23确定具有所述标题的节目是否由相同的广播电台广播。
如果在步骤S425进行的处理中产生的确定结果指示具有所述标题的节目由相同的广播电台广播,那么处理流程进行步骤S426,节目向量产生部分23使节目与相同的组ID相关联。随后,节目向量产生部分23把匹配单词或者匹配单词组以及组ID和广播电台一起保存在数据存储部分24中。
另一方面,如果在步骤S424进行的处理中产生的确定结果指示单词的匹配率小于预定值,例如70%,或者在步骤S425进行的处理中产生的确定结果指示具有所述标题的节目不是由相同的广播电台广播,那么处理流程进入步骤S427。在步骤S426进行的处理结束之后,处理流程也进入步骤S427。在步骤S427,节目向量产生部分23确定标题之一的所有单词是否已与另一标题的所有单词进行比较。
如果在步骤S427进行的处理中产生的确定结果指示标题之一的所有单词还没有与另一标题的所有单词进行比较,那么处理流程返回步骤S423,再次进行步骤S423的处理以及后续步骤的处理。
另一方面,如果在步骤S427进行的处理中产生的确定结果指示标题之一的所有单词已与另一标题的所有单词进行了比较,那么结束处理的执行。
通过进行上述处理,使基于构成标题的单词的匹配率,以及基于具有所述标题的节目由相同的广播电台广播的事实的组ID与具有所述标题的节目的节目向量相关联。随后,数据传输部分25通过网络8,把组ID和标题传送给TV接收设备4或者EPG接收设备9。从而,在把具有类似标题的节目归入相同组的处理中,防止由不同广播电台广播的节目被归入相同组中。具有类似标题,但是由不同广播电台广播的节目的例子是如上所述的新闻节目。
在上面参考图11中所示的流程图说明的处理中,除了要求构成标题的单词的匹配率至少应等于预定值的条件之外,附加条件要求节目应是由相同的广播电台广播的节目。但是,要注意的是,除了广播电台之外,广播时间段和类型当然也可被包括为除了要求构成标题的单词的匹配率至少应等于预定值的条件之外的对节目的标题分组的条件。
另外,即使由于体育实况报道或特别节目的缘故,连续剧或在固定时间内播放的节目的广播开始时间被延迟,作为除了要求构成标题的单词的匹配率至少应等于预定值的条件之外的把节目归入相同组的条件,通过确定节目的广播开始时间是否在预定的时间范围,例如1小时内,可对节目分组。
通过参考图12中所示的流程图,下面的说明解释除了根据构成节目的标题之一的单词和构成另一标题的单词之间的匹配度之外,还根据关于节目的广播开始时间是否在预定时间范围内的确定结果,对节目的标题分组的标题分组处理4。
在步骤S441到S444进行的处理与分别在前面参考图10说明的流程图的步骤S401到S404进行的处理相同。即,数据获取部分21从通过参考保存在元数据数据库7中的EPG数据得到的编目元数据中抽取标题,并把标题提交给节目向量产生部分23。随后,节目向量产生部分23对每个标题进行词法分析,把每个标题分解成单词。随后,节目向量产生部分23计算从词法分析获得的标题的单词之间的匹配度。即,节目向量产生部分23找出代表标题之一的单词匹配另一标题的单词的匹配率。随后,节目向量产生部分23确定单词的匹配率是否至少等于预定值,例如70%。
如果在步骤S444进行的处理中产生的确定结果指示单词的匹配率至少等于预定值,例如70%,那么处理流程进入步骤S445,节目向量产生部分23确定具有所述标题的节目的广播开始时间是否在预定的时间范围,例如1小时内被相互移动。
如果在步骤S445进行的处理中产生的确定结果指示具有所述标题的节目的广播开始时间在预定的时间范围内被相互移动,那么处理流程进行步骤S446,节目向量产生部分23使节目与相同的组ID相关联。随后,节目向量产生部分23把匹配单词或者匹配单词组以及组ID和广播开始时间的范围一起保存在数据存储部分24中。
另一方面,如果在步骤S444进行的处理中产生的确定结果指示单词的匹配率小于预定值,例如70%,或者在步骤S445进行的处理中产生的确定结果指示具有所述标题的节目的广播开始时间未在预定的时间范围内被相互移动,那么处理流程进入步骤S447。在步骤S446进行的处理结束之后,处理流程也进入步骤S447。在步骤S447,节目向量产生部分23确定标题之一的所有单词是否已与另一标题的所有单词进行比较。
如果在步骤S447进行的处理中产生的确定结果指示标题之一的所有单词还没有与另一标题的所有单词进行比较,那么处理流程返回步骤S443,再次进行步骤S443的处理以及后续步骤的处理。
另一方面,如果在步骤S447进行的处理中产生的确定结果指示标题之一的所有单词已与另一标题的所有单词进行了比较,那么结束处理的执行。
通过进行上述处理,使基于构成标题的单词的匹配率,以及基于具有所述标题的节目的广播开始时间在预定的时间范围内被相互移动的事实的组ID与具有所述标题的节目的节目向量相关联。随后,数据传输部分25通过网络8,把组ID和标题传送给TV接收设备4或者EPG接收设备9。从而,在除了根据构成节目的标题之一的单词和构成另一标题的单词之间的匹配度之外,还根据关于节目的广播开始时间是否在预定的时间范围内的确定结果,把具有类似标题的节目归入相同组的处理中,广播开始时间在预定的时间范围内被相互移动的节目被检测为属于相同的节目。从而能够防止在预定的时间范围内,广播开始时间被特别节目等相互移动的节目不被检测为属于相同组的节目。
图13是表示节目推荐处理设备10的结构的方框图。
数据获取部分41是从分发服务器5接收节目向量PP,以及和节目向量PP一起传送的节目方效应向量EfPP的组件。节目向量抽取部分42是从分发服务器5接收的节目向量PP抽取匹配处理所必需的,或者产生用户模型所必需的节目向量PP的组件。如果需要,节目向量抽取部分42把抽取的节目连同对应于抽取的节目向量PP的节目方效应向量EfPP一起传送给匹配处理部分43。
操作输入部分44一般包括诸如键盘、触摸垫和鼠标之类的输入装置。操作输入部分44是接收用户输入的初始编目信息以及用于产生用户模型的输入主题,并把所述信息和输入主题提供给初始目录存储部分45的组件。初始目录存储部分45是对从操作输入部分44接收的初始编目信息和同样从操作输入部分44接收的用于产生用户模型的主题编目的组件。如果需要,初始目录存储部分45把初始编目信息和主题提供给操作日志获取部分46或者匹配处理部分43。根据用户通过操作输入部分44输入的操作,不时更新保存在初始目录存储部分45中的数据。初始编目信息一般包括揭示用户不喜欢的节目的信息,以及揭示用户喜欢的节目的信息。揭示用户不喜欢的节目的信息的例子是不喜欢的类型,不喜欢的关键字和不喜欢的表演者。另一方面,揭示用户更喜欢的节目的信息的例子是喜欢的类型,喜欢的关键字和喜欢的表演者。
操作日志获取部分46是从TV显示设备11或记录/再现设备12获得操作日志,并把操作日志的信息分成正历史和负历史的组件。如果需要,操作日志获取部分46参考保存在初始目录存储部分45中的信息,从数据获取部分41获得的节目向量PP抽取对应于正负历史的节目向量PP,把对应于抽取的节目向量PP的正负历史分别提供给正历史存储部分47和负历史存储部分48。正历史存储部分47保存供给其的正历史的事件,并产生正历史向量UP。出于同样原因,负历史存储部分48保存供给其的负历史的事件,并产生负历史向量MUP。产生的正历史向量UP和产生的负历史向量MUP被提供给匹配处理部分43。
上面引用的正历史是用于抽取用户急切想要观看的节目,或者换句话说,被认为是特别喜欢的一个节目的信息。当用户观看并记录节目时,或者更具体地说,当用户接受在后面说明的处理中,从推荐节目列表中向用户建议的节目,并观看和记录接受的节目时,该节目的元数据被保存在正历史存储部分47中作为给人深刻印象的元数据。正历史存储部分47得到每个详细项目或者每个大项的正历史的总和,从而产生正历史向量UP。
另一方面,上面引用的负历史是用于从推荐节目中排除不合需要的节目的信息。不合需要的节目是用户几乎不想观看的节目。当用户不观看和记录不合需要的节目时,该节目的元数据被保存在负历史存储部分48中作为印象淡薄的元数据。不合需要的节目的例子是和在最初记录的信息中规定的不喜欢的项目对应的节目,记录之后未被观看即被删除的节目,和在后面说明的处理中,从推荐节目列表中向用户建议的,但是未被用户接受的节目。假定用户在最初记录的信息中把体育规定为不喜欢的项目。这种情况下,包括用于作为负印象的体育的加权值5的类型Gmup={0,0,5,0,0,0,0,0,0}作为附加信息被保存在负历史存储部分48中。出于相同的原因,负历史存储部分48得到每个详细项目或者每个大项的负历史的总和,从而产生负历史向量MUP。
匹配处理部分43验证从节目向量抽取部分42抽取的节目向量PP和从正历史存储部分47接收的正历史向量UP之间的,或者节目向量PP和从负历史存储部分48接收的负历史向量MUP之间的匹配。
节目向量PP,正历史向量UP和负历史向量MUP都可以是具有包括被排列成1个数组的所有详细项目分量的格式的向量。这种情况下,由于诸如标题或关键字之类的信息具有多个单词,因此在向量中,每个单词具有和诸如类型之类的项目相等的加权值。为了解决这种问题,在匹配处理部分43中采用的归一化处理部分61通过把每个单词的频率除以构成每个节目的标题的单词的数目,使用作由单词构成的项目的标题和构成所述标题的单词归一化。我们以标题Tm={Toukaidou-1,Mitsuya-1,ghost-story-1}为例。这种情况下,该标题被归一化为Tm={Toukaidou:0.33,Mitsuya:0.33,ghost-story:0.33}。这样,对于用作由单词构成的项目的标题和构成所述标题的单词,构成所述标题的单词的归一化频率的总和被用作加权值,并且由于总和为1,因此在匹配过程中不会出现任何问题。
向量运算部分62是进行用于确定节目向量PP和正历史向量UP之间的,以及节目向量PP和负历史向量MUP之间的匹配的匹配处理的组件。
如果节目向量PP,正历史向量UP和负历史向量MUP都是具有包括被排列成1个数组的所有详细项目分量的格式的向量,那么向量运算部分62得到节目向量PP和正历史向量UP之间的相似度SimUP,以及节目向量PP和负历史向量MUP之间的相似度SimMUP。相似度SimUP和相似度SimMUP都用余弦距离cosθ来表示。根据下面给出的等式(1)计算代表相似度SimUP的cosθu,而根据同样在下面给出的等式(2)计算代表相似度SimMUP的cosθm。从等式(1)和(2)可看出,通过把两个向量的内积除以这两个向量的绝对值的乘积,计算余弦距离。
SimUP=cosθu=UP·PP/|UP|×|PP|   (1)
SimMUP=cosθm=MUP·PP/|MUP|×|PP|   (2)
在上面的等式(1)和(2)中,符号PP、UP和MUP分别表示节目向量PP,正历史向量UP和负历史向量MUP。另外,符号“·”表示一个运算符,用于得到在该运算符两侧的向量的内积。另一方面,符号“×”表示一个运算符,用于得到在该运算符两侧的向量的绝对值的标积。
另外,如果节目向量PP,正历史向量UP和负历史向量MUP都是作为对每个大项进行的向量化处理的结果而获得的向量,那么向量运算部分62可得到对于每个大项,节目向量PP和正历史向量UP之间的相似度,以及节目向量PP和负历史向量MUP之间的相似度,并把关于所有大项得到的相似度的总和计算为每个相似度SimUP和相似度SimMUP。
例如假定对于被分解成单词,并被用作大项的标题,提供的正历史向量UP代表标题Tup={school-1,ghost-story-1,toilet-1},而提供的节目向量PP代表标题Tm={Toukaidou-1,Mitsuya-1,ghost-story-1}。另外我们假定单位向量的长度为1。这种情况下,向量的长度(绝对值)是分量的平方和的平方根,根据下面的等式(3)计算代表两个标题之间的相似度的正余弦距离:
cos θt = 1 · 1 / 3 × 3 = 1 / 3 - - - ( 3 )
在等式(3)中,符号“·”表示一个运算符,用于得到在该运算符两侧的向量的内积,而符号“×”表示一个运算符,用于得到在该运算符两侧的向量的绝对值的标积。
出于相同的原因,按照类似于等式(3)的方式,对于分别用作大项的标题,可得到表示由节目向量PP和负历史向量MUP代表的两个标题之间的相似度的负余弦距离。
现在,例如假定正历史向量UP是复合正历史向量UP={标题Tup,类型Gup,表演者Pup,编剧/作者/制片人Aup,内容(关键字)Kup},负历史向量MUP是复合负历史向量MUP={标题Tmup,类型Gmup,表演者Pmup,编剧/作者/制片人Amup,内容(关键字)Kmup}。这种情况下,对于用作大项的标题,类型,表演者,编剧/作者/制片人和内容中的每一个,根据等式(3)按照相同的方式得以正余弦距离和负余弦距离。由于对每个大项得到正余弦距离和负余弦距离,因此均根据如下所示的等式(4)计算相似度SimUP和相似度SimMUP:
Sim=cosθt+cosθg+cosθp+cosθa+cosθk   (4)
在上面的等式中,cosθt是关于标题大项,节目向量PP和正历史向量UP之间的,或者节目向量PP和负历史向量MUP之间的余弦距离。cosθg是关于类型大项,节目向量PP和正历史向量UP之间的,或者节目向量PP和负历史向量MUP之间的余弦距离。cosθp是关于表演者大项,节目向量PP和正历史向量UP之间的,或者节目向量PP和负历史向量MUP之间的余弦距离。cosθa是关于编剧/作者/制片人大项,节目向量PP和正历史向量UP之间的,或者节目向量PP和负历史向量MUP之间的余弦距离。cosθk是关于内容(关键字)大项,节目向量PP和正历史向量UP之间的,或者节目向量PP和负历史向量MUP之间的余弦距离。
如果如上面的等式中所示,相似度SimUP和相似度SimMUP都被计算成关于所有大项得到的余弦距离的总和,那么项目之间的加权值方面的偏差被消除。从而,上面的计算采用和前面说明的归一化相同的原理。从而,不同于节目向量PP,正历史向量UP和负历史向量MUP都具有包括排列成1个数组的所有详细项目分量的格式,由归一化处理部分61进行的归一化处理可被省略。
即,如果在不进行归一化处理的情况下使用均具有包括排列成1个数组的所有详细项目分量的格式的节目向量PP,正历史向量UP和负历史向量MUP,那么在诸如标题和内容之类的项目中,随着历史事件的数目的增大,不同的单词的数目增大,但是和具有易于重叠的分量的项目相比,每个不同单词的频率几乎不增大。具有易于重叠的分量的项目的例子是广播电台和类型。
为此,如果相似度SimUP和相似度SimMUP都被计算成关于所有分量得到的余弦距离的总和,那么均具有易于重叠的分量的每个项目的效应变得更大。具有易于重叠的分量的项目的例子是如上所述的广播电台和类型项目。我们假定用户是实况广播员A的崇拜者,从而用户喜欢观看“由实况广播员A解说的球队B的棒球比赛的实况报道”。这种情况下,用作类型项目的信息“棒球比赛的实况报道”易于重叠为历史。另一方面,用作表演者项目的信息“实况广播员A”难以重叠为历史。从而,在一些情况下,另一实况广播员B解说的球队B的棒球比赛的实况报道被推荐,而不是推荐介绍实况广播员A的综艺节目。
如果进行归一化处理,或者相似度SimUP和相似度SimMUP都被计算成关于所有大项得到的余弦距离的总和,那么实况广播员A参与的综艺节目可被推荐,而不受历史频率的量值影响。从而能够高度准确地在推荐的节目中反映用户的喜好。
另外,向量运算部分62还能够根据和节目向量PP一起传送的节目方效应向量EfPP和保存在初始目录存储部分45中的用户初始编目的信息,或者根据后面说明的产生的并在用户信息编目部分63中编目的用户方效应向量EfUP或者后面说明的用户方负效应向量EfMUP应用加权值,计算相似度SimUP和相似度SimMUP。
随后,根据通过采用上述方法计算的相似度SimUP,向量运算部分62还从具有最高相似度的节目开始,计算预定数目的节目的对负历史向量MUP的相似度SimMUP,所述预定数目的节目均具有对正历史向量UP的较高相似度SimUP。一般来说,这样的节目的预定数目被设置为10。随后,向量运算部分62得到差值(SimUP-SimMUP),并从具有最大差值(SimUP-SimMUP)的节目开始,确定均具有较大差值(SimUP-SimMUP)的预定数目的节目。最后,向量运算部分62把每个确定的节目提供给推荐信息输出部分49作为推荐节目。一般来说,均被确定为推荐节目的节目的预定数目被设置为3。
另外,如果节目向量PP已被分组,那么向量运算部分62根据关于推荐节目的信息,在用户信息编目部分63中对以第一优先级推荐的一组编目,并把以第一优先级推荐的一组的每个节目推荐为以第一优先级推荐的节目组。
除此之外,向量运算部分62能够通过使用保存在初始目录存储部分45中的主题,对节目向量PP进行过滤处理,从而产生用户模型向量,并在用户信息编目部分63中对产生的用户模型向量编目,以便进行匹配处理。用户模型将在后面详细说明。
根据作为初始目录存储部分45中用户初始编目的信息,从初始目录存储部分45接收的信息,从正历史存储部分47接收的正历史向量UP或者从负历史存储部分48接收的负历史向量MUP,用户信息编目部分63产生用户方效应向量EfUP和用户方负效应向量EfMUP,保存用户方效应向量EfUP和用户方负效应向量EfMUP。节目向量PP的用户方效应向量EfUP是对节目向量PP的分量设置加权值的向量。节目向量PP的加权分量都是对将向用户推荐的节目的选择重要的大项。在节目的选择中只使用节目向量PP的加权项目。作为一种备选方案,用户方效应向量EfUP是揭示用户对每个项目的喜好的向量。另一方面,节目向量PP的用户方负效应向量EfMUP是对节目向量PP的分量设置加权值的向量。但是,节目向量PP的加权分量都是对将向用户推荐的节目的选择不重要的大项。在节目的选择中只使用节目向量PP的非加权项目。作为一种备选方案,用户方负效应向量EfMUP是揭示用户对每个项目的不喜欢的向量。
换句话说,节目向量PP的用户方效应向量EfUP是指示用户方效应向量EfUP的每个项目对节目向量PP和正历史向量UP之间的匹配处理中的匹配的影响有多大的向量。另一方面,节目向量PP的用户方负效应向量EfMUP是指示用户方负效应向量EfMUP的每个项目对节目向量PP和负历史向量MUP之间的匹配处理中的失配的影响有多大的向量。
用户方效应向量EfUP和用户方负效应向量EfMUP都可由用户设置,或者被设置成事先确定的某一值。作为一种备选方案,也可根据初始目录存储部分45中的用户初始编目的信息,产生用户方效应向量EfUP和用户方负效应向量EfMUP。
更具体地说,假定节目向量PP的用户方效应向量EfUP是表示关于节目向量PP的分量的加权值,并且节目向量PP的加权分量都是对将向用户推荐的节目的选择重要的大项。这种情况下,如果类型是对用户重要的分量,那么对于节目向量PP={标题Tm,类型Gm,时间段Hm,广播电台Sm,表演者Pm,编剧/作者/制片人Am,内容Km},用户方效应向量EfUP被设置成典型值{1,5,1,1,1,1,1}。另一方面,如果表演者和类型都是对用户重要的分量,那么用户方效应向量EfUP被设置成典型值{1,3,1,1,5,1,1}。
假定用户方效应向量EfUP是揭示用户对每个项目的喜好的向量,并且类型大项是Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,一般文艺/记录片,新闻/报道,其它}。这种情况下,如果一般文艺/记录片是用户更喜欢的节目类型,那么用户方效应向量EfUP被设置成典型值{0,0,0,0,0,0,5,0,0}。
另外,可根据正历史向量UP或负历史向量MUP,或者通过对用户在固定时期内观看的节目计数,可产生用户方效应向量EfUP和用户方负效应向量EfMUP。除此之外,也可对每种类型产生用户方效应向量EfUP和用户方负效应向量EfMUP。通过参考图22-27中所示的流程图,说明产生用户方效应向量EfUP和用户方负效应向量EfMUP的方法。
此外,如果需要,用户信息编目部分63保存在向量运算部分2进行的处理中产生的信息。在向量运算部分2进行的处理中产生的信息包括以第一优先级推荐的一组和用户模型向量。
上面说明的匹配处理部分43还能够在不进行排除节目(该节目被认为是用户不喜欢的节目)的处理的情况下,通过从均具有对正历史向量UP的较高相似度的节目向量PP的那些节目中选择推荐节目,只根据例如正历史确定推荐节目。均具有对正历史向量UP的较高相似度的节目向量PP的节目都是用户急切想要观看的节目。另一方面,被认为是用户不喜欢的节目的节目都是用户不愿意观看的节目。
推荐信息输出部分49对推荐节目列表50上匹配处理部分43提供的推荐节目的信息编目,并把该信息提供给TV显示设备11或者记录/再现设备12。推荐节目列表50具有可从节目推荐处理设备10中除去的结构,并被用于保存由推荐信息输出部分49提供的推荐节目的信息。通过把推荐节目的信息保存在推荐节目列表50中,根据迄今保存的历史信息,即使例如使用不同的TV接收设备4,不同的TV显示设备11或者不同的记录/再现设备12,也能够进行诸如推荐节目的处理和自动记录处理之类的处理。
另外,如果需要,匹配处理部分43也与驱动器51连接。磁盘71、光盘72、磁光盘73或半导体存储器74安装在驱动器51上。如果需要,驱动器51与磁盘71、光盘72、磁光盘73或半导体存储器74交换数据。
下面参考图14中所示的流程图,说明由节目推荐处理设备10进行的产生正历史向量和负历史向量的正历史向量和负历史向量产生处理1。
首先在步骤S71,操作日志获取部分46把从初始目录存储部分45读出的初始编目数据提供给负历史存储部分48,负历史存储部分48随后通过参考初始编目数据,产生负历史向量MUP。
随后,在下一步骤S72,操作日志获取部分46确定保存在初始目录存储部分45中的初始编目数据是否已被改变。如果在步骤S72进行的处理中产生的确定结果指示初始编目数据已被改变,那么处理流程返回步骤S71,操作日志获取部分46再次进行步骤S71和S72的处理。
另一方面,如果在步骤S72进行的处理中产生的确定结果指示初始编目数据未被改变,那么处理流程进入步骤S73,操作日志获取部分46确定是否已从TV显示设备11或记录/再现设备12供给了操作日志。如果在步骤S73进行的处理中产生的确定结果指示还未从TV显示设备11或记录/再现设备12供给操作日志,那么处理流程返回步骤S72,操作日志获取部分46再次进行步骤S72和S73的处理。
另一方面,如果在步骤S73进行的处理中产生的确定结果指示已从TV显示设备11或记录/再现设备12供给了操作日志,那么处理流程进入步骤S74,操作日志获取部分46确定供给的操作日志是否是正历史。如果操作日志是例如记录操作,那么该操作中所涉及的节目的节目向量PP是正历史节目向量。另一方面,如果操作日志是擦除还未被再现的记录数据,那么该操作中所涉及的节目的节目向量PP是负历史节目向量。
如果在步骤S74进行的处理中产生的确定结果指示供给的操作日志是正历史,那么处理流程进入步骤S75,操作日志获取部分46从数据获取部分41抽取被确定为正历史的操作日志中所涉及的节目的节目向量PP,并把该节目向量PP提供给正历史存储部分47。正历史存储部分47把该节目向量PP保存为附加正历史。
随后,在下一步骤S76,正历史存储部分47得到详细项目或大项的正历史节目向量PP的总和,从而产生正历史向量UP。在步骤S76进行的处理结束之后,处理流程返回步骤S72,重复步骤S72和后续步骤的处理。
另一方面,如果步骤S74进行的处理中产生的确定结果指示供给的操作日志不是正历史,即,如果步骤S74进行的处理中产生的确定结果指示供给的操作日志是负历史,那么处理流程进入步骤S77,操作日志获取部分46从数据获取部分41抽取被确定为负历史的操作日志中所涉及的节目的节目向量PP,并把该节目向量PP提供给负历史存储部分48。负历史存储部分48把该节目向量PP保存为附加负历史。
随后,在下一步骤S78,负历史存储部分48得到详细项目或大项的负历史节目向量PP的总和,从而产生负历史向量MUP。在步骤S78进行的处理结束之后,处理流程返回步骤S72,重复步骤S72和后续步骤的处理。
一般来说,大项由复合正历史向量UP={标题Tup,类型Gup,表演者Pup,编剧/作者/制作人Aup,内容(关键字)Kup}表示,并且在每个大项中规定详细的项目。这种情况下,在表示大项的每个正历史向量UP中,表示向量和的数字被附加到构成大项的每个详细项目上。例如,如图15中所示,表示类型大项的正历史向量UP是类型Gup={(戏剧-25),(综艺-34),(体育-42),(电影-37),(音乐-73),(儿童节目/教育-120),(一般文艺/记录片-3),(新闻/报道-5),(其它-23)},其中代表正历史的总和的数字被附加到构成该大项的每个详细项目上。
代表诸如标题大项之类的大项的向量可用单词来表示。例如,表示标题大项的正历史向量UP是标题Tup={(标题1-12),(标题2-3),...},其中代表正历史的总和的数字被附加到构成该大项的每个单词上。类似于正历史向量UP,在负历史向量MUP中,代表总和的数字被附加到每个项目上。
在图15中所示的每个复合正历史向量UP(当然还有图15中未示出的复合负历史向量MUP)中,用作向量的分量的大项是标题,类型,表演者,编剧/作者/制作人和内容(关键字)。这种情况下,大项的数目小于前面参考图5说明的构成节目向量PP的大项的数目。但是不必说,复合正历史向量UP和复合负历史向量MUP可具有和节目向量PP相同的大项。
在前面参考图14中所示的流程图说明的处理中,根据在输入操作日志之前的初始编目数据,产生负历史向量MUP。不过,在数据被初始编目时,用于选择用户的喜欢节目的信息也可被编目,使得也可在输入操作日志之前产生正历史向量UP。另外,可以不根据初始编目数据,而是只根据操作日志产生正历史向量UP或负历史向量MUP。
这样,正历史向量UP和负历史向量MUP可被独立产生和保存,从而,能够进行高度准确地识别用户的喜好的匹配处理。
要注意的是,此时能够以更高的准确度找到正历史和负历史。在前面参考图14中所示的流程图说明的处理中,以对应于所有项目的正历史的节目向量PP的总和的形式产生正历史向量UP。出于同样原因,以对应于所有项目的负历史的节目向量PP的总和的形式产生负历史向量MUP。不过,也可以对应于类型的正历史的节目向量PP的总和的形式产生类型的正历史向量UP。出于同样原因,也可以对应于类型的负历史的节目向量PP的总和的形式产生类型的负历史向量MUP。
依赖于广播节目的类型,存在其中只有用户不是特别喜欢的某一表演者出现在节目中,使得在推荐的节目中不能正确反映用户的喜好的常见情况。更具体地说,我们假定用户喜爱戏剧,并且只喜爱介绍并不表演戏剧,而是作为综艺节目表演者的喜剧演员A的综艺节目。对于这样的用户,我们还假定观看综艺节目的次数与观看戏剧的次数的比例例如为2∶8。这种情况下,如果在不考虑类型的情况下累积表演者的正历史,那么在一些情况下,和喜剧演员A相比,频繁出现在戏剧中的表演者B在正历史向量UP中具有高分,尽管表演者B不是用户喜欢的演员。对于这样的情况,介绍频繁出现在戏剧中的表演者B的记录节目被推荐,而不是介绍喜剧演员A的综艺节目被推荐。为了解决该问题,对每种类型累积正历史,并根据累积的正历史为每种类型产生正历史向量UP。出于同样原因,对每种类型累积负历史,并根据累积的负历史为每种类型产生负历史向量MUP。
例如假定用户是实况广播员A的崇拜者,从而用户喜欢观看“实况广播员A解说的球队B的棒球比赛的实况报道”。这种情况下,作为类型项目的体育的信息易于重叠为历史。另一方面,作为表演者项目的“实况广播员A”的信息难以重叠为历史。从而,在一些情况下,由另一实况广播员解说的球队B的棒球比赛的实况报道被推荐,而不是介绍实况广播员A的综艺节目。为了解决这种问题,对每个表演者累积正历史,并根据累积的正历史为每个表演者产生正历史向量UP。出于同样原因,对每个表演者累积负历史,并根据累积的负历史为每个表演者产生负历史向量MUP。
通过如上所述对每个特定元素累积历史,能够以更高的准确度在推荐的节目中反映用户的喜好,而不会失去用户真正喜欢的事物。
从而,匹配处理部分43能够验证正历史向量UP和提供的节目向量PP之间的匹配,以及负历史向量MUP和供给的节目向量PP之间的匹配,从而,能够产生正确反映用户的喜好的推荐节目信息。
参考图16中所示的流程图,下面的说明解释所进行的根据对每种类型累积的历史,产生正历史向量UP和负历史向量MUP的正历史向量和负历史向量产生处理2。
在步骤S81-S84进行的处理与分别在上面参考图14说明的流程图的步骤S71-S74进行的处理相同。即,操作日志获取部分46把初始编目数据提供给负历史存储部分48,负历史存储部分48随后通过参考初始编目数据,产生负历史向量MUP。之后,操作日志获取部分46确定初始编目数据是否已被改变。
如果初始编目数据未被改变,那么操作日志获取部分46确定操作日志是否已被提供。
如果操作日志已被提供,那么处理流程进入步骤S84,确定操作日志是否是正历史。如果操作日志是正历史,那么处理流程进入步骤S85,操作日志获取部分46从数据获取部分41抽取和被确定为正历史的操作日志中所涉及的节目对应的节目向量PP,并把获得的节目向量PP提供给正历史存储部分47。正历史存储部分47随后抽取该节目向量PP的类型。
随后,在下一步骤S86,正历史存储部分47把从数据获取部分41获得的节目向量PP保存为所抽取类型的附加正历史。
随后,在下一步骤S87,正历史存储部分47得到关于与额外保存的节目向量PP相关的类型的所有详细项目或所有大项的正历史节目向量PP的总和,以便产生该类型的正历史向量UP。在步骤S87进行的处理结束之后,处理流程返回步骤S82,再次进行步骤S82和后续步骤的处理。
另一方面,如果在步骤S84进行的处理中产生的确定结果指示操作日志是负历史,那么处理流程进入步骤S88,操作日志获取部分46从数据获取部分41抽取和被确定为负历史的操作日志中所涉及的节目对应的节目向量PP,并把获得的节目向量PP提供给负历史存储部分48。负历史存储部分48随后抽取该节目向量PP的类型。
随后,在下一步骤S89,负历史存储部分48把从数据获取部分41获得的节目向量PP保存为所抽取类型的附加负历史。
随后,在下一步骤S90,负历史存储部分48得到关于与额外保存的节目向量PP相关的类型的所有详细项目或所有大项的负历史节目向量PP的总和,以便产生该类型的负历史向量MUP。在步骤S90进行的处理结束之后,处理流程返回步骤S82,再次进行步骤S82和后续步骤的处理。
通过进行上述处理,为每种类型产生正历史向量UP和负历史向量MUP。从而,能够以更高的准确度在正历史向量UP和负历史向量MUP反映用户的喜好,而不会失去用户真正喜欢的事物。从而,能够产生关于正确反映用户的喜好的推荐节目的信息。
参考图17中所示的流程图,下面的说明解释对于其中节目向量PP,正历史向量UP和负历史向量MUP都具有包括排列成1个数组的所有详细项目分量的格式的情况,所进行的识别匹配节目的匹配处理1。
首先在步骤S101,节目向量抽取部分42从数据获取部分41获得多个节目,例如在预定时间段中广播的节目的节目向量PP,并把节目向量PP提供给在匹配处理部分43中采用的归一化处理部分61。归一化处理部分61对作为均代表构成标题和内容的一个单词的分量,包括在每个接收的节目向量PP中的分量和包括在从正历史存储部分47获得的正历史向量UP中的分量进行归一化。随后,归一化处理部分61把归一化结果提供给向量运算部分62。
更具体地说,我们假定接收的节目向量PP代表例如标题Tm={Toukaidou-1,Mitsuya-1,ghost-story-1}。这种情况下,归一化处理部分61把节目向量PP归一化为标题Tm={Toukaidou:0.33,Mitsuya:0.33,ghost-story:0.33}。通过这样进行归一化处理,对于每个节目,可使应用于用作构成节目标题的项目的单词的加权值的总和等于1。
随后,在下一步骤S102,在匹配处理部分43中采用的向量运算部分62通过利用前面给出的等式(1),以每个节目向量PP和正历史向量UP之间的余弦距离的形式计算相似度SimUP。
随后,在下一步骤S103,向量运算部分62通过相互比较相似度SimUP,从具有对正历史向量UP的最高相似度SimUP的向量开始,抽取预定数目的短距离节目向量PP,检查相似度SimUP,相似度SimUP均已在步骤S102进行的处理中被计算为每个节目向量PP和正历史向量UP之间的余弦距离。例如,向量运算部分62抽取10个节目向量PP。
随后,在下一步骤S104,向量运算部分62通过利用前面给出的等式(2),以在步骤S103进行的处理中抽取的每个节目向量PP和从负历史存储部分48获得的负历史向量MUP之间的余弦距离的形式计算相似度SimMUP。
随后,在下一步骤S105,向量运算部分62计算相似度SimUP和对应相似度SimMUP之间的差值,抽取从具有最大差值的节目开始的预定数目的最相似节目的节目向量PP(或EPG数据)作为推荐信息,并把推荐信息提供给推荐信息输出部分49。如前所述,相似度SimUP是节目向量PP和正历史向量UP之间的余弦距离。出于同样原因,相似度SimMUP是节目向量PP和负历史向量MUP之间的余弦距离。例如,向量运算部分62抽取具有最大差值的节目的节目向量PP(或者EPG数据)。推荐信息随后在推荐信息列表50中被编目,并被输出给电视显示设备11和记录/再现设备12。最后,结束该流程图表示的处理的执行。
通过进行上述处理,在节目向量PP,正历史向量UP和负历史向量MUP均具有包括排列成1个数组的所有详细项目分量的格式的情况下,能够根据节目向量PP和正历史向量UP之间的相似度SimUP,以及节目向量PP和负历史向量MUP之间的相似度SimMUP,确定和用户的喜好相符的推荐节目。
通过参考图18中所示的流程图,下面的说明解释匹配处理2,其中不是对用作向量的分量的每个单词进行归一化,而是对每个大项计算余弦距离,并得到计算的余弦距离的总和,作为将被用于确定推荐节目的相似度SimUP或相似度SimMUP。
首先在步骤S111,节目向量抽取部分42从数据获取部分41抽取多个节目的节目向量PP,并把节目向量PP提供给在匹配处理部分43中采用的向量运算部分62。节目的一个例子是在预定的一段时间内广播的节目。随后,对于构成前面引用的复合(compound)正历史向量UP的每个大项,向量运算部分62计算每个节目向量PP和从正历史存储部分47读出的正历史向量UP之间的余弦距离。
随后在步骤S112,根据前面给出的等式(4),向量运算部分62对每个项目计算在步骤S111进行的处理中计算的每个余弦距离的总和,从而得到相似度SimUP。
随后,在下一步骤S113,通过相互比较相似度SimUP,向量运算部分62检查在步骤S112进行的处理中得到的相似度SimUP。每个相似度SimUP代表节目向量PP和正历史向量UP之间的余弦距离的总和。向量运算部分62随后从具有最高相似度SimUP的向量开始,抽取预定数目的短距离节目向量PP。抽取的节目向量PP的预定数目一般为10。
随后,在下一步骤S114,向量运算部分62对构成前面引用的复合负历史向量MUP的每个大项,计算在步骤S113进行的处理中抽取的每个节目向量PP和从负历史存储部分48读出的负历史向量MUP之间的余弦距离。
随后,在下一步骤S115,根据前面给出的等式(4),向量运算部分62对每个项目计算在步骤S114进行的处理中计算的每个余弦距离的总和,从而得到相似度SimMUP。
随后,在下一步骤S116,向量运算部分62计算相似度SimUP和对应相似度SimMUP之间的差值,抽取从具有最大差值的节目开始的预定数目的最相似节目的节目向量PP(或EPG数据)作为推荐信息,并把推荐信息提供给推荐信息输出部分49。如前所述,相似度SimUP是节目向量PP和正历史向量UP之间的余弦距离。出于同样原因,相似度SimMUP是节目向量PP和负历史向量MUP之间的余弦距离。例如,向量运算部分62抽取具有最大差值的3个节目的节目向量PP(或者EPG数据)。推荐信息随后在推荐信息列表50中被编目,并被输出给电视显示设备11和记录/再现设备12。最后,结束该流程图表示的处理的执行。
通过进行上述匹配处理,不是对用作向量的分量的每个单词进行归一化,而是对每个大项计算余弦距离,得到计算的余弦距离的总和,作为将被用于确定推荐节目的相似度SimUP或相似度SimMUP。从而能够根据节目向量PP和正历史向量UP之间的相似度,以及节目向量PP和负历史向量MUP之间的相似度,确定和用户的喜好相符的推荐节目,而不受由属于不同大项的详细元素之间的历史重叠引起的偏差的影响。
在前面参考图17中所示的流程图说明的匹配处理1和前面参考图18中所示的流程图说明的匹配处理2中,从由对正历史向量UP的最高相似度指示的用户最喜欢节目中排除由负历史指示的用户最不喜欢的节目。但是,通过例如只利用正历史,也能够确定推荐节目。
另外,在选择节目的处理中,在一些情况下,用户可能已依据更喜欢新闻和报道节目,喜欢类型胜过表演者,或者认为内容重要而不关心表演者,确定了被加权和不被加权的项目。换句话说,用户具有用于选择节目的一些重要项目和不重要项目。
从而,匹配处理1和匹配处理2可使用前面已说明的节目方效应向量EfPP,用户方效应向量EfUP和用户方负向量EfMUP。另外,可允许用户确定是否使用节目方效应向量EfPP,用户方效应向量EfUP和用户方负向量EfMUP。
通过参考图19中所示的流程图,下面的说明解释允许用户确定是否使用对其来说,节目向量PP,正历史向量UP和负历史向量MUP都是具有包括排列成1个数组的所有详细项目分量的格式的向量的节目方效应向量EfPP,用户方效应向量EfUP的匹配处理3。
首先,在步骤S121,向量运算部分62从初始目录存储部分45获得节目方效应向量EfPP,用户方效应向量EfUP或用户方负向量EfMUP的利用设置数据。用户已通过操纵操作输入部分44,把利用设置数据输入了初始编目存储部分45。利用设置数据是指示在匹配处理中是否通过利用节目方效应向量EfPP,用户方效应向量EfUP或用户方负向量EfMUP,应用加权值的信息。
随后,在下一步骤S122,如果需要,向量运算部分62从用户信息编目部分63读出用户方效应向量EfUP,并根据下面给出的等式(5)计算每个节目向量PP和正历史向量UP之间的余弦距离,从而得到相似度SimUP。
SimUP = epd 1 · eud 1 · p 1 · u 1 + epd 2 · eud 2 · p 2 · u 2 + . . . | PP | | UP | - - - ( 5 )
注意在等式(5)中,节目向量PP=(p1,p2,...),正历史向量UP=(u1,u2,...),节目方效应向量EfPP=(epd1,epd2,...)和用户方效应向量EfUP=(eud1,eud2,...)被认为分别代表节目向量PP,正历史向量UP,节目方效应向量EfPP和用户方效应向量EfUP。另外,在等式(5)中,还假定节目方效应向量EfPP和用户方效应向量EfUP被使用。但是,节目方效应向量EfPP和用户方效应向量EfUP任意之一可不被使用。这种情况下,值1代替了不被使用的节目方效应向量EfPP或用户方效应向量EfUP。
除此之外,用户方效应向量EfUP可以是可由用户设置的向量,一个根据用户给出的初始设置设定的向量,或者在用户信息编目部分63中产生的向量。后面将参考图22-25中所示的流程图,详细说明用户方效应向量EfUP的产生。
随后,在下一步骤S123,向量运算部分62通过相互比较相似度SimUP,检查在步骤S122进行的处理中得到的相似度SimUP。每个相似度SimUP代表节目向量PP和正历史向量UP之间的余弦距离。向量运算部分62随后从具有最高相似度SimUP的向量开始,抽取预定数目的短距离节目向量PP。抽取的节目向量PP的预定数目一般为10。
随后,在下一步骤S124,如果需要,向量运算部分62从用户信息编目部分63读出用户方负效应向量EfMUP,并根据下面给出的等式(6)计算在步骤S123进行的处理中抽取的每个节目向量PP和负历史向量MUP之间的余弦距离,从而得到相似度SimMUP。
SimUP = epd 1 · emd 1 · p 1 · m 1 + epd 2 · emd 2 · p 2 · m 2 + . . . | PP | | MP | - - - ( 6 )
注意在等式(6)中,节目向量PP=(p1,p2,...),负历史向量MUP=(m1,m2,...),节目方效应向量EfPP=(epd1,epd2,...)和用户方负效应向量EfMUP=(emd1,emd2,...)被认为分别代表节目向量PP,负历史向量MUP,节目方效应向量EfPP和用户方负效应向量EfMUP。另外,在等式(6)中,还假定节目方效应向量EfPP和用户方负效应向量EfMUP被使用。但是,节目方效应向量EfPP和用户方负效应向量EfMUP任意之一可不被使用。这种情况下,值1代替了不被使用的节目方效应向量EfPP或用户方负效应向量EfMUP。
除此之外,用户方负效应向量EfMUP可以是可由用户设置的向量,一个根据用户给出的初始设置设定的向量,或者在用户信息编目部分63中产生的向量。后面将参考图26或27中所示的流程图,详细说明用户方负效应向量EfMUP的产生。
随后,在下一步骤S125,向量运算部分62计算相似度SimUP和对应相似度SimMUP之间的差值,抽取从具有最大差值的节目开始的预定数目的最相似节目的节目向量PP(或EPG数据)作为推荐信息,并把推荐信息提供给推荐信息输出部分49。如前所述,相似度SimUP是节目向量PP和正历史向量UP之间的余弦距离。出于同样原因,相似度SimMUP是节目向量PP和负历史向量MUP之间的余弦距离。例如,向量运算部分62抽取具有最大差值的3个节目的节目向量PP(或者EPG数据)。推荐信息随后在推荐信息列表50中被编目,并被输出给电视显示设备11和记录/再现设备12。最后,结束该流程图表示的处理的执行。
通过进行上述匹配处理,根据设置数据,节目方效应向量EfPP,用户方效应向量EfUP或用户方负效应向量EfMUP被用于抽取推荐信息。从而,能够推荐正确反映用户的喜好的信息。
在上面参考图19中所示的流程图说明的处理中,节目向量PP,正历史向量UP和负历史向量MUP都是具有包括排列成1个数组的所有详细项目分量的格式的向量。不过,可对每个大项处理节目向量PP,正历史向量UP和负历史向量MUP。
通过参考图20中所示的流程图,下面的说明解释允许在对于每个大项的匹配过程中,反映节目方效应向量EfPP,用户方效应向量EfUP或用户方负效应向量EfMUP。
首先,在步骤S131,进行和图19中所示的流程图的步骤S121相同的处理,从而获得节目方和用户方的效应向量的利用设置数据。
随后,在下一步骤S132,对于构成复合正历史向量UP的每个大项,向量运算部分62计算每个输入的节目向量PP和从正历史存储部分47读出的正历史向量UP之间的余弦距离。在该计算中,没有使用效应向量。
随后,在下一步骤S133,根据下面给出的等式(7),向量运算部分62把关于每个项目计算的余弦距离乘以效应向量(需要的话),并计算每个项目的余弦距离或者所得到的乘积的总和,从而得到相似度SimUP。
SimUP=epdt·eudt·cosθut+epdg·eudg·cosθug
+epdp·eudp·cosθup+epda·euda·cosθua
+epdk·eudk·cosθuk   (7)
注意在上面的等式(7)中,节目向量PP=(pt,pg,pp,pa,pk)和正历史向量UP=(ut,ug,up,ua,uk)之间的余弦距离由(cosθut,cosθug,cosθup,cosθua,cosθuk)表示,节目方效应向量EfPP由EfPP=(epdt,epdg,epdp,epda,epdk)表示,而用户方效应向量EfUP由EfUP=(eudt,eudg,eudp,euda,eudk)表示。另外在等式(7)中,节目方效应向量EfPP和用户方效应向量EfUP都被使用。但是,节目方效应向量EfPP和用户方效应向量EfUP任意之一可以不被使用。这种情况下,值1代替未使用的节目方效应向量EfPP或用户方效应向量EfUP。
随后,在下一步骤S134,向量运算部分62通过相互比较相似度SimUP,检查以节目向量PP和正历史向量UP之间的余弦距离的总和的形式,在步骤S133进行的处理中得到的相似度SimUP。向量运算部分62随后从具有最高相似度SimUP的向量开始,抽取预定数目的短距离节目向量PP。抽取的节目向量PP的预定数目一般为10。
随后,在下一步骤S135,向量运算部分62关于每个大项,计算在步骤S134进行的处理中抽取的每个节目向量PP和从负历史存储部分48读出的负历史向量MUP之间的余弦距离。这种情况下,不使用效应向量。
随后,在下一步骤S136,根据下面给出的等式(8),向量运算部分62把关于每个项目计算的余弦距离乘以效应向量(需要的话),并计算余弦距离或者所得到的乘积的总和,从而得到相似度SimMUP。
SimMUP=epdt·emdt·cosθmt+epdg·emdg·cosθmg
+epdp·emdp·cosθmp+epda·emda·cosθma
+epdk·emdk·cosθmk   (8)
注意在上面的等式(8)中,节目向量PP=(pt,pg,pp,Pa,pk)和负历史向量MUP=(mt,mg,mp,ma,mk)之间的余弦距离由(cosθmt,cosθmg,cosθmp,cosθma,cosθmk)表示,节目方效应向量EfPP由EfPP=(epdt,epdg,epdp,epda,epdk)表示,而用户方负效应向量EfMUP由EfMUP=(emdt,emdg,emdp,emda,emdk)表示。另外在等式(8)中,节目方效应向量EfPP和用户方负效应向量EfMUP都被使用。但是,节目方效应向量EfPP和用户方负效应向量EfMUP任意之一可以不被使用。这种情况下,值1代替未使用的节目方效应向量EfPP或用户方负效应向量EfMUP。
随后,在下一步骤S137,向量运算部分62计算相似度SimUP和对应相似度SimMUP之间的差值,抽取从具有最大差值的节目开始的预定数目的最相似节目的节目向量PP(或EPG数据)作为推荐信息,并把推荐信息提供给推荐信息输出部分49。如前所述,相似度SimUP是节目向量PP和正历史向量UP之间的余弦距离。出于同样原因,相似度SimMUP是节目向量PP和负历史向量MUP之间的余弦距离。例如,向量运算部分62抽取具有最大差值的3个最类似节目的节目向量PP(或者EPG数据)。推荐信息随后在推荐信息列表50中被编目,并被输出给电视显示设备11和记录/再现设备12。最后,结束该流程图表示的处理的执行。
在上述处理中,对于每个大项,效应向量都被用作加权值。从而,能够产生和用户的喜好的细节相符的推荐信息。
通过参考图21中所示的流程图,下面的说明解释所进行的通过使用由前面参考图16中所示的流程图说明的正历史向量和负历史向量产生处理2关于每种类型产生的正历史向量UP和负历史向量MUP,以及使用为每种类型提供的用户方效应向量EfUP和用户方负效应向量EfMUP来识别匹配节目的匹配处理5。
首先,在步骤S141,进行和图19中所示的流程图的步骤S121相同的处理,从而获得效应向量的设置数据。
随后,在下一步骤S142,向量运算部分62抽取输入节目向量PP的类型。在下面的说明中,输入节目向量PP的类型例如是戏剧。
随后,在下一步骤S143,向量运算部分62从正历史存储部分47读出基于戏剧类型的正历史向量UP,并关于构成复合正历史向量UP的每个大项,计算每个输入节目向量PP和正历史向量UP之间的余弦距离。这种情况下,没有使用效应向量。
随后,在下一步骤S144,根据下面给出的等式(9),向量运算部分62把关于每个项目计算的余弦距离乘以戏剧类型的用户方效应向量(需要的话),并计算每个项目的余弦距离或者所得到的乘积的总和,从而得到相似度SimUP。
SimUP=epdt·eudtd·cosθutd+epdg·eudgd·cosθugd
+epdp·eudpd·cosθupd+epda·eudad·cosθuad
+epdk·eudkd·cosθukd   (9)
注意在上面的等式(9)中,节目向量PP=(pt,pg,pp,pa,pk)和正历史向量UP=(ut,ug,up,ua,uk)之间的余弦距离由(cosθutd,cosθugd,cosθupd,cosθuad,cosθukd)表示,节目方效应向量EfPP由EfPP=(epdt,epdg,epdp,epda,epdk)表示,而用户方效应向量EfUP由EfUP=(eudtd,eudgd,eudpd,eudad,eudkd)表示。另外在等式(9)中,节目方效应向量EfPP和用户方效应向量EfUP都被使用。但是,节目方效应向量EfPP和用户方效应向量EfUP任意之一可以不被使用。这种情况下,值1代替未使用的节目方效应向量EfPP或用户方效应向量EfUP。
随后,在下一步骤S145,向量运算部分62通过相互比较相似度SimUP,检查以节目向量PP和正历史向量UP之间的余弦距离的总和的形式,在步骤S144进行的处理中得到的相似度SimUP。向量运算部分62随后从具有最高相似度SimUP的向量开始,抽取预定数目的短距离节目向量PP。抽取的节目向量PP的预定数目一般为10。
随后,在下一步骤S146,向量运算部分62关于每个大项,计算在步骤S145进行的处理中抽取的每个节目向量PP和关于戏剧类型从负历史存储部分48读出的负历史向量MUP之间的余弦距离。这种情况下,不使用效应向量。
随后,在下一步骤S147,通过使用下面给出的等式(10),向量运算部分62把关于每个项目计算的余弦距离乘以戏剧类型的效应向量(需要的话),并计算余弦距离或者所得到的乘积的总和,从而得到相似度SimMUP。
SimMUP=epdt·emdtd·cosθmtd+epdg·emdgd·cosθmgd
+epdp·emdpd·cosθmpd+epda·emdad·cosθmad
+epdk·emdkd·cosθmkd   (10)
注意在上面的等式(10)中,节目向量PP=(pt,pg,pp,pa,pk)和负历史向量MUP=(mt,mg,mp,ma,mk)之间的余弦距离由(cosθmtd,cosθmgd,cosθmpd,cosθmad,cosθmkd)表示,节目方效应向量EfPP由EfPP=(epdt,epdg,epdp,epda,epdk)表示,而用户方负效应向量EfMUP由EfMUP=(emdtd,emdgd,emdpd,emdad,emdkd)表示。另外,在等式(10)中,节目方效应向量EfPP和用户方负效应向量EfMUP都被使用。但是,节目方效应向量EfPP和用户方负效应向量EfMUP任意之一可以不被使用。这种情况下,值1代替未使用的节目方效应向量EfPP或用户方负效应向量EfMUP。
随后,在下一步骤S148,向量运算部分62计算相似度SimUP和对应相似度SimMUP之间的差值,抽取从具有最大差值的节目开始的预定数目的最相似节目的节目向量PP(或EPG数据)作为推荐信息,并把推荐信息提供给推荐信息输出部分49。如前所述,相似度SimUP是节目向量PP和正历史向量UP之间的余弦距离。出于同样原因,相似度SimMUP是节目向量PP和负历史向量MUP之间的余弦距离。例如,向量运算部分62抽取具有最大差值的3个节目的节目向量PP(或者EPG数据)。推荐信息随后在推荐信息列表50中被编目,并被输出给电视显示设备11和记录/再现设备12。最后,结束该流程图表示的处理的执行。
在上述处理中,对于每个大项,计算每个节目向量PP和类型的正历史向量UP之间的余弦距离,以及每个节目向量PP和类型的负历史向量MUP之间的余弦距离,通过把类型的效应向量用作加权值,得到相似度。从而,能够产生和用户的喜好的细节相符的推荐信息。
另外,根据初始目录存储部分45中用户最初编目的数据,产生用户方效应向量EfUP和用户方负效应向量EfMUP。作为一种备选方案,根据正历史向量UP或负历史向量MUP,或者通过对用户在预定时间内观看的节目计数,产生用户独有的用户方效应向量EfUP和用户方负效应向量EfMUP。
通过参考图22中所示的流程图,下面的说明解释所进行的通过对用户在固定时间内观看的节目计数,产生用户方效应向量EfUP的用户方效应向量产生处理1。
首先,在步骤S151,在匹配处理部分43中采用的用户信息编目部分63选择未处理的大项。
随后,在下一步骤S152,用户信息编目部分63通过参考保存在正历史存储部分47中的正历史,检测用户在预定时间,例如1周,1月或3月内观看的节目,请求节目向量抽取部分42从数据获取部分41抽取用户在预定时间内观看的节目的节目向量PP,并关于构成在步骤S151进行的处理中选择的大项的每个详细项目对节目的数目计数。
更具体地说,例如假定在步骤S151进行的处理中选择的大项是类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,一般文艺/记录片,新闻/报道,其它}。这种情况下,通过把对应于节目的节目向量PP的分量归入构成该大项的项目中,用户信息编目部分63对用户在预定时间内观看的节目的数目计数。例如假定用户在预定时间内观看的节目的数目为50。这种情况下,对用户在预定时间内观看的节目的数目计数的结果是例如Gm={10,18,5,2,8,1,0,1,5}。
随后,在下一步骤S153,用户信息编目部分63请求节目向量抽取部分42从数据获取部分41抽取在相同的预定时间内广播的所有节目的节目向量PP,并关于构成在步骤S151进行的处理中选择的大项的每个详细项目对节目的数目计数。
更具体地说,例如假定在步骤S151进行的处理中选择的大项是类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,一般文艺/记录片,新闻/报道,其它}。这种情况下,通过把对应于节目的节目向量PP的分量归入构成该大项的项目中,用户信息编目部分63对在相同的预定时间内广播的所有节目的数目计数。例如假定在相同的预定时间内广播的所有节目的数目为1000。这种情况下,对在相同的预定时间内广播的所有节目的数目计数的结果是例如Gm={104,239,68,25,78,91,60,254,81}。
随后,在下一步骤S154,用户信息编目部分63计算用户实际观看的节目的数目与所有节目的数目的比值。如上所述,用户实际观看的节目的数目与所有节目的数目已分别在步骤S152和S153进行的处理中获得。
收视率竞争的影响使节目安排被看作反映一般公众的喜好的安排。即,计算用户实际观看的节目的数目与所有节目的数目的比值的处理换句话说等同于通过把所有节目的数目用作标准模型,使用户实际观看的节目的数目归一化的处理。在步骤S154进行的处理中得到的归一化向量被称为归一化向量D。
例如假定在步骤S151进行的处理中选择的大项是类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,一般文艺/记录片,新闻/报道,其它}。例如还假定1周内广播的所有节目的数目为(8,12,3,7,6,4,2,8,10),用户实际观看的节目的数目为(4,0,1,2,3,4,5,5,2)。这种情况下,归一化向量D=(4/8,0/12,1/3,2/7,3/6,4/4,1/2,2/8,2/10)=(0.5,0,0.33,0.28,0.5,1.0,0.5,0.13,0.2)。从而,等于1.0的归一化向量D的分量意味着关于该分量在预定时间内广播的所有节目用户都观看了。另一方面,等于0的归一化向量D的分量意味着关于该分量在预定时间内广播的所有节目用户都没有观看。
随后,在下一步骤S155,用户信息编目部分63根据在步骤S154进行的处理中获得的计算结果,产生大项的效应向量。
为了产生效应向量,大项类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,一般文艺/记录片,新闻/报道,其它}的一个项目被用于设置标准值。例如假定普通用户大约观看一周内广播的戏剧节目的20%。这种情况下,标准值被设置成0.2。由于该大项的效应向量被计算成相对值,效应向量可具有在0-1范围中的值。从而用户方效应向量具有从作为在步骤S154进行的处理的结果而获得的归一化向量D和用作基准的设置值计算得到的相对值。
从而,表示用户的喜欢类型的大项类型Gm的效应向量E被计算成E=(0.3,-0.2,0.13,0.08,0.3,0.8,0.3,-0.07,0.0),这得到指示用户喜欢儿童节目/教育类型,但是不喜欢综艺类型的确定结果。
随后,在下一步骤S156,用户信息编目部分63确定是否已产生所有大项的效应向量。如果在步骤S156进行的处理中产生的确定结果指示还没有产生所有大项的效应向量,那么处理流程返回步骤S151,再次执行步骤S151和后续步骤的处理。
另一方面,如果在步骤S156进行的处理中产生的确定结果指示已产生所有大项的效应向量,那么处理流程进入步骤S157,用户信息编目部分63保存所有大项的效应向量。最后,结束由该流程图表示的处理的执行。
通过进行上述处理,能够得到一般公众的喜好和用户独有的喜好之间的差别。另外,通过关于每个预定的一段时间,例如3月或半年,重新计算用户方效应向量EfUP,能够实时地推荐反映用户的喜好的节目。
另外,在上面参考图22中所示的流程图说明的处理中,根据用户在预定的时间,例如1周,1月或3月内观看的节目,得到用户方效应向量EfUP。用作计算用户方效应向量EfUP的节目可以是在多个时段,例如较短时段,中等时段和较长时段内观看的节目。这种情况下,根据用户在每个时段内观看的节目得到用户方效应向量EfUP,用户方效应向量EfUP被用于确定推荐信息。
在上述处理中,用户独有的喜好被用作用户方效应向量EfUP。但是,用户独有的喜好也可被用作匹配处理的正历史向量UP。
除此之外,代替所有广播的节目,只对用户主要观看节目的特定预定时段内广播的节目的数目计数。这种特定时段的一个例子是从18:00到22:00的所谓黄金时段。通过设置这样的特定预定时段,能够显著减少找出一般公众的喜好的计算处理的数量。
参考图23中所示的流程图,下面的说明解释所进行的通过计算余弦距离,得到将被用来在匹配处理中使用用户独有的喜好和一般公众的喜好之间的差异的用户方效应向量EfUP的用户方效应向量产生处理2,所述余弦距离表示正历史向量UP和一般公众的喜好之间的相似度。
首先,在步骤S161,在匹配处理部分43中采用的用户信息编目部分63获得保存在正历史存储部分47中的正历史向量UP。
随后,在下一步骤S162,用户信息编目部分63获得表示一般公众的喜好的标准喜好向量APP。
标准喜好向量APP可以是从分发服务器5接收的向量,或者由于收视率竞争的效果使节目的安排被看作反映一般公众的喜好的安排,按照上面参考图22中所示的流程图说明的用户方效应向量产生处理1相同的方式,在预定时段内广播的所有节目的数目可被计数,并且如果需要,可进行归一化处理,以便得到标准喜好向量APP。
在分发服务器5中,通过利用一般收视率的调查结果,或者采用另一方法,可产生标准喜好向量APP。
随后,在下一步骤S163,用户信息编目部分63对每个大项,计算正历史向量UP和标准喜好向量APP之间的余弦距离。余弦距离越长,那么正历史向量UP和标准喜好向量APP之间的相似度越高。
随后,在下一步骤S164,用户信息编目部分63通过得到在步骤S163进行的处理中计算的余弦距离的倒数,产生每个大项的用户方效应向量EfUP。最后,结束由该流程图代表的处理的执行。余弦距离的倒数越大,那么正历史向量UP和标准喜好向量APP之间的相似度越低。
通过进行上述处理,能够得到反映一般公众的喜好和用户独有的喜好之间的差异的用户方效应向量EfUP。通过利用该用户方效应向量EfUP进行节目推荐处理,能够确定强调一般公众的喜好和用户独有的喜好之间的差异的推荐节目。
在上面的说明中,节目向量PP和正历史向量UP都是为每个大项提供的向量。但是要注意节目向量PP和正历史向量UP也可以都是具有包括排列成1个数组的所有详细项目分量的格式的向量。另外在这种情况下,不必说也可进行相同的处理。
另外,正历史向量UP和标准喜好向量APP之间的相似度不仅用于计算效应向量,而且是表示用户的独特性的指示符,这样的指示符可直接用于节目的推荐。例如,对于正历史向量UP和标准喜好向量APP之间的较高相似度来说,可首先推荐风格迎合公众的新节目。
如上参考图22和23中所示的流程图所述,如果根据学习过程中,用户进行的操作的历史,恰当地得到用户方效应向量EfUP。但是,用户方效应向量EfUP也可事先被初始编目。作为另一种备选方案,根据经验得到的值也可被事先设置成用户方效应向量EfUP。
要注意的是通过不仅注意大项,而且注意构成每个大项的详细项目,能够产生用户方效应向量EfUP。例如假定构成大项的表演者Pm被分成主角表演者和配角表演者。和戏剧或电影中主角表演者的角色分配相比,优先考虑配角表演者的角色分配的用户可设置用户方效应向量EfUP,以增大配角表演者的加权值。在另一情况下,假定构成用作大项的编剧/作者/制作人元素的人员,例如导演、制片人、作者和摄影师被相互区分。这种情况下,和导演及制片人相比,更欣赏摄影师的用户可设置用户方效应向量EfUP,以便增大摄影师的加权值。
另外,可为每种类型产生用户方效应向量EfUP,并用在匹配处理中,对比为其产生用户方效应向量EfUP的类型的正历史向量UP与节目向量PP,如同上面参考图21中所示的流程图说明的匹配处理5的情况一样。
参考图24中所示的流程图,下面的说明解释所进行的通过关于每种类型,对用户在预定时段中观看的节目计数,产生用户方效应向量EfUP的用户方效应向量产生处理3。
首先,在步骤S171,在匹配处理部分43中采用的用户信息编目部分63选择将关于其对用户在预定时段内观看的节目计数的类型。
随后,在下一步骤S172,用户信息编目部分63选择所选类型的未处理大项。
随后,在下一步骤S173,通过参考保存在正历史存储部分47中的正历史,用户信息编目部分63在用户在预定时段,例如1周,1月或3月内观看的那些节目中检测所选类型的节目。随后,用户信息编目部分63请求节目向量抽取部分42从数据获取部分41抽取检测到的节目的节目向量PP,并关于构成在步骤S172进行的处理中选择的类型大项的每个详细项目,对检测到的节目计数。
随后,在下一步骤S174,用户信息编目部分63请求节目向量抽取部分42从数据获取部分41抽取作为属于所选类型的节目,用户在预定时段内观看的所有节目的节目向量PP,并关于构成在步骤S172进行的处理中选择的类型大项的每个详细项目,对这样的节目计数。
随后,在下一步骤S175,用户信息编目部分63通过把在步骤S173进行的处理中获得的计数结果除以在步骤S174进行的处理中获得的计数结果,计算用户实际观看的节目的数目与所选类型的所有节目的数目的比值。
如上所述,收视率竞争的影响使节目的安排被看作反映公众喜好的安排。即,计算用户实际观看的节目的数目与所选类型的所有节目的数目的比值的处理换句话说等同于通过把所有节目的数目用作标准模型,使用户实际观看的节目的数目归一化的处理。在步骤S175进行的处理中得到的归一化向量被称为归一化向量D′。
例如假定从大项类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,一般文艺/记录片,新闻/报道,其它}中选择戏剧类型。例如还假定对于与选择的戏剧类型对应的节目向量PP的大项时间段Tm={早晨,白天,傍晚,黄金时段,深夜},1周内广播的所有节目的数目为(10,35,7,53,17),用户实际观看的节目的数目为(5,0,0,8,4)。这种情况下,归一化向量为D′=(5/10,0/35,0/7,8/53,4/17)=(0.5,0,0,0.28,0.15,0.24)。从而,等于1.0的归一化向量D′的分量意味着关于该分量在预定时间内广播的所有节目用户都观看了。另一方面,等于0的归一化向量D′的分量意味着关于该分量在预定时间内广播的所有节目用户都没有观看。
随后,在下一步骤S176,用户信息编目部分63根据在步骤S175进行的处理中获得的计算结果,产生所选类型的大项的效应向量。
为了产生效应向量,大项时间段Tm={早晨,白天,傍晚,黄金时段,深夜}的一个项目被用于设置标准值。例如假定普通用户大约观看一周内在黄金时段广播的戏剧节目的20%。这种情况下,标准值被设置成0.2。由于该大项的效应向量被计算成相对值,效应向量可具有在0-1范围中的值。从而用户方效应向量具有从作为在步骤S175进行的处理的结果而获得的归一化向量D′和用作基准的设置值计算得到的相对值。
从而,表示用户的喜欢类型的大项类型Gm的效应向量E′被计算成E′=(0.3,-0.2,-0.2,-0.05,0.04),这得到指示用户喜欢早间时段的戏剧,但是不喜欢白天和傍晚时段的戏剧的确定结果。
随后,在下一步骤S177,用户信息编目部分63确定是否已关于所选类型,产生所有大项的效应向量。如果在步骤S177进行的处理中产生的确定结果指示还没有关于所选类型产生所有大项的效应向量,那么处理流程返回步骤S172,再次执行步骤S172和后续步骤的处理。
另一方面,如果在步骤S177进行的处理中产生的确定结果指示已关于所选类型产生了所有大项的效应向量,那么处理流程进入步骤S178,用户信息编目部分63确定是否已处理了所有类型。如果在步骤S178进行的处理中产生的确定结果指示还没有处理所有类型,那么处理流程返回步骤S171,再次执行步骤S171和后续步骤的处理。
另一方面,如果在步骤S178进行的处理中产生的确定结果指示已处理了所有类型,那么处理流程进入步骤S179,用户信息编目部分63保存所有大项的效应向量,并结束处理的执行。
通过进行上述处理,能够得到关于每种类型,一般公众的喜好和用户独有的喜好之间的差别。另外,通过关于每个预定的一段时间,例如3月或半年,重新计算用户方效应向量EfUP,能够实时地推荐反映用户的喜好的节目,如同前面参考图22中所示的流程图说明的处理的情况一样。
另外,在上面参考图24中所示的流程图说明的处理中,根据用户在预定的时间,例如1周,1月或3月内观看的节目,得到用户方效应向量EfUP。但是,用作计算用户方效应向量EfUP的节目可以是在多个时段,例如较短时段,中等时段和较长时段内观看的节目,如同前面参考图22中所示的流程图说明的处理的情况一样。这种情况下,根据用户在每个时段内观看的节目得到用户方效应向量EfUP,用户方效应向量EfUP被用于确定推荐信息。
除此之外,在上面参考图24中所示的流程图说明的处理中,代替所有广播的节目,只对用户主要观看节目的特定预定时段内广播的节目计数。这种特定时段的一个例子是从18:00到22:00的所谓黄金时段。
参考图25中所示的流程图,下面的说明解释所进行的通过计算余弦距离,得到将被用来在匹配处理中使用用户独有的喜好和一般公众的喜好之间的差异的用户方效应向量EfUP的用户方效应向量产生处理4,所述余弦距离表示关于每种类型,正历史向量UP和一般公众的喜好之间的相似度。
首先,在步骤S191,在匹配处理部分43中采用的用户信息编目部分63选择将对其进行这种处理的类型。
随后,在下一步骤S192,用户信息编目部分63从保存在正历史存储部分47中的正历史向量UP获得所选类型的正历史向量UP。
随后,在下一步骤S193,用户信息编目部分63从表示一般公众的喜好的标准喜好向量APP获得所选类型的标准喜好向量APP。
如前所述,标准喜好向量APP可以是从分发服务器5接收的向量,或者由于收视率竞争的效果使节目安排被看作反映一般公众的喜好的安排,按照上面参考图24中所示的流程图说明的用户方效应向量产生处理3相同的方式,每种类型的在预定时段内广播的所有节目的数目可被计数,并且如果需要,可进行归一化处理,以便得到标准喜好向量APP。
在分发服务器5中,通过利用一般收视率的调查结果,或者通过采用另一方法,可产生标准喜好向量APP。
随后,在下一步骤S194,用户信息编目部分63通过使用每个大项的正历史向量UP和标准喜好向量APP,关于每个大项,计算所选类型的正历史向量UP和所选类型的标准喜好向量APP之间的余弦距离。余弦距离越长,那么正历史向量UP和标准喜好向量APP之间的相似度越高。
随后,在下一步骤S195,用户信息编目部分63通过得到在步骤S194进行的处理中计算的余弦距离的倒数,产生每个大项的用户方效应向量EfUP。余弦距离的倒数越大,那么正历史向量UP和标准喜好向量APP之间的相似度越低。
随后,在下一步骤S196,用户信息编目部分63确定所有类型是否已被处理。如果在步骤S196进行的处理中产生的确定结果指示还没有处理所有类型,那么处理流程返回步骤S191,再次执行步骤S191和后续步骤的处理。另一方面,如果在步骤S196进行的处理中产生的确定结果指示所有类型已被处理,那么结束该流程图代表的处理的执行。
通过执行上述处理,能够得到每种类型的反映一般公众的喜好和用户独有的喜好之间的差别的用户方效应向量EfUP。
另外,按照和前面参考图23中所示的流程图说明的处理相同的方式,通过得到负历史向量MUP和标准喜好向量APP之间的计算相似度的倒数,用户信息编目部分63可产生每个大项的用户方负效应向量EfMUP。
参考图26中所示的流程图,下面的说明解释所进行的通过比较负历史向量MUP与一般公众的喜好,得到用户方负效应向量EfMUP的用户方负效应向量产生处理1。
首先,在步骤S201,在匹配处理部分43中采用的用户信息编目部分63获得保存在负历史存储部分48中的负历史向量MUP。
在下一步骤S202,用户信息编目部分63获得表示一般公众的喜好的标准喜好向量APP。
标准喜好向量APP可以是从分发服务器5接收的向量,或者由于收视率竞争的影响使节目安排被看作反映一般公众的喜好的安排,按照上面参考图22中所示的流程图说明的用户方效应向量产生处理1相同的方式,在预定时段内广播的所有节目的数目可被计数,并且如果需要可进行归一化处理,以便得到标准喜好向量APP。
在下一步骤S203,用户信息编目部分63对每个大项,计算负历史向量MUP和标准喜好向量APP之间的余弦距离。余弦距离越长,那么负历史向量MUP和标准喜好向量APP之间的相似度越高。
在下一步骤S204,用户信息编目部分63通过得到在步骤S203进行的处理中计算的余弦距离的倒数,产生每个大项的用户方负效应向量EfMUP。随后,结束该流程图代表的处理的执行。
通过进行上述处理,可以产生用户方负效应向量EfMUP。从而,能够有效地从推荐节目的列表中排除用户不喜欢的节目。
参考图27中所示的流程图,下面的说明解释所进行的得到每种类型的用户方负效应向量EfMUP的用户方负效应向量产生处理2。
首先,在步骤S211,在匹配处理部分43中采用的用户信息编目部分63选择将在后续步骤对其进行处理的类型。
在下一步骤S212,用户信息编目部分63从保存在负历史存储部分48中的负历史向量MUP中获得所选类型的负历史向量MUP。
在下一步骤S213,用户信息编目部分63获得均表示一般公众的喜好的标准喜好向量APP之一,作为所选类型的标准喜好向量APP。
随后,在下一步骤S214,用户信息编目部分63根据负历史向量MUP和标准喜好向量APP,关于每个大项计算所选类型的负历史向量MUP和所选类型的标准喜好向量APP之间的余弦距离。余弦距离越长,那么负历史向量MUP和标准喜好向量APP之间的相似度越高。
随后,在下一步骤S215,用户信息编目部分63通过得到在步骤S214进行的处理中计算的余弦距离的倒数,产生每个大项的用户方负效应向量EfMUP。余弦距离的倒数越大,那么负历史向量MUP和标准喜好向量APP之间的相似度越低。
随后,在下一步骤S216,用户信息编目部分63确定所有类型是否已被处理。如果在步骤S216进行的处理中产生的确定结果指示还没有处理所有类型,那么处理流程返回步骤S211,再次执行步骤S211和后续步骤的处理。另一方面,如果在步骤S216进行的处理中产生的确定结果指示所有类型已被处理,那么结束该流程图代表的处理的执行。
通过进行上述处理,能够关于每种类型产生用户方负效应向量EfMUP。从而,能够有效地从推荐节目列表中排除用户不喜欢的节目。
要注意的是也可以在前面参考图23和25-27中所示的流程图说明的处理中,关于每个大项得到的余弦距离倒数的n倍的形式,得到用户方效应向量EfUP和用户方负效应向量EfMUP。作为一种备选方案,根据四舍五入技术从余弦距离的倒数舍去预定数目的数位而获得的值也可被用作用户方效应向量EfUP或用户方负效应向量EfMUP。作为另一种备选方案,作为从余弦距离的对应倒数中减去1的结果,可得到用户方效应向量EfUP和用户方负效应向量EfMUP。作为另一种备选方案,可以从余弦距离的对应倒数中减去1的结果的n倍的形式,得到用户方效应向量EfUP和用户方负效应向量EfMUP。
在上面的说明中,节目向量PP和负历史向量MUP都是每个大项的向量。但是要注意的是节目向量PP和负历史向量MUP也可以都是具有包括排列成1个数组的所有详细项目分量的格式的向量。另外这种情况下,不必说也可进行相同的处理。
另外,节目向量抽取部分42抽取的节目向量PP可具有附加于其上的组ID或群集代码,所述组ID或群集代码表示对应于该节目向量PP的节目所属的组。如上所述,通过分别进行由图7和8中所示的流程图表示的处理,产生组ID和群集代码。
如果用户喜欢观看的节目形成连续剧,并且形成该连续剧的所有节目将被推荐,那么能够减少推荐这些节目的处理量。通过把第一优先级的相同组中的节目推荐为用户非常喜欢的节目,也可减少推荐处理的数量。
下面参考图28中所示的流程图,说明包括组推荐的匹配处理。
首先,在步骤S221,在匹配处理部分43中采用的向量运算部分62确定节目向量抽取部分42抽取的节目向量PP是否具有附加的识别某一组的信息,以便确定与该节目向量PP相关的节目是否属于该组。如前所述,附加到节目向量PP上的识别某一组的信息的例子是组ID和群集代码。
如果在步骤S221进行的处理中产生的确定结果指示节目向量PP具有附加的识别某一组的信息,那么处理流程进入步骤S222,向量运算部分62确定组ID或群集代码指示的组是否已在用户信息编目部分63中被编目为以第一优先级推荐的组。
如果在步骤S222进行的处理中产生的确定结果指示由组ID或群集代码表示的组已在用户信息编目部分63中被编目为以第一优先级推荐的组,那么处理流程进入步骤S223,向量运算部分62把与节目向量PP相关的节目的信息作为推荐信息提供给推荐信息输出部分49。推荐信息输出部分49在推荐节目列表50中对推荐信息建议的推荐节目编目,并把推荐节目的信息输出给电视显示设备11或记录/再现设备12。随后,处理流程进入后面说明的步骤S227。
另一方面,如果在步骤S221进行的处理中产生的确定结果指示节目向量PP不具有附加的识别某一组的信息,或者在步骤S222进行的处理中产生的确定结果指示由组ID或群集代码表示的组未在用户信息编目部分63中被编目为以第一优先级推荐的组,那么处理流程进入步骤S224,进行前面分别参考图17-21中所示的流程图说明的匹配处理1到匹配处理5中的任意之一。
随后,在下一步骤S225,通过确定推荐节目的节目向量是否具有附加的识别某一组的信息,向量运算部分62确定在步骤S224进行的匹配处理1到匹配处理5任意之一中推荐的节目是否属于该组。如前所述,附加到节目向量PP上的识别某一组的信息的例子是组ID和群集代码。如果在步骤S225进行的处理中产生的确定结果指示推荐的节目并不属于某一组,那么结束该流程图代表的处理的执行。
另一方面,如果在步骤S225进行的处理中产生的确定结果指示推荐的节目属于某一组,那么处理流程进入步骤S226,向量运算部分62把作为以第一优先级推荐的组加入节目向量PP的组ID(或者群集代码)保存在用户信息编目部分63中。
在步骤S223或S226进行的处理结束之后,处理流程进行步骤S227,向量运算部分62参考作为看作负历史的操作,保存在负历史存储部分48中的操作的日志,确定是否已收到被看作负历史的操作输入。在步骤S227进行的处理中检查的操作输入是关于在步骤S223进行的处理中推荐的节目,或者作为以第一优先级推荐的一组,在步骤S226进行的处理中被编目的节目而输入的操作输入。这是因为在步骤S226进行的处理中被编目的节目是在步骤S224进行的处理中推荐的节目中的一个已归类节目。被看作负历史的操作输入的例子是用户输入的请求观看另一节目或者记录另一节目,因为用户不喜欢所推荐的节目,或者在记录节目的再现之前,请求擦除该记录节目的命令。
如果在步骤S227进行的处理中产生的确定结果指示没有收到被看作负历史的操作输入,那么结束该流程图代表的处理的执行。
另一方面,如果在步骤S227进行的处理中产生的确定结果指示已收到被看作负历史的操作输入,那么处理流程进行步骤S228,向量运算部分62从作为以第一优先级推荐的节目组的目录,保存在用户信息编目部分63中的目录中除去包括目标节目的组。
要注意的是,通过进行前面参考图9中所示的流程图说明的标题分组处理1,在一些情况下,多个组ID可被分配给一个节目向量PP。具体地说,在这样的情况下,在步骤S228进行的处理中,根据负历史操作输入,所有组ID可从作为以第一优先级推荐的组的目录,保存在用户信息编目部分63中的目录中被除去。作为一种备选方案,均被看作负历史的操作输入被累积,当用户输入预定数目的负历史输入操作时,所有组ID可从作为以第一优先级推荐的组的目录,保存在用户信息编目部分63中的目录中被除去。另外,对于其中节目向量PP与组ID一一对应地关联的情况,可以采用这种特征。
通过进行上述处理,能够推荐用户喜欢观看的连续剧的所有节目,能够推荐属于和用户非常喜欢的节目同组的节目,从而能够减少推荐的操作处理。
在包括如上所述的组推荐的匹配处理中,也可根据从电视显示设备11或记录/再现设备12获得的用户操作历史,关于对应的组产生正历史向量UP和负历史向量MUP。
另外,根据在从电视显示设备11或记录/再现设备12获得的用户操作历史中检测到的正历史,观看相同连续剧或者进行连续剧的记录的预约的操作的数目可被计数,当所得到的计数超过预定值时,可以第一优先级推荐该连续剧,而不专门进行匹配处理。
除此之外,代替进行根据用户历史推荐节目的处理,可根据用户事先设置的主题设置用户模型,并根据用户模型,进行推荐节目的处理。
通过经由利用主题的过滤过程,抽取和用户事先设置的主题对应的节目,获得用户模型。初始目录存储部分45保存用户输入的主题。多个主题可被保存在初始目录存储部分45中。另外,用户可通过进行操作恰当地更新主题。向量运算部分62从作为均用于产生用户模型的节目的节目向量PP,节目向量抽取部分42供给的节目向量PP中抽取均包括保存在初始目录存储部分45中的主题的节目向量PP。随后,向量运算部分62得到抽取的节目向量PP的总和,如果需要,顺序使所述总和归一化,从而产生用户模型向量。最后,向量运算部分62把用户模型向量保存在用户信息编目部分63中。
例如我们假定用户规定时间段Hm=“11 PM之后”和类型Gm=“综艺”作为主题。这种情况下,通过使用主题产生用户模型“深夜的综艺节目”,进行过滤处理。用户模型“深夜的综艺节目”包括作为配置要素的在23:00之后深夜时间段中广播的综艺节目中表演的喜剧演员。从而,例如,在匹配处理中,出现该表演者的节目从与综艺类型不同的类型的节目中被抽取,作为推荐节目。与综艺类型不同的类型的例子是戏剧类型。从而,与对每个项目进行匹配处理相比,远远超出该类型的考虑范围的节目可被确定为用户的喜好。
要注意用于产生用户模型的节目一般可以是在预定时间中广播的所有节目,或者在预定时段,例如所谓的黄金时段中广播的一组节目。
另外,例如,在相同的过滤条件下,对不同的各组节目进行过滤处理,以便产生详细对应于每个不同的节目安排,例如一年的不同时间的节目安排和不同时段的节目安排的用户模型向量。
更具体地说,即使在相同条件,例如“类型Gm=音乐”下,现代的节目安排具有不同于10年前的节目安排的广播时间和表演者。从而,可产生与“10年前的乐迷”用户模型不同的“现代乐迷”用户模型。从而,能够推荐由其“10年前的乐迷”喜欢听其歌声的流行歌手作为演员的戏剧或电影。另外,还能够推荐其中现代歌手演唱“10年前的乐迷”喜欢收听的一首歌曲的节目。
另外,即使对于相同的条件,例如“类型Gm=音乐”,也可进行过滤处理,从而获得主要是成人观看节目的时段,以及主要是儿童观看节目的时段的多组不同节目。从而,能够产生不同的用户模型。一般来说,成人的时段从20:00到24:00,而儿童的时段从15:00到20:00。
随后,向量运算部分62计算节目向量抽取部分42提供的节目向量PP和在用户信息编目部分63中编目的用户模型向量之间的相似度。随后,根据计算结果,向量操作部分62产生推荐信息,并把该信息提供给推荐信息输出部分49。推荐信息输出部分49在推荐节目列表50中对推荐信息编目,并把该信息提供给电视显示设备11或记录/再现设备12。
下面参考图29中所示的流程图,说明使用用户模型的匹配处理。
首先,在步骤S231,在匹配处理部分43中采用的向量运算部分62从已抽取节目向量PP的节目向量抽取部分42获得用于产生用户模型的节目的节目向量PP。用于产生用户模型的节目可以是在预定的一段时间,例如1月或3月内广播的节目。作为一种备选方案,用于产生用户模型的节目可以是在预定的一定时间中的预定时段,例如黄金时段内广播的节目。作为另一种备选方案,用于产生用户模型的节目可以是在过去,例如10年或20年前的预定一段时间内广播的节目。
随后,在下一步骤S232,初始目录存储部分45获得用户通过操纵操作输入部分44输入的主题,并保存该主题。向量运算部分62从初始目录存储部分45读出所述主题,并把该主题设置成过滤条件。例如,过滤条件可被描述成散列表。
随后,在下一步骤S233,向量运算部分62根据在步骤S232进行的处理中设置的过滤条件,对在步骤S231进行的处理中获得的节目向量PP进行过滤处理,以便抽取和过滤条件相符的节目向量PP。例如,均用于产生用户模型的节目是在过去的3个月内广播的所有节目。这种情况下,向量运算部分62根据过滤条件“标题Tm或类型Gm=足球”,对过去3个月的节目向量PP进行过滤处理。
随后,在下一步骤S234,向量运算部分62得到在步骤S233进行的过滤处理输出的节目向量PP的总和,并把该总和用作用户模型向量。例如,向量运算部分62根据过滤条件“标题Tm或类型Gm=足球”,对节目向量PP进行过滤处理。这种情况下,产生用户模型“足球迷”的用户模型向量。
随后,在下一步骤S235,向量运算部分62计算在步骤S234进行的处理中产生的用户模型向量和节目向量抽取部分42抽取的节目向量PP之间的余弦距离。节目向量PP是均用作候选推荐信息的节目,即,稍后要广播的节目的节目向量PP。
随后,在下一步骤S236,向量运算部分62通过相互比较相似度,检查以用作候选推荐信息的节目的节目向量PP和用户模型向量之间的余弦距离的形式,在步骤S235进行的处理中得到的相似度。根据检查结果,向量运算部分62随后从具有最高相似度的向量开始,抽取预定数目的短距离节目向量PP,作为推荐信息,并把该推荐信息提供给推荐信息输出部分49。推荐信息输出部分49在推荐节目列表50中对该推荐信息编目,并把该信息提供给电视显示设备11或记录/再现设备12,并结束处理。
通过进行上述处理,即使用户进行的操作的历史不存在,也能够推荐和用户设置的主题相符的节目。另外,在过去,在根据过滤条件“标题Tm或类型Gm=足球”进行的过滤处理中,由足球运动员主演的综艺节目或戏剧不被抽取。另一方面,在前面参考图29中所示的流程图说明的处理中,通过根据主题“标题Tm或类型Gm=足球”设置用户模型,由足球运动员主演的综艺节目或戏剧可被抽取为推荐信息,即使该节目并不符合条件“标题Tm或类型Gm=足球”。这是因为作为构成用户模型向量的项目的内容和表演者包括大量的足球运动员。
在上述处理中,得到用户模型向量和节目向量PP之间的余弦距离作为相似度。但是,也可以关于大项计算的每个余弦距离的总和的形式得到相似度。
要注意的是产生用户模型向量的处理也可在分发服务器5中进行。这种情况下,通过使用一般由前面参考图2说明的节目向量产生部分23产生的节目向量PP,进行图29中所示的流程图的步骤S231-S234的处理。
另外,除了和用户的喜好相符的节目的推荐之外,通过选择具有节目向量PP和正历史向量UP之间的低相似度,以及节目向量PP和负历史向量MUP之间的低相似度的节目,用户既不喜欢也不讨厌的节目被推荐的概率变大。即,具有用户以前未观看的特性的节目被推荐的概率变大。换句话说,在甚至没有尝试节目的情况下被用户拒绝的节目被推荐的概率变大。为了通过抽取用户的喜好推进学习过程,重要的是评估具有用户以前未观看的特性的节目。
从而,向用户呈现的推荐结果被赋予不可预测性。于是,不仅可能导致用户兴趣的丰富,而且还可能获得对推荐更好地匹配用户喜好的节目来说非常重要的历史信息。
下面,参考图30中所示的流程图,说明所进行的识别异常(exceptional)的推荐节目的异常推荐节目选择处理。
首先,在步骤S241,在匹配处理部分43中采用的向量运算部分62使用节目向量抽取部分42提供的节目向量PP,保存在正历史存储部分47中的正历史向量UP和保存在负历史存储部分48中的负历史向量MUP来关于每个大项,计算节目向量PP和正历史向量UP之间的余弦距离,以及节目向量PP和负历史向量MUP之间的余弦距离。
随后,在下一步骤S242,向量运算部分62得到在正历史方关于每个项目计算的余弦距离的总和,和在负历史方关于每个项目计算的余弦距离的总和。即,在步骤S241和S242进行的处理关于每个大项,产生节目向量PP和正历史向量UP之间的相似度SimUP,以及节目向量PP和负历史向量MUP之间的相似度SimMUP。
随后,在下一步骤S243,向量运算部分62计算代表节目向量PP和正历史向量UP之间的相似度的低下,以及节目向量PP和负历史向量MUP之间的相似度的低下的异常推荐值。
具体地说,异常推荐值可由表达式(1-SimUP)×(1-SimMUP)或(1/SimUP)×(1/SimMUP)表述。
随后在下一步骤S244,向量运算部分62根据由在步骤S243进行的处理产生的计算结果,抽取均具有大的异常推荐值的节目作为推荐信息。最后,结束该流程图所代表的处理的执行。
通过进行上述处理,具有用户迄今未观看的特性的节目可被抽取为推荐节目。从而,将向用户推荐的节目的选择被赋予不可预测性。从而,不仅可能导致用户兴趣的丰富,而且还可能获得对推荐更好地匹配用户喜好的节目来说非常重要的历史信息。
通过进行迄今参考图13-30说明的各项处理,节目推荐处理设备10能够产生将被提供给电视显示设备11或记录/再现设备12的推荐信息。
电视显示设备11或记录/再现设备12还接收作为卫星波或地波被捕捉,并由电视接收设备4解码的广播信号。
根据用户进行的操作,电视显示设备11显示从电视接收设备4接收的广播信号,或者从记录/再现设备12接收的再现数据。另外,根据从节目推荐处理设备10接收的推荐信息,电视显示设备11显示推荐节目的信息,并进行自动设置频道的处理。除此之外,电视显示设备11把操作日志提供给节目推荐处理设备10。
另一方面,根据用户进行的操作,记录/再现设备12记录从电视接收设备4接收的广播信号,或者进行记录预约,并且根据从节目推荐处理设备10接收的推荐信息,记录/再现设备12自动记录推荐的节目。另外,记录/再现设备12从安装的或嵌入的记录介质再现节目,并在电视显示设备11上显示再现的节目。除此之外,记录/再现设备12把操作日志提供给节目推荐处理设备10。
图31是表示电视接收设备4的结构的方框图。在下面的说明中,电视接收设备4被解释成符合数字广播接收设备的标准规范的普通接收设备。
卫星波检测部分91是根据从电视显示设备11或记录/再现设备12接收的选择频道的信号,有选择地检测和接收广播电台通过卫星2发射的并由天线3接收的卫星波的组件。卫星波检测部分91还把说明发射模式的发射和多路复用控制信号提供给TMCC(发射和多路复用配置控制)解码部分92,并把卫星波持有的广播信号提供给解调/解码处理部分93。
TMCC解码部分92是接收包括在发射和多路复用控制信号中的信息,并对所述信息解码的组件。该信息包括时隙和指示调制方法和编码率的发射模式。TMCC解码部分92把解码后的信息提供给解调/解码处理部分93。
解调/解码处理部分93是通过采用从TMCC解码部分92接收的关于发射模式的信息所建议的方法,对从卫星波检测部分91接收的广播信号解调和解码的组件。解调/解码处理部分93把解调和解码结果提供给解交错部分94。所述方法的例子是QPSK(四相相移键控)方法和8相PSK(相移键控)方法。QPSK方法也被称为4相调制方法或4相PSK方法。
解交错部分94是对输入信号解交错,并把解交错处理的结果提供给纠错处理部分95的组件。另外,解交错部分94还对解交错结果进行帧分离处理和解扰处理。
纠错处理部分95是对输入信号进行一般采用Reed-Solomon(里德-索罗门)方法的纠错处理,并把纠错处理的结果提供给CA(条件访问)解扰部分101的组件。
地波检测部分96是根据从电视显示设备11或记录/再现设备12接收的选择频道的信号,有选择地检测和接收天线捕捉的地波的组件。地波检测部分96还把说明发射模式的发射和多路复用控制信号提供给TMCC(发射和多路复用配置控制)解码部分97,并把地波持有的广播信号提供给解调/解码处理部分98。
TMCC解码部分97是接收包括在发射和多路复用控制信号中的信息,并对所述信息解码的组件。该信息包括时间戳记TS,时隙和指示调制方法和编码率的发射模式。TMCC解码部分97把解码后的信息提供给解调/解码处理部分98。
解调/解码处理部分98是通过采用从TMCC解码部分97接收的关于发射模式的信息所建议的方法,对从地波检测部分96接收的广播信号解调和解码的组件。解调/解码处理部分98把解调和解码结果提供给解交错部分99。所述方法的例子是QAM(正交调幅)方法。
解交错部分99是对输入信号解交错,并把解交错处理的结果提供给TS(传送流)再现部分100的组件。另外,解交错部分99还对解交错结果进行帧分离处理和解扰处理。
TS再现部分100是根据输入信号产生传送流,并把传送流提供给CA解扰部分101的组件。
CA解扰部分101是对从纠错处理部分95或TS再现部分100接收的条件访问信号解扰,并把解扰后的信号提供给多路分解部分102的组件。
数据输入部分103是通过网络8接收来自EPG接收设备9的EPG数据和分发服务器5传送的流式数据的组件。数据输入部分103把EPG数据和流式数据传送给多路分解部分102。
多路分解部分102是对从CA解扰部分101或数据输入部分103接收的信号进行多路分解,从而产生将被提供给音频信号解码部分104的音频信号,将被提供给视频信号解码部分105的视频信号,和将被提供给数据解码部分106的数据的组件。提供给数据解码部分106的数据包括控制信号和EPG。
音频信号解码部分104是对输入的音频信号解码,并把解码的音频信号提供给电视显示设备11或记录/再现设备12的组件。出于同样原因,视频信号解码部分105是对输入的视频信号解码,并把解码的视频信号提供给电视显示设备11或记录/再现设备12的组件。数据解码部分106是对输入的数据,例如控制信号和EPG解码的组件。数据解码部分106把解码后的数据提供给电视显示设备11或记录/再现设备12。
在电视接收设备4进行的处理中,通过采用预定方法对接收的地波或分发的流式数据解调和解码,解调和解码的结果被提供给电视显示设备11或记录/再现设备12。
图32是表示电视显示设备11的结构的方框图。
操作输入部分121是接收来自用户的操作输入,并把代表从用户接收的操作输入的信号提供给在电视显示设备11中采用的一些组件的组件。另外,操作输入部分121把从用户接收的操作输入的内容提供给用户保存所述内容的操作日志列表122。前面参考图13说明的节目推荐处理设备10中采用的操作日志获取部分46读出保存在操作日志列表122上的操作日志,作为用户进行的操作的日志。如果从用户接收的操作输入是选择频道的操作,那么操作输入部分121把该操作输入提供给频道设置部分123。
频道设置部分123是根据从操作输入部分121接收的代表用户输入的操作输入的信号,产生指示所选频道的控制信号的组件。频道设置部分123把该控制信号提供给电视接收设备4。另外,根据保存在后面说明的推荐节目列表128上的推荐信息,频道设置部分123产生指示所选频道的控制信号,并把该控制信号提供给电视接收设备4,作为电视接收设备4用于自动设置频道的控制信号。电视接收设备4接收由所述控制信号规定的频道的广播信号。
数据输入部分124是从电视接收设备4接收广播信号,并把该信号传送给图像处理部分125的组件。图像处理部分125是根据输出部分126采用的图像显示方法,对输入的广播信号进行图像处理的组件。图像处理部分125把图像处理的结果提供给输出部分126。输出部分126包括显示装置和诸如扬声器之类的音频输出装置。显示装置的例子是CRT(阴极射线管)和LCD(液晶显示器)。输出部分126是显示完成图像处理的输入广播信号的图像信号,并从音频输出装置输出音频信号的组件。
推荐节目列表获取部件127是从节目推荐处理设备10获得推荐信息,并把获得的信息传送给推荐节目列表128的组件。推荐节目列表128对提供的推荐信息编目。频道设置部分123和推荐节目信息显示控制部分129从推荐节目列表128读出推荐信息。
推荐节目信息显示控制部分129是把从推荐节目列表128读出的推荐信息提供给图像处理部分125,以便被用于向用户显示推荐节目的信息的组件。图像处理部分125把从推荐节目信息显示控制部分129接收的推荐信息作为独立信息,或者作为叠加在由从数据输入部分124接收的广播信号代表的图像上的信息,传送给输出部分126。输出部分126在显示装置上显示推荐信息。
要注意的是可允许用户根据从节目推荐处理设备10接收的推荐信息,确定推荐节目的信息是否要被显示在输出部分126上,或者频道是否要被自动设置。
参考图33中所示的流程图,下面的说明解释所进行的根据从节目推荐处理设备10接收的推荐信息,向用户显示推荐节目的信息的推荐信息显示处理。
首先,在步骤S251,推荐节目列表获取部分127获得在节目推荐处理设备10中采用的推荐信息输出部分49输出的推荐信息。
随后,在下一步骤S252,推荐节目列表获取部分127在推荐节目列表128上对获得的推荐信息编目。
随后,在下一步骤S253,推荐节目信息显示控制部分129从推荐节目列表128读出将在相对于当前时间的预定一段时间内广播的推荐节目的信息,从而产生用于显示被推荐节目的信息的数据。所述一段时间的长度一般为3小时或一天。被推荐节目的信息包括每个被推荐节目的标题,内容,广播时间和广播频道。推荐节目信息显示控制部分129随后把该数据提供给图像处理部分125。
随后,在下一步骤S254,图像处理部分125进行图像处理,以便显示用于在输出部分126显示被推荐节目的信息的输入数据,并把图像处理的结果输出给输出部分126。数据所代表的推荐信息可以独立信息或者叠加在由从数据输入部分124接收的广播信号代表的图像上的信息的形式经历图像处理。
随后,在下一步骤S255,输出部分126显示从图像处理部分125接收的推荐信息。最后,结束该流程图代表的处理的执行。
通过进行上述处理,推荐信息被显示在输出部分126上。从而,通过参考显示的推荐信息,用户能够选择他所想观看的节目。
参考图34中所示的流程图,下面的说明解释所进行的根据从节目推荐处理设备10接收的推荐信息,自动设置广播和用户的喜好相符的节目的频道的自动频道设置处理。
在步骤S271和S272进行的处理与分别在前面参考图33说明的流程图的步骤S251和S252进行的处理相同。即,推荐节目列表获取部分127获得由节目推荐处理设备10中采用的推荐信息输出部分49输出的推荐信息。随后,推荐节目列表获取部分127在推荐节目列表128对获得的推荐信息编目。
随后,在下一步骤S273,频道设置部分123从节目推荐列表128获得当前时间的推荐节目的信息。随后,在下一步骤S274,根据被推荐节目的诈,频道设置部分123产生频道设置信息,并把频道设置信息作为控制信号输出给电视接收设备4。根据该控制信号,电视接收设备4接收通过控制信号中规定的频道广播的广播信号。
随后,在下一步骤S275,数据输入部分124从电视接收设备4获得指定频道的广播信号,并把该信号提供给图像处理部分125。
随后,在下一步骤S276,图像处理部分125对输入的广播信号进行图像处理,以便显示图像,并把处理结果提供给输出部分126。
随后,在下一步骤S277,输出部分126以作为图像处理的结果而获得的图像的形式,显示从图像处理部分125接收的推荐节目的信息的图像,并输出声音。最后,结束该流程图代表的处理的执行。
通过进行上述处理,广播和用户的喜好相符的节目的频道被自动设置。例如当用户发出关于该处理的命令时,可进行上面参考图34中所示的流程图说明的自动频道设置处理。从而,当用户存在确定要观看哪个节目的问题时,广播恰当节目的频道可被自动设置。
另外,当用户持续被认为是忽视的一段时间的每个预定一段时间不进行输入操作时,或者当被认为是忽视的一段时间的预定一段时间过去时,可进行上面参考图34中所示的流程图说明的自动频道设置处理,所述预定一段时间一般为2小时。被认为是忽视的一段时间的预定一段时间是其间用户清楚知道用户没有设置频道的事实的一段时间。
要注意的是也可允许用户输入设置不能进行自动频道设置处理的模式的命令。通过这样禁用自动频道设置处理,当用户有意观看通过某一频道广播的节目时,该频道不能被自动改变成另一频道。
图35是表示记录/再现设备12的方框图。
操作输入部分141是接收来自用户的操作输入,并把代表从用户接收的操作输入的控制信号提供给构成记录/再现设备12的其它组件的组件。另外,操作输入部分141把从用户接收的操作输入的内容提供给用于保存所述内容的操作日志列表142。前面参考图13说明的节目推荐处理设备10中采用的操作日志获取部分46读出保存在操作日志列表142上的操作日志,作为用户进行的操作的日志。
记录设置部分143是根据从操作输入部分141接收的,代表用户输入的操作输入的信号,抽取进行记录处理所必需的信息,或者从保存在后面说明的推荐节目列表149上的推荐信息抽取进行记录处理所必需的信息的组件。进行记录处理所必需的信息包括要记录的节目的广播开始时间以及广播结束时间,和广播节目的频道。如果从操作输入部分141接收的控制信号指示从用户接收的操作输入是进行记录预约的操作,那么记录设置部分143在记录预约列表144上对进行记录处理所必需的信息编目。如果从操作输入部分141接收的控制信号指示从用户接收的操作输入是记录当前广播的节目的请求,或者当将通过利用保存在后面说明的推荐节目列表149上的推荐信息进行自动记录时,记录设置部分143把进行记录处理所必需的信息提供给记录控制部分145。
记录控制部分145是根据从记录设置部分143接收的对节目进行记录处理所必需的信息,产生指示广播要记录的节目的广播频道的控制信号,或者通过从在记录预约列表144上编目的记录预约信息抽取当前时间的记录预约信息,产生控制信号的组件。记录控制部分145把控制信号提供给电视接收设备4。记录控制部分145还是产生进行记录的控制信号,并把该控制信号提供给记录/再现处理部分147的组件。根据从记录控制部分14接收的控制信号,电视接收设备4接收通过规定的频道广播的广播信号。
数据输入部分146是从电视接收设备4接收广播信号,并把该信号传送给记录/再现处理部分147的组件。记录/再现处理部分147一般具有允许可拆卸的记录介质被安装在记录/再现处理部分147上的结构,或者包括内部嵌入的记录介质。可拆卸的记录介质的例子是磁带,光盘,磁盘,磁光盘和半导体存储器,而内部嵌入的记录介质是硬盘和半导体存储器。记录/再现处理部分147能够把信息记录到记录介质上,并从可拆卸的或者嵌入的记录介质再现信息。更具体地说,假定可按照在记录记录/再现处理部分147上的可拆卸记录介质是磁带。这种情况下,记录/再现处理部分147配有在记录处理中,把从数据输入部分146接收的广播信号记录到磁带上,和从磁带再现信息的磁头。记录/再现处理部分147把再现的信息提供给诸如电视显示设备11之类的设备,以便显示所述信息。
推荐节目列表获取部分148是从节目推荐处理设备10获得推荐信息,并把该信息传给推荐节目列表149的组件。推荐节目列表149是用于对提供的推荐信息编目的组件。记录设置部分143从推荐节目列表149读出将用于自动记录的推荐信息。
下面参考图36中所示的流程图说明自动记录。
首先,在步骤S291,推荐节目列表获取部分148从在节目推荐处理设备10中采用的推荐信息输出部分49获得推荐信息。
随后,在下一步骤S292,推荐节目列表获取部分148在推荐节目列表149对获得的推荐信息编目。
随后,在下一步骤S293,记录设置部分143从推荐节目列表149抽取当前时间的推荐节目的信息。记录设置部分143随后从抽取的信息获得记录所需的信息,并把获得信息提供给记录控制部分145。获得的记录所需信息包括要记录节目的广播开始时间以及广播结束时间,和广播该频道的频道。
随后,在下一步骤S294,记录控制部分145产生用于接收要记录的节目的广播信号的频道设置信息,并把频道设置信息作为控制信号输出给电视接收设备4。根据该控制信号,电视接收设备4接收通过规定的频道广播的节目的广播信号。
随后,在下一步骤S295,数据输入部分146从电视接收设备4获得指定频道的广播信号,并把该信号传送给记录/再现处理部分147。
随后,在下一步骤296,记录/再现处理部分147把从电视接收设备4接收的广播信号记录到安装的或者内部嵌入的记录介质上。最后,结束该流程图代表的处理的执行。
通过进行上述处理,能够自动记录和用户的喜好相符的节目。在正在进行用户请求的记录处理时,或者已经开始的记录处理,例如预约的记录处理正在进行时,不执行上面参考图36中所示的流程图说明的自动记录处理。
上面的说明解释了根据为当前时间推荐的节目进行的自动记录处理。但是不必说,也可按照相同的方式根据为比当前时间落后预定一段时间的某一时刻获得的推荐信息,进行自动记录处理。这样,能够自动实现记录的预约。
在前面参考图1-36说明的各个处理中,节目向量PP在分发服务器5中产生。但是,代替在分发服务器5中产生节目向量PP,分发服务器5可通过网络8把EPG数据提供给节目推荐处理设备,以便在节目推荐处理设备中用于产生节目向量PP。
图37是关于不是在分发服务器171中产生节目向量PP,而是根据通过网络8,从分发服务器171提供给节目推荐处理设备191的EPG数据,在节目推荐处理设备191中产生节目向量的情况,表示分发服务器171的结构的方框图。这种情况下,还用于产生节目向量PP的节目推荐处理设备191的结构示于图38中。
要注意的是,和在图2中所示的分发服务器5及图13中所示的节目推荐处理设备10中采用的相应对应部分相同的部分用和它们的相应对应物相同的附图标记表示,为了避免重复,不再重复它们的说明。
即,分发服务器171包括如前参考图2所述那样,同样用在分发服务器5中的数据获取部分21和数据传输部分25。分发服务器171从流式数据数据库6读出流式数据,或者从元数据数据库7或包括元数据的EPG数据读出元数据,并通过网络8把流式数据或元数据传送给EPG接收设备9或电视接收设备4。
节目推荐处理设备191具有与前面参考图13的节目推荐处理设备10相同的结构,除了节目推荐处理设备191还包括在图2中所示的分发服务器5中采用的元数据抽取部分22和节目向量产生部分23之外。除了节目推荐处理设备10执行的处理之外,节目推荐处理设备191还进行前面参考图3中所示的流程图说明的节目向量产生处理1,前面参考图6中所示的流程图说明的节目向量产生处理2,前面参考图7中所示的流程图说明的分组处理1,和前面参考图8中所示的流程图说明的分组处理2。
代替产生节目向量PP,分发服务器171可通过网络8把EPG数据提供给节目推荐处理设备191,以便用于产生节目向量PP。尽管存在该差异,仍然能够获得和前面参考图1-36说明的相同结果。
另外,还可实现这样一种系统结构,其中EPG接收设备9从电视显示设备11和记录/再现设备12收集用户进行的操作的信息和设置信息,并把收集的信息提供给分发服务器201,而分发服务器201不仅产生节目向量PP,而且进行匹配处理,通过网络8把匹配处理的结果提供给EPG接收设备9。就这种系统结构来说,网络具有图39中所示的结构,分发服务器201具有图40中所示的方框图。
要注意的是与图1、37和38中所示的它们的相应对应物等同的系统结构组件由和它们的相应对应物相同的附图标记表示,并且为了避免重复,省略了对它们的说明。
即,除了前面参考图37说明的分发服务器171的功能之外,分发服务器201还具有前面参考图38说明的节目推荐处理设备191的功能。从而,用户不需要拥有节目推荐处理设备
在图39和40中所示的结构中,分发服务器201进行前面参考图3-12和图14-30说明的所有各项处理。这些处理包括产生向量,例如节目向量PP,节目方效应向量EfUP,正历史向量UP,负历史向量MUP和标准喜好向量APP的处理,对节目向量PP分组的处理,匹配处理,和选择异常的推荐节目的处理。
要注意的是,此时,用户进行的操作的历史和设置信息一般具有附着于其上的,用于识别因用户而异的历史和设置信息的用户ID。EPG接收设备9从电视显示设备11和记录/再现设备12收集操作历史和设置信息,通过网络8把所述历史和信息传送给分发服务器201。在分发服务器201中采用的节目推荐处理设备191通过根据附着于所述操作历史和设置信息上的用户ID,对所述操作历史和设置信息分类,把从EPG接收设备9接收的操作历史和设置信息保存在诸如初始目录存储部分45,正历史存储部分47和负历史存储部分48之类的部分中。
上述说明解释了其中通过使用电视广播信号的EPG数据,推荐和用户的喜好相符的节目的情况。但是,本发明也可应用于其中通过把属性信息加入无线电广播和诸如流式数据之类的各种数字内容中,推荐和用户的喜好相符的节目的情况。
前面说明的每一系列的处理也可通过软件的执行来实现。如果通过软件的执行来实现上面说明的每一系列的处理,那么构成所述软件的程序可以一般从网络或者程序记录介质被安装到嵌入专用硬件中的计算机,通用个人计算机等中。通过把各种程序安装到通用个人计算机中,个人计算机能够实现各种功能。
上面提及的把要安装到到计算机或通用个人计算机中的程序分别记录为将由所述计算机或通用个人计算机执行的程序的程序记录介质是独立于计算机或通用个人计算机分发和提供给用户的包介质。如前参考图2、13或38所述,包介质的例子包括诸如软盘之类的磁盘31或71,诸如CD-ROM(光盘-只读存储器)或DVD(数字通用盘)之类的光盘32或72,诸如MD(MiniDisc)(商标)之类的磁光盘33或73,以及半导体存储器34或74。
另外,在本说明书中,按照沿着时间轴的预定顺序进行保存在记录介质中的每个程序的步骤。但是,不必按照沿着时间轴的预定顺序进行所述步骤。例如,也可同时或者单独地进行保存在记录介质中的每个程序的步骤。
要注意的是,本说明书中使用的技术术语“系统”意味着包括多个设备的融合结构。
工业可应用性
如上所述,根据本发明,能够产生内容的属性信息。特别地,可使内容的属性信息与加权值相关联,每个加权值规定多个项目中的每一个对属性信息和预定用户的喜好信息之间的相似度的计算的贡献程度。
另外,根据另一发明,不仅能够选择与用户的喜好相符的内容,而且还能够通过使用规定多个项目中的每一个对属性信息和预定用户的喜好信息之间的相似度的计算的贡献程度的加权值信息,来选择内容。从而,能够选择正确地与用户的喜好相符的内容。
另外,根据另一发明,能够找出用户的喜好。特别地,通过比较用户的喜好与一般公众的喜好,能够识别用户的喜好的偏差(bias),从而能够确定用户独有的喜好。

Claims (24)

1、一种执行选择内容的处理的信息处理设备,包括:
获得所述内容的包括多个项目的属性信息的获取装置;和
利用预定的加权值信息计算由所述获取装置获得的所述属性信息与从用户获得的信息之间的相似度的计算装置,
其中所述加权值信息规定在根据所述属性信息和包括所述属性信息所包括的多个所述项目当中的至少一部分的所述从用户获得的信息,计算作为每个所述项目的相似度的项目相似度,并且根据所述项目相似度计算所述属性信息与所述从用户获得的信息之间的相似度时,对应于多个所述项目的所述项目相似度各自的贡献程度。
2、按照权利要求1所述的信息处理设备,其中除了所述内容的所述属性信息之外,所述获取装置还获得所述加权值信息,
所述计算装置通过利用所述加权值信息,比较所述内容的属性信息与所述从用户获得的信息,来计算所述相似度。
3、按照权利要求1所述的信息处理设备,其中所述加权值信息是揭示所述内容的所述属性信息中的对所述用户而言重要的项目的信息。
4、按照权利要求1所述的信息处理设备,还包括:
接收所述用户的操作输入的操作输入装置,
其中所述加权值信息利用由所述操作输入装置输入的所述用户的操作输入来设定。
5、按照权利要求1所述的信息处理设备,还包括:
保存与由所述获取装置获得的所述属性信息的所述项目相对应的所述加权值信息的存储装置。
6、按照权利要求5所述的信息处理设备,其中所述计算装置从所述存储装置保存的所述加权值信息中,抽出符合所述内容所拥有的条件的所述加权值信息,并且利用所抽出的所述加权值信息来计算所述获取装置获得的所述属性信息与所述从用户获得的信息之间的相似度。
7、一种执行选择内容的处理的信息处理设备的信息处理方法,包括:
获得所述内容的包括多个项目的属性信息的获取步骤;和
利用预定的加权值信息计算通过所述获取步骤的处理获得的所述属性信息与从用户获得的信息之间的相似度的计算步骤,
其中所述加权值信息规定在根据所述属性信息和包括所述属性信息所包括的多个所述项目当中的至少一部分的所述从用户获得的信息,计算作为每个所述项目的相似度的项目相似度,并且根据所述项目相似度计算所述属性信息与所述从用户获得的信息之间的相似度时,对应于多个所述项目的所述项目相似度各自的贡献程度。
8、按照权利要求7所述的信息处理方法,其中在所述获取步骤的处理中,除了所述内容的所述属性信息之外,还获得所述加权值信息,
在所述计算步骤的处理中,通过利用所述加权值信息,比较所述内容的属性信息与所述从用户获得的信息,来计算所述相似度。
9、按照权利要求7所述的信息处理方法,其中所述加权值信息是揭示所述内容的所述属性信息中的对所述用户而言重要的项目的信息。
10、按照权利要求7所述的信息处理方法,还包括:
接收所述用户的操作输入的操作输入步骤,
其中所述加权值信息利用通过所述操作输入步骤的处理输入的所述用户的操作输入来设定。
11、按照权利要求7所述的信息处理方法,还包括:
保存与通过所述获取步骤的处理获得的所述属性信息的所述项目相对应的所述加权值信息的存储步骤。
12、按照权利要求11所述的信息处理方法,其中在所述计算步骤的处理中,从通过所述存储步骤的处理保存的所述加权值信息中,抽出符合所述内容所拥有的条件的所述加权值信息,并且利用所抽出的所述加权值信息来计算通过所述获取步骤的处理获得的所述属性信息与所述从用户获得的信息之间的相似度。
13、一种执行选择内容的处理的信息处理设备,包括:
保存所述内容的包括多个项目的属性信息的第一存储装置;和
利用预定的加权值信息计算由所述第一存储装置保存的所述属性信息与从用户获得的信息之间的相似度的计算装置,
其中所述加权值信息规定在根据所述属性信息和包括所述属性信息所包括的多个所述项目当中的至少一部分的所述从用户获得的信息,计算作为每个所述项目的相似度的项目相似度,并且根据所述项目相似度计算所述属性信息与所述从用户获得的信息之间的相似度时,对应于多个所述项目的所述项目相似度各自的贡献程度。
14、按照权利要求13所述的信息处理设备,其中除了所述内容的所述属性信息之外,所述第一存储装置还保存所述加权值信息,
所述计算装置通过利用所述加权值信息,比较所述内容的属性信息与所述从用户获得的信息,来计算所述相似度。
15、按照权利要求13所述的信息处理设备,其中所述加权值信息是揭示所述内容的所述属性信息中的对所述用户而言重要的项目的信息。
16、按照权利要求13所述的信息处理设备,还包括:
接收所述用户的操作输入的操作输入装置,
其中所述加权值信息利用由所述操作输入装置输入的所述用户的操作输入来设定。
17、按照权利要求13所述的信息处理设备,还包括:
保存与由所述第一存储装置保存的所述属性信息的所述项目相对应的加权值信息的第二存储装置。
18、按照权利要求17所述的信息处理设备,其中所述计算装置从所述第二存储装置保存的所述加权值信息中,抽出符合所述内容所拥有的条件的所述加权值信息,并且利用所抽出的所述加权值信息来计算所述第一存储装置保存的所述属性信息与所述从用户获得的信息之间的相似度。
19、一种执行选择内容的处理的信息处理方法,包括:
保存所述内容的包括多个项目的属性信息的第一存储步骤;和
利用预定的加权值信息计算通过所述第一存储步骤的处理保存的所述属性信息与从用户获得的信息之间的相似度的计算步骤,
其中所述加权值信息规定在根据所述属性信息和包括所述属性信息所包括的多个所述项目当中的至少一部分的所述从用户获得的信息,计算作为每个所述项目的相似度的项目相似度,并且根据所述项目相似度计算所述属性信息与所述从用户获得的信息之间的相似度时,对应于多个所述项目的所述项目相似度各自的贡献程度。
20、按照权利要求19所述的信息处理方法,其中在所述第一存储步骤的处理中,除了所述内容的所述属性信息之外,还保存所述加权值信息,
在所述计算步骤的处理中,通过利用所述加权值信息,比较所述内容的属性信息与所述从用户获得的信息,来计算所述相似度。
21、按照权利要求19所述的信息处理方法,其中所述加权值信息是揭示所述内容的所述属性信息中的对所述用户而言重要的项目的信息。
22、按照权利要求19所述的信息处理方法,还包括:
接收所述用户的操作输入的操作输入步骤,
其中所述加权值信息利用通过所述操作输入步骤的处理输入的所述用户的操作输入来设定。
23、按照权利要求19所述的信息处理方法,还包括:
保存与通过所述第一存储步骤的处理保存的所述属性信息的所述项目相对应的加权值信息的第二存储步骤。
24、按照权利要求23所述的信息处理方法,其中在所述计算步骤的处理中,从通过所述第二存储步骤的处理保存的所述加权值信息中,抽出符合所述内容所拥有的条件的所述加权值信息,并且利用所抽出的所述加权值信息来计算通过所述第一存储步骤的处理保存的所述属性信息与所述从用户获得的信息之间的相似度。
CNB2007101049744A 2002-12-12 2003-12-12 信息处理设备和信息处理方法 Expired - Fee Related CN100499761C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2002361275 2002-12-12
JP2002361275A JP4003127B2 (ja) 2002-12-12 2002-12-12 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
JP2002361276 2002-12-12

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB2003801083209A Division CN100499756C (zh) 2002-12-12 2003-12-12 信息处理设备、信息处理方法和信息处理系统

Publications (2)

Publication Number Publication Date
CN101068323A CN101068323A (zh) 2007-11-07
CN100499761C true CN100499761C (zh) 2009-06-10

Family

ID=32760093

Family Applications (4)

Application Number Title Priority Date Filing Date
CNB2007101049763A Expired - Fee Related CN100486310C (zh) 2002-12-12 2003-12-12 信息处理设备和信息处理方法
CNB2003801083209A Expired - Fee Related CN100499756C (zh) 2002-12-12 2003-12-12 信息处理设备、信息处理方法和信息处理系统
CNB2007101049744A Expired - Fee Related CN100499761C (zh) 2002-12-12 2003-12-12 信息处理设备和信息处理方法
CN2007101049759A Expired - Fee Related CN101068324B (zh) 2002-12-12 2003-12-12 信息处理设备和信息处理方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CNB2007101049763A Expired - Fee Related CN100486310C (zh) 2002-12-12 2003-12-12 信息处理设备和信息处理方法
CNB2003801083209A Expired - Fee Related CN100499756C (zh) 2002-12-12 2003-12-12 信息处理设备、信息处理方法和信息处理系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN2007101049759A Expired - Fee Related CN101068324B (zh) 2002-12-12 2003-12-12 信息处理设备和信息处理方法

Country Status (2)

Country Link
JP (1) JP4003127B2 (zh)
CN (4) CN100486310C (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006094018A (ja) * 2004-09-22 2006-04-06 Sharp Corp 番組推薦装置、番組推薦方法、プログラムおよびそのプログラムを記録した記録媒体
JP4676441B2 (ja) * 2004-10-01 2011-04-27 パナソニック株式会社 チャンネル契約提案装置、方法、プログラム及び集積回路
JP2006129265A (ja) * 2004-10-29 2006-05-18 Sharp Corp 番組情報抽出装置、番組情報表示装置、放送番組録画システム、番組情報抽出方法、プログラム、および、プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4543930B2 (ja) 2005-01-07 2010-09-15 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP2006190126A (ja) * 2005-01-07 2006-07-20 Sony Corp 情報処理装置および方法、並びにプログラム
JP4655200B2 (ja) * 2005-02-01 2011-03-23 ソニー株式会社 情報処理装置および方法、並びにプログラム
KR101278156B1 (ko) * 2005-05-03 2013-06-28 삼성전자주식회사 디지털 방송 녹화 기기 및 이를 이용한 타이틀 기록 방법
JP4752623B2 (ja) 2005-06-16 2011-08-17 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP4378646B2 (ja) 2005-09-28 2009-12-09 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
WO2007077991A1 (ja) 2006-01-06 2007-07-12 Sony Corporation 情報処理装置および方法、並びにプログラム
JP4179341B2 (ja) 2006-06-01 2008-11-12 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
CN101094335B (zh) * 2006-06-20 2010-10-13 株式会社日立制作所 电视节目推荐设备和电视节目推荐方法
JP5027483B2 (ja) 2006-11-10 2012-09-19 富士通株式会社 情報検索装置及び情報検索方法
EP1930906A1 (en) 2006-12-08 2008-06-11 Sony Corporation Information processing apparatus, display control processing method and display control processing program
US20080156173A1 (en) * 2006-12-29 2008-07-03 Harman International Industries, Inc. Vehicle infotainment system with personalized content
JP5259099B2 (ja) * 2007-02-16 2013-08-07 株式会社東芝 番組推薦装置及び番組推薦方法
JP4433326B2 (ja) 2007-12-04 2010-03-17 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4465633B2 (ja) 2007-12-07 2010-05-19 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP5180639B2 (ja) * 2008-03-21 2013-04-10 株式会社デンソーアイティーラボラトリ コンテンツ提示装置、コンテンツ提示方法、およびプログラム
JP5573117B2 (ja) * 2009-11-17 2014-08-20 ソニー株式会社 表示制御システム、表示制御装置、および表示制御方法
JP2011142468A (ja) * 2010-01-06 2011-07-21 Sony Corp 情報処理装置、情報処理方法およびプログラム
JP5479134B2 (ja) * 2010-01-29 2014-04-23 株式会社東芝 デジタル放送受信機及び録画番組の制御方法
JP2011160278A (ja) * 2010-02-02 2011-08-18 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP2011164779A (ja) * 2010-02-05 2011-08-25 Sony Corp 情報処理装置、情報処理方法、及びプログラム
JP5235940B2 (ja) * 2010-05-20 2013-07-10 日本電信電話株式会社 番組推薦装置及び方法及びプログラム
JP2014085780A (ja) 2012-10-23 2014-05-12 Samsung Electronics Co Ltd 番組推薦装置及び番組推薦プログラム
JP5575936B2 (ja) * 2013-01-30 2014-08-20 株式会社東芝 システム及び番組推薦方法
US9277258B2 (en) 2013-04-19 2016-03-01 Google Inc. Providing correlated programming information for broadcast media content and streaming media content
CN110008401B (zh) * 2019-02-21 2021-03-09 北京达佳互联信息技术有限公司 关键词提取方法、关键词提取装置和计算机可读存储介质
JP7082106B2 (ja) * 2019-12-27 2022-06-07 Kddi株式会社 番組推薦装置、番組推薦システム、番組推薦方法及び番組推薦プログラム
JP7166374B2 (ja) * 2021-02-18 2022-11-07 ヤフー株式会社 コンテンツ通知装置、コンテンツ通知方法、および、コンテンツ通知プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1107595A1 (en) * 1999-12-01 2001-06-13 Sony Corporation Broadcasting system and reception apparatus
WO2001069921A1 (en) * 2000-03-17 2001-09-20 Koninklijke Philips Electronics N.V. Method and apparatus for rating database objects
JP2002142160A (ja) * 2000-11-02 2002-05-17 Nec Corp 番組推薦装置、番組推薦方法およびそのプログラムを記録した記録媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4268290B2 (ja) * 1999-10-29 2009-05-27 パナソニック株式会社 受信装置および受信方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1107595A1 (en) * 1999-12-01 2001-06-13 Sony Corporation Broadcasting system and reception apparatus
WO2001069921A1 (en) * 2000-03-17 2001-09-20 Koninklijke Philips Electronics N.V. Method and apparatus for rating database objects
JP2002142160A (ja) * 2000-11-02 2002-05-17 Nec Corp 番組推薦装置、番組推薦方法およびそのプログラムを記録した記録媒体

Also Published As

Publication number Publication date
CN101068325A (zh) 2007-11-07
JP4003127B2 (ja) 2007-11-07
CN100499756C (zh) 2009-06-10
CN101068324A (zh) 2007-11-07
CN100486310C (zh) 2009-05-06
CN1736097A (zh) 2006-02-15
CN101068324B (zh) 2011-06-15
JP2004194107A (ja) 2004-07-08
CN101068323A (zh) 2007-11-07

Similar Documents

Publication Publication Date Title
CN100499761C (zh) 信息处理设备和信息处理方法
CN100566387C (zh) 信息处理设备和信息处理方法,记录介质及程序
US9552413B2 (en) Information-processing apparatus, method, system, computer-readable medium and method for automatically recording or recommending content
JP5236700B2 (ja) 番組視聴端末、番組視聴プログラム、番組視聴方法及び番組推薦サーバ
JP4593603B2 (ja) 番組推薦システム、番組視聴端末、番組視聴プログラム、番組視聴方法、番組推薦サーバ、番組推薦プログラム及び番組推薦方法
JP4491746B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びにプログラム
CN105230035A (zh) 用于选择的时移多媒体内容的社交媒体的处理
US20080196064A1 (en) Apparatus and method of providing a recommended broadcast program
KR100927352B1 (ko) 조건부 액세스를 제공하는 방법 및 장치
JP4501948B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP4161701B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP4547596B2 (ja) 情報処理装置および情報処理方法、並びにプログラム
JP4577562B2 (ja) 情報処理装置および情報処理方法、並びにプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090610

Termination date: 20151212

EXPY Termination of patent right or utility model