CN100566387C - 信息处理设备和信息处理方法,记录介质及程序 - Google Patents

信息处理设备和信息处理方法,记录介质及程序 Download PDF

Info

Publication number
CN100566387C
CN100566387C CNB2003801087695A CN200380108769A CN100566387C CN 100566387 C CN100566387 C CN 100566387C CN B2003801087695 A CNB2003801087695 A CN B2003801087695A CN 200380108769 A CN200380108769 A CN 200380108769A CN 100566387 C CN100566387 C CN 100566387C
Authority
CN
China
Prior art keywords
program
vector
information
user
preference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2003801087695A
Other languages
English (en)
Other versions
CN1739289A (zh
Inventor
山本则行
宫崎充弘
斋藤真里
小池宏幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1739289A publication Critical patent/CN1739289A/zh
Application granted granted Critical
Publication of CN100566387C publication Critical patent/CN100566387C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4334Recording operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/775Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television receiver
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/907Television signal recording using static stores, e.g. storage tubes or semiconductor memories
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明涉及使得能够产生正历史向量和负历史向量的信息处理设备和信息处理方法,记录介质及程序。在步骤S71,根据初始登记的内容产生负历史向量。当在步骤S72中确定初始登记的内容未被改变时,和当在步骤S73中确定供给了操作日志时,在步骤S74中确定供给的操作日志是否是正历史。当供给的操作日志是正历史时,在步骤S75,对应于该操作日志的节目向量被额外保存为正历史,在步骤S76,由节目向量的总和产生正历史向量。当供给的操作日志是负历史时,在步骤S77,对应于该操作日志的节目向量被额外保存为负历史,在步骤S78,由节目向量的总和产生负历史向量。本发明适用于广播节目推荐处理设备。

Description

信息处理设备和信息处理方法,记录介质及程序
技术领域
本发明涉及信息处理设备和信息处理方法,记录介质及程序,更具体地说,本发明涉及适合于用来向观看电视广播、无线电广播等的节目,以及流式数据等的用户推荐自动记录,节目等的信息处理设备和信息处理方法,记录介质及程序。
背景技术
按照惯例,当在电视广播、无线电广播等中向用户推荐节目时,根据诸如电子节目指南(EPG)之类的节目信息(节目元数据)选择和用户的偏爱信息匹配的节目。向用户推荐节目的方法随着获得用户爱好数据的方法而不同。例如,推荐方法包括一开始登记和用户的兴趣相关的信息,并根据该信息推荐节目的初始兴趣登记方法,利用用户过去观看的节目的历史来推荐节目的观看历史使用方法,或者使用另一用户的观看历史来推荐节目的协同过滤方法。
初始兴趣登记方法在开始使用时,使用户登记例如喜欢的节目种类(例如戏剧,综艺表演等),喜爱的类型(侦探故事,喜剧等),或者喜欢的演员(talent)的姓名,并通过进行作为关键字的这些信息与节目元数据之间的匹配,获得要推荐的节目的名称。
观看历史使用方法累积每次用户观看节目时,所观看的节目的元数据。当历史元数据被保存到一定程度时,分析该元数据,从而获得诸如喜欢的节目种类,喜爱的类型和喜欢的演员的姓名之类的信息。通过进行作为关键字的这些信息与节目元数据之间的匹配,获得要推荐的节目的名称。
在使用HDD(硬盘驱动器)的记录设备中,不仅观看历史,而且诸如记录计划,记录之类的用户操作也可被累积为历史信息,并被用于获得爱好信息。这种情况下,能够部分区分用户不是特别感兴趣地观看的,并且由于电视接收器,收音机等被打开,而处于被观看状态的节目和用户感兴趣而有意观看的节目。从而,能够获得更好地反映用户的偏爱的信息。
协同过滤方法进行第一用户的观看和操作历史与其它用户的观看历史之间的匹配,以搜索具有和第一用户的观看历史类似的观看历史的第二用户,并获得第二用户的观看或操作历史数据,从而抽取和推荐第二用户观看过,但是第一用户还没有观看过的节目。
存在一种事先把作为节目属性信息的n维属性向量加入到广播节目中,并通过比较选择向量和属性向量,能够选择要记录的节目或者要再现的节目的技术(例如日本专利特许公开No.2001-160955),选择向量是根据用户最初登记的内容和用户再现的节目或者由计划的记录所录制的节目的属性向量的每个属性项目的平均值产生的向量。
但是,当根据初始兴趣登记方法选择节目时,只能反映用户进行初始登记时的固定兴趣。此外,为了获得详细的信息,会使用户登记操作复杂化。另一方面,当登记的信息的条数被减少,以便简化初始设置中,输入登记信息的操作时,只能够根据用户的粗略偏爱信息进行推荐,从而,导致选择和用户的偏爱相符的节目的准确性较低。
另一方面,当在历史使用方法等中,利用仅仅根据用户的观看历史收集的元数据的总和或平均值等来选择节目时,除非历史被累积到一定的程度,否则不能推荐正确地与用户的偏爱相符的节目。另外,就历史使用方法来说,元数据之间的关系被遮蔽,从而不能充分地实现个人化。另外,累积历史会导致倾向于累积为历史的项目,例如类型(倾向于被检测为用户偏爱的事物的项目)和其元素倾向于扩展为历史,例如表演者(starring)(倾向于不被检测为用户偏爱的事物的项目)之间加权方面的失衡。
具体地说,在用户是实况广播员A的崇拜者,从而喜欢观看“实况广播员A解说的棒球队B进行的比赛的实况报道”的情况下,作为类型的信息“棒球比赛的实况报道”往往会累积为历史(信息“棒球比赛的实况报道”容易被检测为用户偏爱的事物),而信息“实况广播员A”往往不会累积为历史(信息“实况广播员A”难以被检测为用户偏爱的事物)。从而,存在由另一实况广播员解说的棒球队B进行的比赛的实况报道被推荐,而实况广播员A出现的综艺节目不被推荐的情况。
另外,如日本专利特许公开No.2001-160955公开的那样,在节目属性向量被预先加入到广播节目中,并且通过比较选择向量和属性向量,从而选择要记录的节目或者要再现的节目的情况下,使用了用户操作的历史,于是,在倾向于累积为历史的项目和其元素倾向于扩展成历史,例如表演者等的项目之间会类似地发生加权方面的失衡,所述选择向量是根据用户最初登记的内容,以及用户再现的节目或者计划记录的节目的属性向量的每个属性项目的平均值产生的向量。
另外,例如,在关于喜欢戏剧,并且喜欢很少表演戏剧的喜剧演员A所出现的综艺节目,并且其综艺节目与戏剧的观看比例为2∶8的用户产生的选择向量中,经常表演戏剧,但是不是用户特别喜欢的演员的表演者B被累积为历史。从而,出现经常表演戏剧的表演者B的记录片优先于出现喜剧演员A的综艺演出被推荐。
另外,当用于选择节目的重要项目因用户而异(例如,重要性依附于表演者,或者重要性依附于内容)时,所有项目被类似地计算,从而在一些情况下,不能反映用户独有的偏爱。
此外,协同过滤方法只使用关于另一用户的偏爱的信息,因此难以抽取详细表示每个用户的偏爱的信息。
发明内容
鉴于上述情况,做出了本发明,使得能够选择与用户的偏爱相符的节目。
根据本发明,提供一种信息处理设备,包括:获得内容的属性信息的属性信息获取装置;获得用户的操作历史的操作历史获取装置;根据操作历史获取装置获得的操作历史,产生指示用户的偏爱的正因素的第一偏爱信息和指示用户的偏爱的负因素的第二偏爱信息的偏爱信息产生装置;和通过相互独立地计算第一偏爱信息与属性信息之间的相似度和第二偏爱信息与属性信息之间的相似度,产生指示向用户推荐观看的内容的推荐信息的推荐信息产生装置。
偏爱信息产生装置产生的第一偏爱信息和第二偏爱信息,及属性信息获取装置获得的属性信息都可包括多个项目;偏爱信息产生装置能够促使注意操作历史获取装置获得的操作历史的项目之一,并依据偏爱信息产生装置注意的项目的元素,产生第一偏爱信息和第二偏爱信息;推荐信息产生装置能够抽取对应于属性信息的元素的第一偏爱信息和第二偏爱信息,并计算第一偏爱信息与属性信息之间的相似度和第二偏爱信息与属性信息之间的相似度。
推荐信息产生装置能够根据第一偏爱信息与属性信息之间的相似度和第二偏爱信息与属性信息之间的相似度的独立计算结果,产生指示具有对每个第一偏爱信息和第二偏爱信息的低相似度的内容的推荐信息。
偏爱信息产生装置产生的第一偏爱信息和第二偏爱信息,及属性信息获取装置获得的属性信息都可依据预定的项目被向量化。
信息处理设备还可包括依据项目,使内容的属性信息和第一偏爱信息及第二偏爱信息至少一部分归一化的归一化处理装置;推荐信息产生装置能够通过相互独立地计算第一偏爱信息与内容的属性信息之间的相似度和第二偏爱信息与内容的属性信息之间的相似度,产生推荐信息,内容的属性信息和第一偏爱信息及第二偏爱信息至少一部分由归一化处理装置归一化。
推荐信息产生装置能够根据偏爱信息产生装置产生的第一偏爱信息与属性信息获取装置获得的属性信息的内积的计算,和偏爱信息产生装置产生的第二偏爱信息与属性信息获取装置获得的属性信息的内积的计算,产生推荐信息。
预定项目可包括大项和通过进一步把大项分成具体细节获得的小项;推荐信息产生装置能够依据大项计算偏爱信息产生装置产生的第一偏爱信息与属性信息获取装置获得的属性信息的内积,和偏爱信息产生装置产生的第二偏爱信息与属性信息获取装置获得的属性信息的内积,并根据内积的计算结果的总和,产生推荐信息。
操作历史获取装置能够把获得的操作历史分成指示用户喜欢的内容的第一操作历史和指示用户不喜欢的内容的第二操作历史;偏爱信息产生装置能够根据第一操作历史产生第一偏爱信息,根据第二操作历史产生第二偏爱信息。
推荐信息产生装置能够根据通过从偏爱信息产生装置产生的第一偏爱信息与属性信息获取装置获得的属性信息之间的相似度中,减去偏爱信息产生装置产生的第二偏爱信息与属性信息获取装置获得的属性信息之间的相似度获得的值,产生推荐信息。
信息处理设备还可包括显示推荐信息产生装置产生的推荐信息的显示装置。
信息处理设备还可包括:接收内容的接收装置;和根据推荐信息产生装置产生的推荐信息,控制接收装置接收的内容的选择的选择控制装置。
信息处理设备还可包括记录选择控制装置选择的接收内容的记录装置。
根据本发明,提供一种信息处理方法,包括下述步骤:获得用户的操作历史;根据操作历史获取步骤的处理获得的操作历史,产生指示用户的偏爱的正因素的第一偏爱信息和指示用户的偏爱的负因素的第二偏爱信息;和通过相互独立地计算第一偏爱信息与属性信息之间的相似度和第二偏爱信息与属性信息之间的相似度,产生指示和用户的偏爱相符的内容的推荐信息。
根据本发明,提供一种记录在记录介质上的程序,包括下述步骤:获得用户的操作历史;根据操作历史获取步骤的处理获得的操作历史,产生指示用户的偏爱的正因素的第一偏爱信息和指示用户的偏爱的负因素的第二偏爱信息;和通过相互独立地计算第一偏爱信息与属性信息之间的相似度和第二偏爱信息与属性信息之间的相似度,产生指示和用户的偏爱相符的内容的推荐信息。
根据本发明,提供一种程序,包括下述步骤:获得用户的操作历史;根据操作历史获取步骤的处理获得的操作历史,产生指示用户的偏爱的正因素的第一偏爱信息和指示用户的偏爱的负因素的第二偏爱信息;和通过相互独立地计算第一偏爱信息与属性信息之间的相似度和第二偏爱信息与属性信息之间的相似度,产生指示和用户的偏爱相符的内容的推荐信息。
根据本发明的信息处理设备和信息处理方法以及程序根据用户的操作历史,产生指示用户的偏爱的正因素的第一偏爱信息和指示用户的偏爱的负因素的第二偏爱信息,并通过相互独立地计算第一偏爱信息与属性信息之间的相似度和第二偏爱信息与属性信息之间的相似度,产生指示和用户的偏爱相符的内容的推荐信息。
附图说明
图1是说明电视节目广播和流式数据分发的说明图;
图2是表示图1中的分发服务器的结构的方框图;
图3是说明第一节目向量产生处理的流程图;
图4是说明EPG数据的说明图;
图5是说明节目向量的说明图;
图6是说明第二节目向量产生处理的流程图;
图7是说明第一分组处理的流程图;
图8是说明第二分组处理的流程图;
图9是说明第一标题分组处理的流程图;
图10是说明第二标题分组处理的流程图;
图11是说明第三标题分组处理的流程图;
图12是说明第四标题分组处理的流程图;
图13是表示图1中的节目推荐处理设备的结构的方框图;
图14是说明产生正历史向量和负历史向量的第一处理的流程图;
图15是说明正历史向量的说明图;
图16是说明产生正历史向量和负历史向量的第二处理的流程图;
图17是说明第一匹配处理的流程图;
图18是说明第二匹配处理的流程图;
图19是说明第三匹配处理的流程图;
图20是说明第四匹配处理的流程图;
图21是说明第五匹配处理的流程图;
图22是说明产生用户方效应(effect)向量的第一处理的流程图;
图23是说明产生用户方效应向量的第二处理的流程图;
图24是说明产生用户方效应向量的第三处理的流程图;
图25是说明产生用户方效应向量的第四处理的流程图;
图26是说明产生用户方负效应向量的第一处理的流程图;
图27是说明产生用户方负效应向量的第二处理的流程图;
图28是说明包括组推荐的匹配处理的流程图;
图29是说明利用用户模型的匹配处理的流程图;
图30是说明异常推荐处理的流程图;
图31是表示图1中的电视接收设备的结构的方框图;
图32是表示图1中的电视显示设备的结构的方框图;
图33是说明推荐信息显示处理的流程图;
图34是说明自动频道设置处理的流程图;
图35是表示图1中的记录和再现设备的结构的方框图;
图36是说明自动记录处理的流程图;
图37是表示分发服务器的结构的另一例子的方框图;
图38是表示节目推荐处理设备的结构的另一例子的方框图;
图39是说明电视节目广播和流式数据分发的网络的另一例子的说明图;
图40是表示分发服务器的结构的另一例子的方框图。
具体实施方式
下面参考附图说明本发明的一个实施例。
首先,参考图1说明电视节目广播和流式数据分发。
广播电台1发射地面波节目广播,或者通过卫星2发射卫星波节目广播。虽然图1中只表示和说明了一个广播电台1,但是不必说,可存在多个广播电台1。电视接收设备4的天线3接收地面波或卫星波节目广播。根据需要,广播信号包括EPG(电子节目指南)。
分发服务器5从流式数据数据库6读取流式数据(streaming data),并通过包括因特网和其它网络在内的网络8把流式数据传送给电视接收设备4。另外,分发服务器5从广播电台1读出作为节目广播的信息的EPG,或者从元数据数据库7读出包括比EPG更详细的信息的元数据,为每个节目产生一个节目向量PP,并通过网络8,把节目向量PP连同EPG数据一起传送给EPG接收设备9。
当叠加在一般广播信号上的EPG具有用于后面说明的处理的足量信息时,和叠加在一般广播信号上的EPG相同的数据可被用于所述处理。当叠加在一般广播信号上的EPG的信息的数量不能被认为足以满足后面说明的处理,那么单独地或者除了叠加在一般广播信号上的EPG之外,元数据可被用于所述处理。下面假定叠加在一般广播信号上的EPG并不具有充分的信息量,并且在本实施例中,包括元数据的信息被使用。这样的信息被总称为EPG数据。
EPG接收设备9把传送的EPG数据提供给电视接收设备4。EPG接收设备9还把和EPG数据一起传送的节目向量PP提供给节目推荐处理设备10。
具有调谐器的电视接收设备4根据从具有操作部分的电视显示设备11或者记录和再现设备12供给的指示频道选择的控制信号,通过天线3选择和接收地面波或卫星波节目广播。电视接收设备4还通过网络8接收从分发服务器5传送的流式数据。另外,电视接收设备4从EPG接收设备9接收EPG数据,并把该EPG数据提供给电视显示设备11或者记录和再现设备12。顺便提及,当电视接收设备4接收的广播波包括EPG时,电视接收设备4把EPG和节目信号分开,并把EPG和节目信号提供给电视显示设备11或者记录和再现设备12。
节目推荐处理设备10从EPG接收设备9获得节目向量PP,并从电视显示设备11以及记录和再现设备12获得操作日志。节目推荐处理设备10根据这些信息或者用户的输入操作,产生推荐和用户的偏爱相符的节目的推荐信息,随后把推荐信息提供给电视显示设备11及记录和再现设备12。
根据用户的操作输入,电视显示设备11显示从电视接收设备4供给的广播信号或者从记录和再现设备12供给的再现信号,并根据从节目推荐处理设备10供给的推荐信息,自动设置频道或显示推荐的节目信息。电视显示设备11把作为用户的操作历史的操作日志提供给节目推荐处理设备10。
根据用户的操作输入,记录和再现设备12把从电视接收设备4供给的广播信号记录在装入记录和再现设备12中的记录介质或者内置记录介质(例如硬盘)上,并根据从节目推荐处理设备10供给的推荐信息,自动把从电视接收设备4供给的广播信号记录到装入的记录介质或者内置记录介质上。另外,记录和再现设备12再现记录在装入的记录介质或者内置记录介质上的节目,并把该节目输出给电视显示设备11显示。此外,记录和再现设备12还把作为用户的操作历史的操作日志提供给节目推荐处理设备10。
虽然这种情况下,EPG接收设备9,电视接收设备4,节目推荐处理设备10,电视显示设备11及记录和再现设备12被描述成不同的设备,不过这些设备不必被相互独立地形成。例如不必说,EPG接收设备9,电视接收设备4和电视显示设备11可被相互集成地形成为包括调谐器功能的电视接收器15-1。另外,记录和再现设备12可与EPG接收设备9,电视接收设备4和电视显示设备11集成,从而形成具有记录功能的电视接收器15-2。不必说,记录和再现设备12可以是具有作为记录介质的大存储容量硬盘的所谓硬盘记录器。此外,节目推荐处理设备10可被包括在具有调谐器功能的电视接收器15-1中,从而形成电视接收器15-3,或者节目推荐处理设备10可被包括在具有记录功能的电视接收器15-2中,从而形成电视接收器15-4。
图2是表示分发服务器5的结构的方框图。
数据获取单元21从元数据数据库7和流式数据数据库6获得数据,随后把数据提供给数据传输单元25。数据获取单元21还把EPG数据提供给元数据抽取单元22。此外,数据获取单元21根据EPG数据的内容,对登记在元数据数据库7中的EPG数据分组。
元数据抽取单元2从供给自数据获取单元21的EPG数据中抽取产生节目向量PP所必需的数据,随后把数据提供给节目向量产生单元23。节目向量产生单元23根据元数据产生节目向量PP,根据需要,使节目向量PP与保存在数据存储单元24中的节目方效应(effect)向量EfPP相关联,随后把节目向量PP提供给数据传输单元25。
根据需要,数据存储单元24保存节目方效应向量EfPP,节目方效应向量EfPP是产生节目向量PP所必需的信息。
根据制作方和广播方的如何提高收视率的观点,教育节目具有类型和内容的要素较强的特性,综艺节目等具有表演者的要素较强的特性,戏剧等具有表演者和编剧的要素较强的特性。为了正确地抽取节目的特性,需要使用这些特性。即,在所进行的推荐和用户的偏爱相符的节目的匹配处理中,构成节目向量PP的哪些元素是重要的将因节目的类型而不同。
具体地说,当节目的类型是“文艺和记录片”时,重要的项目不是表演者,而是节目的内容和标题。另一方面,当节目的类型是“综艺”时,重要的项目是表演者,当节目的类型是“戏剧”时,重要的项目是表演者和编剧。当这些项目被用于产生节目向量PP时,依据节目的类型,定义匹配处理中每个项目的贡献程度的节目方效应向量被设置并被保存在数据存储单元24中。
数据传输单元25通过网络8把从数据获取单元21供给的EPG数据和流式数据,以及从节目向量产生单元23供给的节目向量PP和节目方效应向量EfPP传送给EPG接收设备9或者电视接收设备4。
根据需要,节目向量产生单元23与驱动器26连接。如果需要,磁盘31、光盘32、磁光盘33和半导体存储器34被装入驱动器26,以致相对于驱动器26发送和接收数据。
下面参考图3的流程图,说明分发服务器5进行的第一节目向量产生处理。
在步骤S1,数据获取单元21接收包括从元数据数据库7供给的元数据的EPG数据。
在步骤S2,元数据抽取单元22接收从数据获取单元21供给的EPG数据,抽取产生节目向量PP所需的元数据,随后把元数据输出给节目向量产生单元23。
图4表示元数据的一个例子。元数据包括作为类型的“Movie:Japnese movie”,作为电影标题的“Tokaido Mitsuya Kaidan”,广播日期和关于发行者,广播日期和时间,广播该电影的广播电台的名称,以及广播时间的数据。元数据还包括关于导演的姓名,编剧的姓名,摄像师,负责音乐的人员和表演者的数据,以及作为节目的内容的关于电影的解说。
在步骤S3,根据需要,节目向量产生单元23对包括在元数据中的标题、内容等进行词法分析,从而把标题、内容等分解成单词。具体地说,节目向量产生单元23把包括在元数据中的电影的标题分解成3个单词,即“Tokaido”,“Mitsuya”和“Kaidan”。如图4中所示,当信息“′59 ShinSaiho The Masterpiece of Japanese horror movies that depicts the worldof well-known″Mitsuya Kaidan″with full stylistic beauty”作为电影的评论被包括在元数据中时,节目向量产生单元23抽取包括在该评论中的单词,并把“Saiho”,“stylistic”,“beauty”,“full”,“well-known”,“Mitsuya”,“Kaidan”,“world”,“depicts”,“Japanese movie”,“horror”和“masterpiece”设置为内容信息。
在步骤S4,节目向量产生单元23使包括在元数据中的每个项目向量化,产生节目向量PP。随后结束处理。产生的节目向量PP被输出给数据传输单元25,随后通过网络8被传送给EPG接收设备9。在使每个项目向量化的过程中,所有详细项目可被排成一排,或者可被分成大项,并依据大项被向量化。
例如,当进行依据大项的向量化时,产生节目向量PP={Tm,Gm,Pm,Am,Km},标题、类型、时间段(slot)、广播电台、表演者、编剧/作者/制片人和内容被设置成7个大项,如图5中所示。随后,项目的内容被向量化为标题(标题)Tm={标题1,标题2,...},类型(类型)Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,文艺/记录片,新闻/报告,其它},时间段(小时)Hm={早晨,中午,傍晚,黄金时段,深夜},广播电台(电视台)Sm={NNK Sogo,NNK Kyouiku,AsiaTelevision,TTS,Buji,Telenichi,Toto,NNK Eisei Daiichi,NNK EiseiDaini,WOWO},表演者(人员)Pm={A,B,...},编剧/作者/制片人等(作者)Am={a,b,...},内容(关键字)Km={kw1,kw2,...}。
在上述7个大项中,在大项“类型”、“广播电台”和“时间段”中可设置一种类别,于是,相应的详细元素中由数字向量表示。例如,就广播电台Sm={NNK Sogo,NNK Kyouiku,Asia Television,TTS,Buji,Telenichi,Toto,NNK Eisei Daiichi,NNK Eisei Daini,WOWO}来说,当对应节目的广播电台是WOWO时,广播电台向量可由广播电台Sm={0,0,0,0,0,0,0,0,0,1}表示。就类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,文艺/记录片,新闻/报告,其它}来说,当对应节目的类型是文艺/记录片时,类型向量可由类型Gm={0,0,0,0,0,0,1,0,0}表示。
另一方面,对不能由数字向量表示的项目,例如大项“标题”、“表演者”、“编剧/作者/制片人”和“内容”,根据包括在向量中的单词的频率,使项目值(单词)与加权值(数值)相互关联。例如,大项“标题”由均包含一个单词和一个数值的元素表示,如同标题Tm={Tokaido-1,Mitsuya-1,Kaidan-1}中一样。例如,本例中的“Tokaido-1”表示单词“Tokaido”的频率为1。
节目向量PP由上述处理产生,随后被传送给EPG接收设备9。具体地说,当由前面参考图4说明的节目元数据产生节目向量PP时,节目向量PP={标题Tm={Tokaido-1,Mitsuya-1,Kaidan-1},类型Gm={0,0,0,1,0,0,0,0,0},时间段Hm={0,0,0,0,1},广播电台Sm={0,0,0,0,0,0,0,0,0,  1},表演者Pm={Katsumi  Wakasugi-1,Shigeru  Amami-1,ToshihikoEmi-1,Ryuujiro Nakamura-1,Noriko Nishizawa-1},编剧/作者/制片人Am={Nobuo Nakagawa-1,Shochi Ohnuki-1,Yoshihiro Ishida-1,ShojiNishimoto-1,Chuta Watanabe-1},内容Km={Saiho-1,stylistic-1,beauty-1,full-1,well-known-1,Mitsuya-1,Kaidan-1,world-1,depicts-1,Japanese movie-1,horror-1,masterpiece-1}}。该节目向量PP被传送给EPG接收设备9。
可在表演者Pm的元素中的主角被加权,编剧/作者/制片人Am的元素中的导演被加权的情况下,产生节目向量PP。这种情况下,节目向量PP的元素例如是表演者Pm={Katsumi Wakasugi-3,Shigeru Amami-2,Toshihiko Emi-1,Ryuujiro Nakamura-1,Noriko Nishizawa-1},和编剧/作者/制片人Am={Nobuo Nakagawa-3,Shochi Ohnuki-1,YoshihiroIshida-1,Shoji Nishimoto-1,Chuta Watanabe-1}。
如上所述,产生节目向量PP中的重要元素随着节目类型的不同而不同。当指示依据类型的重要元素的节目方效应向量EfPP作为节目方效应向量信息被保存在数据存储单元24中时,节目方效应向量EfPP可与节目向量PP相关联地被传送。设置节目方效应向量EfPP以便对应于节目向量PP的大项。
当节目的类型是节目向量PP={标题Tm,类型Gm,时间段Hm,广播电台Sm,表演者Pm,编剧/作者/制片人Am,内容Km}中的“文艺/记录片”时,重要的项目是节目的内容和标题(加权值为3),从而节目方效应向量EfPP={3,1,1,1,1,1,3}。另一方面,当节目的类型是综艺时,重要的项目是表演者(加权值为5),从而节目方效应向量EfPP={1,1,1,1,5,1,1}。当节目的类型是戏剧时,重要的项目是表演者(加权值为2)和编剧,从而当编剧特别重要时(加权值为3),节目方效应向量EfPP={1,1,1,1,2,3,1}。
参考图6的流程图,下面说明当与节目向量PP相关联地传送节目方效应向量EfPP时的第二节目向量产生处理。
在步骤S11-S14中进行与参考图3说明的步骤S1-S4进行的处理相同的处理。具体地说,接收从元数据数据库7供给的EPG数据,从EPG数据抽取产生节目向量PP所必需的元数据,随后根据需要,对包括在元数据中的标题、内容等进行词法分析,以便分解成单词。随后,包括在元数据中的每个项目被向量化,从而产生节目向量PP。
在步骤S15,根据供给的元数据的节目的类型,节目向量产生单元23从保存在数据存储单元24中的效应向量信息中抽取对应的效应向量。例如,当节目的类型是“综艺”时,节目向量产生单元23从数据存储单元24抽取对表演者加权的效应向量EfPP={1,1,1,1,5,1,1}。
在步骤S16,节目向量产生单元23使在步骤S15中抽取的效应向量EfPP与在步骤S14中产生的节目向量PP相关联。随后结束处理。
通过上述处理,节目向量PP被产生,根据节目的类型对重要项目加权的节目方效应向量EfPP与节目向量PP相关联,并通过网络8,被传送给EPG接收设备9。
虽然节目向量PP如上所述产生,不过通过根据节目的属性对节目分组,可用少量的操作准确地产生节目向量PP。
节目可被归入例如连续剧,以一周为单位的相同类型的一组节目,以计划单位(13周)表示的依据表演者的一组节目。作为分组的一个具体例子,下面参考图7的流程图,说明当连续剧被分组时的第一分组处理。
在步骤S31,数据获取单元21从登记在元数据数据库7中的EPG数据中抽取和预定的条件(分组条件),例如相同标题,相同广播电台,在工作日的相同广播时间或者在一周的同一天的相同广播时间相符的节目。
在步骤S32,数据获取单元21对抽取的节目分组,并向对应节目的EPG数据加入组ID。
在步骤S33,元数据抽取单元22抽取为了产生具有相同组ID,即识别为连续剧的节目的第一广播的节目向量PP而需要的元数据。
在步骤S34,进行参考图3或图6说明的节目向量产生处理。
在步骤S35,节目向量产生单元23把对应组ID的节目向量PP固定并设置成第一广播的节目向量。随后结束处理。
通过上述处理,连续剧被分组,节目向量被统一。组ID和节目向量PP中相互关联地保存在数据存储单元24中。
特别地,虽然在连续剧的EPG数据中的第一集的内容是节目的整体描述,不过除第一集之外的某一集的内容通常是该集的描述,而不代表节目的整体内容。另外,在每集中,除内容之外的各部分元数据基本相同。从而,通过利用第一集的EPG数据产生节目向量PP,不仅能够减少节目向量产生处理的次数,而且还能够产生更准确地与节目的特性相符的节目向量PP。
虽然图7中说明把相同ID加入连续剧的EPG数据中的处理,不过当区分连续剧的信息事先已被包括在EPG数据中,那么可省略步骤S31的处理,从而通过参考包括在EPG数据中的区分连续剧的信息,把相同ID加入到连续剧的EPG中。
下面参考图8,说明根据不同于连续剧的元素,进行分组的第二分组处理。下面将假定基于类型和表演者进行分组,进行下面的说明。
在步骤S51,数据获取单元21参考记录在元数据数据库7中的EPG数据,并把对应于元数据内容的群集代码加入节目的EPG数据中。
例如抽取和连续剧的预定条件,例如相同标题,相同广播电台,在工作日的相同广播时间或者在一周的同一天的相同广播时间相符的节目。在识别成连续剧的抽取的一组节目中,确定最低有效数位的第一群集代码;例如,根据连续剧的广播时间,用于工作日的相同时间的代码1,用于一周的同一天的相同时间的代码2,或者用于不同于代码1和代码2的广播时间,例如交替的日子或星期中的广播时间等的代码3。当该组节目不是连续剧时,最低有效数位的第一群集代码是0。
下面,参考登记在元数据数据库7中的元数据中的类型数据,依据类型确定具有作为第二最低有效位(第二数位)的数值的第二群集代码,例如代码20或代码30。
最后,参考登记在元数据数据库7中的元数据中的表演者数据,确定通过利用第二最低有效数位之上的数位(第三数位及以上)表示的第三群集代码,例如代码2300或代码800。
第一到第三群集代码的总和是加入节目的EPG中的群集代码。
在步骤S52,数据获取单元21根据群集代码的第一数位是否为0,确定对应EPG是否是连续剧的EPG。
当数据获取单元在步骤S52中确定对应EPG是连续剧的EPG,那么在步骤S53和S54进行和图7中的步骤S33和S34相同的处理。即,第一广播的EPG被抽取,并进行参考图3或图6说明的节目向量产生处理。
在步骤S55,节目向量产生单元23把连续剧的节目向量PP固定和设置成第一广播的节目向量PP,并使产生的群集代码与节目向量PP相互关联。随后结束处理。
当数据获取单元21在步骤S52中确定对应的EPG不是连续剧的EPG时,在步骤S56中进行参考图3或图6说明的节目向量产生处理。
在步骤S57,节目向量产生单元23使产生的群集代码与节目向量PP相关联。随后结束处理。
即使就不同于连续剧的节目来说,上述处理也能够实现基于类型和表演者的节目向量PP的分组,而且能够实现指示该组的群集代码与节目向量PP的关联。
由于参考图2说明的分发服务器5如上参考图3-8所述那样产生节目向量PP,因此总是能够产生对应于新术语或类型等的节目向量PP。产生的节目向量PP连同EPG数据一起通过网络8被EPG接收设备9接收,随后被提供给节目推荐处理设备10。
通过对标题进行词法(morphological)分析,以便把标题分解成单词,并向每个单词附加一个组ID,可进行分组处理。
下面参考图9的流程图说明第一标题分组处理。
在步骤S61,数据获取单元21参考登记在元数据数据库7中的EPG数据,从登记的元数据中抽取标题,随后把标题提供给节目向量产生单元23。
在步骤S62,节目向量产生单元23对标题进行词法分析,以便把标题分解成单词。具体地说,当包括在元数据中的电影标题是“TokaidoMitsuya Kaidan”时,该标题被词法分析,从而获得3个单词:“Tokaido”,“Mitsuya”和“Kaidan”。
在步骤S63,节目向量产生单元23抽取分析的单词或包括多个单词的单词组之一,并从数据存储单元24抽取对应于所抽取单词或单词组的组ID。
通过组合语法分析获得的单词,产生包括多个单词的单词组。当词法分析获得的单词是“Tokaido”,“Mitsuya”和“Kaidan”时,单词组是“Tokaido Mitsuya”,“Tokaido Kaidan”或者“Mitsuya Kaidan”。
在步骤S64,节目向量产生单元23确定是否从数据存储单元24抽取了对应的组ID。
当节目向量抽取单元23在步骤S64中确定对应的组ID未被抽取时,抽取的单词或者包括多个单词的抽取的单词组还未配备组ID。于是,在步骤S65,节目向量产生单元23使新的组ID与抽取的单词或者包括多个单词的抽取单词组相关联。节目向量产生单元23还把该单词或者包括多个单词的单词组连同与之对应的组ID一起保存在数据存储单元24中。
当节目向量抽取单元23在步骤S64中确定对应的组ID被抽取时,或者在步骤S65的处理完成之后,节目向量产生单元23在步骤S66确定是否已对构成标题的所有单词或者包括多个单词的所有单词组抽取了一个组ID。
当节目向量抽取单元23在步骤S66中确定还未对构成标题的所有单词或者包括多个单词的所有单词组抽取一个组ID时,处理返回步骤S63,重复步骤S63及后续步骤的处理。
当节目向量抽取单元23在步骤S66中确定对构成标题的所有单词或者包括多个单词的所有单词组抽取了一个组ID时,节目向量产生部分23在步骤S67使抽取的组ID与节目向量PP相关联。随后结束处理。
通过上述处理,对应于构成标题的单词或者单词组的组ID与节目向量PP相关联,并通过网络8由数据传输单元25传送给电视接收设备4或者EPG接收设备9。
具有类似标题的节目可被包括在相同组内。例如,为了能够把标题为“2-Nen A-Gumi Ginpachi Sensei”的连续剧和标题为“2-NenA-Gumi Ginpachi Sensei Special”的特别节目包括在相同的组中,根据构成标题的单词的词法分析的结果,在所有组合中计算在预定的周期,例如2周、1个月或半年中节目标题之间的单词匹配率。当标题之间的单词匹配率是预定值或更高时,所述标题可被包括在相同的组中。
下面参考图10的流程图,说明根据构成标题的单词之间的匹配率,进行分组的第二标题分组处理。
在步骤S401和S402中进行与参考图9说明的步骤S61和S62相同的处理。即,数据获取单元21参考记录在元数据数据库7中的EPG数据,从登记的元数据中抽取标题,随后把标题提供给节目向量产生单元23。节目向量产生单元23对标题进行词法分析,从而把标题分解成单词。
在步骤S403,根据分析的单词,节目向量产生单元23计算指示标题之间的单词匹配度的匹配率,即单词之间的匹配率。
具体地说,当标题“2-Nen A-Gumi Ginpachi Sensei”和标题“2-Nen A-Gumi Ginpachi Sensei Special”分别被词法分析成“2”,“Nen”,“A”,“Gumi”,“Ginpachi”和“Sensei”,以及“2”,“Nen”,“A”,“Gumi”,“Ginpachi”,“Sensei”和“Special”时,构成这两个节目的标题的单词之间的匹配率为6/7或者85.7%。
在步骤S404,节目向量产生单元23确定单词之间的匹配率是否是例如预定值70%或者更高。不必说,匹配率的阈值可以是不同于70%的任意数值。
当节目向量产生单元23在步骤S404中确定单词之间的匹配率是预定值,例如70%或者更高时,节目向量产生单元23在步骤S405中使这些节目与相同的组ID相关联。节目向量产生单元23还把匹配单词或者单词组以及与之对应的组ID一起保存在数据存储单元24中。
当节目向量产生单元23在步骤S404中确定匹配率小于例如预定值70%,或者在步骤S405的处理结束之后,节目向量产生单元23在步骤S406中确定标题之间的所有组合中的处理是否已完成。
当节目向量产生单元23在步骤S406中确定标题之间的所有组合中的处理没有完成时,处理返回步骤S403,重复步骤S403以及后续步骤的处理。
当节目向量产生单元23在步骤S406中确定标题之间的所有组合中的处理已完成时,结束处理。
通过上述处理,根据构成标题的单词之间的匹配率使组ID与节目向量相关联,并且通过网络8,由数据传输单元25传送给电视接收设备4或者EPG接收设备9。从而,具有类似标题的节目,例如连续剧及其特别节目可作为相同组被处理。
另外,通过根据构成标题的单词之间的匹配率确定组,即使在EPG或元数据中存在半尺寸和全尺寸数字,半尺寸和全尺寸英文字母,或者大写字母和小写字母之间的书写差异,也能把具有相同标题的节目检测为相同组。
除了单词匹配率之外,广播电台,节目类型或广播开始时间可被加入到分组条件中。例如,由于新闻节目的标题包含包括“新闻”在内的很少单词,因此即使不同广播电台的不同形式的新闻节目也会被参考图10的流程图说明的处理检测为相同组。于是,除了单词匹配率之外,当广播电台相互匹配时,节目可被包括在相同组中。
下面参考图11的流程图,说明根据构成标题的单词之间的匹配率,以及作为附加条件的广播电台之间的匹配,进行分组的第三标题分组处理。
在步骤S421和S424中进行与参考图10说明的步骤S401和S404相同的处理。即,数据获取单元21参考登记在元数据数据库7中的EPG数据,从登记的元数据中抽取标题,随后把标题提供给节目向量产生单元23。节目向量产生单元23对标题进行词法分析,把标题分解成单词。根据分析的单词,节目向量产生单元23计算标题之间的单词匹配度,并确定单词之间的匹配率是否是预定值,例如70%或者更高。
当节目向量产生单元23在步骤S424中确定单词之间的匹配率是预定值,例如70%或者更高时,节目向量产生单元23在步骤S425中确定这些节目的广播电台是否彼此相符。
当节目向量产生单元23在步骤S425中确定这些节目的广播电台彼此相符时,节目向量产生单元23在步骤S426中使相同的组ID与这些节目相关联。节目向量产生单元23还把匹配单词或者单词组和广播电台以及与之对应的组ID一起保存在数据存储单元24中。
当节目向量产生单元23在步骤S424中确定匹配率小于预定值,例如70%时,当节目向量产生单元23在步骤S425中确定这些节目的广播电台彼此不相符时,或者在步骤S426的处理结束之后,节目向量产生单元23在步骤S427确定标题之间的所有组合中的处理是否已完成。
当节目向量产生单元23在步骤S427中确定标题之间的所有组合中的处理还没有完成时,处理返回步骤S423,重复步骤S423以及后续步骤的处理。
当节目向量产生单元23在步骤S427中确定标题之间的所有组合中的处理已完成时,结束处理。
通过上述处理,根据广播电台之间的匹配,以及构成标题的单词之间的匹配率,使组ID与节目向量相关联,并通过网络8由数据传输单元25传送给电视接收设备4或者EPG接收设备9。从而,当具有类似标题的节目被包括在相同组中时,能够防止把其它广播电台的新闻节目包括到相同组中。
要注意的是虽然在参考图11的说明中,除了根据构成标题的单词之间的匹配率之外,还根据广播电台是否相同的条件进行分组,不过不必说,除了广播电台之外,可利用广播时间段或类型作为不同于构成标题的单词之间的匹配率的另一条件进行分组。
另外,即使由于体育转播,特别节目等的缘故,连续剧或在固定时间内播放的节目的广播开始时间被改变,为了使连续剧或在固定时间内播放的节目可被检测为相同组,可根据作为不同于构成标题的单词之间的匹配率的另一条件的广播开始时间是否彼此相符,差值在1小时的预定时间范围内的条件,进行节目分组。
下面参考图12的流程图,说明根据构成标题的单词之间的匹配率,以及广播开始时间是否彼此相符,差值在预定时间范围内的附加条件,进行节目的第四标题分组处理。
在步骤S441和S444进行与参考图10说明的步骤S401和S404相同的处理。即,数据获取单元21参考登记在元数据数据库7中的EPG数据,从登记的元数据中抽取标题,随后把标题提供给节目向量产生单元23。节目向量产生单元23对标题进行词法分析,从而把标题分解成单词。根据分析的单词,节目向量产生单元23计算标题之间的单词匹配度,并确定单词之间的匹配率是否是预定值,例如70%或者更高。
当节目向量产生单元23在步骤S444中确定单词之间的匹配率是预定值,例如70%或者更高时,节目向量产生单元23在步骤S445中确定这些节目的广播开始时间是否彼此相符,差值在预定时间,例如1小时的范围内。
当节目向量产生单元23在步骤S445中确定这些节目的广播开始时间彼此相符,差值在预定时间范围内时,节目向量产生单元23在步骤S446中使相同的组ID与这些节目相关联。节目向量产生单元23还把匹配单词或者单词组以及广播开始时间的范围和与之对应的组ID一起保存在数据存储单元24中。
当节目向量产生单元23在步骤S444中确定匹配率小于预定值,例如70%时,当节目向量产生单元23在步骤S445中确定这些节目的广播开始时间彼此之间的差值大于预定范围时,或者在步骤S446的处理结束之后,节目向量产生单元23在步骤S447确定标题之间的所有组合中的处理是否已完成。
当节目向量产生单元23在步骤S447中确定标题之间的所有组合中的处理还未完成时,处理返回步骤S443,重复步骤S443以及后续步骤的处理。
当节目向量产生单元23在步骤S447中确定标题之间的所有组合中的处理已完成时,结束处理。
通过上述处理,根据广播开始时间之间包括在预定范围内的差异的匹配,和构成标题的单词之间的匹配率,组ID与节目向量相关联,并通过网络8由数据传输单元25传送给电视接收设备4或者EPG接收设备9。从而,当具有类似标题的节目被包括在相同组中时,能够防止由于特别节目等引起的广播时间的变化,应被检测为相同组的节目不被检测为相同组的问题。
图13是表示节目推荐处理设备10的结构的方框图。
数据获取单元41获得从分发服务器5传送的节目向量PP,以及对应于节目向量PP的节目方效应向量EfPP。节目向量抽取单元42从数据获取单元41获得的节目向量PP抽取匹配处理所必需的节目向量PP,或者产生用户模型所必需的节目向量PP,并根据需要,把节目向量PP连同节目方效应向量EfPP一起传送给匹配处理单元43。
操作输入单元44包括诸如键盘、触摸垫和鼠标之类的输入装置。操作输入单元44接收用户输入的初始登记信息,以及用于产生用户模型的主题,随后把初始登记的信息和主题输出给初始登记存储单元45。初始登记存储单元45登记从操作输入单元44供给的初始登记内容和用于产生用户模型的主题,并根据需要,把初始登记内容和主题提供给操作日志获取单元46和匹配处理单元43。根据从操作输入单元44输入的用户操作,连续更新登记在初始登记存储单元45中的内容。初始登记内容包括指示用户不喜欢的节目的信息,例如用户不喜欢的类型、关键字和表演者,以及指示用户喜欢的节目的信息,例如用户喜欢的类型、关键字和表演者。
操作日志获取单元46从电视显示设备11或记录和再现设备12获得操作日志,并把这些信息分成正历史和负历史。根据需要,通过参考保存在初始登记存储单元45中的信息,操作日志获取单元46从数据获取单元41获得的节目向量PP中读取对应于正历史和负历史的节目向量PP。操作日志获取单元46随后把正历史和负历史分别提供给正历史存储单元47和负历史存储单元48,以便分别把正历史和负历史保存在正历史存储单元47和负历史存储单元48中。正历史存储单元47保存供给的正历史,并产生正历史向量UP。负历史存储单元48保存供给的负历史,并产生负历史向量MUP。产生的正历史向量UP和产生的负历史向量MUP被提供给匹配处理单元43。
正历史是用于抽取用户观看态度积极的,或者被用户认为是合乎需要的候选节目的信息。例如,当用户观看或记录节目时,或者当用户接受和观看或记录由后面说明的处理以推荐节目列表的形式向用户建议的节目时,该节目的元数据被保存在正历史存储单元47中作为良好印象元数据。正历史存储单元47得到每个详细项目或者每个大项的正历史的总和,产生正历史向量UP。
另一方面,负历史是用于从推荐节目中排除用户不想观看的,或者被用户认为不合需要的节目的信息。例如,当节目具有登记在初始登记中的不喜欢的项目,或者在记录后,未被观看即被擦除时,或者当用户不接受也不观看或记录由后面说明的处理以推荐节目列表的形式向用户推荐的节目时,该节目的元数据被保存在负历史存储单元48中作为负印象元数据。例如,当用户在最初登记中把“体育”规定为不喜欢的项目时,具有用于负印象的加权值5的类型Gmup={0,0,5,0,0,0,0,0,0}被额外保存在负历史存储单元48中。负历史存储单元48得到每个详细项目或者每个大项的负历史的总和,产生负历史向量MUP。
匹配处理单元43验证从节目向量抽取单元42抽取的节目向量和从正历史存储单元47或者负历史存储单元48供给的正历史向量UP或负历史向量MUP之间的匹配。
当节目向量PP和正历史向量UP或负历史向量MUP的所有详细项目在被排列成一行的状态下被向量化时,由于标题、关键字等由多个单词形成,因此单词之一和诸如类型之类的项目在向量中具有相同的加权值。因此,匹配处理单元43的归一化处理单元61通过把单词除以节目的单词的数目,使作为包含单词的项目的标题和内容归一化。例如标题Tm={Tokaido-1,Mitsuya-1,Kaidan-1}被归一化成标题Tm={Tokaido:0.33,Mitsuya:0.33,Kaidan:0.33}。从而,每个标题和内容项目内的单词具有为1的总加权值,从而在匹配处理中不会出现任何不方便。
向量运算单元62进行节目向量PP和正历史向量UP或负历史向量MUP之间的匹配处理。
当节目向量PP,正历史向量UP和负历史向量MUP都由使所有详细元素排成一行的向量表示时,向量运算单元62根据正历史向量UP或负历史向量MUP与节目向量PP之间的向量间余弦距离(cosθ),得到由下面的等式(1)表述的节目向量PP和正历史向量UP之间的相似度SimUP,或者由等式(2)表述的节目向量PP和负历史向量MUP之间的相似度SimMUP。如等式(1)和(2)所示,余弦距离是通过把两个向量的内积除以这两个向量的绝对值的乘积而得到的值。
SimUP=cosθu=UP·PP/|UP|×|PP|    (1)
SimMUP=cosθm=MUP·PP/|MUP|×|PP|    (2)
在等式(1)和(2)中,PP表示节目向量PP,UP表示正历史向量UP,MUP表示负历史向量MUP。另外,“·”内积,“×”表示元素的乘积(标量运算)。
当节目向量PP,正历史向量UP和负历史向量MUP都依据大项被向量化时,向量运算单元62能够得到每个大项中,节目向量PP和正历史向量UP之间的相似度,以及节目向量PP和负历史向量MUP之间的相似度,计算相应大项中的相似度的总和,从而计算相似度SimUP和相似度SimMUP。例如当在分别成单词的大项“标题”中,正历史向量UP是标题Tup={school-1,Kaidan-1,Toilet-1},提供的节目向量PP是标题Tm={Tokaido-1,Mitsuya-1,Kaidan-1},假定单位向量的长度为1,由于向量的长度(绝对值)是全部元素的平方和的平方根,根据下面的等式(3)计算作为标题的相似度的余弦距离cosθt。
cos θt = ( 1 · 1 ) / ( 3 × 3 ) = 1 / 3 - - - ( 3 )
在等式(3)中,“·”表示内积,“×”表示标量运算。按照类似于等式(3)的计算,计算大项的节目向量PP和负历史向量MUP之间的相似度。
例如当正历史向量UP是正历史向量UP={标题Tup,类型Gup,表演者Pup,编剧/作者/制片人Aup,内容(关键字)Kup},负历史向量MUP是负历史向量MUP={标题Tmup,类型Gmup,表演者Pmup,编剧/作者/制片人Amup,内容(关键字)Kmup}时,由于利用类似于等式(3)的计算,在每个大项中获得大项的相似度,因此相似度SimUP和相似度SimMUP均被计算成下面的等式(4)的相似度Sim。
Sim=cosθt+cosθg+cosθp+cosθa+cosθk    (4)
在该等式中,cosθt表示在大项“标题”中,节目向量PP和正历史向量UP或负历史向量MUP之间的余弦距离;cosθg表示在大项“类型”中,节目向量PP和正历史向量UP或负历史向量MUP之间的余弦距离;cosθp表示在大项“表演者”中,节目向量PP和正历史向量UP或负历史向量MUP之间的余弦距离;cosθa表示在大项“编剧/作者/制片人”中,节目向量PP和正历史向量UP或负历史向量MUP之间的余弦距离;cosθk表示在大项“内容”中,节目向量PP和正历史向量UP或负历史向量MUP之间的余弦距离。
当相似度SimUP和相似度SimMUP都被计算成相应大项中的计算结果的总和时,项目之间的加权值方面的失衡被消除,这与归一化是同义的。从而,不同于把所有元素排成一行的向量,不需要进行由归一化处理单元61进行的归一化处理。
即,当在不进行归一化处理的情况下把所有元素排成一行的向量时,随着历史的增大,诸如标题和内容之类的项目中的单词的数目增大,但是和项目频率倾向于增大的诸如广播电台或类型之类的项目相比,每个单词的频率不会增大。
从而,当通过使用所有元素获得元素的计算结果的总和时,其中项目频率倾向于增大的诸如广播电台和类型之类的项目的效应变得更大。例如,在用户是实况广播员A的崇拜者,从而用户喜欢观看“由实况广播员A解说的棒球队B进行的比赛的实况报道”的情况下,作为类型的信息“棒球比赛的实况报道”往往会累积为历史,而信息“实况广播员A”不会累积为历史。从而,出现另一实况广播员解说的棒球队B进行的比赛的实况广播被推荐,而不推荐出现实况广播员A的综艺节目的情况。
另一方面,通过进行归一化处理,或者把相应大项中的计算结果的总和计算成相似度SimUP或和相似度SimMUP,那么能够推荐实况广播员A参与的综艺节目,而不受历史之间的频率方面的差异的影响。从而能够高度准确地反映用户的偏爱。
向量运算单元62还能够通过根据用户初始登记的,保存在初始登记存储单元45中的信息,与节目向量PP相关联地传送的节目方效应向量EfPP,或者产生并登记在用户信息登记单元63中的用户方效应向量EfUP(后面说明)或者用户方负效应向量EfMUP(后面说明)进行加权,计算相似度SimUP和相似度SimMUP。
例如,向量运算单元62根据由上述方法计算的相似度SimUP,获得历史向量MUP之间的相似度SimMUP,和预定数目(例如10个)的具有对正历史向量的最高相似度的节目,计算SimUP-SimMUP,随后把作为计算结果的具有最大相似度的预定数目的(例如3个)节目输出给推荐信息输出单元49作为推荐节目。
当节目向量PP被分组时,向量运算单元62根据推荐节目信息,把推荐的优先组登记在用户信息登记单元63中,优先推荐和推荐的优先组对应的节目。
此外,向量运算单元62能够通过利用保存在初始登记存储单元45中的主题来过滤节目向量PP,产生用户模型向量,并把用户模型向量登记在用户信息登记单元63中,进行匹配处理。用户模型的细节将在后面说明。
用户信息登记单元63根据从初始登记存储单元45供给的用户初始登记的内容,或者从正历史存储单元47或负历史存储单元48供给的正历史向量UP或者负历史向量MUP,产生用户方效应向量EfUP和用户方负效应向量EfMUP,随后保存用户方效应向量EfUP和用户方负效应向量EfMUP。用户方效应向量EfUP指示大项的哪些元素对用户选择节目来说是重要的,并被赋予选择节目的重要性,或者指示每个项目中用户的偏爱。用户方负效应向量EfMUP指示大项的哪些元素对用户选择节目来说不重要,并不被赋予选择节目的重要性,或者指示每个项目中用户不喜欢的项目
换句话说,用户方效应向量EfUP和用户方负效应向量EfMUP定义哪些项目对节目向量PP和正历史向量UP或负历史向量MUP之间的匹配贡献极大。
用户方效应向量EfUP和用户方负效应向量EfMUP可由用户设置,或者通过利用预定值来设置,或者可根据登记在初始登记存储单元45中的用户初始登记的内容来产生。
具体地说,当用户方效应向量EfUP是指示大项的哪些元素对用户选择节目重要时,在节目向量PP={标题Tm,类型Gm,时间段Hm,广播电台Sm,表演者Pm,编剧/作者/制片人Am,内容Km}中类型对用户重要的情况下,用户方效应向量EfUP被设置成例如效应向量EfUP={1,5,1,1,1,1,1}。另一方面,当表演者和类型对用户重要时,用户方效应向量EfUP被设置成例如效应向量EfUP={1,3,1,1,5,1,1}。
当用户方效应向量EfUP指示每个项目中用户的偏爱时,在大项类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,文艺/记录片,新闻/报道,其它}中,用户认为所需的节目类型是文艺/记录片的情况下,用户方效应向量EfUP被设置成例如类型Gm={0,0,0,0,0,0,5,0,0}。
另外,可根据正历史向量UP或负历史向量MUP,或者通过对用户在某一时期内观看的节目计数,可产生用户方效应向量EfUP和用户方负效应向量EfMUP。此外,也可依据类型产生用户方效应向量EfUP和用户方负效应向量EfMUP。下面参考图22-27,说明产生用户方效应向量EfUP和用户方负效应向量EfMUP的方法。
此外,根据需要,用户信息登记单元63登记由向量运算单元2的处理产生的关于推荐的优先组,用户模型向量等的信息。
上面说明的匹配处理单元43能够通过只利用正历史确定推荐的节目,而不进行利用负历史,从具有对正历史向量UP的高相似度的节目(用户观看态度积极的节目)中除去被认为不合用户需要的节目(用户观看态度消极的节目)的处理。
推荐信息输出单元49把从匹配处理单元43提供的推荐节目信息登记在推荐节目列表50中,并把推荐节目信息提供给电视显示设备11或者记录和再现设备12。推荐节目列表50可从节目推荐处理设备10中除去。推荐节目列表50登记从推荐信息输出单元49输出的推荐节目信息。把推荐节目信息保存在推荐节目列表50中使得即使使用例如不同的电视接收设备4,不同的电视显示设备11或者不同的记录和再现设备12,也能够利用迄今累积的历史信息,进行节目推荐,自动记录等。
根据需要,匹配处理单元43与驱动器51连接。根据需要,磁盘71、光盘72、磁光盘73和半导体存储器74被装入驱动器51中,以便相对于驱动器51发送和接收数据。
下面参考图14的流程图,说明由节目推荐处理设备10进行的产生正历史向量和负历史向量的第一处理。
在步骤S71,操作日志获取单元46把从初始登记存储单元45读出的初始登记数据提供给负历史存储单元48。负历史存储单元48通过参考提供给负历史存储单元48的初始登记内容,产生负历史向量MUP。
在步骤S72,操作日志获取单元46根据保存在初始登记存储单元45中的登记内容,确定初始登记内容是否被改变。当操作日志获取单元46在步骤S72中确定初始登记内容被改变时,处理返回步骤S71,重复步骤S71和S72的处理。
当操作日志获取单元46在步骤S72中确定初始登记内容未被改变时,操作日志获取单元46在步骤S73中确定是否从电视显示设备11或记录和再现设备12供给了操作日志。当操作日志获取单元46在步骤S73中确定没有供给任何操作日志时,处理返回步骤S72,重复步骤S72和S73的处理。
当操作日志获取单元46在步骤S73中确定供给了操作日志时,操作日志获取单元46在步骤S74中确定供给的操作日志是否是正历史。例如,当操作日志指示记录操作时,对应于该操作的节目的节目向量PP是正历史。当操作日志指示还未被再现的记录数据的擦除时,对应于该操作的节目的节目向量PP是负历史。
当操作日志获取单元46在步骤S74中确定供给的操作日志是正历史时,操作日志获取单元46在步骤S75中从数据获取单元41抽取与被确定为正历史的操作日志对应的节目向量PP,并把该节目向量PP提供给正历史存储单元47。正历史存储单元47另外把供给的节目向量PP保存为正历史。
在步骤S76,正历史存储单元47得到详细项目或大项的正历史节目向量PP的向量和,从而产生正历史向量UP。在步骤S76的处理结束之后,处理返回步骤S72,重复步骤S72和后续步骤的处理。
当操作日志获取单元46在步骤S74中确定供给的操作日志不是正历史时,供给的操作日志是负历史,从而操作日志获取单元46在步骤S77从数据获取单元41抽取与被确定为负历史的操作日志对应的节目向量PP,并把该节目向量PP提供给负历史存储单元48。负历史存储单元48另外把供给的节目向量PP保存为负历史。
在步骤S78,负历史存储单元48得到详细项目或大项的负历史节目向量PP的向量和,从而产生负历史向量MUP。在步骤S78的处理结束之后,处理返回步骤S72,重复步骤S72和后续步骤的处理。
当在正历史向量UP={标题Tup,类型Gup,表演者Pup,编剧/作者/制作人Aup,内容(关键字)Kup}的大项中描述详细项目时,在正历史向量UP中的每个详细项目之后输入指示向量总和的数值。例如如图15中所示,就大项“类型”来说,如同在类型Gup={(戏剧-25),(综艺-34),(体育-42),(电影-37),(音乐-73),(儿童节目/教育-120),(文艺/记录片-3),(新闻/报道-5),(其它-23)}中一样,对每个详细节目,输入指示正历史总和的数值。
在用单词表示的向量,例如大项“标题”中,如同在标题Tup={(标题1-12),(标题2-3),...}中一样,在单词之后输入指示单词的正历史向量总和的数值。在负历史向量MUP中,如同在正历史向量UP中一样,在项目之后输入指示总和的数值。
虽然在图15中描述的正历史向量UP(和负历史向量MUP)的大项是标题,类型,表演者,编剧/作者/制作人和内容(关键字),这种情况下,大项的数目小于参考图5说明的节目向量PP的大项的数目,但是不必说,正历史向量UP(和负历史向量MUP)的大项可以和节目向量PP的大项相同。
虽然在假定根据在输入操作日志之前的初始登记内容,产生负历史向量MUP的情况下,进行了参考图14的说明,不过,在初始登记时可接收用于选择用户认为所需要的节目的信息,以致也在输入操作日志之前产生正历史向量UP。另外,可以只利用操作日志产生正历史向量UP或负历史向量MUP,而不是根据初始登记产生正历史向量UP或负历史向量MUP。
通过这样相互独立地产生和保持正历史向量UP和负历史向量MUP,能够更准确地进行匹配用户的偏爱的处理。
顺便提及,此时,能够获得更详细的正历史和负历史。例如,虽然在参考图14说明的处理中,利用对应于所有项目中的正历史和负历史的节目向量PP的总和,产生正历史向量UP和负历史向量MUP,不过,也可依据类型累积对应于正历史和负历史的节目向量PP的总和,从而依据类似产生正历史向量UP和负历史向量MUP。
由于表演者经常随着广播节目的类型的不同而不同,因此存在用户的偏爱未被正确反映的情况。具体地说,就喜爱戏剧,并且喜爱几乎不表演戏剧的喜剧演员A所出现的综艺节目,并且其综艺节目和戏剧的观看比例为2∶8的用户来说,当在不区分类型的情况下累积表演者的正历史时,和几乎不表演戏剧的喜剧演员A相比,频繁出现在戏剧中,但是不是用户特别喜欢的演员的表演者B在正历史向量UP中具有更高分。这种情况下,频繁出现在戏剧中的表演者B出现于其中的记录片被推荐,而不是喜剧演员A所出现的综艺演出被推荐。为了防止这种问题,只要依据类型累积正历史和负历史,并根据正历史和负历史,依据类型产生正历史向量UP和负历史向量MUP就可以了。
另外,例如,就用户是实况广播员A的崇拜者,从而喜欢观看“实况广播员A解说的棒球队B进行的比赛的实况报道”的情况下,作为类型的信息“棒球的实况报道”往往会累积成历史,而信息“实况广播员A”难以累积成历史。从而,发生由另一实况广播员解说的棒球队B进行的比赛的实况报道被推荐,而出现实况广播员A的综艺节目不被推荐的情况。为了防止这种问题,只要依据表演者累积正历史和负历史,并根据正历史和负历史,依据表演者产生正历史向量UP和负历史向量MUP就可以了。
通过如上所述依据特定项目累积历史,能够高准确地反映用户的偏爱,而不会遮蔽用户的偏爱。
从而,通过验证供给的节目向量PP和这样在匹配处理单元43中产生的正历史向量UP和负历史向量MUP之间的匹配,能够产生正确反映用户的偏爱的推荐节目信息。
下面参考图16的流程图,说明其中依据类型累积处理历史的产生正历史向量和负历史向量的第二处理。
在步骤S81-S84中进行与在图14中的步骤S71-S74相同的处理。即,通过参考初始登记,产生负历史向量MUP,确定初始登记内容是否被改变,当初始登记内容未被改变时,确定供给的操作日志是否是正历史。
当在步骤S84中确定供给的操作日志是正历史时,操作日志获取单元46在步骤S85中从数据获取单元41抽取和确定为正历史的操作日志对应的节目向量PP,随后把节目向量PP提供给正历史存储单元47。正历史存储单元47抽取供给的节目向量PP的类型。
在步骤S86,正历史存储单元47另外把从数据获取单元41抽取的节目向量PP保存为所抽取类型的正历史。
在步骤S87,正历史存储单元47得到其中另外保存节目向量PP的类型中的详细项目或大项的正历史节目向量PP的向量和,从而产生对应类型的正历史向量UP。在步骤S87的处理结束之后,处理返回步骤S82,重复步骤S82和后续步骤的处理。
当在步骤S84中确定供给的操作日志不是正历史时,供给的操作日志是负历史,从而操作日志获取单元46在步骤S88中从数据获取单元41抽取和被确定为负历史的操作日志对应的节目向量PP,并把节目向量PP提供给负历史存储单元48。负历史存储单元48抽取供给的节目向量PP的类型。
在步骤S89,负历史存储单元48把从数据获取单元41获得的节目向量PP保存为所抽取类型的负历史。
在步骤S90,负历史存储单元48得到其中另外保存节目向量PP的类型中的详细项目或大项的负历史节目向量PP的向量和,从而产生对应类型的负历史向量MUP。在步骤S90的处理结束之后,处理返回步骤S82,重复步骤S82和后续步骤的处理。
通过上述处理,依据类型产生正历史向量UP和负历史向量MUP。于是能够更准确地反映用户的喜好,而不会遮蔽用户的偏爱,从而能够产生准确反映用户的偏爱的推荐节目信息。
下面参考图17的流程图,说明当节目向量PP,正历史向量UP和负历史向量MUP由使所有元素排成一行的向量表示时的第一匹配处理。
在步骤S101,节目向量抽取单元42从数据获取单元41抽取多个节目(例如在预定时间段中广播的节目)的节目向量PP,随后把节目向量PP提供给匹配处理单元43的归一化处理单元61。归一化处理单元61对供给的节目向量PP和从正历史存储单元47读出的正历史向量UP的构成元素中的包括单词的标题和内容进行归一化。随后,归一化处理单元61把归一化结果提供给向量运算单元62。
具体地说,当供给的节目向量PP具有例如标题Tm={Tokaido-1,Mitsuya-1,Kaidan-1}时,归一化处理单元61把标题Tm={Tokaido-1,Mitsuya-1,Kaidan-1}归一化为标题Tm={Toukaidou:0.33,Mitsuya:0.33,ghost-story:0.33},从而节目的项目内的单词的加权值的总和等于1。
在步骤S102,匹配处理单元43中的向量运算单元62通过利用前面给出的等式(1),以多个节目的节目向量PP和正历史向量UP之间的余弦距离的形式计算相似度SimUP。
在步骤S103,向量运算单元62比较在步骤S102中计算的相似度SimUP,相似度SimUP代表节目向量PP和正历史向量UP之间的余弦距离,并抽取具有最高相似度的预定数目的节目向量PP,例如10个节目向量。
在步骤S104,向量运算单元62通过利用前面给出的等式(2),以在步骤S103中抽取的节目向量PP和从负历史存储单元48读出的负历史向量MUP之间的余弦距离的形式计算相似度SimMUP。
在步骤S105,向量运算单元62计算对正历史向量UP的相似度SimUP(即,余弦距离)和对负历史向量的相似度SimMUP(即余弦距离)之间的差值,抽取作为计算结果的具有最高相似度的预定数目的节目(例如1个节目)的节目向量或EPG数据作为推荐信息。向量运算单元62把节目向量或EPG数据输出给推荐信息输出单元49,以便把节目向量或EPG数据登记在推荐节目列表50中,并把节目向量或EPG数据输出给电视显示设备11及记录和再现设备12。随后结束处理。
通过上述处理,当节目向量PP,正历史向量UP和负历史向量MUP都由使所有详细元素排成一行的向量表示时,能够根据节目向量PP和正历史向量UP之间的相似度,以及节目向量PP和负历史向量MUP之间的相似度,确定和用户的偏爱相符的推荐节目。
下面参考图18的流程图,说明通过依据大项计算余弦距离,并计算余弦距离的总和作为相似度SimUP和相似度SimMUP,而不是使由单词表示的项目归一化,确定推荐节目的第二匹配处理。
在步骤S111,节目向量抽取单元42从数据获取单元41抽取多个节目(例如在预定时间段中广播的节目)的节目向量PP,随后把节目向量PP提供给匹配处理单元43中的向量运算单元62。向量运算单元62计算节目向量PP和正历史向量UP的每个大项中,供给的节目向量PP和从正历史存储单元47读出的正历史向量UP之间的余弦距离。
在步骤S112,利用前面的等式(4),向量运算单元62求步骤S111中逐个项目计算的余弦距离的总和,从而计算相似度SimUP。
在步骤S113,向量运算单元62比较在步骤S112中计算的节目向量PP和正历史向量UP之间的相似度SimUP,并抽取具有最高相似度的预定数目的节目向量PP,例如10个节目向量PP。
在步骤S114,向量运算单元62计算节目向量PP和负历史向量MUP的每个大项中,由步骤S113的处理抽取的节目向量PP和从负历史存储单元48读出的负历史向量MUP之间的余弦距离。
在步骤S115,根据前面的等式(4),向量运算单元62求在步骤S114中逐个项目计算的余弦距离的总和,从而计算相似度SimMUP。
在步骤S116,向量运算单元62计算{作为节目向量PP和正历史向量UP之间的余弦距离的相似度SimUP}和{作为节目向量PP和负历史向量MUP之间的余弦距离的相似度SimMUP}之间的差值,抽取作为计算结果的具有最高相似度的预定数目的(例如3个)节目的节目向量PP或EPG数据作为推荐信息。向量运算单元62把节目向量PP或EPG数据输出给推荐信息输出单元49,以便把节目向量PP或EPG数据登记在推荐节目列表50中,并把节目向量PP或EPG数据输出给电视显示设备11及记录和再现设备12。随后结束处理。
通过上述匹配处理,大项的计算结果的总和被计算成相似度SimUP或相似度SimMUP,由单词代表的项目不被归一化。根据节目向量PP和正历史向量UP之间的相似度,以及节目向量PP和负历史向量MUP之间的相似度,能够确定和用户的偏爱相符的推荐节目,而不受属于不同大项的详细元素之间的历史累积方面的差异的影响。
虽然在参考图17和图18说明的第一匹配处理和第二匹配处理中,通过利用负历史,能够从用户的具有对正历史向量UP的最高相似度的节目中排除被认为不合用户需要的节目,但是,也可只利用正历史来确定推荐节目。
就选择节目来说,一些用户非常喜欢新闻和报道节目,认为表演者重要而不是类型重要,或者认为内容重要而不关心表演者。从而对一些用户来说,用于选择节目的要被加权的项目和不被加权的项目,即重要项目和不重要项目可被固定。
从而,使用前面说明的节目方效应向量EfPP和用户方效应向量EfUP或用户方负效应向量EfMP,可进行匹配处理。另外,用户可确定是否使用节目方效应向量EfPP和用户方效应向量EfUP或用户方负向量EfMUP。
下面参考图19的流程图,说明在节目向量PP,正历史向量UP和负历史向量MUP都由使所有详细元素排成一行的向量表示的情况下,根据用户的设置,利用节目方效应向量EfPP或用户方效应向量EfUP进行的第三匹配处理。
在步骤S121,向量运算单元62获得为节目方效应向量EfPP和用户方效应向量EfUP或用户方负向量EfMUP的使用而设置的内容。内容由用户使用操作输入单元44输入,并被登记在初始登记存储单元45中。为效应向量的使用而设置的内容是指示在匹配处理中是否通过利用节目方效应向量EfPP和用户方效应向量EfUP或用户方负向量EfMUP进行加权的信息。
在步骤S122,根据需要,向量运算单元62从用户信息登记单元63读出用户方效应向量EfUP,并利用下面的等式(5)计算节目向量PP和正历史向量UP之间的余弦距离,把该余弦距离设置成相似度SimUP。
SimUP = epd 1 · eud 1 · p 1 · u 1 + epd 2 · eud 2 · p 2 · u 2 + K | PP | | UP | - - - ( 5 )
在等式(5)中,节目向量PP=(p1,p2,...),正历史向量UP=(u1,u2,...),节目方效应向量EfPP=(epd1,epd2,...),用户方效应向量EfUP=(eud1,eud2,...)。虽然在等式(5)中使用了节目方效应向量EfPP和用户方效应向量EfUP,但是,当进行设置以致节目方效应向量EfPP和用户方效应向量EfUP之一不被使用时,数值1代替不被用于计算的向量。
用户方效应向量EfUP能够由用户设置,或者根据用户的初始设置设定,或者可在用户信息登记单元63中产生。后面将参考图22-25详细说明用户方效应向量EfUP的产生。
在步骤S123,向量运算单元62相互在步骤S122中计算的节目向量PP和正历史向量UP之间的相似度SimUP,并抽取预定数目的具有最高相似度的节目向量PP,例如10个节目向量PP。
在步骤S124,根据需要,向量运算单元62从用户信息登记单元63读出用户方负效应向量EfMUP,并根据下面的等式(6)计算在步骤S123抽取的节目向量PP和负历史向量MUP之间的余弦距离。
SimMUP = epd 1 · emd 1 · p 1 · m 1 + epd 2 · emd 2 · p 2 · m 2 + . . . | PP | | MP | - - - ( 6 )
在等式(6)中,节目向量PP=(p1,p2,...),负历史向量MUP=(m1,m2,...),节目方效应向量EfPP=(epd1,epd2,...),用户方负效应向量EfMUP=(emd1,emd2,...)。虽然在等式(6)中使用了节目方效应向量EfPP和用户方负效应向量EfMUP,不过当进行设置以致节目方效应向量EfPP和用户方负效应向量EfMUP之一不被使用时,数值1代替不被用于计算的向量。
用户方负效应向量EfMUP能够由用户设置,或者根据用户的初始设置设定,或者在用户信息登记单元63中产生。后面将参考图26或27详细说明用户方负效应向量EfMUP的产生。
在步骤S125,向量运算单元62计算节目向量PP和正历史向量UP之间的相似度SimUP与节目向量PP和负历史向量MUP之间的相似度SimMUP之间的差值,抽取作为计算结果的具有最高相似度的预定数目的(例如3个)节目的节目向量PP或EPG数据作为推荐信息。向量运算单元62把节目向量PP或EPG数据输出给推荐信息输出单元49,以便把节目向量PP或EPG数据登记在推荐节目列表50中,并把节目向量PP或EPG数据输出给电视显示设备11及记录和再现设备12。随后结束处理。
通过上述匹配处理,由于根据设置,利用节目方效应向量EfPP和用户方效应向量EfUP或用户方负效应向量EfMUP抽取推荐信息,因此能够推荐正确反映用户的偏爱的信息。
虽然在参考图19说明的处理中,节目向量PP,正历史向量UP和负历史向量MUP都由使所有详细元素排成一行的向量表示,不过,也可依据大项计算节目向量PP,正历史向量UP和负历史向量MUP。
下面参考图20的流程图,说明允许依据大项反映节目方效应向量EfPP和用户方效应向量EfUP或用户方负效应向量EfMUP的第四匹配处理。
在步骤S131,进行和图19中的步骤S121相同的处理,从而获得为效应向量的使用而设置的内容。
在步骤S132,向量运算单元62计算节目向量PP和正历史向量UP的每个大项中,供给的节目向量PP和从正历史存储单元47读出的正历史向量UP之间的余弦距离。在该步骤中,效应向量未被用于计算。
在步骤S133,利用下面的等式(7),向量运算单元62根据需要把逐个项目计算的余弦距离乘以效应向量,并计算所述乘法获得的值的总和,从而计算相似度SimUP。
SimUP=epdt·eudt·cosθut+epdg·eudg·cosθug
     +epdp·eudp·cosθup+epda·euda·cosθua
     +epdk·eudk·cosθuk                         (7)
在等式(7)中,节目向量PP=(pt,pg,pp,pa,pk)和正历史向量UP=(ut,ug,up,ua,uk)之间依据大项的余弦距离是(cosθut,cosθug,cosθup,cosθua,cosθuk);节目方效应向量EfPP=(epdt,epdg,epdp,epda,epdk);用户方效应向量EfUP=(eudt,eudg,eudp,euda,eudk)。虽然在等式(7)中使用了节目方效应向量EfPP和用户方效应向量EfUP。但是,当进行设置以致节目方效应向量EfPP和用户方效应向量EfUP之一不被使用时,数值1代替未被用于计算的向量。
在步骤S134,向量运算单元62比较在步骤S133中计算的节目向量PP和正历史向量UP之间的相似度SimUP,并抽取预定数目的具有最高相似度的节目向量PP,例如10个节目向量PP。
在步骤S135,向量运算单元62计算节目向量PP和负历史向量MUP的每个大项中,由步骤S134的处理抽取的节目向量PP和从负历史存储单元48读出的负历史向量MUP之间的余弦距离。在该步骤中,效应向量未被用于计算。
在步骤S136,根据下面的等式(8),向量运算单元62根据需要把逐个项目计算的余弦距离乘以效应向量,并计算所述乘法获得的值的总和,从而计算相似度SimMUP。
SimMUP=epdt·emdt·cosθmt+epdg·emdg·cosθmg
     +epdp·emdp·cosθmp+epda·emda·cosθma
     +epdk·emdk·cosθmk                      (8)
在等式(8)中,节目向量PP=(pt,pg,pp,pa,pk)和负历史向量MUP=(mt,mg,mp,ma,mk)之间依据大项的余弦距离是(cosθmt,cosθmg,cosθmp,cosθma,cosθmk);节目方效应向量EfPP=(epdt,epdg,epdp,epda,epdk);用户方负效应向量EfMUP=(emdt,emdg,emdp,emda,emdk)。虽然在等式(8)中使用了节目方效应向量EfPP和用户方负效应向量EfMUP,但是,当进行设置以致节目方效应向量EfPP和用户方负效应向量EfMUP之一不被使用时,数值“1”代替未被用于计算的向量。
在步骤S137,向量运算单元62计算{作为节目向量PP和正历史向量UP之间的余弦距离的相似度SimUP}和{作为节目向量PP和负历史向量MUP之间的余弦距离的相似度SimMUP}之间的差值,并抽取作为计算结果的具有最大相似度的预定数目的(例如3个)节目的节目向量PP或EPG数据作为推荐信息。向量运算单元62把节目向量PP或EPG数据输出给推荐信息输出单元49,以便把节目向量PP或EPG数据登记在推荐信息列表50中,并把节目向量PP或EPG数据输出给电视显示设备11及记录和再现设备12。随后结束处理。
在上述处理中,对于依据大项利用效应向量进行加权,从而,能够产生和用户的偏爱的细节相符的推荐信息。
下面参考图21的流程图,说明利用每种类型的正历史向量UP和负历史向量MUP,以及每种类型的用户方效应向量EfUP和用户方负效应向量EfMUP进行的第五匹配处理。每种类型的正历史向量UP和负历史向量MUP由产生正历史向量的第二处理产生,参考图16说明了负历史向量。
在步骤S141,进行和图19中的步骤S121相同的处理,从而获得为效应向量的使用而设置的内容。
在步骤S142,向量运算单元62抽取供给的节目向量PP的类型。假定供给的节目向量PP的类型例如是“戏剧”,进行这种情况下的说明。
在步骤S143,向量运算单元62计算节目向量这PP和正历史向量UP的每个大项中,供给的节目向量PP和对应于类型“戏剧”的正历史向量UP之间的余弦距离。正历史向量UP从正历史存储单元47读出。在该步骤中,效应向量未被用于计算。
在步骤S144,根据下面的等式(9),向量运算单元62根据需要把逐个项目计算的余弦距离乘以对应于类型“戏剧”的用户方效应向量,并计算所述乘法得到的值的总和,从而计算相似度SimUP。
SimUP=epdt·eudtd·cosθutd+epdg·eudgd·cosθugd
     +epdp·eudpd·cosθupd+epda·eudad·cosθuad
     +epdk·eudkd·cosθukd                        (9)
在等式(9)中,节目向量PP=(pt,pg,pp,pa,pk)和对应于类型“戏剧”的正历史向量UP=(ut,ug,up,ua,uk)之间依据大项的余弦距离是(cosθutd,cosθugd,cosθupd,cosθuad,cosθukd);节目方效应向量EfPP=(epdt,epdg,epdp,epda,epdk);对应于类型“戏剧”的用户方效应向量EfUP=(eudtd,eudgd,eudpd,eudad,eudkd)。虽然在等式(9)中使用了节目方效应向量EfPP和用户方效应向量EfUP,但是,当进行设置以致节目方效应向量EfPP和用户方效应向量EfUP之一不被使用时,数值1代替未被用于计算的向量。
在步骤S145,向量运算单元62比较在步骤S143中计算的节目向量PP和正历史向量UP之间的相似度SimUP,并抽取具有最高相似度的预定数目的节目向量PP,例如10个节目向量PP。
在步骤S146,向量运算单元62计算节目向量PP和负历史向量MUP的每个大项中,由步骤S145的处理抽取的节目向量PP和对应于类型“戏剧”的负历史向量MUP之间的余弦距离。负历史向量MUP读自负历史存储单元48。在该步骤中,效应向量未被用于计算。
在步骤S147,通过使用下面的等式(10),向量运算单元62根据需要把逐个项目计算的余弦距离乘以对应于类型“戏剧”的效应向量,计算所述乘法获得的值的总和,从而计算相似度SimMUP。
SimMUP=epdt·emdtd·cosθmtd+epdg·emdgd·cosθmgd
     +epdp·emdpd·cosθmpd+epda·emdad·cosθmad
     +epdk·emdkd·cosθmkd                        (10)
在等式(10)中,节目向量PP=(pt,pg,pp,pa,pk)和负历史向量MUP=(mt,mg,mp,ma,mk)之间依据大项的余弦距离是(cosθmtd,cosθmgd,cosθmpd,cosθmad,cosθmkd);节目方效应向量EfPP=(epdt,epdg,epdp,epda,epdk);对应于类型“戏剧”的用户方负效应向量EfMUP=(emdtd,emdgd,emdpd,emdad,emdkd)表示。虽然在等式(10)中使用了节目方效应向量EfPP和用户方负效应向量EfMUP,但是当进行设置以致节目方效应向量EfPP和用户方负效应向量EfMUP之一不被使用时,数值1代替未被用于计算的向量。
在步骤S148,向量运算单元62计算{作为节目向量PP和正历史向量UP之间的余弦距离的相似度SimUP}和{作为节目向量PP和负历史向量MUP之间的余弦距离的相似度SimMUP}之间的差值,抽取作为计算结果的具有最大相似度的预定数目的(例如3个)节目的节目向量PP或EPG数据作为推荐信息。向量运算单元62把节目向量PP或EPG数据输出给推荐信息输出单元49,以便把节目向量PP或EPG数据登记在推荐节目列表50中,并把节目向量PP或EPG数据输出给电视显示设备11及记录和再现设备12。随后结束处理。
通过上述处理,在每个大项中,获得类型的正历史向量UP和节目向量PP之间的余弦距离,以及类型的负历史向量MUP和节目向量PP之间的余弦距离,使用对应于类型的效应向量进行加权,随后计算相似度。从而,能够产生和用户的偏爱的细节相符的推荐信息。
如上所述,根据用户最初登记的内容,产生用户方效应向量EfUP和用户方负效应向量EfMUP。内容被登记在初始登记存储单元45中。另一方面,根据正历史向量UP或负历史向量MUP,或者通过对用户在预定时间内观看的节目计数,可产生用户特有的用户方效应向量EfUP和用户方负效应向量EfMUP。
下面参考图22的流程图,说明产生用户方效应向量的第一处理。通过对用户在某一时期内观看的节目计数,产生用户方效应向量EfUP。
在步骤S151,匹配处理单元43中的用户信息登记单元63选择未处理的大项之一。
在步骤S152,用户信息登记单元63通过参考保存在正历史存储单元47中的正历史,检测用户在1周,1月或3月的预定时间内观看的节目,使节目向量抽取单元42从数据获取单元41抽取与用户在预定时间内观看的节目对应的节目向量PP,并关于包括在于步骤S151选择的大项中的每个详细项目对节目计数。
具体地说,当在步骤S151中选择的大项是大项类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,文艺/记录片,新闻/报道,其它}时,用户信息登记单元63把用户在一定时间内观看的节目的节目向量PP中的元素归入对应的项目中,随后对所述元素计数。例如,当用户在一定时间内观看了50个节目时,对节目计数的结果是类型Gm={10,18,5,2,8,1,0,1,5}。
在步骤S153,用户信息登记单元63使节目向量抽取单元42从数据获取单元41抽取与同一时期中的所有节目对应的节目向量PP,随后关于包括在于步骤S151选择的大项中的每个详细项目对节目计数。
具体地说,当在步骤S151中选择的大项是大项类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,文艺/记录片,新闻/报道,其它}时,用户信息登记单元63把同一时期中的所有节目的节目向量PP中的元素归入对应项目中,随后对所述元素计数。例如当同一时期中的所有节目为1000个节目时,对节目计数的结果是例如类型Gm={104,239,68,25,78,91,60,254,81}。
在步骤S154,用户信息登记单元63根据步骤S152和S153中的计数结果,计算用户实际观看的节目的计数与所有节目的计数的比值。
受收视率竞争的影响,节目安排被认为反映一般公众的偏爱。即,计算用户实际观看的节目的计数与所有节目的计数的比值等同于用作为标准模型的所有节目的计数,使用户实际观看的节目的计数归一化。在步骤S154计算的归一化向量被称为归一化向量D。
例如,在大项类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,文艺/记录片,新闻/报道,其它}中,当1周内的所有节目的计数为(8,12,3,7,6,4,2,8,10),而用户实际观看的节目的数目为(4,0,1,2,3,4,5,5,2)时,归一化向量D如下所示。
D=(4/8,0/12,1/3,2/7,3/6,4/4,1/2,2/8,2/10)=(0.5,0,0.33,0.28,0.5,1.0,0.5,0.13,0.2)。
即,归一化向量D中为1.0的元素指示在设定的时间内,对应项目中的所有节目都被观看了,归一化向量D中为0的元素指示在设定时间内,对应的节目未被观看。
在步骤S155,用户信息登记单元63根据步骤S154中的计算结果,产生对应大项的效应向量。
为了产生效应向量,利用大项类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,文艺/记录片,新闻/报道,其它}中的一个项目设置标准值。例如,假定普通用户大约观看一周内类型:“戏剧”中的节目的20%,那么标准值被设置成0.2。由于大项的效应向量被计算成相对值,因此设定值可以是0-1中的任意值。用户方效应向量是在步骤S154中计算的归一化向量D和设置值之间的相对值。
从而,表示用户感兴趣的类型的大项类型Gm的效应向量E被计算成
E=(0.3,-0.2,0.13,0.08,0.3,0.8,0.3,-0.07,0.0)
于是可确定对应用户喜欢类型“儿童节目/教育”,不喜欢类型“综艺”。
在步骤S156,用户信息登记单元63确定是否已产生所有大项的效应向量。当用户信息登记单元63在步骤S156中确定还没有产生所有大项的效应向量时,处理返回步骤S151,重复步骤S151和后续步骤的处理。
当用户信息登记单元63在步骤S156中确定产生了所有大项的效应向量时,用户信息登记单元63在步骤S157中保存所有大项的效应向量。随后结束处理。
这样的处理能够得到一般公众的偏爱和用户独有的偏爱之间的差别。另外,以3个月或半年的时间间隔重新计算用户方效应向量EfUP,能够实时地推荐反映用户的偏爱的节目。
虽然在图22的处理中,根据用户1周,1月或3月的一定时间内观看的节目,得到用户方效应向量EfUP,不过可以计算对应于多个时段,例如较短时段,中等时段和较长时段的用户方效应向量EfUP,从而利用多个效应向量确定推荐信息。
虽然在上面的说明中,用户独有的偏爱被用作用户方效应向量EfUP,不过,用户独有的偏爱也可被用作匹配处理中的正历史向量UP。
代替所有广播的节目,可以对观众主要观看节目的预定时段(例如从18点到22点的所谓黄金时段)内广播的所有节目计数。这能够显著减少获得一般公众的偏爱的计算处理。
下面参考图23的流程图,说明计算用户方效应向量的第二处理。通过计算指示正历史向量UP和一般公众的偏爱之间的相似度的余弦距离,得到在匹配处理中使用用户独有的偏爱和一般公众的偏爱之间的差异的用户方效应向量EfUP。
在步骤S161,匹配处理单元43中的用户信息登记单元63获得保存在正历史存储单元47中的正历史向量UP。
在步骤S162,用户信息登记单元63获得表示一般公众的偏爱的标准偏爱向量APP。
标准偏爱向量APP可以从分发服务器5供给。另一方面,由于受收视率竞争的影响,节目安排被认为反映一般公众的偏爱。如同参考图22说明的产生用户方效应向量的第一处理中一样,在一定时段内广播的所有节目的内容可被计数并根据需要被归一化,以便产生标准偏爱向量APP。
通过利用公共收视率调查结果,或者采用另一方法,分发服务器5可产生指示一般公众的偏爱的标准偏爱向量APP。
在步骤S163,用户信息登记单元63计算每个大项中,标准偏爱向量APP和正历史向量UP之间的余弦距离。余弦距离越大,那么标准偏爱向量APP和正历史向量UP之间的相似度越高。
在步骤S164,用户信息登记单元63根据在步骤S163中计算的余弦距离,求每个大项中的余弦距离的倒数,从而产生效应向量EfUP。随后结束处理。余弦距离的倒数越大,那么标准偏爱向量APP和正历史向量UP之间的相似度越低。
这样的处理能够得到反映一般公众的偏爱和对应用户独有的偏爱之间的差异的用户方效应向量EfUP。当利用用户方效应向量EfUP进行节目推荐处理时,能够在强调一般公众的偏爱和用户独有的偏爱之间的差异的情况下确定推荐节目。
顺便提及,虽然在上面的说明中,节目向量PP和正历史向量UP都由大项的向量表示,不必说当节目向量PP和正历史向量UP都由使所有详细元素排成一行的向量表示时,也可进行类似处理。
标准偏爱向量APP和正历史向量UP之间的相似度不仅用于计算效应向量,而且还被直接用于节目推荐,作为表示用户的独特性的指示符。例如,当标准偏爱向量APP和正历史向量UP之间的相似度高时,可优先推荐符合大众潮流等的新节目。
虽然如上参考图22和23所述,根据用户操作的历史,通过学习恰当地获得用户方效应向量EfUP,不过,用户方效应向量也可事先被登记为初始登记,或者根据经验得到的预定值可被用于用户方效应向量。
顺便提及,不仅可通过注意大项产生用户方效应向量EfUP,而且可通过注意构成大项的元素,产生用户方效应向量EfUP。例如在构成大项的元素“表演者Pm”中,使主角和配角可相互区分开。和戏剧或电影中主角相比,优先考虑配角的角色分配的用户可在向配角分配比主角更大的加权值的情况下设置用户方效应向量EfUP。另外,在构成大项的元素“编剧/作者/制作人Am”中,使导演、制片人、作者和摄影师可被相互区分。和导演及制片人相比,认为摄影师更重要的用户能够设置用户方效应向量EfUP,以便向摄影师分配更大的加权值。
另外,可依据类型产生用户方效应向量EfUP,以便如同在参考图21说明的第五匹配处理中那样,在对应类型的正历史向量UP与节目向量PP之间的匹配处理中产生影响。
下面参考图24的流程图,说明产生用户方效应向量的第三处理。通过依据类型,对用户在一定时段中观看的节目计数,产生用户方效应向量EfUP。
在步骤S171,匹配处理单元43中的用户信息登记单元63选择将依据其对用户在一定时段内观看的节目计数的类型。
在步骤S172,用户信息登记单元63选择未处理大项之一。
在步骤S173,通过参考保存在正历史存储单元47中的正历史,用户信息登记单元63检测用户在1周,1月或3月的一定时段内观看的节目中的所选类型中的节目,使节目向量抽取单元42从数据获取单元41抽取与用户在一定时段内观看的节目中所选类型中的节目对应的节目向量PP,并依据包括在于步骤S172中选择的大项中的详细项目,对节目计数。
在步骤S174,用户信息登记单元63使节目向量抽取单元42从数据获取单元41抽取与相同时段中的所有节目内的所选类型对应的节目向量PP,随后依据包括在于步骤S172中选择的大项中的详细项目,对节目计数。
在步骤S175,用户信息登记单元63根据步骤S173和S174中的计数结果,计算用户实际观看的节目的计数与所选类型中的所有节目的计数的比值。
如上所述,受收视率竞争的影响,节目安排被认为反映一般公众的偏爱。即,计算用户实际观看的节目的计数与所选类型中的所有节目的计数的比值等同于通过用作为标准模型的对应类型中的所有节目的计数,使用户实际观看的节目的计数归一化。在步骤S175计算的归一化向量被称为归一化向量D′。
例如,在对应于大项类型Gm={戏剧,综艺,体育,电影,音乐,儿童节目/教育,文艺/记录片,新闻/报道,其它}中的类型“戏剧”的节目向量PP的大项时间段Hm={早晨,中午,傍晚,黄金时段,深夜}中,当1周内的所有节目的计数为(10,35,7,53,17),而用户观看的节目的数目为(5,0,0,8,4)时,归一化向量D′如下所示。
D′=(5/10,0/35,0/7,8/53,4/17)=(0.5,0,0,0.15,0.24)。
即,归一化向量D′中等于1.0的元素表示在设定的时段内,对应项目被观看,归一化向量D′中等于0的的分量表示在设定的时段内,对应的节目未被观看。
在步骤S176,用户信息登记单元63根据步骤S175中的计算结果,产生所选类型中的对应大项的效应向量。
为了产生效应向量,利用大项时间段Hm={早晨,中午,傍晚,黄金时段,深夜}中的一个项目设置标准值。例如假定普通用户大约观看一周内时间段“黄金时段”中的戏剧节目的20%,那么标准值可被设置成0.2。由于大项的效应向量被计算成相对值,因此设定值可以是0-1之间的任意值。用户方效应向量是在步骤S175中计算的归一化向量D′和设置值之间的相对值。
从而,大项类型Gm的表示用户感兴趣的类型的效应向量E′被计算成
E′=(0.3,-0.2,-0.2,-0.05,0.04)
于是可确定对应用户喜欢早间时段的戏剧,而不喜欢中午和傍晚时段的戏剧。
在步骤S177,用户信息登记单元63确定在选择的类型中,是否已产生所有大项的效应向量。当用户信息登记单元63在步骤S177中确定还没有产生所有大项的效应向量时,处理返回步骤S172,重复步骤S172和后续步骤的处理。
当用户信息登记单元63在步骤S177中确定产生了所有大项的效应向量时,用户信息登记单元63在步骤S178确定在所有类型中已完成处理。当用户信息登记单元63在步骤S178中确定在所有类型中还没有完成处理时,处理返回步骤S171,重复步骤S171和后续步骤的处理。
当用户信息登记单元63在步骤S178中确定在所有类型中已完成处理时,用户信息登记单元63在步骤S179保存所有大项的效应向量。随后结束处理。
这样的处理能够依据类型,得到一般公众的偏爱和用户独有的偏爱之间的差别。另外,如同参考图22的说明中一样,以3个月或半年的时间间隔重新计算用户方效应向量Erupt能够实时地推荐反映用户的偏爱的节目。
另外虽然在图24的处理中,根据用户在1周,1月或3月的一定时段内观看的节目,获得用户方效应向量EfUP,但是,如参考图22的说明中一样,可以计算对应于多个时段,例如较短时段,中等时段和较长时段的用户方效应向量EfUP,以致利用多个效应向量确定推荐信息。
另外在图24的处理中,代替所有广播节目,可以对观众主要观看节目的预定时段(例如从18点到22点的所谓黄金时段)内中的所有广播节目计数。
下面参考图25的流程图,说明计算用户方效应向量的第四处理,在该处理中,通过依据类型计算指示正历史向量UP和一般公众的偏爱之间的相似度的余弦距离,获得在匹配处理中使用用户独有的偏爱和一般公众的偏爱之间的差异的用户方效应向量EfUP。
在步骤S191,匹配处理单元43中的用户信息登记单元63选择一个类型,从而指定将进行处理的类型。
在步骤S192,用户信息登记单元63从保存在正历史存储单元47中的正历史向量UP中,获得所选类型的正历史向量UP。
在步骤S193,用户信息登记单元63从表示一般公众的偏爱的标准偏爱向量APP中获得所选类型的标准偏爱向量APP。
如前所述,标准偏爱向量APP可以从分发服务器5供给。另一方面,由于受收视率竞争的影响,节目安排被认为反映一般公众的偏爱,如同参考图24说明的产生用户方效应向量的第三处理中一样,在一定时段内广播的所有节目的内容可依据类型被计数,并根据需要被归一化,从而依据类型产生标准偏爱向量APP。
通过利用公共收视率调查结果或者另一方法,分发服务器5可依据类型产生指示一般公众的偏爱的标准偏爱向量APP。
通过使用所选类型的正历史向量UP和所选类型的标准偏爱向量APP,用户信息登记单元63在步骤S194计算每个大项中,标准偏爱向量APP和正历史向量UP之间的余弦距离。余弦距离越大,那么标准偏爱向量APP和正历史向量UP之间的相似度越高。
在步骤S195,用户信息登记单元63根据在步骤S194计算的余弦距离,求每个大项中的余弦距离的倒数,从而产生所选类型中的效应向量EfUP。余弦距离的倒数越大,那么标准偏爱向量APP和正历史向量UP之间的相似度越低。
在步骤S196,用户信息登记单元63确定所有类型中的处理是否已完成。当用户信息登记单元63在步骤S196中确定所有类型中的处理还没有完成时,处理返回步骤S191,重复步骤S191和后续步骤的处理。当用户信息登记单元63在步骤S196中确定所有类型中的处理已完成时,结束处理。
这样的处理能够得到每种类型的反映一般公众的偏爱和用户独有的偏爱之间的差别的用户方效应向量EfUP。
另外,如同参考图23说明的处理中一样,获得标准偏爱向量APP和负历史向量MUP之间的相似度,相似度的倒数可被计算成用户方负效应向量EfMUP。
下面参考图26的流程图,说明计算用户方负效应向量的第一处理,在该处理中,通过比较负历史向量MUP与一般公众的偏爱,得到用户方负效应向量EfMUP。
在步骤S201,匹配处理单元43中的用户信息登记单元63获得保存在负历史存储单元48中的负历史向量MUP。
在步骤S202,用户信息登记单元63获得表示一般公众的偏爱的标准偏爱向量APP。
标准偏爱向量APP可以从分发服务器5供给。另一方面,由于受收视率竞争的影响,节目安排被认为反映一般公众的偏爱,如同在参考图22说明的产生用户方效应向量的第一处理中一样,在一定时段内广播的所有节目的内容可被计数,并且根据需要被归一化,从而得到标准偏爱向量APP。
在步骤S203,用户信息登记单元63计算每个大项中,标准偏爱向量APP和负历史向量MUP之间的余弦距离。余弦距离越大,那么标准偏爱向量APP和负历史向量MUP和之间的相似度越高。
在步骤S204,用户信息登记单元63根据在步骤S203中计算的余弦距离,求每个大项中的余弦距离的倒数,从而产生负效应向量EfMUP。随后结束处理。
这样的处理可以产生负效应向量EfMUP,从而,能够有效地从推荐节目中排除用户不喜欢的节目。
下面参考图27的流程图,说明依据类似进行的计算用户方负效应向量的第二处理。
在步骤S211,匹配处理单元43中的用户信息登记单元3选择一个类型,从而规定其中将进行所述处理的类型。
在步骤S212,用户信息登记单元63从保存在负历史存储单元48中的负历史向量MUP中获得所选类型的负历史向量MUP。
在步骤S213,用户信息登记单元63获得表示一般公众的偏爱的标准偏爱向量APP之中,所选类型的标准偏爱向量APP。
根据所选类型的负历史向量MUP和所选类型的标准偏爱向量APP,用户信息登记单元63在步骤S214计算每个大项中,标准偏爱向量APP和负历史向量MUP之间的余弦距离。余弦距离越长,那么标准偏爱向量APP和负历史向量MUP之间的相似度越高。
在步骤S215,用户信息登记单元63根据在步骤S214中计算的余弦距离,求每个大项中的余弦距离的倒数,从而产生负效应向量EfMUP。余弦距离的倒数越大,那么标准偏爱向量APP和负历史向量MUP之间的相似度越低。
在步骤S216,用户信息登记单元63确定在所有类型中处理是否已完成。当用户信息登记单元63在步骤S216中确定所有类型中的处理没有完成时,处理返回步骤S211,重复步骤S211和后续步骤的处理。当用户信息登记单元63在步骤S216中确定所有类型中的处理已完成时,结束处理。
这样的处理能够依据类型产生负效应向量EfMUP,从而,能够有效地从推荐节目中排除用户不喜欢的节目。
顺便提及,用户方效应向量EfUP和用户方负效应向量EfMUP可以使用通过把参考图23和25-27说明的每个大项中的余弦距离的倒数乘以n得到的值,或者通过把余弦距离的倒数四舍五入到预定数位而获得的值,或者可以使用通过从余弦距离的倒数中减去1获得的值,或者通过把该值乘以n获得的值。
顺便提及,在上面的说明中,节目向量PP和负历史向量MUP都由大项的向量表示,但是不必说当节目向量PP和负历史向量MUP都由使所有详细元素排成一行的向量代表时,可进行类似的处理。
由参考图7和8说明的处理产生的指示组的信息,例如组ID或群集代码可被加入到由节目向量抽取单元42抽取的节目向量PP中。
例如,如果用户喜欢观看的节目是连续剧,当该连续剧的所有各集被推荐时,能够减少推荐的操作处理量。通过把相同组中的节目优先推荐为用户非常喜欢的节目,也可减少推荐的操作处理量。
下面参考图28的流程图,说明包括组推荐的匹配处理。
在步骤S221,根据指示组的信息,例如组ID或群集代码是否被加入到由节目向量抽取单元42抽取的节目向量中,匹配处理单元43中的向量运算单元62确定对应节目是否被分组。
当向量运算单元62在步骤S221中确定对应节目被分组时,向量运算单元62在步骤S222中确定组ID或群集代码指示的组是否在用户信息登记单元63中被登记为优先推荐组。
当向量运算单元62在步骤S222中确定组ID或群集代码表示的组已被登记为优先推荐组时,向量运算单元62在步骤S223把对应节目的信息作为推荐信息提供给推荐信息输出单元49。推荐信息输出单元49把推荐节目登记到推荐节目列表50中,并把推荐节目的信息输出给电视显示设备11或记录和再现设备12。处理进入后面说明的步骤S227。
当向量运算单元62在步骤S221中确定对应节目未被分组,或者当向量运算单元62在步骤S222中确定由组ID或群集代码指示的组未被登记为优先推荐组,那么在步骤S224中进行参考图17-21说明的第一到第五匹配处理之一。
在步骤S225,根据指示组的信息,例如组ID或群集代码是否被加入到在步骤S224中进行的第一到第三匹配处理之一中推荐的节目的节目向量中,向量运算单元62确定推荐的信息是否被分组。当向量运算单元62在步骤S225中确定推荐的节目未被分组时,结束处理。
当向量运算单元62在步骤S225中确定推荐节目被分组时,向量运算单元62在步骤S226中把加入节目向量中的组ID或群集代码作为优先推荐组登记在用户信息登记单元63中。
在步骤S223或S226的处理结束之后,向量运算单元62在步骤S227参考保存在负历史存储单元48中的负历史操作日志,从而确定是否已收到步骤S223的处理推荐的节目,或者在步骤S226的处理中被登记为优先推荐组的节目的变成负历史的操作输入,因为该节目在步骤S224的处理推荐的节目中被分组,所述操作输入例如是发出观看或记录另一节目的命令,而不接受推荐节目的操作输入,或者发出在再现之前,擦除自动记录的节目的命令的操作输入。当向量运算单元62在步骤S227中确定没有收到变成负历史的操作输入时,结束处理。
当向量运算单元62在步骤S227中确定收到变成负历史的操作输入时,向量运算单元62在步骤S228中从登记在用户信息登记单元63中的优先推荐组中除去对应组。然后处理结束。
顺便提及,作为参考图9说明的第一标题分组处理的结果1,可使多个组ID与一个节目向量PP相关联。具体地说,这种情况下,在步骤S228中,响应负历史操作输入,所有组ID可从登记在用户信息登记单元63中的优先推荐组中被除去,或者,负历史操作输入的数目被累积,当实现预定数目的负历史输入操作时,对应的组ID可从登记在用户信息登记单元63中的优先推荐组中被除去。这同样适用于一个组ID与一个节目向量PP相关联的情况。
这样的处理能够推荐用户喜欢观看的连续剧的所有各集节目,能够推荐和用户非常喜欢的节目同组的节目。于是能够减少推荐的操作处理。
当这样进行包括组推荐的匹配处理时,也可依据对应组产生根据从电视显示设备11或记录和再现设备12获得的用户操作历史产生的正历史向量UP和负历史向量MUP。
另外,根据从电视显示设备11或记录和再现设备12获得的用户操作历史的正历史,可对相同连续剧的观看或者计划记录的次数计数,当相同连续剧的观看或者计划记录的次数等于或超过预定数时,可以进行优先推荐,而不专门进行匹配处理。
此外,代替利用用户历史的节目推荐处理,可根据基于用户事先规定的主题设置的用户模型,进行节目推荐处理。
通过经由利用主题的过滤,从预定的一组节目中抽取与用户事先规定的主题对应的节目,获得用户模型。初始登记存储单元45保存用户输入的主题。多个主题可被登记,根据需要,由用户的操作输入更新主题。向量运算单元62抽取从节目向量抽取单元42供给的根据其产生用户模型的节目的节目向量中,包括保存在初始登记存储单元45中的主题的节目向量。向量运算单元62根据需要使抽取的节目向量的总和归一化。向量运算单元62从而产生用户模型向量。向量运算单元62把用户模型向量登记在用户信息登记单元63中。
从而,当时间段Hm=“23点之后”和类型Gm=“综艺”被规定为主题时,利用这些主题进行过滤,产生用户模型“深夜的综艺节目”。由于用户模型“深夜的综艺节目”包括在23点之后的深夜时间段中广播的综艺节目中出现的喜剧演员作为元素,因此在匹配处理中,抽取并推荐在不同于综艺演出的类型,例如戏剧中,出现对应喜剧演员的节目。从而,与依据项目进行匹配处理相比,能够超出类型等应用用户的偏爱。
顺便提及,根据其产生用户模型的节目可以是例如预定时间内的所有节目,或者在预定时段(例如所谓的黄金时段)中广播的一组节目。
另外,通过利用相同的过滤条件,过滤不同的各组节目,能够产生与不同时间或不同时段中的不同节目安排详细对应的用户模型向量。
具体地说,即使在相同条件“类型Gm=音乐”下,现代的节目安排和10年前的节目安排在广播时间和表演者方面不同。于是,能够产生“现代乐迷”和“10年前的乐迷”的不同用户模型。从而,能够推荐由“10年前的乐迷”喜欢听其歌声的流行歌手作为演员的戏剧或电影,或者,推荐现代歌手演唱“10年前的乐迷”喜欢收听的一首歌曲的节目。
另外即使在相同条件“类型Gm=音乐”下,也可通过过滤,从主要是工作者观看节目从20点到24点的时段,以及主要是儿童观看节目的从15点到20点的时段获得不同的节目组,从而能够产生不同的用户模型。
随后,向量运算单元62计算从节目向量抽取单元42供给的节目的节目向量PP和登记在用户信息登记单元63中的用户模型向量之间的相似度。向量操作单元62根据计算结果产生推荐信息。向量操作单元62随后把推荐信息提供给推荐信息输出单元49。推荐信息输出单元49把推荐信息登记在推荐节目列表50中,并把推荐信息提供给电视显示设备11或记录和再现设备12。
下面参考图29的流程图,说明使用用户模型的匹配处理。
在步骤S231,匹配处理单元43中的向量运算单元62获得根据其产生用户模型的节目的节目向量,所述向量由节目向量抽取单元42抽取。根据其产生用户模型的节目可以是在1月或3月的预定时间内广播的节目,或者是在预定时间中的预定时段(例如黄金时段)内广播的节目,或者是在过去10年或20年前的预定时间内广播的节目。
在步骤S232,初始登记存储单元45从操作输入单元44获得用户输入的主题,并保存该主题。向量运算单元62从初始登记存储单元45读出所述主题,随后把该主题设置成过滤条件。例如,过滤条件可被描述成散列表。
在步骤S233,向量运算单元62根据在步骤S232中设置的过滤条件,过滤在步骤S231中获得的节目向量PP,从而抽取和主题相符的节目向量PP。例如,当由其产生用户模型的节目是过去3个月内的所有节目时,向量运算单元62以条件“标题Tm或类型Gm=足球”,过滤过去3个月内的所有节目。
在步骤S234,向量运算单元62得到由步骤S233中的过滤抽取的节目向量PP的总和,并把该总和用作用户模型向量。例如,当以条件“标题Tm或类型Gm=足球”进行过滤时,产生用户模型“足球迷”的用户模型向量。
在步骤S235,向量运算单元62计算在步骤S234中获得的用户模型向量和作为获得推荐信息的候选者的节目(计划此后要广播的节目)的节目向量PP之间的余弦距离,节目向量PP抽取自节目向量抽取单元42。
在步骤S236,向量运算单元62根据在步骤S235中计算的余弦距离,比较用户模型向量与作为获得推荐信息的候选者的节目的节目向量PP,并根据比较结果,抽取具有最高相似度的预定数目的节目作为推荐信息。向量运算单元62把推荐信息提供给推荐信息输出单元49。推荐信息输出单元49把推荐信息登记在推荐节目列表50中,并把推荐信息提供给电视显示设备11或记录和再现设备12。随后结束处理。
即使不存在用户操作历史,这样的处理也能够推荐和用户设置的主题相符的节目。按照惯例,当在设置条件“标题Tm或类型Gm=足球”之后进行匹配处理时,其中出现足球运动员的综艺演出,戏剧等不能被抽取。另一方面,在参考图29说明的处理中,由于以主题“标题Tm或类型Gm=足球”设置用户模型,导致许多足球运动员姓名也包括在用户模型向量中的项目,例如表演者和内容中,即使节目不符合条件“标题Tm或类型Gm=足球”,其中出现足球运动员的综艺演出,戏剧等也可被抽取和推荐。
虽然在上面的说明中,通过计算用户模型向量和节目向量之间的余弦距离获得相似度,不过,在每个大项中可单独计算余弦距离,并通过利用余弦距离的总和,获得相似度。
顺便提及,产生用户模型向量的处理也可在分发服务器5中进行。这种情况下,利用由参考图2说明的节目向量产生单元23产生的节目向量,进行图29中的步骤S231-S234的处理就可以了。
另外,除了推荐和用户的偏爱相符的节目之外,与正历史向量UP和负历史向量MUP的相似度低的节目的选择增大了推荐用户既不喜欢也不讨厌的节目,即,具有用户以前未看过的特性的节目,或者推荐用户未观看即不喜欢的节目的概率。为了通过抽取用户的偏爱推进学习过程,重要的是用户评估具有用户以前未看过的特性的节目。
这使得不仅能够向提供给用户的推荐结果赋予不可预测性并拓宽用户的兴趣,而且还可能获得用于推荐更符合用户偏爱的节目的非常重要的历史信息。
下面参考图30的流程图,说明选择异常(exceptional)推荐节目的处理。
在步骤S241,利用从节目向量抽取单元42供给的节目向量PP,保存在正历史存储单元47中的正历史向量UP和保存在负历史存储单元48中的负历史向量MUP,匹配处理单元43中的向量运算单元62计算每个大项中,正历史向量UP和节目向量PP之间的余弦距离,以及负历史向量MUP和节目向量PP之间的余弦距离。
在步骤S242,向量运算单元62分别得到在正历史方和负历史方,逐个项目计算的余弦距离的总和。即,步骤S241和S242的处理计算如上所述的正历史向量UP和节目向量PP之间的相似度SimUP,以及负历史向量MUP和节目向量PP之间的相似度SimMUP。
在步骤S243,向量运算单元62计算指示对正历史向量UP和负历史向量MUP的相似度的低下的异常推荐值。
具体地说,异常推荐值可由(1-SimUP)×(1-SimMUP)或(1/SimUP)×(1/SimMUP)获得。
在步骤S244,向量运算单元62根据步骤S243中的计算结果,获得具有大的异常推荐值的节目,从而抽取具有大的异常推荐值的节目作为推荐信息。随后结束处理。
这样的处理能够抽取和推荐具有用户以前未看过的特性的节目。于是,不仅能够向推荐给用户的节目的选择赋予不可预测性和拓宽用户的兴趣,而且还能获得用于推荐更符合用户偏爱的节目的非常重要的历史信息。
通过参考图13-30说明的各项处理,在节目推荐处理设备10中产生推荐信息,推荐信息随后被提供给电视显示设备11或记录和再现设备12。
电视显示设备11或记录和再现设备12被供给由电视接收设备4接收和解码的卫星波或地面波广播信号。
电视显示设备11根据用户输入的操作,显示从电视接收设备4供给的广播信号,或者从记录和再现设备12供给的再现数据,并根据从记录和再现设备12供给的推荐信息,显示推荐节目信息或自动设置频道。此外,电视显示设备11把操作日志提供给节目推荐处理设备10。
记录和再现设备12根据用户输入的操作,记录从电视接收设备4供给的广播信号,或者计划所述广播信号的记录,并且根据从节目推荐处理设备10供给的推荐信息,自动记录节目。另外,记录和再现设备12再现装入记录和再现设备12中的记录介质,或包括在记录和再现设备12中的记录介质上的节目,随后把节目输出给电视显示设备11以便显示。此外,记录和再现设备12把操作日志提供给节目推荐处理设备10。
图31是表示电视接收设备4的结构的方框图。在下面的说明中,假定电视接收设备4是支持数字广播接收设备的标准的普通接收设备。
卫星波检测单元91根据从电视显示设备11或记录和再现设备12供给的选择频道的信号,选择和检测通过卫星2发射并由天线3接收的卫星波。卫星波检测单元91把涉及发射模式的控制信号提供给TMCC(发射和多路复用配置控制)解码单元92,并把广播信号提供给解调和解码处理单元93。
TMCC解码单元92接收发射和多路复用控制信号中的关于发射模式(调制系统,编码率等),时隙等的信息的输入,对所述信息解码,随后把解码的信息提供给解调和解码处理单元93。
解调和解码处理单元93根据从TMCC解码单元92供给的关于发射模式的信息,采用诸如QPSK(四相相移键控,也被称为4PSK)方法或8PSK方法之类的方法,对供给的广播信号解调和解码。解调和解码处理单元93把解调和解码信号提供给解交错单元94。
解交错单元94对供给的信号解交错,随后把解交错的信号提供给纠错处理单元95。解交错单元94还对供给的信号进行帧分离处理和解扰处理。
纠错处理单元95利用Reed-Solomon(里德-所罗门)码进行纠错处理,随后把结果提供给CA(条件访问)解扰单元101。
地面波检测单元96根据从电视显示设备11或记录和再现设备12供给的选择频道的控制信号,选择和检测天线3接收的地面波。地面波检测单元96把与发射模式相关的控制信号提供给TMCC解码单元97,并把广播信号提供给解调和解码处理单元98。
TMCC解码单元97接收发射和多路复用控制信号中的关于发射模式(调制系统,编码率等),时隙,TS等的信息的输入,对所述信息解码,随后把解码的信息提供给解调和解码处理单元98。
解调和解码处理单元98根据从TMCC解码单元97供给的关于发射模式的信息,采用诸如QAM(正交调幅)方法之类的方法,对供给的广播信号解调和解码。解调和解码处理单元98把解调和解码的信号提供给解交错单元99。
解交错单元99对供给的信号解交错,并把解交错信号提供给TS(传送流)再现单元100。解交错单元99还对供给的信号进行帧分离处理和解扰处理。
TS再现单元100根据供给的信号再现传送流,随后把再现的传送流提供给CA解扰单元101。
CA解扰单元101对基于从纠错处理单元95或TS再现单元100供给的信号的条件访问信号解扰,随后把解扰后的信号提供给多路分解单元102。
数据输入单元103接收来自EPG接收设备9的EPG数据,并通过网络8接收从分发服务器5供给的流式数据。数据输入单元103把数据提供给多路分解单元102。
多路分解单元102对从CA解扰单元101或数据输入单元103供给的信号进行多路分解。多路分解单元102把音频信号提供给音频信号解码单元104,把视频信号提供给视频信号解码单元105,把控制信号和诸如EPG之类的数据提供给数据解码单元106。
音频信号解码单元104对供给的音频信号解码,随后把解码的音频信号提供给电视显示设备11或记录和再现设备12。视频信号解码单元105对供给的视频信号解码,随后把解码的视频信号提供给电视显示设备11或记录和再现设备12。数据解码单元106对供给的控制信号和诸如EPG之类的数据解码,随后把解码的控制信号和数据提供给电视显示设备11或记录和再现设备12。
作为电视接收设备4的处理的结果,接收的卫星波或地面波,或者分发的流式数据由预定方法解调和解码,随后被提供给电视显示设备11或记录和再现设备12。
图32是表示电视显示设备11的结构的方框图。
操作输入单元121接收来自用户的操作输入,并把对应于来自用户的操作输入的控制信号提供给电视显示设备11的各个部分。另外,操作输入单元121把用户操作的说明提供给操作日志列表122,以便把操作的说明保存在操作日志列表122中。保存在操作日志列表122中的用户操作日志由参考图13说明的节目推荐处理设备10中的操作日志获取单元46获得。当用户操作输入将选择频道时,操作输入单元121把输入的用户操作提供给频道设置单元123。
频道设置单元123根据从操作输入单元121供给的指示用户操作输入的信号,产生指示频道的选择的控制信号。频道设置单元123把该控制信号提供给电视接收设备4。另外,根据登记在后面说明的推荐节目列表128中的推荐信息,频道设置单元123产生指示频道的选择,以便自动设置频道的控制信号。频道设置单元123把该控制信号提供给电视接收设备4。根据该控制信号,电视接收设备4接收规定频道的广播信号。
数据输入单元124接收从电视接收设备4输入的广播信号,随后把广播信号提供给图像处理单元125。图像处理单元125根据输出单元126的图像显示方法,对供给的广播信号进行图像处理。图像处理单元125把图像处理后的广播信号提供给输出单元126。输出单元126包括显示装置和诸如扬声器之类的音频输出装置,显示装置的例子是CRT(阴极射线管)和LCD(液晶显示器)等。输出单元126在显示装置上显示图像处理后的供给的广播信号的图像信号,并从音频输出装置输出广播信号的音频信号。
推荐节目列表获取单元127从节目推荐处理设备10获得推荐信息,随后把推荐信息提供给推荐节目列表128。推荐节目列表128登记提供的推荐信息。登记在推荐节目列表128中的推荐信息被输出给频道设置单元123,或者由推荐节目信息显示控制单元129读出。
推荐节目信息显示控制单元129把从推荐节目列表128读出的推荐信息提供给图像处理单元125,以便向用户呈现推荐节目信息。图像处理单元125把从推荐节目信息显示控制单元129供给的推荐信息单独地,或者叠加在从数据输入单元124供给的广播信号的图像上地输出给输出单元126,以便在显示装置上显示推荐信息。
顺便提及,可依据用户设置,确定是在输出单元126上显示推荐信息,还是根据从节目推荐处理设备10供给的推荐信息自动设置频道。
下面参考图33的流程图,说明根据从节目推荐处理设备10供给的推荐信息,向用户呈现节目推荐信息的推荐信息显示处理。
在步骤S251,推荐节目列表获取单元127获得从节目推荐处理设备10中的推荐信息输出单元49输出的推荐信息。
在步骤S252,推荐节目列表获取单元127把获得的推荐信息登记在推荐节目列表128中。
在步骤S253,推荐节目信息显示控制单元129从推荐节目列表128读出推荐将在当前时间的例如3小时或一天的预定时间内广播的节目的推荐信息,产生用于显示推荐信息,以便显示被推荐节目的标题,内容,广播时间和广播频道等的数据,随后把用于显示推荐信息的数据提供给图像处理单元125。
在步骤S254,图像处理单元125进行图像处理,以便在输出单元126上显示用于显示推荐信息的供给数据。图像处理单元把图像处理的结果提供给输出单元126。推荐信息被单独地或者被重叠在从数据输入单元124供给的广播信号的图像上地进行图像处理。
在步骤S255,输出单元126显示从图像处理单元125供给的推荐信息。最后结束处理。
作为上述处理的结果,推荐信息被显示在输出单元126上。从而,通过参考显示的推荐信息,用户能够选择要观看的节目。
下面参考图34的流程图,说明根据从节目推荐处理设备10供给的推荐信息自动设置频道,从而显示和用户的偏爱相符的节目的自动频道设置处理。
在步骤S271和S272,进行与参考图33说明的步骤S251和S252相同的处理。即,获得从节目推荐处理设备10中的推荐信息输出单元49输出的推荐信息,获得的推荐信息被登记在推荐节目列表128中。
在步骤S273,频道设置单元123从节目推荐列表128获得对应于当前时间的推荐节目的信息。在步骤S274,频道设置单元123根据推荐节目的信息,产生频道设置信息,随后把频道设置信息输出给电视接收设备4。电视接收设备4根据控制信号,接收规定频道的广播信号。
在步骤S275,数据输入单元124从电视接收设备4获得规定频道的广播信号。数据输入单元124把广播信号提供给图像处理单元125。
在步骤S276,图像处理单元125对供给的广播信号进行图像处理,以便在输出单元126上显示。图像处理单元125把图像处理的结果输出给输出单元126。
在步骤S277,输出单元126显示从图像处理单元125提供的推荐节目的视频,并输出推荐节目的音频。随后结束处理。
作为这种处理的结果,对正在广播和用户的偏爱相符的节目的频道进行自动频道设置。例如当用户发出命令时,可进行参考图34说明的自动频道设置处理。这使得当用户不知道观看哪个节目时,能够把频道自动设置成正在广播恰当节目的频道。
另外,每隔预定时间间隔,例如2小时,或者例如当持续预定时间没有来自用户的操作输入时,可进行参考图34说明的自动频道设置处理,在所述预定时间间隔之后,如果频道保持不变,而没有任何特别的意图,那么可确定频道保持原样,在所述预定时间之后,保持不变的频道可被确定为保持原样。
顺便提及,为了防止用户正在有意观看节目时的自动频道设置,可提供其中禁用自动频道设置处理的模式,用户能够发出设置这种模式的命令。
图35是表示记录和再现设备12的方框图。
操作输入单元141接收来自用户的操作输入,把和来自用户的操作输入对应的控制信号提供给记录和再现设备12的各个部分。另外,操作输入单元141把用户操作的说明提供给操作日志列表142,以便把操作的说明保存在操作日志列表142中。保存在操作日志列表142中的用户操作日志由参考图13说明的节目推荐处理设备10中的操作日志获取单元46获得。
记录设置单元143根据从操作输入单元141供给的指示用户操作输入的信号,或者从登记在后面说明的推荐节目列表149中的推荐信息抽取进行记录处理所必需的信息,所述信息例如是要记录的节目的广播开始时间以及广播结束时间,广播频道等。当从操作输入单元141供给的用户操作输入用于计划的记录时,记录设置单元143把进行记录处理所必需的信息登记在计划记录列表144中。当从操作输入单元141供给的用户操作输入用于记录现在正在广播的节目时,或者当将利用登记在后面说明的推荐节目列表149中的推荐信息进行自动记录时,记录设置单元143把进行记录处理所必需的信息提供给记录控制单元145。
根据从记录设置单元143供给的进行记录处理所必需的信息,或者通过从登记在计划记录列表144中的计划记录信息抽取和当前时间对应的计划记录信息,记录控制单元145产生指示要记录的节目的广播频道的控制信号,随后把控制信号提供给电视接收设备4,还产生进行记录处理的控制信号,随后把控制信号提供给记录和再现处理单元147。电视接收设备4根据该控制信号,接收规定频道的广播信号。
数据输入单元146从电视接收设备4接收广播信号,并把广播信号提供给记录和再现处理单元147。记录和再现处理单元147被配置成以致记录介质,例如磁带,光盘,磁盘,磁光盘和半导体存储器可被插入记录和再现处理单元147中,或者记录和再现处理单元147具有在其之内的记录介质,例如硬盘或半导体存储器。记录和再现处理单元147能够把信息记录到这些记录介质上,并从这些记录介质再现信息。具体地说,当可插入记录和再现处理单元147的记录介质是磁带时,记录和再现处理单元147具有磁头。记录和再现处理单元147把从数据输入单元146供给的广播信号记录(即录像)到磁带上,并再现记录在磁带上的信息,随后把该信息提供给电视显示设备11等以便再现输出。
推荐节目列表获取单元148从节目推荐处理设备10获得推荐信息,随后把推荐信息提供给推荐节目列表149。推荐节目列表149登记提供的推荐信息。登记在推荐节目列表149中的推荐信息被输出给记录设置单元143,以便自动进行记录处理。
下面参考图36的流程图说明自动记录处理。
在步骤S291,推荐节目列表获取单元148从节目推荐处理设备10中的推荐信息输出单元49获得推荐信息。
在步骤S292,推荐节目列表获取单元148把获得的推荐信息登记在推荐节目列表149中。
在步骤S293,记录设置单元143从推荐节目列表149抽取对应于当前时间的推荐节目的信息,从而获得进行记录处理所需的信息,例如广播开始时间以及广播结束时间,广播频道等,随后把该信息提供给记录控制单元145。
在步骤S294,记录控制单元145产生用于接收要记录的节目的广播信号的频道设置信息,随后把频道设置信息输出给电视接收设备4。根据该控制信号,电视接收设备4接收规定频道的广播信号。
在步骤S295,数据输入单元146从电视接收设备4获得规定频道的广播信号,随后把广播信号提供给记录和再现处理单元147。
在步骤296,记录和再现处理单元147把供给的广播信号记录在装入或者包括在记录和再现处理单元147中的记录介质上。随后结束处理。
这样的处理能够自动记录和用户的偏爱相符的节目。在用户命令的记录处理或者计划的记录处理正在进行记录操作时,不执行参考图36说明的自动记录处理。
虽然在上面的说明中,根据对应于当前时间的推荐节目进行自动记录,但是不必说,通过获得当前时间之后预定时间的推荐信息,能够按照相同的方式自动设置计划的记录。
虽然在参考图1-36说明的各个处理中,节目向量PP在分发服务器5中产生,但是,代替分发服务器5产生节目向量PP,EPG数据可通过网络8被提供给节目推荐处理设备,节目推荐处理设备可产生节目向量PP。
图37和38分别表示在不是分发服务器产生节目向量PP,而是EPG数据通过网络8被提供给节目推荐处理设备,节目推荐处理设备产生节目向量的情况下,分发服务器171的结构和节目推荐处理设备191的结构。
顺便提及,和图2的分发服务器5及图13的节目推荐处理设备10中的部分对应的部分由相同的附图标记表示,它们的说明将被省略。
具体地说,分发服务器171包括参考图2所述的分发服务器5的数据获取单元21和数据传输单元25。分发服务器171从流式数据数据库6或元数据数据库7获得流式数据包括元数据的EPG数据。分发服务器171通过网络8把流式数据或EPG数据传送给EPG接收设备9或电视接收设备4。
节目推荐处理设备191具有与参考图13说明的节目推荐处理设备10相同的结构,除了节目推荐处理设备191还配有与图2的分发服务器5中设置的相似的元数据抽取单元22和节目向量产生单元23之外。除了节目推荐处理设备10执行的处理之外,节目推荐处理设备191还进行参考图3说明的第一节目向量产生处理,参考图6说明的第二节目向量产生处理,参考图7说明的第一分组处理,和参考图8说明的分组处理。
在EPG数据通过网络8被提供给节目推荐处理设备的情况下,能够产生和参考图1-36说明的情况中相同的效果,节目推荐处理设备产生节目向量PP,而不是分发服务器产生产生节目向量PP。
另外,EPG接收设备9可从电视显示设备11及记录和再现设备12收集用户操作历史和设置信息等,通过网络8把用户操作历史和设置信息等提供给分发服务器,分发服务器不仅产生节目向量PP,而且进行匹配处理,随后通过网络8把匹配结果提供给EPG接收设备9。图39表示了这种情况下的网络结构,图40是表示这种情况下的分发服务器201的结构的方框图。
顺便提及,与图1、37和38中的部分对应的部分由相同的附图标记表示,并且省略了对它们的说明。
具体地说,通过把参考图38说明的节目推荐处理设备191的功能加入参考图37说明的分发服务器171中,形成分发服务器201。从而,用户不需要拥有节目推荐处理设备
在图39和40中所示的结构中,分发服务器201进行参考图3-12和图14-30说明的所有各项处理,例如产生节目向量PP,节目方效应向量EfPP,正历史向量UP,负历史向量MUP或标准偏爱向量APP的处理,节目向量PP分组处理,匹配处理,或异常推荐节目选择处理。
顺便提及,这种情况下,从电视显示设备11及记录和再现设备12收集的,并由EPG接收设备9通过网络传送的用户操作历史和设置信息等具有用户ID,以便可依据用户进行区分。另外,分发服务器201的节目推荐处理设备191中的初始登记存储单元45,正历史存储单元47和负历史存储单元48等根据供给的信息的用户ID,依据用户保存相应的信息。
虽然上面说明了通过使用电视广播信号的EPG数据,推荐和用户的偏爱相符的节目的情况,不过,本发明也可应用于把属性信息加入各种数字内容,例如无线电广播或流式数据中,推荐和用户的偏爱相符的内容的情况。
前面说明的一系列的处理也可由软件来实现。软件或者构成软件的程序从记录介质被安装到包含在特定硬件中的计算机上,或者例如通过安装各种程序,能够实现各种功能的通用个人计算机。
如图2,图13或图38中所示,记录介质由分发给用户,从而独立于计算机提供程序,并且把程序记录于其上的打包介质形成,打包介质包括磁盘31或71(包括软盘),光盘32或72(包括CD-ROM(光盘-只读存储器)和DVD(数字通用盘)),磁光盘33或73(包括MD(MiniDisc)(商标)),半导体存储器34或74等。
另外,在本说明书中,说明记录在记录介质上的程序的步骤不仅包括按照所述顺序依次执行的处理,而且还包括不必按照时间顺序并行地或者单独地进行的处理。
要注意在本说明书中,“系统”指的是由多个设备整体形成的一个设备。
工业可应用性
从而,根据本发明,能够选择和用户的偏爱相符的内容。特别地,因为通过相互独立地计算根据用户操作历史产生的第一偏爱信息和属性信息之间的相似度,和第二偏爱信息和属性信息之间的相似度,产生指示向用户推荐观看的内容的推荐信息,因此能够选择准确地和用户的偏爱相符的内容。

Claims (13)

1、一种执行选择适合用户的偏爱的内容的处理的信息处理设备,包括:
获得所述内容的属性信息的属性信息获取装置;
获得所述用户的操作历史的操作历史获取装置;
根据所述操作历史获取装置获得的所述操作历史,产生指示所述用户的偏爱的正因素的第一偏爱信息和指示所述用户的偏爱的负因素的第二偏爱信息的偏爱信息产生装置;和
通过相互独立地计算所述第一偏爱信息与所述属性信息之间的相似度,和所述第二偏爱信息与所述属性信息之间的相似度,产生指示向所述用户推荐观看的内容的推荐信息的推荐信息产生装置。
2、按照权利要求1所述的信息处理设备,其中:
所述偏爱信息产生装置产生的所述第一偏爱信息和所述第二偏爱信息,及所述属性信息获取装置获得的所述属性信息都包括多个项目;
所述偏爱信息产生装置将注意指向所述操作历史获取装置获得的所述操作历史的所述项目之一,并依据所述偏爱信息产生装置将注意指向的所述项目的元素,产生所述第一偏爱信息和所述第二偏爱信息;和
所述推荐信息产生装置抽取对应于所述属性信息的所述元素的所述第一偏爱信息和所述第二偏爱信息,并计算所述第一偏爱信息与所述属性信息之间的相似度和所述第二偏爱信息与所述属性信息之间的相似度。
3、按照权利要求1所述的信息处理设备,其中:
所述推荐信息产生装置根据所述第一偏爱信息与所述属性信息之间的相似度和所述第二偏爱信息与所述属性信息之间的相似度的独立计算结果,产生指示具有对每个所述第一偏爱信息和所述第二偏爱信息的低相似度的所述内容的推荐信息。
4、按照权利要求1所述的信息处理设备,其中:
所述偏爱信息产生装置产生的所述第一偏爱信息和所述第二偏爱信息,及所述属性信息获取装置获得的所述属性信息都依据预定的项目被向量化。
5、按照权利要求4所述的信息处理设备,还包括依据所述项目,使所述内容的属性信息、所述第一偏爱信息和所述第二偏爱信息的至少一部分归一化的归一化处理装置,
其中所述推荐信息产生装置通过相互独立地计算所述第一偏爱信息与所述内容的所述属性信息之间的相似度和所述第二偏爱信息与所述内容的所述属性信息之间的相似度,产生所述推荐信息,所述内容的属性信息、所述第一偏爱信息和所述第二偏爱信息的至少一部分由所述归一化处理装置归一化。
6、按照权利要求4所述的信息处理设备,其中:
所述推荐信息产生装置根据所述偏爱信息产生装置产生的所述第一偏爱信息与所述属性信息获取装置获得的所述属性信息的内积的计算,和所述偏爱信息产生装置产生的所述第二偏爱信息与所述属性信息获取装置获得的所述属性信息的内积的计算,产生所述推荐信息。
7、按照权利要求4所述的信息处理设备,其中:
所述预定项目包括大项和通过进一步把所述大项分成具体细节获得的小项;
所述推荐信息产生装置依据所述大项计算所述偏爱信息产生装置产生的所述第一偏爱信息与所述属性信息获取装置获得的所述属性信息的内积,和所述偏爱信息产生装置产生的所述第二偏爱信息与所述属性信息获取装置获得的所述属性信息的内积,并根据内积的计算结果的和,产生所述推荐信息。
8、按照权利要求1所述的信息处理设备,其中:
所述操作历史获取装置把获得的所述操作历史分成指示所述用户喜欢的内容的第一操作历史和指示所述用户不喜欢的内容的第二操作历史;
所述偏爱信息产生装置根据所述第一操作历史产生所述第一偏爱信息,根据所述第二操作历史产生所述第二偏爱信息。
9、按照权利要求8所述的信息处理设备,其中:
所述推荐信息产生装置根据通过从所述偏爱信息产生装置产生的所述第一偏爱信息与所述属性信息获取装置获得的所述属性信息之间的相似度中,减去所述偏爱信息产生装置产生的所述第二偏爱信息与所述属性信息获取装置获得的所述属性信息之间的相似度获得的值,产生所述推荐信息。
10、按照权利要求1所述的信息处理设备,还包括显示所述推荐信息产生装置产生的所述推荐信息的显示装置。
11、按照权利要求1所述的信息处理设备,还包括:
接收所述内容的接收装置;和
根据所述推荐信息产生装置产生的所述推荐信息,控制所述接收装置接收的所述内容的选择的选择控制装置。
12、按照权利要求11所述的信息处理设备,还包括:
记录所述选择控制装置选择的所述接收内容的记录装置。
13、一种信息处理设备的信息处理方法,所述信息处理设备执行选择适合用户的偏爱的内容的处理的,包括下述步骤:
获得所述用户的操作历史;
根据所述操作历史获取步骤的处理获得的所述操作历史,产生指示所述用户的偏爱的正因素的第一偏爱信息和指示所述用户的偏爱的负因素的第二偏爱信息;和
通过相互独立地计算所述第一偏爱信息与所述属性信息之间的相似度和所述第二偏爱信息与所述属性信息之间的相似度,产生指示适合所述用户的偏爱的内容的推荐信息。
CNB2003801087695A 2002-12-12 2003-12-12 信息处理设备和信息处理方法,记录介质及程序 Expired - Fee Related CN100566387C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP361277/2002 2002-12-12
JP2002361277A JP2004194108A (ja) 2002-12-12 2002-12-12 情報処理装置および情報処理方法、記録媒体、並びにプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CNA2005100965689A Division CN1750610A (zh) 2002-12-12 2003-12-12 信息处理设备和信息处理方法,记录介质及程序

Publications (2)

Publication Number Publication Date
CN1739289A CN1739289A (zh) 2006-02-22
CN100566387C true CN100566387C (zh) 2009-12-02

Family

ID=32501035

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB2003801087695A Expired - Fee Related CN100566387C (zh) 2002-12-12 2003-12-12 信息处理设备和信息处理方法,记录介质及程序
CNA2005100965689A Pending CN1750610A (zh) 2002-12-12 2003-12-12 信息处理设备和信息处理方法,记录介质及程序

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNA2005100965689A Pending CN1750610A (zh) 2002-12-12 2003-12-12 信息处理设备和信息处理方法,记录介质及程序

Country Status (6)

Country Link
US (2) US7577645B2 (zh)
EP (2) EP1942664A3 (zh)
JP (1) JP2004194108A (zh)
KR (2) KR101029740B1 (zh)
CN (2) CN100566387C (zh)
WO (1) WO2004054246A1 (zh)

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4186620B2 (ja) 2001-01-23 2008-11-26 ソニー株式会社 通信装置及び通信方法、電子機器及びその制御方法、並びに記憶媒体
JP2004194108A (ja) * 2002-12-12 2004-07-08 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム
KR101019976B1 (ko) * 2002-12-12 2011-03-09 소니 주식회사 정보 처리 장치 및 정보 처리 방법, 정보 처리 시스템, 기록 매체
WO2005084234A2 (en) * 2004-02-27 2005-09-15 Daniel Abrahamsohn Method of and system for obtaining data from multiple sources and raking documents based on meta data obtained through collaborative filtering and other matching techniques
US20050210501A1 (en) * 2004-03-19 2005-09-22 Microsoft Corporation Method and apparatus for handling metadata
JP2006040085A (ja) * 2004-07-29 2006-02-09 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
JP2006094018A (ja) * 2004-09-22 2006-04-06 Sharp Corp 番組推薦装置、番組推薦方法、プログラムおよびそのプログラムを記録した記録媒体
CN101036386A (zh) * 2004-10-01 2007-09-12 松下电器产业株式会社 频道订约建议装置、方法、程序和集成电路
WO2006043498A1 (ja) * 2004-10-18 2006-04-27 Pioneer Corporation 情報処理装置、統計情報データベースのデータ構造、情報生成装置、情報処理方法、情報生成方法、情報処理プログラム、およびそのプログラムを記録した記録媒体
JP2006148853A (ja) * 2004-10-18 2006-06-08 Sharp Corp 情報作成装置、番組推薦装置、情報作成方法、番組推薦プログラムおよびそのプログラムを記録した記録媒体
JP2006129122A (ja) * 2004-10-29 2006-05-18 Sharp Corp 放送受信装置、放送受信方法、放送受信プログラム及びプログラム記録媒体
JP2006129265A (ja) * 2004-10-29 2006-05-18 Sharp Corp 番組情報抽出装置、番組情報表示装置、放送番組録画システム、番組情報抽出方法、プログラム、および、プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006134383A (ja) * 2004-11-02 2006-05-25 Canon Inc 再生装置、再生方法及びそのプログラム
KR20050044844A (ko) 2004-11-03 2005-05-13 삼성전자주식회사 디지털 방송 채널정보 표시 장치 및 방법
JP4430002B2 (ja) * 2004-11-03 2010-03-10 三星電子株式会社 デジタル放送プログラム情報の表示装置及び方法
JP2006157715A (ja) * 2004-11-30 2006-06-15 Sharp Corp 番組情報抽出装置、番組情報抽出方法、そのプログラムおよび記録媒体
JP4534748B2 (ja) * 2004-12-20 2010-09-01 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
DE102005039507A1 (de) * 2005-01-18 2006-08-17 Hirschmann Electronics Gmbh Programmdiversity
US7912806B2 (en) * 2005-02-21 2011-03-22 Brother Kogyo Kabushiki Kaisha System and device for providing contents
US7971233B2 (en) * 2005-05-23 2011-06-28 Panasonic Corporation Communication device, communication method, communication program, storage medium thereof, and integrated circuit
JP4378646B2 (ja) 2005-09-28 2009-12-09 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2007110388A (ja) * 2005-10-13 2007-04-26 Funai Electric Co Ltd 連係動作プログラム及び接続機器
EP2309743A1 (en) * 2005-12-29 2011-04-13 United Video Properties, Inc. Systems and Methods for Managing Content
JP2007272451A (ja) * 2006-03-30 2007-10-18 Toshiba Corp 推薦番組情報提供装置、推薦番組情報提供方法及びプログラム
US20070250378A1 (en) * 2006-04-24 2007-10-25 Hughes John M Systems and methods for conducting production competitions
JP4179341B2 (ja) * 2006-06-01 2008-11-12 ソニー株式会社 情報処理装置および方法、プログラム、並びに記録媒体
JP5027483B2 (ja) * 2006-11-10 2012-09-19 富士通株式会社 情報検索装置及び情報検索方法
JP4909033B2 (ja) * 2006-11-30 2012-04-04 富士通株式会社 番組検索装置
JP4423568B2 (ja) * 2006-12-08 2010-03-03 ソニー株式会社 表示制御処理装置および方法並びにプログラム
US8473525B2 (en) * 2006-12-29 2013-06-25 Apple Inc. Metadata generation for image files
JP2008187575A (ja) * 2007-01-31 2008-08-14 Sony Corp 情報処理装置および方法、並びにプログラム
JP2008187576A (ja) * 2007-01-31 2008-08-14 Sony Corp 情報処理装置および方法、並びにプログラム
JP5075423B2 (ja) * 2007-02-16 2012-11-21 株式会社東芝 推薦番組提示装置、および推薦番組提示方法
JP4389973B2 (ja) * 2007-06-26 2009-12-24 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP5173287B2 (ja) * 2007-07-06 2013-04-03 キヤノン株式会社 番組記録装置及びその制御方法
JP4403432B2 (ja) * 2007-07-19 2010-01-27 ソニー株式会社 録画再生装置及び録画再生方法
US8949877B2 (en) * 2007-08-31 2015-02-03 At&T Intellectual Property I, L.P. Method and system for determining subscriber demand for multimedia content
KR100964013B1 (ko) * 2007-11-09 2010-06-15 광주과학기술원 사용자 선호도 기반의 데이터 변환 서비스 시스템 및 그방법
KR101060487B1 (ko) * 2007-11-19 2011-08-30 서울대학교산학협력단 태그 클라우드를 이용한 콘텐츠 추천 장치 및 방법
US20090170586A1 (en) * 2007-12-26 2009-07-02 Springtime Productions, Llc Springtime productions special charity fund raising process
JP5166949B2 (ja) * 2008-04-10 2013-03-21 株式会社エヌ・ティ・ティ・ドコモ レコメンド情報生成装置およびレコメンド情報生成方法
JP4645676B2 (ja) * 2008-04-28 2011-03-09 ソニー株式会社 情報処理装置、関連アイテムの提供方法、及びプログラム
JP4636343B2 (ja) * 2008-09-02 2011-02-23 ソニー株式会社 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム
JP4650552B2 (ja) * 2008-10-14 2011-03-16 ソニー株式会社 電子機器、コンテンツ推薦方法及びプログラム
CN101819570B (zh) * 2009-02-27 2012-08-15 国际商业机器公司 网络环境中的用户信息处理和资源推荐的方法和系统
JP5182178B2 (ja) * 2009-03-18 2013-04-10 ソニー株式会社 情報処理装置及び情報処理方法
JP5338450B2 (ja) * 2009-04-22 2013-11-13 富士通株式会社 再生装置及びプログラム
JP5409103B2 (ja) * 2009-04-30 2014-02-05 株式会社Nttドコモ レコメンド情報配信装置およびレコメンド情報配信方法
JP2011145742A (ja) * 2010-01-12 2011-07-28 Sony Corp 情報処理装置、情報処理方法、およびプログラム
JP5479134B2 (ja) * 2010-01-29 2014-04-23 株式会社東芝 デジタル放送受信機及び録画番組の制御方法
KR20110091382A (ko) * 2010-02-05 2011-08-11 삼성전자주식회사 방송 수신 장치, 방송 프로그램 선택 방법 및 그 저장 매체
KR20110108776A (ko) * 2010-03-29 2011-10-06 삼성전자주식회사 휴대단말기의 사용방법을 제공하는 방법
KR101819432B1 (ko) 2010-08-19 2018-01-16 톰슨 라이센싱 네트워크 트래픽의 모니터링에 의한 정보 콘텐츠의 개인화
EP2606628A2 (en) * 2010-08-19 2013-06-26 Thomson Licensing Personalization of information content by monitoring network traffic
JP5578040B2 (ja) * 2010-11-15 2014-08-27 ソニー株式会社 情報処理装置および方法、情報処理システム、並びに、プログラム
EP2518992A1 (en) * 2011-04-28 2012-10-31 Axel Springer Digital TV Guide GmbH Apparatus and method for managing a personal channel
US8577876B2 (en) * 2011-06-06 2013-11-05 Met Element, Inc. System and method for determining art preferences of people
JP5859771B2 (ja) * 2011-08-22 2016-02-16 ソニー株式会社 情報処理装置、情報処理システム情報処理方法及びプログラム
CN103699551B (zh) * 2012-09-27 2016-05-04 腾讯科技(深圳)有限公司 一种信息的推荐方法、服务器及系统
US20160065160A1 (en) * 2013-03-21 2016-03-03 Intellectual Discovery Co., Ltd. Terminal device and audio signal output method thereof
US9210461B2 (en) * 2013-03-27 2015-12-08 Verizon and Redbox Digital Entertainment Services, LLC Theme-based media program discovery systems and methods
JP6631516B2 (ja) * 2014-06-19 2020-01-15 日本電気株式会社 情報処理装置、ベクトルデータ処理方法、及び、プログラム
US9986299B2 (en) * 2014-09-22 2018-05-29 DISH Technologies L.L.C. Scheduled programming recommendation system
KR20160051983A (ko) * 2014-10-30 2016-05-12 현대자동차주식회사 차량의 음악 추천 시스템 및 그 방법
US9467733B2 (en) 2014-11-14 2016-10-11 Echostar Technologies L.L.C. Intuitive timer
US9503791B2 (en) 2015-01-15 2016-11-22 Echostar Technologies L.L.C. Home screen intelligent viewing
EP3385952B1 (en) * 2015-12-02 2020-08-26 Sony Corporation Information processing device, information processing method, and program
JP6986061B2 (ja) * 2016-03-17 2021-12-22 Kddi株式会社 番組推薦装置、番組推薦方法及び番組推薦プログラム
JP6641204B2 (ja) * 2016-03-17 2020-02-05 Kddi株式会社 番組推薦装置、番組推薦方法及び番組推薦プログラム
US9924217B1 (en) 2016-11-22 2018-03-20 Echostar Technologies L.L.C. Home screen recommendations determination
US10231020B2 (en) 2017-05-16 2019-03-12 The Directv Group, Inc Sports recommender system utilizing content based filtering
US11716586B2 (en) * 2018-09-28 2023-08-01 Sony Corporation Information processing device, method, and program
JP6998933B2 (ja) * 2019-12-27 2022-01-18 Kddi株式会社 番組推薦装置、番組推薦方法及び番組推薦プログラム
JP6866466B2 (ja) * 2019-12-27 2021-04-28 Kddi株式会社 番組推薦装置、番組推薦方法及び番組推薦プログラム
CN111563201A (zh) * 2020-04-29 2020-08-21 北京三快在线科技有限公司 内容推送方法、装置、服务器及存储介质
US20230081938A1 (en) * 2020-09-16 2023-03-16 Google Llc Digital video analysis
CN114443967B (zh) * 2022-04-08 2022-07-08 北京并行科技股份有限公司 一种相似应用推荐方法、计算设备及存储介质
CN117641004B (zh) * 2023-11-22 2024-05-14 北京风平智能科技有限公司 一种短视频推荐方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6076082A (en) * 1995-09-04 2000-06-13 Matsushita Electric Industrial Co., Ltd. Information filtering method and apparatus for preferentially taking out information having a high necessity
JP2001282285A (ja) * 2000-03-31 2001-10-12 Matsushita Electric Ind Co Ltd 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3244005B2 (ja) 1995-09-04 2002-01-07 松下電器産業株式会社 情報フィルタ装置及び情報フィルタリング方法
US6018738A (en) * 1998-01-22 2000-01-25 Microsft Corporation Methods and apparatus for matching entities and for predicting an attribute of an entity based on an attribute frequency value
US6742003B2 (en) * 2001-04-30 2004-05-25 Microsoft Corporation Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications
JP2001086420A (ja) 1999-09-16 2001-03-30 Matsushita Electric Ind Co Ltd 放送端末装置
JP4828679B2 (ja) * 1999-12-01 2011-11-30 ソニー株式会社 受信装置、コンテンツ選択方法、及び放送システム
AU2001241604A1 (en) * 2000-02-18 2001-08-27 Homeportfolio, Inc. Attribute tagging and matching system and method for database management
EP1186164A1 (en) 2000-03-17 2002-03-13 Koninklijke Philips Electronics N.V. Method and apparatus for rating database objects
EP1156424A2 (en) * 2000-05-17 2001-11-21 Matsushita Electric Industrial Co., Ltd. Information recommendation apparatus and information recommendation system
US7454775B1 (en) * 2000-07-27 2008-11-18 Koninklijke Philips Electronics N.V. Method and apparatus for generating television program recommendations based on similarity metric
US7721310B2 (en) 2000-12-05 2010-05-18 Koninklijke Philips Electronics N.V. Method and apparatus for selective updating of a user profile
US20020075320A1 (en) 2000-12-14 2002-06-20 Philips Electronics North America Corp. Method and apparatus for generating recommendations based on consistency of selection
US20040032393A1 (en) * 2001-04-04 2004-02-19 Brandenberg Carl Brock Method and apparatus for scheduling presentation of digital content on a personal communication device
US7149804B2 (en) * 2001-04-30 2006-12-12 Sony Computer Entertainment America Inc. Method and system for providing evaluation of text-based products
JP4098539B2 (ja) * 2002-03-15 2008-06-11 富士通株式会社 プロファイル情報の推薦方法、プログラム及び装置
US20030220858A1 (en) * 2002-05-24 2003-11-27 Duc Lam Method and system for collaborative vendor reconciliation
US7171620B2 (en) * 2002-07-24 2007-01-30 Xerox Corporation System and method for managing document retention of shared documents
US6999962B2 (en) * 2002-08-13 2006-02-14 Xerox Corporation Shared document repository with coupled recommender system
JP2004194108A (ja) * 2002-12-12 2004-07-08 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6076082A (en) * 1995-09-04 2000-06-13 Matsushita Electric Industrial Co., Ltd. Information filtering method and apparatus for preferentially taking out information having a high necessity
JP2001282285A (ja) * 2000-03-31 2001-10-12 Matsushita Electric Ind Co Ltd 音声認識方法及び音声認識装置、並びにそれを用いた番組指定装置

Also Published As

Publication number Publication date
EP1942664A3 (en) 2016-06-08
KR20050074655A (ko) 2005-07-18
US20060129547A1 (en) 2006-06-15
EP1571836B1 (en) 2014-07-16
KR20050085479A (ko) 2005-08-29
CN1750610A (zh) 2006-03-22
KR101007839B1 (ko) 2011-01-13
US20060294093A1 (en) 2006-12-28
CN1739289A (zh) 2006-02-22
WO2004054246A1 (ja) 2004-06-24
US7577645B2 (en) 2009-08-18
EP1942664A2 (en) 2008-07-09
EP1571836A4 (en) 2010-09-08
EP1571836A1 (en) 2005-09-07
JP2004194108A (ja) 2004-07-08
US7587382B2 (en) 2009-09-08
KR101029740B1 (ko) 2011-04-19

Similar Documents

Publication Publication Date Title
CN100566387C (zh) 信息处理设备和信息处理方法,记录介质及程序
CN100499761C (zh) 信息处理设备和信息处理方法
US9552413B2 (en) Information-processing apparatus, method, system, computer-readable medium and method for automatically recording or recommending content
EP2051509A1 (en) Program recommendation system, program view terminal, program view program, program view method, program recommendation server, program recommendation program, and program recommendation method
JP4491746B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びにプログラム
CN103052954A (zh) 推荐系统的基于简档内容检索
CN100385942C (zh) 建议机以及以其提供内容建议的方法
EP1430715B1 (en) Method and device for providing conditional access
US7640563B2 (en) Describing media content in terms of degrees
JP4501948B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP4161701B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP4547596B2 (ja) 情報処理装置および情報処理方法、並びにプログラム
JP4577562B2 (ja) 情報処理装置および情報処理方法、並びにプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091202

Termination date: 20211212

CF01 Termination of patent right due to non-payment of annual fee