WO2004054245A1 - 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム - Google Patents

情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム Download PDF

Info

Publication number
WO2004054245A1
WO2004054245A1 PCT/JP2003/015925 JP0315925W WO2004054245A1 WO 2004054245 A1 WO2004054245 A1 WO 2004054245A1 JP 0315925 W JP0315925 W JP 0315925W WO 2004054245 A1 WO2004054245 A1 WO 2004054245A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
user
vector
program
content
Prior art date
Application number
PCT/JP2003/015925
Other languages
English (en)
French (fr)
Inventor
Noriyuki Yamamoto
Mitsuhiro Miyazaki
Mari Saito
Hiroyuki Koike
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2002361276A external-priority patent/JP4161701B2/ja
Priority claimed from JP2002361275A external-priority patent/JP4003127B2/ja
Application filed by Sony Corporation filed Critical Sony Corporation
Priority to KR1020107017180A priority Critical patent/KR101084503B1/ko
Priority to US10/538,944 priority patent/US8359322B2/en
Priority to EP03778858A priority patent/EP1571835A4/en
Publication of WO2004054245A1 publication Critical patent/WO2004054245A1/ja
Priority to US13/715,347 priority patent/US20130179456A1/en
Priority to US14/617,531 priority patent/US9552413B2/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26283Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for associating distribution time parameters to content, e.g. to generate electronic program guide data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • H04N21/4325Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4661Deriving a combined profile for a plurality of end-users of the same client, e.g. for family members within a home
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors

Definitions

  • Information processing apparatus information processing method, information processing recording medium, and program
  • the present invention relates to an information processing apparatus and an information processing method, an information processing system, a recording medium, and a program.
  • a program such as a television broadcast or a radio broadcast, or streaming data
  • the present invention relates to an information processing apparatus and an information processing method, an information processing system, a recording medium, and a program that are suitable for use in recommending an automatic recording or a program.
  • program information program metadata
  • EPG electronic program guide
  • the method of recommending a program to a user differs depending on the method of acquiring user preference data. For example, an initial interest registration method in which information about a user's interests is initially registered, and a program is recommended based on the information, A viewing history use method that recommends programs using the history of programs that the user has watched in the past, or a collaborative filtering method that recommends programs using the viewing histories of other users is available. there were.
  • the user can enter, for example, a favorite program category (eg, drama, variety, etc.), a favorite genre (inference, comedy, etc.), or a favorite talent name.
  • a favorite program category eg, drama, variety, etc.
  • a favorite genre inference, comedy, etc.
  • a favorite talent name is obtained by matching with the program metadata using these information as keywords.
  • the viewing history use method each time a user views a program, When the set metadata is accumulated and, to some extent, historical metadata is accumulated, the metadata is analyzed to obtain information such as a favorite program category, a favorite genre, or a favorite talent name. . By using these information as keywords and performing matching with the program metadata, the program name to be recommended can be obtained.
  • a recording device using an HDD Hard Disk Drive
  • user operations such as recording reservation or recording are accumulated as history information, and may be used to acquire preference information.
  • the user may not be watching the program with particular interest, but may be watching the program because he / she has a television receiver or radio.
  • it is possible to discriminate some of the programs that have been consciously watched, and to obtain information that better reflects the user's preferences.
  • the viewing history of the first user is matched with the viewing histories of other users, so that the viewing history is similar to that of the first user.
  • searching for the second user and acquiring the history data of the viewing or operation the programs that the second user has watched and the programs that the first user has not watched are extracted and recommended. Is what you do.
  • an n-dimensional attribute vector is added to a broadcast program in advance as program attribute information, To compare the attribute vector with the selection vector generated based on the initial registration contents of the user and the average value of each attribute item of the attribute vector of the program that the user has played or scheduled to record.
  • a broadcast program is preliminarily applied with a program attribute vector, and the initial registration contents of the user and the user By comparing the selected vector generated based on the average value of each attribute item of the attribute vector of the program that has been played back or scheduled for recording with the attribute vector, Alternatively, when a program to be played is selected, since the operation history of the user is used, similarly, items that are likely to overlap as histories and items such as performers whose elements are likely to be spread as histories are similar. The weighting may be biased.
  • the present invention has been made in view of such a situation, and it is an object of the present invention to be able to select a program that matches a user's preference.
  • a first information processing apparatus comprises: an acquiring unit for acquiring information on a content; and an attribute information generating unit for generating attribute information composed of a plurality of items based on the information on the content acquired by the acquiring unit. And first storage means for storing first weight information corresponding to the item of attribute information generated by the attribute information generation means, wherein the first weight information is attribute information and preference information of a predetermined user. It is characterized in that the degree of contribution of each of a plurality of items in the calculation of the degree of similarity with is specified.
  • a transmission means for transmitting the attribute information generated by the attribute information generation means may be further provided.
  • the transmitting means extracts the first weighting information matching the condition of the content from the first weighting information stored in the first storage means, JP2003 / 015925
  • the information can be further transmitted in association with the attribute information generated by the generation unit.
  • the condition of the content can be a genre of the content.
  • the information on the content acquired by the acquiring means may further include an extracting means for extracting predetermined information.
  • the attribute information generating means may include a plurality of pieces of the predetermined information extracted by the extracting means. It can be vectorized for each item of, and attribute information can be generated.
  • the attribute information generating means can analyze the information described in the language among the information on the contents, and generate attribute information based on the analysis result.
  • a second storage unit that stores preference information of a predetermined user composed of a plurality of items; a preference information stored by the second storage unit; and attribute information generated by the attribute information generation unit.
  • a recommendation information generation unit that generates recommendation information indicating content that matches the user's preference.
  • the recommendation information generating means can generate the recommendation information by comparing the attribute information with the preference information using the first weighting information stored in the first storage means.
  • An operation history acquisition unit for acquiring a user operation history, a preference information generation unit for generating user preference information based on the operation history acquired by the operation history acquisition unit, and a preference information generation unit.
  • Weight information generating means for generating second weight information based on the preference information may be further provided.
  • the second weight information includes attribute information and user preference of a plurality of items. The degree of contribution at the time of calculating the degree of similarity with the information can be defined.
  • the recommendation information generating means uses the second weighting information generated by the weighting information generating means to generate the preference information. By comparing the attribute information with the attribute information, recommended information can be generated.
  • a first information processing method generates an attribute step including a plurality of items based on an acquisition step of acquiring information on content and information on the content acquired by the processing of the acquisition step.
  • a plurality of items in calculating the similarity between the attribute information and the preference information of a predetermined user based on the conditions of the content based on the information on the content acquired by the process of the attribute information generation step and the acquisition step.
  • the program recorded on the first recording medium of the present invention includes an acquisition step of acquiring information relating to content, and an attribute composed of a plurality of items based on the information relating to the content acquired by the processing of the acquisition step. Calculating the similarity between the attribute information and the preference information of a predetermined user based on the conditions of the content based on the attribute information generating step of generating the information and the information on the content acquired by the processing of the acquiring step.
  • the extraction step of extracting weighting information defining the degree of contribution of each of the plurality of items, the weighting information extracted by the processing of the extraction step, and the attribute information generated by the processing of the attribute information generation step. And an associating step.
  • a first program includes: an acquisition step for acquiring information on content; and an attribute information generation for generating attribute information composed of a plurality of items based on the information on content acquired by the processing of the acquisition step.
  • Information about the content is acquired, attribute information composed of a plurality of items is generated based on the acquired information about the content, and the attribute information is determined based on the condition about the content based on the information about the content.
  • the weighting information defining the degree of contribution of each of the plurality of items is associated with the attribute information.
  • a second information processing apparatus includes: an acquisition unit configured to acquire attribute information of a content including a plurality of items; a storage unit configured to store user preference information including a plurality of items; Calculating the similarity between the attribute information acquired by the acquisition unit and the user preference information stored in the storage unit using predetermined weighting information, thereby recommending the content that matches the user preference.
  • the information includes recommendation information generating means for generating information, and the weighting information is characterized in that it defines the degree of contribution of each of the plurality of items in calculating the similarity between the attribute information and the user preference information.
  • the obtaining means may further obtain the weight information together with the attribute information of the content, and the recommendation information generating means may compare the attribute information with the preference information using predetermined weight information. Thereby, recommendation information can be generated.
  • An operation history acquisition unit for acquiring a user operation history, a preference information generation unit for generating user preference information based on the operation history acquired by the operation history acquisition unit, and a preference information generation unit.
  • Weighting information generating means for generating weighting information based on the preference information may be further provided.
  • the recommendation information generating means includes a preference information using the weighting information generated by the weighting information generating means. By comparing the information with the attribute information, it is possible to generate the recommended information.
  • the weighting information may be information indicating the characteristic preference of the user with respect to the general preference in the attribute information of the content.
  • Weighting information is an attribute of the content attribute information that is important to the user.
  • the information may be information to be indicated.
  • the weighting information may be information indicating an item representing the content that the user prefers among the attribute information of the content.
  • the weighting information may be information indicating an item representing content that the user does not like among content attribute information.
  • Operation input means for receiving a user's operation input may be further provided, and the weighting information may be information set by the user's operation input input by the operation input means. .
  • a second information processing method is a method for calculating a similarity between content attribute information constituted by a plurality of items and preference information of a predetermined user constituted by the plurality of items.
  • An acquisition step of acquiring setting information relating to weighting information defining a degree of each contribution, and a similarity between attribute information and preference information are determined based on the setting information relating to the weighting information acquired by the processing of the acquiring step. It is characterized by including a calculation step of calculating, and a recommendation information generation step of generating recommendation information indicating content matching the user's preference using the calculation result of the processing of the calculation step.
  • the program recorded on the second recording medium of the present invention is used for calculating the similarity between the content attribute information composed of a plurality of items and the preference information of a predetermined user composed of a plurality of items.
  • a recommendation information generation step of generating recommendation information indicating content matching the user's preference using the calculation result of the calculation step.
  • a second program is a program for calculating the degree of similarity between attribute information of content composed of a plurality of items and preference information of a predetermined user composed of a plurality of items.
  • weighting information that defines the degree
  • the similarity between attribute information of a content composed of a plurality of items and preference information of a predetermined user composed of a plurality of items is calculated using weighting information that defines a degree of contribution of each of the plurality of items. Then, recommendation information indicating the content that matches the user's preference is generated.
  • An information processing system includes: a first information processing device that generates attribute information of content based on information related to content; and a user based on attribute information of content supplied from the first information processing device.
  • a second information processing device that executes a process of selecting content that matches the user's preference, the first information processing device comprising: a first obtaining unit that obtains information about content; and a first obtaining device that obtains information related to content.
  • Attribute information generating means for generating attribute information composed of a plurality of items based on information related to the content acquired by the means; and a first attribute corresponding to the attribute information items generated by the attribute information generating means.
  • First weighting means for storing weighting information, and first weighting information matching the content condition from the first weighting information stored in the first memory means. And transmitting means for transmitting the attribute information in association with the attribute information generated by the attribute information generating means, wherein the second information processing apparatus comprises: A second acquisition means for acquiring the weighting information of the first, second storage means for storing user preference information composed of a plurality of items, and attribute information acquired by the second acquisition means, The similarity to the user preference information stored in the second storage means is determined by determining at least one of the first weighting information and the second weighting information different from the first weighting information. And recommendation information generating means for generating recommendation information indicating content that matches the user's preference by calculating the first weighting information and the second weighting. 03 015925
  • the information is characterized in that the degree of contribution of each of a plurality of items in the calculation of the similarity between the attribute information and the user preference information is defined.
  • the first information processing device acquires information about the content, generates attribute information including a plurality of items based on the information about the content, and generates a first attribute corresponding to the item of the generated attribute information.
  • Weighting information is stored, first weighting information that matches a condition of the content is extracted from the first weighting information, and transmitted in association with the attribute information.
  • the attribute information and the first weighting information of the content composed of the items are obtained, and the preference information of the user composed of the plurality of items is stored, and the similarity between the attribute information and the user preference information is stored. Is calculated using at least one of the first weighting information and the second weighting information different from the first weighting information, and matches the user's preference.
  • Recommendation information indicating the content is generated. Further, the first weighting information and the second weighting information define the degree of contribution of each of the plurality of items in calculating the similarity between the attribute information and the user preference information.
  • a third information processing apparatus provides a general information processing apparatus based on acquisition means for acquiring content attribute information, first information indicating a user's preference, and second information indicating a general preference.
  • Bias information generating means for generating third information indicating the bias of the user's preference with respect to the general preference.
  • Each of the attribute information, the first information, and the third information can be composed of a plurality of items. Using the third information, the items of the attribute information and the first information are used. It is possible to further provide a selecting means for calculating a similarity for each of the items and selecting a content that matches the user's preference.
  • Each of the first information and the second information can be composed of a plurality of items, and the bias information generating means includes, as third information, the first information and the second information.
  • Information indicating an item having a low degree of similarity can be generated.
  • Operation history acquisition means for acquiring the operation history of the user; and preference information generation means for generating first information based on the operation history acquired by the operation history acquisition means.
  • the bias information generating means is configured to calculate, as first information, a first value obtained by counting, for each predetermined item, content that a user has previewed in a predetermined content group, and as a second information, a predetermined value. By calculating a second value obtained by counting all the contents of the content group for each predetermined item, and normalizing the first value with the second value, it is possible to generate third information. it can.
  • the predetermined content group may be a set of contents broadcast or distributed during a predetermined period.
  • the bias information generating means calculates a plurality of first values and a plurality of second values as a plurality of predetermined content groups, respectively, for a set of contents broadcast or distributed during a plurality of different periods. By normalizing the first value with the second value corresponding to the same content group, a plurality of pieces of third information can be generated.
  • the predetermined content group may be a set of contents broadcast or distributed in a predetermined time zone.
  • the first information may be information indicating an item representing the content that the user prefers among the attribute information of the content.
  • the first information may be information indicating an item representing content that the user does not like in the content attribute information.
  • a third information processing method includes a first obtaining step of obtaining first information indicating a user's preference, and a second obtaining step of obtaining second information indicating a general preference. Based on the first information obtained by the processing of the first obtaining step and the second information obtained by the processing of the second obtaining step, the bias of the user's preference with respect to the general preference. Bias information generating step of generating third information indicating the following.
  • the program recorded on the third recording medium of the present invention includes a first acquisition step of acquiring first information indicating a user's preference, and a second information indicating a general preference. General preference based on the second acquisition step to be acquired, the first information acquired by the processing of the first acquisition step, and the second information acquired by the processing of the second acquisition step. And a bias information generating step of generating third information indicating bias of the user's preference.
  • a third program includes: a first acquisition step of acquiring first information indicating a user's preference; a second acquisition step of acquiring second information indicating a general preference; Based on the first information acquired by the processing of the first acquisition step and the second information acquired by the processing of the second acquisition step, the bias of the user's preference with respect to the general preference is obtained. And a merchandise information generation step of generating third information indicating the following.
  • third information indicating the bias of the user's preference is generated.
  • FIG. 1 is a diagram illustrating television program broadcasting and distribution of stream data.
  • FIG. 2 is a block diagram showing the configuration of the distribution server of FIG.
  • FIG. 3 is a flowchart illustrating the program vector generation processing 1.
  • FIG. 4 is a diagram illustrating EPG data.
  • FIG. 5 is a diagram for explaining a program vector.
  • FIG. 6 is a flowchart illustrating the program vector generation processing 2.
  • FIG. 7 is a flowchart illustrating the grouping process 1.
  • FIG. 8 is a flowchart illustrating the grouping process 2.
  • FIG. 9 is a flowchart illustrating the title grouping process 1.
  • FIG. 10 is a flowchart illustrating the title grouping process 2.
  • FIG. 11 is a flowchart illustrating the title grouping process 3.
  • FIG. 12 is a flowchart illustrating the title grouping process 4.
  • FIG. 13 is a block diagram showing a configuration of the program recommendation processing device of FIG.
  • FIG. 14 is a flowchart illustrating the positive history vector and negative history vector generation processing 1.
  • FIG. 15 is a diagram for explaining the normal history vector.
  • FIG. 16 is a flowchart for explaining the positive history vector and negative history vector generation processing 2.
  • FIG. 17 is a flowchart illustrating the matching process 1.
  • FIG. 18 is a flowchart illustrating the matching process 2.
  • FIG. 19 is a flowchart illustrating the matching process 3.
  • FIG. 20 is a flowchart illustrating the matching process 4.
  • FIG. 21 is a flowchart illustrating the matching process 5.
  • FIG. 22 is a flowchart illustrating the user-side effect vector generation processing 1.
  • FIG. 23 is a flowchart illustrating the user-side effect vector generation processing 2.
  • FIG. 24 is a flowchart illustrating the user-side effect vector generation processing 3.
  • FIG. 25 is a flowchart illustrating the user-side effect vector generation processing 4.
  • FIG. 26 is a flowchart for explaining the reaction vector generation process 1 on the user side.
  • FIG. 27 is a flowchart for explaining the second reaction vector generation process on the user side.
  • FIG. 28 is a flowchart illustrating a matching process including group recommendation.
  • FIG. 29 is a flowchart illustrating a matching process using a user model.
  • FIG. 30 is a flowchart illustrating the exception recommendation process.
  • FIG. 31 is a block diagram illustrating a configuration of the television receiver in FIG. 1.
  • FIG. 32 is a block diagram illustrating a configuration of the television display device in FIG. 1.
  • FIG. 33 is a flowchart illustrating the recommendation information display process.
  • FIG. 34 is a flowchart illustrating the automatic channel setting process.
  • FIG. 35 is a block diagram showing a configuration of the recording / reproducing apparatus of FIG.
  • FIG. 36 is a flowchart illustrating the automatic recording process.
  • FIG. 37 is a block diagram illustrating a different configuration example of the distribution server.
  • FIG. 38 is a block diagram showing a different configuration example of the program recommendation processing device.
  • FIG. 39 is a diagram illustrating a different example of a network for television program broadcasting and stream data distribution.
  • FIG. 40 is a block diagram illustrating a different configuration example of the distribution server. BEST MODE FOR CARRYING OUT THE INVENTION
  • the broadcast station 1 transmits a terrestrial program broadcast or a satellite wave program broadcast via the satellite 2.
  • the antenna 3 of the television receiver 4 receives a terrestrial or satellite program broadcast.
  • the broadcast signal includes an EPG (Electronic Program Guide) as necessary.
  • the distribution server 5 reads the streaming data from the streaming data database 6 and distributes the streaming data to the television receiver 4 via a network 8 including the Internet and other networks, and a metadata data base 7 Reads EPG, which is information about programs broadcast from broadcast station 1, or metadata that includes more detailed information than EPG, and, for each program, A PP is generated and distributed to the EPG receiving device 9 via the network 8 together with the EPG data.
  • EPG Electronic Program Guide
  • the processing uses the same information as the EPG superimposed on the general broadcast signal. You may use it. If the amount of information of the EPG superimposed on the general broadcast signal is not enough information for the processing described below, the processing includes the EPG superimposed on the general broadcast signal. In addition, metadata may be used alone or independently.
  • information including metadata is used, and this information is referred to as EPG data. Shall be collectively referred to as
  • the EPG receiving device 9 supplies the distributed EPG data to the television receiving device 4. Further, the EPG receiving device 9 supplies the program recommendation processing device 10 with the program vector PP distributed together with the EPG data.
  • the television receiving device 4 having a tuner is connected to the television display device 11 having an operation unit or the control signal indicating the selection of a channel supplied from the recording / reproducing device 12 via the antenna 3 based on a control signal. It tunes to and receives terrestrial or satellite wave broadcast signals, and receives streaming data from the distribution server 5 via the network 8.
  • the television receiver 4 receives the supply of the EPG data from the EPG receiver 9 and supplies the EPG data to the television display device 11 or the recording / reproducing device 12. If the received broadcast wave contains an EPG, the television receiver 4 separates it from the program signal and supplies it to the television display device 11 or the recording / reproducing device 12, respectively. .
  • the program recommendation processing device 10 obtains the program vector PP from the EPG receiving device 9 and obtains the operation port from the television display device 11 and the recording / reproducing device 12. It generates recommendation information for recommending a program that matches the user's preference based on the information or the user's operation input, and supplies it to the television display device 11 and the recording / reproducing device 12.
  • the television display device 11 displays a broadcast signal supplied from the television receiving device 4 or a reproduced signal supplied from the recording / reproducing device 12 based on a user's operation input, and recommends a program. Based on the recommendation information supplied from the processing device 10, a channel is automatically set or recommended program information is displayed.
  • the television display device 11 supplies an operation log, which is a user's operation history, to the program recommendation processing device 10.
  • the recording / reproducing device 12 records the broadcast signal supplied from the television receiver 4 on an attached recording medium or a built-in recording medium (for example, a hard disk) based on a user's operation input. On the basis of the recommendation information supplied from the program recommendation processing device 10, the broadcast signal supplied from the television receiving device 4 is automatically recorded on a mounted recording medium or a built-in recording medium. Further, the recording / reproducing apparatus 12 reproduces a program recorded on a mounted recording medium or a built-in recording medium, and outputs the program to the television display apparatus 11 for display. Further, the recording / reproducing apparatus 12 supplies an operation log, which is a user's operation history, to the program recommendation processing apparatus 10.
  • a built-in recording medium for example, a hard disk
  • the EPG receiving device 9, the television receiving device 4, the program recommendation processing device 10, the television display device 11, and the recording / reproducing device 12 have been described as different devices, respectively. It doesn't have to be configured individually.
  • the EPG receiving device 9, the television receiving device 4, and the television display device 11 may be integrally configured as a television receiver 15-1 having a built-in tuner function.
  • the recording / reproducing apparatus 12 may be integrally configured to be configured as a television receiver 15-2 having a recording function.
  • the recording / reproducing apparatus 12 may be a so-called hard disk recorder having a large-capacity hard disk as a recording medium.
  • the program recommendation processing device 10 is incorporated in a television receiver 15-1 having a built-in tuner function, and may be used as a television receiver 15-3 or a television receiver having a recording function.
  • the television receiver 15-5-4 may be built in the 15-2.
  • FIG. 2 is a block diagram showing the configuration of the distribution server 5.
  • the data acquisition unit 21 acquires data from the metadata database 7 and the streaming data database 6, supplies the data to the data transmission unit 25, and supplies the EPG data to the metadata extraction unit 22.
  • the data acquisition unit 21 executes a process of grouping the EPG data registered in the metadata database 7 according to the content thereof.
  • the metadata extraction unit 22 extracts data necessary for generating the program vector PP from the EPG data supplied from the data acquisition unit 21, and supplies the data to the program vector generation unit 23.
  • the program vector generation unit 23 generates a program vector PP based on the metadata, and associates the program side effect vector Ef PP stored in the data storage unit 24 as necessary. Then, the data is supplied to the data transmission unit 25.
  • the data storage unit 24 stores the program side effect vector EfPP, which is information necessary for generating the program vector PP, as necessary.
  • the data transmission unit 25 receives the EPG data supplied from the data acquisition unit 21.
  • the streaming data and the program vector PP and the program side effect vector EfPP supplied from the program vector generation unit 23 are transmitted to the EPG receiving device 9 or the television receiving device via the network 8. Send to 4.
  • a drive 26 is connected to the program vector generation unit 23 as necessary.
  • a magnetic disk 31, an optical disk 32, a magneto-optical disk 33, and a semiconductor memory 34 are mounted on the drive 26 as necessary to exchange data.
  • step S 1 the data acquisition unit 21 receives supply of EPG data composed of metadata from the metadata database 7.
  • step S2 the metadata extraction unit 22 receives the supply of the EPG data from the data acquisition unit 21 and extracts the metadata required to generate the program vector PP. Output to 3.
  • Figure 4 shows an example of metadata.
  • the metadata includes, for example, the genre "Movie-I-Japanese", the movie title "Tokaido Mitani Kaidan", the date of the broadcast and the distributor, the date and time of the broadcast, the name of the broadcasting station to broadcast, and , Broadcast time, etc. are included.
  • the metadata includes data such as the director's name, screenwriter's name, photographer (photographer), music staff, and performers, and the contents of this program, such as movie descriptions.
  • step S3 the program vector generation unit 23 performs a morphological analysis on the title, contents, and the like included in the metadata as necessary, and decomposes the words into words. Specifically, the program vector generation unit 23 uses the title of the movie included in the metadata as a title and breaks it down into three words, “Tokaido”, “Mitani”, and “Kaidan”. In addition, as shown in Fig. 4, the program vector generation unit 23, as shown in Fig. 4 in the metadata, describes the Japanese movie “Mitsuya Kaidan,” which is famous for its “59 Shinseiho style beautiful beauty”.
  • step S4 the program vector generation unit 23 vectorizes each item included in the metadata, generates a program vector PP, and ends the processing.
  • the generated program vector PP is output to the data transmission unit 25 and transmitted to the EPG reception device 9 via the network 8. Items can be vectorized by arranging all detail elements as one column, or by separating them into large items, and then vectorizing each item.
  • Tm ⁇ title1, title2, ⁇ ⁇ ⁇ , Genre (Genre)
  • Gm ⁇ Drama, Variety, Sports, Film, Music, Children / Education, Education Z Documents, News / Reports, Others ⁇
  • Hour Hm ⁇ Morning, Lunch, Evening, Golden, Midnight ⁇
  • Broadcasting Station TV Station
  • Sm ⁇ NNK General, NNK Education, Asia TV, TTS, P J, Television, Toto, NNK Satellite 1, NNK Satellite 2, WOWO ⁇
  • Performer (Person) Pm ⁇ person A, person B, ⁇ person a, person b, ⁇ ⁇ ⁇ Content (Keyword) It is vectorized as Km2 ⁇ kwl, kw2, ⁇ ⁇ ⁇ .
  • broadcasting station S111 ⁇ NNK General, NNK Education, Asia Television, TT S, Buji, Tele Nichi, Toto, NNK Satellite 1, NNK Satellite 2, WOW O ⁇
  • Gm ⁇ drama, variety, sports, film, music, Z education for children, culture / documentation, news Z news, etc. ⁇
  • the frequency of words included in the vector, etc. is associated with the weight (numerical value).
  • “Tokaido-1” means that the frequency of the word “Tokaido” is "1".
  • the program side effect vector Ef PP indicating what elements are important for each genre is stored in the data storage section 24 as the program side effect vector information
  • the program side The effect vector EfPP may be transmitted in association with the program vector PP.
  • the program side effect vector EfPP is set corresponding to the major items of the program vector PP.
  • steps S11 to S14 processing similar to the processing in steps S1 to S4 described using FIG. 3 is performed. That is, EPG data is supplied from the metadata database 7, metadata required to generate the program vector PP is extracted from the EPG data, and the title, contents, etc. included in the metadata are extracted. Is morphologically analyzed as necessary, and decomposed into words. Then, each item included in the metadata is vectorized to generate a program vector PP.
  • step S16 the program vector generation unit 23 associates the effect vector EfPP extracted in step S15 with the program vector PP generated in step S14, and performs processing. Is terminated.
  • a program vector PP is generated, and the program side effect vector EfPP for weighting important items is associated with the program genre based on the genre of the program, and is associated via the network 8. Is transmitted to the EPG receiver 9.
  • the program vector PP is generated.For example, by grouping programs by their attributes, the program vector PP can be accurately created with a small amount of calculation. be able to.
  • Program grouping can be generated, for example, by serial drama, programs of the same genre in one-week units, or programs by performers in program units (13 weeks).
  • the grouping process 1 in the case of grouping serial drama will be described with reference to the flowchart of FIG.
  • step S31 the data acquisition unit 21 retrieves the EPG data registered in the metadata database 7 from the EPG data, for example, with the same title, the same broadcasting station, and the broadcast time at the same time on weekdays or the same Extract programs that meet a predetermined condition (condition for grouping) such as.
  • step S32 the data acquisition unit 21 groups the extracted programs and attaches a group ID to the EPG data of the corresponding program.
  • step S33 the metadata extraction unit 22 has the same group ID, that is, the metadata necessary for generating the program vector of the first broadcast of the program recognized as a serial drama. Is extracted.
  • step S35 the program vector generation section 33 fixes the program vector PP of the corresponding group ID to the program vector for the first broadcast, and the process ends. .
  • the serial drama is grouped, and the program vector is unified. Further, the group ID and the program vector PP may be stored in the data storage unit 24 in association with each other.
  • the content of the first time is a commentary on the entire program, but the content other than the first time is often a commentary on that episode, and represents the content of the entire program.
  • the metadata other than the content is almost the same every time, the number of program vector generation processes must be reduced by generating the program vector PP using the first EPG data. In addition to this, it is possible to more accurately generate a program vector PP that matches the program characteristics.
  • step S31 the process of adding the same ID to the EPG data of the serial drama has been described.However, if the EPG data includes information for distinguishing the serial drama in advance, the process of step S31 is performed. By omitting it, the same ID may be added to the EPG of the serial drama with reference to the information for identifying the serial drama included in the EPG data.
  • step S51 the data acquisition unit 21 refers to the EPG data registered in the metadata database 7 and adds a cluster code corresponding to the content of the metadata to the EPG data of the program.
  • the first cluster code of the smallest digit such as code 3 is determined. If it is not a serial drama, the first cluster code of the least significant digit is 0.
  • the data relating to the genre of the metadata registered in the metadata database 7 is referred to, and for each genre, for example, the second digit (1 0 A second cluster code having a numerical value in the () position is determined.
  • the second or lower digit (100) The third cluster code represented by using the above order is determined. Then, the total value of the first to third cluster codes becomes the cluster code added to the EPG of the program.
  • step S52 the data acquisition unit 21 determines whether or not the corresponding EPG is a serial drama based on whether or not the first digit of the cluster code is 0.
  • step S52 If it is determined in step S52 that the drama is a serial drama, in steps S53 and S54, the same processing as in steps S33 and S34 in FIG. 7 is performed. That is, the EPG of the first broadcast is extracted, and the program vector generation processing described with reference to FIG. 3 or FIG. 6 is executed.
  • step S55 the program vector generation unit 33 fixes the program vector PP of the serial drama to the program vector PP for the first broadcast, and sets the program vector PP as the program vector PP. Then, the generated cluster codes are set in association with each other, and the process is terminated. If it is determined in step S52 that it is not a serial drama, in step S56, the program vector generation processing described with reference to FIG. 3 or FIG. 6 is executed. In step S57, the program vector generation unit 33 associates the generated cluster code with the program vector PP, and the process ends.
  • the program vector PP is generated as described with reference to FIGS. 3 to 8, so that the program vector PP corresponding to a new term or genre is always generated. Can be generated.
  • the generated program vector PP is received by the EPG receiving device 9 via the network 8 together with the EPG data, and supplied to the thread and recommendation processing device 10.
  • the grouping process may be performed by morphologically analyzing the title, decomposing the title into words, and attaching a group ID to each word.
  • step S61 the data acquisition unit 21 refers to the EPG data registered in the metadata database 7, extracts a title from the registered metadata, and generates a program vector generation unit 2 Supply to 3.
  • step S62 the program vector generation unit 23 performs a morphological analysis on the title and breaks it down into words. Specifically, if the title of the movie included in the metadata is “Tokaido Mitani Kaidan”, this will be morphologically analyzed as a title, so “Tokaido”, “Miya”, and “Kaidan” You get three words.
  • step S63 the program vector generation unit 23 extracts one of the analyzed word or a group of words composed of a plurality of words, and extracts the word from the data storage unit 24. Then, a group ID corresponding to the extracted word or word group is extracted from.
  • a word group composed of a plurality of words is a word group generated by a combination of words obtained by morphological analysis. If the words are "Tokaido”, “Mitani”, and “Kaidan”, the words are “Tokaido ⁇ Mitani”, “Tokaido 'Kaidan”, and "Mitani'Kaidan”.
  • step S64 the program vector generation unit 23 determines whether the corresponding group ID has been extracted from the data storage unit 24.
  • step S65 the program vector generation unit 23 associates a new group ID with the extracted word or a word group including a plurality of words.
  • the program vector generation unit 23 causes the data storage unit 24 to store a word or a word group including a plurality of words and a corresponding group ID.
  • step S66 the program vector generation unit 23 sets the title to It is determined whether a group ID has been extracted for all the constituent words or a group of words composed of a plurality of words.
  • step S66 If it is determined in step S66 that the group ID has not been extracted for all words constituting the title or for a word group composed of a plurality of words, the process returns to step S63, and the process returns to step S63. Subsequent processing is repeated.
  • step S66 If it is determined in step S66 that all the words constituting the title or a group of words composed of a plurality of words has been extracted with a group ID, in step S67, the program vector generation unit 2 In step 3, the extracted group ID is associated with the program vector, and the process ends.
  • the words constituting the title or the group ID corresponding to the group of words are associated with the program vector, and the data transmitting unit 25 transmits the television receiving device via the network 8 via the network 8. 4 or transmitted to EPG receiver 9.
  • the title drama “Two Years A-Gumi Ginpachi-sensei” and the special program “Two-year A-Gumi Ginpachi-sensei Special” can be grouped into the same group.
  • the word match rate is calculated on a round-robin basis for a program title for a predetermined period, such as two weeks, one month, and six months, and the word match rate is
  • a title grouping process 2 for performing grouping based on the matching rate of words constituting a title will be described with reference to the flowchart of FIG.
  • step S401 and step S402 the same processing as step S61 and step S62 described with reference to FIG. 9 is executed. That is, the data acquisition unit 21 refers to the EPG data registered in the metadata database 7, extracts the title from the registered metadata, and supplies the title to the program vector generation unit 23. Then, the program vector generation unit 23 morphologically analyzes the title and breaks it down into words.
  • step S403 the program vector generation unit 23 calculates, based on the analyzed words, the degree of matching of words between titles, that is, the matching rate indicating the rate of matching of words. .
  • the title “Two Years A-Gumi Ginpachi-sensei” and the title “Two-year A-Gumi Ginpachi-sensei Special” are “2”, “Year”, “A j” “Gumi” and “Ginpachi”, respectively.
  • the matching rate of the words that make up the title of these two programs is , 6Z7 is 85.7%.
  • step S404 the program vector generation unit 23 determines whether or not the words match at least a predetermined value such as 70%.
  • a predetermined value such as 70%.
  • the threshold value of the matching rate may be any numerical value other than 70%.
  • Step S 4 0 word, if it is determined that they match a predetermined value or more, such as 70%, in step S 4 0 5, the program vector generating unit 2 3, its Assign the same group ID to these programs.
  • the program vector generation unit 23 stores the matched word or word group and the corresponding group ID in the data storage unit 24.
  • step S404 If it is determined in step S404 that the matching rate is equal to or less than a predetermined value such as 70%, or if the processing in step S405 ends, the program The vector generator 23 determines whether or not the brute force of the title has been completed.
  • step S 406 If it is determined in step S 406 that the brute force of the title has not been completed, the process returns to step S 403, and the subsequent processes are repeated. If it is determined in step S406 that the brute force of the title has been completed, the process is terminated.
  • the program vector is associated with the group ID based on the matching rate of words constituting the title, and the data transmission unit 25 transmits the television reception device via the network 8 to the television receiver. 4 or transmitted to the EPG receiving device 9, for example, programs of similar titles such as a serial drama and a special program can be processed as the same group.
  • a broadcast station for example, a broadcast station, a program genre, or a broadcast start time may be added to the grouping condition.
  • the title is composed of a small number of words including "news". Therefore, the processing described with reference to FIG.
  • the broadcast station matches in addition to the word match rate, it will be considered as the same group.
  • steps S421 to S424 the same processing as steps S401 to S404 described using FIG. 10 is performed. That is, the data acquisition unit 21 refers to the EPG data registered in the metadata database 7, extracts a title from the registered metadata, and supplies the title to the program vector generation unit 23.
  • the program vector generation unit 23 morphologically analyzes the title and decomposes the title into words. Then, the program vector generation unit 23 calculates the degree of matching between the words based on the analyzed words, and determines whether the words match at least a predetermined value such as 70%, for example. Judge.
  • step S424 If it is determined in step S424 that the words match at least a predetermined value such as 70%, in step S425, the program vector generation unit 23 executes It is determined whether the broadcasting stations match.
  • step S425 If it is determined in step S425 that the broadcasting stations of these programs match, in step S425, the program vector generation unit 23 assigns the same group ID to those programs. Correspond. Also, the program vector generation unit 23 stores the matched word or word group and the corresponding broadcasting station and group ID in the data storage unit 24.
  • step S424 If it is determined in step S424 that the match rate is equal to or less than a predetermined value such as 70%, if it is determined in step S425 that the broadcast stations of these programs do not match, Alternatively, after the processing in step S 426 is completed, in step S 427, the program vector generation unit 23 determines whether or not the round robin of the title has been completed.
  • a predetermined value such as 70%
  • step S 427 If it is determined in step S 427 that the brute force of the title has not been completed, the process returns to step S 423, and the subsequent processes are repeated. If it is determined in 4 27 that the brute force of the title has been completed, the processing is terminated.
  • the program vector is associated with the group ID based on the matching rate of the broadcast station and the matching rate of the words constituting the title, and the data transmitting unit 25 transmits the program ID via the network 8. Since the broadcast is transmitted to the television receiver 4 or the EPG receiver 9, for example, when programs having similar titles are in the same group, news programs of other stations are in the same group. Can be prevented.
  • the grouping is performed on the condition that the same broadcasting station is used in addition to the coincidence rate of the words constituting the title.
  • the grouping may be performed by setting the broadcast time zone, genre, and the like as conditions other than the matching rate of the words constituting the title.
  • the grouping is executed based on the matching rate of the words constituting the title, with the condition that the broadcast times match within a predetermined time range.
  • steps S444 to S444 the same processing as in steps S401 to S404 described with reference to FIG. 10 is executed. That is, the data acquisition unit 21 refers to the EPG data registered in the metadata database 7, extracts the title from the registered metadata, and supplies it to the program vector generation unit 23.
  • the program vector generation unit 23 morphologically analyzes the title and decomposes the title into words. Then, the program vector generation unit 23, based on the analyzed words, The degree of matching of words between the titles is calculated, and it is determined whether or not the words match at least a predetermined value such as 70%.
  • step S444 If it is determined in step S444 that the words match at least a predetermined value such as 70%, in step S445, the program vector generation unit 23 executes It is determined whether or not the broadcast start time of the program is coincident with a shift within a predetermined range such as one hour, for example.
  • step S446 determines The same group ID is associated with the program.
  • the program vector generation unit 23 stores the matched word or word group, the range of the corresponding broadcast start time, and the group ID in the data storage unit 24. If it is determined in step S444 that the matching rate is equal to or less than a predetermined value such as 70%, in step S444, the broadcast start times of those programs are shifted beyond a predetermined range. Is determined, or after the processing in step S446 is completed, in step S444, the program vector generation unit 23 determines whether or not the rounding of the title has been completed. I do.
  • step S444 If it is determined in step S444 that the brute force of the title has not been completed, the process returns to step S444, and the subsequent processes are repeated. If it is determined in step S447 that the brute force of the title has been completed, the processing is terminated.
  • the program vector is associated with a match including a deviation within a predetermined range of the broadcast start time and a group ID based on the match rate of words constituting the title, and the data transmission unit 25, the broadcast is transmitted to the television receiver 4 or the EPG receiver 9 via the network 8 so that, for example, when programs having similar titles are in the same group, the broadcast time of a special program or the like As a result, it is possible to prevent programs that should be detected as being in the same group from being detected as being in the same group. 3 015925
  • FIG. 13 is a block diagram showing a configuration of the program recommendation processing device 10.
  • the data acquisition unit 41 acquires the program side effect vector EfPP corresponding to the program vector PP transmitted from the distribution server 5 and the program number PP.
  • the program vector extraction unit 42 converts the program vector PP acquired by the data acquisition unit 41 from the program vector PP required for matching processing or the program vector PP required for user model generation. Is extracted, and if necessary, supplied to the matching processing unit 43 together with the program side effect vector EfPP corresponding to the program vector PP.
  • the operation input unit 44 includes input devices such as a keyboard, a touchpad, and a mouse, and receives input of initial registration information input by a user and a topic for generating a user model.
  • Output to The initial registration storage unit 45 registers the initial registration contents supplied from the operation input unit 44 and topics for generating a user model, and, if necessary, the operation log acquisition unit 46 or a matching process. Supply to part 43. Further, the contents stored in the initial registration storage unit 45 are sequentially updated based on a user operation input from the operation input unit 44.
  • the information that is initially registered includes, for example, information indicating programs that the user does not like, such as disliked genres, disliked keywords, disliked performers, favorite genres, favorite keywords, favorite performers, etc. There is information indicating programs that the user prefers.
  • the operation port acquisition unit 46 acquires operation logs from the television display device 11 or the recording / reproducing device 12, classifies the information into positive history and negative history, and performs initial registration as necessary. Referring to the information stored in the storage unit 45, the program vector PP corresponding to the positive history and the negative history is read out of the program vector PP acquired by the data acquisition unit 41, and is read. 4 7 and the negative history storage section 4 8 are supplied and stored.
  • the regular history storage unit 47 stores the supplied regular history and generates a regular history vector UP.
  • the negative history storage unit 48 stores the supplied negative history and generates a negative history vector MUP. The generated positive history vector UP and negative history vector MUP are supplied to the matching processing unit 43.
  • the correct history means that the user actively tries to watch, in other words, This information is used to extract program candidates that are considered to be appropriate.
  • This information is used to extract program candidates that are considered to be appropriate.
  • the metadata of the program is stored in the positive history storage unit 47 as good impression metadata.
  • the main history storage unit 47 obtains the total of the main history for each detailed item or for each major item, and generates the main history vector UP.
  • negative histories are information used to exclude programs that users are reluctant to watch, in other words, programs that they do not like from recommended programs. Items that were disliked, programs that were deleted without being viewed after recording, or programs that were proposed to the user as a recommended program list by the processing described below were not accepted by the user, and were not viewed or recorded.
  • the negative history storage unit 48 calculates the total of the negative histories for each detailed item or for each major item, and generates a negative history vector MUP.
  • the matching processing unit 43 includes the program vector extracted from the program vector extraction unit 42 and the positive history vector UP supplied from the positive history storage unit 47 or the negative history storage unit 48, or Negative history vector Verify matching with MUP.
  • the matching processing unit PP positive history vector UP, or negative history vector MUP is vectorized by arranging all the detailed elements in a single line, the title, keyword, etc. will consist of multiple words. Therefore, one word and an item such as a genre have the same weight in the vector. Therefore, the matching processing unit
  • the vector computing unit 62 executes a matching process between the program vector PP and the positive history vector UP or the negative history vector MUP.
  • the vector calculation unit 62 is used when the program vector PP, the positive history vector UP, and the negative history vector MUP are represented by a vector in which all the elements of the detailed items are arranged in one row.
  • the program vector PP and the positive history vector are obtained as shown in the following equation (1).
  • the similarity SimUP with the UP is calculated, and the similarity SimMUP between the program vector PP and the negative history vector MUP is calculated as shown in equation (2).
  • the cosine distance is a value obtained by dividing the inner product of two vectors by the product of the absolute values of each vector, as shown in Equations (1) and (2).
  • PP indicates the program vector PP
  • UP indicates the positive history vector UP
  • MUP indicates the negative history vector MUP.
  • “ ⁇ ” Indicates dot product and "X” indicates element multiplication (scalar operation).
  • the vector arithmetic unit 62 sets the program vector for each major item.
  • the similarity between the program PP and the negative history vector MUP is calculated for the similarity between the program PP and the positive history vector MUP, and the sum of the similarity is calculated for each major item. Similarity SimMUP can be calculated.
  • the positive history vector UP is the title Tup ⁇ school—1, ghost story 1, toilet—1 ⁇
  • a positive history vector UP ⁇ title Tup, Jan Gup, cast Pup, script Z original / directed Aup, content (keyword) Kup ⁇ and negative history vector MUP
  • Negative history vector MUP ⁇ Title Tonore Tmup, Genre Gmup, Performer Pinup, Screenplay Z Original / Direction Atnup, Content (Keyword) Kmup ⁇
  • cos 0 t is the cosine distance between the program vector PP and the regular history vector UP or the negative history vector MUP in the major item “Title”
  • cos e ⁇ is the major item “ in the genre "
  • the program vector PP is a cosine distance between the positive history vector UP or the negative history vector MUP
  • co S S p is, that put the large item” performer "
  • positive history is a cosine distance between the vector UP or the negative history base-vector MUP
  • COS 0 a is, in large item "screenwriter / original Z demonstration”
  • Cos 0 k is the cosine distance between the program vector PP and the positive history vector UP or the negative history vector MUP in the major item “content”.
  • the normalization processing by the normalization processing unit 61 need not be performed.
  • the frequency tends to accumulate, for example, compared to items such as broadcasting stations and genres. In comparison, for items such as titles and contents, as the history increases, the number of words increases, but the frequency of each word is unlikely to increase.
  • the vector calculation unit 62 stores the user's initial registration information stored in the initial registration storage unit 45, the program side effect vector EfPP transmitted in association with the program vector PP, or Weighting is performed by the user side effect vector EfUP (described later) or the user side effect vector EfMUP (described later) generated and registered in the information registration unit 63, and the similarity SimUP and similarity are calculated. SitnMUP can also be calculated.
  • the vector computing unit 62 calculates, for example, a predetermined number of high-order programs (for example, 10) having a high similarity with the positive history vector, Further, the similarity SimMUP with the history vector MUP is obtained, and SimUP—SimMUP is calculated, and a predetermined number (for example, 3) of programs having higher calculation results are output to the recommended information output unit 49 as recommended programs.
  • a predetermined number of high-order programs for example, 10
  • SimMUP with the history vector MUP is obtained, and SimUP—SimMUP is calculated, and a predetermined number (for example, 3) of programs having higher calculation results are output to the recommended information output unit 49 as recommended programs.
  • the vector calculation unit 62 registers the recommended priority group in the user information registration unit 63 based on the information of the recommended program.
  • the program corresponding to the recommendation priority group is recommended with priority.
  • the vector operation unit 62 generates a user model vector by filtering the program vector PP using the topics stored in the initial registration storage unit 45, and generates the user information registration unit 63 Can be registered to perform the matching process. Details of the user model will be described later.
  • the user information registration unit 63 stores the initial registration contents of the user supplied from the initial registration storage unit 45, or the positive history vector UP or the positive history vector supplied from the positive history storage unit 47 or the negative history storage unit 48. Based on the negative history vector MUP, the user side effect vector EfUP and the counter effect vector E deposit UP are generated and stored.
  • the user side effect vector EfUP is a beta vector that indicates to the user which of the major items is important for program selection and is the item that is weighted for program selection. Alternatively, it is a vector indicating the user's preference in each item.
  • the reaction vector EfMUP is a vector that indicates to the user which of the major items are insignificant for program selection and are not weighted for program selection. , Or, for each item, a vector indicating items that the user does not like.
  • the user-side effect vector EfUP and the counter-effect vector EfMUP are larger in the matching between the program vector PP and the positive history vector UP or negative history vector MUP. This defines whether or not to contribute.
  • the user-side effect vector EfUP and the counter-effect vector EfMUP may be set by the user or may use a predetermined value, but are registered in the initial registration storage unit 45. It may be generated based on the initial registration contents of the user.
  • the program vector PP Tol T tn, Genre Gm, Time Zone Hm, Broadcasting Station Sm, Performer Pm, Script / Original Z Direction Am, Content Km ⁇
  • the genre is important to the user.
  • the effect vector is set to EfUP2 (1, 5, 1, 1, 1, 1, 1, 1, 1).
  • the effect vector EfUP (1, 3, 1, 1, 5, 5, 1, 1) is set.
  • the user-side effect vector EfUP and the counter-effect vector EfMUP are generated based on the positive history vector UP or the negative history vector MUP, or by counting programs watched by the user in a certain period of time. It may be done. Further, the user-side effect vector EfUP and the counter-effect vector EfMUP can be generated for each genre. A method for generating the user-side effect vector EfUP or the counter-effect vector EfMUP will be described later with reference to FIGS.
  • the user information registration unit 63 registers information of the recommended priority group, a user model vector, and the like generated by the process of the vector calculation unit 62 as necessary.
  • programs that are highly similar to the positive history vector UP are used to select programs that the user does not like using the negative history. Even without performing the process of removing (programs that the user is reluctant to watch), for example, it is possible to determine a recommended program using only the normal history.
  • the recommended information output unit 49 registers the recommended program information supplied from the matching processing unit 43 in the recommended program list 50, and also registers the information in the television display device 11 or the recording / reproducing device 12.
  • the recommended program list 50 is configured to be detachable from the program recommendation processing device 10, and the recommendation output from the recommended program output unit 49. Register program information.
  • the matching processing section 43 is connected to the drive 51 as necessary.
  • a magnetic disk 71, an optical disk 72, a magneto-optical disk 73, and a semiconductor memory 74 are mounted on the drive 51 as necessary to exchange data.
  • step S71 the operation log acquisition unit 46 supplies the initial registration content read from the initial registration storage unit 45 to the negative history storage unit 48.
  • the negative history storage unit 48 generates a negative history vector MUP by referring to the supplied initial registration contents.
  • step S72 the operation log acquisition unit 46 determines whether the initial registration contents have been changed based on the registration contents stored in the initial registration storage unit 45. If it is determined in step S72 that the initial registration contents have been changed, the processing proceeds to step S72.
  • step S73 the operation log acquisition unit 46 transmits the operation log from the television display device 11 or the recording / reproducing device 12 It is determined whether or not is supplied. If it is determined in step S73 that the operation log has not been supplied, the process returns to step S72, and the subsequent processes are repeated.
  • step S74 the operation port acquisition unit 46 determines whether or not the supplied operation port has a correct history. . For example, if the operation log is a recording operation, the program vector PP of the program corresponding to the operation is a normal history, and if the operation log is erasure of recorded data that is not being played, the operation log corresponds to the operation. The program vector PP of the program has a negative history. It becomes.
  • step S74 if the supplied operation log is determined to be the correct history, in step S75, the operation log acquisition unit 46 responds to the operation log determined to be the correct history
  • the program vector pp to be extracted is extracted from the data acquisition unit 41 and supplied to the main history storage unit 47.
  • the main history storage unit 47 additionally stores the supplied program vector PP as a main history.
  • step S76 the main history storage unit 47 calculates the total of the main history program vectors PP for each detailed item or for each major item, and generates the main history vector UP. I do. After the end of the process in the step S76, the process returns to the step S72, and the subsequent processes are repeated.
  • step S 7 4 supplied operation log is when it is determined not to be a positive history, supplied operation log is because it is a negative history, in step S 7 7, operation hole grayed acquisition unit 4-6
  • the program vector PP corresponding to the operation port determined to be a negative history is extracted from the data acquisition unit 41 and supplied to the negative history storage unit 48.
  • the negative history storage unit 48 additionally stores the supplied program vector PP as a negative history.
  • step S78 the negative history storage unit 48 calculates the total sum of the negative history program vector PP for each detailed item or for each major item, and generates a negative history vector MUP. I do. After the end of the process in step S78, the process returns to step S72, and the subsequent processes are repeated.
  • History history vector / up a numerical value indicating the vector sum is described after each detailed item. For example, as shown in Fig.
  • the major items of the positive history vector UP are the title, genre, performer, script / original Z production, and content (keyword). Although the number of items is described as being smaller than that of the program vector PP described using, it is needless to say that the same large items as the program vector PP may be used.
  • the negative history vector MUP is generated before the operation log is input, based on the contents of the initial registration. May be registered so that the normal history vector UP is generated before the operation log is input.
  • the positive history vector UP or the negative history vector MUP is generated using only the operation log without generating the positive history vector UP or the negative history vector MUP based on the initial registration. As described above, by independently generating and retaining the positive history vector UP and the negative history vector MUP, it is possible to more accurately perform the matching process with the user's preference. it can.
  • the positive history and the negative history may be determined more precisely.
  • the positive history vector UP and the negative history vector are calculated using the sum of the program vectors PP corresponding to the positive history and the negative history in all items.
  • the total of the program vectors PP corresponding to the positive history and the negative history is accumulated, for example, by genre, and the positive history vector UP and the negative history vector MUP are generated for each genre. You may do it.
  • performer B who frequently appears in dramas even though he is not a favorite actor, has a higher score in the regular history vector UP than comedian A, who rarely plays in dramas. It may go wrong.
  • a documentary in which performer B who frequently appears in a drama will be recommended, rather than a variety in which comedian A appears.
  • the positive history and the negative history are accumulated for each genre, and based on this, the positive history vector UP and the negative history vector MUP may be generated for each genre.
  • a history vector UP and a negative history vector MUP may be generated.
  • the matching processing unit 43 verifies the matching between the positive history vector UP and the negative history vector MUP generated in this way and the supplied program vector PP, thereby enabling the user to check the matching. It is possible to generate recommended program information that correctly reflects preferences.
  • steps S81 to S84 the same processing as in steps S71 to S74 in FIG. 14 is performed. That is, a negative history vector MUP is generated by referring to the initial registration, and it is determined whether or not the initial registration content has been changed.If the content has not been changed, whether the supplied operation log has the correct history It is determined whether or not.
  • step S85 the operation log acquisition unit 46 responds to the operation log determined to be the correct history
  • the program vector PP is extracted from the data acquisition unit 41 and supplied to the main history storage unit 47.
  • the main history storage unit 47 extracts the genre of the supplied program vector PP.
  • step S86 the main history storage unit 47 additionally stores the program vector PP extracted from the data acquisition unit 41 as a main history for each genre.
  • step S87 the main history storage unit 47 stores, for each detailed item or for each major item, the program vector of the main history in the genre in which the program vector is additionally stored. Then, a positive history vector UP of the corresponding genre is generated. After the processing in step S87 is completed, the processing returns to step S82, and the subsequent processing is repeated.
  • step S84 If it is determined in step S84 that the supplied operation log is not a positive history, the supplied operation log is a negative history. Then, the program vector PP corresponding to the operation log determined to be “1” is extracted from the data acquisition unit 41 and supplied to the negative history storage unit 48. The negative history storage unit 48 extracts the genre of the supplied program vector PP.
  • step S89 the negative history storage unit 48 additionally stores the program vector PP extracted from the data acquisition unit 41 for each genre as a negative history.
  • step S90 the negative history storage unit 48 stores the negative history program vector PP vector in the genre in which the program vector is additionally stored for each detailed item or for each major item. And calculate the negative history vector MUP of the corresponding genre. Generate. After the processing in step S90 ends, the processing returns to step S82, and the subsequent processing is repeated.
  • a positive history vector UP and a negative history vector MUP are generated for each genre, so that the user's preferences can be reflected more precisely without dulling the user's preferences. It is possible to generate recommended program information that accurately reflects user preferences.
  • the program vector PP, positive history vector UP, and negative history vector MUP are represented by a vector in which all the elements of the detailed items are arranged in one line.
  • the matching process 1 in this case will be described.
  • step S101 the program vector extraction unit 42 extracts the program vector PP of a plurality of programs (for example, a program broadcasted in a predetermined time zone) from the data acquisition unit 41, and executes a matching processing unit. 4 It is supplied to the normalization processing section 61 of 3.
  • the normalization processing unit 61 determines the supplied program vector PP and the components and components of the regular history vector UP read out from the regular history storage unit 47 for the titles and contents composed of words. Normalization is performed, and the normalized result is supplied to the vector calculation unit 62.
  • step S102 the vector operation unit 62 of the matching processing unit 43 uses the above-described equation (1) to calculate the cosine distance between the program vector PP of a plurality of programs and the positive history vector UP. Calculate a certain similarity SimUP.
  • step S103 the vector calculation unit 62 compares the similarity SiraUP indicating the similarity between the program vector PP and the positive history vector UP calculated in step S102, and sets the similarity. For example, a predetermined number of program vectors PP such as 10 is extracted from the highest degree.
  • step S104 the vector operation unit 62 determines in step S103.
  • the similarity SimMUP which is the cosine distance between the extracted program vector PP and the negative history vector MUP read from the negative history storage unit 48, is calculated by using the above-described equation (2).
  • step S105 the vector operation unit 62 calculates the similarity with the positive history vector UP (that is, the cosine distance) SiraMUP—the similarity with the negative history vector (that is, the cosine distance) SimMUP Then, a predetermined number (for example, one) of program vectors or EPG data which are higher ranks are extracted as recommendation information, output to the recommendation information output unit 49, and are output to the recommendation program list 50. In addition to the registration, the information is output to the television display device 11 and the recording / reproducing device 12, and the processing is terminated.
  • a predetermined number for example, one
  • the program vector PP, the positive history vector UP, and the negative history vector MUP are represented by a vector in which all the elements of the detailed items are arranged in one column. Based on the similarity between the vector PP and the positive history vector UP and the similarity between the program vector PP and the negative history vector, it is possible to determine a recommended program that matches the user's preference. .
  • the cosine distance is calculated for each large item, and the sum is used as the similarity SimUP and similarity SitnMUP.
  • the matching process 2 in which a recommended program is determined by calculation, will be described.
  • step S111 the program vector extraction unit 42 extracts a program vector PP of a plurality of programs (for example, a program broadcast in a predetermined time zone) from the data acquisition unit 41, and performs a matching process. It is supplied to the vector operation unit 62 of the unit 43. The vector operation unit 62, for each of the major items of the supplied program vector PP and the positive history UP read out from the main history storage unit 47, performs the Calculate the cosine distance.
  • a program vector PP of a plurality of programs for example, a program broadcast in a predetermined time zone
  • step S112 the solid-state calculation unit 62 sums the values of the cosine distances calculated for each item in step S111 using the above equation (4), and calculates the similarity SiraUP. calculate.
  • step SI 13 the vector operation unit 62 compares the similarity SimUP between the program vector PP and the positive history vector UP calculated in step S 112, and For example, a predetermined number of program vectors PP such as 10 is extracted.
  • step S114 the vector computing unit 62 stores the program vector PP extracted by the processing in step S113 and the negative history vector MUP read from the negative history storage unit 48, respectively. Calculate the cosine distance between the program vector PP and the negative history vector MUP for the major items of.
  • step S115 the vector computing unit 62 sums the values of the cosine distance calculated for each item in step S114 using the above-described equation (4), and calculates the similarity SimMUP. calculate.
  • step S116 the vector calculation unit 62 generates ⁇ similarity SimUP, which is the cosine distance between the program vector PP and the regular history vector UP ⁇ — ⁇ program vector PP and the negative history vector
  • the similarity SimMUP ⁇ which is the cosine distance of the program, is calculated, and the program vector PP or EPG data of a predetermined number (for example, three) of the higher-ranked programs is extracted as recommendation information.
  • the program is output and registered in the recommended program list 50, and is also output to the television display device 11 and the recording / reproducing device 12, thereby completing the process.
  • the sum of the calculation results is calculated as the similarity SimUP and the similarity SimMUP for each large item without normalizing the item indicated by the word, so that the detailed elements belonging to different large items Based on the similarity between the program vector PP and the positive history vector UP and the similarity between the program vector PP and the negative history vector MUP without being affected by the bias of the history overlap, It becomes possible to determine recommended programs that match the taste.
  • the matching process may be performed by using the above-mentioned program side effect vector EfPP, user side effect vector EfUP, or user side counter effect vector EfMUP. Whether or not to use the program side effect vector EfPP, the user side effect vector EfUP, or the user side effect vector EfMUP may be set by the user.
  • a program vector PP a positive history vector UP and a negative history vector MUP power S, and a solid line in which all elements of detailed items are arranged in one row.
  • a description will be given of a matching process 3 in which a matching process is performed using the program side effect vector EfPP or the user side effect vector EfUP depending on the user setting when the program is expressed in terms of the user's setting.
  • step S121 the vector operation unit 62 receives the program effect vector EfPP and the user effect input by the user using the operation input unit 44 and registered in the initial registration storage unit 45. Acquires the usage setting contents of the vector EfUP or the user side reaction vector EfMUP.
  • the effect vector usage setting information is information indicating whether to use the program side effect vector EfPP, the user side effect vector EfUP, or the user side effect vector EfMUP to perform weighting in the matching process. is there.
  • step S122 the vector calculation unit 62 reads the user side effect vector EfUP from the user information registration unit 63 as necessary, and uses the following equation (5) to program the program. Calculate the cosine distance between the vector PP and the normal history vector UP, and use it as the similarity SimUP. epd 1 'eud r p 1 ' u 1 + epd 2 'eud 2 ' p 2 'u 2 + ..,
  • SI mUP I nn II.
  • the user side effect vector EfUP may be set by the user, may be set based on the initial settings of the user, or may be generated in the user information registration unit 63. There may be. The details of the generation of the user side effect vector EfUP will be described later with reference to FIGS.
  • step S123 the vector calculation unit 62 compares the similarity SimUP between the program vector PP and the normal history vector UP calculated in step S122, and determines the highest similarity. For example, a predetermined number of program vectors PP such as 10 are extracted.
  • step S124 the vector calculation unit 62 reads the user side reaction vector EfMUP from the user information registration unit 63 as necessary, and uses the following equation (6) to execute step S1. 1 Calculate the cosine distance between the program vector PP extracted in 23 and the negative history vector no MUP.
  • the user side reaction vector EfMUP may be set by the user, may be set based on the user's initial settings, or may be generated by the user information registration unit 63. It may be. Details of the generation of the user side reaction vector EfMUP will be described later with reference to FIG. 26 or FIG.
  • step S125 the vector operation unit 62 determines the similarity between the program vector PP and the positive history vector UP SimUP—the similarity between the program vector PP and the negative history vector
  • SimMUP is calculated, and program vectors PP or EPG data of a predetermined number (for example, three) of higher-order programs are extracted as recommendation information, output to the recommendation information output unit 49, and a recommended program list 50 Is output to the television display device 11 and the recording / reproducing device 12, and the process is terminated.
  • the recommendation information is extracted by using the program side effect vector EfPP, the user side effect vector EfUP, or the user side effect vector EfMUP according to the setting, and the user's preference is extracted. Can be recommended.
  • the program vector PP, positive history vector UP, and negative history vector MUP are represented by a vector in which all the elements of the detailed items are arranged in one line.
  • the program vector PP, the positive history vector UP, and the negative history vector MUP may be calculated for each major item.
  • the program effect vector EfPP, the user effect vector EfUP, or the user countereffect vector EUP can be reflected for each major item.
  • the matching process 4 will be described.
  • step S131 the same processing as in step S121 of FIG. 19 is executed. Then, the usage setting contents of the effect vector are acquired.
  • step S 1 32 the vector calculation unit 62 determines the program vector for each of the supplied program vector PP and the main history vector UP read from the main history storage unit 47. Calculate the cosine distance between PP and the positive history vector UP. Here, the effect vector is not used for the calculation.
  • step S133 the vector calculation unit 62 multiplies the cosine distance calculated for each item by the effect vector as necessary using the following equation (7), and obtains the obtained value. And calculate the similarity SimUP.
  • step S134 the vector calculation unit 62 compares the similarity SimUP between the program vector PP and the normal history vector UP calculated in step S133, and determines the highest similarity. For example, a predetermined number of program vectors PP such as 10, for example, is extracted.
  • step S135 the vector calculation unit 62 determines the size of each of the program vector PP extracted by the process in step S134 and the negative history vector MUP read from the negative history storage unit 48. For the item, calculate the cosine distance between the program vector PP and the negative history vector MUP.
  • the effect vector is not used in the calculation.
  • step S136 the vector computing unit 62 uses the following equation (8) to calculate Multiply the cosine distance calculated for each item by the effect vector as necessary, and sum the obtained values to calculate the similarity SimMUP.
  • SimMUP epd-j- * erad + 'cos ⁇ m t + epd CT ' erad g * cos ⁇ nig + epd n * emd p 'cos ⁇ ra p
  • Equation (8) describes that both the program side effect vector EfPP and the user side effect vector EfMUP are used, but depending on the settings, the program side effect vector EfPP and the user side effect vector EfMUP are used. If any of the reaction vectors EfMUP are not used, they are calculated by substituting the value “1” for the unused vector.
  • step S 1 37 the vector calculation unit 62 sets ⁇ similarity SimUP, which is the cosine distance between the program vector PP and the regular history vector UP ⁇ — ⁇ the program vector PP and the negative history vector
  • the similarity SimMUP ⁇ which is the cosine distance from the program, is calculated, and the program vector PP or EPG data of a predetermined number (for example, three) of the higher rank programs is extracted as recommendation information, and the recommendation information output unit 4 9 and registered in the recommended program list 50, and output to the television display device 11 and the recording / reproducing device 12 to complete the processing.
  • the weighting is performed using the effect vector for each large item, so that it is possible to generate recommendation information that matches the user's preferences in detail.
  • step S141 the same processing as in step S121 of FIG. 19 is executed, and the usage setting contents of the effect vector are acquired.
  • step S142 the vector operation unit 62 extracts the genre of the supplied program vector PP.
  • the genre of the supplied program vector PP is “drama”.
  • step S 1 43 the vector calculation section 62 sets the supplied program vector PP and the main items of the main history beta UP read out from the main history storage section 47 and corresponding to the genre “drama”. For, calculate the cosine distance between the program vector PP and the normal history vector UP. Here, the effect vector is not used in the calculation.
  • step S144 the vector operation unit 62 uses the following equation (9) to add the user-side effect vector corresponding to the genre “drama” to the cosine distance calculated for each item, if necessary. , And sum the obtained values to calculate the similarity SimUP.
  • Equation (9) describes that both the program side effect vector EfPP and the user side effect vector EfUP are used. However, depending on the setting, the program side effect vector EfPP is used. If any of the user-side effect vectors EfUP is not used, the numerical value “1” is substituted for the unused vector and calculated.
  • the vector calculation unit 62 compares the similarity SimUP between the program vector PP and the positive history vector UP calculated in step S143, and determines the highest similarity. For example, a predetermined number of program vectors PP such as 10, for example, are extracted.
  • step S146 the vector calculation unit 62 determines whether the program vector PP extracted by the processing in step S145 and the negative history corresponding to the genre "drama" read from the negative history storage unit 48 are stored. For each major item in the vector MUP, the cosine distance between the program vector PP and the negative history vector MUP is calculated. Here, the effect vector is not used in the calculation.
  • step S147 the betattle operation unit 62 uses the following equation (10) to add the cosine distance calculated for each item to the genre “drama” as necessary. Multiply the vectors and sum the obtained values to calculate the similarity SimMUP.
  • step S148 the vector calculation unit 62 calculates ⁇ similarity SimUP, which is the cosine distance between the program vector PP and the correct history vector UP ⁇ — ⁇ the program vector PP and the negative history vector, Is the cosine distance of SimMUP ⁇ .
  • the program vector PP or EPG data of a predetermined number (for example, three) of programs are extracted as recommendation information, output to the recommendation information output section 49, and registered in the recommendation program list 50, and the television The data is output to the display device 11 and the recording / reproducing device 12, and the processing is terminated.
  • the cosine distance between the positive history vector UP and negative history vector MUP and the program vector PP for each genre is obtained for each major item, and the effect vector corresponding to the genre is used. Since the similarity is calculated by performing weighting, it is possible to generate recommendation information that matches the user's preference in detail.
  • the user side effect vector EfUP and the counter effect vector EfMUP are generated based on the user's initial registration contents registered in the initial registration storage unit 45.
  • the positive history vector UP or the negative history vector MUP, or the user-specific effect vector EfUP and countereffect vector E can be calculated by counting the programs watched by the user during a certain period of time. UP may be generated.
  • step S151 the user information registration unit 63 of the matching processing unit 43 selects one of the unprocessed large items.
  • the user information registration unit 63 refers to the main history stored in the main history storage unit 47, and, for example, during a certain period such as one week, one month, or three months.
  • the program vector extraction unit 42 detects the program watched by the user, and causes the program vector extraction unit 42 to extract the program vector PP corresponding to the program watched by the user during a certain period from the data acquisition unit 41. 5 Count the number of programs for each detailed item included in the large item selected in 1.
  • step S153 the user information registration unit 63 causes the program vector extraction unit 42 to extract from the data acquisition unit 41 program vectors PP corresponding to all programs in the same period. The number of programs is counted for each detailed item included in the large item selected in S151.
  • the user information registration unit 63 calculates the count of the user's viewing performance / the count of all programs based on the count results of steps S152 and S153. .
  • the programming is considered to reflect the tastes of the public due to the influence of audience rating competition.
  • the calculation of the count number of the user's viewing results and the count number of all programs are, in other words, synonymous with normalizing the count number of the user's viewing results by the force number of all programs as a standard model. is there.
  • the normalization vector calculated in step S154 is referred to as a normalization vector D.
  • the count of all programs in a week is (8, 12 3, 7, 6, 4, 2, 8, 10) Yes, if the count of programs viewed by the user is (4, 0, 1, 2, 3, 4, 5, 5, 2), the normalized vector D is as follows: .
  • step S155 the user information registration unit 63 generates an effect vector of the corresponding large item based on the calculation result of step S155.
  • Gm ⁇ Drama, Variety, Sports, Movie, Music, Z Education for Children, Liberal Arts / Documents, News Z News, etc. ⁇
  • the standard value may be set to 0.2. Since the effective turtle of the large item is calculated as a relative value, the set value may be any value from 0 to 1.
  • the user-side effect vector is a relative value between the normalization vector D calculated in step S154 and the set value.
  • step S156 the user information registration unit 63 determines whether the effect vectors of all large items have been generated. If it is determined in step S156 that the effect vectors of all the large items have not been generated,
  • step S157 the user information registration unit 63 stores the effect vectors of all the large items. Save and finish the process.
  • the user side effect vector EfUP is obtained based on a program watched by the user during a certain period such as one week, one month, or three months.
  • the user-side effect vector EfUP corresponding to the short-term, medium-term, and long-term may be calculated, and the recommendation information may be determined using the plurality of effect vectors. good.
  • the user-specific preference is used as the user-side effect vector EfUP
  • the user-specific preference may be used as the normal history vector UP in the matching process.
  • all programs broadcast in a predetermined time zone for example, so-called golden time between 18 o'clock and 22 o'clock
  • golden time for example, so-called golden time between 18 o'clock and 22 o'clock
  • matching between the user-specific preference and the public preference is performed by calculating the cosine distance indicating the similarity between the normal history vector UP and the public preference.
  • the user-side effect vector calculation process 2 for finding the user-side effect vector EfUP for use in the following will be described.
  • step S 161 the user information registration unit 63 of the matching processing unit 43 acquires the main history vector UP stored in the main history storage unit 47.
  • Step S162 the user information registration unit 63 acquires a standard preference vector APP indicating general preferences.
  • the standard preference vector APP may be supplied from the distribution server 5, or the program composition is considered to reflect the public's preference due to the influence of the audience rating competition.
  • the contents of all programs broadcast during a certain period are counted, and if necessary, normalized, so that the standard preference vector APP is obtained. May be.
  • the distribution server 5 may generate the standard preference vector APP indicating the general preference, for example, using a general audience rating survey or another method.
  • the user information registration unit 63 calculates a cosine distance between the standard preference vector APP and the normal history vector UP for each large item. The larger the cosine distance, the higher the similarity between the standard preference vector APP and the normal history vector UP.
  • the user information registration unit 63 sets the effect vector EfUP by reversing the cosine distance for each major item based on the cosine distance calculated in step S166. After the generation, the process is terminated. The larger the reciprocal of the cosine distance, the lower the similarity between the standard preference vector APP and the normal history vector UP.
  • the user-side effect vector EfUP that reflects the difference between the general preference and the corresponding user-specific preference can be obtained.
  • the program recommendation process is performed using the user side effect vector EfUP, the difference between the user's preference and general preference is emphasized, and the recommended program is determined.
  • program vector PP and the regular history vector UP are described here as being represented by vectors for each major item, the program vector PP and the regular history vector UP are described. Force Even if all the elements of the detailed items are represented by a vector arranged in one line, it goes without saying that the same processing can be executed.
  • the similarity between the standard preference vector APP and the positive history vector UP can be calculated not only by calculating the effect vector, but also as an index indicating the uniqueness of the user, directly in recommending programs. It may be used. For example, when the similarity between the standard preference vector APP and the normal history vector UP is high, a new program that matches the general trend may be preferentially recommended. 59
  • the user-side effect vector EfUP is obtained by learning based on the operation history of the user, but the user-side effect vector is determined in advance. It may be registered as the initial registration, or may use a preset value obtained based on experience.
  • the user-side effect vector EfUP may be generated not only by generating the user-side effect vector EfUP by focusing on the large item, but also by focusing on the constituent elements constituting the large item.
  • the leading role and the supporting role can be distinguished, and in a drama or movie, a user who gives priority to the supporting role over the leading role will
  • the user-side effect vector EfUP can be set to increase the weight of the supporting role, and the director, director, original creator, photographer, etc. can be used for the component ⁇ Screenplay / Original Z Direction Am '' that constitutes a major item. Users who place importance on photographers rather than directors and directors may be able to set the user side effect vector EfUP so as to increase the weight of photographers.
  • a user-side effect vector EfUP is generated for each genre, and as shown in the matching process 5 described with reference to Fig. 21, matching between the positive history vector UP of the corresponding genre and the program vector PP is performed. You may make it act sometimes.
  • a user-side effect vector generation process 3 for generating a user-side effect vector EfUP by counting the programs watched by the user during a certain period for each genre. explain.
  • step S171 the user information registration unit 63 of the matching processing unit 43 selects one of the genres in order to count the programs watched by the user during a certain period by genre.
  • step S172 the user information registration unit 63 selects one of the unprocessed large items.
  • step S 173 the user information registration unit 63 refers to the main history stored in the main history storage unit 47, for example, for one week, one month, or three months.
  • the program of the selected genre is detected, and the program vector extraction unit 42 corresponds to the program of the selected genre among the programs watched by the user during the fixed time period.
  • the program vector PP to be extracted is extracted from the data acquisition unit 41, and the number of programs is counted for each detailed item included in the large item selected in step S172.
  • step S 174 the user information registration unit 63 sends the program vector corresponding to the selected genre out of all the programs in the same period to the program vector extraction unit 42 from the data acquisition unit 41.
  • the program number is extracted, and the number of programs is counted for each detailed item included in the large item selected in step S172.
  • step S175 the user information registration unit 63 determines, based on the count results in steps S177 and S174, the count of the user's viewing performance in the selected genre. Is calculated.
  • the programming is considered to reflect the tastes of the public due to the influence of audience competition. That is, the calculation of the count of the user's viewing performance in the selected genre, in other words, the calculation of the count of all the programs in the selected genre, is performed using the count of the user's viewing performance in the corresponding genre as the corresponding genre as a standard model. This is equivalent to normalizing with the count number of all programs in the program.
  • the normalized vector calculated in step S175 is referred to as a normalized vector D '.
  • the program vector PP corresponding to the genre “Drama” in the major item genre Gm ⁇ drama, variety, sports, movies, music, children / education, education / documentation, youth / reporting, etc. ⁇
  • the count of all programs in a week is (10, 35, 7, 5, 53, 17).
  • step S176 the user information registration unit 63 generates an effect vector of the corresponding large item in the selected genre based on the calculation result of step S175.
  • the user-side effect vector is a relative value between the normalized vector ET calculated in step S175 and the set value.
  • step S177 the user information registration unit 63 determines whether or not the effect vectors of all the large items have been generated in the selected genre. If it is determined in step S177 that the effect vectors of all large items have not been generated, the process returns to step S172, and the subsequent processes are repeated. If it is determined in step S177 that the effect vectors of all large items have been generated, in step S178, the user information registration unit 63 terminates processing of all genres. It is determined whether or not. If it is determined in step S178 that not all genres have been completed, the process returns to step S171, and the subsequent processes are repeated.
  • step S 179 the user information registration section 63 sets the effects of all large items on. And the process ends.
  • the difference between general preferences and user-specific preferences can be determined for each genre.
  • the user-side effect vector EfUP is recalculated every predetermined period, for example, three months or half a year, so that the user's A program that reflects preferences in real time can be recommended.
  • the user side effect vector EfUP is obtained based on the program watched by the user during a certain period such as one week, one month, or three months.
  • the user-side effect vector EfUP corresponding to, for example, the short-term, medium-term, and long-term is calculated for a plurality of periods, and the plurality of effect vectors are calculated.
  • the recommendation information may be determined using the torque.
  • a predetermined time period in which the viewer views the program most (for example, the so-called “golden time” from 18 o'clock to 22 o'clock) ) May be counted for all programs broadcasted on the same day.
  • the user-specific preferences and the public are calculated by executing a cosine distance calculation indicating the degree of similarity between the normal history vector UP and the public preferences for each genre.
  • the following describes the user-side effect vector generation processing 4 for finding the user-side effect vector EfUP for using the distance from the user's preference for matching.
  • step S191 the user information registration unit 63 of the matching processing unit 43 selects one of the genres to specify the genre in which the processing is performed.
  • step S192 the user information registration unit 63 acquires the correct history vector UP of the selected genre from the correct history vectors UP stored in the correct history storage unit 47.
  • step S193 the user information registration unit 63 retrieves the standard preference vector APP of the selected genre from the standard preference vector APP indicating the general preference. Get.
  • the standard preference vector APP may be supplied from the distribution server 5 as described above, or the programming may reflect the public preference due to the influence of the audience rating competition. In the same way as the user-side effect vector calculation process 3 described with reference to Fig. 24, the contents of all programs broadcast during a certain period are counted by genre, normalized as necessary, and standardized by genre.
  • the preference vector APP may be used.
  • a standard preference vector APP indicating general preferences may be generated for each genre using a general audience rating survey or other methods.
  • step S 194 the user information registration unit 63 uses the normal history vector UP of the selected genre and the standard preference vector APP of the selected genre to set the standard preference for each major item. Calculate the cosine distance between the vector APP and the normal history vector UP. The larger the cosine distance, the higher the similarity between the standard preference vector APP and the positive history vector UP.
  • step S195 the user information registration unit 63 sets the reciprocal of the cosine distance for each major item based on the cosine distance calculated in step S194, to determine the effect of the selected genre. Generates vector EfUP. The greater the reciprocal of the cosine distance, the lower the similarity between the standard preference vector APP and the positive history vector UP.
  • step S196 the user information registration unit 63 determines whether or not processing for all genres has been completed. If it is determined in step S178 that all genres have not been completed, the process returns to step S191, and the subsequent processes are repeated. If it is determined in step S196 that all genres have been completed, the processing is terminated.
  • step S201 the user information registration unit 63 of the matching processing unit 43 acquires the negative history vector MUP stored in the negative history storage unit 48.
  • step S202 the user information registration unit 63 acquires a standard preference vector APP indicating a general preference.
  • the standard preference vector APP may be supplied from the distribution server 5.
  • the programming can be considered to reflect the tastes of the general public due to the influence of the audience rating competition, so that the user-side effect vector calculation processing 1 described using FIG.
  • the contents of all programs broadcasted in a certain period may be counted and normalized as necessary, so that the standard preference vector APP may be set.
  • step S203 the user information registration unit 63 calculates a cosine distance between the standard preference vector APP and the negative history vector MUP for each large item.
  • step S204 the user information registration unit 63 sets the reciprocal of the cosine distance for each of the large items based on the cosine distance calculated in step S203, and stores the reaction vector EfMUP. Generate it and end the process.
  • reaction vector EfMUP can be generated, so that programs that the user does not like can be effectively excluded from recommended programs.
  • step S 211 the user information registration unit 63 of the matching processing unit 43 selects one of the genres to specify the genre in which the processing is performed.
  • step S212 the user information registration unit 63 acquires the negative history vector MUP of the selected genre among the negative history vectors MUP stored in the negative history storage unit 48. .
  • step S213 the user information registration unit 63 acquires the standard preference vector APP of the selected genre from the standard preference vector APP indicating the general preference.
  • step S214 the user information registration unit 63 sets the standard preference for each major item based on the negative history vector MUP of the selected genre and the standard preference vector APP of the selected genre. Calculate the cosine distance between the vector APP and the negative history vector MUP. The larger the cosine distance, the higher the similarity between the standard preference vector APP and the negative history vector MUP.
  • step S215 the user information registration unit 63 generates a counter-effect vector ⁇ ⁇ ⁇ for each large item by reversing the cosine distance based on the cosine distance calculated in step S214. I do.
  • step S216 the user information registration unit 63 determines whether or not processing of all genres has been completed. If it is determined in step S216 that all genres have not been completed, the process returns to step S211 and the subsequent processes are repeated. If it is determined in step S216 that all genres have been completed, the processing is terminated.
  • the counter-effect vector EfMUP can be generated for each genre, so that programs that the user does not like can be effectively omitted from recommended programs.
  • the user-side effect vector EfUP and the counter-effect vector EfMUP are n times the reciprocal of the cosine distance for each major item described with reference to FIGS. 23 and 25 to 27, or , A value rounded to the specified digit may be used, a value obtained by subtracting the reciprocal of the cosine distance from 1 or a value obtained by multiplying the value by n It may be possible to use the ⁇ direct.
  • program vector PP and the negative history vector MUP power are described as vectors for each major item, but the program vector PP and the negative history vector MUP are It goes without saying that the same processing can be executed even when all the elements of the detailed items are represented by a vector arranged in one column.
  • the program vector extracted by the program vector extraction unit 42 includes information indicating a group such as a group ID or a cluster code generated by the processing described with reference to FIG. 7 or FIG. May be added.
  • the program that the user prefers to watch is a serial drama
  • the number of calculation processes for recommendation can be reduced. Also, by preferentially selecting programs in the same group as programs that are highly liked by the user, it is possible to reduce the number of calculation processes for recommendation.
  • step S221 the vector calculation unit 62 of the matching processing unit 43 adds a group such as a group ID or a cluster code to the program vector PP supplied from the program vector extraction unit 42. Based on whether or not the indicated information is added, it is determined whether or not the corresponding program is grouped.
  • a group such as a group ID or a cluster code
  • step S221 when it is determined that the corresponding programs are grouped, in step S222, the vector operation unit 62 determines whether the group indicated by the group ID or the cluster code is It is determined whether or not the user information registration unit 63 is registered as a recommendation priority group.
  • step S223 the vector operation unit 62 outputs the information of the corresponding program as recommendation information as recommendation information.
  • the recommended information output unit 49 registers a program to be recommended in the recommended program list 50 and displays the television display.
  • the information of the recommended program is output to the device 11 or the recording / reproducing device 12, and the process proceeds to step S 227 described later.
  • step S221 If it is determined in step S221 that the corresponding program is not grouped, or if it is determined in step S222 that it is not registered as a recommendation priority group, In 24, one of the matching processes 1 to 5 described with reference to FIGS. 17 to 21 is executed.
  • step S225 the vector calculation unit 62 adds a group ID, a program ID to a program vector of a program recommended in any one of the matching processes 1 to 3 executed in step S224. Alternatively, based on whether or not information indicating a group such as a cluster code is added, it is determined whether or not the recommended program is grouped. If it is determined in step S225 that the recommended programs are not grouped, the processing is terminated.
  • step S226 the vector operation unit 62 determines the group ID added to the program vector, Alternatively, the cluster code is registered and stored in the user information registration unit 63 as a recommendation priority group.
  • step S227 the vector calculation unit 62 stores the negative history stored in the negative history storage unit 48.
  • step S 226 For example, for a program registered as a recommendation priority group in the above process, for example, an operation input for instructing viewing or recording of other programs while the recommended program is not accepted, or playback of an automatically recorded program Judge whether or not an operation input that has a negative history, such as an operation input to command the previous deletion, has been received. If it is determined in step S227 that an operation input that has a negative history has not been received, the process ends. If it is determined in step S 227 that an operation input having a negative history has been received, in step S 228, the vector calculation unit 62 registers the recommendation priority group of the user information registration unit 63. , The corresponding group is removed, and the process ends.
  • a plurality of groups ID may be associated with one program vector PP by the title grouping process 1 described with reference to FIG.
  • all group IDs may be removed from the recommendation priority group registration of the user information registration unit 63 by an operation input that results in a negative history.
  • the number of operation inputs that result in a negative history is accumulated, and when a predetermined number of operation inputs that result in a negative history are performed, from the registration of the recommendation priority group of the user information registration unit 63, The corresponding group ID may be removed.
  • one group ID is associated with one program vector PP.
  • Negative history vector MUP may be generated for each corresponding group.
  • the number of viewing or recording reservations in the same serial drama is counted based on the correct history of the user's operation history acquired from the television display device 11 or the recording / reproducing device 12, and the predetermined number or more is counted.
  • the recommendation may be given priority without performing the matching process.
  • a user model is set based on a topic specified by the user in advance, and program recommendation processing is performed based on the user model. You can make it work.
  • the user model is obtained by extracting a program corresponding to a topic from a predetermined program group by performing filtering using a topic specified in advance by the user.
  • the initial registration storage unit 45 stores the topic input by the user. More than one topic may be registered, and will be updated as appropriate according to the user's operation input.
  • the vector calculation unit 62 extracts the program vector including the topic stored in the initial registration storage unit 45 from among the program vectors of the program for which the user model is to be generated, supplied from the program vector extraction unit 42.
  • a user model vector is generated by normalizing the extracted sum of the extracted program vectors as necessary, and registered in the user information registration unit 63.
  • the user model “Midnight Variety” includes, as a component, a variety of comedians that appeared in the variety show broadcast in the midnight frame after 23 o'clock, so for example, in a drama or other program of a genre different from the variety Since the program in which the corresponding comedian appears will be extracted and recommended in the matching process, it is possible to apply the user's preference beyond the genre, as compared to the case where the matching process is performed for each item. Become.
  • the program for which the user model is to be created may be, for example, all programs in a predetermined period, or a group of programs broadcast in a predetermined time period (for example, so-called golden time).
  • user model vectors that correspond to different programming in detail for example, at different times or at different time periods, can be created. Can be generated.
  • the vector calculation unit 62 resembles the program vector PP of the program supplied from the program vector extraction unit 42 with the user model vector registered in the user information registration unit 63.
  • the degree is calculated, and based on the result, recommended information is generated and supplied to the recommended information output unit 49.
  • the recommended information output unit 49 registers the recommended information in the recommended program list 50 and supplies the recommended information to the television display device 11 or the recording / reproducing device 12.
  • step S231 the vector computing unit 62 of the matching processing unit 43 acquires the program vector of the program for which the user model is to be created, extracted by the program vector extracting unit 42.
  • a program for which a user model is to be created is, for example, a program that was broadcast during a predetermined period, such as one month or three months, and is broadcast during a predetermined time period (eg, golden time) during the predetermined period.
  • the program may be a broadcasted program, or a program broadcast during a predetermined period in the past, such as 10 years ago, 20 years ago, or the like.
  • step S232 the initial registration storage unit 45 acquires the topic input by the user from the operation input unit 44 and stores it.
  • the vector operation unit 62 is the first
  • the topic is read from the term registration storage unit 45 and set as filtering conditions.
  • the filtering condition may be described as, for example, a hash table.
  • step S235 the vector operation unit 62 obtains the user model vector generated in step S234 and the recommendation information extracted in the program vector extraction unit 42. Calculate the cosine distance of the program vector (which is scheduled to be broadcast later) to the program vector PP.
  • step S 236 the vector computing unit 62, based on the cosine distance calculated in step S 235, calculates the program model of the candidate program for obtaining the user model vector and the recommendation information. Based on the result of the comparison, a predetermined number of programs having the highest similarity are extracted as recommendation information and supplied to the recommendation information output unit 49 based on the comparison result.
  • the recommended information output unit 49 registers the recommended information in the recommended program list 50 and supplies the recommended information to the television display device 11 or the recording / reproducing device 12, and the process is terminated.
  • the similarity is obtained by calculating the cosine distance between the user model vector and the program vector, but the cosine distance is calculated individually for each major item.
  • the similarity may be obtained using the sum.
  • the generation process of the user model vector may be executed in the distribution server 5. In this case, for example, the processing of steps S231 to S234 in FIG. 29 is executed using the program vector generated by the program vector generation unit 23 described with reference to FIG. What should I do?
  • step S 2 41 the vector operation unit 62 of the matching processing unit 43 receives the program vector PP supplied from the program vector extraction unit 42 and the normal vector stored in the main history storage unit 47. Using the history vector UP and the negative history vector MUP stored in the negative history storage unit 48, the cosine distance between the positive history vector UP and the program vector PP is calculated for each major item. Calculate the cosine distance between the negative history vector MUP and the program vector PP.
  • step S2422 the vector operation unit 62 sums the values of the cosine distance calculated for each item on the positive history side and the negative history side. That is, by the processing of step S241 and step S242, the similarity SitnUP between the positive history vector UP and the yarn PP and the negative history vector MUP and the yarn Y are described above. The similarity SimMUP with the solid PP is calculated.
  • step S243 the vector calculation unit 62 calculates an exception recommendation value indicating a low similarity with the positive history vector UP and the negative history vector MUP.
  • the exception recommendation value can be obtained from (1-SimUP) X (1 -SimMUP) or (1 ZSimUP) X (1 / SimMUP).
  • step S224 the vector calculation unit 62 obtains a program with a high exception recommendation value based on the calculation result in step S243, extracts it as recommendation information, and ends the process.
  • a program having a feature that the user has never watched can be extracted and recommended, so that unexpectedness is given to the selection of a recommended program to the user, and the interest of the user is expanded. Not only will it be possible to connect to the Internet, but it will also be possible to acquire very important history information in order to recommend programs that match the user's preferences.
  • recommendation information is generated in the program recommendation processing device 10 and supplied to the television display device 11 or the recording / reproducing device 12.
  • the television display device 11 or the recording / playback device 12 A broadcasting signal of a satellite wave or a terrestrial wave received and decoded by the communication device 4 is supplied.
  • the television display device 11 displays a broadcast signal supplied from the television receiving device 4 or reproduction data supplied from the recording / reproducing device 12 based on a user's operation input, or displays a program. Based on the recommendation information supplied from the recommendation processing device 10, it displays recommended program information and executes automatic channel setting. Further, the television display device 11 supplies the operation log to the program recommendation processing device 10.
  • the recording / reproducing apparatus 12 records or reserves a broadcast signal supplied from the television receiving apparatus 4 based on a user's operation input, or based on recommendation information supplied from the program recommendation processing apparatus 10. Then, automatically record the program. Further, the recording / reproducing device 12 reproduces a program recorded on the attached recording medium or the built-in recording medium, and outputs the program to the television display device 11 for display. Further, the recording / reproducing device 12 supplies the operation log to the program recommendation processing device 10.
  • FIG. 31 is a block diagram illustrating a configuration of the television receiver 4.
  • the television receiver 4 will be described as a general receiver conforming to the standard for digital broadcast receivers.
  • the satellite wave detector 91 converts a satellite wave transmitted via the satellite 2 and received by the antenna 3 into a signal for selecting a channel supplied from the television display device 11 or the recording / reproducing device 12. Based on this, the channel is detected and detected, and the control 1B relating to the transmission mode is supplied to a TMCC (Transmission and Multiplexing Configuration Control) decoding unit 92 and the broadcast signal is supplied to a demodulation / decoding processing unit 93.
  • TMCC Transmission and Multiplexing Configuration Control
  • the decoding unit 92 receives input of information such as a transmission mode (modulation method, coding rate, etc.) and a slot in the transmission multiplex control signal, decodes the information, and demodulates and decodes the information. Supply 9 to 3.
  • information such as a transmission mode (modulation method, coding rate, etc.) and a slot in the transmission multiplex control signal, decodes the information, and demodulates and decodes the information.
  • the demodulation / decoding processing unit 93 converts the supplied broadcast signal based on the information on the transmission mode supplied from the TMCC decoding unit 92 into, for example, a quadri-phase shift keying (QPSK). , Or 4 phase PSK) or 8 phase 15925
  • QPSK quadri-phase shift keying
  • the signal is demodulated and decoded using a method such as the PSK method, and supplied to the dinter lover 94.
  • the din taller 94 dinter leaps the supplied signal and supplies it to the error correction processing unit 95.
  • the din taller 94 may further perform frame separation and descrambling processing on the supplied signal.
  • the error correction processing unit 95 performs an error correction process using, for example, a Reed-Solomon code, and supplies the result to a CA (Conditional Access: conditional access) descramble unit 101.
  • CA Conditional Access: conditional access
  • the terrestrial wave detector 96 selects and detects the terrestrial wave received by the antenna 3 based on a control signal for selecting a channel supplied from the television display device 11 or the recording / reproducing device 12. Then, a control signal related to the transmission mode is supplied to the TMCC decoding unit 97, and a broadcast signal is supplied to the demodulation / decoding processing unit 98.
  • the TMCC decoding unit 97 receives input of information such as a transmission mode (modulation method, coding rate, etc.), a slot, and a TS in the transmission multiplex control signal, decodes the information, and decodes the information.
  • Information such as a transmission mode (modulation method, coding rate, etc.), a slot, and a TS in the transmission multiplex control signal, decodes the information, and decodes the information.
  • the demodulation / decoding processing unit 98 converts the supplied broadcast signal into, for example, QAM (quadrature amplitude modulation) based on the information on the transmission mode supplied from the TMCC decoding unit 97.
  • the signal is demodulated and decoded by using a method such as a system, and supplied to the Din Taliber 99.
  • the ding liver 990 dingles the supplied signal and supplies it to a TS (Transport Stream) reproducing unit 100. Further, the deinterleaver 99 may further perform frame separation or descrambling processing on the supplied signal.
  • TS Transport Stream
  • the TS reproducing section 100 reproduces a transport stream based on the supplied signal, and supplies the transport stream to the CA descrambling section 101.
  • the CA descramble unit 101 receives the conditional access signal based on the signal supplied from the error correction processing unit 95 or the TS reproduction unit 100. Feed to Lexa 102.
  • the data input unit 103 receives the input of the EPG data from the EPG receiving device 9, receives the streaming data from the distribution server 5 via the network 8, and supplies the streaming data to the demultiplexer 102.
  • the demultiplexer 102 demultiplexes the signal supplied from the CA descramble section 101 or the data input section 103, the audio signal is output to the audio signal decoding section 104, and the video signal is output to the audio signal decoding section 104.
  • the video signal decoder 105 supplies the data such as the control signal and the EPG to the data decoder 106.
  • the audio signal decoding unit 104 decodes the supplied audio signal and supplies it to the television display device 11 or the recording / reproducing device 12.
  • the video signal decoding unit 105 decodes the supplied video signal and supplies it to the television display device 11 or the recording / reproducing device 12.
  • the data decoding unit 106 decodes the supplied control signal and data such as EPG and supplies the decoded data to the television display device 11 or the recording / reproducing device 12.
  • the received satellite wave or terrestrial wave or the distributed streaming data is demodulated and decoded by a predetermined method, and the television display device 11 or It is supplied to the recording and playback device 12.
  • FIG. 32 is a block diagram illustrating a configuration of the television display device 11.
  • the operation input unit 1 2 1 receives an operation input from the user, supplies a control signal corresponding to the user's operation input to each unit of the television display device 11, and stores the operation contents of the user in an operation log list 1 2 2 To be stored.
  • the operation log of the user stored in the operation log list 122 is acquired by the operation log acquisition unit 46 of the program recommendation processing device 10 described with reference to FIG.
  • the operation input unit 121 supplies the input user operation to the channel setting unit 123.
  • the channel setting unit 123 generates a control signal indicating channel selection based on the signal indicating the user's operation input supplied from the operation input unit 122 and supplies the control signal to the television receiver 4.
  • a control signal indicating channel selection is generated and supplied to the television receiver 4 in order to automatically set a channel.
  • the television receiver 4 receives a broadcast signal of a specified channel based on the control signal.
  • the data input section 124 receives an input of a broadcast signal from the television receiver 4 and supplies the broadcast signal to the image processing section 125.
  • the image processing unit 125 performs image processing on the supplied broadcast signal based on the image display method of the output unit 126 and supplies the broadcast signal to the output unit 126.
  • the output unit 126 includes, for example, a display device such as a CRT (Cathode Ray Tube) or an LCD (Liquid Crystal Display), and an audio output device such as a speaker, and a supplied broadcast signal after image processing.
  • the image signal is displayed on the display device, and the audio signal is output from the audio output device.
  • the recommended program list acquisition section 127 acquires recommendation information from the program recommendation processing device 10 and supplies it to the recommended program list 128.
  • the recommended program list 1 288 registers the supplied recommended information.
  • the recommended information registered in the recommended program list 128 is read out to the channel setting unit 123 or to the recommended program information display control unit 129.
  • the recommended program information display control unit 129 outputs the recommended information read from the recommended program list 128 to the image processing unit 125 in order to present the recommended information of the program to the user.
  • the image processing unit 125 outputs the recommendation information supplied from the recommended program information display control unit 129 alone or by superimposing it on the image of the broadcast signal supplied from the data input unit 124. Output it to the unit 1 26 and display it on the display device.
  • Whether the recommended information is displayed on the output unit 126 or the channel is automatically set based on the recommended information supplied from the program recommendation processing device 10 depends on the setting of the user. It may be determined.
  • the recommendation information output unit 49 obtains the recommendation information output from the recommendation information output unit 49.
  • step S252 the recommended program list acquisition section 127 registers the acquired recommended information in the recommended program list 128.
  • step S 253 the recommended program information display control unit 1 229 selects a program to be broadcast from the recommended program list 1 288 within a predetermined time from the current time, for example, 3 hours or 1 day.
  • the recommended information is read, and the recommended information display data for displaying the title, content, broadcast time, and broadcast channel of the recommended program is generated and supplied to the image processing unit 125.
  • step S254 the image processing unit 125 executes image processing for displaying the supplied recommendation information display data on the output unit 126, and supplies the data to the output unit 126.
  • the recommendation information is subjected to image processing alone or by being superimposed on the image of the broadcast signal supplied from the data input unit 124.
  • step S255 the output unit 126 displays the recommendation information supplied from the image processing unit 125, and the process ends.
  • the recommendation information is displayed on the output unit 126, so that the user can select a program to view by referring to the displayed recommendation information.
  • a channel for automatically setting a channel based on the recommendation information supplied from the program recommendation processing device 10 and displaying a program matching the user's preference is displayed. The automatic channel setting process will be described.
  • step S271 and step S272 the same processing as in step S251 and step S252 described with reference to FIG. 33 is executed. That is, the recommendation information output from the recommendation information output unit 49 of the program recommendation processing device 10 is acquired, and the acquired recommendation information is registered in the recommended program list 128.
  • the channel setting unit 1 2 3 acquires information of the recommended program corresponding to the current time from the program recommendation list 98 in step S 2 73, and in step S 2 74, based on the information of the recommended program, It generates channel setting information and outputs it to the television receiver 4.
  • the television receiver 4 receives the designated channel based on the control signal. Receiving broadcast signals of the channel.
  • step S275 the data input unit 124 acquires the broadcast signal of the specified channel from the television receiver 4 and supplies the broadcast signal to the image processing unit 125.
  • the image processing unit 125 performs image processing for displaying the supplied broadcast signal on the output unit 126, and supplies the broadcast signal to the output unit 126.
  • the output unit 126 displays the video of the recommended program supplied from the image processing unit 125, outputs the sound, and ends the processing.
  • a channel is automatically set to a channel on which a program matching the user's preference is being broadcast.
  • the automatic channel setting process described with reference to FIG. 34 may be executed, for example, when the user issues a command.
  • the automatic channel setting process described with reference to FIG. 34 is performed, for example, every two hours, such as at a predetermined time when it is determined that the user has just left the channel without setting the channel with particular consideration.
  • the process may be executed when an operation input from the user is absent for a predetermined time when it can be determined that the user has been left unattended.
  • a mode in which the automatic channel setting process cannot be executed is prepared. You may be able to do it.
  • FIG. 35 is a block diagram showing a configuration of the recording / reproducing device 12.
  • the operation input unit 14 1 receives an operation input from the user, supplies a control signal corresponding to the user's operation input to each unit of the recording / reproducing device 12, and stores the user's operation contents in the operation log list 14 2. Supply and save.
  • the operation log of the user stored in the operation port list 14 2 is acquired by the operation port acquisition unit 46 of the program recommendation processing device 10 described with reference to FIG.
  • the recording setting section 144 is based on a signal indicating the user's operation input supplied from the operation input section 141 or based on a signal registered in a recommended program list 144 described later. From the recommendation information, information necessary for performing the recording process, such as the broadcast start time and the broadcast end time of the program to be recorded, and the channel to be broadcast, is extracted.
  • the recording setting unit 144 registers information necessary for performing recording processing in the recording reservation list 144
  • the user's operation input supplied from the input unit 141 is a recording process of a currently broadcasted program, or automatically using the recommended information registered in a recommended program list 149 described later.
  • information necessary for performing the recording process is supplied to the recording control unit 145.
  • the recording control section 144 is based on the information necessary for performing the recording process supplied from the recording setting section 144 or based on the recording reservation information registered in the recording reservation list 144. By extracting the recording reservation information corresponding to the current time, a control signal indicating the broadcast channel of the program to be recorded is generated, supplied to the television receiver 4, and a control signal for executing the recording process. Is generated and supplied to the recording / playback processing section 147.
  • the television receiver 4 receives a broadcast signal of a specified channel based on the control signal.
  • the data input unit 146 receives an input of a broadcast signal from the television receiver 4 and supplies the broadcast signal to the recording / playback processing unit 147.
  • the recording / reproducing processing unit 147 is configured so that a recording medium such as a magnetic tape, an optical disk, a magnetic disk, a magneto-optical disk, or a semiconductor memory can be mounted therein, or has a hard disk, for example. Or a recording medium such as a semiconductor memory so that information can be recorded on the recording medium or the information can be reproduced from the recording medium.
  • the recording / playback processing unit 147 when the recording medium attachable to the recording / playback processing unit 147 is a magnetic tape, the recording / playback processing unit 147 has a magnetic head, and the data input unit 1 46 Records (ie, records) the broadcast signal supplied from 6 or reproduces the information recorded on the magnetic tape and supplies it to the television display device 11 or the like for reproduction and output.
  • the recommended program list acquisition unit 14 8 acquires recommendation information from the program recommendation processing device 10 And supply it to the recommended program list 149.
  • the recommended program list 149 registers the supplied recommended information.
  • the recommendation information registered in the recommended program list 149 is read out to the recording setting unit 143, and the recording process is automatically executed.
  • step S291 the recommended program list acquisition unit 148 acquires the recommendation information output from the recommendation information output unit 49 of the program recommendation processing device 10.
  • step S292 the recommended program list obtaining unit 148 registers the obtained recommended information in the recommended program list 149.
  • step S293 the recording setting unit 144 extracts the information of the recommended program corresponding to the current time, the program recommendation list 109, the broadcast start time and the broadcast end time, and the broadcast channel. Such information as necessary for the recording process is obtained and supplied to the recording control unit 144.
  • step S294 the recording control unit 145 generates channel setting information for receiving the broadcast signal of the program to be recorded, and outputs the information to the television receiver 4.
  • the television receiver 4 receives the broadcast signal of the specified channel based on the control signal.
  • step S295 the data input unit 146 acquires the broadcast signal of the specified channel from the television receiver 4, and supplies it to the recording / playback processing unit 147.
  • step S296 the recording / playback processing section 147 records the supplied broadcast signal on a mounted or built-in recording medium, and the process ends.
  • the automatic recording process described with reference to FIG. 36 is not executed while a recording operation is already being performed, such as during a recording process instructed by a user or during a recording operation by a recording reservation process.
  • This section describes the case where recording is performed automatically based on the recommended program corresponding to the current time. However, it goes without saying that, for example, it is also possible to obtain recommendation information for a predetermined time earlier than the current time and automatically set a recording reservation by performing the same processing. .
  • the program vector PP is described as being generated in the distribution server 5, but the distribution server does not generate the program vector PP, but via the network 8. Then, the EPG data may be supplied to the program recommendation processing device, and the program recommendation processing device may generate the program vector PP.
  • the distribution server 17 supplies the EPG data to the program recommendation processing device via the network 8 and generates the program vector PP in the program recommendation processing device.
  • the configuration of 1 is shown in Fig. 37, and the configuration of the program recommendation processing device 191 is shown in Fig. 38.
  • the distribution server 17 1 is composed of the data acquisition unit 21 and the data transmission unit 25 of the distribution server 5 described with reference to FIG. 2, and outputs the streaming data from the streaming data database 6 or the metadata database 7.
  • EPG data composed of metadata is acquired and transmitted to the EPG receiving device 8 or the television receiving device 4 via the network 8.
  • a metadata acquisition unit 22 and a program vector generation unit 23 similar to those provided in the distribution server 5 of FIG. 2 are newly provided. Other than the above, it has the same configuration as that of the program recommendation processing device 10 described with reference to FIG. 13.
  • the program vector processing described with reference to FIG. And the program vector generation processing 2 described with reference to FIG. 6, the grouping processing 1 described with reference to FIG. 7, and the grouping processing described with reference to FIG. 8 are executed. I do.
  • the EPG receiving device 9 collects the user's operation history and setting information from the television display device 11 and the recording / reproducing device 12 and supplies them to the distribution server via the network 8.
  • the distribution server may not only generate the program vector PP but also execute the matching process and supply the matching result to the EPG receiving device 9 via the network 8.
  • the network configuration in the case shown in FIG. 3 9 shows a block diagram illustrating a delivery server 2 0 1 configuration in FIG. 4 0.
  • the distribution server 201 is obtained by adding the function of the program recommendation processing device 191 described with reference to FIG. 38 to the distribution server 171 described with reference to FIG. 37. Users do not need to own a program recommendation processor.
  • program vector PP In the configuration shown in Fig. 39 and Fig. 40, program vector PP, program side effect vector EfPP, positive history vector UP, negative history vector MUP, or standard preference betatle APP, etc. 3 to 12 and FIGS. 14 to 30, such as the generation processing of the program vector, the processing of grouping the program vectors, the matching processing, and the processing of selecting the exceptional recommended programs. All processing is executed by the distribution server 201.
  • the operation history and setting information of the user collected from the EPG receiving device 9 and the television display device 11 and the recording / reproducing device 12 and transmitted via the network 8 include, for example, , User ID, etc., so that each user can be distinguished.
  • the program recommendation processing device 1911 of the distribution server 201 the initial registration storage unit 45, the positive history storage unit 47, the negative history storage unit 48, etc., are based on the user ID of the supplied information. Then, each information is saved for each user.
  • a case has been described in which a program suited to the user's preference is recommended using EPG data of a television broadcast signal.
  • the present invention provides various types of broadcasting such as radio broadcasting and streaming data.
  • the present invention can also be applied to a case where attribute information is added to digital content and recommendation is made for a user's preference.
  • the series of processes described above can also be executed by software.
  • the software is capable of executing various functions by installing a computer in which the program constituting the software is built into dedicated hardware or installing various programs. Installed from a recording medium to a personal computer.
  • this recording medium is a magnetic disk 31 or a magnetic disk 31 on which the program is recorded, which is distributed to provide the program to the user separately from the computer.
  • 7 1 including flexible disk
  • optical disk 32 or 7 2 including CD-ROM (Compact Disk-Read Only Memory), DVD (Digital Versatile Disk)), magneto-optical disk 33 or 73 (MD (Mini-Disk) (trademark)), or a package medium composed of semiconductor memory 34 or 74 or the like.
  • steps for describing a program recorded on a recording medium are not limited to processing performed in chronological order in the order described, but are not necessarily performed in chronological order. Alternatively, it also includes processing that is executed individually.
  • system refers to an entire device including a plurality of devices.
  • weighting information that defines the degree of contribution of each eye can be associated with content attribute information.
  • the present invention it is possible to select a content that matches the user's preference, and also to calculate the similarity between the attribute information and the predetermined user's preference information by the contribution of each of the plurality of items. Since the content is selected using the weighting information that defines the degree, it is possible to select the content that correctly matches the user's preference.
  • the user's preference it is possible to obtain the user's preference.
  • the user's preference by comparing the user's preference with the general preference and determining the bias of the user's preference, it is possible to determine the user's specific preference.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Social Psychology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本発明は、番組の属性を表す番組ベクトルを生成することができるようにする。ステップS11において、EPGデータの供給を受け、ステップS12において、番組ベクトルPPを生成するために必要なメタデータが抽出される。ステップS13において、メタデータに含まれている、タイトル、内容などが、形態素解析されて、単語に分解され、ステップS14において、メタデータに含まれているそれぞれの項目がベクトル化されて番組ベクトルPPが生成される。ステップS15において、供給されたメタデータの番組のジャンルに基づいて、対応する効き目ベクトルが抽出される。ステップS16において、抽出された効き目ベクトルと生成されたベクトルとが関連付けされて、処理が終了される。本発明は、コンテンツを配信する配信サーバに適用できる。

Description

明細書
情報処理装置おょぴ情報処理方法、 情報処理 記録媒体、 並びにプログ ラム 技術分野
本発明は、 情報処理装置および情報処理方法、 情報処理システム、 記録媒体、 並びにプログラムに関し、 特に、 テレビジョン放送やラジオ放送などの番組や、 ス トリーミングデータなどを視聴するユーザに対して、 例えば、 自動録画や番組 などの推薦を行う場合に用いて好適な、 情報処理装置および情報処理方法、 情報 処理システム、 記録媒体、 並びにプログラムに関する。 背景技術
従来、 例えば、 テレビジョン放送やラジオ放送などにおいて、 ユーザに対して 番組を推薦する場合には、 電子番組ガイド (E P G: Electronic Program Guide) などの番組情報 (番組メタデータ) を基に、 ユーザの嗜好情報にマッチングする 番組が選択された。 ユーザへの番組の推薦方法は、 ユーザ嗜好データの取得の方 法によって異なり、例えば、初期にユーザの興味に関する情報を登録してもらい、 その情報に基づいて、 番組を推薦する初期興味登録方式、 ユーザが過去に視聴し た番組の履歴を利用して、 番組を推薦する視聴履歴利用方式、 あるいは、 他のュ 一ザの視聴履歴を利用して、 番組を推薦する協調フィルタリング方式などの方法 があった。
初期興味登録方式では、 利用開始時に、 例えば、 好きな番組カテゴリー (例え ば、 ドラマ、 バラエティ、 など) 、 好きなジャンル (推理もの、 お笑いもの、 な ど) 、 または、 好きなタレント名などをユーザに登録してもらい、 これらの情報 をキーワードとして、 番組メタデータとの間でマッチングを取ることにより、 推 薦すべき番組名が取得されるようになされている。
また、 視聴履歴利用方式では、 ユーザが番組を視聴するたびに、 視聴された番 組メタデータが蓄積され、 ある程度、 履歴メタデータが蓄積されると、 そのメタ データが解析されて、例えば、好きな番組カテゴリー、好きなジャンル、または、 好きなタレント名などの情報が取得される。 そして、 これらの情報をキーワード として、 番組メタデータとの間でマッチングを取ることにより、 推薦すべき番組 名が取得されるようになされている。
例えば、 HDD (Hard Disk Drive) を用いた録画装置などにおいては、 視聴履歴 のみならず、 録画予約、 または、 録画などのユーザ操作が履歴情報として蓄積さ れ、 嗜好情報の取得に用いられることもある。 この場合、 ユーザが、 特に興味を 持って番組を視聴しているのではなく、 テレビジョン受像機やラジオなどをつけ ていたために視聴していた状態になっていた番組と、 ユーザが、 より興味を持つ て、 意識的に視聴した番組を一部区別することが可能となり、 ユーザの嗜好をよ り反映した情報を取得できる。
そして、 協調フィルタリング方式は、 第 1のユーザの視聴や操作の履歴に対し て、 その他のユーザの視聴履歴との間でマッチングを取ることにより、 第 1のュ 一ザと視聴履歴の似ている第 2のユーザを検索し、 その視聴または操作の履歴デ ータを取得することにより、 第 2のユーザが視聴した番組で、 第 1のユーザがま だ視聴していない番組を抽出して推薦するものである。
また、 例えば、 特開 2 0 0 1— 1 6 0 9 5 5号公報に開示されているように、 放送番組に、 予め、 番組の属性情報として、 n次元の属性べク トルを付加し、 ュ 一ザの初期登録内容や、 ユーザが再生、 または録画予約した番組の属性ベク トル の各属性項目の平均値を基に生成された選択べク トルと、 属性べク トルとを比較 することにより、 録画する番組、 または、 再生する番組を選択することができる ようになされている技術がある。
しかしながら、 初期登録方式を基に、 番組を選択する場合、 ユーザが初期登録 を行った時期の固定的な興味しか反映できない上、 詳細な情報を得るためには、 ユーザの登録操作が複雑になってしまう。 これに対して、 初期設定の登録情報の 入力操作を簡単にするために、 登録される情報数を少なく してしまった場合、 大 まかなユーザの嗜好情報を基にした推薦しかできないので、 ユーザの嗜好に合致 する番組が選択される精度が低いものとなってしまう。
これに対して、 履歴利用方式などのように、 単純にユーザの視聴履歴などを基 に収集したメタデータの総和、 または平均などを用いて、 番組を選択する場合、 履歴がある程度蓄積されないと、 ユーザの嗜好に正しく合致した番組を推薦する ことができない。 更に、 履歴利用方式では、 メタデータ間の関係性がなまってし まい、充分な個人化はできなかった。また履歴を積み重ねることにより、例えば、 ジャンルなど、 履歴として重なり易い項目 (ユーザが嗜好するものとして検出さ れやすい項目) と、 出演者など、 履歴として要素が広がり易い項目 (ユーザが嗜 好するものとして検出されにくい項目) とで、 重み付けに偏りが生じてしまう場 合がある。
具体的には、 例えば、 ユーザが解説者 Aのファンであるので、 「解説者 Aが解 説している球団 Bの試合の実況中継」 を好んで視聴しているような場合、 ジヤン ルである 「野球の実況中継」 という情報は履歴として重なりやすい ( 「野球の実 況中継」 という情報は、 ユーザが嗜好するものとして検出されやすい) 力 出演 者である 「解説者 A」 という情報は履歴として重なり難い ( 「解説者 A j という 情報は、 ユーザが嗜好するものとして検出され難い) 。 このため、 他の解説者が 解説している球団 Bの試合の実況中継が推薦されて、 解説者 Aが出演しているバ ラエティ番組が推薦されないような場合が発生する。
また、 特開 2 0 0 1— 1 6 0 9 5 5号公報に示されるように、 放送番組に、 予 め、 番組の属性べク トノレを付力 tlし、 ユーザの初期登録内容や、 ユーザが再生、 ま たは録画予約した番組の属性べク トルの各属性項目の平均値を基に生成された選 択べク トルと、 属性べク トルとを比較することにより、 録画する番組、 または、 再生する番組を選択するようにした場合も、 ユーザの操作履歴を利用するのであ るから、 同様に、 履歴として重なり易い項目と、 出演者など、 履歴として要素が 広がり易い項目とで、 重み付けに偏りが生じてしまう場合がある。
更に、 例えば、 ドラマが好きで、 バラエティは、 ほとんどドラマに出演しない コメディアン Aが出演するもののみを好み、 バラエティ対ドラマの視聴比率が 2 : 8であるユーザに対して生成される選択べク トルにおいては、 ほとんどドラ マに出演しないコメディアン Aよりも、 特に好きな俳優でないにもかかわらず、 ドラマに頻繁に出演する出演者 Bが履歴として重なってしまう。 従って、 コメデ イアン Aが出演するバラエティよりも、 ドラマに頻繁に出演する出演者 Bが出演 するドキュメンタリーが優先的に推薦されてしまう。
また、 ユーザによって、 番組を選択するために重要な項目が異なる (例えば、 出演者重視や内容重視など) 場合にも、 全ての項目が同様に演算されるため、 ュ 一ザ固有の嗜好が反映されない場合があった。
また、 協調フィルタリング方式で利用されるのは、 あくまで他のユーザの嗜好 情報であるので、 それぞれのユーザの嗜好を詳細に表す情報を抽出することは困 難であった。 発明の開示
本発明はこのような状況に鑑みてなされたものであり、 ユーザの嗜好に合致し た番組を選択することができるようにするものである。
本発明の第 1の情報処理装置は、 コンテンツに関する情報を取得する取得手段 と、 取得手段により取得されたコンテンツに関する情報に基づいて、 複数の項目 で構成される属性情報を生成する属性情報生成手段と、 属性情報生成手段により 生成された属性情報の項目に対応する第 1の重み付け情報を記憶する第 1の記憶 手段とを備え、 第 1の重み付け情報は、 属性情報と所定のユーザの嗜好情報との 類似度の算出における、 複数の項目それぞれの寄与の度合いを規定するものであ ることを特徴とする。
属性情報生成手段により生成された属性情報を送信する送信手段を更に備えさ せるようにすることができる。
送信手段には、第 1の記憶手段により記憶されている第 1の重み付け情報から、 コンテンツが有する条件に合致する第 1の重み付け情報を抽出させて、 属性情報 JP2003/015925
5
生成手段により生成された属性情報に対応付けて、 更に送信させるようにするこ とができる。
コンテンツが有する条件は、 コンテンツのジャンルであるものとすることがで きる。
取得手段により取得されたコンテンツに関する情報のうち、 所定の情報を抽出 する抽出手段を更に備えさせるようにすることができ、 属性情報生成手段には、 抽出手段により抽出された所定の情報を、 複数の項目ごとにベク トル化して、 属 性情報を生成させるようにすることができる。
属性情報生成手段には、 コンテンツに関する情報のうち、 言語により記載され た情報を解析し、 解析結果を基に、 属性情報を生成させるようにすることができ る。
複数の項目で構成される所定のユーザの嗜好情報を記憶する第 2の記憶手段と、 第 2の記憶手段により記憶されている嗜好情報と、 属性情報生成手段により生成 された属性情報との、 項目ごとの類似度を算出することにより、 ユーザの嗜好と 合致したコンテンツを示す推薦情報を生成する推薦情報生成手段とを更に備えさ せるようにすることができる。
推薦情報生成手段には、 第 1の記憶手段により記憶されている第 1の重み付け 情報を用いて、 属性情報と嗜好情報とを比較させることにより、 推薦情報を生成 させるようにすることができる。
ユーザの操作履歴を取得する操作履歴取得手段と、 操作履歴取得手段により取 得された操作履歴を基に、 ユーザの嗜好情報を生成する嗜好情報生成手段と、 嗜 好情報生成手段により生成された嗜好情報を基に、 第 2の重み付け情報を生成す る重み付け情報生成手段とを更に備えさせるようにすることができ、 第 2の重み 付け情報は、 複数の項目の、 属性情報とユーザの嗜好情報との類似度の算出時の 寄与の度合いを規定するものとすることができ、 推薦情報生成手段には、 重み付 け情報生成手段により生成された第 2の重み付け情報を用いて、 嗜好情報と属性 情報とを比較させることにより、推薦情報を生成させるようにすることができる。 本発明の第 1の情報処理方法は、 コンテンツに関する情報を取得する取得ステ ップと、 取得ステップの処理により取得されたコンテンツに関する情報に基づい て、 複数の項目で構成される属性情報を生成する属性情報生成ステップと、 取得 ステップの処理により取得されたコンテンツに関する情報を基に、 コンテンツが 有する条件に基づいて、 属性情報と所定のユーザの嗜好情報との類似度の算出に おける、 複数の項目それぞれの寄与の度合いを規定する重み付け情報を抽出する 抽出ステップと、 抽出ステップの処理により抽出された重み付け情報と、 属性情 報生成ステップの処理により生成された属性情報とを対応付ける対応付けステッ プとを含むことを特徴とする。
本発明の第 1の記録媒体に記録されているプログラムは、 コンテンツに関する 情報を取得する取得ステップと、 取得ステップの処理により取得されたコンテン ッに関する情報に基づいて、 複数の項目で構成される属性情報を生成する属性情 報生成ステップと、 取得ステップの処理により取得されたコンテンツに関する情 報を基に、 コンテンツが有する条件に基づいて、 属性情報と所定のユーザの嗜好 情報との類似度の算出における、 複数の項目それぞれの寄与の度合いを規定する 重み付け情報を抽出する抽出ステップと、 抽出ステップの処理により抽出された 重み付け情報と、 属性情報生成ステップの処理により生成された属性情報とを対 応付ける対応付けステップとを含むことを特徴とする。
本発明の第 1のプログラムは、 コンテンツに関する情報を取得する取得ステツ プと、取得ステップの処理により取得されたコンテンツに関する情報に基づいて、 複数の項目で構成される属性情報を生成する属性情報生成ステップと、 取得ステ ップの処理により取得されたコンテンツに関する情報を基に、 コンテンツが有す る条件に基づいて、 属性情報と所定のユーザの嗜好情報との類似度の算出におけ る、 複数の項目それぞれの寄与の度合いを規定する重み付け情報を抽出する抽出 ステップと、 抽出ステップの処理により抽出された重み付け情報と、 属性情報生 成ステップの処理により生成された属性情報とを対応付ける対応付けステップと を含むことを特徴とする。 コンテンツに関する情報が取得され、 取得されたコンテンツに関する情報に基 づいて、 複数の項目で構成される属性情報が生成され、 コンテンツに関する情報 を基に、 コンテンツが有する条件に基づいて、 属性情報と所定のユーザの嗜好情 報との類似度の算出における、 複数の項目それぞれの寄与の度合いを規定する重 み付け情報と、 属性情報とが対応付けられる。
本発明の第 2の情報処理装置は、 複数の項目で構成されているコンテンツの属 性情報を取得する取得手段と、 複数の項目で構成されているユーザの嗜好情報を 記憶する記憶手段と、 取得手段により取得された属性情報と、 記憶手段により記 憶されているユーザの嗜好情報との類似度を、 所定の重み付け情報を用いて算出 することにより、 ユーザの嗜好と合致したコンテンツを示す推薦情報を生成する 推薦情報生成手段とを備え、 重み付け情報は、 属性情報とユーザの嗜好情報との 類似度の算出における、 複数の項目それぞれの寄与の度合いを規定することを特 徴とする。
取得手段には、 コンテンツの属性情報とともに、 重み付け情報を更に取得させ るようにすることができ、推薦情報生成手段には、所定の重み付け情報を用いて、 属性情報と嗜好情報とを比較させることにより、 推薦情報を生成させるようにす ることができる。
ユーザの操作履歴を取得する操作履歴取得手段と、 操作履歴取得手段により取 得された操作履歴を基に、 ユーザの嗜好情報を生成する嗜好情報生成手段と、 嗜 好情報生成手段により生成された嗜好情報を基に、 重み付け情報を生成する重み 付け情報生成手段とを更に備えさせるようにすることができ、 推薦情報生成手段 には、 重み付け情報生成手段により生成された重み付け情報を用いて、 嗜好情報 と属性情報とを比較させることにより、 推薦情報を生成させるようにすることが できる。
重み付け情報は、 コンテンツの属性情報のうち、 一般的な嗜好に対して、 ユー ザの特徴的な嗜好を示す情報であるものとすることができる。
重み付け情報は、 コンテンツの属性情報のうち、 ユーザにとって重要な項目を 示す情報であるものとすることができる。
重み付け情報は、 コンテンツの属性情報のうち、 ユーザが好むコンテンツを表 す項目を示す情報であるものとすることができる。
重み付け情報は、 コンテンツの属性情報のうち、 ユーザが好まないコンテンツ を表す項目を示す情報であるものとすることができる。
ユーザの操作入力を受ける操作入力手段を更に備えさせるようにすることがで き、 重み付け情報は、 操作入力手段により入力されるユーザの操作入力により設 定される情報であるものとすることができる。
本発明の第 2の情報処理方法は、 複数の項目により構成されるコンテンッの属 性情報と、 複数の項目により構成される所定のユーザの嗜好情報との類似度の算 出における、 複数の項目それぞれの寄与の度合いを規定する重み付け情報に関す. る設定情報を取得する取得ステップと、 属性情報と嗜好情報との類似度を、 取得 ステップの処理により取得された重み付け情報に関する設定情報に基づいて算出 する算出ステップと、 算出ステップの処理による算出結果を用いて、 ユーザの嗜 好と合致したコンテンツを示す推薦情報を生成する推薦情報生成ステップとを含 むことを特徴とする。
本発明の第 2の記録媒体に記録されているプログラムは、 複数の項目により構 成されるコンテンッの属性情報と、 複数の項目により構成される所定のユーザの 嗜好情報との類似度の算出における、 複数の項目それぞれの寄与の度合いを規定 する重み付け情報に関する設定情報を取得する取得ステップと、 属性情報と嗜好 情報との類似度を、 取得ステップの処理により取得された重み付け情報に関する 設定情報に基づいて算出する算出ステップと、 算出ステップの処理による算出結 果を用いて、 ユーザの嗜好と合致したコンテンツを示す推薦情報を生成する推薦 情報生成ステツプとを含むことを特徴とする。
本発明の第 2のプログラムは、 複数の項目により構成されるコンテンツの属性 情報と、 複数の項目により構成される所定のユーザの嗜好情報との類似度の算出 における、 複数の項目それぞれの寄与の度合いを規定する重み付け情報に関する 設定情報を取得する取得ステップと、 属性情報と嗜好情報との類似度を、 取得ス テツプの処理により取得された重み付け情報に関する設定情報に基づいて算出す る算出ステップと、 算出ステップの処理による算出結果を用いて、 ユーザの嗜好 と合致したコンテンッを示す推薦情報を生成する推薦情報生成ステップとを含む ことを特徴とする。
複数の項目により構成されるコンテンツの属性情報と、 複数の項目により構成 される所定のユーザの嗜好情報との類似度が、 複数の項目それぞれの寄与の度合 いを規定する重み付け情報を用いて算出され、 ユーザの嗜好と合致したコンテン ッを示す推薦情報が生成される。
本発明の情報処理システムは、 コンテンツに関する情報を基にコンテンツの属 性情報を生成する第 1の情報処理装置と、 第 1の情報処理装置から供給されたコ ンテンッの属性情報を基に、 ユーザの嗜好と合致したコンテンツを選択する処理 を実行する第 2の情報処理装置とで構成され、 第 1の情報処理装置は、 コンテン ッに関する情報を取得する第 1の取得手段と、 第 1の取得手段により取得された コンテンツに関する情報に基づいて、 複数の項目で構成される属性情報を生成す る属性情報生成手段と、 属性情報生成手段により生成された属性情報の項目に対 応する第 1の重み付け情報を記憶する第 1の記憶手段と、 第 1の記憶手段に記憶 されている第 1の重み付け情報から、 コンテンツが有する条件に合致する第 1の 重み付け情報を抽出して、 属性情報生成手段により生成された属性情報に対応付 けて送信する送信手段とを備え、 第 2の情報処理装置は、 複数の項目で構成され ているコンテンツの属性情報おょぴ第 1の重み付け情報を取得する第 2の取得手 段と、 複数の項目で構成されているユーザの嗜好情報を記憶する第 2の記憶手段 と、 第 2の取得手段により取得された属性情報と、 第 2の記憶手段により記憶さ れているユーザの嗜好情報との類似度を、 第 1の重み付け情報と第 1の重み付け 情報とは異なる第 2の重み付け情報のうちの少なくともいずれか一方の情報を用 いて算出することにより、 ユーザの嗜好と合致したコンテンツを示す推薦情報を 生成する推薦情報生成手段とを備え、 第 1の重み付け情報および第 2の重み付け 03 015925
10
情報は、 属性情報とユーザの嗜好情報との類似度の算出における、 複数の項目そ れぞれの寄与の度合いを規定することを特徴とする。
第 1の情報処理装置で、 コンテンツに関する情報が取得され、 コンテンツに関 する情報に基づいて、 複数の項目で構成される属性情報が生成され、 生成された 属性情報の項目に対応する第 1の重み付け情報が記憶され、 第 1の重み付け情報 から、 コンテンツが有する条件に合致する第 1の重み付け情報が抽出されて、 属 性情報に対応付けられて送信され、 第 2の情報処理装置で、 複数の項目で構成さ れているコンテンツの属性情報と第 1の重み付け情報が取得され、 複数の項目で 構成されているユーザの嗜好情報が記憶され、 属性情報と、 ユーザの嗜好情報と の類似度が、 第 1の重み付け情報と第 1の重み付け情報とは異なる第 2の重み付 け情報のうちの少なくともいずれか一方の情報が用いられて算出され、 ユーザの 嗜好と合致したコンテンツを示す推薦情報が生成される。 また、 第 1の重み付け 情報および第 2の重み付け情報は、 属性情報とユーザの嗜好情報との類似度の算 出における、 複数の項目それぞれの寄与の度合いを規定するものである。
本発明の第 3の情報処理装置は、コンテンッの属性情報を取得する取得手段と、 ユーザの嗜好を示す第 1の情報と、 一般的な嗜好を示す第 2の情報とを基に、 一 般的な嗜好に対するユーザの嗜好の偏りを示す第 3の情報を生成する偏り情報生 成手段とを備えることを特徴とする。
属性情報、 第 1の情報、 およぴ第 3の情報は、 それぞれ複数の項目により構成 されるものとすることができ、 第 3の情報を用いて、 属性情報と第 1の情報との 項目ごとの類似度を算出して、 ユーザの嗜好と合致したコンテンツを選択する選 択手段を更に備えさせるようにすることができる。
第 1の情報および第 2の情報は、 それぞれ複数の項目により構成されるものと することができ、 偏り情報生成手段には、 第 3の情報として、 第 1の情報と第 2 の情報との類似度が低い項目を示す情報を生成させるようにすることができる。 ユーザの操作履歴を取得する操作履歴取得手段と、 操作履歴取得手段により取 得された操作履歴を基に、 第 1の情報を生成する嗜好情報生成手段とを更に備え 2003/015925
11
させるようにすることができる。
偏り情報生成手段には、 第 1の情報として、 所定のコンテンツ群のうち、 ユー ザが試聴したコンテンツを所定の項目ごとに計数した第 1の値を算出させ、 第2 の情報として、 所定のコンテンツ群の全コンテンツを所定の項目ごとに計数した 第 2の値を算出させ、 第 1の値を第 2の値で正規化させることにより、 第 3の情 報を生成させるようにすることができる。
所定のコンテンッ群は、 所定の期間中に放送または配信されたコンテンツの集 合であるものとすることができる。
偏り情報生成手段には、 複数の異なる期間中に放送または配信されたコンテン ッの集合を、 それぞれ、.複数の所定のコンテンツ群として、 複数の第 1の値およ ぴ第 2の値を算出させるようにすることができ、 第 1の値を、 同一のコンテンツ 群に対応する第 2の値で正規化することにより、 第 3の情報を、 複数生成させる ようにすることができる。
所定のコンテンツ群は、 所定の時間帯に放送または配信されたコンテンツの集 合であるものとすることができる。
第 1の情報は、 コンテンツの属性情報のうち、 ユーザが好むコンテンツを表す 項目を示す情報であるものとすることができる。
第 1の情報は、 コンテンツの属性情報のうち、 ユーザが好まないコンテンツを 表す項目を示す情報であるものとすることができる。
本発明の第 3の情報処理方法は、 ユーザの嗜好を示す第 1の情報を取得する第 1の取得ステップと、 一般的な嗜好を示す第 2の情報を取得する第 2の取得ステ ップと、 第 1の取得ステップの処理により取得された第 1の情報と、 第 2の取得 ステップの処理により取得された第 2の情報とを基に、 一般的な嗜好に対する、 ユーザの嗜好の偏りを示す第 3の情報を生成する偏り情報生成ステップとを含む ことを特徴とする。
本発明の第 3の記録媒体に記録されているプログラムは、 ユーザの嗜好を示す 第 1の情報を取得する第 1の取得ステップと、 一般的な嗜好を示す第 2の情報を 取得する第 2の取得ステップと、 第 1の取得ステップの処理により取得された第 1の情報と、 第 2の取得ステツプの処理により取得された第 2の情報とを基に、 一般的な嗜好に対する、 ユーザの嗜好の偏りを示す第 3の情報を生成する偏り情 報生成ステップとを含むことを特徴とする。
本発明の第 3のプログラムは、 ユーザの嗜好を示す第 1の情報を取得する第 1 の取得ステップと、 一般的な嗜好を示す第 2の情報を取得する第 2の取得ステツ プと、 第 1の取得ステップの処理により取得された第 1の情報と、 第 2の取得ス テツプの処理により取得された第 2の情報とを基に、 一般的な嗜好に対する、 ュ 一ザの嗜好の偏りを示す第 3の情報を生成する傭り情報生成ステップとを含むこ とを特徴とする。
ユーザの嗜好を示す第 1の情報と、 一般的な嗜好を示す第 2の情報とを基に、 ユーザの嗜好の偏りを示す第 3の情報が生成される。 図面の簡単な説明
図 1は、 テレビジョン番組放送、 およびストリームデータの配信について説明 する図である。
図 2は、 図 1の配信サーバの構成を示すプロック図である。
図 3は、 番組べク トル生成処理 1について説明するフローチャートである。 図 4は、 E P Gデータを説明する図である。
図 5は、 番組ベク トルについて説明する図である。
図 6は、 番組べク トル生成処理 2について説明するフローチャートである。 図 7は、 グループ化処理 1について説明するフローチヤ一トである。
図 8は、 グループ化処理 2について説明するフローチヤ一トである。
図 9は、 タイ トルグループ化処理 1について説明するフローチャートである。 図 1 0は、タイトルグループ化処理 2について説明するフローチヤ一トである。 図 1 1は、タイトルグループ化処理 3について説明するフローチヤ一トである。 図 1 2は、タイ トルグループ化処理 4について説明するフローチャートである。 図 1 3は、 図 1の番組推薦処理装置の構成を示すブロック図である。
図 1 4は、 正履歴べク トルおよび負履歴べクトル生成処理 1について説明する フローチヤ一トである。
図 1 5は、 正履歴べク トルを説明する図である。
図 1 6は、 正履歴べクトルおよび負履歴べクトル生成処理 2について説明する フローチヤ一トである。
図 1 7は、 マッチング処理 1について説明するフローチヤ一トである。
図 1 8は、 マッチング処理 2について説明するフローチヤ一トである。
図 1 9は、 マッチング処理 3について説明するフローチヤ一トである。
図 2 0は、 マッチング処理 4について説明するフローチャートである。
図 2 1は、 マッチング処理 5について説明するフローチヤ一トである。
図 2 2は、 ユーザ側効き目べク トル生成処理 1について説明するフローチヤ一 トである。
図 2 3は、 ユーザ側効き目べクトル生成処理 2について説明するフローチヤ一 トである。
図 2 4は、 ユーザ側効き目べク トル生成処理 3について説明するフローチヤ一 トである。
図 2 5は、 ユーザ側効き目べクトル生成処理 4について説明するフローチヤ一 トである。
図 2 6は、 ユーザ側反効き目べクトル生成処理 1について説明するフローチヤ 一トである。
図 2 7は、 ユーザ側反効き目べクトル生成処理 2について説明するフローチヤ ートである。
図 2 8は、 グループ推薦を含むマッチング処理について説明するフローチヤ一 トである。
図 2 9は、 ユーザモデルを用いたマッチング処理について説明するフローチヤ ートである。 図 3 0は、 例外推薦処理について説明するフローチヤ一トである。
図 3 1は、 図 1のテレビジョン受信装置の構成を示すブロック図である。
図 3 2は、 図 1のテレビジョン表示装置の構成を示すブロック図である。
図 3 3は、 推薦情報表示処理について説明するフローチャートである。
図 3 4は、 自動チャンネル設定処理について説明するフローチャートである。 図 3 5は、 図 1の録画再生装置の構成を示すプロック図である。
図 3 6は、 自動録画処理について説明するフローチヤ一トである。
図 3 7は、 配信サーバの異なる構成例を示すプロック図である。
図 3 8は、 番組推薦処理装置の異なる構成例を示すブロック図である。
図 3 9は、 テレビジョン番組放送、 およびストリームデータの配信のためのネ ットワークの異なる例について説明する図である。
図 4 0は、 配信サーバの異なる構成例を示すブロック図である。 発明を実施するための最良の形態
以下、 図を参照して、 本発明の実施の形態について説明する。
図 1を用いて、 テレビジョン番組放送、 およびス トリームデータの配信につい て説明する。
放送局 1は、 地上波の番組放送を送信するか、 もしくは、 衛星 2を介して衛星 波の番組放送を送信する。 図 1においては、 放送局 1を 1つだけ図示して説明し ているが、 放送局 1が、 複数存在することは言うまでもない。 テレビジョン受信 装置 4のアンテナ 3は、 地上波、 または衛星波の番組放送を受信する。 放送信号 には、 必要に応じて、 E P G (Electronic Program Guide) が含まれている。 配信サーバ 5は、 ストリーミングデータデータベース 6から、 ス トリーミング データを読み出し、 インターネットその他のネットワークを含むネットワーク 8 を介して、 テレビジョン受信装置 4に配信するとともに、 メタデータデータべ一 ス 7力、ら、 放送局 1から放送される番組に関する情報である E P G、 あるいは、 E P Gよりも詳細な情報を含むメタデータを読み出して、 番組ごとに、 番組べク トル PPを生成し、 E P Gデータとともに、 ネットワーク 8を介して、 E P G受信 装置 9に配信する。
一般的な放送信号に重畳される E PGの情報量が、 以下に説明する処理に十分 な情報である場合、 処理には、 一般的な放送信号に重畳される E PGと同一のも のを利用するようにしても良い。 また、 一般的な放送信号に重畳される E P Gの 情報量が、以下に説明する処理に十分な情報であるとはいえない場合、処理には、 一般的な放送信号に重畳される E PGに加えて、 もしくは単独で、 メタデータを 利用するようにしても良い。 以下、 一般的な放送信号に重畳される E PGでは、 処理に十分な情報量がないため、 本実施の形態では、 メタデータを含む情報を利 用するものとし、 この情報を、 E PGデータと総称するものとする。
E PG受信装置 9は、 配信された E PGデータを、 テレビジョン受信装置 4に 供給する。 また、 E PG受信装置 9は、 E PGデータとともに配信された番組べ ク トル PPを、 番組推薦処理装置 1 0に供給する。
チューナを有するテレビジョン受信装置 4は、 操作部を有するテレビジョン表 示装置 1 1、 または、 録画再生装置 1 2から供給されるチャンネルの選択を示す 制御信号に基づいて、 アンテナ 3を介して、 地上波、 または衛星波の放送信号を 選局して受信するとともに、 ネットワーク 8を介して、 配信サーバ 5から、 スト リーミングデータの配信を受ける。 また、 テレビジョン受信装置 4は、 E PG受 信装置 9から、 E PGデータの供給を受け、テレビジョン表示装置 1 1、または、 録画再生装置 1 2に供給する。 なお、 テレビジョン受信装置 4は、 受信した放送 波に、 E P Gが含まれていた場合、 番組の信号と分離して、 それぞれ、 テレビジ ヨン表示装置 1 1、 または、 録画再生装置 1 2に供給する。
番組推薦処理装置 1 0は、 E PG受信装置 9から、番組べク トル PPを取得する とともに、 テレビジョン表示装置 1 1およぴ録画再生装置 1 2から、 操作口グを 取得し、 これらの情報、 または、 ユーザの操作入力を基に、 ユーザの嗜好に合致 した番組を推薦するための推薦情報を生成し、 テレビジョン表示装置 1 1および 録画再生装置 1 2に供給する。 テレビジョン表示装置 1 1は、 ユーザの操作入力を基に、 テレビジョン受信装 置 4から供給された放送信号、 または、 録画再生装置 1 2から供給された再生信 号を表示したり、 番組推薦処理装置 1 0から供給された推薦情報を基に、 チャン ネルを自動設定したり、推薦番組情報を表示する。テレビジヨン表示装置 1 1は、 ユーザの操作履歴である操作ログを番組推薦処理装置 1 0に供給する。
録画再生装置 1 2は、 ユーザの操作入力を基に、 テレビジョン受信装置 4から 供給された放送信号を、 装着された記録媒体、 または、 内蔵する記録媒体 (例え ば、 ハードディスク) に録画したり、 番組推薦処理装置 1 0から供給された推薦 情報を基に、 テレビジョン受信装置 4から供給された放送信号を、 装着された記 録媒体、または、内蔵する記録媒体に自動録画する。また、録画再生装置 1 2は、 装着された記録媒体、または、内蔵する記録媒体に録画されている番組を再生し、 テレビジョン表示装置 1 1に出力して表示させる。 更に、 録画再生装置 1 2は、 ユーザの操作履歴である操作ログを番組推薦処理装置 1 0に供給する。
ここでは、 E P G受信装置 9、 テレビジョン受信装置 4、 番組推薦処理装置 1 0、 テレビジョン表示装置 1 1、 および、 録画再生装置 1 2を、 それぞれ異なる 装置として説明したが、これらの装置は、個別に構成されなくてもよレ、。例えば、 E P G受信装置 9、 テレビジョン受信装置 4、 および、 テレビジョン表示装置 1 1を、 チューナ機能を内蔵したテレビジョン受像機 1 5— 1として、 一体的に構 成するようにしても良いことは、 言うまでもない。 更に、 録画再生装置 1 2も一 体的に構成して、 録画機能を有するテレビジョン受像機 1 5— 2として構成する ようにしても良い。 この録画再生装置 1 2は、 記録媒体として、 大容量のハード ディスクを有する、 いわゆるハードディスクレコーダであってもよいことは言う までもない。 また、 番組推薦処理装置 1 0を、 チューナ機能を内蔵したテレビジ ョン受像機 1 5— 1に内蔵して、テレビジョン受像機 1 5— 3としても、または、 録画機能を有するテレビジョン受像機 1 5— 2に内蔵して、 テレビジョン受像機 1 5— 4とするようにしても良い。
図 2は、 配信サーバ 5の構成を示すプロック図である。 データ取得部 2 1は、 メタデータデータベース 7およぴストリーミングデータ データベース 6からデータを取得し、 データ送信部 2 5に供給するとともに、 E P Gデータを、 メタデータ抽出部 2 2に供給する。 また、 データ取得部 2 1は、 メタデータデータベース 7に登録されている E P Gデータを、 その内容により、 グループ化する処理を実行する。
メタデータ抽出部 2 2は、データ取得部 2 1から供給された E P Gデータから、 番組べクトル PPを生成するために必要なデータを抽出し、番組べク トル生成部 2 3に供給する。 番組べクトル生成部 2 3は、 メタデータを基に、 番組べク トル PP を生成し、 必要に応じて、 データ記憶部 2 4に記憶されている番組側効き目べク トル Ef PPを対応付けて、 データ送信部 2 5に供給する。
データ記憶部 2 4は、番組べク トル PPを生成する場合に必要な情報である番組 側効き目べクトル EfPPを、 必要に応じて記憶する。
いかに視聴率を稼ぐかという制作側、 放送側の観点に基づいて、 例えば、 教養 系番組においては、 ジャンルや内容の要素が強いという特性、 パラエティ番組な どにおいては、 出演者の要素が強いという特性、 ドラマなどにおいては、 出演者 およぴ脚本家の要素が強いという特性がある。 番組の特徴を正しく抽出するため には、 これらの特性を利用する必要がある。 すなわち、番組べク トル PPを構成す る要素のうち、 ユーザの嗜好に合致した番組を推薦するために実行されるマッチ ング処理において、どの要素が重要であるかは、番組のジャンルによって異なる。 すなわち、番組のジャンルが「教養 ·ドキュメント」である場合、重要な項目は、 出演者ではなく、 その内容や題名である。 これに対して、 番組のジャンルが 「バ ラエティ」 のとき、 重要な項目は出演者であり、 番組のジャンルが 「ドラマ」 で あるとき、重要な項目は、 出演者と脚本家である。 これらを番組べク トル PPの生 成に利用する場合、 番組のジャンル別に、 項目ごとの、 マッチング処理における 寄与の度合いを規定する番組側効き目べク トルが設定され、 データ記憶部 2 4に 記憶される。
データ送信部 2 5は、 データ取得部 2 1から供給された、 E P Gデータおょぴ ストリーミングデータ、 並びに、 番組べク トル生成部 2 3から供給された番組べ クトル PP、 および、 番組側効き目べク トル EfPPを、 ネットワーク 8を介して、 E P G受信装置 9、 または、 テレビジョン受信装置 4に送信する。
また、 番組べクトル生成部 2 3には、 必要に応じて、 ドライブ 2 6が接続され る。 ドライブ 2 6には、 必要に応じて、 磁気ディスク 3 1、 光ディスク 3 2、 光 磁気ディスク 3 3、 および半導体メモリ 3 4が装着され、 データの授受を行う。 次に、 図 3のフローチャートを参照して、 配信サーバ 5が実行する番組べタト ル生成処理 1について説明する。
ステップ S 1において、データ取得部 2 1は、メタデータデータベース 7から、 メタデータで構成されている E P Gデータの供給を受ける。
ステップ S 2において、 メタデータ抽出部 2 2は、 データ取得部 2 1から E P Gデータの供給を受け、番組べクトル PPを生成するために必要なメタデータを抽 出し、 番組べク トル生成部 2 3に出力する。
図 4に、 メタデータの例を示す。 メタデータには、例えば、 ジャンルとして 「映 画一邦画」 、 映画の題名として 「東海道三谷怪談」 、 放送された年月日および配 給元のデータ、 放送の日時、 放送する放送局名、 並びに、 放送時刻などが含まれ ている。 更に、 メタデータには、 監督名、 脚本家名、 撮影者 (カメラマン) 、 音 楽担当者、 出演者などのデータ、 および、 この番組の内容として、 映画の解説な どが含まれている。
ステップ S 3において、 番組ベク トル生成部 2 3は、 メタデータに含まれてい る、 タイ トル、 内容などを、 必要に応じて形態素解析し、 単語に分解する。 具体 的には、 番組ベクトル生成部 2 3は、 メタデータに含まれている映画の題名をタ ィ トルとして、 「東海道」 、 「三谷」 、 「怪談」 の 3つの単語に分解する。 また、 番組ベク トル生成部 2 3は、 メタデータに、 映画の解説として、 図 4に示される ように、 「, 5 9新西宝 様式美たっぷりに有名な "三谷怪談" の世界を描く邦画 ホラーの傑作。 」 という情報が含まれていた場合、 解説に含まれている単語を抽 出して、 「西宝」 、 「様式」 、 「美」 、 「たっぷり」 、 「有名」 、 「三谷」 、 「怪 談」 、 「世界」 、 「描く」 、 「邦画」 、 「ホラー」 、 「傑作」 を内容情報とする。 ステップ S 4において、 番組ベクトル生成部 2 3は、 メタデータに含まれてい るそれぞれの項目をべク トル化し、番組べクトル PPが生成されて、処理が終了さ れる。 生成された番組べク 'トル PPは、データ送信部 2 5に出力されて、ネットヮ ーク 8を介して、 E PG受信装置 9に送信される。 項目のベク トル化は、 全ての 詳細要素を 1列として並べるようにしても良いし、 大項目に分離した後に、 大項 目ごとにベタトル化するようにしても良い。
大項目別にベク トル化が行われる場合、 例えば、 図 5に示されるように、 大項 目を、 タイ トル、 ジャンル、 時間帯、 放送局、 出演者、 脚本 原作 Z演出、 内容 の 7項目として、番組ベク トル PP= (Tm, Gtn, Pm, Am, Km) が生成される。 そして、各項目の内容が、 タイトル (Title) Tm= {title 1, title2, · · · } 、 ジャンル (Genre) Gm= {ドラマ, バラエティ, スポーツ, 映画, 音楽, 子供向 け/教育, 教養 Zドキュメント, ニュース/報道, その他 } 、 時間帯(Hour) Hm = {朝, 昼, 夕方, ゴールデン, 深夜 } 、 放送局(TV Station) Sm= {NNK 総合, NNK教育, 亜細亜テレビ, TT S, プジ, テレ日, 東都, NNK衛星第 1, NNK衛星第 2, WOWO} 、 出演者(Person) Pm= {person A, person B , · ■ · } ft本 Z原作 Z演出等(Author) Am二 {person a, person b, ■ · ■ } 内容 (Keyword) Km二 {kwl , kw 2 , ■ ■ ■ } として、 ベク トル化される。
上述した 7つの大項目の中で、 大項目 「ジャンル」 、 「放送局」 、 「時間帯」 は、 種類が固定できるため、 詳細要素をそれぞれ数値べク トルで表すことができ る。 放送局の場合、 例えば、 放送局 S 111= {NNK総合, NNK教育, 亜細亜テ レビ, TT S, ブジ, テレ日, 東都, NNK衛星第1, NNK衛星第 2, WOW O}において、対応する番組の放送局が WOWOである場合、放送局べク トルは、 放送局 Sm= { 0, 0, 0, 0, 0, 0, 0, 0, 0, 1 } で表すことができる。 ジャンルの場合、 例えば、 ジャンル Gm= {ドラマ, バラエティ, スポーツ, 映 画, 音楽, 子供向け Z教育, 教養/ドキュメント, ニュース Z報道, その他 } に おいて、 対応する番組のジャンルが、 教養/ドキュメントであった場合、 ジヤン ノレべク トノレは、 ジヤンノレ Gm= { 0 , 0, 0, 0, 0, 0, 1, 0, 0 } で表す ことができる。
一方、 大項目 「タイ トル」 、 「出演者」 、 「脚本 Z原作 Z演出」 、 「内容」 な どの、 数値べク トルで表すことのできない項目においては、 べクトルに含まれる 単語の頻度などによって、 項目値 (単語) と重み (数値) が対応付けられる。 例 えば、 大項目 「タイ トル」 は、 タイ トル Tm= {東海道一 1, 三谷一 1, 怪談一 1} のように、 それぞれ、 単語一数値で構成される要素によって表される。 この 例における、 例えば、 「東海道— 1」 は、 「東海道」 の単語の頻度が 「 1である ことを意味する。
このような処理により、番組べクトル PPが生成されて、 EPG受信装置 9に送 信される。 具体的には、 図 4を用いて説明した番組メタデータから番組ベク トル PPが生成された場合、 番組べク トル PP= {タイトル Tm= {東海道一 1 , 三谷一 1, 怪談一 1 } 、 ジャンル Gm= { 0 , 0, 0, 1, 0, 0, 0, 0, 0} 、 時 間帯 Hm二 { 0 , 0, 0, 0, 1 } 、 放送局 Sm= {0, 0, 0, 0, 0, 0, 0, 0, 0, 1 } 、 出演者 Pm= {若杉嘉津美一 1, 天海茂一 1 , 江見俊彦一 1, 中村竜ニ郎ー 1, 西沢典子一 1 } 、 脚本/原作/演出 Am= {中川信男一 1, 大 貫正一一 1 , 石田義寛ー 1, 西本正ニー 1, 渡辺宙太ー 1 } 、 内容 Km= (西宝 - 1, 様式一 ; L , 美— 1, たっぷり— 1, 有名一 1, 三谷一 1, 怪談一 1, 世界 一 1, 描く— 1, 邦画一 1, ホラ一一 1, 傑作一 1 } } が生成されて、 EPG受 信装置 9に送信される。
このように生成される番組べクトル PPにおいて、 例えば、 出演者 Pmの構成要 素のうち、 主演を重み付けしたり、脚本ノ原作 Z演出 Amの構成要素のうち、監督 を重み付けして、番組べクトノレ PPを生成するようにしても良い。このような場合、 番組べクトル PPの構成要素は、 例えば、 出演者 Pm= {若杉嘉津美一 3, 天海茂 一 2, 江見俊彦一 1 , 中村竜ニ郎ー 1, 西沢典子一 1 } 、 脚本/原作 Z演出 Am = {中川信男一 3, 大貫正一一 1, 石田義寛ー 1 , 西本正ニー 1, 渡辺宙太ー 1 } となる。 また、番組べク トル PPを生成するために、 どの要素が重要であるかは、上述し たように、 番組のジャンルによって異なる。 ジャンルごとにどのような要素が重 要であるかを示した番組側効き目べク トル Ef PPが、番組側効き目べタトル情報と して、 データ記憶部 2 4に記憶されている場合、 番組側効き目べク トル EfPPを、 番組べクトル PPに対応付けて送信するようにしても良い。番組側効き目べク トル EfPPは、 番組べク トル PPの大項目に対応して設定される。
番組べク トル PP= {タイ トル T m, ジャンル G m, 時間帯 Hm, 放送局 S m, 出演 者 P m, 脚本/原作/演出 Am, 内容 K m } において、 例えば、 番組のジャンルが 「教養/ドキュメント」 である場合、 重要な項目は、 その内容や題名 (重み付け 値が 3の場合) であるので、番組側効き目ベク トル EfPP= { 3, 1, 1 , 1 , 1, 1, 3 } となる。 これに対して、 番組のジャンルが 「バラエティ」 のとき、 重要 な項目は出演者(重み付け値が 5の場合)であるので、番組側効き目べク トル EfPP = { 1 , 1, 1 , 1, 5, 1, 1 } となる。 また、 番組のジャンルが 「ドラマ」 であるとき、 重要な項目は、 出演者 (重み付け値が 2の場合) と脚本家であり、 特に脚本家が重要 (重み付け値が 3の場合) である場合、 番組側効き目べク トル EfPP= { 1 , 1, 1, 1 , 2, 3 , 1 } となる。
次に、 図 6のフローチャートを参照して、番組側効き目べクトル EfPP力 番組 ベタトル PPに対応付けて送信される場合の、番組べク トル生成処理 2について説 明する。
ステップ S 1 1乃至ステップ S 1 4において、 図 3を用いて説明したステップ S 1乃至ステップ S 4の処理と同様の処理が実行される。 すなわち、 メタデータ データベース 7から、 E P Gデータの供給を受け、 E P Gデータから、 番組べク トル PPを生成するために必要なメタデータが抽出され、メタデータに含まれてい る、タイトル、内容などが、必要に応じて形態素解析されて、単語に分解される。 そして、 メタデータに含まれているそれぞれの項目がベク トル化されて、 番組べ ク トノレ PPが生成される。
ステップ S 1 5において、 番組べク トル生成部 2 3は、 供給されたメタデータ の番組のジャンルに基づいて、 対応する効き目ベクトルを、 データ記憶部 2 4に 記憶されている効き目べクトル情報から抽出する。例えば、番組のジャンルが「バ ラエティ」 のとき、 データ記憶部 2 4から、 出演者に対する重み付けを行う効き 目ベク トル EfPP= { 1, 1, 1, 1, 5, 1 , 1 } が抽出される。
ステップ S 1 6において、 番組ベク トル生成部 2 3は、 ステップ S 1 5におい て抽出された効き目べク トル EfPPを、ステップ S 1 4において生成された番組べ ク トル PPと対応付けて、 処理が終了される。
このような処理により、番組べクトル PPが生成されて、番組のジャンルに基づ いて、重要な項目に重み付けを施すための番組側効き目べク トル EfPPが対応付け られて、 ネットワーク 8を介して、 E P G受信装置 9に送信される。
以上説明したようにして、番組べク トル PPが生成されるが、例えば、番組をそ の属性ごとにグループ化することにより、 番組ベクトル PPを、 少ない演算量で、 正確に作成するようにすることができる。
番組のグループ化は、例えば、連続ドラマ、 1週単位の同一ジャンルの番組群、 番組編成単位 (1 3週) の出演者ごとの番組群などで生成できるが、 その具体例 として、 次の図 7のフローチャートを参照して、 連続ドラマをグループ化する場 合のグループ化処理 1について説明する。
ステップ S 3 1において、 データ取得部 2 1は、 メタデータデータベース 7に 登録されている E P Gデータから、 例えば、 同一タイトル、 同一放送局で、 放送 時刻が平日の同時刻や、 同じ曜日の同時刻であるなどの所定の条件 (グループ化 のための条件) に合致した番組を抽出する。
ステップ S 3 2において、 データ取得部 2 1は、 抽出された番組をグループ化 し、 対応する番組の E P Gデータにグループ I Dをつける。
ステップ S 3 3において、 メタデータ抽出部 2 2は、 同一グループ I Dを有す る、 すなわち、 連続ドラマであると認識された番組の第 1回目の放送の番組べク トル生成に必要なメタデータを抽出する。
3 4において、 図 3または図 6を用いて説明した番組べク トル生成 P T/JP2003/015925
23
処理が実行される。
ステップ S 3 5において、 番組べクトル生成部 3 3は、 対応するグループ I D の番組べク トノレ PPを、第 1回の放送分の番組べク トルに固定して設定し、処理が 終了される。
このような処理により、 連続ドラマがグループ化されて、 番組ベクトルが統一 される。 また、 グループ I Dと番組べク トル PPとを、 対応付けて、 データ記憶部 2 4に記憶しておくようにしても良い。
特に、 連続ドラマの E P Gデータにおいて、 初回の内容は、 番組全体の解説に なっているが、 初回以外の内容は、 その回の分の解説となっていることが多く、 番組全体の内容を表してはいない。 また、 内容以外の部分のメタデータは毎回ほ ぼ同じであることから、初回分の E P Gデータを採用して番組べクトル PPを生成 することにより、 番組べクトル生成処理の処理回数を減少することができるのみ ならず、より正確に番組の特性と合致した番組べクトル PPを生成することが可能 になる。
図 7においては、 連続ドラマの E P Gデータに同一の I Dを付加する処理につ いて説明したが、 E P Gデータに、 連続ドラマを区別する情報が予め含まれてい る場合、 ステップ S 3 1の処理を省略して、 E P Gデータに含まれている連続ド ラマを区別する情報を参照して、 連続ドラマの E P Gに同一の I Dを付加するよ うにしても良い。
次に、 図 8のフローチャートを参照して、 連続ドラマ以外の要素によってもグ ループ化を行うことができるグループ化処理 2について説明する。 ここでは、 ジ ヤンルおよび出演者によるグループ化を行うものとして説明する。
ステップ S 5 1において、 データ取得部 2 1は、 メタデータデータベース 7に 登録されている E P Gデータを参照して、 番組の E P Gデータに、 メタデータの 内容に対応したクラスタコードを付加する。
例えば、 同一タイ トル、 同一放送局で、 放送時刻が平日の同時刻や、 同じ曜日 の同時刻であるなどの、 連続ドラマである条件に合致した番組を抽出し、 抽出さ 3 015925
24
れた、 連続ドラマであると認識される番組群の中で、 例えば、 連続ドラマの放送 時刻によって、 平日の同時刻であればコード 1、 同じ曜日の同時刻であればコー ド 2、 隔週、 隔日など、 コード 1およびコード 2以外の放送時刻であればコード 3などの、最小桁の第 1のクラスタコードが決定される。連続ドラマでない場合、 最小桁の第 1のクラスタコードは 0となる。
次に、 メタデータデータベース 7に登録されているメタデータのジャンルに関 するデータを参照して、 そのジャンルごとに、 例えば、 コード 2 0、 コード 3 0 などの、 下位から 2桁目 (1 0の位) に数値を有する第 2のクラスタコードが決 定される。
最後に、 メタデータデータベース 7に登録されているメタデータの出演者のデ ータを参照して、 例えば、 コード 2 3 0 0、 コード 8 0 0など、 下位から 2桁目 以上 (1 0 0以上の位) を用いて表される第 3のクラスタコードが決定される。 そして、 第 1乃至第 3のクラスタコードの合計値が、 その番組の E P Gに付加 されるクラスタコードとなる。
ステップ S 5 2において、 データ取得部 2 1は、 クラスタコードの 1桁目が 0 であるか否かを基に、 対応する E P Gは、 連続ドラマのものであるか否かを判断 する。
ステップ S 5 2において、 連続ドラマであると判断された場合、 ステップ S 5 3およびステップ S 5 4において、 図 7のステップ S 3 3およびステップ S 3 4 と同様の処理が実行される。 すなわち、 第 1回目の放送の E P Gが抽出されて、 図 3または図 6を用いて説明した番組べク トル生成処理が実行される。
ステップ S 5 5において、 番組べク トル生成部 3 3は、 この連続ドラマの番組 ベタトル PPを、 第 1回の放送分の番組べク トル PPに固定して設定し、 番組べク トル PPに、 生成したクラスタコードを対応付けて設定し、 処理が終了される。 ステップ S 5 2において、 連続ドラマではないと判断された場合、 ステップ S 5 6において、 図 3または図 6を用いて説明した番組べク トル生成処理が実行さ れる。 ステップ S 5 7において、番組べク トル生成部 3 3は、番組べクトノレ PPに生成 したクラスタコードを対応付けて、 処理が終了される。
このような処理により、 連続ドラマ以外であっても、 ジャンルや出演者によつ て番組べクトル PPをグループ化することが可能となり、グループを示すクラスタ コードと、 番組べク トル PPとを対応付けることができる。
図 2を用いて説明した配信サーバ 5において、 図 3乃至図 8を用いて説明した ようにして番組べク トノレ PPが生成されるので、常に新しい用語やジャンルなどに 対応した番組べクトル PPを生成することが可能となる。生成された番組べク トル PPは、 E P Gデータとともに、 ネットワーク 8を介して、 E P G受信装置 9に受 信され、 番糸且推薦処理装置 1 0に供給される。
また、 グループ化処理は、 タイトルを形態素解析して、 単語に分解し、 単語ご とにグループ I Dを付けることにより行うようにしてもよい。
次に、 図 9のフローチャートを参照して、 タイ トルグループ化処理 1について 説明する。
ステップ S 6 1において、 データ取得部 2 1は、 メタデータデータベース 7に 登録されている E P Gデータを参照して、 登録されているメタデータから、 タイ トルを抽出し、 番組べク トル生成部 2 3に供給する。
ステップ S 6 2において、 番組べク トル生成部 2 3は、 タイ トルを形態素解析 し、 単語に分解する。 具体的には、 メタデータに含まれている映画の題名が 「東 海道三谷怪談」であった場合、 これがタイ トルとして形態素解析されるので、 「東 海道」 、 「三谷」 、 「怪談」 の 3つの単語が得られる。
ステップ S 6 3において、 番組べク トル生成部 2 3は、 解析された単語、 もし くは、 複数の単語から構成される単語群のうちのいずれかを抽出して、 データ記 憶部 2 4から、 抽出された単語、 または単語群に対応するグループ I Dを抽出す る。
ここで、 複数の単語から構成される単語群とは、 形態素解析により得られた単 語の組み合わせにより生成される単語群であり、 例えば、 形態素解析により得ら れた単語が 「東海道」 、 「三谷」 、 「怪談」 である場合、 単語群は、 「東海道 · 三谷」 、 「東海道 '怪談」 、 「三谷'怪談」 となる。
ステップ S 6 4において、番組べク トル生成部 2 3は、データ記憶部 2 4から、 対応するグループ I Dが抽出されたか否かを判断する。
ステップ S 6 4において、 対応するグループ I Dが抽出されなかったと判断さ れた場合、 抽出された単語、 もしくは、 複数の単語から構成される単語群には、 まだグループ I Dが付けられていないので、 ステップ S 6 5において、 番組べク トル生成部 2 3は、 抽出された単語、 もしくは、 複数の単語から構成される単語 群に新たなグループ I Dを対応付ける。また、番組べク トル生成部 2 3は、単語、 もしくは、複数の単語から構成される単語群と、それに対応するグループ I Dを、 データ記憶部 2 4に記憶させる。
ステップ S 6 4において、 対応するグループ I Dが抽出されたと判断された場 合、 または、 ステップ S 6 5の処理の終了後、 ステップ S 6 6において、 番組べ クトル生成部 2 3は、 タイ トルを構成する全ての単語、 もしくは、 複数の単語か ら構成される単語群についてグループ I Dを抽出したか否かを判断する。
ステップ S 6 6において、 タイトルを構成する全ての単語、 もしくは、 複数の 単語から構成される単語群についてグループ I Dを抽出していないと判断された 場合、 処理は、 ステップ S 6 3に戻り、 それ以降の処理が繰り返される。
ステップ S 6 6において、 タイトルを構成する全ての単語、 もしくは、 複数の 単語から構成される単語群についてグループ I Dが抽出されたと判断された場合、 ステップ S 6 7において、 番組べク トル生成部 2 3は、 番組べクトルに、 抽出さ れたグループ I Dを対応付けて、 処理が終了される。
このような処理により、 番組ベクトルに、 タイ トルを構成する単語、 または単 語群に対応するグループ I Dが対応付けられて、 データ送信部 2 5により、 ネッ トワーク 8を介して、 テレビジョン受信装置 4または、 E P G受信装置 9に送信 される。
また、 類似したタイトルの番組を、 同一のグループとするようにしても良い。 P T/JP2003/015925
27
例えば、 タイ トル 「 2年 A組銀八先生」 の連続ドラマと、 タイ トル 「2年 A組銀 八先生スペシャル」 の特別番組とを、 同一のグループとしてグループ化すること ができるように、 タイトルを構成する単語の形態素解析結果を基に、 例えば、 2 週間、 1ヶ月、 半年などの所定の期間の番組タイ トルで、 単語の一致率を総当り で算出し、 単語の一致率が所定の値以上である場合、 同一グループとするように 次に、 図 1 0のフローチャートを参照して、 タイトルを構成する単語の一致率 によりグループ化を実行するタイ トルグループ化処理 2について説明する。
ステップ S 4 0 1およびステップ S 4 0 2において、 図 9を用いて説明した、 ステップ S 6 1およびステップ S 6 2と同様の処理が実行される。 すなわち、 デ ータ取得部 2 1は、 メタデータデータベース 7に登録されている E P Gデータを 参照して、 登録されているメタデータから、 タイトルを抽出し、 番組べクトル生 成部 2 3に供給し、 番組べク トル生成部 2 3は、 タイ トルを形態素解析し、 単語 に分解する。
ステップ S 4 0 3において、 番組べク トル生成部 2 3は、 解析された単語を基 に、 タイ トル間の単語の一致度、 すなわち、 単語が一致している割合を示す一致 率を算出する。
具体的には、 タイ トル 「2年 A組銀八先生」 と、 タイトル 「2年 A組銀八先生 スペシャル」 とが、 それぞれ、 「2」 「年」 「A j 「組」 「銀八」 「先生」 と、 「2」 「年」 「A」 「組」 「銀八」 「先生」 「スペシャル」 とに形態素分析され た場合、 この 2つの番組のタイ トルを構成する単語の一致率は、 6 Z 7で 8 5 . 7 %となる。
ステップ S 4 0 4において、 番組ベク トル生成部 2 3は、 単語が、 例えば、 7 0 %などの所定の値以上一致しているか否かを判断する。この、一致率の閾値は、 7 0 %以外のいかなる数値であっても良いことは言うまでもない。
ステップ S 4 0 4において、 単語が、 7 0 %などの所定の値以上一致している と判断された場合、 ステップ S 4 0 5において、 番組ベク トル生成部 2 3は、 そ れらの番組に、 同一のグループ I Dを対応付ける。 また、 番組ベク トル生成部 2 3は、 一致した単語、 または、 単語群と、 それに対応するグループ I Dを、 デー タ記憶部 2 4に記憶させる。
ステップ S 4 0 4において、 7 0 %などの所定の値以下の一致率であると判断 された場合、 または、 ステップ S 4 0 5の処理の終了後、 ステップ S 4 0 6にお いて、 番組べク トル生成部 2 3は、 タイトルの総当りが終了したか否かを判断す る。
ステップ S 4 0 6において、 タイトルの総当りが終了していないと判断された 場合、 処理は、 ステップ S 4 0 3に戻り、 それ以降の処理が繰り返される。 ステップ S 4 0 6において、 タイ トルの総当りが終了したと判断された場合、 処理が終了される。
このような処理により、 番組べクトルに、 タイ トルを構成する単語の一致率を 基にしたグループ I Dが対応付けられて、 データ送信部 2 5により、 ネットヮー ク 8を介して、 テレビジョン受信装置 4または、 E P G受信装置 9に送信される ので、 例えば、 連続ドラマとスペシャル番組などの類似したタイ トルの番組を、 同一のグループとして処理させるようにすることができる。
さらに、 タイ トルを構成する単語の一致率を基にグループを決定するようにす ることにより、例えば、 E P G、またはメタデータにおいて、数字の半角と全角、 または、 英字の半角と全角、 もしくは、 大文字と小文字などの表記ゆれがあった 場合にも、 同一タイ トルの番組を、 同一のグループとして検出することが可能と なる。
また、 単語の一致率に加えて、 例えば、 放送局や番組ジャンル、 あるいは、 放 送開始時刻などを、 グループ化の条件に加えるようにしても良い。 例えば、 ニュ ース番組などにおいては、 タイ トルが、 「ニュース」 を含む少ない単語によって 構成されているので、 図 1 0を用いて説明した処理では、 異なる放送局の異なる 形態のニュース番組であっても、 同一のグループとして検出されてしまう恐れが あるので、 単語の一致率に加えて、 放送局も一致した場合、 同一グループとする 3 015925
29
ようにしても良い。
図 1 1のフローチャートを参照して、 放送局の一致を条件に加えて、 タイ トル を構成する単語の一致率によりグループ化を実行するタイ トルグループ化処理 3 について説明する。
ステップ S 4 2 1乃至ステップ S 4 2 4において、 図 1 0を用いて説明した、 ステップ S 4 0 1乃至ステップ S 4 0 4と同様の処理が実行される。 すなわち、 データ取得部 2 1は、 メタデータデータベース 7に登録されている E P Gデータ を参照して、 登録されているメタデータから、 タイ トルを抽出し、 番組べク トル 生成部 2 3に供給し、 番組べクトル生成部 2 3は、 タイ トルを形態素解析し、 単 語に分解する。 そして、 番組ベク トル生成部 2 3は、 解析された単語を基に、 タ ィトル間の単語の一致度を算出し、 単語が、 例えば、 7 0 %などの所定の値以上 一致しているか否かを判断する。
ステップ S 4 2 4において、 単語が、 7 0 %などの所定の値以上一致している と判断された場合、 ステップ S 4 2 5において、 番組ベクトル生成部 2 3は、 そ れらの番組の放送局が一致しているか否かを判断する。
ステップ S 4 2 5において、 これらの番組の放送局が一致していると判断され た場合、 ステップ S 4 2 6において、 番組べクトル生成部 2 3は、 それらの番組 に、 同一のグループ I Dを対応付ける。 また、 番組ベク トル生成部 2 3は、 一致 した単語、 または、 単語群と、 それに対応する放送局およびグループ I Dを、 デ ータ記憶部 2 4に記憶させる。
ステップ S 4 2 4において、 7 0 %などの所定の値以下の一致率であると判断 された場合、 ステップ S 4 2 5において、 これらの番組の放送局が一致していな いと判断された場合、 または、 ステップ S 4 2 6の処理の終了後、 ステップ S 4 2 7において、 番組べク トル生成部 2 3は、 タイ トルの総当りが終了したか否か を判断する。
ステップ S 4 2 7において、 タイ トルの総当りが終了していないと判断された 場合、 処理は、 ステップ S 4 2 3に戻り、 それ以降の処理が繰り返される。 4 2 7において、 タイトルの総当りが終了したと判断された場合、 処理が終了される。
このような処理により、 番組べクトルに、 放送局の一致とタイトルを構成する 単語の一致率を基にしたグループ I Dが対応付けられて、 データ送信部 2 5によ り、 ネットワーク 8を介して、 テレビジョン受信装置 4または、 E P G受信装置 9に送信されるので、 例えば、 類似したタイ トルの番組を、 同一のグループとす る場合に、 他局のニュース番組を同一のグループとするようなことを防ぐことが できる。
なお、 図 1 1においては、 タイ トルを構成する単語の一致率以外に、 同一の放 送局であるか否かを条件として、 グループ化を行うものとして説明したが、 放送 局以外の、 例えば、 放送時間帯やジャンルなどを、 タイ トルを構成する単語の一 致率以外の条件として、 グループ化を実行するようにしても良いことは言うまで もない。
更に、 例えば、 連続ドラマや帯番組の放送開始時刻が、 スポーツ中継や特別番 組などのためにずれた場合においても、 同一グループとして検出可能なように、 タイトルを構成する単語の一致率以外の条件を、 放送時刻が、 例えば、 1時間な どの所定の時間範囲内のずれで一致しているか否かとして、 グループ化を実行す るようにしても良い。 - 図 1 2のフローチャートを参照して、 放送時刻が、 所定の時間範囲内のずれで 一致しているか否かを条件に加えて、 タイ トルを構成する単語の一致率によりグ ループ化を実行するタイ トルグループ化処理 4について説明する。
ステップ S 4 4 1乃至ステップ S 4 4 4において、 図 1 0を用いて説明した、 ステップ S 4 0 1乃至ステップ S 4 0 4と同様の処理が実行される。 すなわち、 データ取得部 2 1は、 メタデータデータベース 7に登録されている E P Gデータ を参照して、 登録されているメタデータから、 タイトノレを抽出し、 番組べク トル 生成部 2 3に供給し、 番組べクトル生成部 2 3は、 タイトルを形態素解析し、 単 語に分解する。 そして、 番組べク トル生成部 2 3は、 解析された単語を基に、 タ ィトル間の単語の一致度を算出し、 単語が、 例えば、 7 0 %などの所定の値以上 一致しているか否かを判断する。
ステップ S 4 4 4において、 単語が、 7 0 %などの所定の値以上一致している と判断された場合、 ステップ S 4 4 5において、 番組べク トル生成部 2 3は、 そ れらの番組の放送開始時刻が、 例えば、 1時間などの所定の範囲内のずれで一致 しているか否かを判断する。
ステップ S 4 4 5において、 それらの番組の放送開始時刻が所定の範囲内のず れで一致していると判断された場合、 ステップ S 4 4 6において、 番組ベク トル 生成部 2 3は、 それらの番組に、 同一のグループ I Dを対応付ける。 また、 番組 ベク トル生成部 2 3は、 一致した単語、 または、 単語群と、 それに対応する放送 開始時刻の範囲、 およびグループ I Dを、 データ記憶部 2 4に記憶させる。 ステップ S 4 4 4において、 7 0 %などの所定の値以下の一致率であると判断 された場合、 ステップ S 4 4 5において、 それらの番組の放送開始時刻が所定の 範囲以上にずれていると判断された場合、 または、 ステップ S 4 4 6の処理の終 了後、 ステップ S 4 4 7において、 番組べク トル生成部 2 3は、 タイトルの総当 りが終了したか否かを判断する。
ステップ S 4 4 7において、 タイトルの総当りが終了していないと判断された 場合、 処理は、 ステップ S 4 4 3に戻り、 それ以降の処理が繰り返される。 ステップ S 4 4 7において、 タイトルの総当りが終了したと判断された場合、 処理が終了される。
このような処理により、 番組べクトルに、 放送開始時刻の所定の範囲内のずれ を含む一致と、 タイ トルを構成する単語の一致率を基にしたグループ I Dが対応 付けられて、 データ送信部 2 5により、 ネットワーク 8を介して、 テレビジョン 受信装置 4または、 E P G受信装置 9に送信されるので、 例えば、 類似したタイ トルの番組を同一のグループとする場合に、 特別番組などによる放送時刻の変更 のために、 同一グループとして検出されるべき番組が、 同一グループとして検出 されないようなことを防ぐことができる。 3 015925
32
図 1 3は、 番組推薦処理装置 1 0の構成を示すブロック図である。
データ取得部 4 1は、 配信サーバ 5から送信された番組べク トル PP、 およぴ番 組べク トル PPに対応する番組側効き目べク トル EfPPを取得する。 番組べク トル 抽出部 4 2は、データ取得部 4 1が取得した番組べク トル PPから、マッチング処 理に必要な番組べクトル PP、 あるいは、 ユーザモデル生成のために必要な番組べ クトル PPを抽出し、 必要に応じて、 番組べクトル PPに対応する番組側効き目べ クトル EfPPとともに、 マツチング処理部 4 3に供給する。
操作入力部 4 4は、 例えば、 キーボード、 タツチパッド、 マウスなどの入力デ バイスで構成され、 ユーザが入力した初期登録情報や、 ユーザモデル生成のため のトピックの入力を受け、 初期登録保存部 4 5に出力する。 初期登録保存部 4 5 は、 操作入力部 4 4から供給された初期登録内容や、 ユーザモデル生成のための トピックを登録し、 必要に応じて、 操作ログ取得部 4 6、 または、 マッチング処 理部 4 3に供給する。 また、 初期登録保存部 4 5に保存されている内容は、 操作 入力部 4 4から入力されるユーザの操作に基づいて、 逐次更新される。 初期登録 される内容には、 例えば、 嫌いなジャンル、 嫌いなキーワード、 嫌いな出演者な どの、ユーザが好まない番組を示す情報や、好きなジャンル、好きなキーワード、 好きな出演者などの、 ユーザが好む番組を示す情報がある。
操作口グ取得部 4 6は、 テレビジョン表示装置 1 1または録画再生装置 1 2か ら、操作ログを取得し、これらの情報を正履歴と負履歴に分類し、必要に応じて、 初期登録保存部 4 5に保存されている情報を参照して、 データ取得部 4 1が取得 した番組べクトル PPのうち、 正履歴および負履歴に対応する番組べクトル PPを 読み出して、 正履歴保存部 4 7と負履歴保存部 4 8に供給して保存させる。 正履 歴保存部 4 7は、供給された正履歴を保存し、正履歴べクトル UPを生成する。負 履歴保存部 4 8は、供給された負履歴を保存し、負履歴べク トル MUPを生成する。 生成された正履歴べク トル UPと負履歴べク トル MUPは、マッチング処理部 4 3に 供給される。
ここで、 正履歴とは、 ユーザが積極的に視聴しょうとする、 換言すれば、 好ま しいと思う番組の候補を抽出するために用いられる情報であり、 例えば、 ユーザ 力 番組を視聴したり、 録画した場合、 または、 後述する処理によりユーザに推 薦番組リストとして提案された番組が、 ユーザに受け入れられて視聴または録画 された場合、 その番組のメタデータは、 好印象メタデータとして、 正履歴保存部 4 7に保存される。 正履歴保存部 4 7は、 詳細項目ごとに、 または、 大項目ごと に、 正履歴の総和を求め、 正履歴べクトル UPを生成する。
一方、 負履歴とは、 ユーザが視聴するのに消極的である、 換言すれば、 好まし くないと思う番組を、 推薦する番組から除くために用いられる情報であり、 例え ば、 初期登録で嫌いであるとされた項目や、 録画後見ずに消去された番組、 また は、 後述する処理によりユーザに推薦番組リス トとして提案された番組がユーザ に受け入れられず、 視聴または録画操作されなかった場合、 その番組のメタデー タは負印象メタデータとして、 負履歴保存部 4 8に保存される。 例えば、 ユーザ 、初期登録で「スポーツ」を嫌いであるとした場合、ジャンル Gmup= { 0, 0, 5 , 0, 0 , 0, 0 , 0 , 0 } 力 重み 5で負印象として負履歴保存部 4 8に追 加保存される。 負履歴保存部 4 8は、 詳細項目ごとに、 または、 大項目ごとに、 負履歴の総和を求め、 負履歴べク トル MUPを生成する。
マッチング処理部 4 3は、 番組べク トル抽出部 4 2から抽出された番組べク ト ルと、 正履歴保存部 4 7または負履歴保存部 4 8から供給された正履歴べクトル UP、 または、 負履歴べク トル MUPとのマッチングを検証する。
番組べク トル PP、正履歴べク トル UP、 または、負履歴べク トル MUPが、 全ての 詳細要素を 1列に並べてベタ トル化されている場合、 タイトルやキーワードなど は複数の単語で構成されているので、 その単語 1語と、 例えば、 ジャンルなどの 項目が、 ベクトルにおいて同じ重さになってしまう。 そこで、 マッチング処理部
4 3の正規化処理部 6 1は、 単語によって構成される項目であるタイトルおよび 内容について、 番組ごとに、 単語を単語数で割ることで正規化する。 例えば、 タ ィトル T ra= {東海道一 1 , 三谷一 1, 怪談一 1 }である場合、 タイトル T tn= {東 海道: 0 . 3 3, 三谷: 0 . 3 3 , 怪談: 0 . 3 3 } と正規化される。 これによ り、タイトル、内容とも、その項目内の単語のトータノレで、重みが 1になるので、 マツチング処理において不都合が生じない。
ベタ トル演算部 6 2は、 番組べク トル PPと、 正履歴べク トル UP、 または、 負 履歴べク トル MUPとのマッチング処理を実行する。
ベタ トル演算部 6 2は、 番組べクトル PP、 正履歴べクトル UPおよび負履歴べ クトル MUPが、 詳細項目の全要素を 1列に並べたベタ トルで表されている場合、 正履歴べク トル UPまたは負履歴べクトル MUPと、 番組べクトル PPとのべク トル 間のコサイン距離 (COS0) によって、 次の式 (1) に示されるように、 番組べク トル PPと正履歴ベクトル UPとの類似度 SimUPを求め、 式 (2) に示されるよう に、 番組べクトル PPと負履歴べク トノレ MUPとの類似度 SimMUPを求める。 コサイ ン距離とは、 式 (1) と式 (2) に示されるように、 2つのベク トルの内積を各 ベク トルの絶対値の積で除算して得られる値である。
SimUP = cos 0u = UP · PP/|UP| X |PP| - ■ · (1)
SimMUP = cos Θ m=MUP■ PP/|MUP| X |PP| - - - (2)
ただし、 式 (1) およぴ式 (2) において、 PPは番組べクトル PPを示し、 UP は正履歴べクトル UPを示し、 MUPは、 負履歴べク トル MUPを示す。 また、 " · " は、 内積を示し、 "X" は、 要素の掛け算 (スカラ演算) を示す。
また、 べクトル演算部 62は、 番組べク トノレ PP、 正履歴べク トル UPおよび負 履歴べク トル MUPが大項目ごとにベタ トル化されている場合、 大項目ごとに、 番 組べク トル PPと正履歴べク トル UPとの類似度と、番組べクトル PPと負履歴べク トル MUPとの類似度を求め、 大項目ごとに類似度の和を算出して、 類似度 SimUP および類似度 SimMUPを算出することができる。例えば、単語に分解されている大 項目 「タイトル」 において、 正履歴ベクトル UPが、 タイ トル Tup {学校— 1, 怪談一 1, トイレ— 1 } であり、 供給された番組べク トル PPが、 タイトル Tm = {東海道一 1, 三谷 _ 1, 怪談一 1 } である場合、 単位ベクトル長さを 1とする と、 ベク トルの長さ (絶対値) は、 要素の合計の 2乗和の平方根であるので、 タ ィトルの類似度であるコサイン距離 cosS tは、次の式(3)のように算出される。 cos Θ t= (1 · 1) I ( 3XV~3) =1/3 · ■ ■ (3)
式 (3) において、 "■ " は、 内積を示し、 "X" は、 スカラ演算を示す。 番 組べク トノレ PPと、負履歴べクトル MUPとの大項目ごとの類似度も、式 ( 3 ) と同 様の計算によって算出される。
例えば、 正履歴べク トル UPを、 正履歴べク トル UP= {タイトル Tup, ジヤン ル Gup, 出演者 Pup, 脚本 Z原作/演出 Aup, 内容 (キーワード) Kup} および 負履歴べク トノレ MUPを、 負履歴べクト MUP= {タイ トノレ Tmup, ジャンル Gmup, 出演者 Pinup, 脚本 Z原作/演出 Atnup, 内容 (キーワード) Kmup} とした場合、 それぞれの大項目で、 式 (3) と同様の演算により、 大項目.ごとに類似度が得ら れるので、 類似度 SimUPおよび類似度 SimMUP は、 いずれも、 次の式 (4) の類 似度 Simとして演算される。
Sim=cos Θ +4- cos Θ g+cos Θ p+cos Θ„ + cos Θ k · ■ ■ ( 4 )
ここで、 cos 0 tは、 大項目 「タイトル」 における、 番組べク トノレ PPと、 正履 歴べク トル UPまたは負履歴べクトル MUPとのコサイン距離であり、 cos e ^は、 大項目 「ジャンル」 における、 番組ベクトル PPと、 正履歴ベクトル UPまたは負 履歴ベクトル MUPとのコサイン距離であり、 coSSpは、 大項目 「出演者」 におけ る、 番組べクトノレ PPと、 正履歴べクトル UPまたは負履歴べク トル MUP とのコサ イン距離であり、 COS0 aは、 大項目 「脚本/原作 Z演出」 における、 番組べクト ノレ PPと、正履歴べクトル UPまたは負履歴べクトル MUPとのコサイン距離であり、 cos 0 kは、 大項目 「内容」 における、 番組べクトル PPと、 正履歴べク トル UPま たは負履歴べク トル MUPとのコサイン距離である。
類似度 SimUPおよぴ類似度 SimMUP力 S、大項目ごとの演算結果の和として算出さ れた場合、 項目間の重みの偏りがなくなるため、 正規化を行っているのと道義で ある。 従って、 全要素を 1列に並べたベタ トノレと異なり、 正規化処理部 6 1によ る正規化処理を行わなくてもよい。
すなわち、 正規化を行うことなく、 全要素を 1列に並べたベク トルを用いてし まった場合、 頻度の積み重なり易い、 例えば、 放送局、 ジャンルなどの項目と比 較して、 タイトルや内容などの項目においては、 履歴が増えるに従って、 単語数 は増える一方、 それぞれの単語の頻度は大きくなりにくい。
このため、 全要素を用いて、 要素ごとに合計を取った場合、 頻度の重なりやす い、 放送局、 ジャンルなどの項目の影響が大きくなつてしまうので、 例えば、 ュ 一ザが解説者 Aのファンであるので、 「解説者 Aが解説している球団 Bの試合の 実況中継」 を好んで視聴しているような場合、 ジャンルである 「野球の実況中継」 という情報は履歴として重なりやすいが、 出演者である 「解説者 A」 という情報 は履歴として重なり難い。 従って、 他の解説者が解説している球団 Bの試合の実 況中継が推薦されて、 解説者 Aが出演しているバラエティ番組が推薦されないよ うな場合が発生する。
これに対して、 正規化を行う力、 または、 大項目ごとの演算結果の和を類似度 SimUPおよび類似度 SimMUPとして算出するようにすることにより、履歴の頻度の 大小の影響を受けることなく、 解説者 Aが出演しているバラエティ番組を推薦す ることができ、 より正確にユーザの嗜好を反映するようにすることができる。 また、 ベタトル演算部 6 2は、 初期登録保存部 4 5に保存されているユーザの 初期登録情報、番組べク トル PPに対応付けられて送信される番組側効き目べクト ル EfPP、 または、 ユーザ情報登録部 6 3において生成されて登録されているユー ザ側効き目べク トル EfUP (後述) 、 もしくは、 ユーザ側反効き目べクトル EfMUP (後述) により、 重み付けを行って、類似度 SimUPおよび類似度 SitnMUPを算出す るようにすることもできる。
ベタトル演算部 6 2は、上述したような方法で算出された類似度 SiraUPを基に、 例えば、 正履歴ベク トルとの類似度が高い上位所定数 (例えば、 1 0 ) の番組に 対して、 更に履歴べク トル MUPとの類似度 SimMUPを求め、 SimUP— SimMUPを演算 し、 演算結果の上位所定数 (例えば、 3 ) の番組を推薦番組として、 推薦情報出 力部 4 9に出力する。
また、 ベタトル演算部 6 2は、 番組べク トルがグループ化されている場合、 推 薦された番組の情報を基に、 ユーザ情報登録部 6 3に、 推薦優先グループを登録 し、 推薦優先グループに対応する番組を、 優先的に推薦する。
更に、 ベタトル演算部 6 2は、 初期登録保存部 4 5に保存されているトピック を用いて番組べクトル PPのフィルタリングを行うことにより、ユーザモデルべク トルを生成し、 ユーザ情報登録部 6 3に登録して、 マッチング処理を行うように することができる。 ユーザモデルについての詳細については後述する。
ユーザ情報登録部 6 3は、 初期登録保存部 4 5から供給されたユーザの初期登 録内容、 あるいは、 正履歴保存部 4 7または負履歴保存部 4 8から供給された正 履歴べクトル UPまたは負履歴べク トル MUPを基に、ユーザ側効き目べク トル EfUP および反効き目べク トル E預 UPを生成して、 保存する。 ユーザ側効き目べク トル EfUPは、 そのユーザにとって、 大項目のうちのいずれの要素が番組の選択に重要 であり、番組の選択のために重みが置かれている項目であるかを示すベタトルカ \ または、 それぞれの項目におけるユーザの嗜好を示すベク トルである。 反効き目 ベクトル EfMUPは、 そのユーザにとって、 大項目のうちのいずれの要素が番組の 選択に重要でない要素であり、 番組の選択のために重みが置かれていない項目で あるかを示すベク トルか、 または、 それぞれの項目において、 ユーザが好まない 項目を示すベタ トルである。
換言すれば、 ユーザ側効き目べクトル EfUPおよぴ反効き目べクトル EfMUPは、 番組べクトル PPと、 正履歴べク トル UPまたは負履歴べク トル MUP とのマツチン グにおいて、 いずれの項目が大きく寄与するかを規定するものである。
ユーザ側効き目べク トノレ EfUPおよび反効き目べクトル EfMUPは、ユーザによつ て設定可能としたり、 予め定められた値を用いるようにしても良いが、 初期登録 保存部 4 5に登録されているユーザの初期登録内容を基に生成されるようにして も良い。
具体的には、ユーザ側効き目べク トル EfUPが、そのユーザにとって、大項目の うちのいずれの要素が番組の選択に重要であるかを示す情報である場合、 番組べ ク トル PP= {タイ トル T tn, ジャンル Gm, 時間帯 Hm, 放送局 S m, 出演者 P m, 脚本/原作 Z演出 Am, 内容 Km } において、ユーザにとってジャンルが重要であ る場合、 例えば、 効き目ベク トル EfUP二 (1, 5, 1 , 1, 1 , 1, 1 ) と設定 される。 これに対して、 ユーザにとって出演者とジャンルが重要である場合、 例 えば、 効き目ベク トル EfUP= ( 1, 3, 1, 1 , 5 , 1, 1 ) と設定される。 また、ユーザ側効き目べク トル EfUPが、それぞれの項目におけるユーザの嗜好 を示すベク トルである場合、 大項目ジャンル G m = {ドラマ, バラエティ, スポ ーッ, 映画, 音楽, 子供向け/教育, 教養/ドキュメント, ニュースノ報道, そ の他 } において、 ユーザが好ましいと思う番組のジャンルが、 教養 zドキュメン トであった場合、 ユーザ効き目ベクトル EfUPは、 例えば、 ジャンル G m = { 0 , 0 , 0, 0, 0, 0, 5 , 0, 0 } と設定される。
また、ユーザ側効き目べク トル EfUPおよび反効き目べクトル EfMUPは、正履歴 ベタトル UPまたは負履歴べク トル MUPを基に、あるいは、一定期間にユーザが視 聴した番組をカウントすることにより、 生成されるようにしても良い。 更に、 ュ 一ザ側効き目べクトル EfUPおよぴ反効き目べクトル EfMUPは、ジャンル別に生成 することも可能である。 ユーザ側効き目べク トル EfUPまたは反効き目べクトル EfMUPを生成する方法については、 図 2 2乃至図 2 7を用いて後述する。
更に、ユーザ情報登録部 6 3は、ベタ トル演算部 6 2の処理により生成された、 推薦優先グループの情報や、 ユーザモデルベクトルなどを、 必要に応じて登録す る。
以上説明したマッチング処理部 4 3においては、正履歴べク トル UPとの類似度 が高い番組 (ユーザが積極的に視聴する番組) から、 負履歴を用いて、 ユーザが 好まないと思われる番組 (ユーザが視聴するのに消極的である番組) を取り除く 処理を行わなくても、 例えば、 正履歴のみを用いて推薦番組を決定することも可 能である。
推薦情報出力部 4 9は、 マッチング処理部 4 3から供給された推薦番組の情報 を、 推薦番組リス ト 5 0に登録するとともに、 テレビジョン表示装置 1 1、 また は、 録画再生装置 1 2に供給する。 推薦番組リスト 5 0は、 番組推薦処理装置 1 0から取り外し可能に構成されており、 推薦番組出力部 4 9から出力された推薦 番組情報を登録する。 推薦番組リスト 5 0に推薦番組情報を保存するようにする ことにより、 例えば、 異なるテレビジョン受信装置 4、 テレビジョン表示装置 1 1、 あるいは、 録画再生装置 1 2などを用いる場合においても、 これまで蓄積し た履歴情報を用いて、 番組の推薦や、 自動録画などを実行させるようにすること が可能である。
また、 マッチング処理部 4 3は、 必要に応じて、 ドライブ 5 1とも接続されて いる。 ドライブ 5 1には、 必要に応じて、 磁気ディスク 7 1、 光ディスク 7 2、 光磁気ディスク 7 3、および半導体メモリ 7 4が装着され、データの授受を行う。 図 1 4のフローチャートを参照して、 番組推薦処理装置 1 0が実行する、 正履 歴べク トルおよび負履歴べク トル生成処理 1について説明する。
ステップ S 7 1において、 操作ログ取得部 4 6は、 初期登録保存部 4 5から読 み出した初期登録内容を負履歴保存部 4 8に供給する。 負履歴保存部 4 8は、 供 給された初期登録内容を参照して、 負履歴べク トル MUPを生成する。
ステップ S 7 2において、 操作ログ取得部 4 6は、 初期登録保存部 4 5に保存 されている登録内容を基に、 初期登録内容が変更されたか否かを判断する。 ステ ップ S 7 2において、 初期登録内容が変更されたと判断された場合、 処理は、 ス
7 1に戻り、 それ以降の処理が繰り返される。
7 2において、初期登録内容が変更されていないと判断された場合、 ステップ S 7 3において、 操作ログ取得部 4 6は、 テレビジョン表示装置 1 1ま たは録画再生装置 1 2から、 操作ログが供給されたか否かを判断する。 ステップ S 7 3において、 操作ログが供給されていないと判断された場合、 処理は、 ステ ップ S 7 2に戻り、 それ以降の処理が繰り返される。
ステップ S 7 3において、 操作ログが供給されたと判断された場合、 ステップ S 7 4において、 操作口グ取得部 4 6は、 供給された操作口グは、 正履歴である か否かを判断する。 例えば、 操作ログが、 録画操作である場合、 その操作に対応 する番組の番組べクトル PPは、正履歴となり、操作ログが、再生していない録画 データの消去である場合、その操作に対応する番組の番組べク トル PPは、負履歴 となる。
ステップ S 7 4において、 供給された操作ログは、 正履歴であると判断された 場合、 ステップ S 7 5において、 操作ログ取得部 4 6は、 正履歴であると判断さ れた操作ログに対応する番組べク トル ppをデータ取得部 4 1から抽出し、正履歴 保存部 4 7に供給する。正履歴保存部 4 7は、供給された番組べクトル PPを、正 履歴として追加保存する。
ステップ S 7 6において、 正履歴保存部 4 7は、 詳細項目ごと、 または、 大項 目ごとに正履歴番組べク トル PPのべク トルの総和を求めて、 正履歴べク トル UP を生成する。 ステップ S 7 6の処理の終了後、 処理は、 ステップ S 7 2に戻り、 それ以降の処理が繰り返される。
ステップ S 7 4において、 供給された操作ログは、 正履歴ではないと判断され た場合、 供給された操作ログは、 負履歴であるので、 ステップ S 7 7において、 操作口グ取得部 4 6は、 負履歴であると判断された操作口グに対応する番組べク トル PPをデータ取得部 4 1から抽出し、負履歴保存部 4 8に供給する。負履歴保 存部 4 8は、 供給された番組べク トル PPを、 負履歴として追加保存する。
ステップ S 7 8において、 負履歴保存部 4 8は、 詳細項目ごと、 または、 大項 目ごとに負履歴番組べク トル PPのべク トルの総和を求めて、負履歴べク トル MUP を生成する。 テツプ S 7 8の処理の終了後、 処理は、 ステップ S 7 2に戻り、 そ れ以降の処理が繰り返される。
大項目が、 正履歴ベク トル UP= (タイ トル T up, ジャンル G up, 出演者 P up, 脚本 Z原作 Z演出 Α ΙΦ, 内容 (キーワード) Kup} であり、 大項目の中に詳細項 目が記載されている場合、正履歴べクト/レ UPにおいては、各詳細項目の後に、ベ ク トル総和を示す数値が記載される。 例えば、 図 1 5に示されるように、 大項目 「ジャンル」 に関しては、 ジャンル Gup= { (ドラマ一 2 5 ) , (バラエティ一 3 4 ) , (スポーツ一 4 2 ) , (映画— 3 7 ) , (音楽一 7 3 ) , (子供向け/ 教育一 1 2 0 ) , (教養/ドキュメント一 3 ) , (ニュース 報道一 5 ) , (そ の他一 2 3 ) }のように、詳細項目ごとに正履歴の総和を示す数値が記載される。 また、大項目 「タイ トル」のように、単語によって示されるベタ トルにおいては、 例えば、 タイトル T u p = { (title 1— 1 2 ) , (title 2 - 3 ) , · ■ · } の ように、 単語に続いて、 単語ごとの正履歴の総和を示す数値が記載される。 負履 歴べク トル MUPにおいても、正履歴べク トル UPと同様にして、項目に続いて総和 を示す数値が記述される。
図 1 5においては、 正履歴べクトル UP (および、 負履歴べク トル MUP) の大項 目を、 タイ トル、 ジャンル、 出演者、 脚本/原作 Z演出、 内容 (キーワード) と し、図 5を用いて説明した番組べクトル PPよりも少ない項目数であるものとして 説明したが、番組べクトノレ PPと同様の大項目としても良いことは言うまでもない。 図 1 4においては、 初期登録の内容を基に、 操作ログが入力される前に負履歴 ベクトル MUPが生成されるものとして説明しているが、 初期登録時に、 ユーザが 好ましいと思う番組を選択するための情報の登録を受けるようにし、 操作ログが 入力される前に正履歴べクトル UPも生成されるようにしても良い。また、初期登 録を基に正履歴べク トル UP、 または、 負履歴べク トル MUPを生成せず、 操作ログ のみを用いて正履歴べク トル UP、 または、 負履歴べク トル MUPを生成するように このようにして、 正履歴べク トル UP、 および、 負履歴べクトル MUPを独立して 生成して保持することにより、 より精密に、 ユーザの嗜好とのマッチング処理を 行うことができる。
なお、 このとき、 正履歴および負履歴を、 更に精緻に求めることができるよう にしても良い。 例えば、 図 1 4を用いて説明した処理においては、 全ての項目に おける正履歴と負履歴に対応する番組べク トル PPの総和を用いて、正履歴べク ト ル UPおよび負履歴べク トル MUPを生成したが、正履歴および負履歴に対応する番 組べク トル PPの総和を、例えば、 ジャンル別に蓄積して、 ジャンル別に正履歴べ クトル UPおよび負履歴べクトル MUPを生成するようにしても良い。
放送される番組のジャンルによって、 出演者が偏ってしまうことが頻繁に発生 するため、 ユーザの嗜好が正しく反映されない場合がある。 具体的には、 ドラマ PC蘭 00雇 5925
42
が好きで、 バラエティは、 ほとんどドラマに出演しないコメディアン Aが出演す るもののみを好み、 バラエティ対ドラマの視聴比率が 2 : 8であるユーザにおい て、 ジャンルを区別せずに出演者の正履歴を蓄積した場合、 ほとんどドラマに出 演しないコメディアン Aよりも、 特に好きな俳優でないにもかかわらず、 ドラマ に頻繁に出演する出演者 Bが、正履歴べク トル UPにおいて高ポイントとなってし まう場合がある。 このような場合、 例えば、 コメディアン Aが出演するバラェテ ィよりも、 ドラマに頻繁に出演する出演者 Bが出演するドキュメンタリーが推薦 されてしまう。 これを防止するためには、 ジャンル別に正履歴おょぴ負履歴を蓄 積し、 これを基に、 ジャンル別に正履歴ベクトル UPおよび負履歴ベク トル MUP を生成すればよい。
また、 例えば、 ユーザが解説者 Aのファンであるので、 「解説者 Aが解説して いる球団 Bの試合の実況中継」 を好んで視聴しているような場合、 ジャンルであ る 「スポーツ」 という情報は履歴として重なりやすいが、 出演者である 「解説者 AJ という情報は履歴として重なり難いので、 他の解説者が解説している球団 B の試合の実況中継が推薦されて、 解説者 Aが出演しているバラエティ番組が推薦 されないような場合が発生する。 これを防止するためには、 例えば、 出演者別に 正履歴おょぴ負履歴を蓄積し、 これを基に、出演者別に正履歴べクトル UPおよび 負履歴べクトル MUPを生成すればよい。
このように、 特定の要素別に履歴を蓄積するようにすることにより、 ユーザの 好みをなまらせることなく、 より緻密にユーザの嗜好を反映することが可能とな る。
そして、 マッチング処理部 4 3において、 このようにして生成された正履歴べ クトル UPおよぴ負履歴べク トノレ MUPと、 供給された番組べクトル PPのマツチン グを検証することにより、 ユーザの嗜好を正しく反映した推薦番組情報を生成す ることが可能となる。
次に、 図 1 6のフローチャートを参照して、 ジャンル別に履歴を蓄積するよう にした、 正履歴べク トルおよび負履歴べク トル生成処理 2について説明する。 PC蘭 003/015925
43
ステップ S 8 1乃至ステップ S 8 4において、 図 1 4のステップ S 7 1乃至ス テツプ S 7 4と同様の処理が実行される。 すなわち、 初期登録が参照されて、 負 履歴べクトル MUPが生成され、 初期登録内容が変更されたか否かが判断されて、 変更されなかった場合、 供給された操作ログが、 正履歴であるか否かが判断され る。
ステップ S 8 4において、 供給された操作ログが正履歴であると判断された場 合、 ステップ S 8 5において、 操作ログ取得部 4 6は、 正履歴であると判断され た操作ログに対応する番組べク トル PPをデータ取得部 4 1から抽出し、正履歴保 存部 4 7に供給する。正履歴保存部 4 7は、供給された番組べク トル PPのジヤン ルを抽出する。
ステップ S 8 6において、 正履歴保存部 4 7は、 データ取得部 4 1から抽出さ れた番組ベクトル PPを、 ジャンル別に、 正履歴として追加保存する。
ステップ S 8 7において、 正履歴保存部 4 7は、 詳細項目ごと、 または、 大項 目ごとに、 番組べク トルが追加保存されたジャンルにおいて、 正履歴の番組べク トル PPのべク トルの総和を求めて、 対応するジャンルの正履歴べク トノレ UPを生 成する。 ステップ S 8 7の処理の終了後、 処理は、 ステップ S 8 2に戻り、 それ 以降の処理が繰り返される。
ステップ S 8 4において、 供給された操作ログが正履歴ではないと判断された 場合、 供給された操作ログは負履歴であるので、 ステップ S 8 8において、 操作 ログ取得部 4 6は、 負履歴であると判断された操作ログに対応する番組べク トル PPをデータ取得部 4 1カゝら抽出し、負履歴保存部 4 8に供給する。 負履歴保存部 4 8は、 供給された番組べク トル PPのジャンルを抽出する。
ステップ S 8 9において、 負履歴保存部 4 8は、 データ取得部 4 1から抽出さ れた番組ベク トル PPを、 ジャンル別に、 負履歴として追加保存する。
ステップ S 9 0において、 負履歴保存部 4 8は、 詳細項目ごと、 または、 大項 目ごとに、 番組べク トルが追加保存されたジャンルにおいて、 負履歴の番組べク トル PPのべク トルの総和を求めて、 対応するジャンルの負履歴べク トル MUPを 生成する。 ステップ S 9 0の処理の終了後、 処理は、 ステップ S 8 2に戻り、 そ れ以降の処理が繰り返される。
このような処理により、ジャンル別に正履歴べク トル UPと負履歴べクトル MUP が生成されるので、 ユーザの好みをなまらせることなく、 より緻密にユーザの嗜 好を反映することが可能となり、 ユーザの嗜好を正しく反映した推薦番組情報を 生成することが可能となる。
図 1 7のフローチャートを参照して、 番組べク トル PP、 正履歴べク トル UPお よび負履歴べク トル MUPが、 詳細項目の全要素を 1列に並べたべク トルで表され ている場合の、 マッチング処理 1について説明する。
ステップ S 1 0 1において、 番組べクトル抽出部 4 2は、 複数番組 (例えば、 所定の時間帯に放送される番組)の番組べクトル PPをデータ取得部 4 1から抽出 して、 マッチング処理部 4 3の正規化処理部 6 1に供給する。 正規化処理部 6 1 は、供給された番組べク トル PPと、正履歴保存部 4 7から読み出した正履歴べク トル UPの構成要素のうち、単語で構成されているタイトルおよび内容についての 正規化を行い、 ベタ トル演算部 6 2に正規化結果を供給する。
具体的には、 正規化処理部 6 1は、 供給された番組べク トル PP力 例えば、 タ ィ トル T m = {東海道— 1, 三谷一 1, 怪談一 1 } である場合、 タイトル T m = {東海道: 0 . 3 3, 三谷: 0 . 3 3, 怪談: 0 . 3 3 } として、 その番組ごと に、 その項目内の単語のトータルで、 重みが 1になるように正規化する。
ステップ S 1 0 2において、 マッチング処理部 4 3のべクトル演算部 6 2は、 上述した式 (1 ) を用いて、 複数番組の番組べク トル PPと正履歴べク トル UPの コサイン距離である類似度 SimUPを算出する。
ステップ S 1 0 3において、 ベタトル演算部 6 2は、 ステップ S 1 0 2におい て算出された、 番組べク トル PPと正履歴べクトル UPとの類似度を示す類似度 SiraUPを比較し、 類似度の上位から、 例えば、 1 0などの所定の数だけ、 番組べ タ トル PPを抽出する。
ステップ S 1 0 4において、 ベタトル演算部 6 2は、 ステップ S 1 0 3におい て抽出された番組べクトル PPと、負履歴保存部 4 8から読み出した負履歴べクト ル MUPとのコサイン距離である類似度 SimMUPを、上述した式(2 ) を用いて算出 する。
ステップ S 1 0 5において、ベタトル演算部 6 2は、正履歴べク トル UPとの類 似度(すなわち、 コサイン距離) SiraMUP—負履歴べクトルとの類似度(すなわち、 コサイン距離) SimMUPを算出し、 その上位となる、 所定数 (例えば、 1つ) の番 組の番組べク トルまたは E P Gデータを推薦情報として抽出し、 推薦情報出力部 4 9に出力して、 推薦番組リスト 5 0に登録させるとともに、 テレビジョン表示 装置 1 1および録画再生装置 1 2に出力して、 処理が終了される。
このような処理により、 番組ベクトル PP、 正履歴ベクトル UPおよぴ負履歴べ ク トル MUPが、 詳細項目の全要素を 1列に並べたベタ トルで表されている場合に おいて、 番組べクトル PPと正履歴べク トル UPとの類似度と、 番組べク トル PP と負履歴べクトルとの類似度とを基に、 ユーザの嗜好に合致した推薦番組を決定 することが可能となる。
次に、 図 1 8のフローチャートを参照して、 単語で示される項目の正規化を行 うのではなく、 大項目ごとにコサイン距離の計算を行い、 その和を類似度 SimUP および類似度 SitnMUPとして算出することにより推薦番組を決定する、マッチング 処理 2について説明する。
ステップ S 1 1 1において、 番組べク トル抽出部 4 2は、 複数番組 (例えば、 所定の時間帯に放送される番組)の番組べクトル PPをデータ取得部 4 1から抽出 して、 マッチング処理部 4 3のべク トル演算部 6 2に供給する。 ベタ トル演算部 6 2は、供給された番組べク トル PPと、正履歴保存部 4 7から読み出した正履歴 ベタトノレ UP のそれぞれの大項目について、番糸且ベタトノレ PPと正履歴べクトノレ UP のコサイン距離を算出する。
ステップ S 1 1 2において、 ベタ トノレ演算部 6 2は、 ステップ S 1 1 1におい て項目ごとに算出されたコサイン距離の値を、上述した式(4 )を用いて合計し、 類似度 SiraUPを算出する。 ステップ S I 1 3において、 ベタ トル演算部 6 2は、 ステップ S 1 1 2におい て算出された、番組べク トル PPと正履歴べクトル UPとの類似度 SimUPを比較し、 類似度の上位から、 例えば、 1 0などの所定の数の番組ベクトル PPを抽出する。 ステップ S 1 1 4において、 べク トル演算部 6 2は、 ステップ S 1 1 3の処理 により抽出された番組べクトル PPと、負履歴保存部 4 8から読み出した負履歴べ ク トル MUPのそれぞれの大項目について、番組べク トル PPと負履歴べク トル MUP のコサイン距離を算出する。
ステップ S 1 1 5において、 ベタ トル演算部 6 2は、 ステップ S 1 1 4におい て項目ごとに算出されたコサイン距離の値を、上述した式(4 )を用いて合計し、 類似度 SimMUPを算出する。
ステップ S 1 1 6において、ベタ トル演算部 6 2は、 {番組べクトル PPと正履 歴べクトル UPとのコサイン距離である類似度 SimUP} — {番組べク トル PPと負 履歴べクトルとのコサイン距離である類似度 SimMUP } を算出し、 その上位となる 所定数(例えば 3つ)の番組の番組べクトル PPまたは E P Gデータを推薦情報と して抽出し、 推薦情報出力部 4 9に出力して、 推薦番組リスト 5 0に登録させる とともに、 テレビジョン表示装置 1 1および録画再生装置 1 2に出力して、 処理 が終了される。
このような処理により、 単語で示される項目の正規化を行うことなく、 大項目 ごとに演算結果の和が類似度 SimUPおよび類似度 SimMUPとして算出されるので、 異なる大項目に属する詳細要素間の履歴の重なりの偏りの影響を受けることなく、 番組べクトル PPと正履歴べクトル UPとの類似度と、番組べク トル PPと負履歴べ クトル MUPとの類似度とを基に、 ユーザの嗜好に合致した推薦番組を決定するこ とが可能となる。
図 1 7および図 1 8を用いて説明したマッチング処理 1およびマッチング処理 2においては、ユーザの正履歴べク トル UPとの類似度が高い番組から、負履歴を 用いて、 ユーザが好まないと思われる番組を取り除くことができるものとして説 明しているが、 例えば、 正履歴のみを用いて推薦番組を決定するようにしてもよ 3 015925
47 い。
また、 ユーザによっては、 番組を選択するにあたり、 ニュースや報道番組を非 常に好んだり、 ジャンルより も出演者が重要であったり、 出演者にはこだわらな いが、 内容が重要であるなど、 番組を選択するために重み付けられる項目と、 重 み付けられない項目、 換言すれば、 重要な項目とそうでない項目が固定している 場合がある。
従って、 マッチング処理は、 上述した番組側効き目べクトル EfPP、 ユーザ側効 き目べク トル EfUP、 または、 ユーザ側反効き目べクトル EfMUPを利用して行うよ うにしてもよい。また、番組側効き目べクトル EfPP、ユーザ側効き目べク トル EfUP、 または、 ユーザ側反効き目ベクトル EfMUPを利用するか否かは、 ユーザにより設 定可能なようにしても良い。
次に、 図 1 9のフローチヤ一トを参照して、 番組べク トル PP、 正履歴べクトル UPおよぴ負履歴べク トル MUP力 S、詳細項目の全要素を 1列に並べたベタ トルで表 されている場合に、ユーザの設定により、番組側効き目べク トル EfPPまたはユー ザ側効き目べク トル EfUPを利用してマッチング処理を行う、マッチング処理 3に ついて説明する。
ステップ S 1 2 1において、 ベク トル演算部 6 2は、 操作入力部 4 4を用いて ユーザにより入力され、 初期登録保存部 4 5に登録されている番組側効き目べク トル EfPPおよびユーザ側効き目べクトル EfUPまたはユーザ側反効き目べク トル EfMUPの利用設定内容を取得する。 効き目ベクトルの利用設定内容とは、 マッチ ング処理において、 番組側効き目ベクトル EfPP、 ユーザ側効き目ベクトル EfUP またはユーザ側反効き目べク トル EfMUPを利用して、 重み付けを行うか否かを示 す情報である。
ステップ S 1 2 2において、 ベタトル演算部 6 2は、 必要に応じて、 ユーザ情 報登録部 6 3から、 ユーザ側効き目べク トル EfUPを読み込み、 次の式 (5 ) を用 いて、 番組べク トル PPと正履歴べク トル UPのコサイン距離を算出し、 類似度 SimUPとする。 epd1'eudrp1'u1+epd2'eud2'p2'u2+.. ,
S I mUP = I nn I I . in I . . . J なお、 式 (5) においては、 番組べクトル PP= (pい p2、 ■ ■ · ) 、 正履歴 ベクトル UP= (u1; u2, ■ ■ · ) 、 番組側効き目ベクトル EfPP- (e p dい e p d2, · · · ) 、 ユーザ側効き目ベクトル EfUP= (e u dい e u d2, ' ■ · ) であるものとする。 また、 式 (5) においては、 番組側効き目べク トル EfPPおよ ぴユーザ側効き目べクトル EfUPのいずれをも利用するものとして説明している 、設定により、番組側効き目べク トル EfPPおよぴユーザ側効き目ベク トル EfUP のうちのいずれかが利用されない場合、 利用されないベタ トルに代わって数値 「1」 が代入されて計算される。
また、 ユーザ側効き目べクトノレ EfUPは、 ユーザにより設定可能であっても、 ュ 一ザの初期設定を基に設定されるものであっても良いし、 ユーザ情報登録部 63 において生成されるものであっても良い。ユーザ側効き目べク トル EfUPの生成の 詳細については、 図 22乃至図 25を用いて後述する。
ステップ S 1 23において、 ベタ トル演算部 6 2は、 ステップ S 1 22におい て算出された、番組べク トル PPと正履歴べク トル UPとの類似度 SimUPを比較し、 類似度の上位から、 例えば、 10などの所定の数の番組べクトル PPを抽出する。 ステップ S 1 24において、 べクトル演算部 6 2は、 必要に応じて、 ユーザ情 報登録部 6 3から、 ユーザ側反効き目べクトル EfMUPを読み込み、 次の式 (6) を用いて、ステップ S 1 23において抽出された番組べク トル PPと負履歴べクト ノレ MUPのコサイン距離を算出する。 = ·崎 (6) なお、 式 (6) においては、 番組ベクトル PP= (pい p2、 · · ·) 、 負履歴 ベタトル MUP= (m1( m2, ■ · · ) s 番組側効き目べク トル EfPP= ( e p dL, e p d2, · · ■) 、ユーザ側反効き目べクトル EfMUP= (emdi, e md2, · ■ ·) であるものとする。 また、 式 (6) においては、 番組側効き目べク トル EfPPおよ ぴユーザ側反効き目べク トル EfMUPのいずれをも利用するものとして説明してい る力 設定により、番組側効き目べク トル EfPPおよびユーザ側反効き目べク トル EfMUPのうちのいずれかが利用されない場合、利用されないベタトルに代わって、 数値 「1」 が代入されて計算される。
また、ユーザ側反効き目べク トル EfMUPは、ユーザにより設定可能であっても、 ユーザの初期設定を基に設定されるものであっても良いし、 ユーザ情報登録部 6 3において生成されるものであっても良い。 ユーザ側反効き目べクトル EfMUPの 生成の詳細については、 図 2 6または図 2 7を用いて後述する。
ステップ S 1 2 5において、べク トル演算部 6 2は、番組べク トル PPと正履歴 ベタトル UPとの類似度 SimUP—番組べク トル PPと負履歴べク トルとの類似度
SimMUPを算出し、 その上位となる所定数 (例えば 3つ) の番組の番組べク トル PP または E P Gデータを推薦情報として抽出し、 推薦情報出力部 4 9に出力して、 推薦番組リスト 5 0に登録させるとともに、 テレビジョン表示装置 1 1およぴ録 画再生装置 1 2に出力して、 処理が終了される。
このような処理により、 設定に応じて、 番組側効き目べク トノレ EfPP、 ユーザ側 効き目ベクトル EfUP、 または、 ユーザ側反効き目ベク トル EfMUPが用いられて、 推薦情報が抽出されるので、 ユーザの嗜好を正しく反映した番組を推薦するよう にすることができる。
図 1 9を用いて説明した処理では、 番組べクトル PP、 正履歴べク トル UPおよ び負履歴べクトル MUPが、 詳細項目の全要素を 1列に並べたベタトルで表されて いる場合の処理について説明したが、 番組べクトル PP、 正履歴べク トル UPおよ び負履歴ベクトル MUPを、 それぞれ、 大項目ごとに演算するようにしても良い。 次に、 図 2 0のフローチャートを参照して、 大項目ごとに、 番組側効き目べク トル EfPP、 ユーザ側効き目ベク トル EfUP、 または、 ユーザ側反効き目ベク トル E UPを反映させることができるようにした、 マッチング処理 4について説明す る。
ステップ S 1 3 1において、 図 1 9のステップ S 1 2 1と同様の処理が実行さ れて、 効き目ベク トルの利用設定内容が取得される。
ステップ S 1 3 2において、 ベタトル演算部 6 2は、 供給された番組べク トル PPと、 正履歴保存部 4 7から読み出した正履歴べク トル UPのそれぞれの大項目 について、 番組べク トル PPと正履歴べクトル UPのコサイン距離を算出する。 こ こでは、 効き目ベク トルは演算に利用されない。
ステップ S 1 3 3において、 ベタトル演算部 6 2は、 次の式 (7) を用いて、 項目ごとに算出されたコサイン距離に、 必要に応じて効き目べク トルを乗算し、 得られた値を合計して、 類似度 SimUPを算出する。
SimUP = epcU,eud_ · cos 0 u++ epdg- eud^- cos Θ ug+ epdp* eudp* cos Θ up
+ epL' eud。 · cos Θ ua+ epdj^* eud^* cos Θ · · ■ (7) なお、 式 (7) においては、 番組べク トル PP= ( t, g, p, pa, k) と正履歴ベクトル UP= (ut, ug, up, ua, uk) との大項目ごとのコサイン距離 力 (cos Θ ut, cos Θ ug, cos Θ up , cos Θ ua, cos Θ uk) であり、 番糸且倜 J効き目 ベタトル EfPP= (epdt, epdg, epdp, epda, epdk)、ユーザ側効き目べクトル EfUP = (eudt, eud , eudp, eud„, eudk) であるものとする。 また、 式 (7) におい ては、 番組側効き目べク トル EfPPおよびユーザ側効き目べクトル EfUPのいずれ をも利用するものとして説明しているが、 設定により、 番組側効き目ベクトル EfPPおよびユーザ側効き目べクトル EfUPのうちのいずれかが利用されない場合、 利用されないベクトルに代わって、 数値 「1」 が代入されて計算される。
ステップ S 1 34において、 ベタ トル演算部 6 2は、 ステップ S 1 3 3におい て算出された、番組べク トル PPと正履歴べク トル UPとの類似度 SimUPを比較し、 類似度の上位から、 例えば、 1 0などの所定の数の番組べクトル PPを抽出する。 ステップ S 1 3 5において、 ベタ トル演算部 6 2は、 ステップ S 1 3 4の処理 により抽出された番組べクトル PPと、負履歴保存部 4 8から読み出した負履歴べ クトル MUPのそれぞれの大項目について、番組べク トル PPと負履歴べクトル MUP のコサイン距離を算出する。 ここでは、 効き目ベク トルは演算に利用されない。 ステップ S 1 3 6において、 ベタ トル演算部 6 2は、 次の式 (8) を用いて、 項目ごとに算出されたコサイン距離に、 必要に応じて効き目べクトルを乗算し、 得られた値を合計して、 類似度 SimMUPを算出する。
SimMUP = epd-j- * erad+ ' cos Θ mt+ epdCT' eradg* cos Θ nig+ epdn * emdp' cos Θ rap
+ epd„ · emda · co s Θ m„ + epd^* erndj^' cos Θ ra^ · ■ · ( 8 )
なお、 式 (8 ) においては、 番組ベクトル PP= ( t, g, p, p a, k) と負履歴ベクトル UP= (mt, mg, mp, ma, mk) との大項目ごとのコサイン 距離が、 (cos e mt, cos Θ mg) cos Θ rap , cos Θ ma, cos Θ mk) であり、 番組側効 き目ベクトル EfPP= (epdt, epdg, epdp, epda, epdk) 、 ユーザ側反効き目べク トノレ EfMUP= (emdt, emdg, emdp, emda, emdk) であるものとする。 また、 式 (8 ) においては、番組側効き目べクトル EfPPおよびユーザ側反効き目べク トル EfMUP のいずれをも利用するものとして説明しているが、 設定により、 番組側効き目べ クトル EfPPおよびユーザ側反効き目べクトル EfMUPのうちのいずれかが利用され ない場合、 利用されないべク トルに代わって、 数値 「1」 が代入されて計算され る。
ステップ S 1 3 7において、ベク トル演算部 6 2は、 {番組ベク トル PPと正履 歴べク トル UPとのコサイン距離である類似度 SimUP} — {番組べク トノレ PPと負 履歴べク トルとのコサイン距離である類似度 SimMUP} を算出し、 その上位となる 所定数(例えば 3つ)の番組の番組べクトル PPまたは E P Gデータを推薦情報と して抽出し、 推薦情報出力部 4 9に出力して、 推薦番組リスト 5 0に登録させる とともに、 テレビジョン表示装置 1 1および録画再生装置 1 2に出力して、 処理 が終了される。
このような処理により、 大項目ごとに、 効き目べク トルが利用されて重み付け が行われるので、 ユーザの嗜好に詳細に合致した推薦情報を生成することが可能 となる。
次に、 図 2 1のフローチャートを参照して、 図 1 6を用いて説明した正履歴べ クトルおょぴ負履歴べク トル生成処理 2の処理により生成された、 ジャンル別の 正履歴べク トル UPおよぴ負履歴べクトル MUP、 並びに、 ジャンル別のユーザ側効 き目べクトル EfUPおよびユーザ側反効き目べクトル EfMUPを用いて、マッチング 処理を実行するマッチング処理 5について説明する。
ステップ S 1 4 1において、 図 1 9のステップ S 1 2 1と同様の処理が実行さ れて、 効き目べク トルの利用設定内容が取得される。
ステップ S 1 4 2において、 ベタトル演算部 6 2は、 供給された番組べク トル PPのジャンルを抽出する。 ここでは、 例えば、 供給された番組ベク トル PPのジ ヤンルが 「ドラマ」 であったものとして説明する。
ステップ S 1 4 3において、 ベタトル演算部 6 2は、 供給された番組べク トル PPと、 正履歴保存部 4 7から読み出した、 ジャンル 「ドラマ」 に対応する正履歴 ベタトル UPのそれぞれの大項目について、番組べクトノレ PPと正履歴べク トノレ UP のコサイン距離を算出する。 ここでは、 効き目ベク トルは演算に利用されない。 ステップ S 1 44において、 ベタトル演算部 6 2は、 次の式 (9) を用いて、 項目ごとに算出されたコサイン距離に、 必要に応じて、 ジャンル 「ドラマ」 に対 応するユーザ側効き目ベクトルを乗算し、 得られた値を合計して、 類似度 SimUP を算出する。
SiraUP = epdt"eudt(j'cos Θ ut(j+ epdg · eudgc{ · cos Θ ugc^ + epdp · eudp(^ - cos Θ upc}
+ epd„-eudad*cos 0 uad+ e dj^* eudj^^* cos Θ · · · (9) なお、 式 (9) においては、 番組ベクトル PP= ( t, g, pp, a, k) と、 ジャンル 「ドラマ」 に対応する正履歴べクトル UP= (ut, ug, up, ua, uk) との大項目ごとのコサイン距離が、 (cos Θ utd, cos Θ ugd, cos Θ upd, cos Θ uad, cos Θ ukd)であり、番組側効き目べクトル EfPP= (epdt, epdg, epdp, epda, epdk)、 ジャンル 「ドラマ」 に対応するユーザ側効き目ベク トル EfUP= (eudtd> eudgd, eudpd, eudad, eudkd) であるものとする。 また、 式 (9) においては、 番組側効 き目べクトル EfPPおよびユーザ側効き目べク トル EfUPのいずれをも利用するも のとして説明しているが、設定により、番組側効き目べク トル EfPPおよびユーザ 側効き目べクトル EfUPのうちのいずれかが利用されない場合、利用されないベタ トルに代わって、 数値 「1」 が代入されて計算される。 ステップ S 1 4 5において、 ベタ トル演算部 6 2は、 ステップ S 1 4 3におい て算出された、番組べク トル PPと正履歴べクトル UPとの類似度 SimUPを比較し、 類似度の上位から、 例えば、 1 0などの所定の数の番組ベク トル PPを抽出する。 ステップ S 1 4 6において、 ベタ トル演算部 6 2は、 ステップ S 1 4 5の処理 により抽出された番組べクトル PPと、負履歴保存部 4 8から読み出したジャンル 「ドラマ」 に対応する負履歴ベクトル MUPのそれぞれの大項目について、 番組べ ク トル PPと負履歴べク トル MUPのコサイン距離を算出する。 ここでは、効き目べ クトルは演算に利用されない。
ステップ S 1 4 7において、ベタトル演算部 6 2は、次の式(1 0 ) を用いて、 項目ごとに算出されたコサイン距離に、 必要に応じて、 ジャンル 「ドラマ」 に対 応する効き目べクトルを乗算し、得られた値を合計して、類似度 SimMUPを算出す る。
SiraMUP = epdt - emdtf] - cos Θ emdgcj · cos Θ mgcj - epdp - emdpcj * cos Θ mpcj
Figure imgf000055_0001
+ epcL · emdad' cos Θ raad+ epdj^* erndj^j' cos Θ · · · ( 1 0 ) なお、 式 (1 0 ) においては、 番組ベク トル PP ( t, p g, p, a, k) と負履歴ベクトル MUP= (mt, mg, mp, ma, mk) との大項目ごとのコサイン 距离" I力 Sヽ (cos Θ mtd, cos Θ mgd, cos Θ mpc , cos Θ ma(j, cos Θ m^) であり、 番組 側効き目べクトノレ EfPP = (epdt, epdg, epdp, epda, epdk) 、 ジャンル 「ドラマ」 に対応するユーザ側反効き目べクトル EfMUP= (emdtd, emdgd, emdpd, emdad, eradkd) であるものとする。 また、 式 (1 0 ) においては、 番組側効き目ベクトル EfPP およびユーザ側反効き目べク トル EfMUPのいずれをも利用するものとして説明し ているが、設定により、番組側効き目べク トル EfPPおよびユーザ側反効き目べク トル E预 UPのうちのいずれかが利用されない場合、 利用されないベタトルに代わ つて、 数値 「1」 が代入されて計算される。
ステップ S 1 4 8において、ベク トル演算部 6 2は、 {番組ベクトル PPと正履 歴べクトル UPとのコサイン距離である類似度 SimUP} — {番組べク トル PPと負 履歴べク トルとのコサイン距離である類似度 SimMUP}. を算出し、 その上位となる 所定数(例えば 3つ)の番組の番組べクトル PPまたは E P Gデータを推薦情報と して抽出し、 推薦情報出力部 4 9に出力して、 推薦番組リス ト 5 0に登録させる とともに、 テレビジョン表示装置 1 1および録画再生装置 1 2に出力して、 処理 が終了される。
このような処理により、大項目ごとに、ジャンル別の正履歴べクトル UPおよび 負履歴べク トル MUPと番組べクトル PPとのコサイン距離が求められ、ジャンルに 対応した効き目べク トルが利用されて重み付けが行われて類似度が算出されるの で、 ユーザの嗜好に詳細に合致した推薦情報を生成することが可能となる。
また、ユーザ側効き目べク トル EfUPおよび反効き目べク トル EfMUPは、上述し たように、 初期登録保存部 4 5に登録されている、 ユーザの初期登録内容を基に 生成されるようにしても良いし、 正履歴べクトル UPまたは負履歴べク トル MUP、 あるいは、 一定期間にユーザが視聴した番組をカウントすることにより、 ユーザ 固有のユーザ側効き目べク トル EfUPおよび反効き目べク トル E UPが生成される ようにしても良い。
図 2 2のフローチャートを参照して、 一定期間にユーザが視聴した番組をカウ ントすることによりユーザ側効き目べクトル EfUPを生成する、ユーザ側効き目べ クトル生成処理 1について説明する。
ステップ S 1 5 1において、マッチング処理部 4 3のユーザ情報登録部 6 3は、 未処理の大項目のうちのいずれかを選択する。
ステップ S 1 5 2において、 ユーザ情報登録部 6 3は、 正履歴保存部 4 7に保 存されている正履歴を参照して、 例えば、 1週間、 1ヶ月、 または 3ヶ月などの 一定期間中にユーザが視聴した番組を検出し、 番組べク トル抽出部 4 2に、 一定 期間中にユーザが視聴した番組に対応する番組べクトル PPをデータ取得部 4 1 から抽出させて、 ステップ S 1 5 1において選択された大項目に含まれる詳細項 目ごとに番組数をカウントする。
具体的には、 例えば、 ステップ S 1 5 1において選択された大項目が、 大項目 ジャンル G m == {ドラマ, バラエティ, スポーツ, 映画, 音楽, 子供向け Z教育, 教養 Zドキュメント, ニュース/報道, その他 } であれば、 ユーザ情報登録部6 3は、一定期間中にユーザが視聴した番組の番組べク トル PPの構成要素を、それ ぞれに対応する項目に分類してカウントする。 一定期間中にユーザが視聴した番 組が、 例えば、 5 0番組であった場合、 番組数のカウント結果は、 例えば、 ジャ ンル Gm= ( 1 0, 1 8 , 5 , 2 , 8 , 1 , 0, 1, 5 ) となる。
ステップ S 1 5 3において、 ユーザ情報登録部 6 3は、 番組べク トル抽出部 4 2に、同一期間における全ての番組に対応する番組べクトル PPをデータ取得部 4 1から抽出させて、 ステップ S 1 5 1において選択された大項目に含まれる詳細 項目ごとに番組数を力ゥントする。
具体的には、 例えば、 ステップ S 1 5 1において選択された大項目が、 大項目 ジャンル Gm= {ドラマ, パラエティ, スポーツ, 映画, 音楽, 子供向け Z教育, 教養 ドキュメント, ニュース Z報道, その他 } であれば、 ユーザ情報登録部 6 3は、同一期間における全ての番組の番組べクトル PPの構成要素を、それぞれに 対応する項目に分類してカウントする。同一期間における全ての番組が、例えば、 1 0◦ 0番組であった場合、 番組数のカウント結果は、 例えば、 ジャンル Gm = (1 04, 2 3 9, 6 8 , 2 5, 7 8, 9 1 , 6 0, 2 5 4, 8 1 ) となる。 ステップ S 1 54において、 ユーザ情報登録部 6 3は、 ステップ S 1 5 2およ びステップ S 1 5 3のカウント結果を基に、 ユーザの視聴実績のカウント数/全 番組のカウント数を算出する。
番組編成は、 視聴率競争の影響により、 大衆の嗜好を反映していると考えられ る。 すなわち、 ユーザの視聴実績のカウント数ノ全番組のカウント数の演算は、 換言すれば、 ユーザの視聴実績のカウント数を、 標準モデルとしての全番組の力 ゥント数で正規化することと同義である。 ステップ S 1 5 4において算出される 正規化べク トルを正規化べクトル Dと称するものとする。
例えば、大項目ジャンル Gm= {ドラマ, バラエティ, スポーツ, 映画, 音楽, 子供向けノ教育, 教養 ドキュメント, ニュース/報道, その他 } において、 1 週間の全番組のカウント数が、 (8, 1 2, 3, 7, 6, 4, 2, 8, 1 0) で あり、対してユーザが視聴した番組のカウント数が、 (4, 0, 1, 2, 3, 4, 5, 5, 2)であった場合、 正規化ベク トル Dは、 以下のようになる。 D= (4 /8 , 0/ 1 2, 1/3 , 2/7, 3/6 , 4/4 , 1/2, 2/8 , 2/ 1 0) = (0. 5 , 0, 0. 3 3 , 0. 2 8, 0. 5 , 1. 0, 0. 5 , 0. 1 3, 0. 2) すなわち、 正規化ベク トル Dの構成要素が 1. 0である場合は、 設定され た期間中に、 該当する項目の全番組を視聴したこと、 正規化ベクトル Dの構成要 素が 0である場合は、 設定された期間中に、 該当する番組は一つも視聴しなかつ たことを意味する。
ステップ S 1 5 5において、 ユーザ情報登録部 6 3は、 ステップ S 1 5 4の算 出結果を基に、 対応する大項目の効き目べクトルを生成する。
効き目ベク トルを生成するために、 大項目ジャンル Gm= {ドラマ, バラェテ ィ, スポーツ, 映画, 音楽, 子供向け Z教育, 教養/ドキュメント, ニュース Z 報道, その他 } のうちのいずれかの項目を用いて、 標準値を設定する。 例えば、 ジャンル: 「ドラマ」 の番組 1週間分において、 一般的なユーザは、 その 2割程 度を視聴しているとして、 標準値を 0. 2に設定すればよい。 大項目の効き目べ タトルは、 相対値として算出されるため、 設定値は 0乃至 1のいずれの値であつ てもかまわない。 そして、 ユーザ側効き目ベク トルは、 ステップ S 1 5 4におい て算出された正規化べク トル Dと、 設定値との相対値である。
従って、 ユーザの興味ジャンルを示す、 大項目ジャンル Gmの効き目ベク トル Eは、 E= (0. 3, — 0. 2, 0. 1 3, 0. 0 8, 0. 3, 0. 8, 0. 3, 一 0. 0 7, 0. 0) と算出されるので、 対応するユーザは、 「子供向け Z教育」 のジャンルを好み、 「バラエティ」 のジャンルを好まないと判断するこ とができる。
ステップ S 1 5 6において、 ユーザ情報登録部 6 3は、 全ての大項目の効き目 べクトルが生成されたか否かを判断する。 ステップ S 1 5 6において、 全ての大 項目の効き目べクトルが生成されていないと判断された場合、 処理は、
S 1 5 1に戻り、 それ以降の処理が繰り返される。 ステップ S 1 5 6において、 全ての大項目の効き目べク トルが生成されたと判 断された場合、 ステップ S 1 5 7において、 ユーザ情報登録部 6 3は、 全ての大 項目の効き目べクトルを保存して、 処理が終了される。
このような処理により、 一般的な嗜好と、 ユーザ固有の嗜好との差を求めるこ とができる。 また、 ユーザ側効き目べクトル EfUPを、 例えば、 3ヶ月、 半年など の所定の期間ごとに再演算するようにすることにより、 ユーザの嗜好をリアルタ ィムに反映した番組を推薦することができる。
また、 図 2 2の処理においては、 例えば、 1週間、 1ヶ月、 または 3ヶ月など の一定期間中にユーザが視聴した番組を基にユーザ側効き目べクトル EfUPを求 めるものとして説明したが、 複数の期間を対象として、 例えば、 短期、 中期、 長 期に対応するユーザ側効き目べク トル EfUPを算出し、これら複数の効き目べクト ルを用いて、 推薦情報を決定するようにしても良い。
ここでは、ユーザ固有の嗜好を、ユーザ側効き目べクトル EfUPとして利用する 場合について説明したが、ユーザ固有の嗜好を、正履歴べクトル UPとしてマッチ ング処理に用いるようにしても良い。
また、 放送されている全番組に代わって、 視聴者が最も番組を視聴する所定の 時間帯 (例えば、 1 8時乃至 2 2時の、 いわゆる、 ゴールデンタイム) に放送さ れる全番組をカウントするようにしてもよい。 このようにすることにより、 一般 的な嗜好を求めるための演算処理を大幅に少なくすることができる。
次に、 図 2 3のフローチャートを参照して、正履歴べクトル UPと、大衆の嗜好 との類似度を示すコサイン距離の演算によって、 ユーザ固有の嗜好と、 大衆の嗜 好との隔たりをマッチングに利用するためのユーザ側効き目べクトル EfUPを求 める、 ユーザ側効き目べクトル算出処理 2について説明する。
ステップ S 1 6 1において、マッチング処理部 4 3のユーザ情報登録部 6 3は、 正履歴保存部 4 7に保存されている正履歴べク トル UPを取得する。
ステップ S 1 6 2において、 ユーザ情報登録部 6 3は、 一般的な嗜好を示す、 標準嗜好べクトル APPを取得する。 標準嗜好べク トル APPは、 配信サーバ 5から供給されるものとしても良いし、 または、 番組編成は、 視聴率競争の影響により、 大衆の嗜好を反映していると考 えられるので、 図 2 2を用いて説明したユーザ側効き目べクトル算出処理 1と同 様にして、 一定期間に放送された全番組の内容をカウントし、 必要に応じて正規 化して、 標準嗜好ベクトル APPとするようにしても良い。
配信サーバ 5においては、 例えば、 一般的な視聴率調査や、 その他の方法を用 いて、 一般的な嗜好を示す標準嗜好べクトル APPを生成するようにしても良い。 ステップ S 1 6 3において、 ユーザ情報登録部 6 3は、 大項目ごとに、 標準嗜 好べク トル APPと、正履歴べクトル UPとのコサイン距離を算出する。 コサイン距 離が大きいほど、標準嗜好べク トル APPと、正履歴べク トル UPとの類似度が高い。 ステップ S 1 6 4において、 ユーザ情報登録部 6 3は、 ステップ S 1 6 3にお いて算出されたコサイン距離を基に、大項目ごとに、コサイン距離を逆数にして、 効き目べク トル EfUPを生成して、処理が終了される。 コサイン距離の逆数が大き いほど、 標準嗜好べク トル APPと、 正履歴べク トル UPとの類似度は低い。
このような処理により、 一般的な嗜好と、 対応するユーザ固有の嗜好との差を 反映したユーザ側効き目べク トル EfUPを求めることができる。このユーザ側効き 目べク トル EfUPを用いて番組推薦処理を行った場合、ユーザの嗜好と一般的な嗜 好との違いが強調されて、 推薦される番組が決定される。
なお、 ここでは、 番組べク トル PP、 および正履歴べクトル UPが、 大項目ごと にべクトルで表されているものとして説明したが、番組べク トル PP、 および正履 歴べク トル UP力 詳細項目の全要素を 1列に並べたべクトルで表されている場合 においても、 同様の処理が実行可能であることは言うまでもない。
また、標準嗜好べク トル APPと、正履歴べク トル UPとの類似度は、効き目べク トルを算出するのみならず、 そのユーザのユニーク度を示す指数として、 番組の 推薦に直接的に用いるようにしても良い。 例えば、 標準嗜好ベクトル APPと、 正 履歴べクトル UPとの類似度が高い場合、一般向けの流行に即した新番組などを優 先的に推薦するようにしても良い。 59
図 2 2および図 2 3を用いて説明したように、 ユーザ側効き目べクトル EfUP は、 ユーザの操作履歴に基づいて、 学習的に求められると好適であるが、 ユーザ 側効き目ベク トルは、 予め初期登録として登録されていても良いし、 経験などに より求められる、 予め設定されている値を用いるようにしても良い。
なお、大項目に着目して、ユーザ側効き目べクトル EfUPを生成するのみならず、 大項目を構成する構成要素に着目して、ユーザ側効き目べクトル EfUPを生成する ようにしても良い。例えば、大項目を構成する構成要素「出演者 P m」において、 主役と脇役を区別可能にしておき、 ドラマや映画において、 主役よりも脇役の配 役を優先するユーザは、 主役に対して、 脇役の重み付けを大きくするようにユー ザ側効き目べク トル EfUPを設定可能としたり、大項目を構成する構成要素「脚本 /原作 Z演出 Am」 において、 監督、 演出家、 原作者、 カメラマンなどを区別可能 にしておき、 監督や演出家より、 カメラマンを重視するユーザは、 カメラマンの 重み付けを大きくするようにユーザ側効き目べク トル EfUPを設定可能なように しても良い。
また、ユーザ側効き目べク トル EfUPをジャンルごとに生成し、図 2 1を用いて 説明したマッチング処理 5のように、対応するジャンルの正履歴べクトル UPと番 組べクトル PPとのマッチングのときに作用させるようにしても良い。
次に、 図 2 4のフローチャートを参照して、 一定期間にユーザが視聴した番組 を、ジヤンル別にカウントすることによりユーザ側効き目べク トル EfUPを生成す る、 ユーザ側効き目ベク トル生成処理 3について説明する。
ステップ S 1 7 1において、マッチング処理部 4 3のユーザ情報登録部 6 3は、 一定期間にユーザが視聴した番組を、 ジャンル別にカウントするために、 いずれ かのジャンルを選択する。
ステップ S 1 7 2において、 ユーザ情報登録部 6 3は、 未処理の大項目のうち のいずれかを選択する。
ステップ S 1 7 3において、 ユーザ情報登録部 6 3は、 正履歴保存部 4 7に保 存されている正履歴を参照して、 例えば、 1週間、 1ヶ月、 または 3ヶ月などの 一定期間中にユーザが視聴した番組のうち、選択されたジャンルのものを検出し、 番組ベクトル抽出部 4 2に、 一定期間中にユーザが視聴したもののうち、 選択さ れたジャンルの番組に対応する番組べクトノレ PPをデータ取得部 4 1から抽出さ せて、 ステップ S 1 7 2において選択された大項目に含まれる詳細項目ごとに番 組数をカウントする。
ステップ S 1 74において、 ユーザ情報登録部 6 3は、 番組べク トル抽出部 4 2に、 同一期間における全ての番組のうち、 選択されたジャンルに対応する番組 ベタトノレ PPをデータ取得部 4 1から抽出させて、ステップ S 1 7 2において選択 された大項目に含まれる詳細項目ごとに番組数をカウントする。
ステップ S 1 7 5において、 ユーザ情報登録部 6 3は、 ステップ S 1 7 3およ びステップ S 1 74のカウント結果を基に、 選択されたジャンルにおける、 ユー ザの視聴実績のカウント数 全番組のカウント数を算出する。
上述したように、 番組編成は、 視聴率競争の影響により、 大衆の嗜好を反映し ていると考えられる。 すなわち、 選択されたジャンルにおける、 ユーザの視聴実 績のカウント数ノ全番組のカウント数の演算は、 換言すれば、 対応するジャンル におけるユーザの視聴実績のカウント数を、 標準モデルとしての対応するジヤン ルの全番組のカウント数で正規化することと同義である。 ステップ S 1 7 5にお いて算出される正規化べクトルを正規化べクトル D 'と称するものとする。
例えば、大項目ジャンル Gm= {ドラマ, バラエティ, スポーツ, 映画, 音楽, 子供向け/教育, 教養/ドキュメント, ェユース/報道, その他 } のうちの 「ド ラマ」 のジャンルに対応する番組べク トル PPの、 大項目時間帯 Tm= {朝、 昼、 夕方、 ゴールデン、 深夜 } において、 1週間の全番組のカウント数が、 (1 0, 3 5, 7, 5 3 , 1 7) であり、 対してユーザが視聴した番組のカウント数が、 (5, 0, 0, 8, 4)であった場合、正規化ベクトル D 'は、以下のようになる。 D ' = (5/1 0, 0/3 5 , 0/7, 8/5 3 , 4/ 1 7) = (0. 5, 0, 0, 0. 2 8, 0. 1 5, 0. 24) すなわち、 正規化べタト ル D ,の構成要素が 1. 0である場合は、 設定された期間中に、 該当する項目の 全番組を視聴したことを意味し、 正規化べク トル ETの構成要素が 0である場合 は、設定された期間中に、該当する番組は一つも視聴しなかったことを意味する。 ステップ S 1 7 6において、 ユーザ情報登録部 6 3は、 ステップ S 1 7 5の算 出結果を基に、 選択されたジャンルにおける、 対応する大項目の効き目べク トル を生成する。
効き目ベクトルを生成するために、 大項目時間帯 Tm= {朝、 昼、 夕方、 ゴー ルデン、 深夜 } のうちのいずれかの項目を用いて、 標準値を設定する。 例えば、 時間帯: 「ゴールデン」 の番組 1週間分において、 一般的なユーザは、 ドラマの 2割程度を視聴しているとして、 標準値を 0. 2に設定すればよい。 大項目の効 き目ベクトルは、 相対値として算出されるため、 設定値は 0乃至 1のいずれの値 であってもかまわない。 そして、 ユーザ側効き目ベク トルは、 ステップ S 1 7 5 において算出された正規化べクトル ET と、 設定値との相対値である。
従って、 ユーザの興味ジャンルを示す、 大項目ジャンル Gmの効き目ベク トル E 'は、 E ' = (0. 3 , — 0. 2, 一0. 2, 一 0. 0 5, 0. 0 4) と 算出されるので、 対応するユーザは、 朝の時間帯のドラマを好み、 昼や夕方の時 間帯のドラマを好まないと判断することができる。
ステップ S 1 7 7において、 ユーザ情報登録部 6 3は、 選択されたジャンルに おいて、 全ての大項目の効き目ベクトルが生成されたか否かを判断する。 ステツ プ S 1 7 7において、 全ての大項目の効き目べク トルが生成されていないと判断 された場合、処理は、ステップ S 1 7 2に戻り、それ以降の処理が繰り返される。 ステップ S 1 7 7において、 全ての大項目の効き目べク トルが生成されたと判 断された場合、 ステップ S 1 7 8において、 ユーザ情報登録部 6 3は、 全てのジ ヤンルの処理が終了したか否かを判断する。 ステップ S 1 78において、 全ての ジャンルが終了していないと判断された場合、処理は、ステップ S 1 7 1に戻り、 それ以降の処理が繰り返される。
ステップ S 1 7 8において、 全てのジャンルが終了したと判断された場合、 ス テツプ S 1 7 9において、 ユーザ情報登録部 6 3は、 全ての大項目の効き目べク トルを保存して、 処理が終了される。
このような処理により、 一般的な嗜好と、 ユーザ固有の嗜好との差をジャンル 別に求めることができる。 また、 図 2 2を用いて説明した場合と同様にして、 ュ 一ザ側効き目べクトル EfUPを、例えば、 3ヶ月、半年などの所定の期間ごとに再 演算するようにすることにより、 ユーザの嗜好をリアルタイムに反映した番組を 推薦することができる。
また、 図 2 4の処理においても、 例えば、 1週間、 1ヶ月、 または 3ヶ月など の一定期間中にユーザが視聴した番組を基にユーザ側効き目べクトル EfUPを求 めるものとして説明したが、 図 2 2を用いて説明した場合と同様にして、 複数の 期間を対象として、 例えば、 短期、 中期、 長期に対応するユーザ側効き目べク ト ル EfUPを算出し、 これら複数の効き目べク トルを用いて、推薦情報を決定するよ うにしても良い。
また、 図 2 4の処理においても、 放送されている全番組に代わって、 視聴者が 最も番組を視聴する所定の時間帯 (例えば、 1 8時乃至 2 2時の、 いわゆる、 ゴ 一ルデンタイム) に放送される全番組をカウントするようにしてもよい。
次に、 図 2 5のフローチヤ一トを参照して、正履歴べクトル UPと、大衆の嗜好 との類似度を示すコサイン距離の演算を、 ジャンル別に実行することによって、 ユーザ固有の嗜好と大衆の嗜好との隔たりをマッチングに利用するためのユーザ 側効き目べクトル EfUPを求める、ユーザ側効き目べク トル生成処理 4について説 明する。
ステップ S 1 9 1において、マッチング処理部 4 3のユーザ情報登録部 6 3は、 処理を実行するジャンルを指定するために、 いずれかのジャンルを選択する。 ステップ S 1 9 2において、 ユーザ情報登録部 6 3は、 正履歴保存部 4 7に保 存されている正履歴べク トル UPのうち、 選択されたジャンルの正履歴べクトル UPを取得する。
ステップ S 1 9 3において、 ユーザ情報登録部 6 3は、 一般的な嗜好を示す、 標準嗜好べク トル APPのうち、 選択されたジャンルの標準嗜好べク トル APPを取 得する。
標準嗜好ベク トル APPは、 上述したように、 配信サーバ 5から供給されるもの としても良いし、 または、 番組編成は、 視聴率競争の影響により、 大衆の嗜好を 反映していると考えられるので、 図 2 4を用いて説明したユーザ側効き目べクト ル算出処理 3と同様にして、 一定期間に放送された全番組の内容をジャンル別に カウントし、 必要に応じて正規化して、 ジャンル別標準嗜好ベクトル APPとする ようにしても良い。
配信サーバ 5においては、 例えば、 一般的な視聴率調査や、 その他の方法を用 いて、 一般的な嗜好を示す標準嗜好べクトル APPをジャンル別に生成するように しても良い。
ステップ S 1 9 4において、 ユーザ情報登録部 6 3は、 選択されたジャンルの 正履歴べクトル UPと、選択されたジャンルの標準嗜好べク トル APPを用いて、大 項目ごとに、標準嗜好べク トル APPと、正履歴べク トル UPとのコサイン距離を算 出する。 コサイン距離が大きいほど、 標準嗜好べクトル APPと、 正履歴べク トル UPとの類似度が高い。
ステップ S 1 9 5において、 ユーザ情報登録部 6 3は、 ステップ S 1 9 4にお いて算出されたコサイン距離を基に、大項目ごとに、コサイン距離を逆数にして、 選択されたジャンルの効き目べク トル EfUPを生成する。コサイン距離の逆数が大 きいほど、 標準嗜好べク トル APPと、 正履歴べク トル UPとの類似度は低い。 ステップ S 1 9 6において、 ユーザ情報登録部 6 3は、 全てのジャンルの処理 が終了したか否かを判断する。 ステップ S 1 7 8において、 全てのジャンルが終 了していないと判断された場合、 処理は、 ステップ S 1 9 1に戻り、 それ以降の 処理が繰り返される。 ステップ S 1 9 6において、 全てのジャンルが終了したと 判断された場合、 処理が終了される。
このような処理により、 一般的な嗜好と、 対応するユーザ固有の嗜好との差を 反映した、 ジャンル別のユーザ側効き目べクトル EfUPを求めることができる。 また、 図 2 3を用いて説明した処理と同様にして、 標準嗜好ベク トル APPと、 負履歴べク トル MUPとの類似度を求め、 その逆数を、 反効き目べクトル EfMUPと して算出するようにしてもよい。
次に、 図 2 6のフローチャートを参照して、 負履歴ベク トル MUPを、 大衆の嗜 好と比較することにより、 反効き目べクトル EfMUPを求めるユーザ側反効き目べ タ トル算出処理 1について説明する。
ステップ S 2 0 1において、マッチング処理部 4 3のユーザ情報登録部 6 3は、 負履歴保存部 4 8に保存されている負履歴べクトル MUPを取得する。
ステップ S 2 0 2において、 ユーザ情報登録部 6 3は、 一般的な嗜好を示す、 標準嗜好べクトル APPを取得する。
標準嗜好ベク トル APPは、 配信サーバ 5から供給されるものとしても良い。 あ るいは、 番組編成は、 視聴率競争の影響により、 大衆の嗜好を反映していると考 えられるので、 図 2 2を用いて説明したユーザ側効き目べクトル算出処理 1と同 様にして、 一定期間に放送された全番組の内容をカウントし、 必要に応じて正規 化して、 標準嗜好べクトル APPとするようにしても良い。
ステップ S 2 0 3において、 ユーザ情報登録部 6 3は、 大項目ごとに、 標準嗜 好ベク トル APPと、 負履歴ベクトル MUPとのコサイン距離を算出する。 コサイン 距離が大きいほど、 標準嗜好べク トル APPと、 負履歴べク トル MUPとの類似度が 高い。
ステップ S 2 0 4において、 ユーザ情報登録部 6 3は、 ステップ S 2 0 3にお いて算出されたコサイン距離を基に、大項目ごとに、コサイン距離を逆数にして、 反効き目ベク トル EfMUPを生成して、 処理が終了される。
このような処理により、反効き目べクトル EfMUPを生成することができるので、 ユーザが好まない番組を、 推薦する番組から効果的に省くことができる。
次に、 図 2 7のフローチャートを参照して、 ジャンル別に実行されるユーザ側 反効き目ベク トル生成処理 2について説明する。
ステップ S 2 1 1において、マッチング処理部 4 3のユーザ情報登録部 6 3は、 処理を実行するジャンルを指定するために、 いずれかのジャンルを選択する。 ステップ S 2 1 2において、 ユーザ情報登録部 6 3は、 負履歴保存部 4 8に保 存されている負履歴べク トル MUPのうち、 選択されたジャンルの負履歴べク トル MUPを取得する。
ステップ S 2 1 3において、 ユーザ情報登録部 6 3は、 一般的な嗜好を示す、 標準嗜好べク トル APPのうち、 選択されたジャンルの標準嗜好べク トル APPを取 得する。
ステップ S 2 1 4において、 ユーザ情報登録部 6 3は、 選択されたジャンルの 負履歴べク トル MUPと選択されたジャンルの標準嗜好べク トル APPとを基に、 大 項目ごとに、 標準嗜好べクトル APPと、 負履歴べタ トル MUPとのコサイン距離を 算出する。 コサイン距離が大きいほど、 標準嗜好べク トル APPと、 負履歴べクト ル MUPとの類似度が高い。
ステップ S 2 1 5において、 ユーザ情報登録部 6 3は、 ステップ S 2 1 4にお いて算出されたコサイン距離を基に、大項目ごとに、コサイン距離を逆数にして、 反効き目ベクトル ΕΏΙΙΙΡを生成する。 コサイン距離の逆数が大きいほど、 標準嗜 好べク トル ΑΡΡと、 負履歴べクトル MUPとの類似度が低い。
ステップ S 2 1 6において、 ユーザ情報登録部 6 3は、 全てのジャンルの処理 が終了したか否かを判断する。 ステップ S 2 1 6において、 全てのジャンルが終 了していないと判断された場合、 処理は、 ステップ S 2 1 1に戻り、 それ以降の 処理が繰り返される。 ステップ S 2 1 6において、 全てのジャンルが終了したと 判断された場合、 処理が終了される。
このような処理により、 反効き目ベク トル EfMUPを、 ジャンル別に生成するこ とができるので、 ユーザが好まない番組を、 推薦する番組から効果的に省くこと ができる。
なお、 ユーザ側効き目べクトル EfUPと、 反効き目べクトル EfMUPは、 図 2 3、 および、 図 2 5乃至図 2 7を用いて説明した大項目ごとのコサイン距離の逆数を n倍した値、 あるいは、 所定の桁で四捨五入した値を用いるものとしてもかまわ ないし、 1からコサイン距離の逆数を減算した値、 あるいは、 その値を n倍した ィ直を用いるものとしてもかまわない。
ここでは、 番組べクトル PP、 および負履歴べク トル MUP力 大項目ごとにべク トルで表されているものとして説明したが、番組べクトル PP、 およぴ負履歴べク トル MUPが、 詳細項目の全要素を 1列に並べたべクトルで表されている場合にお いても、 同様の処理が実行可能であることは言うまでもない。
また、 番組べクトル抽出部 4 2によって抽出される番組べク トルには、 図 7ま たは図 8を用いて説明した処理により生成された、 クループ I D、 またはクラス タコードなどのグループを示す情報が付加されている場合がある。
例えば、 ユーザが好んで視聴する番組が、 連続ドラマであった場合、 該当する 連続ドラマは、 全ての回において推薦されるようにすれば、 推薦のための演算処 理を削減することができる。 また、 ユーザに非常に好まれている番組と同グルー プの番組を優先的に推龠するようにすることによつても、 推薦のための演算処理 を削減することができる。
次に、 図 2 8のフローチャートを参照して、 クループ推薦を含むマッチング処 理について説明する。
ステップ S 2 2 1において、 マッチング処理部 4 3のべクトル演算部 6 2は、 番組べクトル抽出部 4 2から供給された番組べク トノレ PPに、 クループ I D、また はクラスタコードなどのグループを示す情報が付加されているか否かを基に、 対 応する番組は、 グループ化されているか否かを判断する。
ステップ S 2 2 1において、 対応する番組はグループ化されていると判断され た場合、 ステップ S 2 2 2において、 ベクトル演算部 6 2は、 クループ I D、 ま たはクラスタコードで示されるグループは、 推薦優先グループとして、 ユーザ情 報登録部 6 3に登録されているか否かを判断する。
ステップ S 2 2 2において、 推薦優先グループとして登録されていると判断さ れた場合、 ステップ S 2 2 3において、 ベタトル演算部 6 2は、 対応する番組の 情報を、 推薦情報として、 推薦情報出力部 4 9に供給する。 推薦情報出力部 4 9 は、 推薦番組リス ト 5 0に推薦する番組を登録するとともに、 テレビジョン表示 装置 1 1、 または、 録画再生装置 1 2に、 推薦する番組の情報を出力して、 処理 は、 後述するステップ S 2 2 7に進む。
ステップ S 2 2 1において、 対応する番組はグループ化されていないと判断さ れた場合、 または、 ステップ S 2 2 2において、 推薦優先グループとして登録さ れていないと判断された場合、 ステップ S 2 2 4において、 図 1 7乃至図 2 1を 用いて説明した、 マッチング処理 1乃至マッチング処理 5のいずれかの処理が実 行される。
ステップ S 2 2 5において、 ベタ トル演算部 6 2は、 ステップ S 2 2 4におい て実行されたマッチング処理 1乃至マッチング処理 3のいずれかの処理において 推薦された番組の番組ベクトルに、 クループ I D、 またはクラスタコードなどの グループを示す情報が付加されているか否かを基に、 推薦された番組は、 グルー プ化されているか否かを判断する。 ステップ S 2 2 5において、 推薦された番組 は、 グループ化されていないと判断された場合、 処理は終了される。
ステップ S 2 2 5において、 推薦された番組は、 グループ化されていると判断 された場合、 ステップ S 2 2 6において、 ベタトル演算部 6 2は、 番組べク トル に付加しているグループ I D、 またはクラスタコードを、 推薦優先グループとし て、 ユーザ情報登録部 6 3に登録して保存する。
ステップ S 2 2 3、 または、 ステップ S 2 2 6の処理の終了後、 ステップ S 2 2 7において、 べク トル演算部 6 2は、 負履歴保存部 4 8に保存されている負履 歴の操作ログを参照して、 ステップ S 2 2 3の処理により推薦された番組、 また は、 ステップ S 2 2 4の処理により推薦された番組のうち、 グループ化されてい るので、 ステップ S 2 2 6の処理において推薦優先グループとして登録された番 組に対して、 例えば、 推薦した番組が受け入れられずにその他の番組の視聴の視 聴または録画を指令する操作入力や、 自動録画された番組の再生前の消去を指令 する操作入力など、 負の履歴となる操作入力を受けたか否かを判断する。 ステツ プ S 2 2 7において、負の履歴となる操作入力を受けていないと判断された場合、 処理が終了される。 ステップ S 2 2 7において、 負の履歴となる操作入力を受けたと判断された場 合、 ステップ S 2 2 8において、 ベタ トル演算部 6 2は、 ユーザ情報登録部 6 3 の推薦優先グループの登録から、 対応するグループをはずして、 処理が終了され る。
なお、 図 9を用いて説明したタイトルグループ化処理 1により、 1つの番組べ クトル PPに複数のグループ I Dが関連付けられている場合もある。特にこのよう な場合には、 ステップ S 2 2 8において、 負の履歴となる操作入力により、 ユー ザ情報登録部 6 3の推薦優先グループの登録から、 全てのグループ I Dがはずさ れるようにしても良いし、 負の履歴となる操作入力の回数を蓄積するようにし、 所定の数だけ負の履歴となる操作入力が行われた場合に、 ユーザ情報登録部 6 3 の推薦優先グループの登録から、 対応するグループ I Dがはずされるようにして も良い。 また、 1つの番組ベクトル PPに 1つののグループ I Dが関連付けられて いる場合においても同様である。
このような処理により、 ユーザが好んで視聴している連続ドラマを全ての回に おいて推薦されるようにしたり、 ユーザに非常に好まれている番組と同グループ の番組を推薦するようにすることができるので、 推薦のための演算処理を削減す ることができる。
このように、 グループ推薦を含むマッチング処理が行われている場合、 テレビ ジョン表示装置 1 1または録画再生装置 1 2から取得されるユーザの操作履歴を 基に生成される正履歴べクトル UPおよぴ負履歴べクトル MUPは、対応するグルー プごとに生成されるようにしてもよい。
また、 テレビジョン表示装置 1 1または録画再生装置 1 2から取得されるユー ザの操作履歴のうちの正履歴を基に、 同一の連続ドラマにおける視聴または録画 予約の回数をカウントし、 所定回数以上になった場合に、 マッチング処理を特に 行うことなく、 優先的に推薦するようにしてもかまわない。
また、 ユーザ履歴を用いて番組の推薦処理を行うのではなく、 ユーザが予め指 定したトピックを基にユーザモデルを設定し、 ユーザモデルを基に番組の推薦処 理を行うようにしてもよレ、。
ユーザモデルは、 所定の番組群から、 ユーザが予め指定したトピックを用いて フィルタリングを行うことにより、 トピックに対応する番組を抽出することで得 られる。 初期登録保存部 4 5は、 ユーザにより入力されたトピックを保存する。 登録されるトピックは複数であってもかまわないし、ユーザの操作入力によって、 適宜、 更新される。 ベタトル演算部 6 2は、 番組べク トル抽出部 4 2から供給さ れる、 ユーザモデル作成対象の番組の番組べクトルにおいて、 初期登録保存部 4 5に保存されているトピックを含む番組べクトルを抽出し、 抽出された番組べク トルの総和を、 必要に応じて正規化することにより、 ユーザモデルベク トルを生 成し、 ユーザ情報登録部 6 3に登録する。
これにより、 例えば、 トピックとして、 時間帯 Hm = 「2 3時以降」 およびジ ヤンル G m = 「パラエティ」 が指定された場合、 これらのトピックを用いてフィ ルタリングが行われ、 ユーザモデル 「深夜のバラエティ」 が生成される。 ユーザ モデル 「深夜のバラエティ」 には、 2 3時以降の深夜枠に放送されるバラエティ ' 番組に出演したコメディアンが構成要素として含まれるので、 例えば、 ドラマな どの、 バラエティとは異なるジャンルの番組において、 対応するコメディアンが 出演する番組がマッチング処理において抽出され、 推薦されるので、 項目ごとに マッチング処理を行う場合と比較して、 ユーザの嗜好を、 ジャンルなどを超越し て適用することが可能となる。
なお、ユーザモデル作成対象の番組は、例えば、所定期間の全番組であっても、 所定の時間帯 (例えば、 いわゆるゴールデンタイム) に放送された番組群であつ てもよい。
また、 例えば、 同じフィルタリング条件を用いて、 異なる番組集合を対象にフ ィルタリングを行うことによって、 例えば、 異なる時期、 あるいは、 異なる時間 帯などの、 異なる番組編成に詳細に対応したユーザモデルベク トルを生成するこ とができる。
具体的には、同じ「ジャンル G m =音楽」 という条件でも、現在の番組編成と、 1 0年前の番組編成では、 放送時刻や出演者に違いがあるので、 「現在の音楽フ アン」 「1 0年前の音楽ファン」 という異なるユーザモデルを生成することがで きる。 これにより、 「 1 0年前の音楽ファン」 が好んで聞いていたポップス歌手 力 現在、俳優として出演しているドラマや映画などを推薦したり、 または、 「1 0年前の音楽ファン」 が好んで聞いていた楽曲を、 現在の歌手が歌うような番組 を推薦することが可能となる。
また、 例えば、 主に社会人が視聴するような、 2 0時乃至 2 4時などの時間帯 と、主に子供が視聴するような、 1 5時乃至 2 0時などの時間帯とでは、同じ「ジ ヤンル G m =音楽」 という条件でも、 フィルタリングにより異なる番組群を得る ことができるので、 異なるユーザモデルを生成することができる。
そして、 ベタ トル演算部 6 2は、 番組べク トル抽出部 4 2から供給される番組 の番組べク トル PPと、ユーザ情報登録部 6 3に登録されているユーザモデルべク トルとの類似度を演算し、 その結果を基に、 推薦情報を生成し、 推薦情報出力部 4 9に供給する。 推薦情報出力部 4 9は、 推薦情報を、 推薦番組リスト 5 0に登 録するとともに、 テレビジョン表示装置 1 1、 または、 録画再生装置 1 2に供給 する。
次に、 図 2 9のフローチャートを参照して、 ユーザモデルを用いたマッチング 処理について説明する。
ステップ S 2 3 1において、 マッチング処理部 4 3のべク トル演算部 6 2は、 番組ベク トル抽出部 4 2において抽出された、 ユーザモデル作成対象の番組の番 組ベク トルを取得する。 ユーザモデル作成対象の番組とは、 例えば、 1ヶ月また は 3ヶ月などの所定の期間に放送された番組であっても、 それら所定の期間中の 所定の時間帯(例えば、ゴールデンタイム)に放送された番組であっても良いし、 あるいは、 1 0年前、 2 0年前などの、 過去の所定の期間に放送された番組であ つても良い。
ステップ S 2 3 2において、 初期登録保存部 4 5は、 操作入力部 4 4より、 ュ 一ザにより入力されたトピックを取得し、 保存する。 ベク トル演算部 6 2は、 初 期登録保存部 4 5からトピックを読み出して、 フィルタリング条件として設定す る。 フィルタリング条件は、 例えば、 ハッシュテーブルとして記載されるように しても良い。
ステップ S 2 3 3において、 ベタ トル演算部 6 2は、 ステップ S 2 3 1におい て取得された番組べクトル PPを、ステップ S 2 3 2において設定されたフィルタ リング条件を基にフィルタリングし、トピックに合致する番組べク トル PPを抽出 する。 例えば、 ユーザモデル作成対象の番組が、 過去 3ヶ月間の全番組である場 合、ベタトル演算部 6 2は、過去 3ヶ月間の全番組べク トル PPに対して 「タイ ト ノレ T m、または、ジャンル G m =サッカー」 という条件でフィルタリングを施す。 ステップ S 2 3 4において、 べクトル演算部 6 2は、 ステップ S 2 3 3におい てフィルタリングによって抽出された番組べク トノレ PPの総和を求めて、ユーザモ デルベクトルとする。 例えば、 「タイ トル T m、 または、 ジャンル G m =サッカ 一」 という条件でフィルタリングが施された場合、 「サッカーファン」 というュ 一ザモデノレのユーザモデノレべクト /レが生成される。
ステップ S 2 3 5において、 べク トル演算部 6 2は、 ステップ S 2 3 4におい て生成されたユーザモデルべクトノレと、 番組べク トル抽出部 4 2において抽出さ れた、 推薦情報を求めるための候補となる (この後放送される予定である) 番組 の番組べク トル PPとのコサイン距離を算出する。
ステップ S 2 3 6において、 ベタ トル演算部 6 2は、 ステップ S 2 3 5におい て算出されたコサイン距離を基に、 ユーザモデルベク トルと推薦情報を求めるた めの候補となる番組の番組べクトル PPとの類似度を比較し、比較結果を基に、類 似度が高いもののうち、 上位から所定の数の番組を推薦情報として抽出し、 推薦 情報出力部 4 9に供給する。 推薦情報出力部 4 9は、 推薦情報を、 推薦番組リス ト 5 0に登録するとともに、 テレビジョン表示装置 1 1、 または、 録画再生装置 1 2に供給して、 処理が終了される。
このような処理により、 ユーザの操作履歷がない場合においても、 ユーザが設 定したトピックに合致した番組を推薦することができる。また、従来においては、 例えば、 「タイ トル T m、 または、 ジャンル G m二サッカー」 という条件を設定 してマッチング処理を行った場合、 サッカー選手が出演するバラエティやドラマ などを抽出することができなかった。 これに対して、 図 2 9を用いて説明した処 理においては、 「タイトル T m、 または、 ジャンル G m =サッカー」 という トビ ックでユーザモデルを設定することにより、 ユーザモデルベク トルの出演者や内 容などの項目にも、 サッカー選手名が多く含まれるために、 たとえ 「タイ トル T m、 または、 ジャンル G m =サッカー」 という条件に合致していない番組であつ ても、 サッカー選手が出演するバラエティやドラマなどを抽出して推薦すること が可能となる。
ここでは、 ユーザモデルべク トルと、 番組べク トルとのコサイン距離を算出す ることにより、 類似度を求めるものとして説明しているが、 大項目ごとに、 個別 にコサイン距離を算出し、 その合計を用いて類似度を求めるようにしても良い。 なお、 ユーザモデルベクトルの生成処理は、 配信サーバ 5において実行される ようにしてもよい。 その場合、 例えば、 図 2を用いて説明した番組ベク トル生成 部 2 3が生成した番組ベクトルを用いて、 図 2 9のステップ S 2 3 1乃至ステツ プ S 2 3 4の処理が実行されるようにすれば良い。
また、 ユーザの嗜好にあった番組を推薦するばかりでなく、正履歴べク トル UP および負履歴べクトル MUPのいずれとも類似度が低いものを選ぶと、 好きでも嫌 いでもない、すなわち、これまでユーザが視聴したことのない特徴を有する番組、 換言すれば、 食わず嫌いの番組が推薦される可能性が高くなる。 このように、 ュ 一ザの嗜好を抽出して学習を進めるためには、 これまでユーザが視聴したことの ない特徴を有する番組も評価してもらうことが重要である。
これにより、 ユーザに対して提供する推薦結果に意外性を与え、 ユーザの興味 の拡大につなげることが可能になるばかりでなく、 よりユーザの嗜好に合致した 番組を推薦するために、 非常に重要な履歴情報を取得することが可能となる。 次に、 図 3 0のフローチャートを参照して、 例外推薦番組選択処理について説 明する。 ステップ S 2 4 1において、 マッチング処理部 4 3のべクトル演算部 6 2は、 番組べクトル抽出部 4 2から供給された番組べクトル PPと、正履歴保存部 4 7に 保存されている正履歴べクトル UP、 および、負履歴保存部 4 8に保存されている 負履歴べク トル MUPとを用いて、大項目ごとに、正履歴べクトル UPと番組べクト ル PPとのコサイン距離、 および、 負履歴べクトル MUPと番組べクトル PPとのコ サイン距離を、 それぞれ算出する。
ステップ S 2 4 2において、 ベタトル演算部 6 2は、 項目ごとに算出されたコ サイン距離の値を、 正履歴側と負履歴側で、 それぞれ、 合計する。 すなわち、 ス テツプ S 2 4 1およびステップ S 2 4 2の処理により、 上述した、 正履歴べク ト ル UPと番糸且ベタトル PPとの類似度 SitnUPおよび負履歴べク トル MUPと番糸且ベタ トノレ PPとの類似度 SimMUPが算出される。
ステップ S 2 4 3において、 ベタ トル演算部 6 2は、 正履歴べク トル UP、 およ び、 負履歴べク トル MUPとの類似度の低さを示す例外推薦値を算出する。
具体的には、例外推薦値は、 ( 1一 SimUP) X ( 1 -SimMUP) または( 1 ZSimUP) X ( 1 /SimMUP) によって求めることが可能である。
ステップ S 2 4 4において、 べク トル演算部 6 2は、 ステップ S 2 4 3の算出 結果を基に、 例外推薦値の高い番組を求め、 推薦情報として抽出し、 処理が終了 される。
このような処理により、 これまでユーザが視聴したことのない特徴を有する番 組を抽出して推薦することができるので、 ユーザへの推薦番組の選択に、 意外性 を与え、 ユーザの興味の拡大につなげることが可能になるばかりでなく、 よりュ 一ザの嗜好に合致した番組を推薦するために、 非常に重要な履歴情報を取得する ことが可能となる。
図 1 3乃至図 3 0を用いて説明した処理により、 番組推薦処理装置 1 0におい て、 推薦情報が生成されて、 テレビジョン表示装置 1 1、 または、 録画再生装置 1 2に供給される。
テレビジョン表示装置 1 1、 または、 録画再生装置 1 2には、 テレビジョン受 信装置 4において受信されて復号された衛星波または地上波の放送信号が供給さ れる。
テレビジョン表示装置 1 1は、 ユーザの操作入力を基に、 テレビジョン受信装 置 4から供給された放送信号、 または、 録画再生装置 1 2から供給された再生デ ータを表示したり、 番組推薦処理装置 1 0から供給された推薦情報を基に、 推薦 番組情報を表示したり、 チャンネルの自動設定を実行する。 更に、 テレビジョン 表示装置 1 1は、 操作ログを番組推薦処理装置 1 0に供給する。
また、 録画再生装置 1 2は、 ユーザの操作入力を基に、 テレビジョン受信装置 4から供給された放送信号を録画または録画予約したり、 番組推薦処理装置 1 0 から供給された推薦情報を基に、 番組を自動録画する。 また、 録画再生装置 1 2 は、 装着された記録媒体、 または、 内蔵する記録媒体に録画されている番組を再 生し、 テレビジョン表示装置 1 1に出力して表示させる。 更に、 録画再生装置 1 2は、 操作ログを番組推薦処理装置 1 0に供給する。
図 3 1は、 テレビジョン受信装置 4の構成を示すブロック図である。 テレビジ ヨン受信装置 4は、 デジタル放送用受信装置の標準規格に対応する一般的な受信 装置であるものとして説明する。
衛星波検波部 9 1は、 衛星 2を介して送信され、 アンテナ 3によって受信され た衛星波を、 テレビジョン表示装置 1 1、 または、 録画再生装置 1 2から供給さ れたチャンネルを選択する信号を基に選局して検波し、 伝送モードに関する制御 1B号を T M C C (Transmission and Multiplexing Configuration Control) 復号 部 9 2に、 放送信号を復調 '復号処理部 9 3に供給する。
丁1^[じじ復号部9 2は、 伝送多重制御信号における伝送モード (変調方式、 符 号化率など) やスロット等の情報の入力を受け、 これらの情報を復号し、 復調' 復号処理部 9 3に供給する。
復調 '復号処理部 9 3は、 T M C C復号部 9 2から供給された、伝送モードに関 する情報に基づいて、 供給された放送信号を、 例えば、 Q P S K (quadri-phase shift keying: 4位相変調方式、 または、 4相 P S Kとも称する) 方式や、 8相 15925
75
P S K方式などの方法を用いて復調および復号し、 ディンタリーバ 9 4に供給す る。
ディンタリーバ 9 4は、 供給された信号をディンタリープして、 誤り訂正処理 部 9 5に供給する。 また、 ディンタリーバ 9 4は、 供給された信号に対して、 更 に、 フレーム分離やデスクランブルの処理を施すようにしても良い。
誤り訂正処理部 9 5は、 例えば、 リードソロモン符号などを用いた誤り訂正処 理を行い、 C A (Conditional Access:限定受信) デスクランブル部 1 0 1に供 給する。
地上波検波部 9 6は、 アンテナ 3によって受信された地上波を、 テレビジョン 表示装置 1 1または録画再生装置 1 2から供給された、 チャンネルを選択する制 御信号を基に選局して検波し、 伝送モードに関する制御信号を T M C C復号部 9 7に、 放送信号を復調'復号処理部 9 8に供給する。
T M C C復号部9 7は、 伝送多重制御信号における伝送モード (変調方式、 符 号化率など) やスロッ ト、 T S等の情報の入力を受け、 これらの情報を復号し、 復調'復号処理部 9 8に供給する。
復調 '復号処理部 9 8は、 T M C C復号部 9 7から供給された、伝送モードに関 する情報に基づいて、 供給された放送信号を、 例えば、 Q AM (quadrature ampl itude modulation:直交振幅変調) 方式などの方法を用いて復調および復号 し、 ディンタリーバ 9 9に供給する。
ディンタリーバ 9 9は、供給された信号をディンタリーブして、 T S (Transport Stream; トランスポートストリーム) 再生部 1 0 0に供給する。 また、 デインタ リーバ 9 9は、 供給された信号に対して、 更に、 フレーム分離やデスクランブル の処理を施すようにしても良い。
T S再生部 1 0 0は、 供給された信号を基に、 トランスポートス トリームを再 生し、 C Aデスクランプル部 1 0 1に供給する。
C Aデスクランプル部 1 0 1は、 誤り訂正処理部 9 5、 または、 T S再生部 1 0 0から供給された信号を基に、 限定受信信- レクサ 1 0 2に供給する。
データ入力部 1 0 3は、 E P G受信装置 9から、 E P Gデータの入力を受けた り、 ネットワーク 8を介して、 配信サーバ 5より、 ストリーミングデータの供給 を受け、 デマルチプレクサ 1 0 2に供給する。
デマルチプレクサ 1 0 2は、 C Aデスクランブル部 1 0 1、 または、 データ入 力部 1 0 3から供給された信号をデマルチプレタスし、 音声信号は音声信号復号 部 1 0 4に、 映像信号は、 映像信号復号部 1 0 5に、 そして、 制御信号や E P G などのデータは、 データ復号部 1 0 6にそれぞれ供給する。
音声信号復号部 1 0 4は、 供給された音声信号を復号し、 テレビジョン表示装 置 1 1、 または、 録画再生装置 1 2に供給する。 映像信号復号部 1 0 5は、 供給 された映像信号を復号し、 テレビジョン表示装置 1 1、 または、 録画再生装置 1 2に供給する。 データ復号部 1 0 6は、 供給された制御信号や E P Gなどのデー タを復号し、テレビジョン表示装置 1 1、または、録画再生装置 1 2に供給する。 テレビジョン受信装置 4の処理により、 受信された衛星波、 または地上波、 あ るいは、 配信されたス トリーミングデータが、 所定の方式により復調および復号 されて、 テレビジョン表示装置 1 1、 または、 録画再生装置 1 2に供給される。 図 3 2は、 テレビジョン表示装置 1 1の構成を示すプロック図である。
操作入力部 1 2 1は、 ユーザからの操作入力を受け、 テレビジョン表示装置 1 1の各部にユーザの操作入力に対応する制御信号を供給するとともに、 ユーザの 操作内容を操作ログリスト 1 2 2に供給して保存させる。 操作ログリスト 1 2 2 に保存されているユーザの操作ログは、 図 1 3を用いて説明した番組推薦処理装 置 1 0の操作ログ取得部 4 6により取得される。 また、 ユーザの操作入力が、 チ ヤンネルの選択であった場合、 操作入力部 1 2 1は、 入力されたユーザの操作を チャンネル設定部 1 2 3に供給する。
チヤンネル設定部 1 2 3は、 操作入力部 1 2 1から供給されたユーザの操作入 力を示す信号に基づいて、 チヤンネルの選択を示す制御信号を生成し、 テレビジ ヨン受信装置 4に供給する。 また、 チャンネル設定部 1 2 3は、 後述する推薦番 JP2003/015925
77
組リスト 1 2 8に登録されている推薦情報に基づいて、 自動的にチャンネルを設 定するために、 チャンネルの選択を示す制御信号を生成し、 テレビジョン受信装 置 4に供給する。 テレビジョン受信装置 4は、 制御信号に基づいて、 指定された チャンネルの放送信号を受信する。
データ入力部 1 2 4は、 テレビジョン受信装置 4から放送信号の入力を受け、 画像処理部 1 2 5に供給する。 画像処理部 1 2 5は、 供給された放送信号に対し て、 出力部 1 2 6の画像表示方法に基づいて、 画像処理を施し、 出力部 1 2 6に 供給する。 出力部 1 2 6は、 例えば、 C R T (Cathode Ray Tube) 、 または、 L C D (Liquid Crystal Display) などの表示デバイスと、 スピーカなどの音声出 力デバイスで構成され、 供給された画像処理後の放送信号の画像信号を表示デバ イスに表示し、 音声出力デバイスから音声信号を出力する。
推薦番組リスト取得部 1 2 7は、 番組推薦処理装置 1 0から、 推薦情報を取得 し、 推薦番組リスト 1 2 8に供給する。 推薦番組リスト 1 2 8は、 供給された推 薦情報を登録する。 推薦番組リスト 1 2 8に登録された推薦情報は、 チャンネル 設定部 1 2 3に読み出されたり、推薦番組情報表示制御部 1 2 9に読み出される。 推薦番組情報表示制御部 1 2 9は、番組の推薦情報をユーザに提示するために、 推薦番組リスト 1 2 8から読み出した推薦情報を、画像処理部 1 2 5に出力する。 画像処理部 1 2 5は、推薦番組情報表示制御部 1 2 9から供給された推薦情報を、 単独で、 または、 データ入力部 1 2 4から供給された放送信号の画像に重畳させ て、 出力部 1 2 6に出力して、 表示デバイスに表示させる。
なお、 番組推薦処理装置 1 0から供給される推薦情報を基に、 出力部 1 2 6に 推薦情報を表示させるか、 自動的にチャンネルを設定させるようにするかは、 ュ 一ザの設定によって決定されるようにしても良い。
図 3 3のフローチヤ一トを参照して、 番組推薦処理装置 1 0から供給される推 薦情報を基に、 ユーザに番組推薦情報を提示するための推薦情報表示処理につい て説明する。
2 5 1において、 推薦番組リスト取得部 1 2 7は、 番組推薦処理装 置 1 0の推薦情報出力部 4 9から出力された推薦情報を取得する。
ステップ S 2 5 2において、 推薦番組リスト取得部 1 2 7は、 取得した推薦情 報を、 推薦番組リスト 1 2 8に登録する。
ステップ S 2 5 3において、 推薦番組情報表示制御部 1 2 9は、 推薦番組リス ト 1 2 8から、 例えば、 3時間や 1日など、 現在時刻よりも所定の時間以内に放 送される番組の推薦情報を読み出し、推薦する番組のタイ トル、内容、放送時間、 および、 放送チャンネルなどを表示させるための、 推薦情報表示用のデータを生 成し、 画像処理部 1 2 5に供給する。
ステップ S 2 5 4において、 画像処理部 1 2 5は、 供給された推薦情報表示用 のデータを、 出力部 1 2 6に表示させるための画像処理を実行し、 出力部 1 2 6 に供給する。 推薦情報は、 単独で、 または、 データ入力部 1 2 4から供給された 放送信号の画像に重畳されて、 画像処理される。
ステップ S 2 5 5において、 出力部 1 2 6は、 画像処理部 1 2 5から供給され た推薦情報を表示し、 処理が終了される。
このような処理により、出力部 1 2 6に推薦情報が表示されるので、ユーザは、 表示された推薦情報を参照して、 視聴する番組を選択することが可能となる。 次に、 図 3 4のフローチャートを参照して、 番組推薦処理装置 1 0から供給さ れる推薦情報を基に、 自動的にチャンネルを設定して、 ユーザの嗜好に合致した 番組を表示させるための自動チャンネル設定処理について説明する。
ステップ S 2 7 1およびステップ S 2 7 2において、 図 3 3を用いて説明した ステップ S 2 5 1およびステップ S 2 5 2と同様の処理が実行される。すなわち、 番組推薦処理装置 1 0の推薦情報出力部 4 9から出力された推薦情報が取得され、 取得された推薦情報が、 推薦番組リスト 1 2 8に登録される。
チャンネル設定部 1 2 3は、 ステップ S 2 7 3において、 番組推薦リスト 9 8 から、現在時刻に対応する推薦番組の情報を取得し、ステップ S 2 7 4において、 推薦番組の情報を基に、 チャンネル設定情報を生成し、 テレビジョン受信装置 4 に出力する。 テレビジョン受信装置 4は、 制御信号に基づいて、 指定されたチヤ ンネルの放送信号を受信する。
ステップ S 2 7 5において、 データ入力部 1 2 4は、 テレビジョン受信装置 4 から指定されたチャンネルの放送信号を取得し、 画像処理部 1 2 5に供給する。 ステップ S 2 7 6において、 画像処理部 1 2 5は、 供給された放送信号に、 出 力部 1 2 6に表示させるための画像処理を実行し、 出力部 1 2 6に供給する。 ステップ S 2 7 7において、 出力部 1 2 6は、 画像処理部 1 2 5から供給され た、 推薦された番組の映像を表示して、 音声を出力し、 処理が終了される。 このような処理により、 自動的に、 ユーザの嗜好に合致した番組が放送されて いるチャンネルにチャンネル設定される。 図 3 4を用いて説明した自動チャンネ ル設定処理は、 例えば、 ユーザが指令したときに実行されるようにしても良い。 これにより、 ユーザが、 どの番組を視聴するかを悩んだ場合などに、 適切な番組 が放送されている番組にチャンネルを自動的に設定することが可能となる。 また、 図 3 4を用いて説明した自動チャンネル設定処理は、 例えば、 2時間な ど、 特に意識してチャンネルを設定せず、 ただ放置されていると判断可能なよう な所定の時間ごとに、あるいは、放置されていると判断可能なような所定の時間、 ユーザからの操作入力がなかつた場合などに実行されるようにしても良い。 なお、 ユーザが意識して番組を視聴している途中で、 自動的にチャンネルが切 り替わってしまうことがないように、 自動チャンネル設定処理の実行不可のモー ドを用意して、 ユーザが指令することができるようにしても良い。
図 3 5は、 録画再生装置 1 2の構成を示すブロック図である。
操作入力部 1 4 1は、 ユーザからの操作入力を受け、 録画再生装置 1 2の各部 にユーザの操作入力に対応する制御信号を供給するとともに、 ユーザの操作内容 を操作ログリスト 1 4 2に供給して保存させる。 操作口グリス ト 1 4 2に保存さ れているユーザの操作ログは、 図 1 3を用いて説明した番組推薦処理装置 1 0の 操作口グ取得部 4 6により取得される。
録画設定部 1 4 3は、 操作入力部 1 4 1から供給されたユーザの操作入力を示 す信号に基づいて、 または、 後述する推薦番組リスト 1 4 9に登録されている推 薦情報から、例えば、録画する番組の放送開始時間おょぴ放送終了時間、並びに、 放送されるチャンネルなど、 録画処理を行うために必要な情報を抽出する。 録画 設定部 1 4 3は、 操作入力部 1 4 1から供給されたユーザの操作入力が録画予約 である場合、録画処理を行うために必要な情報を録画予約リスト 1 4 4に登録し、 操作入力部 1 4 1から供給されたユーザの操作入力が、 現在放送されている番組 の録画処理である場合、 または、 後述する推薦番組リス ト 1 4 9に登録されてい る推薦情報を用いて自動録画処理を行う場合、 録画処理を行うために必要な情報 を、 録画制御部 1 4 5に供給する。
録画制御部 1 4 5は、 録画設定部 1 4 3から供給された、 録画処理を行うため に必要な情報を基に、 または、 録画予約リス ト 1 4 4に登録されている録画予約 情報のうち現在時刻に対応する録画予約情報を抽出することにより、 録画する番 組の放送チャンネルを示す制御信号を生成して、 テレビジョン受信装置 4に供給 するとともに、 録画処理を実行するための制御信号を生成し、 録画再生処理部 1 4 7に供給する。 テレビジョン受信装置 4は、 制御信号に基づいて、 指定された チャンネルの放送信号を受信する。
データ入力部 1 4 6は、 テレビジョン受信装置 4から放送信号の入力を受け、 録画再生処理部 1 4 7に供給する。 録画再生処理部 1 4 7は、 例えば、 磁気テー プ、 光ディスク、 磁気ディスク、 光磁気ディスク、 または、 半導体メモリなどの 記録媒体が装着可能なように構成されるか、 その内部に、 例えば、 ハードデイス ク、 または、 半導体メモリなどの記録媒体を有し、 それらの記録媒体に情報を記 録したり、 それらの記録媒体から情報を再生可能なようになされている。 具体的 には、 録画再生処理部 1 4 7に装着可能な記録媒体が磁気テープである場合、 録 画再生処理部 1 4 7は、 磁気へッドを有し、 磁気テープにデータ入力部 1 4 6か ら供給された放送信号を記録 (すなわち、 録画) したり、 磁気テープに記録され ている情報を再生して、 テレビジョン表示装置 1 1などに供給して再生出力させ る。
推薦番組リス ト取得部 1 4 8は、 番組推薦処理装置 1 0から、 推薦情報を取得 し、 推薦番組リスト 1 4 9に供給する。 推薦番組リスト 1 4 9は、 供給された推 薦情報を登録する。 推薦番組リスト 1 4 9に登録された推薦情報は、 録画設定部 1 4 3に読み出されて、 自動的に録画処理が実行される。
次に、 図 3 6のフローチャートを参照して、 自動録画処理について説明する。 ステップ S 2 9 1において、 推薦番組リスト取得部 1 4 8は、 番組推薦処理装 置 1 0の推薦情報出力部 4 9から出力された推薦情報を取得する。
ステップ S 2 9 2において、 推薦番組リスト取得部 1 4 8は、 取得した推薦情 報を、 推薦番組リスト 1 4 9に登録する。
ステップ S 2 9 3において、録画設定部 1 4 3は、番組推薦リスト 1 0 9力、ら、 現在時刻に対応する推薦番組の情報を抽出し、放送開始時間および放送終了時間、 並びに、 放送チャンネルなどの、 録画処理のために必要な情報を取得して、 録画 制御部 1 4 5に供給する。
ステップ S 2 9 4において、 録画制御部 1 4 5は、 録画する番組の放送信号の 供給を受けるためのチヤンネル設定情報を生成し、 テレビジョン受信装置 4に出 力する。 テレビジョン受信装置 4は、 制御信号に基づいて、 指定されたチャンネ ルの放送信号を受信する。
ステップ S 2 9 5において、 データ入力部 1 4 6は、 テレビジョン受信装置 4 から、 指定されたチャンネルの放送信号を取得し、 録画再生処理部 1 4 7に供給 する。
ステップ S 2 9 6において、録画再生処理部 1 4 7は、供給された放送信号を、 装着されている、 または、 内蔵されている記録媒体に記録して、 処理が終了され る。
このような処理により、 ユーザの嗜好に合致した番組を、 自動的に録画するこ とが可能となる。 図 3 6を用いて説明した自動録画処理は、 ユーザが指令した録 画処理、 または、 録画予約処理による録画動作中など、 すでに録画動作が行われ ている間には実行されない。
ここでは、 現在時刻に対応する推薦番組を基に、 自動的に録画を行い場合につ いて説明したが、 例えば、 現在時刻よりも先の所定の時間分の推薦情報を取得し て、 同様の処理により、 自動的に録画予約を設定することができるようにしても よいことは言うまでもない。
図 1乃至図 3 6を用いて説明した処理では、番組べクトル PP力 配信サーバ 5 において生成されるものとして説明したが、配信サーバが番組べクトル PPを生成 するのではなく、 ネットワーク 8を介して、 E P Gデータを番組推薦処理装置に 供給し、番組推薦処理装置において、番組べクトル PPを生成するようにしても良 い。
配信サーバが番組べクトノレ ppを生成するのではなく、ネットワーク 8を介して、 E P Gデータを番組推薦処理装置に供給し、 番組推薦処理装置において、 番組べ クトル PPを生成する場合の配信サーバ 1 7 1の構成を図 3 7に示し、番組推薦処 理装置 1 9 1の構成を図 3 8に示す。
なお、 図 2の配信サーバ 5、 および、 図 1 3の番組推薦処理装置 1 0における 場合と対応する部分には同一の符号を付してあり、 その説明は適宜省略する。 すなわち、 配信サーバ 1 7 1は、 図 2を用いて説明した配信サーバ 5のデータ 取得部 2 1およびデータ送信部 2 5で構成され、 ストリーミングデータデータベ ース 6またはメタデータデータベース 7からストリーミングデータ、 または、 メ タデータで構成される E P Gデータを取得して、 ネットワーク 8を介して、 E P G受信装置 8またはテレビジョン受信装置 4に送信する。
そして、 番組推薦処理装置 1 9 1は、 図 2の配信サーバ 5に設けられていたも のと同様のメタデータ取得部 2 2および番組べク トル生成部 2 3が新たに設けら れている以外は、 図 1 3を用いて説明した番組推薦処理装置 1 0と同様の構成を 有するものであり、 番組推薦処理装置 1 0が実行する処理に加えて、 図 3を用い て説明した番組ベク トル生成処理 1、 および、 図 6を用いて説明した番組べタト ル生成処理 2、 並びに、 図 7を用いて説明したグループ化処理 1、 および、 図 8 を用いて説明したグループ化処理を実行する。
配信サーバが番組べク トル PPを生成するのではなく、ネットワーク 8を介して、 E P Gデータを番組推薦処理装置に供給し、 番組推薦処理装置において、 番組べ ク トル PPを生成する場合においても、図 1乃至図 3 6を用いて説明した場合と同 様の効果を奏することが可能である。
また、 更に、 E P G受信装置 9が、 テレビジョンジョン表示装置 1 1および録 画再生装置 1 2から、 ユーザの操作履歴や設定情報などを収集して、 ネットヮー ク 8を介して、 配信サーバに供給するようにし、 配信サーバが、 番組べク トル PP を生成するのみでなく、 マッチング処理を実行し、 ネットワーク 8を介して、 マ ツチング結果を E P G受信装置 9に供給するようにしてもよい。 この場合のネッ トワーク構成を図 3 9に示し、 配信サーバ2 0 1の構成を示すブロック図を図4 0に示す。
なお、 図 1、 図 3 7、 および図 3 8における場合と対応する部分には同一の符 号を付してあり、 その説明は適宜省略する。
すなわち、配信サーバ 2 0 1は、図 3 7を用いて説明した配信サーバ 1 7 1に、 図 3 8を用いて説明した番組推薦処理装置 1 9 1の機能を加えたものであり、 ュ —ザは、 番組推薦処理装置を保有する必要がない。
図 3 9および図 4 0に示される構成においては、番組べク トル PP、番組側効き 目べク トル EfPP、 正履歴べク トル UP、 負履歴べク トル MUP、 もしくは、 標準嗜好 ベタトル APPなどの生成処理や、 番組べク トルのグループ化処理、 マッチング処 理、 または、 例外推薦番組選択処理などの、 図 3乃至図 1 2、 および、 図 1 4乃 至図 3 0を用いて説明した全ての処理が、 配信サーバ 2 0 1で実行される。
なお、 このとき、 E P G受信装置 9力 テレビジョンジョン表示装置 1 1およ び録画再生装置 1 2から収集して、 ネットワーク 8を介して送信する、 ユーザの 操作履歴や設定情報などには、 たとえば、 ユーザ I Dなどが付けられて、 ユーザ ごとに区別可能なようになされる。 また、 配信サーバ 2 0 1の番組推薦処理装置 1 9 1において、 初期登録保存部 4 5、 正履歴保存部 4 7、 負履歴保存部 4 8な どは、 供給された情報のユーザ I Dを基に、 それぞれの情報をユーザ別に保存す る。 以上の説明においては、 テレビジョン放送信号の E P Gデータを用いて、 ユー ザの嗜好にあった番組を推薦する場合について説明したが、 本発明は、 ラジオ放 送、 あるいは、 ス トリーミングデータなどの各種デジタルコンテンツに属性情報 を付加し、ユーザの嗜好にあったものを推薦する場合についても適用可能である。 上述した一連の処理は、 ソフトウェアにより実行することもできる。 そのソフ トウエアは、 そのソフトウェアを構成するプログラムが、 専用のハードウェアに 組み込まれているコンピュータ、 または、 各種のプログラムをインス トールする ことで、 各種の機能を実行することが可能な、 例えば汎用のパーソナルコンビュ ータなどに、 記録媒体からインス トールされる。
この記録媒体は、 図 2、 図 1 3、 または、 図 3 8に示すように、 コンピュータ とは別に、 ユーザにプログラムを提供するために配布される、 プログラムが記録 されている磁気ディスク 3 1または 7 1 (フレキシブルディスクを含む) 、 光デ イスク 3 2または 7 2 (CD-ROM (Compact Disk-Read Only Memory) , DVD (Digital Versatile Disk) を含む) 、 光磁気ディスク 3 3または 7 3 (MD (Mini-Disk) (商標) を含む) 、 もしくは半導体メモリ 3 4または 7 4などよりなるパッケ一 ジメディアなどにより構成される。
また、 本明細書において、 記録媒体に記録されるプログラムを記述するステツ プは、 記載された順序に沿って時系列的に行われる処理はもちろん、 必ずしも時 系列的に処理されなくとも、 並列的あるいは個別に実行される処理をも含むもの である。
なお、 本明細書において、 システムとは、 複数の装置により構成される装置全 体を表すものである。 産業上の利用可能性
このように、本発明によれば、コンテンツの属性情報を生成することができる。 特に、 属性情報と所定のユーザの嗜好情報との類似度の算出における、 複数の項 目それぞれの寄与の度合いを規定する重み付け情報と、 コンテンッの属性情報を 対応付けることができる。
また、 他の本発明によれば、 ユーザの嗜好と合致したコンテンツを選択するこ とができるほか、属性情報と所定のユーザの嗜好情報との類似度の算出における、 複数の項目それぞれの寄与の度合いを規定する重み付け情報を用いて、 コンテン ッが選択されるので、 ユーザの嗜好に正しく合致したコンテンツを選択すること ができる。
さらに、 他の本発明によれば、 ユーザの嗜好を求めることができる。 特に、 ュ 一ザの嗜好と一般的な嗜好を比較して、ユーザの嗜好の偏りを求めることにより、 ユーザ固有の嗜好を求めることができる。

Claims

請求の範囲
1 . コンテンツに関する情報を基に前記コンテンツの属性情報を生成する情報 処理装置において、
前記コンテンツに関する情報を取得する取得手段と、
前記取得手段により取得された前記コンテンツに関する情報に基づいて、 複数 の項目で構成される前記属性情報を生成する属性情報生成手段と、
前記属性情報生成手段により生成された前記属性情報の前記項目に対応する第 1の重み付け情報を記憶する第 1の記憶手段と
を備え、
前記第 1の重み付け情報は、 前記属性情報と所定のユーザの嗜好情報との類似 度の算出における、 複数の前記項目それぞれの寄与の度合いを規定するものであ る
ことを特徴とする情報処理装置。
2 . 前記属性情報生成手段により生成された前記属性情報を送信する送信手 段
を更に備えることを特徴とする請求の範囲第 1項に記載の情報処理装置。
3 . 前記送信手段は、 前記第 1の記憶手段により記憶されている前記第 1の 重み付け情報から、 前記コンテンツが有する条件に合致する前記第 1の重み付け 情報を抽出して、 前記属性情報生成手段により生成された前記属性情報に対応付 けて、 更に送信する
ことを特徴とする請求の範囲第 2項に記載の情報処理装置。
4 . 前記コンテンツが有する条件は、 前記コンテンツのジャンルである ことを特徴とする請求の範囲第 3項に記載の情報処理装置。
5 . 前記取得手段により取得された前記コンテンツに関する情報のうち、 所 定の情報を抽出する抽出手段を更に備え、
前記属性情報生成手段は、 前記抽出手段により抽出された前記所定の情報を、 複数の前記項目ごとにべクトル化して、 前記属性情報を生成する ことを特徴とする請求の範囲第 1項に記載の情報処理装置。
6 . 前記属性情報生成手段は、 前記コンテンツに関する情報のうち、 言語に より記載された情報を解析し、 解析結果を基に、 前記属性情報を生成する ことを特徴とする請求の範囲第 1項に記載の情報処理装置。
7 . 前記属性情報生成手段は、 言語により記載された情報に、 頻度または重 みを示す数値を対応付けて、 前記属性情報を生成する
ことを特徴とする請求の範囲第 5項に記載の情報処理装置。
8 . 複数の前記項目で構成される所定の前記ユーザの前記嗜好情報を記憶す る第 2の記憶手段と、
前記第 2の記憶手段により記憶されている前記嗜好情報と、 前記属性情報生成 手段により生成された前記属性情報との、 前記項目ごとの類似度を算出すること により、 前記ユーザの嗜好と合致したコンテンツを示す推薦情報を生成する推薦 情報生成手段と
を更に備えることを特徴とする請求の範囲第 1項に記載の情報処理装置。 9 . 前記推薦情報生成手段は、 前記第 1の記憶手段により記憶されている前 記第 1の重み付け情報を用いて、 前記属性情報と前記嗜好情報とを比較すること により、 前記推薦情報を生成する
ことを特徴とする請求の範囲第 8項に記載の情報処理装置。
1 0 . 前記ユーザの操作履歴を取得する操作履歴取得手段と、
前記操作履歴取得手段により取得された前記操作履歴を基に、 前記ユーザの嗜 好情報を生成する嗜好情報生成手段と、
前記嗜好情報生成手段により生成された前記嗜好情報を基に、 第 2の重み付け 情報を生成する重み付け情報生成手段と
を更に備え、
前記第 2の重み付け情報は、 複数の前記項目の、 前記属性情報と前記ユーザの 嗜好情報との類似度の算出時の寄与の度合いを規定するものであり、
前記推薦情報生成手段は、 前記重み付け情報生成手段により生成された前記第 2の重み付け情報を用いて、 前記嗜好情報と前記属性情報とを比較することによ り、 前記推薦情報を生成する
ことを特徴とする請求の範囲第 8項に記載の情報処理装置。
1 1 . コンテンツに関する情報を基に前記コンテンツの属性情報を生成する 情報処理装置の情報処理方法において、
前記コンテンツに関する情報を取得する取得ステップと、
前記取得ステップの処理により取得された前記コンテンツに関する情報に基づ いて、複数の項目で構成される前記属性情報を生成する属性情報生成ステップと、 前記取得ステップの処理により取得された前記コンテンツに関する情報を基に、 前記コンテンツが有する条件に基づいて、 前記属性情報と所定のユーザの嗜好情 報との類似度の算出における、 複数の前記項目それぞれの寄与の度合いを規定す る重み付け情報を抽出する抽出ステップと、
前記抽出ステツプの処理により抽出された前記重み付け情報と、 前記属性情報 生成ステツプの処理により生成された前記属性情報とを対応付ける対応付けステ ップと
を含むことを特徴とする情報処理方法。
1 2 . コンテンツに関する情報を基に前記コンテンツの属性情報を生成する 処理をコンピュータに実行させるプログラムであって、
前記コンテンツに関する情報を取得する取得ステップと、
前記取得ステップの処理により取得された前記コンテンツに関する情報に基づ いて、複数の項目で構成される前記属性情報を生成する属性情報生成ステップと、 前記取得ステップの処理により取得された前記コンテンツに関する情報を基に、 前記コンテンツが有する条件に基づいて、 前記属性情報と所定のユーザの嗜好情 報との類似度の算出における、 複数の前記項目それぞれの寄与の度合いを規定す る重み付け情報を抽出する抽出ステップと、
前記抽出ステップの処理により抽出された前記重み付け情報と、 前記属性情報 生成ステップの処理により生成された前記属性情報とを対応付ける対応付けステ ップと
を含むことを特徴とするコンピュータが読み取り可能なプログラムが記録され ている記録媒体。
1 3 . コンテンツに関する情報を基に前記コンテンツの属性情報を生成する 処理をコンピュータに実行させるプログラムであって、
前記コンテンツに関する情報を取得する取得ステップと、
前記取得ステップの処理により取得された前記コンテンツに関する情報に基づ いて、複数の項目で構成される前記属性情報を生成する属性情報生成ステツプと、 前記取得ステツプの処理により取得された前記コンテンツに関する情報を基に、 前記コンテンツが有する条件に基づいて、 前記属性情報と所定のユーザの嗜好情 報との類似度の算出における、 複数の前記項目それぞれの寄与の度合いを規定す る重み付け情報を抽出する抽出ステップと、
前記抽出ステップの処理により抽出された前記重み付け情報と、 前記属性情報 生成ステツプの処理により生成された前記属性情報とを対応付ける対応付けステ ップと
を含むことを特徴とするプログラム。
1 4 . ユーザの嗜好と合致したコンテンツを選択する処理を実行する情報処 理装置において、
複数の項目で構成されている前記コンテンツの属性情報を取得する取得手段と、 複数の前記項目で構成されている前記ユーザの嗜好情報を記憶する記憶手段と、 前記取得手段により取得された前記属性情報と、 前記記憶手段により記憶され ている前記ユーザの嗜好情報との類似度を、 所定の重み付け情報を用いて算出す ることにより、 前記ユーザの嗜好と合致したコンテンツを示す推薦情報を生成す る推薦情報生成手段と
を備え、
前記重み付け情報は、 前記属性情報と前記ユーザの嗜好情報との類似度の算出 における、 複数の前記項目それぞれの寄与の度合いを規定する ことを特徴とする情報処理装置。
1 5 . 前記取得手段は前記コンテンツの属性情報とともに、 前記重み付け情 報を更に取得し、
前記推薦情報生成手段は、 前記重み付け情報を用いて、 前記コンテンツの属性 情報と前記嗜好情報とを比較することにより、 前記推薦情報を生成する
ことを特徴とする請求の範囲第 1 4項に記載の情報処理装置。
1 6 . 前記ユーザの操作履歴を取得する操作履歴取得手段と、
前記操作履歴取得手段により取得された前記操作履歴を基に、 前記ユーザの嗜 好情報を生成する嗜好情報生成手段と、
前記嗜好情報生成手段により生成された前記嗜好情報を基に、 前記重み付け情 報を生成する重み付け情報生成手段と
を更に備え、
前記推薦情報生成手段は、 前記重み付け情報生成手段により生成された前記重 み付け情報を用いて、 前記嗜好情報と前記属性情報とを比較することにより、 前 記推薦情報を生成する
ことを特徴とする請求の範囲第 1 4項に記載の情報処理装置。
1 7 . 前記重み付け情報は、 前記コンテンツの属性情報のうち、 一般的な嗜 好に対して、 前記ユーザの特徴的な嗜好を示す情報である
ことを特徴とする請求の範囲第 1 4項に記載の情報処理装置。
1 8 . 前記重み付け情報は、 前記コンテンツの属性情報のうち、 前記ユーザ にとつて重要な項目を示す情報である
ことを特徴とする請求の範囲第 1 4項に記載の情報処理装置。
1 9 . 前記重み付け情報は、 前記コンテンツの属性情報のうち、 前記ユーザ が好むコンテンツを表す項目を示す情報である
ことを特徴とする請求の範囲第 1 4項に記載の情報処理装置。
2 0 . 前記重み付け情報は、 前記コンテンツの属性情報のうち、 前記ユーザ が好まないコンテンツを表す項目を示す情報である ことを特徴とする請求の範囲第 1 4項に記載の情報処理装置。
2 1 . 前記ユーザの操作人力を受ける操作入力手段を更に備え、
前記重み付け情報は、 前記操作入力手段により入力される前記ユーザの操作入 力により設定される
ことを特徴とする請求の範囲第 1 4項に記載の情報処理装置。
2 2 . ユーザの嗜好と合致したコンテンツを選択する処理を実行する情報処 理装置の情報処理方法において、
複数の項目により構成される前記コンテンッの属性情報と、 複数の項目により 構成される所定のユーザの嗜好情報との類似度の算出における、 複数の前記項目 それぞれの寄与の度合いを規定する重み付け情報に関する設定情報を取得する取 得ステップと、
前記属性情報と前記嗜好情報との類似度を、 前記取得ステップの処理により取 得された前記重み付け情報に関する設定情報に基づいて算出する算出ステップと、 前記算出ステップの処理による算出結果を用いて、 前記ユーザの嗜好と合致し たコンテンツを示す推薦情報を生成する推薦情報生成ステップと
を含むことを特徴とする情報処理方法。
2 3 . ユーザの嗜好と合致したコンテンツを選択する処理をコンピュータに 実行させるプログラムであって、
複数の項目により構成される前記コンテンツの属性情報と、 複数の項目により 構成される所定のユーザの嗜好情報との類似度の算出における、 複数の前記項目 それぞれの寄与の度合いを規定する重み付け.情報に関する設定情報を取得する取 前記属性情報と前記嗜好情報との類似度を、 前記取得ステップの処理により取 得された前記重み付け情報に関する設定情報に基づいて算出する算出ステップと、 前記算出ステップの処理による算出結果を用いて、 前記ユーザの嗜好と合致し たコンテンツを示す推薦情報を生成する推薦情報生成ステップと
を含むことを特徴とするコンピュータが読み取り可能なプログラムが記録され ている記録媒体。
2 4 . ユーザの嗜好と合致したコンテンツを選択する処理をコンピュータに 実行させるプログラムであって、
複数の項目により構成される前記コンテンツの属性情報と、 複数の項目により 構成される所定のユーザの嗜好情報との類似度の算出における、 複数の前記項目 それぞれの寄与の度合いを規定する重み付け情報に関する設定情報を取得する取 前記属性情報と前記嗜好情報との類似度を、 前記取得ステップの処理により取 得された前記重み付け情報に関する設定情報に基づいて算出する算出ステップと、 前記算出ステップの処理による算出結果を用いて、 前記ユーザの嗜好と合致し たコンテンツを示す推薦情報を生成する推薦情報生成ステップと
を含むことを特徴とするプログラム。
2 5 . コンテンツに関する情報を基に前記コンテンツの属性情報を生成する 第 1の情報処理装置と、
前記第 1の情報処理装置から供給された前記コンテンツの属性情報を基に、 ュ 一ザの嗜好と合致した前記コンテンツを選択する処理を実行する第 2の情報処理 で構成される情報処理システムにおいて、
前記第 1の情報処理装置は、
前記コンテンツに関する情報を取得する第 1の取得手段と、
前記第 1の取得手段により取得された前記コンテンツに関する情報に基づい て、 複数の項目で構成される前記属性情報を生成する属性情報生成手段と、 前記属性情報生成手段により生成された前記属性情報の前記項目に対応する 第 1の重み付け情報を記憶する第 1の記憶手段と、
前記第 1の記憶手段に記憶されている前記第 1の重み付け情報から、 前記コ ンテンッが有する条件に合致する前記第 1の重み付け情報を抽出して、 前記属 性情報生成手段により生成された前記属性情報に対応付けて送信する送信手段 と
を備え、
前記第 2の情報処理装置は、
複数の項目で構成されている前記コンテンツの属性情報および前記第 1の重 み付け情報を取得する第 2の取得手段と、
複数の前記項目で構成されている前記ユーザの嗜好情報を記憶する第 2の記 憶手段と、
前記第 2の取得手段により取得された前記属性情報と、 前記第 2の記憶手段 により記憶されている前記ユーザの嗜好情報との類似度を、 前記第 1の重み付 け情報と前記第 1の重み付け情報とは異なる第 2の重み付け情報のうちの少な くともいずれか一方の情報を用いて算出することにより、 前記ユーザの嗜好と 合致したコンテンツを示す推薦情報を生成する推薦情報生成手段と
を備え、
前記第 1の重み付け情報および前記第 2の重み付け情報は、 前記属性情報と前 記ユーザの嗜好情報との類似度の算出における、 複数の前記項目それぞれの寄与 の度合いを規定する
ことを特徴とする情報処理システム。
2 6 . ユーザの嗜好と合致したコンテンツを選択する処理を実行する情報処 理装置において、
前記コンテンツの属性情報を取得する取得手段と、
前記ユーザの嗜好を示す第 1の情報と、 一般的な嗜好を示す第 2の情報とを基 に、 一般的な嗜好に対する前記ユーザの嗜好の偏りを示す第 3の情報を生成する 偏り情報生成手段と
を備えることを特徴とする情報処理装置。
2 7 . 前記属性情報、 前記第 1の情報、 および前記第 3の情報は、 それぞれ 複数の項目により構成され、
前記第 3の情報を用いて、 前記属性情報と前記第 1の情報との前記項目ごとの 類似度を算出して、 前記ユーザの嗜好と合致したコンテンツを選択する選択手段 を更に備える
ことを特徴とする請求の範囲第 2 6項に記載の情報処理装置。
2 8 . 前記第 1の情報および前記第 2の情報は、 それぞれ複数の項目により 構成され、
前記偏り情報生成手段は、 前記第 3の情報として、 前記第 1の情報と前記第 2 の情報との類似度が低い前記項目を示す情報を生成する
ことを特徴とする請求の範囲第 2 6項に記載の情報処理装置。
2 9 . 前記ユーザの操作履歴を取得する操作履歴取得手段と、
前記操作履歴取得手段により取得された前記操作履歴を基に、 前記第 1の情報 を生成する嗜好情報生成手段と
を更に備えることを特徴とする請求の範囲第 2 6項に記載の情報処理装置。
3 0 . 前記偏り情報生成手段は、 前記第 1の情報として、 所定のコンテンツ 群のうち、 前記ユーザが試聴したコンテンッを所定の項目ごとに計数した第 1の 値を算出し、 前記第 2の情報として、 前記所定のコンテンツ群の全コンテンツを 前記所定の項目ごとに計数した第 2の値を算出し、 前記第 1の値を前記第 2の値 で正規化することにより、 前記第 3の情報を生成する
ことを特徴とする請求の範囲第 2 6項に記載の情報処理装置。
3 1 . 前記所定のコンテンツ群は、 所定の期間中に放送または配信されたコ ンテンッの集合である
ことを特徴とする請求の範囲第 3 0項に記載の情報処理装置。
3 2 . 前記偏り情報生成手段は、 複数の異なる期間中に放送または配信され たコンテンツの集合を、 それぞれ、 複数の前記所定のコンテンツ群として、 複数 の前記第 1の値および前記第 2の値を算出し、 前記第 1の値を、 同一のコンテン ッ群に対応する前記第 2の値で正規化することにより、 前記第 3の情報を、 複数 生成する
ことを特徴とする請求の範囲第 3 0項に記載の情報処理装置。
3 3 . 前記所定のコンテンツ群は、 所定の時間帯に放送または配信されたコ ンテンッの集合である
ことを特徴とする請求の範囲第 3 0項に記載の情報処理装置。
3 4 . 前記第 1の情報は、 前記コンテンツの属性情報のうち、 前記ユーザが 好むコンテンツを表す項目を示す情報である
ことを特徴とする請求の範囲第 2 6項に記載の情報処理装置。
3 5 . 前記第 1の情報は、 前記コンテンツの属性情報のうち、 前記ユーザが 好まないコンテンツを表す項目を示す情報である
ことを特徴とする請求の範囲第 2 6項に記載の情報処理装置。
3 6 . ユーザの嗜好と合致したコンテンツを選択する処理を実行する情報処 理装置の情報処理方法において、
前記ユーザの嗜好を示す第 1の情報を取得する第 1の取得ステップと、 一般的な嗜好を示す第 2の情報を取得する第 2の取得ステップと、
前記第 1の取得ステップの処理により取得された前記第 1の情報と、 前記第 2 の取得ステップの処理により取得された前記第 2の情報とを基に、 一般的な嗜好 に対する、 前記ユーザの嗜好の偏りを示す第 3の情報を生成する偏り情報生成ス テツプと
を含むことを特徴とする情報処理方法。
3 7 . ユーザの嗜好と合致したコンテンツを選択する処理をコン
ピュータに実行させるプログラムであって、
前記ユーザの嗜好を示す第 1の情報を取得する第 1の取得ステップと、 一般的な嗜好を示す第 2の情報を取得する第 2の取得ステップと、
前記第 1の取得ステップの処理により取得された前記第 1の情報と、 前記第 2 の取得ステップの処理により取得された前記第 2の情報とを基に、 一般的な嗜好 に対する、 前記ユーザの嗜好の偏りを示す第 3の情報を生成する偏り情報生成ス テツプと
を含むことを特徴とするコンピュータが読み取り可能なプログラムが記録され ている記録媒体。
3 8 . ユーザの嗜好と合致したコンテンツを選択する処理をコンピュータに 実行させるプログラムであって、
前記ユーザの嗜好を示す第 1の情報を取得する第 1の取得ステップと、 一般的な嗜好を示す第 2の情報を取得する第 2の取得ステップと、
前記第 1の取得ステップの処理により取得された前記第 1の情報と、 前記第 2 の取得ステップの処理により取得された前記第 2の情報とを基に、 一般的な嗜好 に対する、 前記ユーザの嗜好の偏りを示す第 3の情報を生成する偏り情報生成ス テツプと
を含むことを特徴とするプログラム。
PCT/JP2003/015925 2002-12-12 2003-12-12 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム WO2004054245A1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020107017180A KR101084503B1 (ko) 2002-12-12 2003-12-12 정보 처리 장치 및 정보 처리 방법, 및 기록 매체
US10/538,944 US8359322B2 (en) 2002-12-12 2003-12-12 Information-processing apparatus, method, system, and computer readable medium and method for automatically recording or recommending content
EP03778858A EP1571835A4 (en) 2002-12-12 2003-12-12 DEVICE, METHOD AND SYSTEM FOR PROCESSING DATA, RECORDING MEDIUM, AND PROGRAM
US13/715,347 US20130179456A1 (en) 2002-12-12 2012-12-14 Information-processing apparatus, method, system, computer- readable medium and method for automatically recording or recommending content
US14/617,531 US9552413B2 (en) 2002-12-12 2015-02-09 Information-processing apparatus, method, system, computer-readable medium and method for automatically recording or recommending content

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2002361276A JP4161701B2 (ja) 2002-12-12 2002-12-12 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP2002-361276 2002-12-12
JP2002361275A JP4003127B2 (ja) 2002-12-12 2002-12-12 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
JP2002-361275 2002-12-12

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US10/538,944 A-371-Of-International US8359322B2 (en) 2002-12-12 2003-12-12 Information-processing apparatus, method, system, and computer readable medium and method for automatically recording or recommending content
US13/715,347 Continuation US20130179456A1 (en) 2002-12-12 2012-12-14 Information-processing apparatus, method, system, computer- readable medium and method for automatically recording or recommending content

Publications (1)

Publication Number Publication Date
WO2004054245A1 true WO2004054245A1 (ja) 2004-06-24

Family

ID=32510664

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/015925 WO2004054245A1 (ja) 2002-12-12 2003-12-12 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム

Country Status (4)

Country Link
US (3) US8359322B2 (ja)
EP (1) EP1571835A4 (ja)
KR (2) KR101019976B1 (ja)
WO (1) WO2004054245A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006062298A1 (en) * 2004-12-10 2006-06-15 Alticast Corp. Efficient method for providing preference program of digital broadcasting
JP2017161976A (ja) * 2016-03-07 2017-09-14 日本放送協会 興味情報処理装置およびプログラム

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101036386A (zh) * 2004-10-01 2007-09-12 松下电器产业株式会社 频道订约建议装置、方法、程序和集成电路
JP4378646B2 (ja) * 2005-09-28 2009-12-09 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
KR100750150B1 (ko) * 2005-12-23 2007-08-21 삼성전자주식회사 방송 콘텐츠 정보 표시 방법 및 그 장치
EP1970820A4 (en) * 2006-01-06 2009-01-14 Sony Corp INFORMATION PROCESSING DEVICE AND METHOD, AND PROGRAM
JP5027483B2 (ja) * 2006-11-10 2012-09-19 富士通株式会社 情報検索装置及び情報検索方法
JP4909033B2 (ja) * 2006-11-30 2012-04-04 富士通株式会社 番組検索装置
JP4389973B2 (ja) * 2007-06-26 2009-12-24 ソニー株式会社 情報処理装置および方法、並びにプログラム
KR101426241B1 (ko) 2007-08-24 2014-08-05 삼성전자주식회사 개인 맞춤형 녹화 컨텐츠 처리 방법 및 장치
JP5205895B2 (ja) * 2007-09-25 2013-06-05 富士通株式会社 情報推奨装置
JP5166949B2 (ja) * 2008-04-10 2013-03-21 株式会社エヌ・ティ・ティ・ドコモ レコメンド情報生成装置およびレコメンド情報生成方法
US20110107381A1 (en) * 2008-06-26 2011-05-05 Honeybee Tv Israel Ltd. Methods and systems for managing viewing at client terminals
JP2010041163A (ja) * 2008-08-01 2010-02-18 Fujitsu Ltd 表示装置,遠隔操作装置および表示プログラム
JP5573117B2 (ja) 2009-11-17 2014-08-20 ソニー株式会社 表示制御システム、表示制御装置、および表示制御方法
JP2011145742A (ja) * 2010-01-12 2011-07-28 Sony Corp 情報処理装置、情報処理方法、およびプログラム
KR101438764B1 (ko) * 2011-05-13 2014-09-12 한국전자통신연구원 사용자 시청 이력 기반 콘텐츠 추천 방법
US8620917B2 (en) * 2011-12-22 2013-12-31 Telefonaktiebolaget L M Ericsson (Publ) Symantic framework for dynamically creating a program guide
JP2016522597A (ja) * 2013-03-21 2016-07-28 インテレクチュアル ディスカバリー カンパニー リミテッド 端末装置及びそのオーディオ信号の出力方法
US9277258B2 (en) * 2013-04-19 2016-03-01 Google Inc. Providing correlated programming information for broadcast media content and streaming media content
CN104424341A (zh) * 2013-09-11 2015-03-18 北大方正集团有限公司 资源推荐装置和资源推荐方法
EP3082100A4 (en) * 2013-12-09 2017-08-16 Telefonica Digital España, S.L.U. Method and system for characterising a user group
JP2015191507A (ja) * 2014-03-28 2015-11-02 ソニー株式会社 情報処理装置及びプログラム
US10482519B1 (en) * 2014-11-18 2019-11-19 Netflix, Inc. Relationship-based search and recommendations via authenticated negatives
US9886363B2 (en) 2015-03-27 2018-02-06 International Business Machines Corporation Identification of storage performance shortfalls
US9672207B2 (en) * 2015-10-19 2017-06-06 International Business Machines Corporation System, method, and recording medium for determining and discerning items with multiple meanings
US10423891B2 (en) * 2015-10-19 2019-09-24 International Business Machines Corporation System, method, and recording medium for vector representation of words in a language
US10579628B2 (en) * 2015-12-17 2020-03-03 The Nielsen Company (Us), Llc Media names matching and normalization
US10223359B2 (en) * 2016-10-10 2019-03-05 The Directv Group, Inc. Determining recommended media programming from sparse consumption data
US10958968B2 (en) * 2017-03-30 2021-03-23 Verizon Media Inc. Systems and methods for streaming media menu templates
US10231020B2 (en) 2017-05-16 2019-03-12 The Directv Group, Inc Sports recommender system utilizing content based filtering
US11768804B2 (en) * 2018-03-29 2023-09-26 Konica Minolta Business Solutions U.S.A., Inc. Deep search embedding of inferred document characteristics
US11176186B2 (en) * 2020-03-27 2021-11-16 International Business Machines Corporation Construing similarities between datasets with explainable cognitive methods
CN114077741B (zh) * 2021-11-01 2022-12-09 清华大学 软件供应链安全检测方法和装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09191454A (ja) * 1996-01-10 1997-07-22 Sony Corp 番組選択支援装置、番組選択支援方法、放送受信装置、放送受信方法、放送送信装置、放送送信方法、放送送受信装置、および放送送受信方法
JPH09288683A (ja) * 1995-09-04 1997-11-04 Matsushita Electric Ind Co Ltd 情報フィルタ装置及び情報フィルタリング方法
JPH10162025A (ja) * 1996-11-29 1998-06-19 Sony Corp キーワード生成方法及びその装置
JP2001128102A (ja) * 1999-10-29 2001-05-11 Matsushita Electric Ind Co Ltd 受信装置
JP2001160955A (ja) * 1999-12-01 2001-06-12 Sony Corp 放送システム及び受信装置
WO2001069921A1 (en) * 2000-03-17 2001-09-20 Koninklijke Philips Electronics N.V. Method and apparatus for rating database objects
JP2002142160A (ja) * 2000-11-02 2002-05-17 Nec Corp 番組推薦装置、番組推薦方法およびそのプログラムを記録した記録媒体

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US6076082A (en) 1995-09-04 2000-06-13 Matsushita Electric Industrial Co., Ltd. Information filtering method and apparatus for preferentially taking out information having a high necessity
US6005565A (en) * 1997-03-25 1999-12-21 Sony Corporation Integrated search of electronic program guide, internet and other information resources
GB2340636B (en) * 1997-03-31 2000-08-09 Microsoft Corp Query-based electronic program guide
US6628302B2 (en) * 1998-11-30 2003-09-30 Microsoft Corporation Interactive video programming methods
US6457010B1 (en) * 1998-12-03 2002-09-24 Expanse Networks, Inc. Client-server based subscriber characterization system
JP2001197392A (ja) * 2000-01-11 2001-07-19 Nec Corp 番組選択装置及び方法
JP2001285765A (ja) * 2000-03-29 2001-10-12 Nec Corp 放送番組蓄積方式
US7567958B1 (en) * 2000-04-04 2009-07-28 Aol, Llc Filtering system for providing personalized information in the absence of negative data
US7213256B1 (en) * 2000-12-29 2007-05-01 Dan Kikinis Method and apparatus for finding the same of similar shows
US7937725B1 (en) * 2000-07-27 2011-05-03 Koninklijke Philips Electronics N.V. Three-way media recommendation method and system
US20020083451A1 (en) * 2000-12-21 2002-06-27 Gill Komlika K. User-friendly electronic program guide based on subscriber characterizations
US7444660B2 (en) * 2000-11-16 2008-10-28 Meevee, Inc. System and method for generating metadata for video programming events
US20020152224A1 (en) * 2001-03-06 2002-10-17 Cliff Roth System and method for generating a recommendation guide for use with an EPG
US20030066068A1 (en) * 2001-09-28 2003-04-03 Koninklijke Philips Electronics N.V. Individual recommender database using profiles of others
US20030115589A1 (en) * 2001-12-17 2003-06-19 D'souza Errol System and method for automatically flagging a channel as a favorite channel
US7900147B2 (en) * 2002-07-22 2011-03-01 International Business Machines Corporation System and method for enabling disconnected web access
US8046793B2 (en) * 2002-07-29 2011-10-25 Sharp Laboratories Of America, Inc. Favorites program selection
US7657907B2 (en) * 2002-09-30 2010-02-02 Sharp Laboratories Of America, Inc. Automatic user profiling
JP2004194108A (ja) * 2002-12-12 2004-07-08 Sony Corp 情報処理装置および情報処理方法、記録媒体、並びにプログラム
US7308464B2 (en) * 2003-07-23 2007-12-11 America Online, Inc. Method and system for rule based indexing of multiple data structures

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09288683A (ja) * 1995-09-04 1997-11-04 Matsushita Electric Ind Co Ltd 情報フィルタ装置及び情報フィルタリング方法
JPH09191454A (ja) * 1996-01-10 1997-07-22 Sony Corp 番組選択支援装置、番組選択支援方法、放送受信装置、放送受信方法、放送送信装置、放送送信方法、放送送受信装置、および放送送受信方法
JPH10162025A (ja) * 1996-11-29 1998-06-19 Sony Corp キーワード生成方法及びその装置
JP2001128102A (ja) * 1999-10-29 2001-05-11 Matsushita Electric Ind Co Ltd 受信装置
JP2001160955A (ja) * 1999-12-01 2001-06-12 Sony Corp 放送システム及び受信装置
WO2001069921A1 (en) * 2000-03-17 2001-09-20 Koninklijke Philips Electronics N.V. Method and apparatus for rating database objects
JP2002142160A (ja) * 2000-11-02 2002-05-17 Nec Corp 番組推薦装置、番組推薦方法およびそのプログラムを記録した記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1571835A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006062298A1 (en) * 2004-12-10 2006-06-15 Alticast Corp. Efficient method for providing preference program of digital broadcasting
JP2017161976A (ja) * 2016-03-07 2017-09-14 日本放送協会 興味情報処理装置およびプログラム

Also Published As

Publication number Publication date
US9552413B2 (en) 2017-01-24
US20130179456A1 (en) 2013-07-11
EP1571835A1 (en) 2005-09-07
US8359322B2 (en) 2013-01-22
EP1571835A4 (en) 2010-10-20
US20150178379A1 (en) 2015-06-25
US20060248091A1 (en) 2006-11-02
KR20100100998A (ko) 2010-09-15
KR101019976B1 (ko) 2011-03-09
KR101084503B1 (ko) 2011-11-18
KR20050084264A (ko) 2005-08-26

Similar Documents

Publication Publication Date Title
JP4003127B2 (ja) 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
KR101007839B1 (ko) 정보 처리 장치 및 정보 처리 방법, 기록 매체, 및프로그램
WO2004054245A1 (ja) 情報処理装置および情報処理方法、情報処理システム、記録媒体、並びにプログラム
US10372759B2 (en) Profile based content retrieval for recommender systems
JP4491746B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びにプログラム
US8613023B2 (en) Information processor, information processing method and computer program
US7640563B2 (en) Describing media content in terms of degrees
JP4182743B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4501948B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP4161701B2 (ja) 情報処理装置および情報処理方法、記録媒体、並びにプログラム
JP4547596B2 (ja) 情報処理装置および情報処理方法、並びにプログラム
JP4577562B2 (ja) 情報処理装置および情報処理方法、並びにプログラム

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CN KR US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2003778858

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 1020057010677

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 20038A83209

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 1020057010677

Country of ref document: KR

WWP Wipo information: published in national office

Ref document number: 2003778858

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2006248091

Country of ref document: US

Ref document number: 10538944

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 10538944

Country of ref document: US