JP4501948B2 - Information processing apparatus, information processing method, recording medium, and program - Google Patents

Information processing apparatus, information processing method, recording medium, and program Download PDF

Info

Publication number
JP4501948B2
JP4501948B2 JP2007054675A JP2007054675A JP4501948B2 JP 4501948 B2 JP4501948 B2 JP 4501948B2 JP 2007054675 A JP2007054675 A JP 2007054675A JP 2007054675 A JP2007054675 A JP 2007054675A JP 4501948 B2 JP4501948 B2 JP 4501948B2
Authority
JP
Japan
Prior art keywords
information
vector
content
user
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007054675A
Other languages
Japanese (ja)
Other versions
JP2007200339A (en
Inventor
則行 山本
充弘 宮嵜
真里 斎藤
宏幸 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007054675A priority Critical patent/JP4501948B2/en
Publication of JP2007200339A publication Critical patent/JP2007200339A/en
Application granted granted Critical
Publication of JP4501948B2 publication Critical patent/JP4501948B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、情報処理装置および情報処理方法、記録媒体、並びにプログラムに関し、特に、テレビジョン放送やラジオ放送などの番組や、ストリーミングデータなどを視聴するユーザに対して、例えば、自動録画や番組などを選択する場合に用いて好適な、情報処理装置および情報処理方法、記録媒体、並びにプログラムに関する。   The present invention relates to an information processing apparatus, an information processing method, a recording medium, and a program. In particular, for a user who watches a program such as a television broadcast or a radio broadcast, or streaming data, for example, an automatic recording or a program. The present invention relates to an information processing device, an information processing method, a recording medium, and a program, which are suitable for use in selecting an item.

従来、例えば、テレビジョン放送やラジオ放送などにおいて、ユーザに対して番組を推薦する場合には、電子番組ガイド(EPG:Electronic Program Guide)などの番組情報(番組メタデータ)を基に、ユーザの嗜好情報にマッチングする番組が選択された。ユーザへの番組の推薦方法は、ユーザ嗜好データの取得の方法によって異なり、例えば、初期にユーザの興味に関する情報を登録してもらい、その情報に基づいて、番組を推薦する初期興味登録方式、ユーザが過去に視聴した番組の履歴を利用して、番組を推薦する視聴履歴利用方式、あるいは、他のユーザの視聴履歴を利用して、番組を推薦する協調フィルタリング方式などの方法があった。   Conventionally, for example, when a program is recommended to a user in television broadcasting or radio broadcasting, the user's information is based on program information (program metadata) such as an electronic program guide (EPG). A program matching the preference information was selected. The method of recommending a program to the user differs depending on the method of acquiring user preference data. For example, an initial interest registration method for recommending a program on the basis of information on the user's interest and registering the user based on the information. However, there have been methods such as a viewing history utilization method for recommending programs using the history of programs viewed in the past, or a collaborative filtering method for recommending programs using the viewing history of other users.

初期興味登録方式では、利用開始時に、例えば、好きな番組カテゴリー(例えば、ドラマ、バラエティ、など)、好きなジャンル(推理もの、お笑いもの、など)、または、好きなタレント名などをユーザに登録してもらい、これらの情報をキーワードとして、番組メタデータとの間でマッチングを取ることにより、推薦すべき番組名が取得されるようになされている。   In the initial interest registration method, at the start of use, for example, a favorite program category (for example, drama, variety, etc.), a favorite genre (inference, comedy, etc.), or a favorite talent name is registered with the user. By using this information as a keyword and matching with program metadata, the name of the program to be recommended is acquired.

また、視聴履歴利用方式では、ユーザが番組を視聴するたびに、視聴された番組メタデータが蓄積され、ある程度、履歴メタデータが蓄積されると、そのメタデータが解析されて、例えば、好きな番組カテゴリー、好きなジャンル、または、好きなタレント名などの情報が取得される。そして、これらの情報をキーワードとして、番組メタデータとの間でマッチングを取ることにより、推薦すべき番組名が取得されるようになされている。   Also, in the viewing history usage method, each time a user views a program, the viewed program metadata is accumulated, and when the history metadata is accumulated to some extent, the metadata is analyzed, for example, as desired Information such as program category, favorite genre, or favorite talent name is acquired. A program name to be recommended is acquired by matching the program metadata with these information as keywords.

例えば、HDD(Hard Disk Drive)を用いた録画装置などにおいては、視聴履歴のみならず、録画予約、または、録画などのユーザ操作が履歴情報として蓄積され、嗜好情報の取得に用いられることもある。この場合、ユーザが、特に興味を持って番組を視聴しているのではなく、テレビジョン受像機やラジオなどをつけていたために視聴していた状態になっていた番組と、ユーザが、より興味を持って、意識的に視聴した番組を一部区別することが可能となり、ユーザの嗜好をより反映した情報を取得できる。   For example, in a recording device using an HDD (Hard Disk Drive), user operations such as recording reservation or recording as well as viewing history are accumulated as history information and may be used for obtaining preference information. . In this case, the user is not interested in watching the program with particular interest, but the user is more interested in the program that was being watched because the television receiver or radio was on. It is possible to discriminate a part of programs that have been consciously viewed and to acquire information more reflecting the user's preferences.

そして、協調フィルタリング方式は、第1のユーザの視聴や操作の履歴に対して、その他のユーザの視聴履歴との間でマッチングを取ることにより、第1のユーザと視聴履歴の似ている第2のユーザを検索し、その視聴または操作の履歴データを取得することにより、第2のユーザが視聴した番組で、第1のユーザがまだ視聴していない番組を抽出して推薦するものである。   In the collaborative filtering method, the first user's viewing history is similar to the first user's viewing history by matching the viewing history of the first user with the viewing history of other users. The user is searched and the history data of viewing or operation is acquired, so that programs that the second user has watched are extracted and recommended by the first user.

また、放送番組に、予め、番組の属性情報として、n次元の属性ベクトルを付加し、ユーザの初期登録内容や、ユーザが再生、または録画予約した番組の属性ベクトルの各属性項目の平均値を基に生成された選択ベクトルと、属性ベクトルとを比較することにより、録画する番組、または、再生する番組を選択することができるようになされている技術がある(例えば、特許文献1)。   In addition, an n-dimensional attribute vector is added to the broadcast program in advance as the attribute information of the program, and the initial registration contents of the user and the average value of each attribute item of the attribute vector of the program reproduced or reserved for recording by the user are obtained. There is a technique in which a program to be recorded or a program to be played back can be selected by comparing a selection vector generated based on an attribute vector (for example, Patent Document 1).

特開2001−160955号公報JP 2001-160955 A

しかしながら、初期登録方式を基に、番組を選択する場合、ユーザが初期登録を行った時期の固定的な興味しか反映できない上、詳細な情報を得るためには、ユーザの登録操作が複雑になってしまう。これに対して、初期設定の登録情報の入力操作を簡単にするために、登録される情報数を少なくしてしまった場合、大まかなユーザの嗜好情報を基にした推薦しかできないので、ユーザの嗜好に合致する番組が選択される精度が低いものとなってしまう。   However, when selecting a program based on the initial registration method, only a fixed interest at the time when the user performed the initial registration can be reflected, and the user's registration operation becomes complicated in order to obtain detailed information. End up. On the other hand, if the number of registered information is reduced in order to simplify the initial registration information input operation, the user can only make recommendations based on user preference information. The accuracy of selecting a program that matches the preference will be low.

これに対して、履歴利用方式などのように、単純にユーザの視聴履歴などを基に収集したメタデータの総和、または平均などを用いて、番組を選択する場合、履歴がある程度蓄積されないと、ユーザの嗜好に正しく合致した番組を推薦することができない。更に、履歴利用方式では、メタデータ間の関係性がなまってしまい、充分な個人化はできなかった。また履歴を積み重ねることにより、例えば、ジャンルなど、履歴として重なり易い項目(ユーザが嗜好するものとして検出されやすい項目)と、出演者など、履歴として要素が広がり易い項目(ユーザが嗜好するものとして検出されにくい項目)とで、重み付けに偏りが生じてしまう場合がある。   On the other hand, when a program is selected using a sum total or an average of metadata collected based on a user's viewing history or the like, such as a history usage method, the history is not accumulated to some extent, A program that correctly matches the user's preferences cannot be recommended. Furthermore, in the history usage method, the relationship between metadata is lost, and sufficient personalization cannot be achieved. Also, by accumulating histories, for example, items that are easy to overlap as histories such as genres (items that are easy to detect as user-preferred) and items that are easy to expand as histories such as performers (detected as user-preferred) In some cases, the weighting may be biased.

具体的には、例えば、ユーザが解説者Aのファンであるので、「解説者Aが解説している球団Bの試合の実況中継」を好んで視聴しているような場合、ジャンルである「野球の実況中継」という情報は履歴として重なりやすい(「野球の実況中継」という情報は、ユーザが嗜好するものとして検出されやすい)が、出演者である「解説者A」という情報は履歴として重なり難い(「解説者A」という情報は、ユーザが嗜好するものとして検出され難い)。このため、他の解説者が解説している球団Bの試合の実況中継が推薦されて、解説者Aが出演しているバラエティ番組が推薦されないような場合が発生する。   Specifically, for example, since the user is a fan of the commentator A, when he likes to watch “the live broadcast of the game of the team B explained by the commentator A”, the genre is “ The information “baseball live coverage” is easy to overlap as a history (the information “baseball live coverage” is easy to detect as a user's preference), but the information “caster A” who is a performer overlaps as history. It is difficult (information “explanator A” is difficult to detect as a user's preference). For this reason, there may be a case where the live broadcast of the game of the team B explained by other commentators is recommended and the variety program in which the commentator A appears is not recommended.

また、特許文献1に示されるように、放送番組に、予め、番組の属性ベクトルを付加し、ユーザの初期登録内容や、ユーザが再生、または録画予約した番組の属性ベクトルの各属性項目の平均値を基に生成された選択ベクトルと、属性ベクトルとを比較することにより、録画する番組、または、再生する番組を選択するようにした場合も、ユーザの操作履歴を利用するのであるから、同様に、履歴として重なり易い項目と、出演者など、履歴として要素が広がり易い項目とで、重み付けに偏りが生じてしまう場合がある。   In addition, as shown in Patent Document 1, an attribute vector of a program is added to a broadcast program in advance, and the average of each attribute item of the user's initial registration content and the attribute vector of the program that the user has played or reserved for recording Since the user's operation history is also used when selecting the program to be recorded or the program to be played back by comparing the selection vector generated based on the value with the attribute vector, the same applies. In addition, there may be a bias in weighting between items that tend to overlap as histories and items that tend to spread elements as histories such as performers.

更に、例えば、ドラマが好きで、バラエティは、ほとんどドラマに出演しないコメディアンAが出演するもののみを好み、バラエティ対ドラマの視聴比率が2:8であるユーザに対して生成される選択ベクトルにおいては、ほとんどドラマに出演しないコメディアンAよりも、特に好きな俳優でないにもかかわらず、ドラマに頻繁に出演する出演者Bが履歴として重なってしまう。従って、コメディアンAが出演するバラエティよりも、ドラマに頻繁に出演する出演者Bが出演するドキュメンタリーが優先的に推薦されてしまう。   Further, for example, in a selection vector generated for a user who likes a drama and prefers only those in which comedian A, who rarely appears in dramas, appears, and the audience ratio of variety to drama is 2: 8. Actor B who frequently appears in dramas overlaps as a history, even though he is not a favorite actor, than comedian A, who hardly appears in dramas. Therefore, a documentary in which performer B who frequently appears in dramas appears is preferentially recommended over the variety in which comedian A appears.

また、ユーザによって、番組を選択するために重要な項目が異なる(例えば、出演者重視や内容重視など)場合にも、全ての項目が同様に演算されるため、ユーザ固有の嗜好が反映されない場合があった。   In addition, even when important items for selecting a program are different depending on the user (for example, emphasis on performers or content), since all items are calculated in the same way, user-specific preferences are not reflected. was there.

また、協調フィルタリング方式で利用されるのは、あくまで他のユーザの嗜好情報であるので、それぞれのユーザの嗜好を詳細に表す情報を抽出することは困難であった。   Further, since what is used in the collaborative filtering method is the preference information of other users to the last, it is difficult to extract information that represents each user's preference in detail.

本発明はこのような状況に鑑みてなされたものであり、ユーザの嗜好に合致した番組を選択することができるようにするものである。   The present invention has been made in view of such a situation, and makes it possible to select a program that matches a user's preference.

本発明の第1の側面の情報処理装置は、ユーザの嗜好に類似するコンテンツを選択する処理を実行する情報処理装置であって、複数の項目で構成されている前記コンテンツの属性情報を他の装置から受信する受信手段と、前記ユーザのコンテンツについての操作履歴から、前記ユーザが好むコンテンツの履歴である正履歴情報と前記ユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報を生成するユーザ履歴情報生成手段と、前記コンテンツの属性情報並びに前記正履歴情報および前記負履歴情報は前記項目ごとにベクトル化され、前記コンテンツの属性情報と前記ユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和によって、受信された前記コンテンツの属性情報と、生成された前記ユーザ履歴情報との類似度算出する算出手段と、算出された前記類似度に基づいて、コンテンツを選択する選択手段と、前記算出手段が用いる前記重み付け情報であって、所定期間の前記属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とし、前記標準嗜好ベクトルと、前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報として生成する重み付け情報生成手段とを備え、前記算出手段は、前記コンテンツの属性情報と前記正履歴情報のベクトルのコサイン距離と前記正の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記負履歴情報のベクトルのコサイン距離と前記負の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出するAn information processing apparatus according to a first aspect of the present invention is an information processing apparatus that performs a process of selecting content similar to a user's preference, and includes the attribute information of the content including a plurality of items User history information comprising receiving means for receiving from the device, and positive history information that is a history of content that the user likes and negative history information that is a history of content that the user does not like from the operation history of the user's content User history information generating means for generating the content attribute information, the positive history information and the negative history information are vectorized for each item, and the cosine distance between the content attribute information and the user history information vector The inner product with the weighting information is calculated for each item and the result of the inner product is added to all the items. And calculating means for calculating the similarity between the received attribute information of the content and the generated user history information, selecting means for selecting content based on the calculated similarity, The weighting information used by the calculation means , the cosine distance between the standard preference vector indicating the general preference of the viewer obtained by counting the attribute information for a predetermined period and the vector of the positive history information for each item And the reciprocal thereof is positive weighting information that defines the degree of positive contribution of each item when calculating the similarity between the attribute information and the positive history information , the standard preference vector, The cosine distance with the negative history information vector is calculated for each item, and the reciprocal of each item in the case of calculating the similarity between the attribute information and the negative history information. Of a weighting information generating means for generating a negative weighting information defining the degree of contribution, the calculating means, the cosine distance between the positive weighting vector information of the attribute information of the content positive history information An inner product is calculated for each item, and the inner product of the cosine distance of the content attribute information, the vector of the negative history information, and the negative weighting information is calculated from the sum of the inner product results for all the items. The similarity between the content attribute information and the user history information is calculated based on the difference obtained by calculating for each item and subtracting the sum of the inner product results for all the items .

前記ユーザ履歴情報生成手段には、ジャンル別に、前記ユーザ履歴情報を生成させ、前記重み付け情報生成手段には、所定のジャンルについて、前記標準嗜好ベクトルと前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記正の重み付け情報として生成させるとともに、前記所定のジャンルについて、前記標準嗜好ベクトルと前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を前記負の重み付け情報として生成させ、前記算出手段には、前記コンテンツの属性情報と前記所定のジャンルの前記正履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記所定のジャンルの前記負履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記所定のジャンルの前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出させるようにすることができる。 The user history information generating unit generates the user history information for each genre, and the weighting information generating unit sets a cosine distance between the standard preference vector and the vector of the positive history information for a predetermined genre. For each item, the reciprocal number is generated as the positive weighting information, and for the predetermined genre, the cosine distance between the standard preference vector and the negative history information vector is calculated for each item. An inverse number is generated as the negative weighting information, and the calculation means calculates an inner product of the attribute information of the content and the cosine distance of the vector of the positive history information of the predetermined genre for each item, and From the sum of the inner product results for all the items, the attribute information of the content and the predetermined genre The attribute information of the content of the predetermined genre is calculated by calculating the inner product of the vector of the negative history information with the cosine distance of each item and subtracting the sum of the results of the inner products for all the items. And the user history information can be calculated .

前記受信手段には、コンテンツを複数のグループに分類したときの所定のグループを示す情報が付加されている前記コンテンツの属性情報も前記他の装置から受信させ、前記選択手段には、前記コンテンツの属性情報に前記グループを示す情報が付加されている場合、前記グループを示す情報に対応するコンテンツを選択させ、前記グループを示す情報が付加されていない場合、前記算出手段が算出した前記類似度に基づいて、コンテンツを選択させることができる。 The receiving unit also receives attribute information of the content to which information indicating a predetermined group when the content is classified into a plurality of groups is added from the other device, and the selection unit is configured to receive the content of the content. When the information indicating the group is added to the attribute information, the content corresponding to the information indicating the group is selected. When the information indicating the group is not added, the similarity calculated by the calculation unit is set. Based on this, the content can be selected .

前記コンテンツは番組であり、前記グループは、連続ドラマ、コンテンツのジャンル、出演者、タイトルのいずれかでグループ化されるものとすることができる。 The content may be a program, and the group may be grouped by any one of a series drama, content genre, performer, and title .

前記重み付け情報生成手段により生成された前記属性情報の前記項目に対応する重み付け情報を記憶する記憶手段を更に備えさせるようにすることができる。 Storage means for storing weighting information corresponding to the item of the attribute information generated by the weighting information generation means can be further provided.

前記ユーザのコンテンツについての操作履歴を蓄積する蓄積手段をさらに備えるようにすることができる。 The information processing apparatus may further include an accumulating unit that accumulates an operation history of the user content .

本発明の第1の側面の情報処理方法は、ユーザの嗜好に類似するコンテンツを選択する処理を実行する情報処理装置の情報処理方法であって、前記情報処理装置が、複数の項目で構成されている前記コンテンツの属性情報を他の装置から受信する受信ステップと、前記ユーザのコンテンツについての操作履歴から、前記ユーザが好むコンテンツの履歴である正履歴情報と前記ユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報を生成するユーザ履歴情報生成ステップと、前記コンテンツの属性情報並びに前記正履歴情報および前記負履歴情報は前記項目ごとにベクトル化され、前記コンテンツの属性情報と前記ユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和によって、受信された前記コンテンツの属性情報と、生成された前記ユーザ履歴情報との類似度算出する算出ステップと算出された前記類似度に基づいて、コンテンツを選択する選択ステップと、前記算出ステップの処理で用いられる前記重み付け情報であって、所定期間の前記属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とし、前記標準嗜好ベクトルと、前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報として生成する重み付け情報生成ステップとを含み、前記算出ステップの処理は、前記コンテンツの属性情報と前記正履歴情報のベクトルのコサイン距離と前記正の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記負履歴情報のベクトルのコサイン距離と前記負の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出するAn information processing method according to a first aspect of the present invention is an information processing method of an information processing apparatus that executes a process of selecting content similar to a user's preference, and the information processing apparatus includes a plurality of items. A receiving step of receiving the attribute information of the content from another device, an operation history of the user's content, a positive history information that is a history of the content that the user likes, and a history of the content that the user does not like A user history information generation step for generating user history information including certain negative history information, the attribute information of the content, the positive history information, and the negative history information are vectorized for each item, and the content attribute information The inner product of the cosine distance of the vector of the user history information and the weighting information is calculated for each item, and the inner product The sum obtained by adding all of the items results in the attribute information of the received the contents, a calculation step of calculating a similarity between the generated the user history information, based on the calculated degree of similarity A selection step for selecting content; and the weighting information used in the processing of the calculation step, the standard preference vector indicating the general preference of viewers obtained by counting the attribute information for a predetermined period; and The cosine distance with the vector of the positive history information is calculated for each item, and the reciprocal thereof defines the degree of positive contribution of each item when calculating the similarity between the attribute information and the positive history information. a positive weighting information, and the standard favorite vector, calculates a cosine distance between the vector of the negative history information for each of the items, the inverse, the genus In the case of calculating the similarity between the information and the negative history information, and a weighting information generating step of generating a negative weighting information defining the negative degree of contribution of each item, the processing of the calculation step, the The inner product of the cosine distance of the content attribute information and the vector of the positive history information and the positive weighting information is calculated for each item, and the result of the inner product is added to all the items, and the content of the content is calculated. By calculating the inner product of the cosine distance of the attribute information and the negative history information vector and the negative weighting information for each item, and subtracting the sum of the results of the inner products for all the items, The similarity between content attribute information and the user history information is calculated .

前記ユーザ履歴情報生成ステップの処理では、ジャンル別に、前記ユーザ履歴情報を生成させ、前記重み付け情報生成ステップの処理では、所定のジャンルについて、前記標準嗜好ベクトルと前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記正の重み付け情報として生成させるとともに、前記所定のジャンルについて、前記標準嗜好ベクトルと前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を前記負の重み付け情報として生成させ、前記算出ステップの処理では、前記コンテンツの属性情報と前記所定のジャンルの前記正履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記所定のジャンルの前記負履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記所定のジャンルの前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出させるようにすることができる。 In the processing of the user history information generation step, the user history information is generated for each genre, and in the processing of the weighting information generation step, a cosine distance between the standard preference vector and the vector of the positive history information for a predetermined genre. Is calculated for each item, and the reciprocal thereof is generated as the positive weighting information, and the cosine distance between the standard preference vector and the negative history information vector is calculated for each item for the predetermined genre. The reciprocal is generated as the negative weighting information, and in the processing of the calculating step, an inner product of the attribute information of the content and the cosine distance of the vector of the positive history information of the predetermined genre is calculated for each item. The content is calculated from the sum of the inner product results for all the items. The inner product of the attribute information and the cosine distance of the vector of the negative history information of the predetermined genre is calculated for each item, and the result of the inner product is subtracted from the sum obtained by adding all the items. It is possible to calculate the similarity between the attribute information of the content of the genre and the user history information .

前記受信ステップの処理では、コンテンツを複数のグループに分類したときの所定のグループを示す情報が付加されている前記コンテンツの属性情報も前記他の装置から受信させ、前記選択ステップの処理では、前記コンテンツの属性情報に前記グループを示す情報が付加されている場合、前記グループを示す情報に対応するコンテンツを選択させ、前記グループを示す情報が付加されていない場合、前記算出ステップが算出した前記類似度に基づいて、コンテンツを選択させることができる。 In the process of the receiving step, the attribute information of the content to which information indicating a predetermined group when the content is classified into a plurality of groups is added is also received from the other device. When the information indicating the group is added to the attribute information of the content, the content corresponding to the information indicating the group is selected, and when the information indicating the group is not added, the similarity calculated in the calculation step The content can be selected based on the degree .

前記コンテンツは番組であり、前記グループは、連続ドラマ、コンテンツのジャンル、出演者、タイトルのいずれかでグループ化されるものとすることができる。 The content may be a program, and the group may be grouped by any one of a series drama, content genre, performer, and title .

前記重み付け情報生成ステップの処理により生成された前記属性情報の前記項目に対応する重み付け情報を記憶する記憶ステップを更に含ませるようにすることができる。 A storage step of storing weighting information corresponding to the item of the attribute information generated by the processing of the weighting information generation step can be further included.

前記ユーザのコンテンツについての操作履歴を蓄積する蓄積ステップをさらに含むようにすることができる。 An accumulating step of accumulating an operation history of the user content can be further included .

本発明の第1の側面のプログラムは、ユーザの嗜好に類似するコンテンツを選択する処理をコンピュータに実行させるためのプログラムであって、複数の項目で構成されている前記コンテンツの属性情報を他の装置から受信する受信ステップと、前記ユーザのコンテンツについての操作履歴から、前記ユーザが好むコンテンツの履歴である正履歴情報と前記ユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報を生成するユーザ履歴情報生成ステップと、前記コンテンツの属性情報並びに前記正履歴情報および前記負履歴情報は前記項目ごとにベクトル化され、前記コンテンツの属性情報と前記ユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和によって、受信された前記コンテンツの属性情報と、生成された前記ユーザ履歴情報との類似度算出する算出ステップと算出された前記類似度に基づいて、コンテンツを選択する選択ステップと、前記算出ステップの処理で用いられる前記重み付け情報であって、所定期間の前記属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とし、前記標準嗜好ベクトルと、前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報として生成する重み付け情報生成ステップとを含み、前記算出ステップの処理は、前記コンテンツの属性情報と前記正履歴情報のベクトルのコサイン距離と前記正の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記負履歴情報のベクトルのコサイン距離と前記負の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出する
処理をコンピュータに実行させる。
A program according to a first aspect of the present invention is a program for causing a computer to execute a process of selecting content similar to a user's preference, wherein the content attribute information composed of a plurality of items User history information consisting of a reception step received from the device, and positive history information that is a history of the content that the user likes and negative history information that is a history of content that the user does not like from the operation history of the user's content Generating the user history information, the content attribute information and the positive history information and the negative history information are vectorized for each item, and the cosine distance between the content attribute information and the user history information vector The inner product with the weighting information is calculated for each item, and the result of the inner product is calculated for all previous items. The sum obtained by adding the serial item, and attribute information of the received the contents, a calculation step of calculating a similarity between the generated the user history information, based on the calculated degree of similarity, select content A standard preference vector indicating general audience preference obtained by counting the attribute information for a predetermined period, and a vector of the positive history information, the weighting information used in the processing of the selection step and the calculation step the cosine distance calculated for each of the items and, its inverse, in the case of calculating the similarity between the attribute information and the positive history information, a positive weighting information defining the degree of positive contribution of each item The cosine distance between the standard preference vector and the negative history information vector is calculated for each item, and the reciprocal is calculated as the attribute information and the default In the case of calculating the similarity between the information, and a weighting information generating step of generating a negative weighting information defining the negative degree of contribution of each item, the processing of the calculation step, the attribute information of the content The inner product of the cosine distance of the vector of the positive history information and the positive weighting information is calculated for each item, and the result of the inner product is added to all the items, and the attribute information of the content and the negative information are calculated. The inner product of the cosine distance of the vector of history information and the negative weighting information is calculated for each item, and the attribute information of the content is obtained by subtracting the sum of the results of the inner product for all the items. Calculate similarity with the user history information
To perform the processing to computer.

本発明の第1の側面においては、複数の項目で構成されているコンテンツの属性情報が他の装置から受信され、ユーザのコンテンツについての操作履歴から、ユーザが好むコンテンツの履歴である正履歴情報とユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報が生成され、コンテンツの属性情報並びに正履歴情報および負履歴情報は項目ごとにベクトル化され、コンテンツの属性情報とユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を項目ごとに算出して、その内積の結果を全ての項目について足した和によって、受信されたコンテンツの属性情報と、生成されたユーザ履歴情報との類似度が算出され、算出された類似度に基づいて、コンテンツが選択される。重み付け情報としては、所定期間の属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、正履歴情報のベクトルとのコサイン距離が項目ごとに算出され、その逆数が、属性情報と正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とされ、標準嗜好ベクトルと、負履歴情報のベクトルとのコサイン距離が項目ごとに算出され、その逆数が、属性情報と負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報とされるIn the first aspect of the present invention, the attribute information of the content composed of a plurality of items is received from another device, and the normal history information that is the history of the content preferred by the user from the operation history of the user's content And negative history information, which is a history of content that the user does not like, is generated, the content attribute information and the positive history information and negative history information are vectorized for each item, the content attribute information and the user history The inner product of the cosine distance of the information vector and the weighting information is calculated for each item, the attribute information of the received content, the generated user history information, and the sum of the results of the inner product for all items, The similarity is calculated, and the content is selected based on the calculated similarity. As the weighting information, the cosine distance between the standard preference vector indicating the viewer's general preference obtained by counting the attribute information of a predetermined period and the vector of the normal history information is calculated for each item, and the reciprocal thereof is the attribute When calculating the degree of similarity between information and positive history information, this is positive weighting information that defines the degree of positive contribution of each item, and the cosine distance between the standard preference vector and the negative history information vector for each item The reciprocal number is negative weighting information that defines the degree of negative contribution of each item when the similarity between attribute information and negative history information is calculated .

本発明の第2の側面の情報処理装置は、ユーザの嗜好に類似するコンテンツを選択する処理を実行する情報処理装置であって、複数の項目で構成されている前記コンテンツの属性情報を記憶する第1の記憶手段と、前記ユーザのコンテンツについての操作履歴から、前記ユーザが好むコンテンツの履歴である正履歴情報と前記ユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報を生成するユーザ履歴情報生成手段と、前記コンテンツの属性情報並びに前記正履歴情報および前記負履歴情報は前記項目ごとにベクトル化され、前記コンテンツの属性情報と前記ユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和によって、前記第1の記憶手段により記憶された前記コンテンツの属性情報と、生成された前記ユーザ履歴情報の類似度算出する算出手段と、算出された前記類似度に基づいて、コンテンツを選択する選択手段と、前記算出手段が用いる前記重み付け情報であって、所定期間の前記属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とし、前記標準嗜好ベクトルと、前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報として生成する重み付け情報生成手段とを備え、前記算出手段は、前記コンテンツの属性情報と前記正履歴情報のベクトルのコサイン距離と前記正の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記負履歴情報のベクトルのコサイン距離と前記負の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出するAn information processing apparatus according to a second aspect of the present invention is an information processing apparatus that performs a process of selecting content similar to a user's preference, and stores attribute information of the content configured by a plurality of items User history information including first history information and positive history information that is a history of content that the user likes and negative history information that is a history of content that the user does not like from the operation history of the user's content. The user history information generating means for generating, the attribute information of the content, the positive history information and the negative history information are vectorized for each item, and a cosine distance and a weight of the vector of the content attribute information and the user history information An inner product with information is calculated for each item, and the result of the inner product is added to all the items, Calculating means for calculating similarity between the attribute information of the content stored by the first storage means and the generated user history information; and selecting means for selecting content based on the calculated similarity If, a the weighting information the calculation unit uses, obtained by counting the attribute information of a predetermined period, and the standard preference vector indicating the preferences of the viewer general, the cosine distance between the vector of the positive history information The standard preference vector is calculated for each item, and the reciprocal thereof is set as positive weighting information that defines the degree of positive contribution of each item when calculating the similarity between the attribute information and the positive history information. And the cosine distance between the negative history information vector and each item, and the reciprocal thereof is used to calculate the similarity between the attribute information and the negative history information. Kicking, and a weighting information generating means for generating a negative weighting information defining the negative degree of contribution of each item, the calculation unit, the cosine distance vector of the attribute information of the content positive history information An inner product with positive weighting information is calculated for each item, and the result of the inner product is added to all the items, and the cosine distance between the attribute information of the content and the vector of the negative history information and the negative An inner product with weighting information is calculated for each item, and a similarity between the attribute information of the content and the user history information is calculated based on a difference obtained by subtracting the sum of the inner product results for all the items. .

前記ユーザ履歴情報生成手段には、ジャンル別に、前記ユーザ履歴情報を生成させ、前記重み付け情報生成手段には、所定のジャンルについて、前記標準嗜好ベクトルと前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記正の重み付け情報として生成させるとともに、前記所定のジャンルについて、前記標準嗜好ベクトルと前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を前記負の重み付け情報として生成させ、前記算出手段には、前記コンテンツの属性情報と前記所定のジャンルの前記正履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記所定のジャンルの前記負履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記所定のジャンルの前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出させるようにすることができる。 The user history information generating unit generates the user history information for each genre, and the weighting information generating unit sets a cosine distance between the standard preference vector and the vector of the positive history information for a predetermined genre. For each item, the reciprocal number is generated as the positive weighting information, and for the predetermined genre, the cosine distance between the standard preference vector and the negative history information vector is calculated for each item. An inverse number is generated as the negative weighting information, and the calculation means calculates an inner product of the attribute information of the content and the cosine distance of the vector of the positive history information of the predetermined genre for each item, and From the sum of the inner product results for all the items, the attribute information of the content and the predetermined genre The attribute information of the content of the predetermined genre is calculated by calculating the inner product of the vector of the negative history information with the cosine distance of each item and subtracting the sum of the results of the inner products for all the items. And the user history information can be calculated .

前記第1の記憶手段には、コンテンツを複数のグループに分類したときの所定のグループを示す情報が付加されている前記コンテンツの属性情報も記憶させ、前記選択手段には、前記コンテンツの属性情報に前記グループを示す情報が付加されている場合、前記グループを示す情報に対応するコンテンツを選択させ、前記グループを示す情報が付加されていない場合、前記算出手段が算出した前記類似度に基づいて、コンテンツを選択させることができる。 The first storage means also stores attribute information of the content to which information indicating a predetermined group when content is classified into a plurality of groups is stored, and the selection means stores the attribute information of the content When the information indicating the group is added to, the content corresponding to the information indicating the group is selected, and when the information indicating the group is not added, based on the similarity calculated by the calculation unit , The content can be selected .

前記コンテンツは番組であり、前記グループは、連続ドラマ、コンテンツのジャンル、出演者、タイトルのいずれかでグループ化されるものとすることができる。 The content may be a program, and the group may be grouped by any one of a series drama, content genre, performer, and title .

前記重み付け情報生成手段により生成された前記属性情報の前記項目に対応する重み付け情報を記憶する第2の記憶手段を更に備えさせるようにすることができる。 The storage device may further comprise second storage means for storing weighting information corresponding to the item of the attribute information generated by the weighting information generation means .

前記ユーザのコンテンツについての操作履歴を蓄積する蓄積手段をさらに備えるようにすることができる The information processing apparatus may further include an accumulating unit that accumulates an operation history of the user content .

本発明の第2の側面の情報処理方法は、ユーザの嗜好に類似するコンテンツを選択する処理を実行する情報処理装置の情報処理方法であって、前記情報処理装置が、複数の項目で構成されている前記コンテンツの属性情報を記憶する第1の記憶ステップと、前記ユーザのコンテンツについての操作履歴から、前記ユーザが好むコンテンツの履歴である正履歴情報と前記ユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報を生成するユーザ履歴情報生成ステップと、前記コンテンツの属性情報並びに前記正履歴情報および前記負履歴情報は前記項目ごとにベクトル化され、前記コンテンツの属性情報と前記ユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和によって、前記第1の記憶ステップの処理により記憶された前記コンテンツの属性情報と、前記ユーザ履歴情報との類似度算出する算出ステップと、算出された前記類似度に基づいて、コンテンツを選択する選択ステップと、前記算出ステップの処理で用いられる前記重み付け情報であって、所定期間の前記属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とし、前記標準嗜好ベクトルと、前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報として生成する重み付け情報生成ステップとを含み、前記算出ステップの処理は、前記コンテンツの属性情報と前記正履歴情報のベクトルのコサイン距離と前記正の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記負履歴情報のベクトルのコサイン距離と前記負の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出するAn information processing method according to a second aspect of the present invention is an information processing method for an information processing apparatus that executes processing for selecting content similar to a user's preference, and the information processing apparatus includes a plurality of items. A first storage step for storing the attribute information of the content that is stored, and positive history information that is a history of the user's preferred content and a history of content that the user does not like from the operation history of the user's content. A user history information generating step for generating user history information comprising negative history information , the content attribute information, the positive history information and the negative history information are vectorized for each item, and the content attribute information and the content information Calculate the inner product of the cosine distance of the vector of user history information and the weighting information for each item, and the result of the inner product The calculation step of calculating the similarity between the attribute information of the content stored by the processing of the first storage step and the user history information by the sum of all the items, and the calculated similarity A standard step indicating a general preference of the viewer, which is obtained by counting the attribute information for a predetermined period , which is the weighting information used in the processing of the selection step of selecting content and the calculation step based on the degree The cosine distance between the vector and the vector of the positive history information is calculated for each item, and the reciprocal of the positive contribution of each item when calculating the similarity between the attribute information and the positive history information . a positive weighting information defining the degree, calculated with the standard favorite vector, a cosine distance between the vector of the negative history information for each of the items, The inverse of, in a case of calculating the similarity between the attribute information and the negative history information, and a weighting information generating step of generating a negative weighting information defining the negative degree of contribution of each item, the calculated In the processing of the step, the inner product of the cosine distance between the attribute information of the content and the vector of the positive history information and the positive weighting information is calculated for each item, and the result of the inner product is added to all the items. From the sum, the inner product of the cosine distance of the content attribute information and the negative history information vector and the negative weighting information is calculated for each item, and the sum of the inner product results for all the items is calculated. The similarity between the content attribute information and the user history information is calculated based on the subtracted difference .

前記ユーザ履歴情報生成ステップの処理では、ジャンル別に、前記ユーザ履歴情報を生成させ、前記重み付け情報生成ステップの処理では、所定のジャンルについて、前記標準嗜好ベクトルと前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記正の重み付け情報として生成させるとともに、前記所定のジャンルについて、前記標準嗜好ベクトルと前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を前記負の重み付け情報として生成させ、前記算出ステップの処理では、前記コンテンツの属性情報と前記所定のジャンルの前記正履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記所定のジャンルの前記負履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記所定のジャンルの前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出させるようにすることができる。 In the processing of the user history information generation step, the user history information is generated for each genre, and in the processing of the weighting information generation step, a cosine distance between the standard preference vector and the vector of the positive history information for a predetermined genre. Is calculated for each item, and the reciprocal thereof is generated as the positive weighting information, and the cosine distance between the standard preference vector and the negative history information vector is calculated for each item for the predetermined genre. The reciprocal is generated as the negative weighting information, and in the processing of the calculating step, an inner product of the attribute information of the content and the cosine distance of the vector of the positive history information of the predetermined genre is calculated for each item. The content is calculated from the sum of the inner product results for all the items. The inner product of the attribute information and the cosine distance of the vector of the negative history information of the predetermined genre is calculated for each item, and the result of the inner product is subtracted from the sum obtained by adding all the items. It is possible to calculate the similarity between the attribute information of the content of the genre and the user history information .

前記第1の記憶ステップの処理では、コンテンツを複数のグループに分類したときの所定のグループを示す情報が付加されている前記コンテンツの属性情報も記憶させ、前記選択ステップの処理では、前記コンテンツの属性情報に前記グループを示す情報が付加されている場合、前記グループを示す情報に対応するコンテンツを選択させ、前記グループを示す情報が付加されていない場合、前記算出ステップが算出した前記類似度に基づいて、コンテンツを選択させることができる。 In the process of the first storage step, attribute information of the content to which information indicating a predetermined group when the content is classified into a plurality of groups is also stored, and in the process of the selection step, the content of the content is stored. When the information indicating the group is added to the attribute information, the content corresponding to the information indicating the group is selected. When the information indicating the group is not added, the similarity calculated by the calculation step is set. based on, it is possible to select a content.

前記コンテンツは番組であり、前記グループは、連続ドラマ、コンテンツのジャンル、出演者、タイトルのいずれかでグループ化されるものとすることができる。 The content may be a program, and the group may be grouped by any one of a series drama, content genre, performer, and title .

前記重み付け情報生成ステップにより生成された前記属性情報の前記項目に対応する重み付け情報を記憶する第2の記憶ステップを更に含ませるようにすることができる。 A second storage step of storing weighting information corresponding to the item of the attribute information generated by the weighting information generation step can be further included.

前記ユーザのコンテンツについての操作履歴を蓄積する蓄積ステップをさらに含むようにすることができる。 An accumulating step of accumulating an operation history of the user content can be further included .

本発明の第2の側面のプログラムは、ユーザの嗜好に類似するコンテンツを選択する処理をコンピュータに実行させるためのプログラムであって、複数の項目で構成されている前記コンテンツの属性情報を記憶する第1の記憶ステップと、前記ユーザのコンテンツについての操作履歴から、前記ユーザが好むコンテンツの履歴である正履歴情報と前記ユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報を生成するユーザ履歴情報生成ステップと、前記コンテンツの属性情報並びに前記正履歴情報および前記負履歴情報は前記項目ごとにベクトル化され、前記コンテンツの属性情報と前記ユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和によって、前記第1の記憶ステップの処理により記憶された前記コンテンツの属性情報と、生成された前記ユーザ履歴情報との類似度算出する算出ステップと、算出された前記類似度に基づいて、コンテンツを選択する選択ステップと、前記算出ステップの処理で用いられる前記重み付け情報であって、所定期間の前記属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とし、前記標準嗜好ベクトルと、前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報として生成する重み付け情報生成ステップとを含み、前記算出ステップの処理は、前記コンテンツの属性情報と前記正履歴情報のベクトルのコサイン距離と前記正の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記負履歴情報のベクトルのコサイン距離と前記負の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出する処理をコンピュータに実行させる。 A program according to a second aspect of the present invention is a program for causing a computer to execute processing for selecting content similar to a user's preference, and stores attribute information of the content composed of a plurality of items. User history information consisting of first history step and positive history information which is a history of content preferred by the user and negative history information which is a history of content not preferred by the user from the operation history of the user's content. The user history information generation step, the content attribute information, the positive history information, and the negative history information are vectorized for each item, and the cosine distance and weight of the content attribute information and the user history information vector Calculate an inner product with information for each item, and calculate the inner product result for all the items. A calculation step of calculating a similarity between the attribute information of the content stored by the processing of the first storage step and the generated user history information by a sum obtained by adding to the calculated similarity A selection step for selecting content, and the weighting information used in the processing of the calculation step, and a standard preference vector indicating general viewer preference obtained by counting the attribute information for a predetermined period; Calculating the degree of positive contribution of each item when calculating the cosine distance to the vector of the positive history information for each item and calculating the reciprocal of the similarity between the attribute information and the positive history information. a positive weighting information defining calculates said standard preference vector, a cosine distance between the vector of the negative history information for each of the items, and vice versa The said in the case of calculating the similarity of attribute information and said negative history information, and a weighting information generating step of generating a negative weighting information defining the negative degree of contribution of each item, the calculation step The process calculates, for each item, an inner product of the cosine distance of the attribute information of the content and the vector of the positive history information and the positive weighting information, and the result of the inner product is added from all the items. The inner product of the cosine distance of the content attribute information and the negative history information vector and the negative weighting information is calculated for each item, and the result of the inner product is added to all the items. Due to the difference, the computer is caused to execute a process of calculating the similarity between the content attribute information and the user history information .

本発明の第2の側面においては、複数の項目で構成されているコンテンツの属性情報が記憶され、ユーザのコンテンツについての操作履歴から、ユーザが好むコンテンツの履歴である正履歴情報とユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報が生成され、コンテンツの属性情報並びに正履歴情報および負履歴情報は項目ごとにベクトル化され、コンテンツの属性情報とユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を項目ごとに算出して、その内積の結果を全ての項目について足した和によって、受信されたコンテンツの属性情報と、生成されたユーザ履歴情報との類似度が算出され、算出された類似度に基づいて、コンテンツが選択される。重み付け情報としては、所定期間の属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、正履歴情報のベクトルとのコサイン距離が項目ごとに算出され、その逆数が、属性情報と正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とされ、標準嗜好ベクトルと、負履歴情報のベクトルとのコサイン距離が項目ごとに算出され、その逆数が、属性情報と負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報とされる In the second aspect of the present invention, content attribute information composed of a plurality of items is stored, and from the operation history of the user's content, the correct history information that is the history of the user's preferred content and the user's preference. User history information consisting of negative history information, which is a history of no content, is generated, the attribute information of the content and the positive history information and the negative history information are vectorized for each item, and the vector of the content attribute information and the user history information The inner product of the cosine distance and the weighting information is calculated for each item, and the similarity between the attribute information of the received content and the generated user history information is obtained by adding the result of the inner product for all items. The content is selected based on the calculated similarity. As the weighting information, the cosine distance between the standard preference vector indicating the viewer's general preference obtained by counting the attribute information of a predetermined period and the vector of the normal history information is calculated for each item, and the reciprocal thereof is the attribute When calculating the degree of similarity between information and positive history information, this is positive weighting information that defines the degree of positive contribution of each item, and the cosine distance between the standard preference vector and the negative history information vector for each item The reciprocal number is negative weighting information that defines the degree of negative contribution of each item when calculating the similarity between the attribute information and the negative history information.

このように、本発明によれば、属性情報と、ユーザから取得された情報との類似度を算出することができ、特に、取得された属性情報と、ユーザから取得された情報との類似度を、所定の重み付け情報を用いて算出することができる。   As described above, according to the present invention, it is possible to calculate the similarity between the attribute information and the information acquired from the user, and in particular, the similarity between the acquired attribute information and the information acquired from the user. Can be calculated using predetermined weighting information.

また、他の本発明によれば、属性情報と、ユーザから取得された情報との類似度を算出することができ、特に、記憶されている属性情報と、ユーザから取得された情報との類似度を、所定の重み付け情報を用いて算出することができる。   According to another aspect of the present invention, the degree of similarity between attribute information and information acquired from a user can be calculated. In particular, the similarity between stored attribute information and information acquired from a user can be calculated. The degree can be calculated using predetermined weighting information.

以下、図を参照して、本発明の実施の形態について説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1を用いて、テレビジョン番組放送、およびストリームデータの配信について説明する。   A television program broadcast and stream data distribution will be described with reference to FIG.

放送局1は、地上波の番組放送を送信するか、もしくは、衛星2を介して衛星波の番組放送を送信する。図1においては、放送局1を1つだけ図示して説明しているが、放送局1が、複数存在することは言うまでもない。テレビジョン受信装置4のアンテナ3は、地上波、または衛星波の番組放送を受信する。放送信号には、必要に応じて、EPG(Electronic Program Guide)が含まれている。   The broadcast station 1 transmits a terrestrial program broadcast, or transmits a satellite wave program broadcast via the satellite 2. In FIG. 1, only one broadcasting station 1 is illustrated and described, but it goes without saying that there are a plurality of broadcasting stations 1. The antenna 3 of the television receiver 4 receives a terrestrial or satellite wave program broadcast. The broadcast signal includes an EPG (Electronic Program Guide) as necessary.

配信サーバ5は、ストリーミングデータデータベース6から、ストリーミングデータを読み出し、インターネットその他のネットワークを含むネットワーク8を介して、テレビジョン受信装置4に配信するとともに、メタデータデータベース7から、放送局1から放送される番組に関する情報であるEPG、あるいは、EPGよりも詳細な情報を含むメタデータを読み出して、番組ごとに、番組ベクトルPPを生成し、EPGデータとともに、ネットワーク8を介して、EPG受信装置9に配信する。   The distribution server 5 reads the streaming data from the streaming data database 6 and distributes the streaming data to the television receiver 4 via the network 8 including the Internet and other networks, and is broadcast from the broadcast station 1 from the metadata database 7. EPG, which is information related to the program to be read, or metadata including more detailed information than EPG is read out, and a program vector PP is generated for each program, and the EPG data is sent to the EPG receiver 9 via the network 8 together with the EPG data. To deliver.

一般的な放送信号に重畳されるEPGの情報量が、以下に説明する処理に十分な情報である場合、処理には、一般的な放送信号に重畳されるEPGと同一のものを利用するようにしても良い。また、一般的な放送信号に重畳されるEPGの情報量が、以下に説明する処理に十分な情報であるとはいえない場合、処理には、一般的な放送信号に重畳されるEPGに加えて、もしくは単独で、メタデータを利用するようにしても良い。以下、一般的な放送信号に重畳されるEPGでは、処理に十分な情報量がないため、本実施の形態では、メタデータを含む情報を利用するものとし、この情報を、EPGデータと総称するものとする。   When the information amount of the EPG superimposed on a general broadcast signal is sufficient information for the processing described below, the same EPG as that superimposed on the general broadcast signal is used for the processing. Anyway. In addition, when it cannot be said that the information amount of the EPG superimposed on the general broadcast signal is sufficient information for the processing described below, the processing includes the EPG superimposed on the general broadcast signal. Alternatively, the metadata may be used alone. Hereinafter, since an EPG superimposed on a general broadcast signal does not have a sufficient amount of information for processing, in this embodiment, information including metadata is used, and this information is collectively referred to as EPG data. Shall.

EPG受信装置9は、配信されたEPGデータを、テレビジョン受信装置4に供給する。また、EPG受信装置9は、EPGデータとともに配信された番組ベクトルPPを、番組推薦処理装置10に供給する。   The EPG receiver 9 supplies the distributed EPG data to the television receiver 4. Further, the EPG receiving device 9 supplies the program vector PP distributed together with the EPG data to the program recommendation processing device 10.

チューナを有するテレビジョン受信装置4は、操作部を有するテレビジョン表示装置11、または、録画再生装置12から供給されるチャンネルの選択を示す制御信号に基づいて、アンテナ3を介して、地上波、または衛星波の放送信号を選局して受信するとともに、ネットワーク8を介して、配信サーバ5から、ストリーミングデータの配信を受ける。また、テレビジョン受信装置4は、EPG受信装置9から、EPGデータの供給を受け、テレビジョン表示装置11、または、録画再生装置12に供給する。なお、テレビジョン受信装置4は、受信した放送波に、EPGが含まれていた場合、番組の信号と分離して、それぞれ、テレビジョン表示装置11、または、録画再生装置12に供給する。   The television receiver 4 having a tuner receives a terrestrial wave via an antenna 3 based on a control signal indicating channel selection supplied from a television display device 11 having an operation unit or a recording / playback device 12. Alternatively, a satellite wave broadcast signal is selected and received, and distribution of streaming data is received from the distribution server 5 via the network 8. Also, the television receiver 4 receives the EPG data from the EPG receiver 9 and supplies it to the television display device 11 or the recording / reproducing device 12. When the received broadcast wave includes an EPG, the television receiver 4 separates it from the program signal and supplies it to the television display device 11 or the recording / playback device 12, respectively.

番組推薦処理装置10は、EPG受信装置9から、番組ベクトルPPを取得するとともに、テレビジョン表示装置11および録画再生装置12から、操作ログを取得し、これらの情報、または、ユーザの操作入力を基に、ユーザの嗜好に合致した番組を推薦するための推薦情報を生成し、テレビジョン表示装置11および録画再生装置12に供給する。   The program recommendation processing device 10 acquires the program vector PP from the EPG receiving device 9, acquires operation logs from the television display device 11 and the recording / playback device 12, and receives this information or user operation input. Based on this, recommendation information for recommending a program that matches the user's preference is generated and supplied to the television display device 11 and the recording / playback device 12.

テレビジョン表示装置11は、ユーザの操作入力を基に、テレビジョン受信装置4から供給された放送信号、または、録画再生装置12から供給された再生信号を表示したり、番組推薦処理装置10から供給された推薦情報を基に、チャンネルを自動設定したり、推薦番組情報を表示する。テレビジョン表示装置11は、ユーザの操作履歴である操作ログを番組推薦処理装置10に供給する。   The television display device 11 displays a broadcast signal supplied from the television receiver 4 or a playback signal supplied from the recording / playback device 12 based on a user operation input, or from the program recommendation processing device 10. Based on the supplied recommendation information, the channel is automatically set and recommended program information is displayed. The television display device 11 supplies an operation log, which is a user operation history, to the program recommendation processing device 10.

録画再生装置12は、ユーザの操作入力を基に、テレビジョン受信装置4から供給された放送信号を、装着された記録媒体、または、内蔵する記録媒体(例えば、ハードディスク)に録画したり、番組推薦処理装置10から供給された推薦情報を基に、テレビジョン受信装置4から供給された放送信号を、装着された記録媒体、または、内蔵する記録媒体に自動録画する。また、録画再生装置12は、装着された記録媒体、または、内蔵する記録媒体に録画されている番組を再生し、テレビジョン表示装置11に出力して表示させる。更に、録画再生装置12は、ユーザの操作履歴である操作ログを番組推薦処理装置10に供給する。   The recording / playback device 12 records a broadcast signal supplied from the television receiver 4 on an attached recording medium or a built-in recording medium (for example, a hard disk) or a program based on a user operation input. Based on the recommendation information supplied from the recommendation processing device 10, the broadcast signal supplied from the television receiver 4 is automatically recorded on the attached recording medium or a built-in recording medium. In addition, the recording / reproducing apparatus 12 reproduces a program recorded on the attached recording medium or a built-in recording medium, and outputs and displays the program on the television display apparatus 11. Furthermore, the recording / playback apparatus 12 supplies an operation log, which is a user operation history, to the program recommendation processing apparatus 10.

ここでは、EPG受信装置9、テレビジョン受信装置4、番組推薦処理装置10、テレビジョン表示装置11、および、録画再生装置12を、それぞれ異なる装置として説明したが、これらの装置は、個別に構成されなくてもよい。例えば、EPG受信装置9、テレビジョン受信装置4、および、テレビジョン表示装置11を、チューナ機能を内蔵したテレビジョン受像機15−1として、一体的に構成するようにしても良いことは、言うまでもない。更に、録画再生装置12も一体的に構成して、録画機能を有するテレビジョン受像機15−2として構成するようにしても良い。この録画再生装置12は、記録媒体として、大容量のハードディスクを有する、いわゆるハードディスクレコーダであってもよいことは言うまでもない。また、番組推薦処理装置10を、チューナ機能を内蔵したテレビジョン受像機15−1に内蔵して、テレビジョン受像機15−3としても、または、録画機能を有するテレビジョン受像機15−2に内蔵して、テレビジョン受像機15−4とするようにしても良い。   Here, the EPG reception device 9, the television reception device 4, the program recommendation processing device 10, the television display device 11, and the recording / playback device 12 have been described as different devices, but these devices are individually configured. It does not have to be done. For example, it goes without saying that the EPG receiving device 9, the television receiving device 4, and the television display device 11 may be integrally configured as a television receiver 15-1 having a built-in tuner function. Yes. Further, the recording / reproducing apparatus 12 may be integrally configured as a television receiver 15-2 having a recording function. Needless to say, the recording / reproducing apparatus 12 may be a so-called hard disk recorder having a large-capacity hard disk as a recording medium. Further, the program recommendation processing device 10 is incorporated in a television receiver 15-1 having a tuner function, and may be used as the television receiver 15-3 or in the television receiver 15-2 having a recording function. It may be built in and used as the television receiver 15-4.

図2は、配信サーバ5の構成を示すブロック図である。   FIG. 2 is a block diagram showing the configuration of the distribution server 5.

データ取得部21は、メタデータデータベース7およびストリーミングデータデータベース6からデータを取得し、データ送信部25に供給するとともに、EPGデータを、メタデータ抽出部22に供給する。また、データ取得部21は、メタデータデータベース7に登録されているEPGデータを、その内容により、グループ化する処理を実行する。   The data acquisition unit 21 acquires data from the metadata database 7 and the streaming data database 6, supplies the data to the data transmission unit 25, and supplies EPG data to the metadata extraction unit 22. In addition, the data acquisition unit 21 performs processing for grouping the EPG data registered in the metadata database 7 according to the content thereof.

メタデータ抽出部22は、データ取得部21から供給されたEPGデータから、番組ベクトルPPを生成するために必要なデータを抽出し、番組ベクトル生成部23に供給する。番組ベクトル生成部23は、メタデータを基に、番組ベクトルPPを生成し、必要に応じて、データ記憶部24に記憶されている番組側効き目ベクトルEfPPを対応付けて、データ送信部25に供給する。   The metadata extraction unit 22 extracts data necessary for generating the program vector PP from the EPG data supplied from the data acquisition unit 21 and supplies the data to the program vector generation unit 23. The program vector generation unit 23 generates a program vector PP based on the metadata, associates the program-side effect vector EfPP stored in the data storage unit 24 with the data, and supplies it to the data transmission unit 25 as necessary. To do.

データ記憶部24は、番組ベクトルPPを生成する場合に必要な情報である番組側効き目ベクトルEfPPを、必要に応じて記憶する。   The data storage unit 24 stores the program side effect vector EfPP, which is information necessary for generating the program vector PP, as necessary.

いかに視聴率を稼ぐかという制作側、放送側の観点に基づいて、例えば、教養系番組においては、ジャンルや内容の要素が強いという特性、バラエティ番組などにおいては、出演者の要素が強いという特性、ドラマなどにおいては、出演者および脚本家の要素が強いという特性がある。番組の特徴を正しく抽出するためには、これらの特性を利用する必要がある。すなわち、番組ベクトルPPを構成する要素のうち、ユーザの嗜好に合致した番組を推薦するために実行されるマッチング処理において、どの要素が重要であるかは、番組のジャンルによって異なる。   Based on the viewpoint of the production side and the broadcast side on how to earn the audience rating, for example, the characteristic that the element of genre and content is strong in the educational program, and the characteristic that the element of the performer is strong in the variety program etc. In drama, etc., there is a characteristic that the elements of performers and screenwriters are strong. In order to correctly extract program characteristics, it is necessary to use these characteristics. That is, of the elements constituting the program vector PP, which element is important in the matching process executed to recommend a program that matches the user's preference differs depending on the genre of the program.

すなわち、番組のジャンルが「教養・ドキュメント」である場合、重要な項目は、出演者ではなく、その内容や題名である。これに対して、番組のジャンルが「バラエティ」のとき、重要な項目は出演者であり、番組のジャンルが「ドラマ」であるとき、重要な項目は、出演者と脚本家である。これらを番組ベクトルPPの生成に利用する場合、番組のジャンル別に、項目ごとの、マッチング処理における寄与の度合いを規定する番組側効き目ベクトルが設定され、データ記憶部24に記憶される。   That is, when the genre of the program is “Liberal Arts / Documents”, the important item is not the performer but the contents and title. On the other hand, when the program genre is “variety”, the important item is a performer, and when the program genre is “drama”, the important items are a performer and a screenwriter. When these are used to generate the program vector PP, a program-side effect vector that defines the degree of contribution in the matching process for each item is set for each genre of the program and stored in the data storage unit 24.

データ送信部25は、データ取得部21から供給された、EPGデータおよびストリーミングデータ、並びに、番組ベクトル生成部23から供給された番組ベクトルPP、および、番組側効き目ベクトルEfPPを、ネットワーク8を介して、EPG受信装置9、または、テレビジョン受信装置4に送信する。   The data transmission unit 25 receives the EPG data and streaming data supplied from the data acquisition unit 21, and the program vector PP and the program side effect vector EfPP supplied from the program vector generation unit 23 via the network 8. , And transmitted to the EPG receiver 9 or the television receiver 4.

また、番組ベクトル生成部23には、必要に応じて、ドライブ26が接続される。ドライブ26には、必要に応じて、磁気ディスク31、光ディスク32、光磁気ディスク33、および半導体メモリ34が装着され、データの授受を行う。   In addition, a drive 26 is connected to the program vector generation unit 23 as necessary. A magnetic disk 31, an optical disk 32, a magneto-optical disk 33, and a semiconductor memory 34 are mounted on the drive 26 as necessary to exchange data.

次に、図3のフローチャートを参照して、配信サーバ5が実行する番組ベクトル生成処理1について説明する。   Next, the program vector generation process 1 executed by the distribution server 5 will be described with reference to the flowchart of FIG.

ステップS1において、データ取得部21は、メタデータデータベース7から、メタデータで構成されているEPGデータの供給を受ける。   In step S <b> 1, the data acquisition unit 21 receives supply of EPG data composed of metadata from the metadata database 7.

ステップS2において、メタデータ抽出部22は、データ取得部21からEPGデータの供給を受け、番組ベクトルPPを生成するために必要なメタデータを抽出し、番組ベクトル生成部23に出力する。   In step S <b> 2, the metadata extraction unit 22 receives supply of EPG data from the data acquisition unit 21, extracts metadata necessary for generating the program vector PP, and outputs the metadata to the program vector generation unit 23.

図4に、メタデータの例を示す。メタデータには、例えば、ジャンルとして「映画−邦画」、映画の題名として「東海道三谷怪談」、放送された年月日および配給元のデータ、放送の日時、放送する放送局名、並びに、放送時刻などが含まれている。更に、メタデータには、監督名、脚本家名、撮影者(カメラマン)、音楽担当者、出演者などのデータ、および、この番組の内容として、映画の解説などが含まれている。   FIG. 4 shows an example of metadata. The metadata includes, for example, “movie-Japanese movie” as the genre, “Tokaido Mitani Kaidan” as the title of the movie, date of broadcasting and distribution source data, date and time of broadcasting, name of broadcasting station, and broadcasting The time is included. Further, the metadata includes data such as a director name, a screenwriter name, a photographer (cameraman), a music representative, a performer, etc., and a description of a movie as the contents of the program.

ステップS3において、番組ベクトル生成部23は、メタデータに含まれている、タイトル、内容などを、必要に応じて形態素解析し、単語に分解する。具体的には、番組ベクトル生成部23は、メタデータに含まれている映画の題名をタイトルとして、「東海道」、「三谷」、「怪談」の3つの単語に分解する。また、番組ベクトル生成部23は、メタデータに、映画の解説として、図4に示されるように、「'59西宝 様式美たっぷりに有名な“三谷怪談”の世界を描く邦画ホラーの傑作。」という情報が含まれていた場合、解説に含まれている単語を抽出して、「西宝」、「様式」、「美」、「たっぷり」、「有名」、「三谷」、「怪談」、「世界」、「描く」、「邦画」、「ホラー」、「傑作」を内容情報とする。   In step S3, the program vector generation unit 23 performs morphological analysis on titles, contents, and the like included in the metadata as necessary, and breaks them down into words. Specifically, the program vector generation unit 23 uses the title of the movie included in the metadata as a title and breaks it down into three words “Tokaido”, “Mitani”, and “Kaidan”. In addition, the program vector generation unit 23 is a masterpiece of a Japanese movie horror that describes the world of “Mitsuya Kaidan”, which is famous for its '59 Seiho style beauty, as shown in FIG. ”Is extracted, the words included in the commentary are extracted and“ Seiho ”,“ Style ”,“ Beauty ”,“ Plenty ”,“ Famous ”,“ Mitani ”,“ Kaidan ” , “World”, “Draw”, “Japanese Film”, “Horror”, “Masterpiece” are the content information.

ステップS4において、番組ベクトル生成部23は、メタデータに含まれているそれぞれの項目をベクトル化し、番組ベクトルPPが生成されて、処理が終了される。生成された番組ベクトルPPは、データ送信部25に出力されて、ネットワーク8を介して、EPG受信装置9に送信される。項目のベクトル化は、全ての詳細要素を1列として並べるようにしても良いし、大項目に分離した後に、大項目ごとにベクトル化するようにしても良い。   In step S4, the program vector generation unit 23 vectorizes each item included in the metadata, generates a program vector PP, and the process ends. The generated program vector PP is output to the data transmitter 25 and transmitted to the EPG receiver 9 via the network 8. The item vectorization may be such that all the detailed elements are arranged in one column, or may be vectorized for each major item after being separated into major items.

大項目別にベクトル化が行われる場合、例えば、図5に示されるように、大項目を、タイトル、ジャンル、時間帯、放送局、出演者、脚本/原作/演出、内容の7項目として、番組ベクトルPP=(Tm,Gm,Pm,Am,Km)が生成される。そして、各項目の内容が、タイトル(Title)Tm={title1,title2,・・・}、ジャンル(Genre)Gm={ドラマ,バラエティ,スポーツ,映画,音楽,子供向け/教育,教養/ドキュメント,ニュース/報道,その他}、時間帯(Hour)Hm={朝,昼,夕方,ゴールデン,深夜}、放送局(TV Station) Sm={NNK総合,NNK教育,亜細亜テレビ,TTS,ブジ,テレ日,東都,NNK衛星第1,NNK衛星第2,WOWO}、出演者(Person)Pm={person A,person B,・・・}脚本/原作/演出等(Author)Am={person a,person b,・・・}内容(Keyword)Km={kw1,kw2,・・・}として、ベクトル化される。   When vectorization is performed for each major item, for example, as shown in FIG. 5, the major item is divided into seven items: title, genre, time zone, broadcast station, performer, screenplay / original / production, and content. The vector PP = (Tm, Gm, Pm, Am, Km) is generated. The contents of each item are title Tm = {title1, title2,...}, Genre (Genre) Gm = {drama, variety, sports, movie, music, children / education, education / documents, News / News, Other}, Hour Hm = {Morning, Noon, Evening, Golden, Late Night}, Broadcasting Station (TV Station) Sm = {NNK General, NNK Education, Asia TV, TTS, Buji, Tele-day , Higashi, NNK Satellite 1, NNK Satellite 2, WOWO}, Performer (Person) Pm = {person A, person B, ...} Screenplay / Original / Director, etc. (Author) Am = {person a, person b,...} Contents (Keyword) Km = {kw1, kw2,.

上述した7つの大項目の中で、大項目「ジャンル」、「放送局」、「時間帯」は、種類が固定できるため、詳細要素をそれぞれ数値ベクトルで表すことができる。放送局の場合、例えば、放送局Sm={NNK総合,NNK教育,亜細亜テレビ,TTS,ブジ,テレ日,東都,NNK衛星第1,NNK衛星第2,WOWO}において、対応する番組の放送局がWOWOである場合、放送局ベクトルは、放送局Sm={0,0,0,0,0,0,0,0,0,1}で表すことができる。ジャンルの場合、例えば、ジャンルGm={ドラマ,バラエティ,スポーツ,映画,音楽,子供向け/教育,教養/ドキュメント,ニュース/報道,その他}において、対応する番組のジャンルが、教養/ドキュメントであった場合、ジャンルベクトルは、ジャンルGm={0,0,0,0,0,0,1,0,0}で表すことができる。   Among the seven major items described above, the major items “genre”, “broadcasting station”, and “time zone” can be fixed in type, so that detailed elements can be represented by numerical vectors. In the case of a broadcasting station, for example, in the broadcasting station Sm = {NNK General, NNK Education, Asia TV, TTS, Buji, Tele-day, East Tokyo, NNK Satellite 1, NNK Satellite 2, WOWO} Is WOWO, the broadcast station vector can be represented by broadcast station Sm = {0, 0, 0, 0, 0, 0, 0, 0, 0, 1}. In the case of a genre, for example, in the genre Gm = {drama, variety, sport, movie, music, for children / education, education / documents, news / reports, etc.}, the corresponding program genre was education / documents. In this case, the genre vector can be represented by genre Gm = {0, 0, 0, 0, 0, 0, 1, 0, 0}.

一方、大項目「タイトル」、「出演者」、「脚本/原作/演出」、「内容」などの、数値ベクトルで表すことのできない項目においては、ベクトルに含まれる単語の頻度などによって、項目値(単語)と重み(数値)が対応付けられる。例えば、大項目「タイトル」は、タイトルTm={東海道−1,三谷−1,怪談−1}のように、それぞれ、単語−数値で構成される要素によって表される。この例における、例えば、「東海道−1」は、「東海道」の単語の頻度が「1であることを意味する。   On the other hand, for items that cannot be represented by numeric vectors, such as the major items “title”, “performer”, “screenplay / original / production”, “content”, the item value depends on the frequency of words contained in the vector. (Word) and weight (numerical value) are associated with each other. For example, the major item “title” is represented by elements each composed of a word and a numerical value, such as title Tm = {Tokaido-1, Mitani-1, Kaidan-1}. For example, “Tokaido-1” in this example means that the frequency of the word “Tokaido” is “1”.

このような処理により、番組ベクトルPPが生成されて、EPG受信装置9に送信される。具体的には、図4を用いて説明した番組メタデータから番組ベクトルPPが生成された場合、番組ベクトルPP={タイトルTm={東海道−1,三谷−1,怪談−1}、ジャンルGm={0,0,0,1,0,0,0,0,0}、時間帯Hm={0,0,0,0,1}、放送局Sm={0,0,0,0,0,0,0,0,0,1}、出演者Pm={若杉嘉津美−1,天海茂−1,江見俊彦−1,中村竜二郎−1,西沢典子−1}、脚本/原作/演出Am={中川信男−1,大貫正一−1,石田義寛−1,西本正二−1,渡辺宙太−1}、内容Km={西宝−1,様式−1,美−1,たっぷり−1,有名−1,三谷−1,怪談−1,世界−1,描く−1,邦画−1,ホラー−1,傑作−1}}が生成されて、EPG受信装置9に送信される。   Through such processing, a program vector PP is generated and transmitted to the EPG receiving device 9. Specifically, when the program vector PP is generated from the program metadata described with reference to FIG. 4, the program vector PP = {title Tm = {Tokaido-1, Mitani-1, Kaidan-1}, genre Gm = {0,0,0,1,0,0,0,0,0}, time zone Hm = {0,0,0,0,1}, broadcast station Sm = {0,0,0,0,0 , 0, 0, 0, 0, 1}, performer Pm = {Katsumi Wakasugi-1, Shigeru Amami-1, Toshihiko Emi-1, Ryujiro Nakamura-1, Noriko Nishizawa}, Screenplay / Original / Director Am = {Nobuo Nakagawa-1, Masakazu Onuki-1, Yoshihiro Ishida-1, Shoji Nishimoto-1, Sota Watanabe-1}, Content Km = {Nishiho-1, Style-1, Beauty-1, Plenty-1, Famous-1, Mitani-1, Kaidan-1, World-1, Draw-1, Japanese-style-1, Horror-1, Masterpiece-1}} are generated and transmitted to the EPG receiver 9.

このように生成される番組ベクトルPPにおいて、例えば、出演者Pmの構成要素のうち、主演を重み付けしたり、脚本/原作/演出Amの構成要素のうち、監督を重み付けして、番組ベクトルPPを生成するようにしても良い。このような場合、番組ベクトルPPの構成要素は、例えば、出演者Pm={若杉嘉津美−3,天海茂−2,江見俊彦−1,中村竜二郎−1,西沢典子−1}、脚本/原作/演出Am={中川信男−3,大貫正一−1,石田義寛−1,西本正二−1,渡辺宙太−1}となる。   In the program vector PP generated in this way, for example, the starring is weighted out of the constituent elements of the performer Pm, or the director is weighted out of the constituent elements of the script / original / production Am, and the program vector PP is You may make it produce | generate. In such a case, the constituent elements of the program vector PP are, for example, performers Pm = {Katsumi Wakasugi-3, Shigeru Amami-2, Toshihiko Emi-1, Ryujiro Nakamura-1, Noriko Nishizawa-1}, Screenplay / Original / Production Am = {Nobuo Nakagawa-3, Shoichi Onuki-1, Yoshihiro Ishida-1, Shoji Nishimoto-1, Sota Watanabe-1}.

また、番組ベクトルPPを生成するために、どの要素が重要であるかは、上述したように、番組のジャンルによって異なる。ジャンルごとにどのような要素が重要であるかを示した番組側効き目ベクトルEfPPが、番組側効き目ベクトル情報として、データ記憶部24に記憶されている場合、番組側効き目ベクトルEfPPを、番組ベクトルPPに対応付けて送信するようにしても良い。番組側効き目ベクトルEfPPは、番組ベクトルPPの大項目に対応して設定される。   In addition, as described above, which element is important for generating the program vector PP depends on the genre of the program. When the program side effect vector EfPP indicating what elements are important for each genre is stored in the data storage unit 24 as program side effect vector information, the program side effect vector EfPP is converted into the program vector PP. You may make it transmit in response to. The program side effect vector EfPP is set corresponding to the major items of the program vector PP.

番組ベクトルPP={タイトルTm,ジャンルGm,時間帯Hm,放送局Sm,出演者Pm,脚本/原作/演出Am,内容Km}において、例えば、番組のジャンルが「教養/ドキュメント」である場合、重要な項目は、その内容や題名(重み付け値が3の場合)であるので、番組側効き目ベクトルEfPP={3,1,1,1,1,1,3}となる。これに対して、番組のジャンルが「バラエティ」のとき、重要な項目は出演者(重み付け値が5の場合)であるので、番組側効き目ベクトルEfPP={1,1,1,1,5,1,1}となる。また、番組のジャンルが「ドラマ」であるとき、重要な項目は、出演者(重み付け値が2の場合)と脚本家であり、特に脚本家が重要(重み付け値が3の場合)である場合、番組側効き目ベクトルEfPP={1,1,1,1,2,3,1}となる。   In the case of the program vector PP = {title Tm, genre Gm, time zone Hm, broadcast station Sm, performer Pm, screenplay / original / production Am, content Km}, for example, if the genre of the program is “Education / Document”, Since the important items are the contents and title (when the weighting value is 3), the program side effect vector EfPP = {3, 1, 1, 1, 1, 1, 3}. On the other hand, when the genre of the program is “variety”, the important item is the performer (when the weighting value is 5), so the program side effect vector EfPP = {1, 1, 1, 1, 5, 1,1}. Also, when the program genre is “drama”, the important items are the performer (when the weighting value is 2) and the screenwriter, especially when the screenwriter is important (when the weighting value is 3). The program side effect vector EfPP = {1, 1, 1, 1, 2, 3, 1}.

次に、図6のフローチャートを参照して、番組側効き目ベクトルEfPPが、番組ベクトルPPに対応付けて送信される場合の、番組ベクトル生成処理2について説明する。   Next, the program vector generation process 2 when the program side effect vector EfPP is transmitted in association with the program vector PP will be described with reference to the flowchart of FIG.

ステップS11乃至ステップS14において、図3を用いて説明したステップS1乃至ステップS4の処理と同様の処理が実行される。すなわち、メタデータデータベース7から、EPGデータの供給を受け、EPGデータから、番組ベクトルPPを生成するために必要なメタデータが抽出され、メタデータに含まれている、タイトル、内容などが、必要に応じて形態素解析されて、単語に分解される。そして、メタデータに含まれているそれぞれの項目がベクトル化されて、番組ベクトルPPが生成される。   In steps S11 to S14, processing similar to the processing in steps S1 to S4 described with reference to FIG. 3 is executed. That is, EPG data is supplied from the metadata database 7, metadata necessary for generating the program vector PP is extracted from the EPG data, and the title, content, etc. included in the metadata are necessary. Morphological analysis is performed according to Then, each item included in the metadata is vectorized to generate a program vector PP.

ステップS15において、番組ベクトル生成部23は、供給されたメタデータの番組のジャンルに基づいて、対応する効き目ベクトルを、データ記憶部24に記憶されている効き目ベクトル情報から抽出する。例えば、番組のジャンルが「バラエティ」のとき、データ記憶部24から、出演者に対する重み付けを行う効き目ベクトルEfPP={1,1,1,1,5,1,1}が抽出される。   In step S <b> 15, the program vector generation unit 23 extracts the corresponding effect vector from the effect vector information stored in the data storage unit 24 based on the genre of the supplied metadata program. For example, when the genre of the program is “variety”, an effect vector EfPP = {1, 1, 1, 1, 5, 1, 1} for weighting performers is extracted from the data storage unit 24.

ステップS16において、番組ベクトル生成部23は、ステップS15において抽出された効き目ベクトルEfPPを、ステップS14において生成された番組ベクトルPPと対応付けて、処理が終了される。   In step S16, the program vector generation unit 23 associates the effect vector EfPP extracted in step S15 with the program vector PP generated in step S14, and the process ends.

このような処理により、番組ベクトルPPが生成されて、番組のジャンルに基づいて、重要な項目に重み付けを施すための番組側効き目ベクトルEfPPが対応付けられて、ネットワーク8を介して、EPG受信装置9に送信される。   By such processing, a program vector PP is generated, and a program-side effect vector EfPP for weighting important items is associated with the EPG receiving apparatus via the network 8 based on the genre of the program. 9 is transmitted.

以上説明したようにして、番組ベクトルPPが生成されるが、例えば、番組をその属性ごとにグループ化することにより、番組ベクトルPPを、少ない演算量で、正確に作成するようにすることができる。   As described above, the program vector PP is generated. For example, the program vector PP can be accurately created with a small amount of calculation by grouping the programs by their attributes. .

番組のグループ化は、例えば、連続ドラマ、1週単位の同一ジャンルの番組群、番組編成単位(13週)の出演者ごとの番組群などで生成できるが、その具体例として、次の図7のフローチャートを参照して、連続ドラマをグループ化する場合のグループ化処理1について説明する。   The program grouping can be generated by, for example, a continuous drama, a program group of the same genre in a week unit, a program group for each performer in a program organization unit (13 weeks), etc. As a specific example, the following FIG. The grouping process 1 in the case of grouping serial dramas will be described with reference to the flowchart of FIG.

ステップS31において、データ取得部21は、メタデータデータベース7に登録されているEPGデータから、例えば、同一タイトル、同一放送局で、放送時刻が平日の同時刻や、同じ曜日の同時刻であるなどの所定の条件(グループ化のための条件)に合致した番組を抽出する。   In step S31, the data acquisition unit 21 determines from the EPG data registered in the metadata database 7 that the broadcast time is the same time on weekdays or the same time on the same day of the week with the same title and the same broadcast station, for example. The programs that match the predetermined conditions (grouping conditions) are extracted.

ステップS32において、データ取得部21は、抽出された番組をグループ化し、対応する番組のEPGデータにグループIDをつける。   In step S32, the data acquisition unit 21 groups the extracted programs and attaches a group ID to the EPG data of the corresponding program.

ステップS33において、メタデータ抽出部22は、同一グループIDを有する、すなわち、連続ドラマであると認識された番組の第1回目の放送の番組ベクトル生成に必要なメタデータを抽出する。   In step S33, the metadata extraction unit 22 extracts metadata necessary for generating a program vector of the first broadcast of a program having the same group ID, that is, a program recognized as a continuous drama.

ステップS34において、図3または図6を用いて説明した番組ベクトル生成処理が実行される。   In step S34, the program vector generation process described with reference to FIG. 3 or FIG. 6 is executed.

ステップS35において、番組ベクトル生成部23は、対応するグループIDの番組ベクトルPPを、第1回の放送分の番組ベクトルに固定して設定し、処理が終了される。   In step S35, the program vector generation unit 23 sets the program vector PP of the corresponding group ID fixed to the program vector for the first broadcast, and the process ends.

このような処理により、連続ドラマがグループ化されて、番組ベクトルが統一される。また、グループIDと番組ベクトルPPとを、対応付けて、データ記憶部24に記憶しておくようにしても良い。   By such processing, continuous dramas are grouped and program vectors are unified. Further, the group ID and the program vector PP may be associated with each other and stored in the data storage unit 24.

特に、連続ドラマのEPGデータにおいて、初回の内容は、番組全体の解説になっているが、初回以外の内容は、その回の分の解説となっていることが多く、番組全体の内容を表してはいない。また、内容以外の部分のメタデータは毎回ほぼ同じであることから、初回分のEPGデータを採用して番組ベクトルPPを生成することにより、番組ベクトル生成処理の処理回数を減少することができるのみならず、より正確に番組の特性と合致した番組ベクトルPPを生成することが可能になる。   In particular, in the EPG data of serial dramas, the initial contents are commentary for the entire program, but the contents other than the first time are often commentary for that time, representing the contents of the entire program. Not. Further, since the metadata other than the contents is almost the same every time, the number of times of the program vector generation process can be reduced only by generating the program vector PP by adopting the EPG data for the first time. Instead, it is possible to generate the program vector PP that more accurately matches the program characteristics.

図7においては、連続ドラマのEPGデータに同一のIDを付加する処理について説明したが、EPGデータに、連続ドラマを区別する情報が予め含まれている場合、ステップS31の処理を省略して、EPGデータに含まれている連続ドラマを区別する情報を参照して、連続ドラマのEPGに同一のIDを付加するようにしても良い。   In FIG. 7, the process of adding the same ID to the EPG data of the continuous drama has been described. However, when the EPG data includes information for distinguishing the continuous drama in advance, the process of step S31 is omitted. The same ID may be added to the EPG of the continuous drama with reference to information for distinguishing the continuous drama included in the EPG data.

次に、図8のフローチャートを参照して、連続ドラマ以外の要素によってもグループ化を行うことができるグループ化処理2について説明する。ここでは、ジャンルおよび出演者によるグループ化を行うものとして説明する。   Next, with reference to the flowchart of FIG. 8, the grouping process 2 which can group by elements other than a continuous drama is demonstrated. Here, it demonstrates as what performs grouping by a genre and a performer.

ステップS51において、データ取得部21は、メタデータデータベース7に登録されているEPGデータを参照して、番組のEPGデータに、メタデータの内容に対応したクラスタコードを付加する。   In step S51, the data acquisition unit 21 refers to the EPG data registered in the metadata database 7 and adds a cluster code corresponding to the content of the metadata to the EPG data of the program.

例えば、同一タイトル、同一放送局で、放送時刻が平日の同時刻や、同じ曜日の同時刻であるなどの、連続ドラマである条件に合致した番組を抽出し、抽出された、連続ドラマであると認識される番組群の中で、例えば、連続ドラマの放送時刻によって、平日の同時刻であればコード1、同じ曜日の同時刻であればコード2、隔週、隔日など、コード1およびコード2以外の放送時刻であればコード3などの、最小桁の第1のクラスタコードが決定される。連続ドラマでない場合、最小桁の第1のクラスタコードは0となる。   For example, a program that matches the conditions for a continuous drama, such as the same title and the same broadcasting station, and the broadcast time is the same time on weekdays or the same day of the week, is extracted, and is a continuous drama. In the program group recognized as, for example, according to the broadcast time of the continuous drama, code 1 if the same time on weekdays, code 2 if the same time on the same day of the week, code 1 and code 2 such as biweekly, every other day, etc. If the broadcast time is other than the first, the first cluster code of the smallest digit such as code 3 is determined. If it is not a continuous drama, the first cluster code of the minimum digit is 0.

次に、メタデータデータベース7に登録されているメタデータのジャンルに関するデータを参照して、そのジャンルごとに、例えば、コード20、コード30などの、下位から2桁目(10の位)に数値を有する第2のクラスタコードが決定される。   Next, by referring to the data related to the genre of metadata registered in the metadata database 7, for each genre, for example, a numerical value in the second digit (10th digit) from the lower order such as code 20 and code 30 A second cluster code having is determined.

最後に、メタデータデータベース7に登録されているメタデータの出演者のデータを参照して、例えば、コード2300、コード800など、下位から2桁目以上(100以上の位)を用いて表される第3のクラスタコードが決定される。   Finally, referring to the data of the performers of the metadata registered in the metadata database 7, for example, the code 2300, the code 800, etc. are represented using the second digit or more (100 or more) from the lower order. A third cluster code is determined.

そして、第1乃至第3のクラスタコードの合計値が、その番組のEPGに付加されるクラスタコードとなる。   The total value of the first to third cluster codes becomes the cluster code added to the EPG of the program.

ステップS52において、データ取得部21は、クラスタコードの1桁目が0であるか否かを基に、対応するEPGは、連続ドラマのものであるか否かを判断する。   In step S52, the data acquisition unit 21 determines whether the corresponding EPG is that of a continuous drama based on whether the first digit of the cluster code is 0 or not.

ステップS52において、連続ドラマであると判断された場合、ステップS53およびステップS54において、図7のステップS33およびステップS34と同様の処理が実行される。すなわち、第1回目の放送のEPGが抽出されて、図3または図6を用いて説明した番組ベクトル生成処理が実行される。   If it is determined in step S52 that the drama is a continuous drama, the same processing as in steps S33 and S34 of FIG. 7 is executed in steps S53 and S54. That is, the EPG of the first broadcast is extracted, and the program vector generation process described with reference to FIG. 3 or FIG. 6 is executed.

ステップS55において、番組ベクトル生成部23は、この連続ドラマの番組ベクトルPPを、第1回の放送分の番組ベクトルPPに固定して設定し、番組ベクトルPPに、生成したクラスタコードを対応付けて設定し、処理が終了される。   In step S55, the program vector generation unit 23 sets the program vector PP of this continuous drama fixed to the program vector PP for the first broadcast, and associates the generated cluster code with the program vector PP. The setting is completed.

ステップS52において、連続ドラマではないと判断された場合、ステップS56において、図3または図6を用いて説明した番組ベクトル生成処理が実行される。   If it is determined in step S52 that the drama is not a continuous drama, the program vector generation process described with reference to FIG. 3 or FIG. 6 is executed in step S56.

ステップS57において、番組ベクトル生成部23は、番組ベクトルPPに生成したクラスタコードを対応付けて、処理が終了される。   In step S57, the program vector generation unit 23 associates the generated cluster code with the program vector PP, and the process ends.

このような処理により、連続ドラマ以外であっても、ジャンルや出演者によって番組ベクトルPPをグループ化することが可能となり、グループを示すクラスタコードと、番組ベクトルPPとを対応付けることができる。   By such a process, even if it is not a continuous drama, the program vectors PP can be grouped by genre or performer, and the cluster code indicating the group can be associated with the program vector PP.

図2を用いて説明した配信サーバ5において、図3乃至図8を用いて説明したようにして番組ベクトルPPが生成されるので、常に新しい用語やジャンルなどに対応した番組ベクトルPPを生成することが可能となる。生成された番組ベクトルPPは、EPGデータとともに、ネットワーク8を介して、EPG受信装置9に受信され、番組推薦処理装置10に供給される。   Since the distribution server 5 described with reference to FIG. 2 generates the program vector PP as described with reference to FIGS. 3 to 8, the program vector PP always corresponding to a new term or genre is generated. Is possible. The generated program vector PP is received together with the EPG data by the EPG receiving device 9 via the network 8 and supplied to the program recommendation processing device 10.

また、グループ化処理は、タイトルを形態素解析して、単語に分解し、単語ごとにグループIDを付けることにより行うようにしてもよい。   In addition, the grouping process may be performed by performing morphological analysis on titles, decomposing them into words, and attaching a group ID to each word.

次に、図9のフローチャートを参照して、タイトルグループ化処理1について説明する。   Next, the title grouping process 1 will be described with reference to the flowchart of FIG.

ステップS61において、データ取得部21は、メタデータデータベース7に登録されているEPGデータを参照して、登録されているメタデータから、タイトルを抽出し、番組ベクトル生成部23に供給する。   In step S <b> 61, the data acquisition unit 21 refers to the EPG data registered in the metadata database 7, extracts a title from the registered metadata, and supplies the title to the program vector generation unit 23.

ステップS62において、番組ベクトル生成部23は、タイトルを形態素解析し、単語に分解する。具体的には、メタデータに含まれている映画の題名が「東海道三谷怪談」であった場合、これがタイトルとして形態素解析されるので、「東海道」、「三谷」、「怪談」の3つの単語が得られる。   In step S62, the program vector generation unit 23 performs morphological analysis on the title and breaks it down into words. Specifically, if the title of the movie included in the metadata is “Tokaido Mitani Kaidan”, it will be morphologically analyzed as a title, so the three words “Tokaido”, “Mitani”, and “Kaidan” Is obtained.

ステップS63において、番組ベクトル生成部23は、解析された単語、もしくは、複数の単語から構成される単語群のうちのいずれかを抽出して、データ記憶部24から、抽出された単語、または単語群に対応するグループIDを抽出する。   In step S63, the program vector generation unit 23 extracts either the analyzed word or a word group composed of a plurality of words, and extracts the extracted word or word from the data storage unit 24. A group ID corresponding to the group is extracted.

ここで、複数の単語から構成される単語群とは、形態素解析により得られた単語の組み合わせにより生成される単語群であり、例えば、形態素解析により得られた単語が「東海道」、「三谷」、「怪談」である場合、単語群は、「東海道・三谷」、「東海道・怪談」、「三谷・怪談」となる。   Here, the word group composed of a plurality of words is a word group generated by a combination of words obtained by morphological analysis. For example, words obtained by morphological analysis are “Tokaido” and “Mitani”. , The word group is “Tokaido / Mitsuya”, “Tokaido / Kaidan”, “Mitani / Kaidan”.

ステップS64において、番組ベクトル生成部23は、データ記憶部24から、対応するグループIDが抽出されたか否かを判断する。   In step S <b> 64, the program vector generation unit 23 determines whether the corresponding group ID has been extracted from the data storage unit 24.

ステップS64において、対応するグループIDが抽出されなかったと判断された場合、抽出された単語、もしくは、複数の単語から構成される単語群には、まだグループIDが付けられていないので、ステップS65において、番組ベクトル生成部23は、抽出された単語、もしくは、複数の単語から構成される単語群に新たなグループIDを対応付ける。また、番組ベクトル生成部23は、単語、もしくは、複数の単語から構成される単語群と、それに対応するグループIDを、データ記憶部24に記憶させる。   If it is determined in step S64 that the corresponding group ID has not been extracted, no group ID has been assigned to the extracted word or a word group composed of a plurality of words. The program vector generation unit 23 associates a new group ID with the extracted word or a word group composed of a plurality of words. Further, the program vector generation unit 23 causes the data storage unit 24 to store a word or a word group composed of a plurality of words and a group ID corresponding to the word group.

ステップS64において、対応するグループIDが抽出されたと判断された場合、または、ステップS65の処理の終了後、ステップS66において、番組ベクトル生成部23は、タイトルを構成する全ての単語、もしくは、複数の単語から構成される単語群についてグループIDを抽出したか否かを判断する。   When it is determined in step S64 that the corresponding group ID has been extracted, or after the process of step S65 is completed, in step S66, the program vector generation unit 23 selects all the words constituting the title, or a plurality of words It is determined whether or not a group ID has been extracted for a word group composed of words.

ステップS66において、タイトルを構成する全ての単語、もしくは、複数の単語から構成される単語群についてグループIDを抽出していないと判断された場合、処理は、ステップS63に戻り、それ以降の処理が繰り返される。   If it is determined in step S66 that no group ID has been extracted for all words constituting the title or a word group composed of a plurality of words, the process returns to step S63, and the subsequent processes are performed. Repeated.

ステップS66において、タイトルを構成する全ての単語、もしくは、複数の単語から構成される単語群についてグループIDが抽出されたと判断された場合、ステップS67において、番組ベクトル生成部23は、番組ベクトルに、抽出されたグループIDを対応付けて、処理が終了される。   If it is determined in step S66 that the group ID has been extracted for all words constituting the title or a word group composed of a plurality of words, in step S67, the program vector generation unit 23 adds the program vector to the program vector. The process ends after associating the extracted group IDs.

このような処理により、番組ベクトルに、タイトルを構成する単語、または単語群に対応するグループIDが対応付けられて、データ送信部25により、ネットワーク8を介して、テレビジョン受信装置4または、EPG受信装置9に送信される。   By such processing, the program vector is associated with the word constituting the title or the group ID corresponding to the word group, and the data transmission unit 25 transmits the television receiver 4 or the EPG via the network 8. It is transmitted to the receiving device 9.

また、類似したタイトルの番組を、同一のグループとするようにしても良い。例えば、タイトル「2年A組銀八先生」の連続ドラマと、タイトル「2年A組銀八先生スペシャル」の特別番組とを、同一のグループとしてグループ化することができるように、タイトルを構成する単語の形態素解析結果を基に、例えば、2週間、1ヶ月、半年などの所定の期間の番組タイトルで、単語の一致率を総当りで算出し、単語の一致率が所定の値以上である場合、同一グループとするようにしてもよい。   Also, programs with similar titles may be grouped together. For example, the title is structured so that the series “2 years A group Ginhachi teacher” and the special program “2 years A group Ginhachi teacher special” can be grouped as the same group. Based on the morphological analysis result of the word to be calculated, the word match rate is calculated for the program title of a predetermined period such as 2 weeks, 1 month, 6 months, etc., and the word match rate is equal to or higher than the predetermined value. In some cases, the same group may be used.

次に、図10のフローチャートを参照して、タイトルを構成する単語の一致率によりグループ化を実行するタイトルグループ化処理2について説明する。   Next, with reference to the flowchart of FIG. 10, the title grouping process 2 in which grouping is performed based on the matching rate of words constituting the title will be described.

ステップS401およびステップS402において、図9を用いて説明した、ステップS61およびステップS62と同様の処理が実行される。すなわち、データ取得部21は、メタデータデータベース7に登録されているEPGデータを参照して、登録されているメタデータから、タイトルを抽出し、番組ベクトル生成部23に供給し、番組ベクトル生成部23は、タイトルを形態素解析し、単語に分解する。   In step S401 and step S402, the same processing as step S61 and step S62 described with reference to FIG. 9 is executed. That is, the data acquisition unit 21 refers to the EPG data registered in the metadata database 7, extracts the title from the registered metadata, supplies the title to the program vector generation unit 23, and supplies the program vector generation unit 23 23 morphologically analyzes the title and breaks it down into words.

ステップS403において、番組ベクトル生成部23は、解析された単語を基に、タイトル間の単語の一致度、すなわち、単語が一致している割合を示す一致率を算出する。   In step S <b> 403, the program vector generation unit 23 calculates the matching degree of words between titles based on the analyzed words, that is, a matching rate indicating a ratio of matching words.

具体的には、タイトル「2年A組銀八先生」と、タイトル「2年A組銀八先生スペシャル」とが、それぞれ、「2」「年」「A」「組」「銀八」「先生」と、「2」「年」「A」「組」「銀八」「先生」「スペシャル」とに形態素分析された場合、この2つの番組のタイトルを構成する単語の一致率は、6/7で85.7%となる。   Specifically, the title “Two Years A Group Ginpachi Teacher” and the title “Two Years A Group Ginpachi Special” are “2”, “Year”, “A”, “Group”, “Ginpachi”, “ In the case of morphological analysis of “Teacher” and “2” “Year” “A” “Group” “Ginpachi” “Teacher” “Special”, the matching rate of words constituting the titles of these two programs is 6 / 7 is 85.7%.

ステップS404において、番組ベクトル生成部23は、単語が、例えば、70%などの所定の値以上一致しているか否かを判断する。この、一致率の閾値は、70%以外のいかなる数値であっても良いことは言うまでもない。   In step S404, the program vector generation unit 23 determines whether or not the words match a predetermined value or more such as 70%. Needless to say, the threshold value of the coincidence rate may be any numerical value other than 70%.

ステップS404において、単語が、70%などの所定の値以上一致していると判断された場合、ステップS405において、番組ベクトル生成部23は、それらの番組に、同一のグループIDを対応付ける。また、番組ベクトル生成部23は、一致した単語、または、単語群と、それに対応するグループIDを、データ記憶部24に記憶させる。   If it is determined in step S404 that the words match a predetermined value such as 70% or more, in step S405, the program vector generation unit 23 associates these programs with the same group ID. In addition, the program vector generation unit 23 causes the data storage unit 24 to store the matched word or word group and the corresponding group ID.

ステップS404において、70%などの所定の値以下の一致率であると判断された場合、または、ステップS405の処理の終了後、ステップS406において、番組ベクトル生成部23は、タイトルの総当りが終了したか否かを判断する。   When it is determined in step S404 that the matching rate is equal to or less than a predetermined value such as 70%, or after the processing in step S405 is completed, in step S406, the program vector generation unit 23 finishes the brute force of the title. Determine whether or not.

ステップS406において、タイトルの総当りが終了していないと判断された場合、処理は、ステップS403に戻り、それ以降の処理が繰り返される。   If it is determined in step S406 that the title round robin has not ended, the process returns to step S403, and the subsequent processes are repeated.

ステップS406において、タイトルの総当りが終了したと判断された場合、処理が終了される。   If it is determined in step S406 that the title round robin has been completed, the processing is terminated.

このような処理により、番組ベクトルに、タイトルを構成する単語の一致率を基にしたグループIDが対応付けられて、データ送信部25により、ネットワーク8を介して、テレビジョン受信装置4または、EPG受信装置9に送信されるので、例えば、連続ドラマとスペシャル番組などの類似したタイトルの番組を、同一のグループとして処理させるようにすることができる。   By such processing, the program vector is associated with the group ID based on the matching rate of the words constituting the title, and the data transmission unit 25 transmits the television receiver 4 or EPG via the network 8. Since it is transmitted to the receiving device 9, for example, programs with similar titles such as a series drama and a special program can be processed as the same group.

さらに、タイトルを構成する単語の一致率を基にグループを決定するようにすることにより、例えば、EPG、またはメタデータにおいて、数字の半角と全角、または、英字の半角と全角、もしくは、大文字と小文字などの表記ゆれがあった場合にも、同一タイトルの番組を、同一のグループとして検出することが可能となる。   Furthermore, by determining the group based on the matching rate of the words that make up the title, for example, in EPG or metadata, in half-width and full-width of numbers, half-width and full-width of English letters, or capital letters Even when there is a fluctuation in the case of lowercase letters or the like, it is possible to detect programs with the same title as the same group.

また、単語の一致率に加えて、例えば、放送局や番組ジャンル、あるいは、放送開始時刻などを、グループ化の条件に加えるようにしても良い。例えば、ニュース番組などにおいては、タイトルが、「ニュース」を含む少ない単語によって構成されているので、図10を用いて説明した処理では、異なる放送局の異なる形態のニュース番組であっても、同一のグループとして検出されてしまう恐れがあるので、単語の一致率に加えて、放送局も一致した場合、同一グループとするようにしても良い。   Further, in addition to the word matching rate, for example, a broadcasting station, a program genre, or a broadcast start time may be added to the grouping condition. For example, in a news program or the like, the title is composed of a small number of words including “news”. Therefore, in the process described with reference to FIG. Therefore, in addition to the word matching rate, if the broadcasting stations match, the same group may be used.

図11のフローチャートを参照して、放送局の一致を条件に加えて、タイトルを構成する単語の一致率によりグループ化を実行するタイトルグループ化処理3について説明する。   With reference to the flowchart of FIG. 11, a title grouping process 3 for performing grouping based on the matching rate of words constituting a title, with the matching of broadcasting stations as a condition, will be described.

ステップS421乃至ステップS424において、図10を用いて説明した、ステップS401乃至ステップS404と同様の処理が実行される。すなわち、データ取得部21は、メタデータデータベース7に登録されているEPGデータを参照して、登録されているメタデータから、タイトルを抽出し、番組ベクトル生成部23に供給し、番組ベクトル生成部23は、タイトルを形態素解析し、単語に分解する。そして、番組ベクトル生成部23は、解析された単語を基に、タイトル間の単語の一致度を算出し、単語が、例えば、70%などの所定の値以上一致しているか否かを判断する。   In steps S421 to S424, the same processing as that in steps S401 to S404 described with reference to FIG. 10 is executed. That is, the data acquisition unit 21 refers to the EPG data registered in the metadata database 7, extracts the title from the registered metadata, supplies the title to the program vector generation unit 23, and supplies the program vector generation unit 23 23 morphologically analyzes the title and breaks it down into words. Then, the program vector generation unit 23 calculates the degree of matching between words based on the analyzed word, and determines whether or not the word matches a predetermined value such as 70% or more. .

ステップS424において、単語が、70%などの所定の値以上一致していると判断された場合、ステップS425において、番組ベクトル生成部23は、それらの番組の放送局が一致しているか否かを判断する。   If it is determined in step S424 that the words match a predetermined value such as 70% or more, in step S425, the program vector generation unit 23 determines whether the broadcast stations of these programs match. to decide.

ステップS425において、これらの番組の放送局が一致していると判断された場合、ステップS426において、番組ベクトル生成部23は、それらの番組に、同一のグループIDを対応付ける。また、番組ベクトル生成部23は、一致した単語、または、単語群と、それに対応する放送局およびグループIDを、データ記憶部24に記憶させる。   If it is determined in step S425 that the broadcast stations of these programs match, in step S426, the program vector generation unit 23 associates the same group ID with these programs. Further, the program vector generation unit 23 stores the matched word or word group and the corresponding broadcasting station and group ID in the data storage unit 24.

ステップS424において、70%などの所定の値以下の一致率であると判断された場合、ステップS425において、これらの番組の放送局が一致していないと判断された場合、または、ステップS426の処理の終了後、ステップS427において、番組ベクトル生成部23は、タイトルの総当りが終了したか否かを判断する。   If it is determined in step S424 that the match rate is equal to or less than a predetermined value such as 70%, if it is determined in step S425 that the broadcast stations of these programs do not match, or the process of step S426 In step S427, the program vector generation unit 23 determines whether or not the title round-robin has ended.

ステップS427において、タイトルの総当りが終了していないと判断された場合、処理は、ステップS423に戻り、それ以降の処理が繰り返される。   If it is determined in step S427 that the title round-robin has not ended, the process returns to step S423, and the subsequent processes are repeated.

ステップS427において、タイトルの総当りが終了したと判断された場合、処理が終了される。   If it is determined in step S427 that the title round-robin has ended, the processing ends.

このような処理により、番組ベクトルに、放送局の一致とタイトルを構成する単語の一致率を基にしたグループIDが対応付けられて、データ送信部25により、ネットワーク8を介して、テレビジョン受信装置4または、EPG受信装置9に送信されるので、例えば、類似したタイトルの番組を、同一のグループとする場合に、他局のニュース番組を同一のグループとするようなことを防ぐことができる。   By such processing, the program vector is associated with the group ID based on the match rate of the broadcasting station and the word constituting the title, and the data transmission unit 25 receives the television signal via the network 8. Since it is transmitted to the apparatus 4 or the EPG receiving apparatus 9, for example, when programs with similar titles are set to the same group, it is possible to prevent the news programs of other stations from being set to the same group. .

なお、図11においては、タイトルを構成する単語の一致率以外に、同一の放送局であるか否かを条件として、グループ化を行うものとして説明したが、放送局以外の、例えば、放送時間帯やジャンルなどを、タイトルを構成する単語の一致率以外の条件として、グループ化を実行するようにしても良いことは言うまでもない。   Note that in FIG. 11, the grouping is performed on the condition that the broadcasting stations are the same, in addition to the matching rate of the words constituting the title. It goes without saying that grouping may be executed using a band, a genre, or the like as a condition other than the matching rate of words constituting the title.

更に、例えば、連続ドラマや帯番組の放送開始時刻が、スポーツ中継や特別番組などのためにずれた場合においても、同一グループとして検出可能なように、タイトルを構成する単語の一致率以外の条件を、放送時刻が、例えば、1時間などの所定の時間範囲内のずれで一致しているか否かとして、グループ化を実行するようにしても良い。   Furthermore, for example, even if the broadcast start time of a continuous drama or band program is shifted due to a sports broadcast or a special program, conditions other than the matching rate of words constituting the title so that it can be detected as the same group Grouping may be executed based on whether or not the broadcast times coincide with each other within a predetermined time range such as one hour.

図12のフローチャートを参照して、放送時刻が、所定の時間範囲内のずれで一致しているか否かを条件に加えて、タイトルを構成する単語の一致率によりグループ化を実行するタイトルグループ化処理4について説明する。   Referring to the flowchart of FIG. 12, title grouping that performs grouping based on the matching rate of words constituting the title, in addition to whether or not the broadcast time matches with a deviation within a predetermined time range Processing 4 will be described.

ステップS441乃至ステップS444において、図10を用いて説明した、ステップS401乃至ステップS404と同様の処理が実行される。すなわち、データ取得部21は、メタデータデータベース7に登録されているEPGデータを参照して、登録されているメタデータから、タイトルを抽出し、番組ベクトル生成部23に供給し、番組ベクトル生成部23は、タイトルを形態素解析し、単語に分解する。そして、番組ベクトル生成部23は、解析された単語を基に、タイトル間の単語の一致度を算出し、単語が、例えば、70%などの所定の値以上一致しているか否かを判断する。   In steps S441 to S444, the same processing as that in steps S401 to S404 described with reference to FIG. 10 is executed. That is, the data acquisition unit 21 refers to the EPG data registered in the metadata database 7, extracts the title from the registered metadata, supplies the title to the program vector generation unit 23, and supplies the program vector generation unit 23 23 morphologically analyzes the title and breaks it down into words. Then, the program vector generation unit 23 calculates the degree of matching between words based on the analyzed word, and determines whether or not the word matches a predetermined value such as 70% or more. .

ステップS444において、単語が、70%などの所定の値以上一致していると判断された場合、ステップS445において、番組ベクトル生成部23は、それらの番組の放送開始時刻が、例えば、1時間などの所定の範囲内のずれで一致しているか否かを判断する。   If it is determined in step S444 that the words match a predetermined value such as 70% or more, in step S445, the program vector generation unit 23 sets the broadcast start time of those programs to, for example, 1 hour. It is determined whether or not they coincide with each other within a predetermined range.

ステップS445において、それらの番組の放送開始時刻が所定の範囲内のずれで一致していると判断された場合、ステップS446において、番組ベクトル生成部23は、それらの番組に、同一のグループIDを対応付ける。また、番組ベクトル生成部23は、一致した単語、または、単語群と、それに対応する放送開始時刻の範囲、およびグループIDを、データ記憶部24に記憶させる。   If it is determined in step S445 that the broadcast start times of these programs match with a deviation within a predetermined range, in step S446, the program vector generation unit 23 assigns the same group ID to those programs. Associate. In addition, the program vector generation unit 23 causes the data storage unit 24 to store the matched word or word group, the corresponding broadcast start time range, and the group ID.

ステップS444において、70%などの所定の値以下の一致率であると判断された場合、ステップS445において、それらの番組の放送開始時刻が所定の範囲以上にずれていると判断された場合、または、ステップS446の処理の終了後、ステップS447において、番組ベクトル生成部23は、タイトルの総当りが終了したか否かを判断する。   If it is determined in step S444 that the match rate is equal to or less than a predetermined value such as 70%, if it is determined in step S445 that the broadcast start time of those programs is shifted beyond a predetermined range, or After the process of step S446 ends, in step S447, the program vector generation unit 23 determines whether or not the title round-robin has ended.

ステップS447において、タイトルの総当りが終了していないと判断された場合、処理は、ステップS443に戻り、それ以降の処理が繰り返される。   If it is determined in step S447 that the title round-robin has not ended, the process returns to step S443, and the subsequent processes are repeated.

ステップS447において、タイトルの総当りが終了したと判断された場合、処理が終了される。   If it is determined in step S447 that the title round robin has ended, the processing ends.

このような処理により、番組ベクトルに、放送開始時刻の所定の範囲内のずれを含む一致と、タイトルを構成する単語の一致率を基にしたグループIDが対応付けられて、データ送信部25により、ネットワーク8を介して、テレビジョン受信装置4または、EPG受信装置9に送信されるので、例えば、類似したタイトルの番組を同一のグループとする場合に、特別番組などによる放送時刻の変更のために、同一グループとして検出されるべき番組が、同一グループとして検出されないようなことを防ぐことができる。   By such processing, the program vector is associated with a match including a deviation within a predetermined range of the broadcast start time and a group ID based on the match rate of the words constituting the title. Since it is transmitted to the television receiving device 4 or the EPG receiving device 9 via the network 8, for example, when programs having similar titles are grouped, the broadcast time is changed by a special program or the like. In addition, it is possible to prevent programs that should be detected as the same group from being detected as the same group.

図13は、番組推薦処理装置10の構成を示すブロック図である。   FIG. 13 is a block diagram showing the configuration of the program recommendation processing device 10.

データ取得部41は、配信サーバ5から送信された番組ベクトルPP、および番組ベクトルPPに対応する番組側効き目ベクトルEfPPを取得する。番組ベクトル抽出部42は、データ取得部41が取得した番組ベクトルPPから、マッチング処理に必要な番組ベクトルPP、あるいは、ユーザモデル生成のために必要な番組ベクトルPPを抽出し、必要に応じて、番組ベクトルPPに対応する番組側効き目ベクトルEfPPとともに、マッチング処理部43に供給する。   The data acquisition unit 41 acquires the program vector PP transmitted from the distribution server 5 and the program side effect vector EfPP corresponding to the program vector PP. The program vector extraction unit 42 extracts a program vector PP necessary for matching processing or a program vector PP necessary for user model generation from the program vector PP acquired by the data acquisition unit 41, and if necessary, The program side effect vector EfPP corresponding to the program vector PP is supplied to the matching processing unit 43.

操作入力部44は、例えば、キーボード、タッチパッド、マウスなどの入力デバイスで構成され、ユーザが入力した初期登録情報や、ユーザモデル生成のためのトピックの入力を受け、初期登録保存部45に出力する。初期登録保存部45は、操作入力部44から供給された初期登録内容や、ユーザモデル生成のためのトピックを登録し、必要に応じて、操作ログ取得部46、または、マッチング処理部43に供給する。また、初期登録保存部45に保存されている内容は、操作入力部44から入力されるユーザの操作に基づいて、逐次更新される。初期登録される内容には、例えば、嫌いなジャンル、嫌いなキーワード、嫌いな出演者などの、ユーザが好まない番組を示す情報や、好きなジャンル、好きなキーワード、好きな出演者などの、ユーザが好む番組を示す情報がある。   The operation input unit 44 includes input devices such as a keyboard, a touch pad, and a mouse, for example. The operation input unit 44 receives initial registration information input by the user and a topic input for generating a user model, and outputs the initial registration information to the initial registration storage unit 45. To do. The initial registration storage unit 45 registers initial registration contents supplied from the operation input unit 44 and topics for user model generation, and supplies them to the operation log acquisition unit 46 or the matching processing unit 43 as necessary. To do. Further, the contents stored in the initial registration storage unit 45 are sequentially updated based on a user operation input from the operation input unit 44. Initially registered contents include information indicating programs that the user does not like, such as disliked genres, disliked keywords, disliked performers, favorite genres, favorite keywords, favorite performers, etc. There is information indicating programs that the user likes.

操作ログ取得部46は、テレビジョン表示装置11または録画再生装置12から、操作ログを取得し、これらの情報を正履歴と負履歴に分類し、必要に応じて、初期登録保存部45に保存されている情報を参照して、データ取得部41が取得した番組ベクトルPPのうち、正履歴および負履歴に対応する番組ベクトルPPを読み出して、正履歴保存部47と負履歴保存部48に供給して保存させる。正履歴保存部47は、供給された正履歴を保存し、正履歴ベクトルUPを生成する。負履歴保存部48は、供給された負履歴を保存し、負履歴ベクトルMUPを生成する。生成された正履歴ベクトルUPと負履歴ベクトルMUPは、マッチング処理部43に供給される。   The operation log acquisition unit 46 acquires operation logs from the television display device 11 or the recording / playback device 12, classifies these pieces of information into positive histories and negative histories, and stores them in the initial registration storage unit 45 as necessary. The program vector PP corresponding to the positive history and the negative history is read out from the program vector PP acquired by the data acquisition unit 41 with reference to the stored information and supplied to the positive history storage unit 47 and the negative history storage unit 48. And save it. The positive history storage unit 47 stores the supplied positive history and generates a positive history vector UP. The negative history storage unit 48 stores the supplied negative history and generates a negative history vector MUP. The generated positive history vector UP and negative history vector MUP are supplied to the matching processing unit 43.

ここで、正履歴とは、ユーザが積極的に視聴しようとする、換言すれば、好ましいと思う番組の候補を抽出するために用いられる情報であり、例えば、ユーザが、番組を視聴したり、録画した場合、または、後述する処理によりユーザに推薦番組リストとして提案された番組が、ユーザに受け入れられて視聴または録画された場合、その番組のメタデータは、好印象メタデータとして、正履歴保存部47に保存される。正履歴保存部47は、詳細項目ごとに、または、大項目ごとに、正履歴の総和を求め、正履歴ベクトルUPを生成する。   Here, the positive history is information used to extract a candidate of a program that the user wants to actively watch, in other words, a preferable program. For example, the user can watch the program, When recorded, or when a program proposed as a recommended program list to the user through processing described later is accepted and viewed or recorded by the user, the metadata of the program is stored as positive impression metadata as a positive history. Stored in the unit 47. The positive history storage unit 47 obtains the sum of positive histories for each detailed item or for each large item, and generates a positive history vector UP.

一方、負履歴とは、ユーザが視聴するのに消極的である、換言すれば、好ましくないと思う番組を、推薦する番組から除くために用いられる情報であり、例えば、初期登録で嫌いであるとされた項目や、録画後見ずに消去された番組、または、後述する処理によりユーザに推薦番組リストとして提案された番組がユーザに受け入れられず、視聴または録画操作されなかった場合、その番組のメタデータは負印象メタデータとして、負履歴保存部48に保存される。例えば、ユーザが、初期登録で「スポーツ」を嫌いであるとした場合、ジャンルGmup={0,0,5,0,0,0,0,0,0}が、重み5で負印象として負履歴保存部48に追加保存される。負履歴保存部48は、詳細項目ごとに、または、大項目ごとに、負履歴の総和を求め、負履歴ベクトルMUPを生成する。   On the other hand, the negative history is information used to remove programs that are reluctant to be viewed by the user, in other words, programs that are not preferable to the recommended programs. For example, they are disliked during initial registration. If the selected item, the program deleted without recording after recording, or the program proposed as a recommended program list to the user by the process described later is not accepted by the user and is not viewed or recorded, the program The metadata is stored in the negative history storage unit 48 as negative impression metadata. For example, if the user dislikes “sports” in the initial registration, the genre Gmup = {0, 0, 5, 0, 0, 0, 0, 0, 0} is negative with a weight of 5 as a negative impression. It is additionally stored in the history storage unit 48. The negative history storage unit 48 calculates the sum of negative histories for each detailed item or for each large item, and generates a negative history vector MUP.

マッチング処理部43は、番組ベクトル抽出部42から抽出された番組ベクトルと、正履歴保存部47または負履歴保存部48から供給された正履歴ベクトルUP、または、負履歴ベクトルMUPとのマッチングを検証する。   The matching processing unit 43 verifies matching between the program vector extracted from the program vector extracting unit 42 and the positive history vector UP or negative history vector MUP supplied from the positive history storage unit 47 or the negative history storage unit 48. To do.

番組ベクトルPP、正履歴ベクトルUP、または、負履歴ベクトルMUPが、全ての詳細要素を1列に並べてベクトル化されている場合、タイトルやキーワードなどは複数の単語で構成されているので、その単語1語と、例えば、ジャンルなどの項目が、ベクトルにおいて同じ重さになってしまう。そこで、マッチング処理部43の正規化処理部61は、単語によって構成される項目であるタイトルおよび内容について、番組ごとに、単語を単語数で割ることで正規化する。例えば、タイトルTm={東海道−1,三谷−1,怪談−1}である場合、タイトルTm={東海道:0.33,三谷:0.33,怪談:0.33}と正規化される。これにより、タイトル、内容とも、その項目内の単語のトータルで、重みが1になるので、マッチング処理において不都合が生じない。   If the program vector PP, positive history vector UP, or negative history vector MUP is vectorized by arranging all the detailed elements in one column, the title, keyword, etc. are composed of a plurality of words. One word and an item such as a genre, for example, have the same weight in the vector. Therefore, the normalization processing unit 61 of the matching processing unit 43 normalizes the title and contents, which are items configured by words, by dividing the word by the number of words for each program. For example, when the title Tm = {Tokaido-1, Mitani-1, Kaidan-1}, the title Tm = {Tokaido: 0.33, Mitani: 0.33, Kaidan: 0.33} is normalized. As a result, both the title and the content have a total weight of 1 in the item, so that no inconvenience occurs in the matching process.

ベクトル演算部62は、番組ベクトルPPと、正履歴ベクトルUP、または、負履歴ベクトルMUPとのマッチング処理を実行する。   The vector calculation unit 62 executes a matching process between the program vector PP and the positive history vector UP or the negative history vector MUP.

ベクトル演算部62は、番組ベクトルPP、正履歴ベクトルUPおよび負履歴ベクトルMUPが、詳細項目の全要素を1列に並べたベクトルで表されている場合、正履歴ベクトルUPまたは負履歴ベクトルMUPと、番組ベクトルPPとのベクトル間のコサイン距離(cosθ)によって、次の式(1)に示されるように、番組ベクトルPPと正履歴ベクトルUPとの類似度SimUPを求め、式(2)に示されるように、番組ベクトルPPと負履歴ベクトルMUPとの類似度SimMUPを求める。コサイン距離とは、式(1)と式(2)に示されるように、2つのベクトルの内積を各ベクトルの絶対値の積で除算して得られる値である。   When the program vector PP, the positive history vector UP, and the negative history vector MUP are represented by a vector in which all the elements of the detailed items are arranged in one column, the vector calculation unit 62 determines whether the positive history vector UP or the negative history vector MUP Based on the cosine distance (cosθ) between the program vector PP and the vector, the similarity SimUP between the program vector PP and the positive history vector UP is obtained as shown in the following equation (1). As described above, the similarity SimMUP between the program vector PP and the negative history vector MUP is obtained. The cosine distance is a value obtained by dividing the inner product of two vectors by the product of the absolute values of the vectors, as shown in the equations (1) and (2).

SimUP=cosθu=UP・PP/|UP|×|PP|・・・(1)
SimMUP=cosθm=MUP・PP/|MUP|×|PP|・・・(2)
SimUP = cosθu = UP ・ PP / | UP | × | PP | ・ ・ ・ (1)
SimMUP = cosθm = MUP ・ PP / | MUP | × | PP | (2)

ただし、式(1)および式(2)において、PPは番組ベクトルPPを示し、UPは正履歴ベクトルUPを示し、MUPは、負履歴ベクトルMUPを示す。また、“・”は、内積を示し、“×”は、要素の掛け算(スカラ演算)を示す。   In the equations (1) and (2), PP represents the program vector PP, UP represents the positive history vector UP, and MUP represents the negative history vector MUP. “·” Indicates an inner product, and “x” indicates element multiplication (scalar operation).

また、ベクトル演算部62は、番組ベクトルPP、正履歴ベクトルUPおよび負履歴ベクトルMUPが大項目ごとにベクトル化されている場合、大項目ごとに、番組ベクトルPPと正履歴ベクトルUPとの類似度と、番組ベクトルPPと負履歴ベクトルMUPとの類似度を求め、大項目ごとに類似度の和を算出して、類似度SimUPおよび類似度SimMUPを算出することができる。例えば、単語に分解されている大項目「タイトル」において、正履歴ベクトルUPが、タイトルTup={学校−1,怪談−1,トイレ−1}であり、供給された番組ベクトルPPが、タイトルTm={東海道−1,三谷−1,怪談−1}である場合、単位ベクトル長さを1とすると、ベクトルの長さ(絶対値)は、要素の合計の2乗和の平方根であるので、タイトルの類似度であるコサイン距離cosθtは、次の式(3)のように算出される。   Further, when the program vector PP, the positive history vector UP, and the negative history vector MUP are vectorized for each major item, the vector calculation unit 62 determines the similarity between the program vector PP and the positive history vector UP for each major item. Then, the similarity between the program vector PP and the negative history vector MUP is obtained, the sum of the similarities is calculated for each major item, and the similarity SimUP and the similarity SimMUP can be calculated. For example, in the large item “title” broken down into words, the positive history vector UP is the title Tup = {school−1, ghost story−1, toilet−1}, and the supplied program vector PP is the title Tm. = {Tokaido-1, Mitani-1, Kaidan-1} If the unit vector length is 1, the vector length (absolute value) is the square root of the sum of the squares of the elements. The cosine distance cos θt, which is the similarity between titles, is calculated as in the following equation (3).

cosθt=(1・1)/(√3×√3)=1/3・・・(3)     cosθt = (1 ・ 1) / (√3 × √3) = 1/3 (3)

式(3)において、“・”は、内積を示し、“×”は、スカラ演算を示す。番組ベクトルPPと、負履歴ベクトルMUPとの大項目ごとの類似度も、式(3)と同様の計算によって算出される。   In Expression (3), “·” indicates an inner product, and “x” indicates a scalar operation. The similarity for each major item between the program vector PP and the negative history vector MUP is also calculated by the same calculation as in equation (3).

例えば、正履歴ベクトルUPを、正履歴ベクトルUP={タイトルTup,ジャンルGup,出演者Pup,脚本/原作/演出Aup,内容(キーワード)Kup}および負履歴ベクトルMUPを、負履歴ベクトMUP={タイトルTmup,ジャンルGmup,出演者Pmup,脚本/原作/演出Amup,内容(キーワード)Kmup}とした場合、それぞれの大項目で、式(3)と同様の演算により、大項目ごとに類似度が得られるので、類似度SimUPおよび類似度SimMUP は、いずれも、次の式(4)の類似度Simとして演算される。   For example, the positive history vector UP is set to the positive history vector UP = {title Tup, genre Gup, performer Pup, screenplay / original / production Aup, content (keyword) Kup} and negative history vector MUP, negative history vector MUP = { When title Tmup, genre Gmup, performer Pmup, screenplay / original / production Amup, and content (keyword) Kmup}, the similarity for each major item is calculated by the same calculation as in equation (3). Thus, the similarity SimUP and the similarity SimMUP are both calculated as the similarity Sim of the following equation (4).

Sim=cosθt+ cosθg+cosθp+cosθa+cosθk・・・(4)       Sim = cosθt + cosθg + cosθp + cosθa + cosθk (4)

ここで、cosθtは、大項目「タイトル」における、番組ベクトルPPと、正履歴ベクトルUPまたは負履歴ベクトルMUPとのコサイン距離であり、cosθgは、大項目「ジャンル」における、番組ベクトルPPと、正履歴ベクトルUPまたは負履歴ベクトルMUPとのコサイン距離であり、cosθpは、大項目「出演者」における、番組ベクトルPPと、正履歴ベクトルUPまたは負履歴ベクトルMUPとのコサイン距離であり、cosθaは、大項目「脚本/原作/演出」における、番組ベクトルPPと、正履歴ベクトルUPまたは負履歴ベクトルMUPとのコサイン距離であり、cosθkは、大項目「内容」における、番組ベクトルPPと、正履歴ベクトルUPまたは負履歴ベクトルMUPとのコサイン距離である。   Here, cosθt is the cosine distance between the program vector PP and the positive history vector UP or negative history vector MUP in the large item “title”, and cosθg is the positive value of the program vector PP in the large item “genre”. The cosine distance between the history vector UP or the negative history vector MUP, and cosθp is the cosine distance between the program vector PP and the positive history vector UP or the negative history vector MUP in the major item `` performer '', and cosθa is The cosine distance between the program vector PP and the positive history vector UP or the negative history vector MUP in the large item “screenplay / original / production”, and cosθk is the program vector PP and the positive history vector in the large item “content”. The cosine distance with the UP or negative history vector MUP.

類似度SimUPおよび類似度SimMUPが、大項目ごとの演算結果の和として算出された場合、項目間の重みの偏りがなくなるため、正規化を行っているのと同義である。従って、全要素を1列に並べたベクトルと異なり、正規化処理部61による正規化処理を行わなくてもよい。 When the similarity SimUP and the similarity SimMUP are calculated as the sum of the calculation results for each large item, there is no weight bias between items, which is synonymous with normalization. Therefore, unlike a vector in which all elements are arranged in one column, normalization processing by the normalization processing unit 61 may not be performed.

すなわち、正規化を行うことなく、全要素を1列に並べたベクトルを用いてしまった場合、頻度の積み重なり易い、例えば、放送局、ジャンルなどの項目と比較して、タイトルや内容などの項目においては、履歴が増えるに従って、単語数は増える一方、それぞれの単語の頻度は大きくなりにくい。   That is, when normalization is used and a vector in which all elements are arranged in one column is used, items such as titles and contents are easily compared with items such as broadcast stations and genres, which are likely to accumulate in frequency. In, as the history increases, the number of words increases, but the frequency of each word hardly increases.

このため、全要素を用いて、要素ごとに合計を取った場合、頻度の重なりやすい、放送局、ジャンルなどの項目の影響が大きくなってしまうので、例えば、ユーザが解説者Aのファンであるので、「解説者Aが解説している球団Bの試合の実況中継」を好んで視聴しているような場合、ジャンルである「野球の実況中継」という情報は履歴として重なりやすいが、出演者である「解説者A」という情報は履歴として重なり難い。従って、他の解説者が解説している球団Bの試合の実況中継が推薦されて、解説者Aが出演しているバラエティ番組が推薦されないような場合が発生する。   For this reason, when all elements are used and the total is taken for each element, the influence of items such as broadcast stations and genres that tend to overlap frequently increases, so the user is a fan of commentator A, for example. So, if you like to watch “Live broadcast of the game of Team B that commentator A explains”, the information “Live broadcast of baseball” that is a genre is easy to overlap as a history. The information “Explanator A” is difficult to overlap as history. Therefore, there may be a case where the live broadcast of the game of the team B which is explained by another commentator is recommended and the variety program in which the commentator A appears is not recommended.

これに対して、正規化を行うか、または、大項目ごとの演算結果の和を類似度SimUPおよび類似度SimMUPとして算出するようにすることにより、履歴の頻度の大小の影響を受けることなく、解説者Aが出演しているバラエティ番組を推薦することができ、より正確にユーザの嗜好を反映するようにすることができる。   On the other hand, by normalizing or calculating the sum of the calculation results for each large item as the similarity SimUP and similarity SimMUP, without being affected by the magnitude of the history frequency, The variety program in which the commentator A appears can be recommended, and the user's preference can be more accurately reflected.

また、ベクトル演算部62は、初期登録保存部45に保存されているユーザの初期登録情報、番組ベクトルPPに対応付けられて送信される番組側効き目ベクトルEfPP、または、ユーザ情報登録部63において生成されて登録されているユーザ側効き目ベクトルEfUP(後述)、もしくは、ユーザ側反効き目ベクトルEfMUP(後述)により、重み付けを行って、類似度SimUPおよび類似度SimMUPを算出するようにすることもできる。   The vector calculation unit 62 generates the user initial registration information stored in the initial registration storage unit 45, the program side effect vector EfPP transmitted in association with the program vector PP, or the user information registration unit 63. The similarity SimUP and the similarity SimMUP may be calculated by weighting according to the registered user side effect vector EfUP (described later) or the user side reaction vector EfMUP (described later).

ベクトル演算部62は、上述したような方法で算出された類似度SimUPを基に、例えば、正履歴ベクトルとの類似度が高い上位所定数(例えば、10)の番組に対して、更に履歴ベクトルMUPとの類似度SimMUPを求め、SimUP−SimMUPを演算し、演算結果の上位所定数(例えば、3)の番組を推薦番組として、推薦情報出力部49に出力する。   Based on the similarity SimUP calculated by the method as described above, the vector calculation unit 62, for example, further records a history vector for a predetermined number of programs (for example, 10) having a high similarity to the positive history vector. Similarity SimMUP with MUP is calculated, SimUP−SimMUP is calculated, and the upper predetermined number (for example, 3) of the calculation results are output to the recommended information output unit 49 as recommended programs.

また、ベクトル演算部62は、番組ベクトルがグループ化されている場合、推薦された番組の情報を基に、ユーザ情報登録部63に、推薦優先グループを登録し、推薦優先グループに対応する番組を、優先的に推薦する。   Further, when the program vectors are grouped, the vector calculation unit 62 registers a recommended priority group in the user information registration unit 63 based on the recommended program information, and selects a program corresponding to the recommended priority group. , Preferentially recommend.

更に、ベクトル演算部62は、初期登録保存部45に保存されているトピックを用いて番組ベクトルPPのフィルタリングを行うことにより、ユーザモデルベクトルを生成し、ユーザ情報登録部63に登録して、マッチング処理を行うようにすることができる。ユーザモデルについての詳細については後述する。   Further, the vector calculation unit 62 generates a user model vector by filtering the program vector PP using the topic stored in the initial registration storage unit 45, registers it in the user information registration unit 63, and performs matching. Processing can be performed. Details of the user model will be described later.

ユーザ情報登録部63は、初期登録保存部45から供給されたユーザの初期登録内容、あるいは、正履歴保存部47または負履歴保存部48から供給された正履歴ベクトルUPまたは負履歴ベクトルMUPを基に、ユーザ側効き目ベクトルEfUPおよび反効き目ベクトルEfMUPを生成して、保存する。ユーザ側効き目ベクトルEfUPは、そのユーザにとって、大項目のうちのいずれの要素が番組の選択に重要であり、番組の選択のために重みが置かれている項目であるかを示すベクトルか、または、それぞれの項目におけるユーザの嗜好を示すベクトルである。反効き目ベクトルEfMUPは、そのユーザにとって、大項目のうちのいずれの要素が番組の選択に重要でない要素であり、番組の選択のために重みが置かれていない項目であるかを示すベクトルか、または、それぞれの項目において、ユーザが好まない項目を示すベクトルである。   The user information registration unit 63 is based on the initial registration contents of the user supplied from the initial registration storage unit 45 or the positive history vector UP or negative history vector MUP supplied from the positive history storage unit 47 or the negative history storage unit 48. Then, the user side effect vector EfUP and the counter effect vector EfMUP are generated and stored. The user-side effect vector EfUP is a vector that indicates to the user which elements of the major items are important for program selection and items that are weighted for program selection, or , A vector indicating the user's preference in each item. The counter-effect vector EfMUP is a vector indicating to the user which element of the large items is an element that is not important for program selection and is an item that is not weighted for program selection, Or it is a vector which shows the item which a user does not like in each item.

換言すれば、ユーザ側効き目ベクトルEfUPおよび反効き目ベクトルEfMUPは、番組ベクトルPPと、正履歴ベクトルUPまたは負履歴ベクトルMUPとのマッチングにおいて、いずれの項目が大きく寄与するかを規定するものである。   In other words, the user-side effect vector EfUP and the counter-effect vector EfMUP define which item contributes greatly in the matching between the program vector PP and the positive history vector UP or the negative history vector MUP.

ユーザ側効き目ベクトルEfUPおよび反効き目ベクトルEfMUPは、ユーザによって設定可能としたり、予め定められた値を用いるようにしても良いが、初期登録保存部45に登録されているユーザの初期登録内容を基に生成されるようにしても良い。   The user side effect vector EfUP and the counter effect vector EfMUP may be set by the user or may use predetermined values, but based on the initial registration contents of the user registered in the initial registration storage unit 45. May be generated.

具体的には、ユーザ側効き目ベクトルEfUPが、そのユーザにとって、大項目のうちのいずれの要素が番組の選択に重要であるかを示す情報である場合、番組ベクトルPP={タイトルTm,ジャンルGm,時間帯Hm,放送局Sm,出演者Pm,脚本/原作/演出Am,内容Km}において、ユーザにとってジャンルが重要である場合、例えば、効き目ベクトルEfUP=(1,5,1,1,1,1,1)と設定される。これに対して、ユーザにとって出演者とジャンルが重要である場合、例えば、効き目ベクトルEfUP=(1,3,1,1,5,1,1)と設定される。   Specifically, when the user side effect vector EfUP is information indicating which of the major items is important for the user in selecting a program, the program vector PP = {title Tm, genre Gm , Time zone Hm, broadcast station Sm, performer Pm, screenplay / original / production Am, content Km}, if the genre is important to the user, for example, the effect vector EfUP = (1, 5, 1, 1, 1 , 1, 1). On the other hand, when the performer and the genre are important for the user, for example, the effect vector EfUP = (1, 3, 1, 1, 5, 1, 1) is set.

また、ユーザ側効き目ベクトルEfUPが、それぞれの項目におけるユーザの嗜好を示すベクトルである場合、大項目ジャンルGm={ドラマ,バラエティ,スポーツ,映画,音楽,子供向け/教育,教養/ドキュメント,ニュース/報道,その他}において、ユーザが好ましいと思う番組のジャンルが、教養/ドキュメントであった場合、ユーザ効き目ベクトルEfUPは、例えば、ジャンルGm={0,0,0,0,0,0,5,0,0}と設定される。   When the user side effect vector EfUP is a vector indicating the user's preference in each item, the large item genre Gm = {drama, variety, sports, movie, music, children / education, education / documents, news / When the genre of the program that the user thinks preferable in the news report, etc. is education / document, the user effect vector EfUP is, for example, the genre Gm = {0, 0, 0, 0, 0, 0, 5, 0,0}.

また、ユーザ側効き目ベクトルEfUPおよび反効き目ベクトルEfMUPは、正履歴ベクトルUPまたは負履歴ベクトルMUPを基に、あるいは、一定期間にユーザが視聴した番組をカウントすることにより、生成されるようにしても良い。更に、ユーザ側効き目ベクトルEfUPおよび反効き目ベクトルEfMUPは、ジャンル別に生成することも可能である。ユーザ側効き目ベクトルEfUPまたは反効き目ベクトルEfMUPを生成する方法については、図22乃至図27を用いて後述する。   Further, the user side effect vector EfUP and the counter effect vector EfMUP may be generated based on the positive history vector UP or the negative history vector MUP or by counting the programs viewed by the user for a certain period. good. Furthermore, the user-side effect vector EfUP and the counter-effect vector EfMUP can be generated for each genre. A method for generating the user-side effect vector EfUP or the counter-effect vector EfMUP will be described later with reference to FIGS.

更に、ユーザ情報登録部63は、ベクトル演算部62の処理により生成された、推薦優先グループの情報や、ユーザモデルベクトルなどを、必要に応じて登録する。   Furthermore, the user information registration unit 63 registers the information of the recommendation priority group, the user model vector, and the like generated by the processing of the vector calculation unit 62 as necessary.

以上説明したマッチング処理部43においては、正履歴ベクトルUPとの類似度が高い番組(ユーザが積極的に視聴する番組)から、負履歴を用いて、ユーザが好まないと思われる番組(ユーザが視聴するのに消極的である番組)を取り除く処理を行わなくても、例えば、正履歴のみを用いて推薦番組を決定することも可能である。   In the matching processing unit 43 described above, from a program having a high degree of similarity to the positive history vector UP (a program that is actively viewed by the user), a program that the user does not like using the negative history (the user has For example, it is possible to determine a recommended program using only the positive history without performing a process of removing a program that is reluctant to watch.

推薦情報出力部49は、マッチング処理部43から供給された推薦番組の情報を、推薦番組リスト50に登録するとともに、テレビジョン表示装置11、または、録画再生装置12に供給する。推薦番組リスト50は、番組推薦処理装置10から取り外し可能に構成されており、推薦番組出力部49から出力された推薦番組情報を登録する。推薦番組リスト50に推薦番組情報を保存するようにすることにより、例えば、異なるテレビジョン受信装置4、テレビジョン表示装置11、あるいは、録画再生装置12などを用いる場合においても、これまで蓄積した履歴情報を用いて、番組の推薦や、自動録画などを実行させるようにすることが可能である。   The recommended information output unit 49 registers the recommended program information supplied from the matching processing unit 43 in the recommended program list 50 and supplies it to the television display device 11 or the recording / reproducing device 12. The recommended program list 50 is configured to be removable from the program recommendation processing device 10, and registers recommended program information output from the recommended program output unit 49. By storing the recommended program information in the recommended program list 50, for example, even when different television receivers 4, television display devices 11, recording / reproducing devices 12, etc. are used, the history accumulated so far Using information, it is possible to execute program recommendation, automatic recording, and the like.

また、マッチング処理部43は、必要に応じて、ドライブ51とも接続されている。ドライブ51には、必要に応じて、磁気ディスク71、光ディスク72、光磁気ディスク73、および半導体メモリ74が装着され、データの授受を行う。   The matching processing unit 43 is also connected to the drive 51 as necessary. A magnetic disk 71, an optical disk 72, a magneto-optical disk 73, and a semiconductor memory 74 are mounted on the drive 51 as necessary to exchange data.

図14のフローチャートを参照して、番組推薦処理装置10が実行する、正履歴ベクトルおよび負履歴ベクトル生成処理1について説明する。   The positive history vector and negative history vector generation processing 1 executed by the program recommendation processing device 10 will be described with reference to the flowchart of FIG.

ステップS71において、操作ログ取得部46は、初期登録保存部45から読み出した初期登録内容を負履歴保存部48に供給する。負履歴保存部48は、供給された初期登録内容を参照して、負履歴ベクトルMUPを生成する。   In step S <b> 71, the operation log acquisition unit 46 supplies the initial registration content read from the initial registration storage unit 45 to the negative history storage unit 48. The negative history storage unit 48 refers to the supplied initial registration content and generates a negative history vector MUP.

ステップS72において、操作ログ取得部46は、初期登録保存部45に保存されている登録内容を基に、初期登録内容が変更されたか否かを判断する。ステップS72において、初期登録内容が変更されたと判断された場合、処理は、ステップS71に戻り、それ以降の処理が繰り返される。   In step S <b> 72, the operation log acquisition unit 46 determines whether or not the initial registration content has been changed based on the registration content stored in the initial registration storage unit 45. If it is determined in step S72 that the initial registration content has been changed, the process returns to step S71, and the subsequent processes are repeated.

ステップS72において、初期登録内容が変更されていないと判断された場合、ステップS73において、操作ログ取得部46は、テレビジョン表示装置11または録画再生装置12から、操作ログが供給されたか否かを判断する。ステップS73において、操作ログが供給されていないと判断された場合、処理は、ステップS72に戻り、それ以降の処理が繰り返される。   If it is determined in step S72 that the initial registration content has not been changed, in step S73, the operation log acquisition unit 46 determines whether an operation log has been supplied from the television display device 11 or the recording / playback device 12. to decide. If it is determined in step S73 that no operation log is supplied, the process returns to step S72, and the subsequent processes are repeated.

ステップS73において、操作ログが供給されたと判断された場合、ステップS74において、操作ログ取得部46は、供給された操作ログは、正履歴であるか否かを判断する。例えば、操作ログが、録画操作である場合、その操作に対応する番組の番組ベクトルPPは、正履歴となり、操作ログが、再生していない録画データの消去である場合、その操作に対応する番組の番組ベクトルPPは、負履歴となる。   If it is determined in step S73 that an operation log has been supplied, in step S74, the operation log acquisition unit 46 determines whether or not the supplied operation log is a positive history. For example, when the operation log is a recording operation, the program vector PP of the program corresponding to the operation becomes a positive history, and when the operation log is erasure of recorded data that has not been reproduced, the program corresponding to the operation The program vector PP has a negative history.

ステップS74において、供給された操作ログは、正履歴であると判断された場合、ステップS75において、操作ログ取得部46は、正履歴であると判断された操作ログに対応する番組ベクトルPPをデータ取得部41から抽出し、正履歴保存部47に供給する。正履歴保存部47は、供給された番組ベクトルPPを、正履歴として追加保存する。   If it is determined in step S74 that the supplied operation log is a positive history, in step S75, the operation log acquisition unit 46 stores the program vector PP corresponding to the operation log determined to be a positive history. Extracted from the acquisition unit 41 and supplied to the positive history storage unit 47. The main history storage unit 47 additionally stores the supplied program vector PP as a main history.

ステップS76において、正履歴保存部47は、詳細項目ごと、または、大項目ごとに正履歴番組ベクトルPPのベクトルの総和を求めて、正履歴ベクトルUPを生成する。ステップS76の処理の終了後、処理は、ステップS72に戻り、それ以降の処理が繰り返される。   In step S76, the positive history storage unit 47 obtains the sum of the vectors of the positive history program vector PP for each detailed item or each large item, and generates a positive history vector UP. After the process of step S76 is completed, the process returns to step S72, and the subsequent processes are repeated.

ステップS74において、供給された操作ログは、正履歴ではないと判断された場合、供給された操作ログは、負履歴であるので、ステップS77において、操作ログ取得部46は、負履歴であると判断された操作ログに対応する番組ベクトルPPをデータ取得部41から抽出し、負履歴保存部48に供給する。負履歴保存部48は、供給された番組ベクトルPPを、負履歴として追加保存する。   If it is determined in step S74 that the supplied operation log is not a positive history, the supplied operation log is a negative history. Therefore, in step S77, the operation log acquisition unit 46 has a negative history. The program vector PP corresponding to the determined operation log is extracted from the data acquisition unit 41 and supplied to the negative history storage unit 48. The negative history storage unit 48 additionally stores the supplied program vector PP as a negative history.

ステップS78において、負履歴保存部48は、詳細項目ごと、または、大項目ごとに負履歴番組ベクトルPPのベクトルの総和を求めて、負履歴ベクトルMUPを生成する。テップS78の処理の終了後、処理は、ステップS72に戻り、それ以降の処理が繰り返される。   In step S78, the negative history storage unit 48 obtains the sum of the vectors of the negative history program vector PP for each detailed item or each large item, and generates a negative history vector MUP. After the end of step S78, the process returns to step S72, and the subsequent processes are repeated.

大項目が、正履歴ベクトルUP={タイトルTup,ジャンルGup,出演者Pup,脚本/原作/演出Aup,内容(キーワード)Kup}であり、大項目の中に詳細項目が記載されている場合、正履歴ベクトルUPにおいては、各詳細項目の後に、ベクトル総和を示す数値が記載される。例えば、図15に示されるように、大項目「ジャンル」に関しては、ジャンルGup={(ドラマ−25),(バラエティ−34),(スポーツ−42),(映画−37),(音楽−73),(子供向け/教育−120),(教養/ドキュメント−3),(ニュース/報道−5),(その他−23)}のように、詳細項目ごとに正履歴の総和を示す数値が記載される。また、大項目「タイトル」のように、単語によって示されるベクトルにおいては、例えば、タイトルTup={(title1−12),(title2−3),・・・}のように、単語に続いて、単語ごとの正履歴の総和を示す数値が記載される。負履歴ベクトルMUPにおいても、正履歴ベクトルUPと同様にして、項目に続いて総和を示す数値が記述される。   If the major item is the positive history vector UP = {title Tup, genre Gup, performer Pup, screenplay / original / production Aup, content (keyword) Kup}, and the detailed item is described in the major item, In the positive history vector UP, a numerical value indicating the vector sum is written after each detailed item. For example, as shown in FIG. 15, for the large item “genre”, the genre Gup = {(drama-25), (variety-34), (sports-42), (movie-37), (music-73). ), (For children / education-120), (education / document-3), (news / report-5), (others-23)}, the numerical value indicating the sum of the positive history is described for each detailed item. Is done. In addition, in a vector indicated by a word such as the large item “title”, for example, title Tup = {(title1-12), (title2-3),. A numerical value indicating the total sum of positive histories for each word is described. Similarly to the positive history vector UP, the negative history vector MUP also describes a numerical value indicating the sum following the item.

図15においては、正履歴ベクトルUP(および、負履歴ベクトルMUP)の大項目を、タイトル、ジャンル、出演者、脚本/原作/演出、内容(キーワード)とし、図5を用いて説明した番組ベクトルPPよりも少ない項目数であるものとして説明したが、番組ベクトルPPと同様の大項目としても良いことは言うまでもない。   In FIG. 15, the major items of the positive history vector UP (and negative history vector MUP) are the title, genre, performer, screenplay / original / production, content (keyword), and the program vector described with reference to FIG. Although it has been described that the number of items is smaller than that of the PP, it is needless to say that the same large items as the program vector PP may be used.

図14においては、初期登録の内容を基に、操作ログが入力される前に負履歴ベクトルMUPが生成されるものとして説明しているが、初期登録時に、ユーザが好ましいと思う番組を選択するための情報の登録を受けるようにし、操作ログが入力される前に正履歴ベクトルUPも生成されるようにしても良い。また、初期登録を基に正履歴ベクトルUP、または、負履歴ベクトルMUPを生成せず、操作ログのみを用いて正履歴ベクトルUP、または、負履歴ベクトルMUPを生成するようにしてもよい。   In FIG. 14, it is described that the negative history vector MUP is generated before the operation log is input based on the contents of the initial registration. It is also possible to receive registration of information for generating the positive history vector UP before the operation log is input. Further, the positive history vector UP or the negative history vector MUP may not be generated based on the initial registration, and the positive history vector UP or the negative history vector MUP may be generated using only the operation log.

このようにして、正履歴ベクトルUP、および、負履歴ベクトルMUPを独立して生成して保持することにより、より精密に、ユーザの嗜好とのマッチング処理を行うことができる。   In this way, the positive history vector UP and the negative history vector MUP are independently generated and held, whereby the matching process with the user's preference can be performed more precisely.

なお、このとき、正履歴および負履歴を、更に精緻に求めることができるようにしても良い。例えば、図14を用いて説明した処理においては、全ての項目における正履歴と負履歴に対応する番組ベクトルPPの総和を用いて、正履歴ベクトルUPおよび負履歴ベクトルMUPを生成したが、正履歴および負履歴に対応する番組ベクトルPPの総和を、例えば、ジャンル別に蓄積して、ジャンル別に正履歴ベクトルUPおよび負履歴ベクトルMUPを生成するようにしても良い。   At this time, the positive history and the negative history may be obtained more precisely. For example, in the process described with reference to FIG. 14, the positive history vector UP and the negative history vector MUP are generated using the sum of the program vectors PP corresponding to the positive history and the negative history in all items. For example, the total sum of the program vectors PP corresponding to the negative history may be accumulated for each genre, and the positive history vector UP and the negative history vector MUP may be generated for each genre.

放送される番組のジャンルによって、出演者が偏ってしまうことが頻繁に発生するため、ユーザの嗜好が正しく反映されない場合がある。具体的には、ドラマが好きで、バラエティは、ほとんどドラマに出演しないコメディアンAが出演するもののみを好み、バラエティ対ドラマの視聴比率が2:8であるユーザにおいて、ジャンルを区別せずに出演者の正履歴を蓄積した場合、ほとんどドラマに出演しないコメディアンAよりも、特に好きな俳優でないにもかかわらず、ドラマに頻繁に出演する出演者Bが、正履歴ベクトルUPにおいて高ポイントとなってしまう場合がある。このような場合、例えば、コメディアンAが出演するバラエティよりも、ドラマに頻繁に出演する出演者Bが出演するドキュメンタリーが推薦されてしまう。これを防止するためには、ジャンル別に正履歴および負履歴を蓄積し、これを基に、ジャンル別に正履歴ベクトルUPおよび負履歴ベクトルMUPを生成すればよい。   Depending on the genre of the broadcast program, the performers are often biased, so the user's preferences may not be correctly reflected. Specifically, users who like dramas and prefer only those with comedian A, who rarely appear in dramas, appear without distinguishing genres in users who have a 2: 8 audience ratio of variety versus drama. When accumulating the positive history of the performer, performer B who frequently appears in the drama is a higher point in the positive history vector UP than the comedian A, who hardly appears in the drama, even though he is not a favorite actor. May end up. In such a case, for example, a documentary in which a performer B who frequently appears in dramas appears is recommended rather than a variety in which comedian A appears. In order to prevent this, a positive history and a negative history are accumulated for each genre, and based on this, a positive history vector UP and a negative history vector MUP may be generated for each genre.

また、例えば、ユーザが解説者Aのファンであるので、「解説者Aが解説している球団Bの試合の実況中継」を好んで視聴しているような場合、ジャンルである「スポーツ」という情報は履歴として重なりやすいが、出演者である「解説者A」という情報は履歴として重なり難いので、他の解説者が解説している球団Bの試合の実況中継が推薦されて、解説者Aが出演しているバラエティ番組が推薦されないような場合が発生する。これを防止するためには、例えば、出演者別に正履歴および負履歴を蓄積し、これを基に、出演者別に正履歴ベクトルUPおよび負履歴ベクトルMUPを生成すればよい。   Also, for example, since the user is a fan of commentator A, when he likes to watch “the live broadcast of the game of team B explained by commentator A”, the genre is “sports”. Information is easy to overlap as history, but the information of the commentator “Explanator A” is difficult to overlap as history, so it is recommended that live commentary of the game of Team B that other commentators are commenting on is recommended. There is a case where a variety program in which is appearing is not recommended. In order to prevent this, for example, a positive history and a negative history are accumulated for each performer, and based on this, a positive history vector UP and a negative history vector MUP may be generated for each performer.

このように、特定の要素別に履歴を蓄積するようにすることにより、ユーザの好みをなまらせることなく、より緻密にユーザの嗜好を反映することが可能となる。   As described above, by storing the history for each specific element, it is possible to reflect the user's preference more precisely without easing the user's preference.

そして、マッチング処理部43において、このようにして生成された正履歴ベクトルUPおよび負履歴ベクトルMUPと、供給された番組ベクトルPPのマッチングを検証することにより、ユーザの嗜好を正しく反映した推薦番組情報を生成することが可能となる。   Then, in the matching processing unit 43, the recommended program information that correctly reflects the user's preference by verifying the matching between the positive history vector UP and the negative history vector MUP generated in this way and the supplied program vector PP. Can be generated.

次に、図16のフローチャートを参照して、ジャンル別に履歴を蓄積するようにした、正履歴ベクトルおよび負履歴ベクトル生成処理2について説明する。   Next, the positive history vector and negative history vector generation processing 2 in which the history is accumulated by genre will be described with reference to the flowchart of FIG.

ステップS81乃至ステップS84において、図14のステップS71乃至ステップS74と同様の処理が実行される。すなわち、初期登録が参照されて、負履歴ベクトルMUPが生成され、初期登録内容が変更されたか否かが判断されて、変更されなかった場合、供給された操作ログが、正履歴であるか否かが判断される。   In steps S81 to S84, the same processing as in steps S71 to S74 of FIG. 14 is executed. That is, the initial registration is referred to, the negative history vector MUP is generated, and it is determined whether or not the initial registration contents have been changed. If not, the supplied operation log is a positive history. Is judged.

ステップS84において、供給された操作ログが正履歴であると判断された場合、ステップS85において、操作ログ取得部46は、正履歴であると判断された操作ログに対応する番組ベクトルPPをデータ取得部41から抽出し、正履歴保存部47に供給する。正履歴保存部47は、供給された番組ベクトルPPのジャンルを抽出する。   If it is determined in step S84 that the supplied operation log is a positive history, in step S85, the operation log acquisition unit 46 acquires the program vector PP corresponding to the operation log determined to be a positive history. Extracted from the unit 41 and supplied to the positive history storage unit 47. The positive history storage unit 47 extracts the genre of the supplied program vector PP.

ステップS86において、正履歴保存部47は、データ取得部41から抽出された番組ベクトルPPを、ジャンル別に、正履歴として追加保存する。   In step S86, the main history storage unit 47 additionally stores the program vector PP extracted from the data acquisition unit 41 as a main history for each genre.

ステップS87において、正履歴保存部47は、詳細項目ごと、または、大項目ごとに、番組ベクトルが追加保存されたジャンルにおいて、正履歴の番組ベクトルPPのベクトルの総和を求めて、対応するジャンルの正履歴ベクトルUPを生成する。ステップS87の処理の終了後、処理は、ステップS82に戻り、それ以降の処理が繰り返される。   In step S87, the correct history storage unit 47 obtains the sum of the vectors of the correct history program vector PP in the genre in which the program vectors are additionally stored for each detailed item or each large item, and for the corresponding genre. Generate positive history vector UP. After the process of step S87 ends, the process returns to step S82, and the subsequent processes are repeated.

ステップS84において、供給された操作ログが正履歴ではないと判断された場合、供給された操作ログは負履歴であるので、ステップS88において、操作ログ取得部46は、負履歴であると判断された操作ログに対応する番組ベクトルPPをデータ取得部41から抽出し、負履歴保存部48に供給する。負履歴保存部48は、供給された番組ベクトルPPのジャンルを抽出する。   If it is determined in step S84 that the supplied operation log is not a positive history, the supplied operation log is a negative history. Therefore, in step S88, the operation log acquisition unit 46 is determined to be a negative history. The program vector PP corresponding to the operation log is extracted from the data acquisition unit 41 and supplied to the negative history storage unit 48. The negative history storage unit 48 extracts the genre of the supplied program vector PP.

ステップS89において、負履歴保存部48は、データ取得部41から抽出された番組ベクトルPPを、ジャンル別に、負履歴として追加保存する。   In step S89, the negative history storage unit 48 additionally stores the program vector PP extracted from the data acquisition unit 41 as a negative history for each genre.

ステップS90において、負履歴保存部48は、詳細項目ごと、または、大項目ごとに、番組ベクトルが追加保存されたジャンルにおいて、負履歴の番組ベクトルPPのベクトルの総和を求めて、対応するジャンルの負履歴ベクトルMUPを生成する。ステップS90の処理の終了後、処理は、ステップS82に戻り、それ以降の処理が繰り返される。   In step S90, the negative history storage unit 48 obtains the sum of the vectors of the negative history program vector PP in the genre in which the program vectors are additionally stored for each detailed item or each large item, and for the corresponding genre. A negative history vector MUP is generated. After the process of step S90 ends, the process returns to step S82, and the subsequent processes are repeated.

このような処理により、ジャンル別に正履歴ベクトルUPと負履歴ベクトルMUPが生成されるので、ユーザの好みをなまらせることなく、より緻密にユーザの嗜好を反映することが可能となり、ユーザの嗜好を正しく反映した推薦番組情報を生成することが可能となる。   By such processing, a positive history vector UP and a negative history vector MUP are generated for each genre, so that it is possible to reflect the user's preference more precisely without sloppy the user's preference. It is possible to generate recommended program information that is correctly reflected.

図17のフローチャートを参照して、番組ベクトルPP、正履歴ベクトルUPおよび負履歴ベクトルMUPが、詳細項目の全要素を1列に並べたベクトルで表されている場合の、マッチング処理1について説明する。   With reference to the flowchart of FIG. 17, the matching process 1 in the case where the program vector PP, the positive history vector UP, and the negative history vector MUP are represented by vectors in which all elements of the detailed items are arranged in one column will be described. .

ステップS101において、番組ベクトル抽出部42は、複数番組(例えば、所定の時間帯に放送される番組)の番組ベクトルPPをデータ取得部41から抽出して、マッチング処理部43の正規化処理部61に供給する。正規化処理部61は、供給された番組ベクトルPPと、正履歴保存部47から読み出した正履歴ベクトルUPの構成要素のうち、単語で構成されているタイトルおよび内容についての正規化を行い、ベクトル演算部62に正規化結果を供給する。   In step S <b> 101, the program vector extraction unit 42 extracts program vectors PP of a plurality of programs (for example, programs broadcast in a predetermined time zone) from the data acquisition unit 41, and normalization processing unit 61 of the matching processing unit 43. To supply. The normalization processing unit 61 performs normalization on the title and content composed of words among the components of the supplied program vector PP and the positive history vector UP read from the positive history storage unit 47, and the vector The normalization result is supplied to the calculation unit 62.

具体的には、正規化処理部61は、供給された番組ベクトルPPが、例えば、タイトルTm={東海道−1,三谷−1,怪談−1}である場合、タイトルTm={東海道:0.33,三谷:0.33,怪談:0.33}として、その番組ごとに、その項目内の単語のトータルで、重みが1になるように正規化する。   Specifically, when the supplied program vector PP is, for example, the title Tm = {Tokaido-1, Mitani-1, Kaidan-1}, the normalization processing unit 61 has the title Tm = {Tokaido: 0. 33, Mitani: 0.33, Kaidan: 0.33}, and normalize so that the total weight of the words in the item is 1 for each program.

ステップS102において、マッチング処理部43のベクトル演算部62は、上述した式(1)を用いて、複数番組の番組ベクトルPPと正履歴ベクトルUPのコサイン距離である類似度SimUPを算出する。   In step S102, the vector calculation unit 62 of the matching processing unit 43 calculates similarity SimUP, which is a cosine distance between the program vector PP of a plurality of programs and the positive history vector UP, using the above-described equation (1).

ステップS103において、ベクトル演算部62は、ステップS102において算出された、番組ベクトルPPと正履歴ベクトルUPとの類似度を示す類似度SimUPを比較し、類似度の上位から、例えば、10などの所定の数だけ、番組ベクトルPPを抽出する。   In step S103, the vector calculation unit 62 compares the similarity SimUP indicating the similarity between the program vector PP and the positive history vector UP calculated in step S102. The program vector PP is extracted by the number of.

ステップS104において、ベクトル演算部62は、ステップS103において抽出された番組ベクトルPPと、負履歴保存部48から読み出した負履歴ベクトルMUPとのコサイン距離である類似度SimMUPを、上述した式(2)を用いて算出する。   In step S104, the vector calculation unit 62 calculates the similarity SimMUP, which is a cosine distance between the program vector PP extracted in step S103 and the negative history vector MUP read from the negative history storage unit 48, using the equation (2) described above. Calculate using.

ステップS105において、ベクトル演算部62は、正履歴ベクトルUPとの類似度(すなわち、コサイン距離)SimUP−負履歴ベクトルとの類似度(すなわち、コサイン距離)SimMUPを算出し、その上位となる、所定数(例えば、1つ)の番組の番組ベクトルまたはEPGデータを推薦情報として抽出し、推薦情報出力部49に出力して、推薦番組リスト50に登録させるとともに、テレビジョン表示装置11および録画再生装置12に出力して、処理が終了される。   In step S105, the vector calculation unit 62 calculates a similarity (ie, cosine distance) SimUP-similarity (ie, cosine distance) SimMUP with the positive history vector UP, and is a higher order. A program vector or EPG data of a number of programs (for example, one) is extracted as recommended information, output to the recommended information output unit 49, registered in the recommended program list 50, and the television display device 11 and the recording / playback device. 12 to finish the process.

このような処理により、番組ベクトルPP、正履歴ベクトルUPおよび負履歴ベクトルMUPが、詳細項目の全要素を1列に並べたベクトルで表されている場合において、番組ベクトルPPと正履歴ベクトルUPとの類似度と、番組ベクトルPPと負履歴ベクトルとの類似度とを基に、ユーザの嗜好に合致した推薦番組を決定することが可能となる。   By such processing, when the program vector PP, the positive history vector UP, and the negative history vector MUP are expressed by vectors in which all the elements of the detailed items are arranged in one column, the program vector PP and the positive history vector UP It is possible to determine a recommended program that matches the user's preference based on the similarity between the program vector PP and the negative history vector.

次に、図18のフローチャートを参照して、単語で示される項目の正規化を行うのではなく、大項目ごとにコサイン距離の計算を行い、その和を類似度SimUPおよび類似度SimMUPとして算出することにより推薦番組を決定する、マッチング処理2について説明する。   Next, referring to the flowchart of FIG. 18, instead of normalizing the items indicated by words, the cosine distance is calculated for each large item, and the sum is calculated as similarity SimUP and similarity SimMUP. The matching process 2 for determining the recommended program will be described.

ステップS111において、番組ベクトル抽出部42は、複数番組(例えば、所定の時間帯に放送される番組)の番組ベクトルPPをデータ取得部41から抽出して、マッチング処理部43のベクトル演算部62に供給する。ベクトル演算部62は、供給された番組ベクトルPPと、正履歴保存部47から読み出した正履歴ベクトルUPのそれぞれの大項目について、番組ベクトルPPと正履歴ベクトルUPのコサイン距離を算出する。   In step S111, the program vector extraction unit 42 extracts program vectors PP of a plurality of programs (for example, programs broadcast in a predetermined time zone) from the data acquisition unit 41, and sends them to the vector calculation unit 62 of the matching processing unit 43. Supply. The vector calculation unit 62 calculates the cosine distance between the program vector PP and the positive history vector UP for each major item of the supplied program vector PP and the positive history vector UP read from the positive history storage unit 47.

ステップS112において、ベクトル演算部62は、ステップS111において項目ごとに算出されたコサイン距離の値を、上述した式(4)を用いて合計し、類似度SimUPを算出する。   In step S112, the vector calculation unit 62 calculates the similarity SimUP by summing up the cosine distance values calculated for each item in step S111 using the above-described equation (4).

ステップS113において、ベクトル演算部62は、ステップS112において算出された、番組ベクトルPPと正履歴ベクトルUPとの類似度SimUPを比較し、類似度の上位から、例えば、10などの所定の数の番組ベクトルPPを抽出する。   In step S113, the vector calculation unit 62 compares the similarity SimUP between the program vector PP and the positive history vector UP calculated in step S112, and determines a predetermined number of programs such as 10 from the top of the similarity. Extract vector PP.

ステップS114において、ベクトル演算部62は、ステップS113の処理により抽出された番組ベクトルPPと、負履歴保存部48から読み出した負履歴ベクトルMUPのそれぞれの大項目について、番組ベクトルPPと負履歴ベクトルMUPのコサイン距離を算出する。   In step S114, the vector calculation unit 62 determines the program vector PP and the negative history vector MUP for each major item of the program vector PP extracted by the process of step S113 and the negative history vector MUP read from the negative history storage unit 48. Cosine distance is calculated.

ステップS115において、ベクトル演算部62は、ステップS114において項目ごとに算出されたコサイン距離の値を、上述した式(4)を用いて合計し、類似度SimMUPを算出する。   In step S115, the vector calculation unit 62 calculates the similarity SimMUP by summing up the cosine distance values calculated for each item in step S114 using the above-described equation (4).

ステップS116において、ベクトル演算部62は、{番組ベクトルPPと正履歴ベクトルUPとのコサイン距離である類似度SimUP}−{番組ベクトルPPと負履歴ベクトルとのコサイン距離である類似度SimMUP}を算出し、その上位となる所定数(例えば3つ)の番組の番組ベクトルPPまたはEPGデータを推薦情報として抽出し、推薦情報出力部49に出力して、推薦番組リスト50に登録させるとともに、テレビジョン表示装置11および録画再生装置12に出力して、処理が終了される。   In step S116, the vector calculation unit 62 calculates {similarity SimUP which is a cosine distance between the program vector PP and the positive history vector UP} − {similarity SimMUP which is a cosine distance between the program vector PP and the negative history vector}. Then, the program vector PP or EPG data of a predetermined number (for example, three) programs that are higher in rank are extracted as recommended information, output to the recommended information output unit 49, registered in the recommended program list 50, and television. The data is output to the display device 11 and the recording / playback device 12, and the process is terminated.

このような処理により、単語で示される項目の正規化を行うことなく、大項目ごとに演算結果の和が類似度SimUPおよび類似度SimMUPとして算出されるので、異なる大項目に属する詳細要素間の履歴の重なりの偏りの影響を受けることなく、番組ベクトルPPと正履歴ベクトルUPとの類似度と、番組ベクトルPPと負履歴ベクトルMUPとの類似度とを基に、ユーザの嗜好に合致した推薦番組を決定することが可能となる。   By such processing, the sum of the calculation results for each large item is calculated as similarity SimUP and similarity SimMUP without normalizing the items indicated by words, so detailed elements belonging to different large items can be compared. Based on the similarity between the program vector PP and the positive history vector UP and the similarity between the program vector PP and the negative history vector MUP without being affected by the bias of the history overlap, a recommendation that matches the user's preference The program can be determined.

図17および図18を用いて説明したマッチング処理1およびマッチング処理2においては、ユーザの正履歴ベクトルUPとの類似度が高い番組から、負履歴を用いて、ユーザが好まないと思われる番組を取り除くことができるものとして説明しているが、例えば、正履歴のみを用いて推薦番組を決定するようにしてもよい。   In the matching process 1 and the matching process 2 described with reference to FIGS. 17 and 18, a program that the user seems not to like using a negative history is selected from programs having a high similarity to the user's positive history vector UP. Although it has been described that it can be removed, for example, the recommended program may be determined using only the positive history.

また、ユーザによっては、番組を選択するにあたり、ニュースや報道番組を非常に好んだり、ジャンルよりも出演者が重要であったり、出演者にはこだわらないが、内容が重要であるなど、番組を選択するために重み付けられる項目と、重み付けられない項目、換言すれば、重要な項目とそうでない項目が固定している場合がある。   In addition, some users may like programs such as news or news programs very much when selecting a program, performers are more important than genres, and content is important, although they are not particular about performers. In some cases, items that are weighted to select the item and items that are not weighted, in other words, important items and items that are not weighted are fixed.

従って、マッチング処理は、上述した番組側効き目ベクトルEfPP、ユーザ側効き目ベクトルEfUP、または、ユーザ側反効き目ベクトルEfMUPを利用して行うようにしてもよい。また、番組側効き目ベクトルEfPP、ユーザ側効き目ベクトルEfUP、または、ユーザ側反効き目ベクトルEfMUPを利用するか否かは、ユーザにより設定可能なようにしても良い。   Therefore, the matching process may be performed using the above-described program-side effect vector EfPP, user-side effect vector EfUP, or user-side effect vector EfMUP. Further, whether to use the program side effect vector EfPP, the user side effect vector EfUP, or the user side effect vector EfMUP may be set by the user.

次に、図19のフローチャートを参照して、番組ベクトルPP、正履歴ベクトルUPおよび負履歴ベクトルMUPが、詳細項目の全要素を1列に並べたベクトルで表されている場合に、ユーザの設定により、番組側効き目ベクトルEfPPまたはユーザ側効き目ベクトルEfUPを利用してマッチング処理を行う、マッチング処理3について説明する。   Next, referring to the flowchart of FIG. 19, when the program vector PP, the positive history vector UP, and the negative history vector MUP are represented by vectors in which all the elements of the detailed items are arranged in one column, the user setting Thus, the matching process 3 for performing the matching process using the program side effect vector EfPP or the user side effect vector EfUP will be described.

ステップS121において、ベクトル演算部62は、操作入力部44を用いてユーザにより入力され、初期登録保存部45に登録されている番組側効き目ベクトルEfPPおよびユーザ側効き目ベクトルEfUPまたはユーザ側反効き目ベクトルEfMUPの利用設定内容を取得する。効き目ベクトルの利用設定内容とは、マッチング処理において、番組側効き目ベクトルEfPP、ユーザ側効き目ベクトルEfUPまたはユーザ側反効き目ベクトルEfMUPを利用して、重み付けを行うか否かを示す情報である。   In step S121, the vector calculation unit 62 is input by the user using the operation input unit 44, and is registered in the initial registration storage unit 45. The program side effect vector EfPP and the user side effect vector EfUP or the user side effect vector EfMUP. Get the usage settings for. The effect vector usage setting content is information indicating whether or not weighting is performed using the program side effect vector EfPP, the user side effect vector EfUP, or the user side effect vector EfMUP in the matching process.

ステップS122において、ベクトル演算部62は、必要に応じて、ユーザ情報登録部63から、ユーザ側効き目ベクトルEfUPを読み込み、次の式(5)を用いて、番組ベクトルPPと正履歴ベクトルUPのコサイン距離を算出し、類似度SimUPとする。   In step S122, the vector calculation unit 62 reads the user side effect vector EfUP from the user information registration unit 63 as necessary, and uses the following equation (5) to cosine the program vector PP and the positive history vector UP. The distance is calculated and the similarity is SimUP.

Figure 0004501948
Figure 0004501948

なお、式(5)においては、番組ベクトルPP=(p1、p2、・・・)、正履歴ベクトルUP=(u1,u2,・・・)、番組側効き目ベクトルEfPP=(epd1,epd2,・・・)、ユーザ側効き目ベクトルEfUP=(eud1,eud2,・・・)であるものとする。また、式(5)においては、番組側効き目ベクトルEfPPおよびユーザ側効き目ベクトルEfUPのいずれをも利用するものとして説明しているが、設定により、番組側効き目ベクトルEfPPおよびユーザ側効き目ベクトルEfUPのうちのいずれかが利用されない場合、利用されないベクトルに代わって数値「1」が代入されて計算される。   In equation (5), program vector PP = (p1, p2,...), Positive history vector UP = (u1, u2,...), Program side effect vector EfPP = (epd1, epd2,. ..) And the user side effect vector EfUP = (eud1, eud2,...). Further, in the equation (5), it is described that both the program side effect vector EfPP and the user side effect vector EfUP are used, but depending on the setting, of the program side effect vector EfPP and the user side effect vector EfUP, When any of the above is not used, the numerical value “1” is substituted for the unused vector and calculated.

また、ユーザ側効き目ベクトルEfUPは、ユーザにより設定可能であっても、ユーザの初期設定を基に設定されるものであっても良いし、ユーザ情報登録部63において生成されるものであっても良い。ユーザ側効き目ベクトルEfUPの生成の詳細については、図22乃至図25を用いて後述する。   Further, the user side effect vector EfUP may be set by the user, may be set based on the initial setting of the user, or may be generated by the user information registration unit 63. good. Details of generation of the user-side effect vector EfUP will be described later with reference to FIGS.

ステップS123において、ベクトル演算部62は、ステップS122において算出された、番組ベクトルPPと正履歴ベクトルUPとの類似度SimUPを比較し、類似度の上位から、例えば、10などの所定の数の番組ベクトルPPを抽出する。   In step S123, the vector calculation unit 62 compares the similarity SimUP between the program vector PP and the positive history vector UP calculated in step S122, and determines a predetermined number of programs such as 10 from the top of the similarity. Extract vector PP.

ステップS124において、ベクトル演算部62は、必要に応じて、ユーザ情報登録部63から、ユーザ側反効き目ベクトルEfMUPを読み込み、次の式(6)を用いて、ステップS123において抽出された番組ベクトルPPと負履歴ベクトルMUPのコサイン距離を算出する。   In step S124, the vector calculation unit 62 reads the user-side reaction vector EfMUP from the user information registration unit 63 as necessary, and uses the following equation (6) to extract the program vector PP extracted in step S123. And the cosine distance of the negative history vector MUP.

Figure 0004501948
Figure 0004501948

なお、式(6)においては、番組ベクトルPP=(p1、p2、・・・)、負履歴ベクトルMUP=(m1,m2,・・・)、番組側効き目ベクトルEfPP=(epd1,epd2,・・・)、ユーザ側反効き目ベクトルEfMUP=(emd1,emd2,・・・)であるものとする。また、式(6)においては、番組側効き目ベクトルEfPPおよびユーザ側反効き目ベクトルEfMUPのいずれをも利用するものとして説明しているが、設定により、番組側効き目ベクトルEfPPおよびユーザ側反効き目ベクトルEfMUPのうちのいずれかが利用されない場合、利用されないベクトルに代わって、数値「1」が代入されて計算される。   In equation (6), program vector PP = (p1, p2,...), Negative history vector MUP = (m1, m2,...), Program side effect vector EfPP = (epd1, epd2,. ..., And user side reaction vector EfMUP = (emd1, emd2,...). Further, in the equation (6), it is described that both the program side effect vector EfPP and the user side reaction vector EfMUP are used. However, depending on the setting, the program side effect vector EfPP and the user side reaction vector EfMUP are used. When any one of the above is not used, the numerical value “1” is substituted for calculation instead of the unused vector.

また、ユーザ側反効き目ベクトルEfMUPは、ユーザにより設定可能であっても、ユーザの初期設定を基に設定されるものであっても良いし、ユーザ情報登録部63において生成されるものであっても良い。ユーザ側反効き目ベクトルEfMUPの生成の詳細については、図26または図27を用いて後述する。   Further, the user side reaction vector EfMUP may be set by the user, may be set based on the initial setting of the user, or is generated by the user information registration unit 63. Also good. Details of generation of the user side reaction vector EfMUP will be described later with reference to FIG. 26 or FIG.

ステップS125において、ベクトル演算部62は、番組ベクトルPPと正履歴ベクトルUPとの類似度SimUP−番組ベクトルPPと負履歴ベクトルとの類似度SimMUPを算出し、その上位となる所定数(例えば3つ)の番組の番組ベクトルPPまたはEPGデータを推薦情報として抽出し、推薦情報出力部49に出力して、推薦番組リスト50に登録させるとともに、テレビジョン表示装置11および録画再生装置12に出力して、処理が終了される。   In step S125, the vector calculation unit 62 calculates the similarity SimUP between the program vector PP and the positive history vector UP—the similarity SimMUP between the program vector PP and the negative history vector, and a predetermined number (for example, three) higher than that. ) Is extracted as recommendation information, output to the recommendation information output unit 49, registered in the recommended program list 50, and output to the television display device 11 and the recording / playback device 12 The process is terminated.

このような処理により、設定に応じて、番組側効き目ベクトルEfPP、ユーザ側効き目ベクトルEfUP、または、ユーザ側反効き目ベクトルEfMUPが用いられて、推薦情報が抽出されるので、ユーザの嗜好を正しく反映した番組を推薦するようにすることができる。   Through such processing, the recommendation information is extracted using the program side effect vector EfPP, the user side effect vector EfUP, or the user side reaction vector EfMUP according to the setting, so that the user's preference is correctly reflected. The recommended program can be recommended.

図19を用いて説明した処理では、番組ベクトルPP、正履歴ベクトルUPおよび負履歴ベクトルMUPが、詳細項目の全要素を1列に並べたベクトルで表されている場合の処理について説明したが、番組ベクトルPP、正履歴ベクトルUPおよび負履歴ベクトルMUPを、それぞれ、大項目ごとに演算するようにしても良い。   In the processing described with reference to FIG. 19, the processing in the case where the program vector PP, the positive history vector UP, and the negative history vector MUP are represented by vectors in which all elements of the detailed items are arranged in one column has been described. The program vector PP, the positive history vector UP, and the negative history vector MUP may be calculated for each major item.

次に、図20のフローチャートを参照して、大項目ごとに、番組側効き目ベクトルEfPP、ユーザ側効き目ベクトルEfUP、または、ユーザ側反効き目ベクトルEfMUPを反映させることができるようにした、マッチング処理4について説明する。   Next, referring to the flowchart of FIG. 20, the matching process 4 is performed so that the program side effect vector EfPP, the user side effect vector EfUP, or the user side effect vector EfMUP can be reflected for each major item. Will be described.

ステップS131において、図19のステップS121と同様の処理が実行されて、効き目ベクトルの利用設定内容が取得される。   In step S131, processing similar to that in step S121 of FIG. 19 is executed, and the usage setting content of the effect vector is acquired.

ステップS132において、ベクトル演算部62は、供給された番組ベクトルPPと、正履歴保存部47から読み出した正履歴ベクトルUPのそれぞれの大項目について、番組ベクトルPPと正履歴ベクトルUPのコサイン距離を算出する。ここでは、効き目ベクトルは演算に利用されない。   In step S132, the vector calculation unit 62 calculates the cosine distance between the program vector PP and the positive history vector UP for each major item of the supplied program vector PP and the positive history vector UP read from the positive history storage unit 47. To do. Here, the effect vector is not used for the calculation.

ステップS133において、ベクトル演算部62は、次の式(7)を用いて、項目ごとに算出されたコサイン距離に、必要に応じて効き目ベクトルを乗算し、得られた値を合計して、類似度SimUPを算出する。   In step S133, the vector calculation unit 62 uses the following equation (7) to multiply the cosine distance calculated for each item by an effect vector as necessary, and sums the obtained values to obtain a similarity. Calculate the degree SimUP.

SimUP=epdt・eudt・cosθut+ epdg・eudg・cosθug+ epdp・eudp・cosθup
+ epda・euda・cosθua+ epdk・eudk・cosθuk・・・(7)
SimUP = epdt ・ eudt ・ cosθut + epdg ・ eudg ・ cosθug + epdp ・ eudp ・ cosθup
+ epda, euda, cosθua + epdk, eudk, cosθuk (7)

なお、式(7)においては、番組ベクトルPP=(pt,pg,pp,pa,pk)と正履歴ベクトルUP=(ut,ug,up,ua,uk)との大項目ごとのコサイン距離が、(cosθut,cosθug,cosθup ,cosθua,cosθuk)であり、番組側効き目ベクトルEfPP=(epdt,epdg,epdp,epda,epdk)、ユーザ側効き目ベクトルEfUP=(eudt,eudg,eudp,euda,eudk)であるものとする。また、式(7)においては、番組側効き目ベクトルEfPPおよびユーザ側効き目ベクトルEfUPのいずれをも利用するものとして説明しているが、設定により、番組側効き目ベクトルEfPPおよびユーザ側効き目ベクトルEfUPのうちのいずれかが利用されない場合、利用されないベクトルに代わって、数値「1」が代入されて計算される。   In equation (7), the cosine distance for each major item of program vector PP = (pt, pg, pp, pa, pk) and positive history vector UP = (ut, ug, up, ua, uk) , (Cosθut, cosθug, cosθup, cosθua, cosθuk), program side effect vector EfPP = (epdt, epdg, epdp, epda, epdk), user side effect vector EfUP = (eudt, eudg, eudp, euda, eudk) Suppose that Further, in the equation (7), it is described that both the program side effect vector EfPP and the user side effect vector EfUP are used, but depending on the setting, of the program side effect vector EfPP and the user side effect vector EfUP, If any one of the above is not used, the numerical value “1” is substituted for calculation instead of the unused vector.

ステップS134において、ベクトル演算部62は、ステップS133において算出された、番組ベクトルPPと正履歴ベクトルUPとの類似度SimUPを比較し、類似度の上位から、例えば、10などの所定の数の番組ベクトルPPを抽出する。   In step S134, the vector calculation unit 62 compares the similarity SimUP between the program vector PP and the positive history vector UP calculated in step S133, and determines a predetermined number of programs such as 10 from the top of the similarity. Extract vector PP.

ステップS135において、ベクトル演算部62は、ステップS134の処理により抽出された番組ベクトルPPと、負履歴保存部48から読み出した負履歴ベクトルMUPのそれぞれの大項目について、番組ベクトルPPと負履歴ベクトルMUPのコサイン距離を算出する。ここでは、効き目ベクトルは演算に利用されない。   In step S135, the vector calculation unit 62 determines the program vector PP and the negative history vector MUP for each major item of the program vector PP extracted by the process of step S134 and the negative history vector MUP read from the negative history storage unit 48. Cosine distance is calculated. Here, the effect vector is not used for the calculation.

ステップS136において、ベクトル演算部62は、次の式(8)を用いて、項目ごとに算出されたコサイン距離に、必要に応じて効き目ベクトルを乗算し、得られた値を合計して、類似度SimMUPを算出する。   In step S136, the vector calculation unit 62 uses the following equation (8) to multiply the cosine distance calculated for each item by an effect vector as necessary, and sums the obtained values to obtain a similarity. Calculate the degree SimMUP.

SimMUP=epdt・emdt・cosθmt+ epdg・emdg・cosθmg+ epdp・emdp・cosθmp
+ epda・emda・cosθma+ epdk・emdk・cosθmk・・・(8)
SimMUP = epdt ・ emdt ・ cosθmt + epdg ・ emdg ・ cosθmg + epdp ・ emdp ・ cosθmp
+ epda ・ emda ・ cosθma + epdk ・ emdk ・ cosθmk (8)

なお、式(8)においては、番組ベクトルPP=(pt,pg,pp,pa,pk)と負履歴ベクトルUP=(mt,mg,mp,ma,mk)との大項目ごとのコサイン距離が、(cosθmt,cosθmg,cosθmp ,cosθma,cosθmk)であり、番組側効き目ベクトルEfPP=(epdt,epdg,epdp,epda,epdk、)、ユーザ側反効き目ベクトルEfMUP=(emdt,emdg,emdp,emda,emdk)であるものとする。また、式(8)においては、番組側効き目ベクトルEfPPおよびユーザ側反効き目ベクトルEfMUPのいずれをも利用するものとして説明しているが、設定により、番組側効き目ベクトルEfPPおよびユーザ側反効き目ベクトルEfMUPのうちのいずれかが利用されない場合、利用されないベクトルに代わって、数値「1」が代入されて計算される。   In equation (8), the cosine distance for each major item of program vector PP = (pt, pg, pp, pa, pk) and negative history vector UP = (mt, mg, mp, ma, mk) , (Cosθmt, cosθmg, cosθmp, cosθma, cosθmk), program-side effect vector EfPP = (epdt, epdg, epdp, epda, epdk,), user-side reaction vector EfMUP = (emdt, emdg, emdp, emda, emdk). Further, in the equation (8), it is described that both the program side effect vector EfPP and the user side reaction vector EfMUP are used, but depending on the setting, the program side effect vector EfPP and the user side reaction vector EfMUP When any one of the above is not used, the numerical value “1” is substituted for calculation instead of the unused vector.

ステップS137において、ベクトル演算部62は、{番組ベクトルPPと正履歴ベクトルUPとのコサイン距離である類似度SimUP}−{番組ベクトルPPと負履歴ベクトルとのコサイン距離である類似度SimMUP}を算出し、その上位となる所定数(例えば3つ)の番組の番組ベクトルPPまたはEPGデータを推薦情報として抽出し、推薦情報出力部49に出力して、推薦番組リスト50に登録させるとともに、テレビジョン表示装置11および録画再生装置12に出力して、処理が終了される。   In step S137, the vector calculation unit 62 calculates {similarity SimUP which is a cosine distance between the program vector PP and the positive history vector UP} − {similarity SimMUP which is a cosine distance between the program vector PP and the negative history vector}. Then, the program vector PP or EPG data of a predetermined number (for example, three) programs that are higher in rank are extracted as recommended information, output to the recommended information output unit 49, registered in the recommended program list 50, and television. The data is output to the display device 11 and the recording / playback device 12, and the process is terminated.

このような処理により、大項目ごとに、効き目ベクトルが利用されて重み付けが行われるので、ユーザの嗜好に詳細に合致した推薦情報を生成することが可能となる。   With such a process, the effect vector is used for each large item and weighting is performed, so that it is possible to generate recommendation information that matches the user's preference in detail.

次に、図21のフローチャートを参照して、図16を用いて説明した正履歴ベクトルおよび負履歴ベクトル生成処理2の処理により生成された、ジャンル別の正履歴ベクトルUPおよび負履歴ベクトルMUP、並びに、ジャンル別のユーザ側効き目ベクトルEfUPおよびユーザ側反効き目ベクトルEfMUPを用いて、マッチング処理を実行するマッチング処理5について説明する。   Next, referring to the flowchart of FIG. 21, the positive history vector UP and negative history vector MUP for each genre generated by the processing of the positive history vector and negative history vector generation processing 2 described with reference to FIG. The matching process 5 for executing the matching process using the user-side effect vector EfUP and the user-side reaction vector EfMUP for each genre will be described.

ステップS141において、図19のステップS121と同様の処理が実行されて、効き目ベクトルの利用設定内容が取得される。   In step S141, processing similar to that in step S121 of FIG. 19 is executed, and the effect vector usage setting content is acquired.

ステップS142において、ベクトル演算部62は、供給された番組ベクトルPPのジャンルを抽出する。ここでは、例えば、供給された番組ベクトルPPのジャンルが「ドラマ」であったものとして説明する。   In step S142, the vector calculation unit 62 extracts the genre of the supplied program vector PP. Here, for example, it is assumed that the genre of the supplied program vector PP is “drama”.

ステップS143において、ベクトル演算部62は、供給された番組ベクトルPPと、正履歴保存部47から読み出した、ジャンル「ドラマ」に対応する正履歴ベクトルUPのそれぞれの大項目について、番組ベクトルPPと正履歴ベクトルUPのコサイン距離を算出する。ここでは、効き目ベクトルは演算に利用されない。   In step S143, the vector calculation unit 62 sets the program vector PP and the correct program vector PP for each major item of the supplied program vector PP and the correct history vector UP corresponding to the genre “drama” read from the correct history storage unit 47. Calculate cosine distance of history vector UP. Here, the effect vector is not used for the calculation.

ステップS144において、ベクトル演算部62は、次の式(9)を用いて、項目ごとに算出されたコサイン距離に、必要に応じて、ジャンル「ドラマ」に対応するユーザ側効き目ベクトルを乗算し、得られた値を合計して、類似度SimUPを算出する。   In step S144, the vector calculation unit 62 multiplies the cosine distance calculated for each item by the user-side effect vector corresponding to the genre “drama” using the following equation (9), The obtained values are summed to calculate the similarity SimUP.

SimUP=epdt・eudtd・cosθutd+ epdg・eudgd・cosθugd+ epdp・eudpd・cosθupd
+ epda・eudad・cosθuad+ epdk・eudkd・cosθukd・・・(9)
SimUP = epdt ・ eudtd ・ cosθutd + epdg ・ eudgd ・ cosθugd + epdp ・ eudpd ・ cosθupd
+ epda, eudad, cosθuad + epdk, eudkd, cosθukd (9)

なお、式(9)においては、番組ベクトルPP=(pt,pg,pp,pa,pk)と、ジャンル「ドラマ」に対応する正履歴ベクトルUP=(ut,ug,up,ua,uk)との大項目ごとのコサイン距離が、(cosθutd,cosθugd,cosθupd ,cosθuad,cosθukd)であり、番組側効き目ベクトルEfPP=(epdt,epdg,epdp,epda,epdk)、ジャンル「ドラマ」に対応するユーザ側効き目ベクトルEfUP=(eudtd,eudgd,eudpd,eudad,eudkd)であるものとする。また、式(9)においては、番組側効き目ベクトルEfPPおよびユーザ側効き目ベクトルEfUPのいずれをも利用するものとして説明しているが、設定により、番組側効き目ベクトルEfPPおよびユーザ側効き目ベクトルEfUPのうちのいずれかが利用されない場合、利用されないベクトルに代わって、数値「1」が代入されて計算される。   In Equation (9), program vector PP = (pt, pg, pp, pa, pk) and positive history vector UP = (ut, ug, up, ua, uk) corresponding to the genre “drama”. The cosine distance for each major item is (cosθutd, cosθugd, cosθupd, cosθuad, cosθukd), the program side effect vector EfPP = (epdt, epdg, epdp, epda, epdk), and the user side corresponding to the genre “drama” It is assumed that the effectiveness vector EfUP = (eudtd, eudgd, eudpd, eudad, eudkd). Further, in the equation (9), it is described that both the program side effect vector EfPP and the user side effect vector EfUP are used, but depending on the setting, of the program side effect vector EfPP and the user side effect vector EfUP, If any one of the above is not used, the numerical value “1” is substituted for calculation instead of the unused vector.

ステップS145において、ベクトル演算部62は、ステップS144において算出された、番組ベクトルPPと正履歴ベクトルUPとの類似度SimUPを比較し、類似度の上位から、例えば、10などの所定の数の番組ベクトルPPを抽出する。   In step S145, the vector calculation unit 62 compares the similarity SimUP between the program vector PP and the positive history vector UP calculated in step S144, and a predetermined number of programs such as 10, for example, from the top of the similarity. Extract vector PP.

ステップS146において、ベクトル演算部62は、ステップS145の処理により抽出された番組ベクトルPPと、負履歴保存部48から読み出したジャンル「ドラマ」に対応する負履歴ベクトルMUPのそれぞれの大項目について、番組ベクトルPPと負履歴ベクトルMUPのコサイン距離を算出する。ここでは、効き目ベクトルは演算に利用されない。   In step S146, the vector calculation unit 62 performs the program for each major item of the program vector PP extracted by the process of step S145 and the negative history vector MUP corresponding to the genre “drama” read from the negative history storage unit 48. The cosine distance between the vector PP and the negative history vector MUP is calculated. Here, the effect vector is not used for the calculation.

ステップS147において、ベクトル演算部62は、次の式(10)を用いて、項目ごとに算出されたコサイン距離に、必要に応じて、ジャンル「ドラマ」に対応する効き目ベクトルを乗算し、得られた値を合計して、類似度SimMUPを算出する。   In step S147, the vector calculation unit 62 multiplies the cosine distance calculated for each item by the effect vector corresponding to the genre “drama” as necessary using the following equation (10). Similarity SimMUP is calculated by summing the values obtained.

SimMUP=epdt・emdtd・cosθmtd+ epdg・emdgd・cosθmgd+ epdp・emdpd・cosθmpd
+ epda・emdad・cosθmad+ epdk・emdkd・cosθmkd・・・(10)
SimMUP = epdt ・ emdtd ・ cosθmtd + epdg ・ emdgd ・ cosθmgd + epdp ・ emdpd ・ cosθmpd
+ epda ・ emdad ・ cosθmad + epdk ・ emdkd ・ cosθmkd (10)

なお、式(10)においては、番組ベクトルPP=(pt,pg,pp,pa,pk)と負履歴ベクトルMUP=(mt,mg,mp,ma,mk)との大項目ごとのコサイン距離が、(cosθmtd,cosθmgd,cosθmpd ,cosθmad,cosθmkd)であり、番組側効き目ベクトルEfPP=(epdt,epdg,epdp,epda,epdk)、ジャンル「ドラマ」に対応するユーザ側反効き目ベクトルEfMUP=(emdtd,emdgd,emdpd,emdad,emdkd)であるものとする。また、式(10)においては、番組側効き目ベクトルEfPPおよびユーザ側反効き目ベクトルEfMUPのいずれをも利用するものとして説明しているが、設定により、番組側効き目ベクトルEfPPおよびユーザ側反効き目ベクトルEfMUPのうちのいずれかが利用されない場合、利用されないベクトルに代わって、数値「1」が代入されて計算される。   In equation (10), the cosine distance for each major item of the program vector PP = (pt, pg, pp, pa, pk) and the negative history vector MUP = (mt, mg, mp, ma, mk). , (Cosθmtd, cosθmgd, cosθmpd, cosθmad, cosθmkd), program side effect vector EfPP = (epdt, epdg, epdp, epda, epdk), user side reaction vector EfMUP = (emdtd, emdgd, emdpd, emdad, emdkd). Further, in the equation (10), it is described that both the program side effect vector EfPP and the user side reaction vector EfMUP are used. However, depending on the setting, the program side effect vector EfPP and the user side reaction vector EfMUP are used. When any one of the above is not used, the numerical value “1” is substituted for calculation instead of the unused vector.

ステップS148において、ベクトル演算部62は、{番組ベクトルPPと正履歴ベクトルUPとのコサイン距離である類似度SimUP}−{番組ベクトルPPと負履歴ベクトルとのコサイン距離である類似度SimMUP}を算出し、その上位となる所定数(例えば3つ)の番組の番組ベクトルPPまたはEPGデータを推薦情報として抽出し、推薦情報出力部49に出力して、推薦番組リスト50に登録させるとともに、テレビジョン表示装置11および録画再生装置12に出力して、処理が終了される。   In step S148, the vector calculation unit 62 calculates {similarity SimUP which is a cosine distance between the program vector PP and the positive history vector UP} − {similarity SimMUP which is a cosine distance between the program vector PP and the negative history vector}. Then, the program vector PP or EPG data of a predetermined number (for example, three) programs that are higher in rank are extracted as recommended information, output to the recommended information output unit 49, registered in the recommended program list 50, and television. The data is output to the display device 11 and the recording / playback device 12, and the process is terminated.

このような処理により、大項目ごとに、ジャンル別の正履歴ベクトルUPおよび負履歴ベクトルMUPと番組ベクトルPPとのコサイン距離が求められ、ジャンルに対応した効き目ベクトルが利用されて重み付けが行われて類似度が算出されるので、ユーザの嗜好に詳細に合致した推薦情報を生成することが可能となる。   By such processing, the cosine distance between the positive history vector UP and the negative history vector MUP and the program vector PP for each genre is obtained for each major item, and weighting is performed using the effect vector corresponding to the genre. Since the degree of similarity is calculated, it is possible to generate recommendation information that matches the user's preference in detail.

また、ユーザ側効き目ベクトルEfUPおよび反効き目ベクトルEfMUPは、上述したように、初期登録保存部45に登録されている、ユーザの初期登録内容を基に生成されるようにしても良いし、正履歴ベクトルUPまたは負履歴ベクトルMUP、あるいは、一定期間にユーザが視聴した番組をカウントすることにより、ユーザ固有のユーザ側効き目ベクトルEfUPおよび反効き目ベクトルEfMUPが生成されるようにしても良い。   Further, as described above, the user side effect vector EfUP and the counter effect vector EfMUP may be generated based on the initial registration contents of the user registered in the initial registration storage unit 45, or the positive history The user-side user-effect vector EfUP and the counter-effect vector EfMUP may be generated by counting the vector UP, the negative history vector MUP, or the programs viewed by the user during a certain period.

図22のフローチャートを参照して、一定期間にユーザが視聴した番組をカウントすることによりユーザ側効き目ベクトルEfUPを生成する、ユーザ側効き目ベクトル生成処理1について説明する。   With reference to the flowchart of FIG. 22, the user-side effect vector generation process 1 for generating the user-side effect vector EfUP by counting the programs viewed by the user during a certain period will be described.

ステップS151において、マッチング処理部43のユーザ情報登録部63は、未処理の大項目のうちのいずれかを選択する。   In step S151, the user information registration unit 63 of the matching processing unit 43 selects one of unprocessed large items.

ステップS152において、ユーザ情報登録部63は、正履歴保存部47に保存されている正履歴を参照して、例えば、1週間、1ヶ月、または3ヶ月などの一定期間中にユーザが視聴した番組を検出し、番組ベクトル抽出部42に、一定期間中にユーザが視聴した番組に対応する番組ベクトルPPをデータ取得部41から抽出させて、ステップS151において選択された大項目に含まれる詳細項目ごとに番組数をカウントする。   In step S152, the user information registration unit 63 refers to the main history stored in the main history storage unit 47, and for example, shows a program viewed by the user during a certain period such as one week, one month, or three months. And the program vector extraction unit 42 extracts the program vector PP corresponding to the program viewed by the user during a certain period from the data acquisition unit 41, and for each detailed item included in the large item selected in step S151. Count the number of programs.

具体的には、例えば、ステップS151において選択された大項目が、大項目ジャンルGm={ドラマ,バラエティ,スポーツ,映画,音楽,子供向け/教育,教養/ドキュメント,ニュース/報道,その他}であれば、ユーザ情報登録部63は、一定期間中にユーザが視聴した番組の番組ベクトルPPの構成要素を、それぞれに対応する項目に分類してカウントする。一定期間中にユーザが視聴した番組が、例えば、50番組であった場合、番組数のカウント結果は、例えば、ジャンルGm=(10,18,5,2,8,1,0,1,5)となる。   Specifically, for example, the large item selected in step S151 is the large item genre Gm = {drama, variety, sports, movie, music, children / education, education / documents, news / reports, etc.} For example, the user information registration unit 63 classifies and counts the constituent elements of the program vector PP of the program viewed by the user during a certain period of time into corresponding items. When the number of programs viewed by the user during a certain period is 50, for example, the count result of the number of programs is, for example, genre Gm = (10, 18, 5, 2, 8, 1, 0, 1, 5 )

ステップS153において、ユーザ情報登録部63は、番組ベクトル抽出部42に、同一期間における全ての番組に対応する番組ベクトルPPをデータ取得部41から抽出させて、ステップS151において選択された大項目に含まれる詳細項目ごとに番組数をカウントする。   In step S153, the user information registration unit 63 causes the program vector extraction unit 42 to extract program vectors PP corresponding to all programs in the same period from the data acquisition unit 41, and includes them in the large items selected in step S151. The number of programs is counted for each detailed item.

具体的には、例えば、ステップS151において選択された大項目が、大項目ジャンルGm={ドラマ,バラエティ,スポーツ,映画,音楽,子供向け/教育,教養/ドキュメント,ニュース/報道,その他}であれば、ユーザ情報登録部63は、同一期間における全ての番組の番組ベクトルPPの構成要素を、それぞれに対応する項目に分類してカウントする。同一期間における全ての番組が、例えば、1000番組であった場合、番組数のカウント結果は、例えば、ジャンルGm=(104,239,68,25,78,91,60,254,81)となる。   Specifically, for example, the large item selected in step S151 is the large item genre Gm = {drama, variety, sports, movie, music, children / education, education / documents, news / reports, etc.} For example, the user information registration unit 63 classifies the constituent elements of the program vectors PP of all programs in the same period into the corresponding items and counts them. When all the programs in the same period are 1000 programs, for example, the count result of the number of programs is, for example, genre Gm = (104, 239, 68, 25, 78, 91, 60, 254, 81). .

ステップS154において、ユーザ情報登録部63は、ステップS152およびステップS153のカウント結果を基に、ユーザの視聴実績のカウント数/全番組のカウント数を算出する。   In step S154, the user information registration unit 63 calculates the count number of the viewing results of the user / the count number of all the programs based on the count results of step S152 and step S153.

番組編成は、視聴率競争の影響により、大衆の嗜好を反映していると考えられる。すなわち、ユーザの視聴実績のカウント数/全番組のカウント数の演算は、換言すれば、ユーザの視聴実績のカウント数を、標準モデルとしての全番組のカウント数で正規化することと同義である。ステップS154において算出される正規化ベクトルを正規化ベクトルDと称するものとする。   Program organization is considered to reflect the taste of the masses due to the influence of audience rating competition. In other words, the calculation of the user's viewing record count / all program counts is synonymous with normalizing the user's viewing record counts with all program counts as a standard model. . The normalized vector calculated in step S154 is referred to as a normalized vector D.

例えば、大項目ジャンルGm={ドラマ,バラエティ,スポーツ,映画,音楽,子供向け/教育,教養/ドキュメント,ニュース/報道,その他}において、1週間の全番組のカウント数が、(8,12,3,7,6,4,2,8,10)であり、対してユーザが視聴した番組のカウント数が、(4,0,1,2,3,4,1,2,2)であった場合、正規化ベクトルDは、以下のようになる。
D=(4/8,0/12,1/3 ,2/7,3/6,4/4,1/2,2/8,2/10)=(0.5,0,0.33,0.28,0.5,1.0,0.5,0.25,0.2)
すなわち、正規化ベクトルDの構成要素が1.0である場合は、設定された期間中に、該当する項目の全番組を視聴したこと、正規化ベクトルDの構成要素が0である場合は、設定された期間中に、該当する番組は一つも視聴しなかったことを意味する。
For example, in the large item genre Gm = {drama, variety, sports, movie, music, children / education, education / documents, news / reports, etc.}, the count number of all programs for one week is (8, 12, 3,7,6,4,2,8,10) and the number of programs viewed by the user is (4,0,1,2,3,4,1,2,2). In this case, the normalized vector D is as follows.
D = (4/8, 0/12, 1/3, 2/7, 3/6, 4/4, 1/2, 2/8, 2/10) = (0.5, 0, 0.33 , 0.28, 0.5, 1.0, 0.5, 0.25, 0.2)
That is, when the component of the normalization vector D is 1.0, that all the programs of the corresponding item have been viewed during the set period, and when the component of the normalization vector D is 0, It means that no corresponding program was watched during the set period.

ステップS155において、ユーザ情報登録部63は、ステップS154の算出結果を基に、対応する大項目の効き目ベクトルを生成する。   In step S155, the user information registration unit 63 generates a corresponding large item effect vector based on the calculation result in step S154.

効き目ベクトルを生成するために、大項目ジャンルGm={ドラマ,バラエティ,スポーツ,映画,音楽,子供向け/教育,教養/ドキュメント,ニュース/報道,その他}のうちのいずれかの項目を用いて、標準値を設定する。例えば、ジャンル:「ドラマ」の番組1週間分において、一般的なユーザは、その2割程度を視聴しているとして、標準値を0.2に設定すればよい。大項目の効き目ベクトルは、相対値として算出されるため、設定値は0乃至1のいずれの値であってもかまわない。そして、ユーザ側効き目ベクトルは、ステップS154において算出された正規化ベクトルDと、設定値との相対値である。   In order to generate an effect vector, using one of the items of the large item genre Gm = {drama, variety, sports, movies, music, children / education, education / documents, news / reports, etc.} Set the standard value. For example, in a program of the genre: “drama” for one week, it is sufficient that a general user views about 20% of the program and sets the standard value to 0.2. Since the effect vector of the large item is calculated as a relative value, the set value may be any value from 0 to 1. The user side effect vector is a relative value between the normalized vector D calculated in step S154 and the set value.

従って、ユーザの興味ジャンルを示す、大項目ジャンルGmの効き目ベクトルEは、
E=(0.3,−0.2,0.13,0.08,0.3,0.8,0.3,−0.07,0.0)
と算出されるので、対応するユーザは、「子供向け/教育」のジャンルを好み、「バラエティ」のジャンルを好まないと判断することができる。
Therefore, the effect vector E of the large item genre Gm indicating the user's interest genre is
E = (0.3, -0.2, 0.13, 0.08, 0.3, 0.8, 0.3, -0.07, 0.0)
Therefore, it can be determined that the corresponding user likes the genre of “for children / education” and does not like the genre of “variety”.

ステップS156において、ユーザ情報登録部63は、全ての大項目の効き目ベクトルが生成されたか否かを判断する。ステップS156において、全ての大項目の効き目ベクトルが生成されていないと判断された場合、処理は、ステップS151に戻り、それ以降の処理が繰り返される。   In step S156, the user information registration unit 63 determines whether or not all large item effect vectors have been generated. If it is determined in step S156 that not all large effect vectors have been generated, the process returns to step S151, and the subsequent processes are repeated.

ステップS156において、全ての大項目の効き目ベクトルが生成されたと判断された場合、ステップS157において、ユーザ情報登録部63は、全ての大項目の効き目ベクトルを保存して、処理が終了される。   If it is determined in step S156 that all large item effect vectors have been generated, in step S157, the user information registration unit 63 stores all large item effect vectors, and the process ends.

このような処理により、一般的な嗜好と、ユーザ固有の嗜好との差を求めることができる。また、ユーザ側効き目ベクトルEfUPを、例えば、3ヶ月、半年などの所定の期間ごとに再演算するようにすることにより、ユーザの嗜好をリアルタイムに反映した番組を推薦することができる。   By such processing, a difference between general preference and user-specific preference can be obtained. In addition, by recalculating the user-side effect vector EfUP every predetermined period such as three months or six months, it is possible to recommend a program that reflects the user's preferences in real time.

また、図22の処理においては、例えば、1週間、1ヶ月、または3ヶ月などの一定期間中にユーザが視聴した番組を基にユーザ側効き目ベクトルEfUPを求めるものとして説明したが、複数の期間を対象として、例えば、短期、中期、長期に対応するユーザ側効き目ベクトルEfUPを算出し、これら複数の効き目ベクトルを用いて、推薦情報を決定するようにしても良い。   Further, in the processing of FIG. 22, it has been described that the user-side effect vector EfUP is obtained based on a program viewed by the user during a certain period such as one week, one month, or three months. For example, the user side effect vector EfUP corresponding to the short term, the medium term, and the long term may be calculated, and the recommendation information may be determined using the plurality of effect vectors.

ここでは、ユーザ固有の嗜好を、ユーザ側効き目ベクトルEfUPとして利用する場合について説明したが、ユーザ固有の嗜好を、正履歴ベクトルUPとしてマッチング処理に用いるようにしても良い。   Although the case where the user-specific preference is used as the user-side effect vector EfUP has been described here, the user-specific preference may be used as the positive history vector UP for the matching process.

また、放送されている全番組に代わって、視聴者が最も番組を視聴する所定の時間帯(例えば、18時乃至22時の、いわゆる、ゴールデンタイム)に放送される全番組をカウントするようにしてもよい。このようにすることにより、一般的な嗜好を求めるための演算処理を大幅に少なくすることができる。   Further, instead of all programs being broadcast, all programs broadcast in a predetermined time zone (for example, so-called golden time from 18:00 to 22:00) when the viewer views the program most are counted. May be. By doing in this way, the arithmetic processing for calculating | requiring general preference can be reduced significantly.

次に、図23のフローチャートを参照して、正履歴ベクトルUPと、大衆の嗜好との類似度を示すコサイン距離の演算によって、ユーザ固有の嗜好と、大衆の嗜好との隔たりをマッチングに利用するためのユーザ側効き目ベクトルEfUPを求める、ユーザ側効き目ベクトル算出処理2について説明する。   Next, referring to the flowchart of FIG. 23, the difference between the user-specific preference and the mass preference is used for matching by calculating the cosine distance indicating the similarity between the positive history vector UP and the mass preference. The user-side effect vector calculation process 2 for obtaining the user-side effect vector EfUP will be described.

ステップS161において、マッチング処理部43のユーザ情報登録部63は、正履歴保存部47に保存されている正履歴ベクトルUPを取得する。   In step S <b> 161, the user information registration unit 63 of the matching processing unit 43 acquires the positive history vector UP stored in the positive history storage unit 47.

ステップS162において、ユーザ情報登録部63は、一般的な嗜好を示す、標準嗜好ベクトルAPPを取得する。   In step S162, the user information registration unit 63 acquires a standard preference vector APP that indicates a general preference.

標準嗜好ベクトルAPPは、配信サーバ5から供給されるものとしても良いし、または、番組編成は、視聴率競争の影響により、大衆の嗜好を反映していると考えられるので、図22を用いて説明したユーザ側効き目ベクトル算出処理1と同様にして、一定期間に放送された全番組の内容をカウントし、必要に応じて正規化して、標準嗜好ベクトルAPPとするようにしても良い。   The standard preference vector APP may be supplied from the distribution server 5, or the program organization is considered to reflect the preference of the masses due to the influence of the audience rating competition. Similarly to the user-side effect vector calculation process 1 described above, the contents of all programs broadcast for a certain period may be counted and normalized as necessary to obtain the standard preference vector APP.

配信サーバ5においては、例えば、一般的な視聴率調査や、その他の方法を用いて、一般的な嗜好を示す標準嗜好ベクトルAPPを生成するようにしても良い。   In the distribution server 5, for example, a standard preference vector APP indicating a general preference may be generated using a general audience rating survey or other methods.

ステップS163において、ユーザ情報登録部63は、大項目ごとに、標準嗜好ベクトルAPPと、正履歴ベクトルUPとのコサイン距離を算出する。コサイン距離が大きいほど、標準嗜好ベクトルAPPと、正履歴ベクトルUPとの類似度が高い。   In step S163, the user information registration unit 63 calculates the cosine distance between the standard preference vector APP and the positive history vector UP for each large item. The greater the cosine distance, the higher the similarity between the standard preference vector APP and the positive history vector UP.

ステップS164において、ユーザ情報登録部63は、ステップS163において算出されたコサイン距離を基に、大項目ごとに、コサイン距離を逆数にして、効き目ベクトルEfUPを生成して、処理が終了される。コサイン距離の逆数が大きいほど、標準嗜好ベクトルAPPと、正履歴ベクトルUPとの類似度は低い。   In step S164, based on the cosine distance calculated in step S163, the user information registration unit 63 generates an effect vector EfUP by reciprocating the cosine distance for each major item, and the process is terminated. The greater the reciprocal of the cosine distance, the lower the similarity between the standard preference vector APP and the positive history vector UP.

このような処理により、一般的な嗜好と、対応するユーザ固有の嗜好との差を反映したユーザ側効き目ベクトルEfUPを求めることができる。このユーザ側効き目ベクトルEfUPを用いて番組推薦処理を行った場合、ユーザの嗜好と一般的な嗜好との違いが強調されて、推薦される番組が決定される。   By such processing, the user-side effect vector EfUP reflecting the difference between the general preference and the corresponding user-specific preference can be obtained. When the program recommendation process is performed using the user-side effect vector EfUP, the recommended program is determined with emphasis on the difference between the user's preference and the general preference.

なお、ここでは、番組ベクトルPP、および正履歴ベクトルUPが、大項目ごとにベクトルで表されているものとして説明したが、番組ベクトルPP、および正履歴ベクトルUPが、詳細項目の全要素を1列に並べたベクトルで表されている場合においても、同様の処理が実行可能であることは言うまでもない。   Here, the program vector PP and the positive history vector UP have been described as being represented by vectors for each major item. However, the program vector PP and the positive history vector UP are all elements of the detailed items. It goes without saying that the same processing can be executed even when the vectors are represented by vectors arranged in columns.

また、標準嗜好ベクトルAPPと、正履歴ベクトルUPとの類似度は、効き目ベクトルを算出するのみならず、そのユーザのユニーク度を示す指数として、番組の推薦に直接的に用いるようにしても良い。例えば、標準嗜好ベクトルAPPと、正履歴ベクトルUPとの類似度が高い場合、一般向けの流行に即した新番組などを優先的に推薦するようにしても良い。   Further, the similarity between the standard preference vector APP and the positive history vector UP may be used not only for calculating the effectiveness vector but also directly for program recommendation as an index indicating the uniqueness of the user. . For example, when the similarity between the standard preference vector APP and the positive history vector UP is high, a new program or the like that matches the general trend may be preferentially recommended.

図22および図23を用いて説明したように、ユーザ側効き目ベクトルEfUPは、ユーザの操作履歴に基づいて、学習的に求められると好適であるが、ユーザ側効き目ベクトルは、予め初期登録として登録されていても良いし、経験などにより求められる、予め設定されている値を用いるようにしても良い。   As described with reference to FIGS. 22 and 23, the user side effect vector EfUP is preferably obtained by learning based on the user's operation history, but the user side effect vector is registered in advance as an initial registration. Alternatively, a preset value obtained by experience or the like may be used.

なお、大項目に着目して、ユーザ側効き目ベクトルEfUPを生成するのみならず、大項目を構成する構成要素に着目して、ユーザ側効き目ベクトルEfUPを生成するようにしても良い。例えば、大項目を構成する構成要素「出演者Pm」において、主役と脇役を区別可能にしておき、ドラマや映画において、主役よりも脇役の配役を優先するユーザは、主役に対して、脇役の重み付けを大きくするようにユーザ側効き目ベクトルEfUPを設定可能としたり、大項目を構成する構成要素「脚本/原作/演出Am」において、監督、演出家、原作者、カメラマンなどを区別可能にしておき、監督や演出家より、カメラマンを重視するユーザは、カメラマンの重み付けを大きくするようにユーザ側効き目ベクトルEfUPを設定可能なようにしても良い。   Note that the user-side effect vector EfUP may be generated not only by generating the user-side effect vector EfUP by paying attention to the large item but also by paying attention to the components constituting the large item. For example, in the component “Performer Pm” constituting the large item, the main role and the supporting role can be distinguished from each other, and in a drama or a movie, the user who gives priority to the casting of the supporting role over the leading character The user side effect vector EfUP can be set so as to increase the weight, and in the component “screenplay / original / production Am” constituting the large item, the director, director, original author, photographer, etc. can be distinguished. A user who places more importance on the cameraman than the director or director may be able to set the user-side effect vector EfUP so as to increase the weight of the cameraman.

また、ユーザ側効き目ベクトルEfUPをジャンルごとに生成し、図21を用いて説明したマッチング処理5のように、対応するジャンルの正履歴ベクトルUPと番組ベクトルPPとのマッチングのときに作用させるようにしても良い。   Further, a user-side effect vector EfUP is generated for each genre, and is used when matching the corresponding genre positive history vector UP and program vector PP as in the matching process 5 described with reference to FIG. May be.

次に、図24のフローチャートを参照して、一定期間にユーザが視聴した番組を、ジャンル別にカウントすることによりユーザ側効き目ベクトルEfUPを生成する、ユーザ側効き目ベクトル生成処理3について説明する。   Next, a user side effect vector generation process 3 for generating a user side effect vector EfUP by counting programs viewed by the user during a certain period by genre will be described with reference to the flowchart of FIG.

ステップS171において、マッチング処理部43のユーザ情報登録部63は、一定期間にユーザが視聴した番組を、ジャンル別にカウントするために、いずれかのジャンルを選択する。   In step S171, the user information registration unit 63 of the matching processing unit 43 selects any genre in order to count programs viewed by the user for a certain period by genre.

ステップS172において、ユーザ情報登録部63は、未処理の大項目のうちのいずれかを選択する。   In step S172, the user information registration unit 63 selects one of the unprocessed large items.

ステップS173において、ユーザ情報登録部63は、正履歴保存部47に保存されている正履歴を参照して、例えば、1週間、1ヶ月、または3ヶ月などの一定期間中にユーザが視聴した番組のうち、選択されたジャンルのものを検出し、番組ベクトル抽出部42に、一定期間中にユーザが視聴したもののうち、選択されたジャンルの番組に対応する番組ベクトルPPをデータ取得部41から抽出させて、ステップS172において選択された大項目に含まれる詳細項目ごとに番組数をカウントする。   In step S173, the user information registration unit 63 refers to the main history stored in the main history storage unit 47, and for example, shows a program viewed by the user during a certain period such as one week, one month, or three months. Of the selected genre is detected, and the program vector extraction unit 42 extracts, from the data acquisition unit 41, the program vector PP corresponding to the program of the selected genre among those viewed by the user during a certain period. The number of programs is counted for each detailed item included in the large item selected in step S172.

ステップS174において、ユーザ情報登録部63は、番組ベクトル抽出部42に、同一期間における全ての番組のうち、選択されたジャンルに対応する番組ベクトルPPをデータ取得部41から抽出させて、ステップS172において選択された大項目に含まれる詳細項目ごとに番組数をカウントする。   In step S174, the user information registration unit 63 causes the program vector extraction unit 42 to extract the program vector PP corresponding to the selected genre from all the programs in the same period from the data acquisition unit 41, and in step S172. The number of programs is counted for each detailed item included in the selected large item.

ステップS175において、ユーザ情報登録部63は、ステップS173およびステップS174のカウント結果を基に、選択されたジャンルにおける、ユーザの視聴実績のカウント数/全番組のカウント数を算出する。   In step S175, the user information registration unit 63 calculates the count number of the user's viewing performance / the count number of all programs in the selected genre based on the count results in step S173 and step S174.

上述したように、番組編成は、視聴率競争の影響により、大衆の嗜好を反映していると考えられる。すなわち、選択されたジャンルにおける、ユーザの視聴実績のカウント数/全番組のカウント数の演算は、換言すれば、対応するジャンルにおけるユーザの視聴実績のカウント数を、標準モデルとしての対応するジャンルの全番組のカウント数で正規化することと同義である。ステップS175において算出される正規化ベクトルを正規化ベクトルD´と称するものとする。   As described above, the program organization is considered to reflect the popular preference due to the influence of audience rating competition. In other words, the calculation of the count of the user's viewing performance / the count of all the programs in the selected genre is, in other words, the count of the user's viewing performance in the corresponding genre. This is synonymous with normalization by the count of all programs. The normalized vector calculated in step S175 is referred to as a normalized vector D ′.

例えば、大項目ジャンルGm={ドラマ,バラエティ,スポーツ,映画,音楽,子供向け/教育,教養/ドキュメント,ニュース/報道,その他}のうちの「ドラマ」のジャンルに対応する番組ベクトルPPの、大項目時間帯Tm={朝、昼、夕方、ゴールデン、深夜}において、1週間の全番組のカウント数が、(10,35,7,53,17)であり、対してユーザが視聴した番組のカウント数が、(5,0,0,8,4)であった場合、正規化ベクトルD´は、以下のようになる。
D´=(5/10,0/35,0/7,8/53,4/17)
=(0.5,0,0,0.28,0.15,0.24)
すなわち、正規化ベクトルD´の構成要素が1.0である場合は、設定された期間中に、該当する項目の全番組を視聴したことを意味し、正規化ベクトルD´の構成要素が0である場合は、設定された期間中に、該当する番組は一つも視聴しなかったことを意味する。
For example, the large program vector PP corresponding to the genre of “drama” in the large category genre Gm = {drama, variety, sports, movie, music, children / education, education / documents, news / reports, etc.} In the item time zone Tm = {morning, noon, evening, golden, midnight}, the count number of all the programs for one week is (10, 35, 7, 53, 17), and the program viewed by the user is displayed. When the count number is (5, 0, 0, 8, 4), the normalized vector D ′ is as follows.
D ′ = (5/10, 0/35, 0/7, 8/53, 4/17)
= (0.5, 0, 0, 0.28, 0.15, 0.24)
That is, when the component of the normalized vector D ′ is 1.0, it means that all programs of the corresponding item have been viewed during the set period, and the component of the normalized vector D ′ is 0. In this case, it means that no corresponding program was viewed during the set period.

ステップS176において、ユーザ情報登録部63は、ステップS175の算出結果を基に、選択されたジャンルにおける、対応する大項目の効き目ベクトルを生成する。   In step S176, the user information registration unit 63 generates an effect vector for the corresponding large item in the selected genre based on the calculation result in step S175.

効き目ベクトルを生成するために、大項目時間帯Tm={朝、昼、夕方、ゴールデン、深夜}のうちのいずれかの項目を用いて、標準値を設定する。例えば、時間帯:「ゴールデン」の番組1週間分において、一般的なユーザは、ドラマの2割程度を視聴しているとして、標準値を0.2に設定すればよい。大項目の効き目ベクトルは、相対値として算出されるため、設定値は0乃至1のいずれの値であってもかまわない。そして、ユーザ側効き目ベクトルは、ステップS175において算出された正規化ベクトルD´と、設定値との相対値である。   In order to generate an effect vector, a standard value is set using any item of the large item time zone Tm = {morning, noon, evening, golden, midnight}. For example, in a one-week program of the time zone: “Golden”, a general user may watch about 20% of the drama and set the standard value to 0.2. Since the effect vector of the large item is calculated as a relative value, the set value may be any value from 0 to 1. The user side effect vector is a relative value between the normalized vector D ′ calculated in step S175 and the set value.

従って、ユーザの興味ジャンルを示す、大項目ジャンルGmの効き目ベクトルE´は、
E´=(0.3,−0.2,−0.2,−0.05,0.04)
と算出されるので、対応するユーザは、朝の時間帯のドラマを好み、昼や夕方の時間帯のドラマを好まないと判断することができる。
Therefore, the effect vector E ′ of the large item genre Gm indicating the user's genre is
E ′ = (0.3, −0.2, −0.2, −0.05, 0.04)
Therefore, it can be determined that the corresponding user likes the drama in the morning time zone and does not like the drama in the daytime or evening time zone.

ステップS177において、ユーザ情報登録部63は、選択されたジャンルにおいて、全ての大項目の効き目ベクトルが生成されたか否かを判断する。ステップS177において、全ての大項目の効き目ベクトルが生成されていないと判断された場合、処理は、ステップS172に戻り、それ以降の処理が繰り返される。   In step S177, the user information registration unit 63 determines whether or not the effect vectors for all large items have been generated in the selected genre. If it is determined in step S177 that not all large effect vectors have been generated, the process returns to step S172, and the subsequent processes are repeated.

ステップS177において、全ての大項目の効き目ベクトルが生成されたと判断された場合、ステップS178において、ユーザ情報登録部63は、全てのジャンルの処理が終了したか否かを判断する。ステップS178において、全てのジャンルが終了していないと判断された場合、処理は、ステップS171に戻り、それ以降の処理が繰り返される。   When it is determined in step S177 that all large item effect vectors have been generated, in step S178, the user information registration unit 63 determines whether or not the processing of all genres has been completed. If it is determined in step S178 that all genres have not ended, the process returns to step S171, and the subsequent processes are repeated.

ステップS178において、全てのジャンルが終了したと判断された場合、ステップS179において、ユーザ情報登録部63は、全ての大項目の効き目ベクトルを保存して、処理が終了される。   If it is determined in step S178 that all genres have been completed, in step S179, the user information registration unit 63 stores the effect vectors of all large items, and the process ends.

このような処理により、一般的な嗜好と、ユーザ固有の嗜好との差をジャンル別に求めることができる。また、図22を用いて説明した場合と同様にして、ユーザ側効き目ベクトルEfUPを、例えば、3ヶ月、半年などの所定の期間ごとに再演算するようにすることにより、ユーザの嗜好をリアルタイムに反映した番組を推薦することができる。   By such processing, the difference between the general preference and the user-specific preference can be obtained for each genre. Similarly to the case described with reference to FIG. 22, by recalculating the user side effect vector EfUP every predetermined period such as 3 months, 6 months, etc., the user's preference can be changed in real time. The reflected program can be recommended.

また、図24の処理においても、例えば、1週間、1ヶ月、または3ヶ月などの一定期間中にユーザが視聴した番組を基にユーザ側効き目ベクトルEfUPを求めるものとして説明したが、図22を用いて説明した場合と同様にして、複数の期間を対象として、例えば、短期、中期、長期に対応するユーザ側効き目ベクトルEfUPを算出し、これら複数の効き目ベクトルを用いて、推薦情報を決定するようにしても良い。   Also, in the processing of FIG. 24, the description has been made assuming that the user-side effect vector EfUP is obtained based on a program viewed by the user during a certain period such as one week, one month, or three months. In the same manner as described above, for a plurality of periods, for example, the user-side effect vector EfUP corresponding to the short-term, medium-term, and long-term is calculated, and the recommendation information is determined using the plurality of effect vectors. You may do it.

また、図24の処理においても、放送されている全番組に代わって、視聴者が最も番組を視聴する所定の時間帯(例えば、18時乃至22時の、いわゆる、ゴールデンタイム)に放送される全番組をカウントするようにしてもよい。   Also, in the processing of FIG. 24, instead of all the broadcasted programs, the program is broadcast in a predetermined time zone (for example, the so-called golden time from 18:00 to 22:00) when the viewer views the program most. You may make it count all the programs.

次に、図25のフローチャートを参照して、正履歴ベクトルUPと、大衆の嗜好との類似度を示すコサイン距離の演算を、ジャンル別に実行することによって、ユーザ固有の嗜好と大衆の嗜好との隔たりをマッチングに利用するためのユーザ側効き目ベクトルEfUPを求める、ユーザ側効き目ベクトル生成処理4について説明する。   Next, referring to the flowchart of FIG. 25, the cosine distance calculation indicating the similarity between the positive history vector UP and the public preference is executed for each genre, so that the user-specific preference and the public preference are obtained. The user side effect vector generation process 4 for obtaining the user side effect vector EfUP for using the gap for matching will be described.

ステップS191において、マッチング処理部43のユーザ情報登録部63は、処理を実行するジャンルを指定するために、いずれかのジャンルを選択する。   In step S191, the user information registration unit 63 of the matching processing unit 43 selects one of the genres in order to specify a genre for executing the process.

ステップS192において、ユーザ情報登録部63は、正履歴保存部47に保存されている正履歴ベクトルUPのうち、選択されたジャンルの正履歴ベクトルUPを取得する。   In step S 192, the user information registration unit 63 acquires the positive history vector UP of the selected genre from the positive history vectors UP stored in the positive history storage unit 47.

ステップS193において、ユーザ情報登録部63は、一般的な嗜好を示す、標準嗜好ベクトルAPPのうち、選択されたジャンルの標準嗜好ベクトルAPPを取得する。   In step S193, the user information registration unit 63 acquires the standard preference vector APP of the selected genre among the standard preference vectors APP indicating the general preference.

標準嗜好ベクトルAPPは、上述したように、配信サーバ5から供給されるものとしても良いし、または、番組編成は、視聴率競争の影響により、大衆の嗜好を反映していると考えられるので、図24を用いて説明したユーザ側効き目ベクトル算出処理3と同様にして、一定期間に放送された全番組の内容をジャンル別にカウントし、必要に応じて正規化して、ジャンル別標準嗜好ベクトルAPPとするようにしても良い。   As described above, the standard preference vector APP may be supplied from the distribution server 5, or the program organization is considered to reflect the popular preference due to the influence of audience rating competition. Similar to the user-side effect vector calculation process 3 described with reference to FIG. 24, the contents of all programs broadcast for a certain period are counted by genre, normalized as necessary, and the genre-specific standard preference vector APP You may make it do.

配信サーバ5においては、例えば、一般的な視聴率調査や、その他の方法を用いて、一般的な嗜好を示す標準嗜好ベクトルAPPをジャンル別に生成するようにしても良い。   In the distribution server 5, for example, a standard preference vector APP indicating a general preference may be generated for each genre using a general audience rating survey or other methods.

ステップS194において、ユーザ情報登録部63は、選択されたジャンルの正履歴ベクトルUPと、選択されたジャンルの標準嗜好ベクトルAPPを用いて、大項目ごとに、標準嗜好ベクトルAPPと、正履歴ベクトルUPとのコサイン距離を算出する。コサイン距離が大きいほど、標準嗜好ベクトルAPPと、正履歴ベクトルUPとの類似度が高い。   In step S194, the user information registration unit 63 uses the positive history vector UP of the selected genre and the standard preference vector APP of the selected genre, for each major item, the standard preference vector APP and the positive history vector UP. Cosine distance is calculated. The greater the cosine distance, the higher the similarity between the standard preference vector APP and the positive history vector UP.

ステップS195において、ユーザ情報登録部63は、ステップS194において算出されたコサイン距離を基に、大項目ごとに、コサイン距離を逆数にして、選択されたジャンルの効き目ベクトルEfUPを生成する。コサイン距離の逆数が大きいほど、標準嗜好ベクトルAPPと、正履歴ベクトルUPとの類似度は低い。   In step S195, the user information registration unit 63 generates the effect vector EfUP of the selected genre by reversing the cosine distance for each major item based on the cosine distance calculated in step S194. The greater the reciprocal of the cosine distance, the lower the similarity between the standard preference vector APP and the positive history vector UP.

ステップS196において、ユーザ情報登録部63は、全てのジャンルの処理が終了したか否かを判断する。ステップS196において、全てのジャンルが終了していないと判断された場合、処理は、ステップS191に戻り、それ以降の処理が繰り返される。ステップS196において、全てのジャンルが終了したと判断された場合、処理が終了される。   In step S196, the user information registration unit 63 determines whether all genres have been processed. If it is determined in step S196 that all genres have not ended, the process returns to step S191, and the subsequent processes are repeated. If it is determined in step S196 that all genres have been completed, the process ends.

このような処理により、一般的な嗜好と、対応するユーザ固有の嗜好との差を反映した、ジャンル別のユーザ側効き目ベクトルEfUPを求めることができる。   By such processing, the user-side effect vector EfUP for each genre reflecting the difference between the general preference and the corresponding user-specific preference can be obtained.

また、図23を用いて説明した処理と同様にして、標準嗜好ベクトルAPPと、負履歴ベクトルMUPとの類似度を求め、その逆数を、反効き目ベクトルEfMUPとして算出するようにしてもよい。   Similarly to the processing described with reference to FIG. 23, the similarity between the standard preference vector APP and the negative history vector MUP may be obtained, and the reciprocal thereof may be calculated as the reaction vector EfMUP.

次に、図26のフローチャートを参照して、負履歴ベクトルMUPを、大衆の嗜好と比較することにより、反効き目ベクトルEfMUPを求めるユーザ側反効き目ベクトル算出処理1について説明する。   Next, the user-side reaction vector calculation process 1 for obtaining the reaction vector EfMUP by comparing the negative history vector MUP with the public preference will be described with reference to the flowchart of FIG.

ステップS201において、マッチング処理部43のユーザ情報登録部63は、負履歴保存部48に保存されている負履歴ベクトルMUPを取得する。   In step S <b> 201, the user information registration unit 63 of the matching processing unit 43 acquires the negative history vector MUP stored in the negative history storage unit 48.

ステップS202において、ユーザ情報登録部63は、一般的な嗜好を示す、標準嗜好ベクトルAPPを取得する。   In step S202, the user information registration unit 63 acquires a standard preference vector APP that indicates a general preference.

標準嗜好ベクトルAPPは、配信サーバ5から供給されるものとしても良い。あるいは、番組編成は、視聴率競争の影響により、大衆の嗜好を反映していると考えられるので、図22を用いて説明したユーザ側効き目ベクトル算出処理1と同様にして、一定期間に放送された全番組の内容をカウントし、必要に応じて正規化して、標準嗜好ベクトルAPPとするようにしても良い。   The standard preference vector APP may be supplied from the distribution server 5. Or, since the program organization is considered to reflect the preference of the public due to the influence of audience rating competition, it is broadcasted for a certain period in the same manner as the user side effect vector calculation processing 1 described with reference to FIG. The contents of all the programs may be counted and normalized as necessary to obtain the standard preference vector APP.

ステップS203において、ユーザ情報登録部63は、大項目ごとに、標準嗜好ベクトルAPPと、負履歴ベクトルMUPとのコサイン距離を算出する。コサイン距離が大きいほど、標準嗜好ベクトルAPPと、負履歴ベクトルMUPとの類似度が高い。   In step S203, the user information registration unit 63 calculates the cosine distance between the standard preference vector APP and the negative history vector MUP for each large item. The greater the cosine distance, the higher the similarity between the standard preference vector APP and the negative history vector MUP.

ステップS204において、ユーザ情報登録部63は、ステップS203において算出されたコサイン距離を基に、大項目ごとに、コサイン距離を逆数にして、反効き目ベクトルEfMUPを生成して、処理が終了される。   In step S204, based on the cosine distance calculated in step S203, the user information registration unit 63 generates a reaction eye vector EfMUP by reversing the cosine distance for each major item, and the process is terminated.

このような処理により、反効き目ベクトルEfMUPを生成することができるので、ユーザが好まない番組を、推薦する番組から効果的に省くことができる。   By such processing, the reaction vector EfMUP can be generated, so that programs that the user does not like can be effectively omitted from the recommended programs.

次に、図27のフローチャートを参照して、ジャンル別に実行されるユーザ側反効き目ベクトル生成処理2について説明する。   Next, the user-side reaction vector generation process 2 executed for each genre will be described with reference to the flowchart of FIG.

ステップS211において、マッチング処理部43のユーザ情報登録部63は、処理を実行するジャンルを指定するために、いずれかのジャンルを選択する。   In step S <b> 211, the user information registration unit 63 of the matching processing unit 43 selects any genre in order to specify a genre for executing the process.

ステップS212において、ユーザ情報登録部63は、負履歴保存部48に保存されている負履歴ベクトルMUPのうち、選択されたジャンルの負履歴ベクトルMUPを取得する。   In step S212, the user information registration unit 63 acquires the negative history vector MUP of the selected genre among the negative history vectors MUP stored in the negative history storage unit 48.

ステップS213において、ユーザ情報登録部63は、一般的な嗜好を示す、標準嗜好ベクトルAPPのうち、選択されたジャンルの標準嗜好ベクトルAPPを取得する。   In step S213, the user information registration unit 63 acquires the standard preference vector APP of the selected genre among the standard preference vectors APP indicating the general preference.

ステップS214において、ユーザ情報登録部63は、選択されたジャンルの負履歴ベクトルMUPと選択されたジャンルの標準嗜好ベクトルAPPとを基に、大項目ごとに、標準嗜好ベクトルAPPと、負履歴ベクトルMUPとのコサイン距離を算出する。コサイン距離が大きいほど、標準嗜好ベクトルAPPと、負履歴ベクトルMUPとの類似度が高い。   In step S214, the user information registration unit 63 determines, based on the negative history vector MUP of the selected genre and the standard preference vector APP of the selected genre, the standard preference vector APP and the negative history vector MUP for each major item. Cosine distance is calculated. The greater the cosine distance, the higher the similarity between the standard preference vector APP and the negative history vector MUP.

ステップS215において、ユーザ情報登録部63は、ステップS214において算出されたコサイン距離を基に、大項目ごとに、コサイン距離を逆数にして、反効き目ベクトルEfMUPを生成する。コサイン距離の逆数が大きいほど、標準嗜好ベクトルAPPと、負履歴ベクトルMUPとの類似度が低い。   In step S215, the user information registration unit 63 generates a reaction vector EfMUP by reversing the cosine distance for each major item based on the cosine distance calculated in step S214. The greater the reciprocal of the cosine distance, the lower the similarity between the standard preference vector APP and the negative history vector MUP.

ステップS216において、ユーザ情報登録部63は、全てのジャンルの処理が終了したか否かを判断する。ステップS216において、全てのジャンルが終了していないと判断された場合、処理は、ステップS211に戻り、それ以降の処理が繰り返される。ステップS216において、全てのジャンルが終了したと判断された場合、処理が終了される。   In step S216, the user information registration unit 63 determines whether or not the processing for all genres has been completed. If it is determined in step S216 that all genres have not ended, the process returns to step S211 and the subsequent processes are repeated. If it is determined in step S216 that all genres have been completed, the process ends.

このような処理により、反効き目ベクトルEfMUPを、ジャンル別に生成することができるので、ユーザが好まない番組を、推薦する番組から効果的に省くことができる。   By such processing, the reaction vector EfMUP can be generated for each genre, so that programs that the user does not like can be effectively omitted from recommended programs.

なお、ユーザ側効き目ベクトルEfUPと、反効き目ベクトルEfMUPは、図23、および、図25乃至図27を用いて説明した大項目ごとのコサイン距離の逆数をn倍した値、あるいは、所定の桁で四捨五入した値を用いるものとしてもかまわないし、1からコサイン距離の逆数を減算した値、あるいは、その値をn倍した値を用いるものとしてもかまわない。   The user side effect vector EfUP and the counter effect vector EfMUP are values obtained by multiplying the reciprocal of the cosine distance for each major item described with reference to FIG. 23 and FIGS. 25 to 27 by n, or in predetermined digits. A value obtained by rounding off may be used, or a value obtained by subtracting the reciprocal of the cosine distance from 1 or a value obtained by multiplying the value by n may be used.

ここでは、番組ベクトルPP、および負履歴ベクトルMUPが、大項目ごとにベクトルで表されているものとして説明したが、番組ベクトルPP、および負履歴ベクトルMUPが、詳細項目の全要素を1列に並べたベクトルで表されている場合においても、同様の処理が実行可能であることは言うまでもない。   Here, the program vector PP and the negative history vector MUP are described as being represented by vectors for each major item. However, the program vector PP and the negative history vector MUP are all columns of detailed items in one column. It goes without saying that the same processing can be executed even in the case where the vectors are represented by arranged vectors.

また、番組ベクトル抽出部42によって抽出される番組ベクトルには、図7または図8を用いて説明した処理により生成された、クループID、またはクラスタコードなどのグループを示す情報が付加されている場合がある。   When the program vector extracted by the program vector extraction unit 42 is added with information indicating a group such as a group ID or a cluster code generated by the processing described with reference to FIG. 7 or FIG. There is.

例えば、ユーザが好んで視聴する番組が、連続ドラマであった場合、該当する連続ドラマは、全ての回において推薦されるようにすれば、推薦のための演算処理を削減することができる。また、ユーザに非常に好まれている番組と同グループの番組を優先的に推薦するようにすることによっても、推薦のための演算処理を削減することができる。   For example, if the program that the user likes to watch is a continuous drama, the calculation processing for recommendation can be reduced if the corresponding continuous drama is recommended at all times. In addition, it is possible to reduce the calculation processing for recommendation by preferentially recommending a program of the same group as a program that is highly preferred by the user.

次に、図28のフローチャートを参照して、クループ推薦を含むマッチング処理について説明する。   Next, the matching process including group recommendation will be described with reference to the flowchart of FIG.

ステップS221において、マッチング処理部43のベクトル演算部62は、番組ベクトル抽出部42から供給された番組ベクトルPPに、クループID、またはクラスタコードなどのグループを示す情報が付加されているか否かを基に、対応する番組は、グループ化されているか否かを判断する。   In step S221, the vector calculation unit 62 of the matching processing unit 43 determines whether or not information indicating a group such as a group ID or a cluster code is added to the program vector PP supplied from the program vector extraction unit 42. In addition, it is determined whether or not the corresponding program is grouped.

ステップS221において、対応する番組はグループ化されていると判断された場合、ステップS222において、ベクトル演算部62は、クループID、またはクラスタコードで示されるグループは、推薦優先グループとして、ユーザ情報登録部63に登録されているか否かを判断する。   When it is determined in step S221 that the corresponding programs are grouped, in step S222, the vector calculation unit 62 determines that the group indicated by the group ID or the cluster code is the recommended priority group and the user information registration unit. It is determined whether or not it is registered in 63.

ステップS222において、推薦優先グループとして登録されていると判断された場合、ステップS223において、ベクトル演算部62は、対応する番組の情報を、推薦情報として、推薦情報出力部49に供給する。推薦情報出力部49は、推薦番組リスト50に推薦する番組を登録するとともに、テレビジョン表示装置11、または、録画再生装置12に、推薦する番組の情報を出力して、処理は、後述するステップS227に進む。   If it is determined in step S222 that it is registered as a recommended priority group, in step S223, the vector calculation unit 62 supplies the corresponding program information to the recommendation information output unit 49 as recommendation information. The recommended information output unit 49 registers recommended programs in the recommended program list 50 and outputs recommended program information to the television display device 11 or the recording / playback device 12. The process proceeds to S227.

ステップS221において、対応する番組はグループ化されていないと判断された場合、または、ステップS222において、推薦優先グループとして登録されていないと判断された場合、ステップS224において、図17乃至図21を用いて説明した、マッチング処理1乃至マッチング処理5のいずれかの処理が実行される。   If it is determined in step S221 that the corresponding program is not grouped, or if it is determined in step S222 that the corresponding program is not registered as a recommended priority group, in step S224, FIGS. 17 to 21 are used. One of the matching processes 1 to 5 described above is executed.

ステップS225において、ベクトル演算部62は、ステップS224において実行されたマッチング処理1乃至マッチング処理5のいずれかの処理において推薦された番組の番組ベクトルに、クループID、またはクラスタコードなどのグループを示す情報が付加されているか否かを基に、推薦された番組は、グループ化されているか否かを判断する。ステップS225において、推薦された番組は、グループ化されていないと判断された場合、処理は終了される。   In step S225, the vector calculation unit 62 indicates information indicating a group such as a group ID or a cluster code in the program vector of the program recommended in any of the matching processing 1 to the matching processing 5 executed in step S224. Based on whether or not is added, it is determined whether or not the recommended program is grouped. If it is determined in step S225 that the recommended program is not grouped, the process is terminated.

ステップS225において、推薦された番組は、グループ化されていると判断された場合、ステップS226において、ベクトル演算部62は、番組ベクトルに付加しているグループID、またはクラスタコードを、推薦優先グループとして、ユーザ情報登録部63に登録して保存する。   When it is determined in step S225 that the recommended program is grouped, in step S226, the vector calculation unit 62 uses the group ID or cluster code added to the program vector as a recommended priority group. The user information is registered in the user information registration unit 63 and stored.

ステップS223、または、ステップS226の処理の終了後、ステップS227において、ベクトル演算部62は、負履歴保存部48に保存されている負履歴の操作ログを参照して、ステップS223の処理により推薦された番組、または、ステップS224の処理により推薦された番組のうち、グループ化されているので、ステップS226の処理において推薦優先グループとして登録された番組に対して、例えば、推薦した番組が受け入れられずにその他の番組の視聴の視聴または録画を指令する操作入力や、自動録画された番組の再生前の消去を指令する操作入力など、負の履歴となる操作入力を受けたか否かを判断する。ステップS227において、負の履歴となる操作入力を受けていないと判断された場合、処理が終了される。   After the process of step S223 or step S226 is completed, in step S227, the vector calculation unit 62 refers to the negative history operation log stored in the negative history storage unit 48 and is recommended by the process of step S223. For example, a recommended program is not accepted for a program registered as a recommended priority group in the process of step S226, because the programs are grouped among the recommended programs or the programs recommended by the process of step S224. In addition, it is determined whether or not an operation input for giving a negative history such as an operation input for instructing viewing or recording of other programs or an operation input for instructing to erase the automatically recorded program before reproduction is received. If it is determined in step S227 that an operation input that is a negative history has not been received, the process ends.

ステップS227において、負の履歴となる操作入力を受けたと判断された場合、ステップS228において、ベクトル演算部62は、ユーザ情報登録部63の推薦優先グループの登録から、対応するグループをはずして、処理が終了される。   If it is determined in step S227 that an operation input having a negative history has been received, in step S228, the vector calculation unit 62 removes the corresponding group from the recommended priority group registration in the user information registration unit 63, and performs processing. Is terminated.

なお、図9を用いて説明したタイトルグループ化処理1により、1つの番組ベクトルPPに複数のグループIDが関連付けられている場合もある。特にこのような場合には、ステップS228において、負の履歴となる操作入力により、ユーザ情報登録部63の推薦優先グループの登録から、全てのグループIDがはずされるようにしても良いし、負の履歴となる操作入力の回数を蓄積するようにし、所定の数だけ負の履歴となる操作入力が行われた場合に、ユーザ情報登録部63の推薦優先グループの登録から、対応するグループIDがはずされるようにしても良い。また、1つの番組ベクトルPPに1つののグループIDが関連付けられている場合においても同様である。   Note that there may be a case where a plurality of group IDs are associated with one program vector PP by the title grouping process 1 described with reference to FIG. In particular, in such a case, in step S228, all group IDs may be removed from the recommended priority group registration of the user information registration unit 63 by an operation input as a negative history. The number of operation inputs that become the history of the user ID is accumulated, and when a predetermined number of operation inputs that become a negative history are made, the corresponding group ID is obtained from the registration of the recommended priority group of the user information registration unit 63. It may be removed. The same applies to the case where one group ID is associated with one program vector PP.

このような処理により、ユーザが好んで視聴している連続ドラマを全ての回において推薦されるようにしたり、ユーザに非常に好まれている番組と同グループの番組を推薦するようにすることができるので、推薦のための演算処理を削減することができる。   Through such a process, it is possible to recommend a series of dramas that the user likes to watch at all times, or to recommend a program of the same group as a program that the user likes very much. As a result, calculation processing for recommendation can be reduced.

このように、グループ推薦を含むマッチング処理が行われている場合、テレビジョン表示装置11または録画再生装置12から取得されるユーザの操作履歴を基に生成される正履歴ベクトルUPおよび負履歴ベクトルMUPは、対応するグループごとに生成されるようにしてもよい。   As described above, when matching processing including group recommendation is performed, the positive history vector UP and the negative history vector MUP generated based on the user's operation history acquired from the television display device 11 or the recording / playback device 12. May be generated for each corresponding group.

また、テレビジョン表示装置11または録画再生装置12から取得されるユーザの操作履歴のうちの正履歴を基に、同一の連続ドラマにおける視聴または録画予約の回数をカウントし、所定回数以上になった場合に、マッチング処理を特に行うことなく、優先的に推薦するようにしてもかまわない。   Also, based on the positive history of the user's operation history acquired from the television display device 11 or the recording / playback device 12, the number of times of viewing or recording reservations in the same continuous drama is counted, and the predetermined number or more is reached. In this case, the matching process may not be particularly performed and the recommendation may be preferentially performed.

また、ユーザ履歴を用いて番組の推薦処理を行うのではなく、ユーザが予め指定したトピックを基にユーザモデルを設定し、ユーザモデルを基に番組の推薦処理を行うようにしてもよい。   Instead of performing the program recommendation process using the user history, a user model may be set based on a topic designated in advance by the user, and the program recommendation process may be performed based on the user model.

ユーザモデルは、所定の番組群から、ユーザが予め指定したトピックを用いてフィルタリングを行うことにより、トピックに対応する番組を抽出することで得られる。初期登録保存部45は、ユーザにより入力されたトピックを保存する。登録されるトピックは複数であってもかまわないし、ユーザの操作入力によって、適宜、更新される。ベクトル演算部62は、番組ベクトル抽出部42から供給される、ユーザモデル作成対象の番組の番組ベクトルにおいて、初期登録保存部45に保存されているトピックを含む番組ベクトルを抽出し、抽出された番組ベクトルの総和を、必要に応じて正規化することにより、ユーザモデルベクトルを生成し、ユーザ情報登録部63に登録する。   The user model is obtained by extracting a program corresponding to a topic from a predetermined program group by performing filtering using a topic designated in advance by the user. The initial registration storage unit 45 stores topics input by the user. There may be a plurality of topics to be registered, and the topics are updated as appropriate according to user operation inputs. The vector calculation unit 62 extracts the program vector including the topic stored in the initial registration storage unit 45 from the program vector of the program to be created by the user model supplied from the program vector extraction unit 42, and the extracted program A user model vector is generated by normalizing the sum of the vectors as necessary, and registered in the user information registration unit 63.

これにより、例えば、トピックとして、時間帯Hm=「23時以降」およびジャンルGm=「バラエティ」が指定された場合、これらのトピックを用いてフィルタリングが行われ、ユーザモデル「深夜のバラエティ」が生成される。ユーザモデル「深夜のバラエティ」には、23時以降の深夜枠に放送されるバラエティ番組に出演したコメディアンが構成要素として含まれるので、例えば、ドラマなどの、バラエティとは異なるジャンルの番組において、対応するコメディアンが出演する番組がマッチング処理において抽出され、推薦されるので、項目ごとにマッチング処理を行う場合と比較して、ユーザの嗜好を、ジャンルなどを超越して適用することが可能となる。   Thus, for example, when the time zone Hm = “after 23:00” and the genre Gm = “variety” are specified as topics, filtering is performed using these topics, and the user model “late-night variety” is generated. Is done. The user model “Midnight Variety” includes a comedian who appeared in a variety program broadcast in the late-night frame after 23:00 as a component, so it can be used in programs of a genre different from variety, such as dramas. Since a program in which the comedian appears is extracted and recommended in the matching process, it is possible to apply the user's preference across genres and the like as compared with the case where the matching process is performed for each item.

なお、ユーザモデル作成対象の番組は、例えば、所定期間の全番組であっても、所定の時間帯(例えば、いわゆるゴールデンタイム)に放送された番組群であってもよい。   Note that the user model creation target program may be, for example, all programs for a predetermined period or a group of programs broadcast in a predetermined time zone (for example, so-called golden time).

また、例えば、同じフィルタリング条件を用いて、異なる番組集合を対象にフィルタリングを行うことによって、例えば、異なる時期、あるいは、異なる時間帯などの、異なる番組編成に詳細に対応したユーザモデルベクトルを生成することができる。   Also, for example, by filtering on different program sets using the same filtering condition, user model vectors corresponding to details of different program organization, for example, at different times or different time zones, are generated. be able to.

具体的には、同じ「ジャンルGm=音楽」という条件でも、現在の番組編成と、10年前の番組編成では、放送時刻や出演者に違いがあるので、「現在の音楽ファン」「10年前の音楽ファン」という異なるユーザモデルを生成することができる。これにより、「10年前の音楽ファン」が好んで聞いていたポップス歌手が、現在、俳優として出演しているドラマや映画などを推薦したり、または、「10年前の音楽ファン」が好んで聞いていた楽曲を、現在の歌手が歌うような番組を推薦することが可能となる。   Specifically, even under the same condition of “genre Gm = music”, there is a difference in broadcast time and performers between the current program organization and the program organization 10 years ago, so “current music fan” “10 years” A different user model can be generated, called “Previous Music Fan”. This makes it possible for a pop singer that a “music fan 10 years ago” would like to listen to recommends a drama or movie that is currently acting as an actor, or a “music fan 10 years ago”. It is possible to recommend a program that the current singer sings the music that was being heard.

また、例えば、主に社会人が視聴するような、20時乃至24時などの時間帯と、主に子供が視聴するような、15時乃至20時などの時間帯とでは、同じ「ジャンルGm=音楽」という条件でも、フィルタリングにより異なる番組群を得ることができるので、異なるユーザモデルを生成することができる。   Further, for example, the same “genre Gm” is used in a time zone such as 20:00 to 24:00 that is mainly viewed by a member of society and a time zone such as 15:00 to 20:00 that is mainly viewed by a child. Since different programs can be obtained by filtering even under the condition “= music”, different user models can be generated.

そして、ベクトル演算部62は、番組ベクトル抽出部42から供給される番組の番組ベクトルPPと、ユーザ情報登録部63に登録されているユーザモデルベクトルとの類似度を演算し、その結果を基に、推薦情報を生成し、推薦情報出力部49に供給する。推薦情報出力部49は、推薦情報を、推薦番組リスト50に登録するとともに、テレビジョン表示装置11、または、録画再生装置12に供給する。   The vector calculation unit 62 calculates the similarity between the program vector PP of the program supplied from the program vector extraction unit 42 and the user model vector registered in the user information registration unit 63, and based on the result. The recommendation information is generated and supplied to the recommendation information output unit 49. The recommended information output unit 49 registers the recommended information in the recommended program list 50 and supplies the recommended information to the television display device 11 or the recording / playback device 12.

次に、図29のフローチャートを参照して、ユーザモデルを用いたマッチング処理について説明する。   Next, the matching process using the user model will be described with reference to the flowchart of FIG.

ステップS231において、マッチング処理部43のベクトル演算部62は、番組ベクトル抽出部42において抽出された、ユーザモデル作成対象の番組の番組ベクトルを取得する。ユーザモデル作成対象の番組とは、例えば、1ヶ月または3ヶ月などの所定の期間に放送された番組であっても、それら所定の期間中の所定の時間帯(例えば、ゴールデンタイム)に放送された番組であっても良いし、あるいは、10年前、20年前などの、過去の所定の期間に放送された番組であっても良い。   In step S231, the vector calculation unit 62 of the matching processing unit 43 acquires the program vector of the program to be created by the user model extracted by the program vector extraction unit 42. The user model creation target program is, for example, a program broadcast during a predetermined period such as one month or three months, and is broadcast during a predetermined time period (for example, golden time) during the predetermined period. It may be a program that has been broadcast for a predetermined period in the past, such as 10 years ago or 20 years ago.

ステップS232において、初期登録保存部45は、操作入力部44より、ユーザにより入力されたトピックを取得し、保存する。ベクトル演算部62は、初期登録保存部45からトピックを読み出して、フィルタリング条件として設定する。フィルタリング条件は、例えば、ハッシュテーブルとして記載されるようにしても良い。   In step S232, the initial registration storage unit 45 acquires the topic input by the user from the operation input unit 44 and stores it. The vector calculation unit 62 reads the topic from the initial registration storage unit 45 and sets it as a filtering condition. The filtering condition may be described as a hash table, for example.

ステップS233において、ベクトル演算部62は、ステップS231において取得された番組ベクトルPPを、ステップS232において設定されたフィルタリング条件を基にフィルタリングし、トピックに合致する番組ベクトルPPを抽出する。例えば、ユーザモデル作成対象の番組が、過去3ヶ月間の全番組である場合、ベクトル演算部62は、過去3ヶ月間の全番組ベクトルPPに対して「タイトルTm、または、ジャンルGm=サッカー」という条件でフィルタリングを施す。   In step S233, the vector calculation unit 62 filters the program vector PP acquired in step S231 based on the filtering condition set in step S232, and extracts a program vector PP that matches the topic. For example, when the user model creation target program is all programs for the past three months, the vector calculation unit 62 performs “title Tm or genre Gm = soccer” for all program vectors PP for the past three months. Filtering is performed under the condition.

ステップS234において、ベクトル演算部62は、ステップS233においてフィルタリングによって抽出された番組ベクトルPPの総和を求めて、ユーザモデルベクトルとする。例えば、「タイトルTm、または、ジャンルGm=サッカー」という条件でフィルタリングが施された場合、「サッカーファン」というユーザモデルのユーザモデルベクトルが生成される。   In step S234, the vector calculation part 62 calculates | requires the sum total of the program vector PP extracted by filtering in step S233, and makes it a user model vector. For example, when filtering is performed under the condition “title Tm or genre Gm = soccer”, a user model vector of a user model “soccer fan” is generated.

ステップS235において、ベクトル演算部62は、ステップS234において生成されたユーザモデルベクトルと、番組ベクトル抽出部42において抽出された、推薦情報を求めるための候補となる(この後放送される予定である)番組の番組ベクトルPPとのコサイン距離を算出する。   In step S235, the vector calculation unit 62 becomes a candidate for obtaining recommendation information extracted by the user model vector generated in step S234 and the program vector extraction unit 42 (will be broadcast later). The cosine distance with the program vector PP of the program is calculated.

ステップS236において、ベクトル演算部62は、ステップS235において算出されたコサイン距離を基に、ユーザモデルベクトルと推薦情報を求めるための候補となる番組の番組ベクトルPPとの類似度を比較し、比較結果を基に、類似度が高いもののうち、上位から所定の数の番組を推薦情報として抽出し、推薦情報出力部49に供給する。推薦情報出力部49は、推薦情報を、推薦番組リスト50に登録するとともに、テレビジョン表示装置11、または、録画再生装置12に供給して、処理が終了される。   In step S236, the vector calculation unit 62 compares the similarity between the user model vector and the program vector PP of a candidate program for obtaining recommendation information based on the cosine distance calculated in step S235, and the comparison result. Based on the above, a predetermined number of programs from the top among those having high similarity are extracted as recommendation information and supplied to the recommendation information output unit 49. The recommended information output unit 49 registers the recommended information in the recommended program list 50 and supplies the recommended information to the television display device 11 or the recording / reproducing device 12, and the processing is completed.

このような処理により、ユーザの操作履歴がない場合においても、ユーザが設定したトピックに合致した番組を推薦することができる。また、従来においては、例えば、「タイトルTm、または、ジャンルGm=サッカー」という条件を設定してマッチング処理を行った場合、サッカー選手が出演するバラエティやドラマなどを抽出することができなかった。これに対して、図29を用いて説明した処理においては、「タイトルTm、または、ジャンルGm=サッカー」というトピックでユーザモデルを設定することにより、ユーザモデルベクトルの出演者や内容などの項目にも、サッカー選手名が多く含まれるために、たとえ「タイトルTm、または、ジャンルGm=サッカー」という条件に合致していない番組であっても、サッカー選手が出演するバラエティやドラマなどを抽出して推薦することが可能となる。   By such processing, even when there is no user operation history, it is possible to recommend a program that matches the topic set by the user. Conventionally, for example, when a matching process is performed by setting a condition of “title Tm or genre Gm = soccer”, it is impossible to extract a variety or drama in which a soccer player appears. On the other hand, in the process described with reference to FIG. 29, by setting a user model with the topic “title Tm or genre Gm = soccer”, items such as performers and contents of the user model vector are set. However, since many soccer player names are included, even if the program does not meet the condition of “title Tm or genre Gm = soccer”, the variety or drama in which the soccer player appears is extracted. It becomes possible to recommend.

ここでは、ユーザモデルベクトルと、番組ベクトルとのコサイン距離を算出することにより、類似度を求めるものとして説明しているが、大項目ごとに、個別にコサイン距離を算出し、その合計を用いて類似度を求めるようにしても良い。   Here, the cosine distance between the user model vector and the program vector is calculated to calculate the similarity, but for each major item, the cosine distance is calculated individually and the sum is used. The similarity may be obtained.

なお、ユーザモデルベクトルの生成処理は、配信サーバ5において実行されるようにしてもよい。その場合、例えば、図2を用いて説明した番組ベクトル生成部23が生成した番組ベクトルを用いて、図29のステップS231乃至ステップS234の処理が実行されるようにすれば良い。   Note that the user model vector generation process may be executed in the distribution server 5. In that case, for example, the processing of steps S231 to S234 of FIG. 29 may be executed using the program vector generated by the program vector generation unit 23 described with reference to FIG.

また、ユーザの嗜好にあった番組を推薦するばかりでなく、正履歴ベクトルUPおよび負履歴ベクトルMUPのいずれとも類似度が低いものを選ぶと、好きでも嫌いでもない、すなわち、これまでユーザが視聴したことのない特徴を有する番組、換言すれば、食わず嫌いの番組が推薦される可能性が高くなる。このように、ユーザの嗜好を抽出して学習を進めるためには、これまでユーザが視聴したことのない特徴を有する番組も評価してもらうことが重要である。   In addition to recommending programs that match the user's preference, choosing a low-history vector UP or negative-history vector MUP that has a low degree of similarity does not like or dislike, that is, the user has ever viewed it. There is a high possibility that a program having a characteristic that has never been performed, in other words, a program that is not eaten and hated is recommended. As described above, in order to extract the user's preference and advance the learning, it is important that the program having the characteristics that the user has never watched is evaluated.

これにより、ユーザに対して提供する推薦結果に意外性を与え、ユーザの興味の拡大につなげることが可能になるばかりでなく、よりユーザの嗜好に合致した番組を推薦するために、非常に重要な履歴情報を取得することが可能となる。   This not only makes it possible to give unexpected results to the recommendation results provided to the user and expands the user's interest, but is also very important for recommending programs that better match the user's preferences. History information can be acquired.

次に、図30のフローチャートを参照して、例外推薦番組選択処理について説明する。   Next, the exceptional recommended program selection process will be described with reference to the flowchart of FIG.

ステップS241において、マッチング処理部43のベクトル演算部62は、番組ベクトル抽出部42から供給された番組ベクトルPPと、正履歴保存部47に保存されている正履歴ベクトルUP、および、負履歴保存部48に保存されている負履歴ベクトルMUPとを用いて、大項目ごとに、正履歴ベクトルUPと番組ベクトルPPとのコサイン距離、および、負履歴ベクトルMUPと番組ベクトルPPとのコサイン距離を、それぞれ算出する。   In step S241, the vector calculation unit 62 of the matching processing unit 43 includes the program vector PP supplied from the program vector extraction unit 42, the positive history vector UP stored in the positive history storage unit 47, and the negative history storage unit. 48, the cosine distance between the positive history vector UP and the program vector PP and the cosine distance between the negative history vector MUP and the program vector PP for each major item using the negative history vector MUP stored in FIG. calculate.

ステップS242において、ベクトル演算部62は、項目ごとに算出されたコサイン距離の値を、正履歴側と負履歴側で、それぞれ、合計する。すなわち、ステップS241およびステップS242の処理により、上述した、正履歴ベクトルUPと番組ベクトルPPとの類似度SimUPおよび負履歴ベクトルMUPと番組ベクトルPPとの類似度SimMUPが算出される。   In step S242, the vector calculation unit 62 adds the cosine distance values calculated for each item on the positive history side and the negative history side, respectively. In other words, the above-described similarity SimUP between the positive history vector UP and the program vector PP and the similarity SimMUP between the negative history vector MUP and the program vector PP are calculated by the processing in steps S241 and S242.

ステップS243において、ベクトル演算部62は、正履歴ベクトルUP、および、負履歴ベクトルMUPとの類似度の低さを示す例外推薦値を算出する。   In step S243, the vector calculation unit 62 calculates an exceptional recommended value indicating a low degree of similarity between the positive history vector UP and the negative history vector MUP.

具体的には、例外推薦値は、(1−SimUP)×(1−SimMUP)または(1/SimUP)×(1/SimMUP)によって求めることが可能である。   Specifically, the exceptional recommendation value can be obtained by (1-SimUP) × (1-SimMUP) or (1 / SimUP) × (1 / SimMUP).

ステップS244において、ベクトル演算部62は、ステップS243の算出結果を基に、例外推薦値の高い番組を求め、推薦情報として抽出し、処理が終了される。   In step S244, the vector calculation unit 62 obtains a program with a high exceptional recommendation value based on the calculation result in step S243, extracts it as recommendation information, and the process ends.

このような処理により、これまでユーザが視聴したことのない特徴を有する番組を抽出して推薦することができるので、ユーザへの推薦番組の選択に、意外性を与え、ユーザの興味の拡大につなげることが可能になるばかりでなく、よりユーザの嗜好に合致した番組を推薦するために、非常に重要な履歴情報を取得することが可能となる。   By such processing, it is possible to extract and recommend programs having characteristics that have not been viewed by the user so far, so that the selection of the recommended programs to the user is surprising and the user's interest is expanded. In addition to being able to connect, it is possible to acquire very important history information in order to recommend programs more suited to the user's preference.

図13乃至図30を用いて説明した処理により、番組推薦処理装置10において、推薦情報が生成されて、テレビジョン表示装置11、または、録画再生装置12に供給される。   Through the processing described with reference to FIGS. 13 to 30, recommendation information is generated in the program recommendation processing device 10 and supplied to the television display device 11 or the recording / playback device 12.

テレビジョン表示装置11、または、録画再生装置12には、テレビジョン受信装置4において受信されて復号された衛星波または地上波の放送信号が供給される。   The television display device 11 or the recording / playback device 12 is supplied with a satellite wave or terrestrial broadcast signal received and decoded by the television receiver 4.

テレビジョン表示装置11は、ユーザの操作入力を基に、テレビジョン受信装置4から供給された放送信号、または、録画再生装置12から供給された再生データを表示したり、番組推薦処理装置10から供給された推薦情報を基に、推薦番組情報を表示したり、チャンネルの自動設定を実行する。更に、テレビジョン表示装置11は、操作ログを番組推薦処理装置10に供給する。   The television display device 11 displays the broadcast signal supplied from the television receiver 4 or the playback data supplied from the recording / playback device 12 or the program recommendation processing device 10 based on a user operation input. Based on the supplied recommendation information, recommended program information is displayed, and automatic channel setting is executed. Further, the television display device 11 supplies the operation log to the program recommendation processing device 10.

また、録画再生装置12は、ユーザの操作入力を基に、テレビジョン受信装置4から供給された放送信号を録画または録画予約したり、番組推薦処理装置10から供給された推薦情報を基に、番組を自動録画する。また、録画再生装置12は、装着された記録媒体、または、内蔵する記録媒体に録画されている番組を再生し、テレビジョン表示装置11に出力して表示させる。更に、録画再生装置12は、操作ログを番組推薦処理装置10に供給する。   Further, the recording / reproducing apparatus 12 records or reserves a broadcast signal supplied from the television receiving apparatus 4 based on a user operation input, or based on recommendation information supplied from the program recommendation processing apparatus 10. Automatically record programs. In addition, the recording / reproducing apparatus 12 reproduces a program recorded on the attached recording medium or a built-in recording medium, and outputs and displays the program on the television display apparatus 11. Further, the recording / reproducing apparatus 12 supplies the operation log to the program recommendation processing apparatus 10.

図31は、テレビジョン受信装置4の構成を示すブロック図である。テレビジョン受信装置4は、デジタル放送用受信装置の標準規格に対応する一般的な受信装置であるものとして説明する。   FIG. 31 is a block diagram illustrating a configuration of the television receiver 4. The television receiver 4 will be described as being a general receiver corresponding to the standard of a digital broadcast receiver.

衛星波検波部91は、衛星2を介して送信され、アンテナ3によって受信された衛星波を、テレビジョン表示装置11、または、録画再生装置12から供給されたチャンネルを選択する信号を基に選局して検波し、伝送モードに関する制御信号をTMCC(Transmission and Multiplexing Configuration Control)復号部92に、放送信号を復調・復号処理部93に供給する。   The satellite wave detector 91 selects a satellite wave transmitted via the satellite 2 and received by the antenna 3 based on a signal for selecting a channel supplied from the television display device 11 or the recording / playback device 12. The control signal relating to the transmission mode is supplied to a TMCC (Transmission and Multiplexing Configuration Control) decoding unit 92 and the broadcast signal is supplied to a demodulation / decoding processing unit 93.

TMCC復号部92は、伝送多重制御信号における伝送モード(変調方式、符号化率など)やスロット等の情報の入力を受け、これらの情報を復号し、復調・復号処理部93に供給する。   The TMCC decoding unit 92 receives input of information such as a transmission mode (modulation scheme, coding rate, etc.) and a slot in the transmission multiplex control signal, decodes the information, and supplies the information to the demodulation / decoding processing unit 93.

復調・復号処理部93は、TMCC復号部92から供給された、伝送モードに関する情報に基づいて、供給された放送信号を、例えば、QPSK(quadri-phase shift keying:4位相変調方式、または、4相PSKとも称する)方式や、8相PSK方式などの方法を用いて復調および復号し、デインタリーバ94に供給する。   The demodulation / decoding processing unit 93 converts the supplied broadcast signal into, for example, a QPSK (quadri-phase shift keying: 4 phase modulation scheme, or 4) based on the information regarding the transmission mode supplied from the TMCC decoding unit 92. The signal is demodulated and decoded using a method such as a phase PSK method or an 8-phase PSK method, and supplied to the deinterleaver 94.

デインタリーバ94は、供給された信号をデインタリーブして、誤り訂正処理部95に供給する。また、デインタリーバ94は、供給された信号に対して、更に、フレーム分離やデスクランブルの処理を施すようにしても良い。   The deinterleaver 94 deinterleaves the supplied signal and supplies it to the error correction processing unit 95. Further, the deinterleaver 94 may further perform frame separation and descrambling processing on the supplied signal.

誤り訂正処理部95は、例えば、リードソロモン符号などを用いた誤り訂正処理を行い、CA(Conditional Access:限定受信)デスクランブル部101に供給する。   The error correction processing unit 95 performs error correction processing using, for example, a Reed-Solomon code and supplies the result to a CA (Conditional Access) descrambling unit 101.

地上波検波部96は、アンテナ3によって受信された地上波を、テレビジョン表示装置11または録画再生装置12から供給された、チャンネルを選択する制御信号を基に選局して検波し、伝送モードに関する制御信号をTMCC復号部97に、放送信号を復調・復号処理部98に供給する。   The terrestrial wave detection unit 96 selects and detects a terrestrial wave received by the antenna 3 based on a control signal for selecting a channel supplied from the television display device 11 or the recording / reproducing device 12, and transmits a transmission mode. The control signal is supplied to the TMCC decoding unit 97, and the broadcast signal is supplied to the demodulation / decoding processing unit 98.

TMCC復号部97は、伝送多重制御信号における伝送モード(変調方式、符号化率など)やスロット、TS等の情報の入力を受け、これらの情報を復号し、復調・復号処理部98に供給する。   The TMCC decoding unit 97 receives input of information such as a transmission mode (modulation scheme, coding rate, etc.), slot, TS, etc. in the transmission multiplex control signal, decodes the information, and supplies it to the demodulation / decoding processing unit 98. .

復調・復号処理部98は、TMCC復号部97から供給された、伝送モードに関する情報に基づいて、供給された放送信号を、例えば、QAM(quadrature amplitude modulation:直交振幅変調)方式などの方法を用いて復調および復号し、デインタリーバ99に供給する。   The demodulation / decoding processing unit 98 uses, for example, a method such as a QAM (quadrature amplitude modulation) method for the supplied broadcast signal based on the information regarding the transmission mode supplied from the TMCC decoding unit 97. The signal is demodulated and decoded and supplied to the deinterleaver 99.

デインタリーバ99は、供給された信号をデインタリーブして、TS(Transport Stream;トランスポートストリーム)再生部100に供給する。また、デインタリーバ99は、供給された信号に対して、更に、フレーム分離やデスクランブルの処理を施すようにしても良い。   The deinterleaver 99 deinterleaves the supplied signal and supplies it to the TS (Transport Stream) reproducing unit 100. Further, the deinterleaver 99 may further perform frame separation and descrambling processing on the supplied signal.

TS再生部100は、供給された信号を基に、トランスポートストリームを再生し、CAデスクランブル部101に供給する。   The TS reproducing unit 100 reproduces the transport stream based on the supplied signal and supplies the transport stream to the CA descrambling unit 101.

CAデスクランブル部101は、誤り訂正処理部95、または、TS再生部100から供給された信号を基に、限定受信信号をデスクランブルし、デマルチプレクサ102に供給する。   The CA descrambling unit 101 descrambles the limited reception signal based on the signal supplied from the error correction processing unit 95 or the TS reproduction unit 100 and supplies it to the demultiplexer 102.

データ入力部103は、EPG受信装置9から、EPGデータの入力を受けたり、ネットワーク8を介して、配信サーバ5より、ストリーミングデータの供給を受け、デマルチプレクサ102に供給する。   The data input unit 103 receives EPG data input from the EPG receiving device 9 or receives streaming data supplied from the distribution server 5 via the network 8 and supplies the streaming data to the demultiplexer 102.

デマルチプレクサ102は、CAデスクランブル部101、または、データ入力部103から供給された信号をデマルチプレクスし、音声信号は音声信号復号部104に、映像信号は、映像信号復号部105に、そして、制御信号やEPGなどのデータは、データ復号部106にそれぞれ供給する。   The demultiplexer 102 demultiplexes the signal supplied from the CA descrambling unit 101 or the data input unit 103, the audio signal to the audio signal decoding unit 104, the video signal to the video signal decoding unit 105, and The control signal and data such as EPG are supplied to the data decoding unit 106, respectively.

音声信号復号部104は、供給された音声信号を復号し、テレビジョン表示装置11、または、録画再生装置12に供給する。映像信号復号部105は、供給された映像信号を復号し、テレビジョン表示装置11、または、録画再生装置12に供給する。データ復号部106は、供給された制御信号やEPGなどのデータを復号し、テレビジョン表示装置11、または、録画再生装置12に供給する。   The audio signal decoding unit 104 decodes the supplied audio signal and supplies the decoded audio signal to the television display device 11 or the recording / playback device 12. The video signal decoding unit 105 decodes the supplied video signal and supplies the decoded video signal to the television display device 11 or the recording / playback device 12. The data decoding unit 106 decodes the supplied control signal, data such as EPG, and supplies the decoded data to the television display device 11 or the recording / playback device 12.

テレビジョン受信装置4の処理により、受信された衛星波、または地上波、あるいは、配信されたストリーミングデータが、所定の方式により復調および復号されて、テレビジョン表示装置11、または、録画再生装置12に供給される。   The received satellite wave, terrestrial wave, or distributed streaming data is demodulated and decoded by a predetermined method by the processing of the television receiving device 4, and the television display device 11 or the recording / reproducing device 12 is decoded. To be supplied.

図32は、テレビジョン表示装置11の構成を示すブロック図である。   FIG. 32 is a block diagram illustrating a configuration of the television display device 11.

操作入力部121は、ユーザからの操作入力を受け、テレビジョン表示装置11の各部にユーザの操作入力に対応する制御信号を供給するとともに、ユーザの操作内容を操作ログリスト122に供給して保存させる。操作ログリスト122に保存されているユーザの操作ログは、図13を用いて説明した番組推薦処理装置10の操作ログ取得部46により取得される。また、ユーザの操作入力が、チャンネルの選択であった場合、操作入力部121は、入力されたユーザの操作をチャンネル設定部123に供給する。   The operation input unit 121 receives an operation input from the user, supplies a control signal corresponding to the user's operation input to each unit of the television display device 11, and supplies the operation content of the user to the operation log list 122 for storage. Let The user operation log stored in the operation log list 122 is acquired by the operation log acquisition unit 46 of the program recommendation processing apparatus 10 described with reference to FIG. When the user operation input is a channel selection, the operation input unit 121 supplies the input user operation to the channel setting unit 123.

チャンネル設定部123は、操作入力部121から供給されたユーザの操作入力を示す信号に基づいて、チャンネルの選択を示す制御信号を生成し、テレビジョン受信装置4に供給する。また、チャンネル設定部123は、後述する推薦番組リスト128に登録されている推薦情報に基づいて、自動的にチャンネルを設定するために、チャンネルの選択を示す制御信号を生成し、テレビジョン受信装置4に供給する。テレビジョン受信装置4は、制御信号に基づいて、指定されたチャンネルの放送信号を受信する。   The channel setting unit 123 generates a control signal indicating channel selection based on the signal indicating the user operation input supplied from the operation input unit 121 and supplies the control signal to the television receiver 4. In addition, the channel setting unit 123 generates a control signal indicating channel selection in order to automatically set a channel based on recommendation information registered in a recommended program list 128 described later, and the television receiver 4 is supplied. The television receiver 4 receives a broadcast signal of a designated channel based on the control signal.

データ入力部124は、テレビジョン受信装置4から放送信号の入力を受け、画像処理部125に供給する。画像処理部125は、供給された放送信号に対して、出力部126の画像表示方法に基づいて、画像処理を施し、出力部126に供給する。出力部126は、例えば、CRT(Cathode Ray Tube)、または、LCD(Liquid Crystal Display)などの表示デバイスと、スピーカなどの音声出力デバイスで構成され、供給された画像処理後の放送信号の画像信号を表示デバイスに表示し、音声出力デバイスから音声信号を出力する。   The data input unit 124 receives broadcast signals from the television receiver 4 and supplies them to the image processing unit 125. The image processing unit 125 performs image processing on the supplied broadcast signal based on the image display method of the output unit 126 and supplies the processed broadcast signal to the output unit 126. The output unit 126 includes, for example, a display device such as a CRT (Cathode Ray Tube) or LCD (Liquid Crystal Display) and an audio output device such as a speaker, and the supplied image signal of the broadcast signal after image processing is supplied. Is displayed on the display device, and an audio signal is output from the audio output device.

推薦番組リスト取得部127は、番組推薦処理装置10から、推薦情報を取得し、推薦番組リスト128に供給する。推薦番組リスト128は、供給された推薦情報を登録する。推薦番組リスト128に登録された推薦情報は、チャンネル設定部123に読み出されたり、推薦番組情報表示制御部129に読み出される。   The recommended program list acquisition unit 127 acquires recommended information from the program recommendation processing device 10 and supplies the recommended information to the recommended program list 128. The recommended program list 128 registers the supplied recommendation information. The recommended information registered in the recommended program list 128 is read by the channel setting unit 123 or the recommended program information display control unit 129.

推薦番組情報表示制御部129は、番組の推薦情報をユーザに提示するために、推薦番組リスト128から読み出した推薦情報を、画像処理部125に出力する。画像処理部125は、推薦番組情報表示制御部129から供給された推薦情報を、単独で、または、データ入力部124から供給された放送信号の画像に重畳させて、出力部126に出力して、表示デバイスに表示させる。   The recommended program information display control unit 129 outputs the recommended information read from the recommended program list 128 to the image processing unit 125 in order to present the recommended information of the program to the user. The image processing unit 125 outputs the recommended information supplied from the recommended program information display control unit 129 to the output unit 126 alone or superimposed on the image of the broadcast signal supplied from the data input unit 124. , Display on the display device.

なお、番組推薦処理装置10から供給される推薦情報を基に、出力部126に推薦情報を表示させるか、自動的にチャンネルを設定させるようにするかは、ユーザの設定によって決定されるようにしても良い。   It should be noted that, based on the recommendation information supplied from the program recommendation processing device 10, whether the recommendation information is displayed on the output unit 126 or whether the channel is automatically set is determined by the user setting. May be.

図33のフローチャートを参照して、番組推薦処理装置10から供給される推薦情報を基に、ユーザに番組推薦情報を提示するための推薦情報表示処理について説明する。   A recommendation information display process for presenting program recommendation information to the user based on the recommendation information supplied from the program recommendation processing apparatus 10 will be described with reference to the flowchart of FIG.

ステップS251において、推薦番組リスト取得部127は、番組推薦処理装置10の推薦情報出力部49から出力された推薦情報を取得する。   In step S <b> 251, the recommended program list acquisition unit 127 acquires the recommendation information output from the recommendation information output unit 49 of the program recommendation processing device 10.

ステップS252において、推薦番組リスト取得部127は、取得した推薦情報を、推薦番組リスト128に登録する。   In step S <b> 252, the recommended program list acquisition unit 127 registers the acquired recommendation information in the recommended program list 128.

ステップS253において、推薦番組情報表示制御部129は、推薦番組リスト128から、例えば、3時間や1日など、現在時刻よりも所定の時間以内に放送される番組の推薦情報を読み出し、推薦する番組のタイトル、内容、放送時間、および、放送チャンネルなどを表示させるための、推薦情報表示用のデータを生成し、画像処理部125に供給する。   In step S253, the recommended program information display control unit 129 reads, from the recommended program list 128, recommended information of a program broadcast within a predetermined time from the current time, such as 3 hours or 1 day, and a recommended program. Recommendation information display data for displaying the title, content, broadcast time, broadcast channel, and the like of the image is generated and supplied to the image processing unit 125.

ステップS254において、画像処理部125は、供給された推薦情報表示用のデータを、出力部126に表示させるための画像処理を実行し、出力部126に供給する。推薦情報は、単独で、または、データ入力部124から供給された放送信号の画像に重畳されて、画像処理される。   In step S <b> 254, the image processing unit 125 executes image processing for causing the output unit 126 to display the supplied recommendation information display data and supplies the output unit 126 with the image processing. The recommendation information is subjected to image processing alone or superimposed on the image of the broadcast signal supplied from the data input unit 124.

ステップS255において、出力部126は、画像処理部125から供給された推薦情報を表示し、処理が終了される。   In step S255, the output unit 126 displays the recommendation information supplied from the image processing unit 125, and the process ends.

このような処理により、出力部126に推薦情報が表示されるので、ユーザは、表示された推薦情報を参照して、視聴する番組を選択することが可能となる。   As a result of such processing, the recommendation information is displayed on the output unit 126, so that the user can select a program to view with reference to the displayed recommendation information.

次に、図34のフローチャートを参照して、番組推薦処理装置10から供給される推薦情報を基に、自動的にチャンネルを設定して、ユーザの嗜好に合致した番組を表示させるための自動チャンネル設定処理について説明する。   Next, referring to the flowchart of FIG. 34, an automatic channel for automatically setting a channel based on the recommendation information supplied from the program recommendation processing device 10 and displaying a program that matches the user's preference. The setting process will be described.

ステップS271およびステップS272において、図33を用いて説明したステップS251およびステップS252と同様の処理が実行される。すなわち、番組推薦処理装置10の推薦情報出力部49から出力された推薦情報が取得され、取得された推薦情報が、推薦番組リスト128に登録される。   In steps S271 and S272, processing similar to that in steps S251 and S252 described with reference to FIG. 33 is executed. That is, the recommendation information output from the recommendation information output unit 49 of the program recommendation processing device 10 is acquired, and the acquired recommendation information is registered in the recommended program list 128.

チャンネル設定部123は、ステップS273において、番組推薦リスト128から、現在時刻に対応する推薦番組の情報を取得し、ステップS274において、推薦番組の情報を基に、チャンネル設定情報を生成し、テレビジョン受信装置4に出力する。テレビジョン受信装置4は、制御信号に基づいて、指定されたチャンネルの放送信号を受信する。   In step S273, the channel setting unit 123 acquires recommended program information corresponding to the current time from the program recommendation list 128. In step S274, the channel setting unit 123 generates channel setting information based on the recommended program information. Output to the receiver 4. The television receiver 4 receives a broadcast signal of a designated channel based on the control signal.

ステップS275において、データ入力部124は、テレビジョン受信装置4から指定されたチャンネルの放送信号を取得し、画像処理部125に供給する。   In step S <b> 275, the data input unit 124 acquires a broadcast signal of a designated channel from the television receiver 4 and supplies the broadcast signal to the image processing unit 125.

ステップS276において、画像処理部125は、供給された放送信号に、出力部126に表示させるための画像処理を実行し、出力部126に供給する。   In step S <b> 276, the image processing unit 125 performs image processing for displaying the supplied broadcast signal on the output unit 126 and supplies the image signal to the output unit 126.

ステップS277において、出力部126は、画像処理部125から供給された、推薦された番組の映像を表示して、音声を出力し、処理が終了される。   In step S277, the output unit 126 displays the video of the recommended program supplied from the image processing unit 125, outputs the sound, and the process ends.

このような処理により、自動的に、ユーザの嗜好に合致した番組が放送されているチャンネルにチャンネル設定される。図34を用いて説明した自動チャンネル設定処理は、例えば、ユーザが指令したときに実行されるようにしても良い。これにより、ユーザが、どの番組を視聴するかを悩んだ場合などに、適切な番組が放送されている番組にチャンネルを自動的に設定することが可能となる。   By such processing, the channel is automatically set to the channel on which the program that matches the user's preference is broadcast. The automatic channel setting process described with reference to FIG. 34 may be executed, for example, when a user instructs. This makes it possible to automatically set a channel for a program on which an appropriate program is broadcast when the user is worried about which program to view.

また、図34を用いて説明した自動チャンネル設定処理は、例えば、2時間など、特に意識してチャンネルを設定せず、ただ放置されていると判断可能なような所定の時間ごとに、あるいは、放置されていると判断可能なような所定の時間、ユーザからの操作入力がなかった場合などに実行されるようにしても良い。   In addition, the automatic channel setting process described with reference to FIG. 34 is performed every predetermined time that can be determined to be left alone, for example, for 2 hours or the like without particularly setting the channel. It may be executed when there is no operation input from the user for a predetermined time during which it can be determined that the user is left unattended.

なお、ユーザが意識して番組を視聴している途中で、自動的にチャンネルが切り替わってしまうことがないように、自動チャンネル設定処理の実行不可のモードを用意して、ユーザが指令することができるようにしても良い。   In order to prevent the channel from being automatically switched while the user is consciously watching a program, a mode in which automatic channel setting processing cannot be executed is prepared and the user can instruct. You may be able to do it.

図35は、録画再生装置12の構成を示すブロック図である。   FIG. 35 is a block diagram showing the configuration of the recording / playback apparatus 12.

操作入力部141は、ユーザからの操作入力を受け、録画再生装置12の各部にユーザの操作入力に対応する制御信号を供給するとともに、ユーザの操作内容を操作ログリスト142に供給して保存させる。操作ログリスト142に保存されているユーザの操作ログは、図13を用いて説明した番組推薦処理装置10の操作ログ取得部46により取得される。   The operation input unit 141 receives an operation input from the user, supplies a control signal corresponding to the user's operation input to each unit of the recording / playback apparatus 12, and supplies the operation content of the user to the operation log list 142 for storage. . The user operation log stored in the operation log list 142 is acquired by the operation log acquisition unit 46 of the program recommendation processing apparatus 10 described with reference to FIG.

録画設定部143は、操作入力部141から供給されたユーザの操作入力を示す信号に基づいて、または、後述する推薦番組リスト149に登録されている推薦情報から、例えば、録画する番組の放送開始時間および放送終了時間、並びに、放送されるチャンネルなど、録画処理を行うために必要な情報を抽出する。録画設定部143は、操作入力部141から供給されたユーザの操作入力が録画予約である場合、録画処理を行うために必要な情報を録画予約リスト144に登録し、操作入力部141から供給されたユーザの操作入力が、現在放送されている番組の録画処理である場合、または、後述する推薦番組リスト149に登録されている推薦情報を用いて自動録画処理を行う場合、録画処理を行うために必要な情報を、録画制御部145に供給する。   The recording setting unit 143 starts broadcasting a program to be recorded, for example, based on a signal indicating a user's operation input supplied from the operation input unit 141 or from recommended information registered in a recommended program list 149 described later. Information necessary for recording processing, such as time and broadcast end time, and broadcast channel, is extracted. When the user operation input supplied from the operation input unit 141 is a recording reservation, the recording setting unit 143 registers information necessary for performing the recording process in the recording reservation list 144 and is supplied from the operation input unit 141. If the user's operation input is a recording process for a currently broadcast program, or if an automatic recording process is performed using recommended information registered in a recommended program list 149 described later, the recording process is performed. Information necessary for the recording is supplied to the recording control unit 145.

録画制御部145は、録画設定部143から供給された、録画処理を行うために必要な情報を基に、または、録画予約リスト144に登録されている録画予約情報のうち現在時刻に対応する録画予約情報を抽出することにより、録画する番組の放送チャンネルを示す制御信号を生成して、テレビジョン受信装置4に供給するとともに、録画処理を実行するための制御信号を生成し、録画再生処理部147に供給する。テレビジョン受信装置4は、制御信号に基づいて、指定されたチャンネルの放送信号を受信する。   The recording control unit 145 is based on the information necessary for performing the recording process supplied from the recording setting unit 143 or the recording corresponding to the current time among the recording reservation information registered in the recording reservation list 144. By extracting the reservation information, a control signal indicating the broadcast channel of the program to be recorded is generated and supplied to the television receiver 4, and a control signal for executing the recording process is generated, and a recording / playback processing unit 147. The television receiver 4 receives a broadcast signal of a designated channel based on the control signal.

データ入力部146は、テレビジョン受信装置4から放送信号の入力を受け、録画再生処理部147に供給する。録画再生処理部147は、例えば、磁気テープ、光ディスク、磁気ディスク、光磁気ディスク、または、半導体メモリなどの記録媒体が装着可能なように構成されるか、その内部に、例えば、ハードディスク、または、半導体メモリなどの記録媒体を有し、それらの記録媒体に情報を記録したり、それらの記録媒体から情報を再生可能なようになされている。具体的には、録画再生処理部147に装着可能な記録媒体が磁気テープである場合、録画再生処理部147は、磁気ヘッドを有し、磁気テープにデータ入力部146から供給された放送信号を記録(すなわち、録画)したり、磁気テープに記録されている情報を再生して、テレビジョン表示装置11などに供給して再生出力させる。   The data input unit 146 receives a broadcast signal from the television receiver 4 and supplies it to the recording / playback processing unit 147. The recording / playback processing unit 147 is configured so that a recording medium such as a magnetic tape, an optical disk, a magnetic disk, a magneto-optical disk, or a semiconductor memory can be mounted therein, for example, a hard disk, A recording medium such as a semiconductor memory is provided, and information can be recorded on the recording medium and information can be reproduced from the recording medium. Specifically, when the recording medium that can be attached to the recording / playback processing unit 147 is a magnetic tape, the recording / playback processing unit 147 has a magnetic head, and receives a broadcast signal supplied from the data input unit 146 to the magnetic tape. Information is recorded (that is, recorded) or information recorded on the magnetic tape is reproduced and supplied to the television display 11 or the like for reproduction output.

推薦番組リスト取得部148は、番組推薦処理装置10から、推薦情報を取得し、推薦番組リスト149に供給する。推薦番組リスト149は、供給された推薦情報を登録する。推薦番組リスト149に登録された推薦情報は、録画設定部143に読み出されて、自動的に録画処理が実行される。   The recommended program list acquisition unit 148 acquires recommendation information from the program recommendation processing device 10 and supplies it to the recommended program list 149. The recommended program list 149 registers the supplied recommendation information. The recommendation information registered in the recommended program list 149 is read by the recording setting unit 143, and the recording process is automatically executed.

次に、図36のフローチャートを参照して、自動録画処理について説明する。   Next, automatic recording processing will be described with reference to the flowchart of FIG.

ステップS291において、推薦番組リスト取得部148は、番組推薦処理装置10の推薦情報出力部49から出力された推薦情報を取得する。   In step S291, the recommended program list acquisition unit 148 acquires the recommendation information output from the recommendation information output unit 49 of the program recommendation processing device 10.

ステップS292において、推薦番組リスト取得部148は、取得した推薦情報を、推薦番組リスト149に登録する。   In step S292, the recommended program list acquisition unit 148 registers the acquired recommended information in the recommended program list 149.

ステップS293において、録画設定部143は、番組推薦リスト149から、現在時刻に対応する推薦番組の情報を抽出し、放送開始時間および放送終了時間、並びに、放送チャンネルなどの、録画処理のために必要な情報を取得して、録画制御部145に供給する。   In step S293, the recording setting unit 143 extracts information on a recommended program corresponding to the current time from the program recommendation list 149, and is necessary for recording processing such as broadcast start time and broadcast end time, and broadcast channel. Such information is acquired and supplied to the recording control unit 145.

ステップS294において、録画制御部145は、録画する番組の放送信号の供給を受けるためのチャンネル設定情報を生成し、テレビジョン受信装置4に出力する。テレビジョン受信装置4は、制御信号に基づいて、指定されたチャンネルの放送信号を受信する。   In step S294, the recording control unit 145 generates channel setting information for receiving the supply of the broadcast signal of the program to be recorded, and outputs the channel setting information to the television receiver 4. The television receiver 4 receives a broadcast signal of a designated channel based on the control signal.

ステップS295において、データ入力部146は、テレビジョン受信装置4から、指定されたチャンネルの放送信号を取得し、録画再生処理部147に供給する。   In step S295, the data input unit 146 acquires the broadcast signal of the designated channel from the television receiver 4 and supplies the broadcast signal to the recording / playback processing unit 147.

ステップS296において、録画再生処理部147は、供給された放送信号を、装着されている、または、内蔵されている記録媒体に記録して、処理が終了される。   In step S296, the recording / playback processing unit 147 records the supplied broadcast signal on a recording medium that is attached or built in, and the process ends.

このような処理により、ユーザの嗜好に合致した番組を、自動的に録画することが可能となる。図36を用いて説明した自動録画処理は、ユーザが指令した録画処理、または、録画予約処理による録画動作中など、すでに録画動作が行われている間には実行されない。   By such processing, it is possible to automatically record a program that matches the user's preference. The automatic recording process described with reference to FIG. 36 is not executed while a recording operation is already being performed, such as a recording process instructed by a user or a recording operation by a recording reservation process.

ここでは、現在時刻に対応する推薦番組を基に、自動的に録画を行い場合について説明したが、例えば、現在時刻よりも先の所定の時間分の推薦情報を取得して、同様の処理により、自動的に録画予約を設定することができるようにしてもよいことは言うまでもない。   Here, the case where the recording is automatically performed based on the recommended program corresponding to the current time has been described. However, for example, the recommended information for a predetermined time before the current time is acquired and the same processing is performed. Needless to say, the recording reservation may be automatically set.

図1乃至図36を用いて説明した処理では、番組ベクトルPPが、配信サーバ5において生成されるものとして説明したが、配信サーバが番組ベクトルPPを生成するのではなく、ネットワーク8を介して、EPGデータを番組推薦処理装置に供給し、番組推薦処理装置において、番組ベクトルPPを生成するようにしても良い。   In the processing described with reference to FIGS. 1 to 36, the program vector PP is described as being generated in the distribution server 5, but the distribution server does not generate the program vector PP, but via the network 8. The EPG data may be supplied to the program recommendation processing device, and the program recommendation processing device may generate the program vector PP.

配信サーバが番組ベクトルPPを生成するのではなく、ネットワーク8を介して、EPGデータを番組推薦処理装置に供給し、番組推薦処理装置において、番組ベクトルPPを生成する場合の配信サーバ171の構成を図37に示し、番組推薦処理装置191の構成を図38に示す。   The distribution server does not generate the program vector PP, but supplies the EPG data to the program recommendation processing device via the network 8, and the configuration of the distribution server 171 when the program recommendation processing device generates the program vector PP is as follows. FIG. 37 shows the configuration of the program recommendation processing device 191.

なお、図2の配信サーバ5、および、図13の番組推薦処理装置10における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。   2 corresponding to those in the distribution server 5 in FIG. 2 and the program recommendation processing apparatus 10 in FIG. 13 are denoted by the same reference numerals, and the description thereof is omitted as appropriate.

すなわち、配信サーバ171は、図2を用いて説明した配信サーバ5のデータ取得部21およびデータ送信部25で構成され、ストリーミングデータデータベース6またはメタデータデータベース7からストリーミングデータ、または、メタデータで構成されるEPGデータを取得して、ネットワーク8を介して、EPG受信装置9またはテレビジョン受信装置4に送信する。   That is, the distribution server 171 includes the data acquisition unit 21 and the data transmission unit 25 of the distribution server 5 described with reference to FIG. 2, and includes streaming data or metadata from the streaming data database 6 or the metadata database 7. The EPG data is acquired and transmitted to the EPG reception device 9 or the television reception device 4 via the network 8.

そして、番組推薦処理装置191は、図2の配信サーバ5に設けられていたものと同様のメタデータ取得部22および番組ベクトル生成部23が新たに設けられている以外は、図13を用いて説明した番組推薦処理装置10と同様の構成を有するものであり、番組推薦処理装置10が実行する処理に加えて、図3を用いて説明した番組ベクトル生成処理1、および、図6を用いて説明した番組ベクトル生成処理2、並びに、図7を用いて説明したグループ化処理1、および、図8を用いて説明したグループ化処理2を実行する。   The program recommendation processing device 191 uses FIG. 13 except that a metadata acquisition unit 22 and a program vector generation unit 23 similar to those provided in the distribution server 5 of FIG. 2 are newly provided. It has the same configuration as the program recommendation processing device 10 described, and in addition to the processing executed by the program recommendation processing device 10, the program vector generation processing 1 described with reference to FIG. 3 and FIG. The program vector generation process 2 described above, the grouping process 1 described using FIG. 7, and the grouping process 2 described using FIG. 8 are executed.

配信サーバが番組ベクトルPPを生成するのではなく、ネットワーク8を介して、EPGデータを番組推薦処理装置に供給し、番組推薦処理装置において、番組ベクトルPPを生成する場合においても、図1乃至図36を用いて説明した場合と同様の効果を奏することが可能である。   Even when the distribution server does not generate the program vector PP but supplies EPG data to the program recommendation processing device via the network 8, and the program recommendation processing device generates the program vector PP, FIG. 1 to FIG. It is possible to achieve the same effect as described with reference to 36.

また、更に、EPG受信装置9が、テレビジョンジョン表示装置11および録画再生装置12から、ユーザの操作履歴や設定情報などを収集して、ネットワーク8を介して、配信サーバに供給するようにし、配信サーバが、番組ベクトルPPを生成するのみでなく、マッチング処理を実行し、ネットワーク8を介して、マッチング結果をEPG受信装置9に供給するようにしてもよい。この場合のネットワーク構成を図39に示し、配信サーバ201の構成を示すブロック図を図40に示す。   Further, the EPG receiving device 9 collects user operation history and setting information from the television display device 11 and the recording / playback device 12 and supplies them to the distribution server via the network 8. The distribution server may not only generate the program vector PP but also execute a matching process and supply the matching result to the EPG receiver 9 via the network 8. A network configuration in this case is shown in FIG. 39, and a block diagram showing a configuration of the distribution server 201 is shown in FIG.

なお、図1、図37、および図38における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。   In addition, the same code | symbol is attached | subjected to the part corresponding to the case in FIG.1, FIG.37, and FIG.38, The description is abbreviate | omitted suitably.

すなわち、配信サーバ201は、図37を用いて説明した配信サーバ171に、図38を用いて説明した番組推薦処理装置191の機能を加えたものであり、ユーザは、番組推薦処理装置を保有する必要がない。   That is, the distribution server 201 is obtained by adding the function of the program recommendation processing device 191 described with reference to FIG. 38 to the distribution server 171 described with reference to FIG. 37, and the user has the program recommendation processing device. There is no need.

図39および図40に示される構成においては、番組ベクトルPP、番組側効き目ベクトルEfPP、正履歴ベクトルUP、負履歴ベクトルMUP、もしくは、標準嗜好ベクトルAPPなどの生成処理や、番組ベクトルのグループ化処理、マッチング処理、または、例外推薦番組選択処理などの、図3乃至図12、および、図14乃至図30を用いて説明した全ての処理が、配信サーバ201で実行される。   In the configuration shown in FIGS. 39 and 40, the program vector PP, the program side effect vector EfPP, the positive history vector UP, the negative history vector MUP, or the standard preference vector APP is generated, or the program vector grouping processing is performed. All processing described with reference to FIGS. 3 to 12 and FIGS. 14 to 30 such as matching processing or exceptional recommended program selection processing is executed by the distribution server 201.

なお、このとき、EPG受信装置9が、テレビジョンジョン表示装置11および録画再生装置12から収集して、ネットワーク8を介して送信する、ユーザの操作履歴や設定情報などには、たとえば、ユーザIDなどが付けられて、ユーザごとに区別可能なようになされる。また、配信サーバ201の番組推薦処理装置191において、初期登録保存部45、正履歴保存部47、負履歴保存部48などは、供給された情報のユーザIDを基に、それぞれの情報をユーザ別に保存する。   At this time, the EPG receiving device 9 collects from the television display device 11 and the recording / playback device 12 and transmits it via the network 8, for example, in the user operation history and setting information, for example, the user ID Etc. are added so that each user can be distinguished. Further, in the program recommendation processing device 191 of the distribution server 201, the initial registration storage unit 45, the positive history storage unit 47, the negative history storage unit 48, etc., each information is classified by user based on the user ID of the supplied information. save.

以上の説明においては、テレビジョン放送信号のEPGデータを用いて、ユーザの嗜好にあった番組を推薦する場合について説明したが、本発明は、ラジオ放送、あるいは、ストリーミングデータなどの各種デジタルコンテンツに属性情報を付加し、ユーザの嗜好にあったものを推薦する場合についても適用可能である。   In the above description, the case of recommending a program that suits the user's preference using EPG data of a television broadcast signal has been described. However, the present invention is applicable to various digital contents such as radio broadcast or streaming data. The present invention can also be applied to a case where attribute information is added and a user's preference is recommended.

上述した一連の処理は、ソフトウェアにより実行することもできる。そのソフトウェアは、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどに、記録媒体からインストールされる。   The series of processes described above can also be executed by software. The software is a computer in which the program constituting the software is incorporated in dedicated hardware, or various functions can be executed by installing various programs, for example, a general-purpose personal computer For example, it is installed from a recording medium.

この記録媒体は、図2、図13、または、図38に示すように、コンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク31または71(フレキシブルディスクを含む)、光ディスク32または72(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク33または73(MD(Mini-Disk)(商標)を含む)、もしくは半導体メモリ34または74などよりなるパッケージメディアなどにより構成される。   As shown in FIG. 2, FIG. 13, or FIG. 38, this recording medium is distributed to provide a program to the user separately from the computer, and is recorded on a magnetic disk 31 or 71 (flexible disk). Disk), optical disk 32 or 72 (including CD-ROM (Compact Disk-Read Only Memory), DVD (Digital Versatile Disk)), magneto-optical disk 33 or 73 (MD (Mini-Disk) (trademark) included) ) Or a package medium composed of the semiconductor memory 34 or 74.

また、本明細書において、記録媒体に記録されるプログラムを記述するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。   Further, in the present specification, the step of describing the program recorded on the recording medium is not limited to the processing performed in chronological order according to the described order, but may be performed in parallel or It also includes processes that are executed individually.

なお、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。   In the present specification, the system represents the entire apparatus constituted by a plurality of apparatuses.

テレビジョン番組放送、およびストリームデータの配信について説明する図である。It is a figure explaining a television program broadcast and delivery of stream data. 図1の配信サーバの構成を示すブロック図である。It is a block diagram which shows the structure of the delivery server of FIG. 番組ベクトル生成処理1について説明するフローチャートである。It is a flowchart explaining the program vector generation process 1. FIG. EPGデータを説明する図である。It is a figure explaining EPG data. 番組ベクトルについて説明する図である。It is a figure explaining a program vector. 番組ベクトル生成処理2について説明するフローチャートである。It is a flowchart explaining the program vector generation process 2. FIG. グループ化処理1について説明するフローチャートである。10 is a flowchart for explaining grouping processing 1; グループ化処理2について説明するフローチャートである。10 is a flowchart for explaining grouping processing 2; タイトルグループ化処理1について説明するフローチャートである。It is a flowchart explaining the title grouping process 1. FIG. タイトルグループ化処理2について説明するフローチャートである。It is a flowchart explaining the title grouping process 2. FIG. タイトルグループ化処理3について説明するフローチャートである。10 is a flowchart for explaining title grouping processing 3; タイトルグループ化処理4について説明するフローチャートである。10 is a flowchart for explaining title grouping processing 4; 図1の番組推薦処理装置の構成を示すブロック図である。It is a block diagram which shows the structure of the program recommendation processing apparatus of FIG. 正履歴ベクトルおよび負履歴ベクトル生成処理1について説明するフローチャートである。10 is a flowchart for explaining positive history vector and negative history vector generation processing 1; 正履歴ベクトルを説明する図である。It is a figure explaining a positive history vector. 正履歴ベクトルおよび負履歴ベクトル生成処理2について説明するフローチャートである。10 is a flowchart for explaining positive history vector and negative history vector generation processing 2; マッチング処理1について説明するフローチャートである。It is a flowchart explaining the matching process 1. FIG. マッチング処理2について説明するフローチャートである。It is a flowchart explaining the matching process 2. FIG. マッチング処理3について説明するフローチャートである。It is a flowchart explaining the matching process 3. FIG. マッチング処理4について説明するフローチャートである。It is a flowchart explaining the matching process 4. FIG. マッチング処理5について説明するフローチャートである。It is a flowchart explaining the matching process 5. FIG. ユーザ側効き目ベクトル生成処理1について説明するフローチャートである。It is a flowchart explaining the user side effect vector generation process 1. FIG. ユーザ側効き目ベクトル生成処理2について説明するフローチャートである。It is a flowchart explaining the user side effect vector generation process 2. FIG. ユーザ側効き目ベクトル生成処理3について説明するフローチャートである。It is a flowchart explaining the user side effect vector generation process 3. FIG. ユーザ側効き目ベクトル生成処理4について説明するフローチャートである。It is a flowchart explaining the user side effect vector generation process 4. FIG. ユーザ側反効き目ベクトル生成処理1について説明するフローチャートである。It is a flowchart explaining the user side reaction vector generation process 1. FIG. ユーザ側反効き目ベクトル生成処理2について説明するフローチャートである。It is a flowchart explaining the user side reaction vector generation process 2. FIG. グループ推薦を含むマッチング処理について説明するフローチャートである。It is a flowchart explaining the matching process including group recommendation. ユーザモデルを用いたマッチング処理について説明するフローチャートである。It is a flowchart explaining the matching process using a user model. 例外推薦処理について説明するフローチャートである。It is a flowchart explaining an exception recommendation process. 図1のテレビジョン受信装置の構成を示すブロック図である。It is a block diagram which shows the structure of the television receiver of FIG. 図1のテレビジョン表示装置の構成を示すブロック図である。It is a block diagram which shows the structure of the television display apparatus of FIG. 推薦情報表示処理について説明するフローチャートである。It is a flowchart explaining a recommendation information display process. 自動チャンネル設定処理について説明するフローチャートである。It is a flowchart explaining an automatic channel setting process. 図1の録画再生装置の構成を示すブロック図である。It is a block diagram which shows the structure of the video recording / reproducing apparatus of FIG. 自動録画処理について説明するフローチャートである。It is a flowchart explaining an automatic video recording process. 配信サーバの異なる構成例を示すブロック図である。It is a block diagram which shows the example of a different structure of a delivery server. 番組推薦処理装置の異なる構成例を示すブロック図である。It is a block diagram which shows the example of a different structure of a program recommendation processing apparatus. テレビジョン番組放送、およびストリームデータの配信のためのネットワークの異なる例について説明する図である。It is a figure explaining the example from which the network for a television program broadcast and the delivery of stream data differs. 配信サーバの異なる構成例を示すブロック図である。It is a block diagram which shows the example of a different structure of a delivery server.

符号の説明Explanation of symbols

5 配信サーバ, 10 番組推薦処理装置, 21 データ取得部, 22 メタデータ抽出部, 23 番組ベクトル生成部, 24 データ記憶部, 25 データ送信部, 41 データ取得部, 42 番組ベクトル抽出部, 43 マッチング処理部, 44 操作入力部, 45 初期登録保存部, 46 操作ログ取得部, 47 正履歴保存部, 48 負履歴保存部, 49 推薦情報出力部, 50 推薦番組リスト, 61 正規化処理部, 62 ベクトル演算部, 63 ユーザ情報登録部, 171 配信サーバ, 191 番組推薦処理装置, 201 配信サーバ   5 distribution server, 10 program recommendation processing device, 21 data acquisition unit, 22 metadata extraction unit, 23 program vector generation unit, 24 data storage unit, 25 data transmission unit, 41 data acquisition unit, 42 program vector extraction unit, 43 matching Processing unit, 44 operation input unit, 45 initial registration storage unit, 46 operation log acquisition unit, 47 positive history storage unit, 48 negative history storage unit, 49 recommended information output unit, 50 recommended program list, 61 normalization processing unit, 62 Vector calculation unit, 63 user information registration unit, 171 distribution server, 191 program recommendation processing device, 201 distribution server

Claims (28)

ユーザの嗜好に類似するコンテンツを選択する処理を実行する情報処理装置であって、
複数の項目で構成されている前記コンテンツの属性情報を他の装置から受信する受信手段と、
前記ユーザのコンテンツについての操作履歴から、前記ユーザが好むコンテンツの履歴である正履歴情報と前記ユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報を生成するユーザ履歴情報生成手段と、
前記コンテンツの属性情報並びに前記正履歴情報および前記負履歴情報は前記項目ごとにベクトル化され、前記コンテンツの属性情報と前記ユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和によって、受信された前記コンテンツの属性情報と、生成された前記ユーザ履歴情報との類似度算出する算出手段と、
算出された前記類似度に基づいて、コンテンツを選択する選択手段と、
前記算出手段が用いる前記重み付け情報であって、所定期間の前記属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とし、前記標準嗜好ベクトルと、前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報として生成する重み付け情報生成手段と
を備え、
前記算出手段は、前記コンテンツの属性情報と前記正履歴情報のベクトルのコサイン距離と前記正の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記負履歴情報のベクトルのコサイン距離と前記負の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出する
情報処理装置
An information processing apparatus that executes processing for selecting content similar to a user's preference,
Receiving means for receiving attribute information of the content composed of a plurality of items from another device;
User history information generating means for generating user history information consisting of positive history information that is a history of content preferred by the user and negative history information that is a history of content not preferred by the user from an operation history of the user's content When,
The attribute information of the content, the positive history information, and the negative history information are vectorized for each item, and the inner product of the cosine distance of the content attribute information and the vector of the user history information and the weighting information is calculated for each item. Calculating means for calculating the similarity between the attribute information of the received content and the generated user history information by calculating and summing the result of the inner product for all the items ;
Selection means for selecting content based on the calculated similarity;
The weighting information used by the calculation means, and the cosine distance between a standard preference vector indicating general viewer preference obtained by counting the attribute information for a predetermined period and the vector of the positive history information is the item And the reciprocal number thereof is positive weighting information that defines the degree of positive contribution of each item when calculating the similarity between the attribute information and the positive history information, and the standard preference vector, The cosine distance with the negative history information vector is calculated for each item, and the reciprocal thereof defines the degree of negative contribution of each item when calculating the similarity between the attribute information and the negative history information. Weighting information generating means for generating negative weighting information
With
The calculation means calculates the inner product of the cosine distance of the content attribute information and the vector of the positive history information and the positive weighting information for each item, and adds the result of the inner product for all the items. From the sum, the inner product of the cosine distance of the content attribute information and the negative history information vector and the negative weighting information is calculated for each item, and the sum of the inner product results for all the items is calculated. The similarity between the content attribute information and the user history information is calculated based on the subtracted difference.
Information processing device .
前記ユーザ履歴情報生成手段は、ジャンル別に、前記ユーザ履歴情報を生成し、
前記重み付け情報生成手段は、所定のジャンルについて、前記標準嗜好ベクトルと前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記正の重み付け情報として生成するとともに、前記所定のジャンルについて、前記標準嗜好ベクトルと前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を前記負の重み付け情報として生成し、
前記算出手段は、前記コンテンツの属性情報と前記所定のジャンルの前記正履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記所定のジャンルの前記負履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記所定のジャンルの前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出する
請求項1に記載の情報処理装置。
The user history information generating means generates the user history information for each genre,
The weighting information generation means calculates a cosine distance between the standard preference vector and the vector of the positive history information for each item for a predetermined genre, and generates the reciprocal thereof as the positive weighting information, For a predetermined genre, a cosine distance between the standard preference vector and the negative history information vector is calculated for each item, and the reciprocal thereof is generated as the negative weighting information.
The calculation means calculates the inner product of the attribute information of the content and the cosine distance of the vector of the positive history information of the predetermined genre for each item, and sums the results of the inner products for all the items. From the above, the inner product of the attribute information of the content and the cosine distance of the vector of the negative history information of the predetermined genre is calculated for each item, and the sum of the results of the inner product for all the items is subtracted. the difference, the information processing apparatus according to claim 1 for calculating the degree of similarity between the attribute information and the user history information of the content of the predetermined genres.
前記受信手段は、コンテンツを複数のグループに分類したときの所定のグループを示す情報が付加されている前記コンテンツの属性情報も前記他の装置から受信し、
前記選択手段は、前記コンテンツの属性情報に前記グループを示す情報が付加されている場合、前記グループを示す情報に対応するコンテンツを選択し、前記グループを示す情報が付加されていない場合、前記算出手段が算出した前記類似度に基づいて、コンテンツを選択する
請求項1に記載の情報処理装置。
The receiving means also receives attribute information of the content to which information indicating a predetermined group when content is classified into a plurality of groups is added from the other device,
The selection means selects the content corresponding to the information indicating the group when the information indicating the group is added to the attribute information of the content, and calculates the calculation when the information indicating the group is not added. The information processing apparatus according to claim 1, wherein content is selected based on the similarity calculated by the means.
前記コンテンツは番組であり、前記グループは、連続ドラマ、コンテンツのジャンル、出演者、タイトルのいずれかでグループ化される
請求項3に記載の情報処理装置。
The information processing apparatus according to claim 3, wherein the content is a program, and the group is grouped by any one of a series drama, a content genre, a performer, and a title.
前記重み付け情報生成手段により生成された前記属性情報の前記項目に対応する前記重み付け情報を記憶する記憶手段
を更に備える請求項1に記載の情報処理装置。
The information processing apparatus according to claim 1, further comprising a storage unit that stores the weighting information corresponding to the item of the attribute information generated by the weighting information generation unit.
前記ユーザのコンテンツについての操作履歴を蓄積する蓄積手段をさらに備える
請求項1に記載の情報処理装置。
The information processing apparatus according to claim 1, further comprising an accumulation unit that accumulates an operation history of the user's content.
ユーザの嗜好に類似するコンテンツを選択する処理を実行する情報処理装置の情報処理方法であって、前記情報処理装置が、
複数の項目で構成されている前記コンテンツの属性情報を他の装置から受信する受信ステップと、
前記ユーザのコンテンツについての操作履歴から、前記ユーザが好むコンテンツの履歴である正履歴情報と前記ユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報を生成するユーザ履歴情報生成ステップと、
前記コンテンツの属性情報並びに前記正履歴情報および前記負履歴情報は前記項目ごとにベクトル化され、前記コンテンツの属性情報と前記ユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和によって、受信された前記コンテンツの属性情報と、生成された前記ユーザ履歴情報との類似度算出する算出ステップと
算出された前記類似度に基づいて、コンテンツを選択する選択ステップと、
前記算出ステップの処理で用いられる前記重み付け情報であって、所定期間の前記属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とし、前記標準嗜好ベクトルと、前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報として生成する重み付け情報生成ステップと
を含み、
前記算出ステップの処理は、前記コンテンツの属性情報と前記正履歴情報のベクトルのコサイン距離と前記正の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記負履歴情報のベクトルのコサイン距離と前記負の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出する
情報処理方法
An information processing method for an information processing apparatus that executes processing for selecting content similar to a user's preference, wherein the information processing apparatus includes:
A receiving step of receiving attribute information of the content composed of a plurality of items from another device;
A user history information generation step for generating user history information including positive history information that is a history of content that the user likes and negative history information that is a history of content that the user does not like from the operation history of the user's content. When,
The attribute information of the content, the positive history information, and the negative history information are vectorized for each item, and the inner product of the cosine distance of the content attribute information and the vector of the user history information and the weighting information is calculated for each item. A calculation step of calculating the similarity between the attribute information of the received content and the generated user history information by calculating and summing the result of the inner product for all the items ;
A selection step of selecting content based on the calculated similarity;
The cosine distance between the standard preference vector indicating the general preference of the viewer , which is the weighting information used in the processing of the calculation step, and obtained by counting the attribute information for a predetermined period, and the vector of the positive history information Is calculated for each item, and the reciprocal thereof is positive weighting information that defines the degree of positive contribution of each item when calculating the similarity between the attribute information and the positive history information, and the standard preference The cosine distance between the vector and the vector of the negative history information is calculated for each item, and the reciprocal of the negative contribution of each item in calculating the similarity between the attribute information and the negative history information. A weighting information generating step for generating as negative weighting information for prescribing the degree ;
Including
The processing of the calculating step calculates an inner product of the cosine distance of the content attribute information and the vector of the positive history information and the positive weighting information for each item, and the result of the inner product is calculated for all the items. From the sum, the inner product of the cosine distance of the content attribute information and the vector of the negative history information and the negative weighting information is calculated for each item, and the result of the inner product is added for all the items. The similarity between the content attribute information and the user history information is calculated based on the difference obtained by subtracting the sum.
Information processing method .
前記ユーザ履歴情報生成ステップの処理は、ジャンル別に、前記ユーザ履歴情報を生成し、
前記重み付け情報生成ステップの処理は、所定のジャンルについて、前記標準嗜好ベクトルと前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記正の重み付け情報として生成するとともに、前記所定のジャンルについて、前記標準嗜好ベクトルと前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を前記負の重み付け情報として生成し、
前記算出ステップの処理は、前記コンテンツの属性情報と前記所定のジャンルの前記正履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記所定のジャンルの前記負履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記所定のジャンルの前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出する
請求項7に記載の情報処理方法。
The processing of the user history information generation step generates the user history information for each genre,
The processing of the weighting information generation step calculates a cosine distance between the standard preference vector and the vector of the positive history information for each item for a predetermined genre, and generates the reciprocal thereof as the positive weighting information. For each of the predetermined genres, a cosine distance between the standard preference vector and the negative history information vector is calculated for each item, and the reciprocal thereof is generated as the negative weighting information.
In the calculation step, the inner product of the attribute information of the content and the cosine distance of the vector of the positive history information of the predetermined genre is calculated for each item, and the result of the inner product is added to all the items. The inner product of the attribute information of the content and the cosine distance of the vector of the negative history information of the predetermined genre is calculated for each item, and the sum of the results of the inner products for all the items is calculated. The information processing method according to claim 7, wherein the similarity between the attribute information of the content of the predetermined genre and the user history information is calculated based on the subtracted difference .
前記受信ステップの処理は、コンテンツを複数のグループに分類したときの所定のグループを示す情報が付加されている前記コンテンツの属性情報も前記他の装置から受信し、
前記選択ステップの処理は、前記コンテンツの属性情報に前記グループを示す情報が付加されている場合、前記グループを示す情報に対応するコンテンツを選択し、前記グループを示す情報が付加されていない場合、前記算出ステップが算出した前記類似度に基づいて、コンテンツを選択する
請求項7に記載の情報処理方法。
The process of the receiving step also receives attribute information of the content to which information indicating a predetermined group when content is classified into a plurality of groups is added from the other device,
In the process of the selection step, when information indicating the group is added to the attribute information of the content, the content corresponding to the information indicating the group is selected, and when the information indicating the group is not added, The information processing method according to claim 7, wherein content is selected based on the similarity calculated by the calculation step.
前記コンテンツは番組であり、前記グループは、連続ドラマ、コンテンツのジャンル、出演者、タイトルのいずれかでグループ化される
請求項9に記載の情報処理方法。
The information processing method according to claim 9, wherein the content is a program, and the group is grouped by any one of a series drama, a content genre, a performer, and a title.
前記重み付け情報生成ステップの処理により生成された前記属性情報の前記項目に対応する前記重み付け情報を記憶する記憶ステップ
を更に含む請求項7に記載の情報処理方法。
The information processing method according to claim 7, further comprising a storage step of storing the weighting information corresponding to the item of the attribute information generated by the processing of the weighting information generation step.
前記ユーザのコンテンツについての操作履歴を蓄積する蓄積ステップをさらに含む
請求項7に記載の情報処理方法。
The information processing method according to claim 7, further comprising an accumulation step of accumulating an operation history for the user's content.
ユーザの嗜好に類似するコンテンツを選択する処理をコンピュータに実行させるためのプログラムであって、
複数の項目で構成されている前記コンテンツの属性情報を他の装置から受信する受信ステップと、
前記ユーザのコンテンツについての操作履歴から、前記ユーザが好むコンテンツの履歴である正履歴情報と前記ユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報を生成するユーザ履歴情報生成ステップと、
前記コンテンツの属性情報並びに前記正履歴情報および前記負履歴情報は前記項目ごとにベクトル化され、前記コンテンツの属性情報と前記ユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和によって、受信された前記コンテンツの属性情報と、生成された前記ユーザ履歴情報との類似度算出する算出ステップと
算出された前記類似度に基づいて、コンテンツを選択する選択ステップと、
前記算出ステップの処理で用いられる前記重み付け情報であって、所定期間の前記属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とし、前記標準嗜好ベクトルと、前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報として生成する重み付け情報生成ステップと
を含み、
前記算出ステップの処理は、前記コンテンツの属性情報と前記正履歴情報のベクトルのコサイン距離と前記正の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記負履歴情報のベクトルのコサイン距離と前記負の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出する
処理をコンピュータに実行させるためのプログラム。
A program for causing a computer to execute processing for selecting content similar to a user's preference,
A receiving step of receiving attribute information of the content composed of a plurality of items from another device;
A user history information generation step for generating user history information including positive history information that is a history of content that the user likes and negative history information that is a history of content that the user does not like from the operation history of the user's content. When,
The attribute information of the content, the positive history information, and the negative history information are vectorized for each item, and the inner product of the cosine distance of the content attribute information and the vector of the user history information and the weighting information is calculated for each item. A calculation step of calculating the similarity between the attribute information of the received content and the generated user history information by calculating and summing the result of the inner product for all the items ;
A selection step of selecting content based on the calculated similarity;
The cosine distance between the standard preference vector indicating the general preference of the viewer , which is the weighting information used in the processing of the calculation step, and obtained by counting the attribute information for a predetermined period, and the vector of the positive history information Is calculated for each item, and the reciprocal thereof is positive weighting information that defines the degree of positive contribution of each item when calculating the similarity between the attribute information and the positive history information, and the standard preference The cosine distance between the vector and the vector of the negative history information is calculated for each item, and the reciprocal of the negative contribution of each item in calculating the similarity between the attribute information and the negative history information. A weighting information generating step for generating as negative weighting information for prescribing the degree ;
Including
The processing of the calculating step calculates an inner product of the cosine distance of the content attribute information and the vector of the positive history information and the positive weighting information for each item, and the result of the inner product is calculated for all the items. From the sum, the inner product of the cosine distance of the content attribute information and the vector of the negative history information and the negative weighting information is calculated for each item, and the result of the inner product is added for all the items. The similarity between the content attribute information and the user history information is calculated based on the difference obtained by subtracting the sum.
A program that causes a computer to execute processing .
請求項13に記載のプログラムが記録されたコンピュータ読み取り可能な記録媒体。 A computer-readable recording medium on which the program according to claim 13 is recorded. ユーザの嗜好に類似するコンテンツを選択する処理を実行する情報処理装置であって、
複数の項目で構成されている前記コンテンツの属性情報を記憶する第1の記憶手段と、
前記ユーザのコンテンツについての操作履歴から、前記ユーザが好むコンテンツの履歴である正履歴情報と前記ユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報を生成するユーザ履歴情報生成手段と、
前記コンテンツの属性情報並びに前記正履歴情報および前記負履歴情報は前記項目ごとにベクトル化され、前記コンテンツの属性情報と前記ユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和によって、前記第1の記憶手段により記憶された前記コンテンツの属性情報と、生成された前記ユーザ履歴情報の類似度算出する算出手段と、
算出された前記類似度に基づいて、コンテンツを選択する選択手段と、
前記算出手段が用いる前記重み付け情報であって、所定期間の前記属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とし、前記標準嗜好ベクトルと、前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報として生成する重み付け情報生成手段と
を備え、
前記算出手段は、前記コンテンツの属性情報と前記正履歴情報のベクトルのコサイン距離と前記正の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記負履歴情報のベクトルのコサイン距離と前記負の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出する
情報処理装置
An information processing apparatus that executes processing for selecting content similar to a user's preference,
First storage means for storing attribute information of the content composed of a plurality of items;
User history information generating means for generating user history information consisting of positive history information that is a history of content preferred by the user and negative history information that is a history of content not preferred by the user from an operation history of the user's content When,
The attribute information of the content, the positive history information, and the negative history information are vectorized for each item, and the inner product of the cosine distance of the content attribute information and the vector of the user history information and the weighting information is calculated for each item. calculated and, by a sum obtained by adding all of the items the result of the inner product, and calculates the similarity between the attribute information of the content stored by the first storing means, the user history information generated calculated Means,
Selection means for selecting content based on the calculated similarity;
The weighting information used by the calculation means, and the cosine distance between a standard preference vector indicating general viewer preference obtained by counting the attribute information for a predetermined period and the vector of the positive history information is the item And the reciprocal number thereof is positive weighting information that defines the degree of positive contribution of each item when calculating the similarity between the attribute information and the positive history information, and the standard preference vector, The cosine distance with the negative history information vector is calculated for each item, and the reciprocal thereof defines the degree of negative contribution of each item when calculating the similarity between the attribute information and the negative history information. Weighting information generating means for generating negative weighting information
With
The calculation means calculates the inner product of the cosine distance of the content attribute information and the vector of the positive history information and the positive weighting information for each item, and adds the result of the inner product for all the items. From the sum, the inner product of the cosine distance of the content attribute information and the negative history information vector and the negative weighting information is calculated for each item, and the sum of the inner product results for all the items is calculated. The similarity between the content attribute information and the user history information is calculated based on the subtracted difference.
Information processing device .
前記ユーザ履歴情報生成手段は、ジャンル別に、前記ユーザ履歴情報を生成し、
前記重み付け情報生成手段は、所定のジャンルについて、前記標準嗜好ベクトルと前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記正の重み付け情報として生成するとともに、前記所定のジャンルについて、前記標準嗜好ベクトルと前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を前記負の重み付け情報として生成し、
前記算出手段は、前記コンテンツの属性情報と前記所定のジャンルの前記正履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記所定のジャンルの前記負履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記所定のジャンルの前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出する
請求項15に記載の情報処理装置。
The user history information generating means generates the user history information for each genre,
The weighting information generation means calculates a cosine distance between the standard preference vector and the vector of the positive history information for each item for a predetermined genre, and generates the reciprocal thereof as the positive weighting information, For a predetermined genre, a cosine distance between the standard preference vector and the negative history information vector is calculated for each item, and the reciprocal thereof is generated as the negative weighting information.
The calculation means calculates the inner product of the attribute information of the content and the cosine distance of the vector of the positive history information of the predetermined genre for each item, and sums the results of the inner products for all the items. From the above, the inner product of the attribute information of the content and the cosine distance of the vector of the negative history information of the predetermined genre is calculated for each item, and the sum of the results of the inner product for all the items is subtracted. The information processing apparatus according to claim 15, wherein a similarity between the attribute information of the content of the predetermined genre and the user history information is calculated based on the difference .
前記第1の記憶手段は、コンテンツを複数のグループに分類したときの所定のグループを示す情報が付加されている前記コンテンツの属性情報も記憶し、
前記選択手段は、前記コンテンツの属性情報に前記グループを示す情報が付加されている場合、前記グループを示す情報に対応するコンテンツを選択し、前記グループを示す情報が付加されていない場合、前記算出手段が算出した前記類似度に基づいて、コンテンツを選択する
請求項15に記載の情報処理装置。
The first storage means also stores attribute information of the content to which information indicating a predetermined group when content is classified into a plurality of groups is added,
The selection means selects the content corresponding to the information indicating the group when the information indicating the group is added to the attribute information of the content, and calculates the calculation when the information indicating the group is not added. The information processing apparatus according to claim 15, wherein content is selected based on the similarity calculated by a means.
前記コンテンツは番組であり、前記グループは、連続ドラマ、コンテンツのジャンル、出演者、タイトルのいずれかでグループ化される
請求項17に記載の情報処理装置。
The information processing apparatus according to claim 17, wherein the content is a program, and the group is grouped by any one of a series drama, a content genre, a performer, and a title.
前記重み付け情報生成手段により生成された前記属性情報の前記項目に対応する重み付け情報を記憶する第2の記憶手段
を更に備える請求項15に記載の情報処理装置。
The information processing apparatus according to claim 15, further comprising a second storage unit that stores weighting information corresponding to the item of the attribute information generated by the weighting information generation unit.
前記ユーザのコンテンツについての操作履歴を蓄積する蓄積手段をさらに備える
請求項15に記載の情報処理装置。
The information processing apparatus according to claim 15, further comprising storage means for storing an operation history of the user's content.
ユーザの嗜好に類似するコンテンツを選択する処理を実行する情報処理装置の情報処理方法であって、前記情報処理装置が、
複数の項目で構成されている前記コンテンツの属性情報を記憶する第1の記憶ステップと、
前記ユーザのコンテンツについての操作履歴から、前記ユーザが好むコンテンツの履歴である正履歴情報と前記ユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報を生成するユーザ履歴情報生成ステップと、
前記コンテンツの属性情報並びに前記正履歴情報および前記負履歴情報は前記項目ごとにベクトル化され、前記コンテンツの属性情報と前記ユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和によって、前記第1の記憶ステップの処理により記憶された前記コンテンツの属性情報と、前記ユーザ履歴情報との類似度算出する算出ステップと、
算出された前記類似度に基づいて、コンテンツを選択する選択ステップと、
前記算出ステップの処理で用いられる前記重み付け情報であって、所定期間の前記属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とし、前記標準嗜好ベクトルと、前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報として生成する重み付け情報生成ステップと
を含み、
前記算出ステップの処理は、前記コンテンツの属性情報と前記正履歴情報のベクトルのコサイン距離と前記正の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記負履歴情報のベクトルのコサイン距離と前記負の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出する
情報処理方法
An information processing method for an information processing apparatus that executes processing for selecting content similar to a user's preference, wherein the information processing apparatus includes:
A first storage step of storing attribute information of the content composed of a plurality of items;
A user history information generation step for generating user history information including positive history information that is a history of content that the user likes and negative history information that is a history of content that the user does not like from the operation history of the user's content. When,
The attribute information of the content, the positive history information, and the negative history information are vectorized for each item, and the inner product of the cosine distance of the content attribute information and the vector of the user history information and the weighting information is calculated for each item. calculated and, by a sum obtained by adding all of the items the result of the inner product is calculated and the attribute information of the content stored by the processing of said first storage step, a similarity between the user history information calculated Steps,
A selection step of selecting content based on the calculated similarity;
The cosine distance between the standard preference vector indicating the general preference of the viewer , which is the weighting information used in the processing of the calculation step, and obtained by counting the attribute information for a predetermined period, and the vector of the positive history information Is calculated for each item, and the reciprocal thereof is positive weighting information that defines the degree of positive contribution of each item when calculating the similarity between the attribute information and the positive history information, and the standard preference The cosine distance between the vector and the vector of the negative history information is calculated for each item, and the reciprocal of the negative contribution of each item in calculating the similarity between the attribute information and the negative history information. A weighting information generating step for generating as negative weighting information for prescribing the degree ;
Including
The processing of the calculating step calculates an inner product of the cosine distance of the content attribute information and the vector of the positive history information and the positive weighting information for each item, and the result of the inner product is calculated for all the items. From the sum, the inner product of the cosine distance of the content attribute information and the vector of the negative history information and the negative weighting information is calculated for each item, and the result of the inner product is added for all the items. The similarity between the content attribute information and the user history information is calculated based on the difference obtained by subtracting the sum.
Information processing method .
前記ユーザ履歴情報生成ステップの処理は、ジャンル別に、前記ユーザ履歴情報を生成し、
前記重み付け情報生成ステップの処理は、所定のジャンルについて、前記標準嗜好ベクトルと前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記正の重み付け情報として生成するとともに、前記所定のジャンルについて、前記標準嗜好ベクトルと前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を前記負の重み付け情報として生成し、
前記算出ステップの処理は、前記コンテンツの属性情報と前記所定のジャンルの前記正履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記所定のジャンルの前記負履歴情報のベクトルのコサイン距離との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記所定のジャンルの前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出する
請求項21に記載の情報処理方法。
The processing of the user history information generation step generates the user history information for each genre,
The processing of the weighting information generation step calculates a cosine distance between the standard preference vector and the vector of the positive history information for each item for a predetermined genre, and generates the reciprocal thereof as the positive weighting information. For each of the predetermined genres, a cosine distance between the standard preference vector and the negative history information vector is calculated for each item, and the reciprocal thereof is generated as the negative weighting information.
In the calculation step, the inner product of the attribute information of the content and the cosine distance of the vector of the positive history information of the predetermined genre is calculated for each item, and the result of the inner product is added to all the items. The inner product of the attribute information of the content and the cosine distance of the vector of the negative history information of the predetermined genre is calculated for each item, and the sum of the results of the inner products for all the items is calculated. The information processing method according to claim 21, wherein a similarity between the attribute information of the content of the predetermined genre and the user history information is calculated based on the difference drawn .
前記第1の記憶ステップの処理は、コンテンツを複数のグループに分類したときの所定のグループを示す情報が付加されている前記コンテンツの属性情報も記憶し、
前記選択ステップの処理は、前記コンテンツの属性情報に前記グループを示す情報が付加されている場合、前記グループを示す情報に対応するコンテンツを選択し、前記グループを示す情報が付加されていない場合、前記算出ステップが算出した前記類似度に基づいて、コンテンツを選択する
請求項21に記載の情報処理方法。
The processing of the first storing step also stores attribute information of the content to which information indicating a predetermined group when content is classified into a plurality of groups is added,
In the process of the selection step, when information indicating the group is added to the attribute information of the content, the content corresponding to the information indicating the group is selected, and when the information indicating the group is not added, The information processing method according to claim 21, wherein content is selected based on the similarity calculated by the calculation step.
前記コンテンツは番組であり、前記グループは、連続ドラマ、コンテンツのジャンル、出演者、タイトルのいずれかでグループ化される
請求項23に記載の情報処理方法。
The content is a program, the group is a drama series, the genre of the content, performer information processing method according to claim 23 which are grouped in one title.
前記重み付け情報生成ステップにより生成された前記属性情報の前記項目に対応する重み付け情報を記憶する第2の記憶ステップ
を更に含む請求項21に記載の情報処理方法。
The information processing method according to claim 21, further comprising a second storage step of storing weighting information corresponding to the item of the attribute information generated by the weighting information generation step.
前記ユーザのコンテンツについての操作履歴を蓄積する蓄積ステップをさらに含む
請求項21に記載の情報処理方法。
The information processing method according to claim 21, further comprising an accumulation step of accumulating an operation history of the user's content.
ユーザの嗜好に類似するコンテンツを選択する処理をコンピュータに実行させるためのプログラムであって、
複数の項目で構成されている前記コンテンツの属性情報を記憶する第1の記憶ステップと、
前記ユーザのコンテンツについての操作履歴から、前記ユーザが好むコンテンツの履歴である正履歴情報と前記ユーザが好まないコンテンツの履歴である負履歴情報とからなるユーザ履歴情報を生成するユーザ履歴情報生成ステップと、
前記コンテンツの属性情報並びに前記正履歴情報および前記負履歴情報は前記項目ごとにベクトル化され、前記コンテンツの属性情報と前記ユーザ履歴情報のベクトルのコサイン距離と重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和によって、前記第1の記憶ステップの処理により記憶された前記コンテンツの属性情報と、生成された前記ユーザ履歴情報との類似度算出する算出ステップと、
算出された前記類似度に基づいて、コンテンツを選択する選択ステップと、
前記算出ステップの処理で用いられる前記重み付け情報であって、所定期間の前記属性情報をカウントして得られる、視聴者一般の嗜好を示す標準嗜好ベクトルと、前記正履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記正履歴情報との類似度を算出する場合における、各項目の正の寄与の度合いを規定する正の重み付け情報とし、前記標準嗜好ベクトルと、前記負履歴情報のベクトルとのコサイン距離を前記項目ごとに算出し、その逆数を、前記属性情報と前記負履歴情報との類似度を算出する場合における、各項目の負の寄与の度合いを規定する負の重み付け情報として生成する重み付け情報生成ステップと
を含み、
前記算出ステップの処理は、前記コンテンツの属性情報と前記正履歴情報のベクトルのコサイン距離と前記正の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和から、前記コンテンツの属性情報と前記負履歴情報のベクトルのコサイン距離と前記負の重み付け情報との内積を前記項目ごとに算出して、その内積の結果を全ての前記項目について足した和を引いた差により、前記コンテンツの属性情報と前記ユーザ履歴情報との類似度を算出する
処理をコンピュータに実行させるためのプログラム。
A program for causing a computer to execute processing for selecting content similar to a user's preference,
A first storage step of storing attribute information of the content composed of a plurality of items;
A user history information generation step for generating user history information including positive history information that is a history of content that the user likes and negative history information that is a history of content that the user does not like from the operation history of the user's content. When,
The attribute information of the content, the positive history information, and the negative history information are vectorized for each item, and the inner product of the cosine distance of the content attribute information and the vector of the user history information and the weighting information is calculated for each item. calculated and, by a sum obtained by adding all of the items the result of the inner product, and the first attribute information of the content stored by the processing of the storage step, the similarity between the generated the user history information A calculating step for calculating;
A selection step of selecting content based on the calculated similarity;
The cosine distance between the standard preference vector indicating the general preference of the viewer , which is the weighting information used in the processing of the calculation step, and obtained by counting the attribute information for a predetermined period, and the vector of the positive history information Is calculated for each item, and the reciprocal thereof is positive weighting information that defines the degree of positive contribution of each item when calculating the similarity between the attribute information and the positive history information, and the standard preference The cosine distance between the vector and the vector of the negative history information is calculated for each item, and the reciprocal of the negative contribution of each item in calculating the similarity between the attribute information and the negative history information. A weighting information generating step for generating as negative weighting information for prescribing the degree ;
Including
The processing of the calculating step calculates an inner product of the cosine distance of the content attribute information and the vector of the positive history information and the positive weighting information for each item, and the result of the inner product is calculated for all the items. From the sum, the inner product of the cosine distance of the content attribute information and the vector of the negative history information and the negative weighting information is calculated for each item, and the result of the inner product is added for all the items. The similarity between the content attribute information and the user history information is calculated based on the difference obtained by subtracting the sum.
A program that causes a computer to execute processing .
請求項27に記載のプログラムが記録されたコンピュータ読み取り可能な記録媒体。 A computer-readable recording medium on which the program according to claim 27 is recorded.
JP2007054675A 2007-03-05 2007-03-05 Information processing apparatus, information processing method, recording medium, and program Expired - Fee Related JP4501948B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007054675A JP4501948B2 (en) 2007-03-05 2007-03-05 Information processing apparatus, information processing method, recording medium, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007054675A JP4501948B2 (en) 2007-03-05 2007-03-05 Information processing apparatus, information processing method, recording medium, and program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002361275A Division JP4003127B2 (en) 2002-12-12 2002-12-12 Information processing apparatus and information processing method, information processing system, recording medium, and program

Publications (2)

Publication Number Publication Date
JP2007200339A JP2007200339A (en) 2007-08-09
JP4501948B2 true JP4501948B2 (en) 2010-07-14

Family

ID=38454812

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007054675A Expired - Fee Related JP4501948B2 (en) 2007-03-05 2007-03-05 Information processing apparatus, information processing method, recording medium, and program

Country Status (1)

Country Link
JP (1) JP4501948B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4650541B2 (en) 2008-09-08 2011-03-16 ソニー株式会社 RECOMMENDATION DEVICE AND METHOD, PROGRAM, AND RECORDING MEDIUM
JP5526848B2 (en) * 2010-02-17 2014-06-18 ソニー株式会社 Information processing apparatus, information processing method, and program
JP2011175362A (en) 2010-02-23 2011-09-08 Sony Corp Information processing apparatus, importance level calculation method, and program
JP2019134373A (en) * 2018-02-02 2019-08-08 住友電気工業株式会社 Viewing recording apparatus, viewing recording method and viewing recording program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132893A (en) * 2000-10-27 2002-05-10 Work Supply:Kk Real estate information providing system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132893A (en) * 2000-10-27 2002-05-10 Work Supply:Kk Real estate information providing system

Also Published As

Publication number Publication date
JP2007200339A (en) 2007-08-09

Similar Documents

Publication Publication Date Title
JP4003127B2 (en) Information processing apparatus and information processing method, information processing system, recording medium, and program
KR101007839B1 (en) Information processing device and information processing method, recording medium, and computer program
KR101084503B1 (en) Information processing device and information processing method, and recording medium
JP4491746B2 (en) Information processing apparatus, information processing method, recording medium, and program
US8613023B2 (en) Information processor, information processing method and computer program
JP5482206B2 (en) Information processing apparatus, information processing method, and program
US20080196064A1 (en) Apparatus and method of providing a recommended broadcast program
JP2011142468A (en) Information processing apparatus, information processing method, and program
JP4182743B2 (en) Image processing apparatus and method, recording medium, and program
JP4501948B2 (en) Information processing apparatus, information processing method, recording medium, and program
JP4161701B2 (en) Information processing apparatus, information processing method, recording medium, and program
JP4547596B2 (en) Information processing apparatus, information processing method, and program
JP4577562B2 (en) Information processing apparatus, information processing method, and program
KR101102351B1 (en) Method and system for providing custom-made broadcasting program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091020

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100121

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100311

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100330

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100412

R151 Written notification of patent or utility model registration

Ref document number: 4501948

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130430

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140430

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees