JP5136181B2 - Information retrieval device - Google Patents

Information retrieval device Download PDF

Info

Publication number
JP5136181B2
JP5136181B2 JP2008110152A JP2008110152A JP5136181B2 JP 5136181 B2 JP5136181 B2 JP 5136181B2 JP 2008110152 A JP2008110152 A JP 2008110152A JP 2008110152 A JP2008110152 A JP 2008110152A JP 5136181 B2 JP5136181 B2 JP 5136181B2
Authority
JP
Japan
Prior art keywords
search result
information
index
exclusion
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008110152A
Other languages
Japanese (ja)
Other versions
JP2009259150A (en
Inventor
彰 烏谷
高弘 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008110152A priority Critical patent/JP5136181B2/en
Publication of JP2009259150A publication Critical patent/JP2009259150A/en
Application granted granted Critical
Publication of JP5136181B2 publication Critical patent/JP5136181B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、情報を検索する情報検索装置に関し、特に、検索結果からユーザに不要な情報を適切に除外することができる情報検索装置に関するものである。   The present invention relates to an information search apparatus that searches for information, and more particularly to an information search apparatus that can appropriately exclude information unnecessary for a user from a search result.

近年、テレビ機能を搭載したPC(Personal Computer)や、PVR(Personal Video Recorder)などのようにテレビ番組(あるいは、ネット上で配信されるコンテンツ)を録画・再生する装置(以下、情報記録装置)が広く普及している。   In recent years, a device (hereinafter referred to as an information recording device) that records and plays back a TV program (or content distributed over the Internet) such as a PC (Personal Computer) equipped with a TV function or a PVR (Personal Video Recorder). Is widely spread.

そして、この情報記録装置は、ユーザの利便性を向上させるために、各種の機能を備えており、例えば、EPG(Electric Program Guide)から配信される電子番組表(メタデータ)を利用して、ユーザの好みの番組を自動的に検索・提示する機能や、検索した番組を自動的に録画する機能を備えている。   And this information recording device is provided with various functions in order to improve the convenience of the user, for example, using an electronic program guide (metadata) distributed from EPG (Electric Program Guide), It has a function of automatically searching and presenting a user's favorite program and a function of automatically recording the searched program.

しかしながら、情報記録装置によって検索される番組には、ドラマの再放送や、他の放送局で既に視聴済みの映画等のように、ユーザにとって不要な番組が含まれている場合があった。   However, there are cases where programs searched by the information recording apparatus include programs that are unnecessary for the user, such as re-broadcasts of dramas and movies that have already been viewed by other broadcast stations.

そこで、特許文献1では、ユーザが過去に録画した番組を操作履歴として保管しておき、検索結果と操作履歴とを比較して、ユーザが過去に録画した番組を検索結果から除外することで、ユーザにとって不要な番組を検索結果から取り除くという技術が公開されている。   Therefore, in Patent Document 1, the program recorded by the user in the past is stored as an operation history, the search result is compared with the operation history, and the program recorded by the user in the past is excluded from the search result. A technique for removing a program unnecessary for a user from a search result is disclosed.

具体的に、特許文献1では、操作履歴に含まれる番組のジャンル、タイトル、放送局の組み合わせを特定し、特定した組合せと同じ組み合わせを有する番組を検索結果から取り除いている。また、番組のジャンルが映画の場合には、タイトルが同じ番組を検索結果から取り除いている。   Specifically, in Patent Document 1, a combination of a program genre, a title, and a broadcasting station included in the operation history is specified, and a program having the same combination as the specified combination is removed from the search result. When the genre of the program is a movie, a program with the same title is removed from the search result.

特許第3747847号公報Japanese Patent No. 3747847

しかしながら、上述した従来の技術では、検索結果からユーザにとって不要な番組を取り除くための除外条件を適切に設定することができないという問題があった。   However, the above-described conventional technique has a problem that it is not possible to appropriately set an exclusion condition for removing a program unnecessary for a user from a search result.

図23は、従来技術の問題点を説明するための図である。図23の(a)は、ユーザの操作履歴を示し、図23の(b)は、不要な番組を除去する前の検索結果を示している。そして、図23の(c)は、従来の技術によって、不要な番組を除去した後の検索結果を示している。   FIG. 23 is a diagram for explaining the problems of the prior art. FIG. 23A shows a user operation history, and FIG. 23B shows a search result before an unnecessary program is removed. FIG. 23C shows search results after unnecessary programs are removed by the conventional technique.

ここで、図23の(c)に示す番組識別番号「1011」の番組は、操作履歴(図23の(a))に示す番組識別番号「1001」の番組の再放送であるため、不要な番組として取り除くべきであるが、放送局とタイトルとの組合せが異なっているため、検索結果から取り除くことができていない。   Here, the program with the program identification number “1011” shown in FIG. 23C is unnecessary because it is a rebroadcast of the program with the program identification number “1001” shown in the operation history (FIG. 23A). Although it should be removed as a program, it cannot be removed from the search result because the combination of the broadcasting station and the title is different.

同様に、図23の(c)に示す番組識別番号「1013」の番組は、操作履歴(図23の(a))に示す番組識別番号「1002」の番組の再放送であるため、不要な番組として取り除くべきであるが、放送局とタイトルとの組合せが異なっているため、検索結果から取り除くことができていない。   Similarly, the program with the program identification number “1013” shown in (c) of FIG. 23 is unnecessary because it is a rebroadcast of the program with the program identification number “1002” shown in the operation history ((a) of FIG. 23). Although it should be removed as a program, it cannot be removed from the search result because the combination of the broadcasting station and the title is different.

また、図23の(c)に示す番組識別番号「1012」の番組は、操作履歴(図23の(a))に示す番組識別番号「1002」の番組のサイマル放送(異なる放送波で同時に放送している番組)であるため、不要な番組として取り除くべきであるが、双方を比較するとジャンルが異なっているために、検索結果から取り除くことができていない。   In addition, the program with the program identification number “1012” shown in FIG. 23C is simultaneously broadcast on the program with the program identification number “1002” shown in the operation history (FIG. 23A). Therefore, it should be removed as an unnecessary program. However, when both are compared, the genre is different, so it cannot be removed from the search result.

一方、図23の(b)に示す番組識別番号「1014」、「1015」の番組は、それぞれ、操作履歴(図23の(a))に示す番組識別番号「1001」、「1002」の翌日以降に放送される番組であり、どちらも操作履歴の番組とは異なるため、検索結果に残しておくべきであるが、双方を比較すると放送局、ジャンル、タイトルの組合せが一致しているため、誤って検索結果から除外されている。   On the other hand, the programs with the program identification numbers “1014” and “1015” shown in FIG. 23B are the next day of the program identification numbers “1001” and “1002” shown in the operation history (FIG. 23A), respectively. It is a program that will be broadcast later, both of which are different from the operation history program, so it should be left in the search results, but when comparing both, the combination of broadcast station, genre, title matches, Accidentally excluded from search results.

このように、従来の技術では、検索結果から不要な番組を取り除くための除外条件を適切に設定することができていないため、ユーザにとって不要な番組を取り除き、ユーザにとって必要な情報を検索結果に残すことができていない。   As described above, in the conventional technique, the exclusion condition for removing the unnecessary program from the search result cannot be set appropriately. Therefore, the program unnecessary for the user is removed, and the information necessary for the user is included in the search result. I can't leave it.

この発明は、上述した従来技術による問題点を解消するためになされたものであり、ユーザに必要な番組を推奨できるように、除外条件を適切に設定することができる情報検索装置を提供することを目的とする。   The present invention has been made in order to solve the above-described problems caused by the prior art, and provides an information search apparatus capable of appropriately setting exclusion conditions so that a user can recommend a necessary program. With the goal.

上述した課題を解決し、目的を達成するため、この情報検索装置は、検索対象となる情報のメタデータを取得して保管するメタデータ取得部と、ユーザによる過去の操作履歴の内容と、操作対象となった情報のメタデータとを対応付けた操作履歴の情報を保管する操作履歴記録部と、前記メタデータ取得部で保管した検索対象の情報のメタデータと、前記操作履歴記録部で保管した操作対象の情報のメタデータのテキスト部分から、それぞれのインデックスを作成するインデックス作成部と、前記インデックス作成部で作成した各インデックスを比較して各検索結果を得た後、前記操作履歴の情報と前記検索結果の情報とのインデックスの類似度、もしくは、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす検索結果を、除外する候補の検索結果となる除外検索結果として抽出する推薦部と、前記推薦部が抽出した前記除外検索結果の情報を保管する除外履歴記録部と、前記除外履歴記録部に保管された除外検索結果の情報と、前記操作履歴記録部に保管された操作履歴の情報とを基にして、前記推薦部が前記除外検索結果を抽出するための条件を調整する除外条件調整部と、を備えることを要件とする。   In order to solve the above-described problems and achieve the object, this information search device includes a metadata acquisition unit that acquires and stores metadata of information to be searched, contents of past operation history by the user, and operations An operation history recording unit that stores operation history information associated with metadata of target information, metadata of search target information stored by the metadata acquisition unit, and storage by the operation history recording unit The index creation unit that creates each index from the text part of the metadata of the information to be operated and the respective indexes created by the index creation unit to obtain each search result, and then the operation history information And the index similarity between the search result information or the index similarity between the search result information is within a predetermined range, and A search unit that extracts a search result that satisfies a predetermined condition for a comparison result other than the text portion of the data as an excluded search result that is a search result of a candidate to be excluded, and stores information on the exclusion search result extracted by the recommendation unit Based on the exclusion history recording unit, the information on the exclusion search result stored in the exclusion history recording unit, and the operation history information stored in the operation history recording unit, the recommendation unit performs the exclusion search result And an exclusion condition adjustment unit that adjusts the conditions for extracting.

この情報検索装置によれば、除外履歴記録部に保管された除外検索結果の情報と、操作履歴記録部に保管された操作履歴の情報とを基にして、除外検索結果を抽出するための条件を調整するので、かかる条件をユーザのニーズに合わせて適切に設定でき、ユーザによって不要となる情報を検索結果から除外することができる。   According to this information search device, a condition for extracting an exclusion search result based on information on an exclusion search result stored in the exclusion history recording unit and information on an operation history stored in the operation history recording unit Therefore, such conditions can be appropriately set according to the user's needs, and information unnecessary by the user can be excluded from the search results.

以下に添付図面を参照して、この発明に係る情報検索装置の好適な実施の形態を詳細に説明する。   Exemplary embodiments of an information search apparatus according to the present invention will be explained below in detail with reference to the accompanying drawings.

まず、本実施例1にかかる情報検索装置の概要および特徴について説明する。本実施例1にかかる情報検索装置は、番組のメタデータ(電子番組表のデータ等)から生成されるインデックスとユーザの嗜好に基づいて生成されるインデックスとを比較して、ユーザの嗜好に合うと考えられる番組の検索結果を一旦抽出する。そして、情報検索装置は、所定の除外条件を用いて、ユーザに対して不要な番組を検索結果から除外し、除外した番組の情報(以下、除外データ)と、ユーザの番組に対する操作の履歴(操作履歴データ)とを基にして、除外条件を調整する。   First, an outline and features of the information search apparatus according to the first embodiment will be described. The information search apparatus according to the first embodiment compares an index generated from program metadata (such as electronic program guide data) with an index generated based on the user's preference, and matches the user's preference. The search result of the program considered to be once extracted. Then, the information search apparatus excludes a program unnecessary for the user from the search result using a predetermined exclusion condition, information on the excluded program (hereinafter, excluded data), and a history of operations on the user's program ( The exclusion condition is adjusted based on the operation history data.

このように、本実施例1にかかる情報検索装置は、除外データと操作履歴データとを基にして、除外条件を調整するので、除外条件を適切に設定でき、ユーザにとって不要な番組のみを検索結果から取り除くことができる。   As described above, since the information search apparatus according to the first embodiment adjusts the exclusion condition based on the exclusion data and the operation history data, the exclusion condition can be appropriately set and only the program unnecessary for the user is searched. Can be removed from the results.

次に、本実施例1にかかる情報検索装置100の構成について説明する。図1は、本実施例1にかかる情報検索装置100の構成を示す機能ブロック図である。同図に示すように、この情報検索装置100は、メタデータ取得部110と、操作履歴記録部120と、嗜好情報設定部130と、インデックス作成部140と、推薦部150と、除外履歴記録部160と、除外条件調整部170と、表示部180と、検索結果記録部190とを有する。なお、この情報検索装置100は、ネットワークに接続される通信装置や、放送波を受信する受信装置を備えているものとする(図示略)。   Next, the configuration of the information search apparatus 100 according to the first embodiment will be described. FIG. 1 is a functional block diagram of the configuration of the information search apparatus 100 according to the first embodiment. As shown in the figure, the information retrieval apparatus 100 includes a metadata acquisition unit 110, an operation history recording unit 120, a preference information setting unit 130, an index creation unit 140, a recommendation unit 150, and an exclusion history recording unit. 160, an exclusion condition adjustment unit 170, a display unit 180, and a search result recording unit 190. The information search apparatus 100 includes a communication apparatus connected to a network and a receiving apparatus that receives broadcast waves (not shown).

このうち、メタデータ取得部110は、検索対象となる番組、ネット動画、ニュース(ネット上で配信されるニュース)などのメタデータを取得して保管する手段である。図2は、メタデータ取得部110が保管するメタデータのデータ構造の一例を示す図である。同図に示すように、このメタデータは、番組を識別するための番組識別番号と、放送日時と、放送局と、放送長と、放送波と、ジャンルと、タイトルと、番組の説明とを有する。   Among these, the metadata acquisition unit 110 is means for acquiring and storing metadata such as a search target program, a net moving image, and news (news distributed on the net). FIG. 2 is a diagram illustrating an example of a data structure of metadata stored in the metadata acquisition unit 110. As shown in the figure, this metadata includes a program identification number for identifying a program, a broadcast date and time, a broadcast station, a broadcast length, a broadcast wave, a genre, a title, and a description of the program. Have.

なお、図2のメタデータは、番組のメタデータを示している。ネット動画のメタデータは、動画の配信開始日時、配信長、配信元、ジャンル、タイトル、説明、配信期限などからなり、ニュースのメタデータは、ニュースの配信開始日時、配信元、ジャンル、タイトル、説明、配信期限などからなる。   Note that the metadata in FIG. 2 indicates the metadata of the program. Net video metadata includes video distribution start date, distribution length, distribution source, genre, title, description, distribution deadline, etc. News metadata includes news distribution start date, distribution source, genre, title, Consists of explanation, delivery deadline, etc.

メタデータ取得部110は、番組のメタデータを、放送波に重畳されているEPG(Electric Program Guide)や、ネットワークを通して提供されるEPGから取得する。また、メタデータ取得部110は、ネット動画やニュースのメタデータを、ネット動画の配信元やニュースの配信元から取得する。   The metadata acquisition unit 110 acquires program metadata from an EPG (Electric Program Guide) superimposed on a broadcast wave or an EPG provided through a network. Further, the metadata acquisition unit 110 acquires the metadata of the net moving image and the news from the distribution source of the net moving image and the distribution source of the news.

操作履歴記録部120は、ユーザが番組、ネット動画、ニュースなどに対して行った各種の操作内容(視聴、再生、閲覧、録画、自動再生、保存など)を、操作履歴データとして記録する手段である。   The operation history recording unit 120 is a means for recording various operation contents (viewing, reproduction, browsing, recording, automatic reproduction, saving, etc.) performed by the user for a program, an online video, news, etc., as operation history data. is there.

図3は、本実施例1にかかる操作履歴データのデータ構造の一例を示す図である。同図に示すように、この操作履歴データは、番組識別番号と、操作日時と、操作内容となる操作と、放送日時と、放送局と、ジャンルと、タイトルと、説明とを有する。操作履歴記録部120は、操作履歴データに記録されるエントリの数が規定数に達した場合や、記録してからの期間が規定期間よりも長くなったエントリを操作履歴データから削除してもよい。   FIG. 3 is a diagram illustrating an example of the data structure of the operation history data according to the first embodiment. As shown in the figure, the operation history data includes a program identification number, an operation date and time, an operation that is operation content, a broadcast date and time, a broadcasting station, a genre, a title, and a description. The operation history recording unit 120 deletes an entry from the operation history data when the number of entries recorded in the operation history data reaches a specified number or when an entry whose recording period is longer than the specified period is deleted. Good.

嗜好情報設定部130は、ユーザの好みの番組、ネット動画、ニュースなどを検索するための検索条件を設定する手段である。嗜好情報設定部130は、入力装置(図示略)を介してユーザからキーワードを取得し、取得した各キーワードを検索条件として設定してもよいし、操作履歴記録部120に記録された操作履歴データに含まれるテキストを取得して、検索条件に設定してもよい。   The preference information setting unit 130 is a means for setting a search condition for searching for a user's favorite program, network video, news, and the like. The preference information setting unit 130 may acquire keywords from the user via an input device (not shown), set each acquired keyword as a search condition, or operation history data recorded in the operation history recording unit 120. May be acquired and set as a search condition.

インデックス作成部140は、メタデータ取得部110のメタデータ(検索対象)のインデックス(以下、検索対象インデックス)、操作履歴記録部120の操作履歴データのインデックス(以下、操作履歴インデックス)、嗜好情報設定部130の検索条件のインデックス(以下、検索条件インデックス)をそれぞれ作成する手段である。インデックス作成部140は、作成した検索対象インデックス、操作履歴インデックス、検索条件インデックスの情報を推薦部150に出力する。   The index creation unit 140 includes an index of metadata (search target) of the metadata acquisition unit 110 (hereinafter referred to as search target index), an index of operation history data of the operation history recording unit 120 (hereinafter referred to as operation history index), and preference information setting. This is means for creating an index of search conditions (hereinafter referred to as a search condition index) of the unit 130. The index creation unit 140 outputs the created search target index, operation history index, and search condition index information to the recommendation unit 150.

インデックスの作成方法は、タイトル、説明、ジャンルなどに含まれるテキストを形態素解析やn−gram解析にかけてキーワードに分解した後、各キーワードの出現頻度などの統計量を用いて重み付けすることでインデックス(ベクトル)を作成する。以下において、検索対象インデックス、操作履歴インデックス、検索条件インデックスの作成方法について順に説明する。   The index is created by dividing the text included in the title, description, genre, etc. into keywords through morphological analysis or n-gram analysis, and then weighting them using statistics such as the appearance frequency of each keyword. ). Hereinafter, a method for creating a search target index, an operation history index, and a search condition index will be described in order.

(検索対象インデックスについて)
図2に示したメタデータの番組識別番号「1001」を例にして、検索対象インデックスの作成方法を説明する。インデックス作成部140は、番組識別番号「1001」のタイトル、説明、ジャンルなどに含まれるテキストを形態素解析にかけてキーワードに分解した場合に、キーワード「アップタウン、音楽、・・・」が含まれている場合には、ベクトル空間における、番組識別番号「1001」の基底は、「アップタウン」、「音楽」、・・・となる。
(About search target index)
A method of creating a search target index will be described using the metadata program identification number “1001” shown in FIG. 2 as an example. When the text included in the title, description, and genre of the program identification number “1001” is decomposed into keywords by performing morphological analysis, the index creating unit 140 includes the keywords “Uptown, Music,...”. In this case, the basis of the program identification number “1001” in the vector space is “Uptown”, “Music”,.

そして、各基底の大きさは、各キーワードの統計量となる。統計量としては、例えば、TF(Term Frequency)やDF(Document Frequency)を用いて算出する。TFは、ある番組(ネット動画、ニュースを含む)のテキスト中に特定のキーワードが出現する頻度であり、DFは、検索対象となる全番組中(例えば、図2に示したメタデータに含まれる全ての番組中)で、特定のキーワードを含む番組の数を示す。   The size of each base is a statistic of each keyword. The statistics are calculated using, for example, TF (Term Frequency) or DF (Document Frequency). TF is the frequency at which a specific keyword appears in the text of a certain program (including online video and news), and DF is included in all the programs to be searched (for example, included in the metadata shown in FIG. 2). The number of programs including a specific keyword in all programs).

統計量(基底の大きさ)を算出する具体的な式は、
統計量=TF/DF
となる。
The specific formula for calculating the statistic (base size) is
Statistics = TF / DF
It becomes.

例えば、図2に示した番組識別番号「1001」のテキストにキーワード「アップタウン」、「音楽」が出現する頻度(TF)がそれぞれ「0.8」、「0.6」であり、図2に示した全番組中で、キーワード「アップタウン」、「音楽」を含む番組の数(DF)が、それぞれ、「2」、「3」であった場合には、番組識別番号「1001」のインデックスは、「アップタウン(基底の大きさ0.4)、音楽(基底の大きさ0.2)」となる。なお、検索対象インデックスは、図2に示したメタデータに含まれる番組の数だけ作成される。   For example, the frequencies (TF) at which the keywords “Uptown” and “Music” appear in the text of the program identification number “1001” shown in FIG. 2 are “0.8” and “0.6”, respectively. If the numbers (DF) of the programs including the keywords “Uptown” and “Music” are “2” and “3”, respectively, the program identification number “1001” is shown. The index is “Uptown (base size 0.4), Music (base size 0.2)”. Note that the search target indexes are created for the number of programs included in the metadata shown in FIG.

(操作履歴インデックスについて)
図3に示した検索履歴データ「1001」を例にして、操作履歴インデックスの作成方法を説明する。インデックス作成部140は、番組識別番号「1001」のタイトル、説明、ジャンルなどに含まれるテキストを形態素解析にかけてキーワードに分解した場合に、キーワード「アップタウン、音楽、・・・」が含まれている場合には、ベクトル空間における、番組識別番号「1001」の基底は、「アップタウン」、「音楽」、・・・となる。
(About the operation history index)
A method for creating an operation history index will be described using the search history data “1001” shown in FIG. 3 as an example. When the text included in the title, description, and genre of the program identification number “1001” is decomposed into keywords by performing morphological analysis, the index creating unit 140 includes the keywords “Uptown, Music,...”. In this case, the basis of the program identification number “1001” in the vector space is “Uptown”, “Music”,.

そして、各基底の大きさは、各キーワードの統計量となる。統計量の算出方法は、検索インデックスにおいて説明した算出方法と同様である。図3に示した番組識別番号「1001」のテキストにキーワード「アップタウン」、「音楽」が出現する頻度(TF)がそれぞれ「0.8」、「0.6」であり、図2に示した全番組中で、キーワード「アップタウン」、「音楽」を含む番組の数(DF)が、それぞれ、「2」、「3」であった場合には、番組識別番号「1001」のインデックスは、「アップタウン(基底の大きさ0.4)、音楽(基底の大きさ0.2)」となる。なお、操作履歴インデックスは、図3に示した操作履歴データに含まれる番組の数だけ作成される。   The size of each base is a statistic of each keyword. The statistic calculation method is the same as the calculation method described in the search index. The frequencies (TF) at which the keywords “Uptown” and “Music” appear in the text of the program identification number “1001” shown in FIG. 3 are “0.8” and “0.6”, respectively. If the number of programs (DF) including the keywords “Uptown” and “Music” is “2” and “3”, respectively, the index of the program identification number “1001” is , “Uptown (base size 0.4), music (base size 0.2)”. Note that as many operation history indexes as the number of programs included in the operation history data shown in FIG. 3 are created.

(検索条件インデックスについて)
ここでは、操作履歴データ(図3参照)を用いた場合の検索条件インデックスの作成方法を説明する。インデックス作成部140は、操作履歴インデックスに含まれる全てのテキストを形態素解析にかけて、テキストをキーワードに分解する。テキストをキーワードに分解した結果、キーワード「アップタウン、音楽、ちりとり、・・・」が含まれている場合には、ベクトル空間における検索条件インデックスの規定は、「アップタウン」、「音楽」、「ちりとり」・・・となる。
(About search condition index)
Here, a method of creating a search condition index when using operation history data (see FIG. 3) will be described. The index creation unit 140 performs morphological analysis on all the texts included in the operation history index, and decomposes the texts into keywords. If the keyword “Uptown, Music, Dustpan,...” Is included as a result of dividing the text into keywords, the search condition index in the vector space is defined as “Uptown”, “Music”, “ Dustpan "...

そして、各基底の大きさは、各キーワードの統計量となる。統計量の算出方法は、検索インデックスにおいて説明した算出方法と同様である。操作履歴データのテキストにキーワード「アップタウン」、「音楽」、「ちりとり」が出現する頻度(TF)がそれぞれ「0.4」、「0.3」、「0.2」であり、図2に示した全番組中で、キーワード「アップタウン」、「音楽」、「ちりとり」を含む番組の数(DF)が、それぞれ、「2」、「3」、「2」であった場合には、検索条件インデックスは、「アップタウン(基底の大きさ0.2)、音楽(基底の大きさ0.1)、ちりとり(基底の大きさ0.1)」となる。   The size of each base is a statistic of each keyword. The statistic calculation method is the same as the calculation method described in the search index. The frequencies (TF) at which the keywords “Uptown”, “Music”, and “Dustpan” appear in the text of the operation history data are “0.4”, “0.3”, and “0.2”, respectively. When the number of programs (DF) including the keywords “Uptown”, “Music”, and “Dust” is “2”, “3”, and “2”, respectively, The search condition index is “uptown (base size 0.2), music (base size 0.1), dustpan (base size 0.1)”.

推薦部150は、インデックス作成部140からインデックス(検索対象インデックス、操作履歴インデックス、検索条件インデックス)の情報を取得し、取得したインデックスに基づいて、ユーザに推奨する番組の検索結果を作成する手段である。推薦部150は、検索結果の候補となる一次検索結果を作成する処理、一次検索結果から不要な番組を取り除く処理を順に実行する。以下において、一次検索結果を作成する処理、不要な番組を取り除く処理について順に説明する。   The recommendation unit 150 is a unit that acquires index information (search target index, operation history index, search condition index) from the index generation unit 140, and generates a search result of a program recommended to the user based on the acquired index. is there. The recommendation unit 150 sequentially executes a process of creating a primary search result as a search result candidate and a process of removing unnecessary programs from the primary search result. In the following, a process for creating a primary search result and a process for removing unnecessary programs will be described in order.

(一次検索結果を作成する処理について)
推薦部150は、各検索対象インデックスと検索条件インデックスとの類似度を算出し、算出した類似度に基づいて一次検索結果を作成する。なお、ベクトル同士の類似度は、ベクトル間の内積(あるいは角度、相関係数)で表される。図4は、インデックス間の類似度の計算方法を示す図である。ユーザの嗜好に合う情報ほど類似度が高くなる。
(About processing to create primary search results)
The recommendation unit 150 calculates the similarity between each search target index and the search condition index, and creates a primary search result based on the calculated similarity. Note that the similarity between vectors is represented by an inner product (or angle, correlation coefficient) between the vectors. FIG. 4 is a diagram illustrating a method of calculating similarity between indexes. The degree of similarity increases as the information matches the user's preference.

推薦部150は、各検索対象インデックスと検索条件インデックスとの内積を算出し、算出した内積の値が第1の規定値以上となる検索対象インデックスと検索条件インデックスとの組を抽出する(抽出した組に含まれる検索対象インデックスを、検索結果候補インデックスと表記する。)。そして、検索結果候補インデックスに対応する各種情報(番組識別番号、放送日時、放送局、ジャンル、タイトル、説明)を一次検索結果に登録する。   The recommendation unit 150 calculates the inner product of each search target index and the search condition index, and extracts a set of the search target index and the search condition index in which the calculated inner product value is equal to or greater than the first specified value (extracted) The search target index included in the set is referred to as a search result candidate index.) Various information (program identification number, broadcast date / time, broadcast station, genre, title, description) corresponding to the search result candidate index is registered in the primary search result.

(不要な番組を取り除く処理について)
推薦部150は、検索結果候補インデックスと操作履歴インデックスとを基にして、不要なエントリを一次検索結果から除外する。一次検索結果から不要なエントリが除外されたものが、最終的な検索結果となる。推薦部150は、まず、検索結果候補インデックスと操作履歴インデックスとの内積を算出する。
(About processing to remove unnecessary programs)
The recommendation unit 150 excludes unnecessary entries from the primary search result based on the search result candidate index and the operation history index. A final search result is obtained by removing unnecessary entries from the primary search result. The recommendation unit 150 first calculates the inner product of the search result candidate index and the operation history index.

そして、推薦部150は、算出した内積と、第2の規定値とを比較して、内積が第2の規定値以上となる検索結果候補インデックスと操作履歴インデックスとの組(以下、第1の組)を抽出する。第1の組に含まれる検索結果候補インデックスの番組は、対となる操作履歴インデックスの番組の再放送あるいはサイマル放送の疑いが極めて高い番組となる。   Then, the recommendation unit 150 compares the calculated inner product with the second specified value, and sets the search result candidate index and the operation history index (hereinafter referred to as the first history index) that the inner product is equal to or greater than the second specified value. Group). The program of the search result candidate index included in the first group is a program that is extremely likely to be rebroadcast or simulcast of the paired operation history index program.

推薦部150は、第1の組に含まれる各インデックスに対応する番組の放送日時(放送開始日、放送開始時間)に基づいて、第1の組に含まれる検索結果候補インデックスが、ユーザにとって不要な番組のインデックスであるか否かを判定する。   Based on the broadcast date and time (broadcast start date, broadcast start time) of the program corresponding to each index included in the first group, the recommendation unit 150 does not require the search result candidate index included in the first group for the user. It is determined whether or not the index is a correct program.

具体的に、推薦部150は、第1の組において、検索結果候補インデックスに対応する番組の放送開始時間と、操作履歴インデックスに対応する番組の放送開始時間とを比較する。そして、各放送開始時間が異なっている場合には、かかる第1の組における検索結果候補インデックスの番組は、ユーザが既に操作した番組(操作履歴データの番組)の再放送の番組であると判定する。   Specifically, the recommendation unit 150 compares the broadcast start time of the program corresponding to the search result candidate index with the broadcast start time of the program corresponding to the operation history index in the first set. If the broadcast start times are different, it is determined that the program of the search result candidate index in the first set is a rebroadcast program of a program that has already been operated by the user (program of operation history data). To do.

また、推薦部150は、第1の組において、検索結果候補インデックスに対応する番組の放送開始日と、操作履歴インデックスに対応する番組の放送開始日とを比較する。そして、各放送開始日が同じとなる場合には、かかる第1の組における検索結果候補インデックスの番組は、ユーザが既に操作した番組(操作履歴データの番組)のサイマル放送であると判定する。   In the first group, the recommendation unit 150 compares the broadcast start date of the program corresponding to the search result candidate index with the broadcast start date of the program corresponding to the operation history index. When the broadcast start dates are the same, it is determined that the program of the search result candidate index in the first set is a simulcast of a program that has already been operated by the user (program of operation history data).

推薦部150は、再放送あるいはサイマル放送であると判定した番組の検索結果候補インデックスに対応するエントリを一次検索結果から除外すると共に、除外したエントリを除外データに登録する。図5は、本実施例1にかかる除外データの一例を示す図である。同図に示すように、この除外データは、一次検索結果から除外された番組の番組識別番号と、放送日時と、放送局と、ジャンルと、タイトルと、説明とを有する。   The recommendation unit 150 excludes the entry corresponding to the search result candidate index of the program determined to be rebroadcast or simulcast from the primary search result, and registers the excluded entry in the exclusion data. FIG. 5 is a diagram illustrating an example of exclusion data according to the first embodiment. As shown in the figure, the exclusion data includes a program identification number of a program excluded from the primary search result, a broadcast date and time, a broadcast station, a genre, a title, and a description.

続いて、推薦部150は、検索結果候補インデックス(再放送の番組あるいはサイマル放送の番組と判定された番組に対応する検索結果候補インデックスを除く)同士の内積を算出し、算出した内積が第2の閾値以上となる検索結果候補インデックスの組(以下、第2の組)を抽出する。   Subsequently, the recommendation unit 150 calculates an inner product between the search result candidate indexes (excluding a search result candidate index corresponding to a program determined to be a rebroadcast program or a simulcast program), and the calculated inner product is the second. A set of search result candidate indexes (hereinafter referred to as a second set) that is equal to or greater than the threshold is extracted.

推薦部150は、第2の組に含まれる各インデックスに対応する番組の放送日時(放送開始日、放送開始時間)に基づいて、第2の組に含まれる検索結果候補インデックスが、ユーザにとって不要な番組のインデックスであるか否かを判定する。   Based on the broadcast date and time (broadcast start date, broadcast start time) of the program corresponding to each index included in the second set, the recommendation unit 150 does not require the search result candidate index included in the second set for the user. It is determined whether or not the index is a correct program.

具体的に、推薦部150は、第2の組において、一方の検索結果候補インデックスに対応する番組の放送開始時間と、もう一方の検索結果候補インデックスに対応する番組の放送開始時間とを比較する。そして、各放送開始時間が異なっている場合には、かかる第2の組における一方の検索結果候補インデックスの番組が、もう一方の検索結果候補インデックスの番組の再放送であると判定する。   Specifically, the recommendation unit 150 compares the broadcast start time of the program corresponding to one search result candidate index with the broadcast start time of the program corresponding to the other search result candidate index in the second set. . When the broadcast start times are different, it is determined that the program of one search result candidate index in the second set is a rebroadcast of the program of the other search result candidate index.

また、推薦部150は、第2の組において、一方の検索結果候補インデックスに対応する番組の放送開始日と、もう一方の検索結果候補インデックスに対応する番組の放送開始日とを比較する。そして、各放送開始日が同じとなる場合には、かかる第2の組における一方の検索結果候補インデックスの番組が、もう一方の検索結果候補インデックスの番組のサイマル放送であると判定する。   Further, the recommendation unit 150 compares the broadcast start date of the program corresponding to one search result candidate index with the broadcast start date of the program corresponding to the other search result candidate index in the second set. When the broadcast start dates are the same, it is determined that the program of one search result candidate index in the second set is a simulcast of the program of the other search result candidate index.

推薦部150は、再放送あるいはサイマル放送であると判定した番組の検索結果候補インデックスを含む第2の組中で、どちらか一方の検索結果候補インデックスを選択する。そして、選択した検索結果候補インデックスに対応するエントリを一次検索結果から除外すると共に、除外したエントリを除外データ(図5参照)に登録する。また、推薦部150は、作成した除外データを除外履歴記録部160に記録する。   The recommendation unit 150 selects one of the search result candidate indexes in the second set including the search result candidate index of the program determined to be rebroadcast or simulcast. Then, the entry corresponding to the selected search result candidate index is excluded from the primary search result, and the excluded entry is registered in the exclusion data (see FIG. 5). The recommendation unit 150 records the created exclusion data in the exclusion history recording unit 160.

ところで、推薦部150は、検索結果インデックスと操作履歴インデックスとの内積を算出し、算出した内積と、第2の規定値と第3の規定値(ただし、第2の規定値>第3の規定値)とを比較する。そして、内積が第3の規定値以上、第2の規定値未満となる検索結果候補インデックスと操作履歴インデックスとの組(以下、第3の組)を抽出する。第3の組に含まれる検索結果候補インデックスの番組は、対となる操作履歴インデックスの番組の再放送あるいはサイマル放送の疑いのある番組となる。ただし、再放送あるいはサイマル放送である可能性は、第1の組よりも低い。   Incidentally, the recommendation unit 150 calculates the inner product of the search result index and the operation history index, and calculates the inner product, the second specified value, and the third specified value (where the second specified value> the third specified value). Value). Then, a set of search result candidate indexes and operation history indexes (hereinafter referred to as a third set) in which the inner product is not less than the third specified value and less than the second specified value is extracted. The program of the search result candidate index included in the third set is a program that is suspected of being rebroadcasted or a simulcast of the paired operation history index. However, the possibility of rebroadcasting or simulcasting is lower than in the first group.

推薦部150は、第3の組に含まれる各インデックスに対応する番組の放送日時(放送開始日、放送開始時間)に基づいて、第3の組に組まれる検索結果候補インデックスが、ユーザにとって不要な番組のインデックスである可能性があるか否かを判定する。   The recommendation unit 150 does not require a search result candidate index to be set in the third set based on the broadcast date and time (broadcast start date, broadcast start time) of the program corresponding to each index included in the third set for the user. It is determined whether or not there is a possibility that the program index is correct.

具体的に、推薦部150は、第3の組において、検索結果候補インデックスに対応する番組の放送開始時間と、操作履歴インデックスに対応する番組の放送開始時間とを比較する。そして、各放送開始時間が異なっている場合には、かかる第3の組における検索結果候補インデックスの番組は、ユーザが既に操作した番組(操作履歴データの番組)の再放送の番組である可能性が高いと判定する。   Specifically, the recommendation unit 150 compares the broadcast start time of the program corresponding to the search result candidate index with the broadcast start time of the program corresponding to the operation history index in the third set. If the broadcast start times are different, the program of the search result candidate index in the third group may be a rebroadcast program of a program already operated by the user (program of operation history data). Is determined to be high.

また、推薦部150は、第3の組において、検索結果候補インデックスに対応する番組の放送開始日と、操作履歴インデックスに対応する番組の放送開始日とを比較する。そして、各放送開始日が同じとなる場合には、かかる第3の組における検索結果候補インデックスの番組は、ユーザが既に操作した番組(操作履歴データの番組)のサイマル放送である可能性が高いと判定する。   In the third set, the recommendation unit 150 compares the broadcast start date of the program corresponding to the search result candidate index with the broadcast start date of the program corresponding to the operation history index. If the broadcast start dates are the same, the program of the search result candidate index in the third set is likely to be a simulcast of a program that has already been operated by the user (program of operation history data). Is determined.

推薦部150は、再放送あるいはサイマル放送の可能性が高いと判定した番組の検索結果候補インデックスの各種情報(識別番号、放送日時、放送局、ジャンル、タイトル、説明)を、除外候補データに登録する。図6は、本実施例1にかかる除外候補データのデータ構造の一例を示す図である。同図に示すように、この除外候補データは、番組識別番号と、放送日時と、放送局と、ジャンルと、タイトルと、説明とを有する。推薦部150は、作成した除外候補データを除外履歴記録部160に記録する。   The recommendation unit 150 registers various information (identification number, broadcast date / time, broadcast station, genre, title, description) of the search result candidate index of the program determined to be highly likely to be rebroadcast or simulcast in the exclusion candidate data. To do. FIG. 6 is a diagram illustrating an example of the data structure of the exclusion candidate data according to the first embodiment. As shown in the figure, this exclusion candidate data includes a program identification number, a broadcast date, a broadcast station, a genre, a title, and a description. The recommendation unit 150 records the created exclusion candidate data in the exclusion history recording unit 160.

推薦部150は、一次検索結果から不要な番組を取り除いた残りの番組のエントリを検索結果データとして、表示部180および検索結果記録部190に出力する。図7は、本実施例1にかかる検索結果データのデータ構造の一例を示す図である。   The recommendation unit 150 outputs the remaining program entries obtained by removing unnecessary programs from the primary search result to the display unit 180 and the search result recording unit 190 as search result data. FIG. 7 is a diagram illustrating an example of a data structure of search result data according to the first embodiment.

図7に示すように、この検索結果データは、検索順位、番組識別番号、放送日時、放送局、ジャンル、タイトル、説明を有する。推薦部150は、例えば、検索対象インデックスと検索条件インデックスとの類似度が高いエントリほど検索順位を小さく設定して、検索結果データのエントリを並び替えてもよい。   As shown in FIG. 7, the search result data includes a search order, a program identification number, a broadcast date and time, a broadcast station, a genre, a title, and a description. For example, the recommendation unit 150 may rearrange the entries of the search result data by setting a lower search order for an entry having a higher similarity between the search target index and the search condition index.

除外履歴記録部160は、除外データ(図5参照)および除外候補データ(図6参照)を記憶する手段である。除外履歴記録部160は、新たに検索が行われた場合や、除外データあるいは除外候補データに登録されるエントリの数が規定数に達した場合や、記録してからの期間が規定期間よりも長くなったエントリを除外データ、除外候補データから削除してもよい。   The exclusion history recording unit 160 is means for storing exclusion data (see FIG. 5) and exclusion candidate data (see FIG. 6). The exclusion history recording unit 160 is used when a new search is performed, when the number of entries registered in the exclusion data or exclusion candidate data reaches a prescribed number, or when the period after recording is longer than the prescribed period. You may delete the entry which became long from exclusion data and exclusion candidate data.

除外条件調整部170は、除外履歴記録部160に記録された除外データおよび除外候補データと、操作履歴記録部120に記録された操作履歴データとを比較して、推薦部150が利用する第2の規定値および第3の規定値を調整する手段である。   The exclusion condition adjustment unit 170 compares the exclusion data and the exclusion candidate data recorded in the exclusion history recording unit 160 with the operation history data recorded in the operation history recording unit 120, and the second condition used by the recommendation unit 150. Means for adjusting the specified value and the third specified value.

具体的に、除外条件調整部170は、除外データに含まれる各エントリと操作履歴データの各エントリとを比較して、放送日時、放送局、タイトル、説明が一致するエントリの組が存在するか否かを判定する。そして、除外条件調整部170は、一致するエントリの組が存在すると判定した場合には、推薦部150が利用する第2の規定値に所定の値を加算する。   Specifically, the exclusion condition adjustment unit 170 compares each entry included in the exclusion data with each entry of the operation history data to determine whether there is a set of entries having the same broadcast date / time, broadcast station, title, and description. Determine whether or not. When the exclusion condition adjustment unit 170 determines that there is a set of matching entries, the exclusion condition adjustment unit 170 adds a predetermined value to the second specified value used by the recommendation unit 150.

除外データに含まれる各エントリと操作履歴データの各エントリとを比較して、一致するエントリが存在するということは、除外されたエントリが本来は検索結果に残して欲しかったものであると考えられるため、第2の規定値に所定の値を加算して除外条件を厳しくする(一次検索結果に含まれるエントリを除外されにくくする)。   If each entry included in the excluded data is compared with each entry in the operation history data, and there is a matching entry, it is considered that the excluded entry originally wanted to be left in the search result. Therefore, the exclusion condition is tightened by adding a predetermined value to the second specified value (the entry included in the primary search result is not easily excluded).

一方、除外条件調整部170は、除外候補データに含まれる各エントリと操作履歴データの各エントリとを比較して、放送日時、放送局、タイトル、説明が一致するエントリの組が存在するか否かを判定する。そして、除外条件調整部170は、一致するエントリの組が存在しないと判定した場合には、推薦部150が利用する第2の規定値および第3の規定値から所定の値を減算する。   On the other hand, the exclusion condition adjustment unit 170 compares each entry included in the exclusion candidate data with each entry of the operation history data to determine whether there is a set of entries having the same broadcast date / time, broadcast station, title, and description. Determine whether. If the exclusion condition adjustment unit 170 determines that there is no matching entry pair, the exclusion condition adjustment unit 170 subtracts a predetermined value from the second specified value and the third specified value used by the recommendation unit 150.

除外候補データに含まれる各エントリと操作履歴データの各エントリとを比較して、一致するエントリが存在しないということは、除外候補データに含まれるエントリ(除外候補データに含まれるエントリは、一次検索結果に残されている)が本来は検索結果に残して欲しくなかったものであると考えられるため、第2の規定値および第3の規定値から所定の値を減算して除外条件を緩くする(一次検索結果に含まれるエントリを除外しやすくする)。   Comparing each entry included in the exclusion candidate data with each entry in the operation history data, the fact that there is no matching entry means that the entry included in the exclusion candidate data (the entry included in the exclusion candidate data is the primary search) (Remaining in the result) is considered to be something that was originally not desired to be included in the search result, so that the exclusion condition is relaxed by subtracting a predetermined value from the second specified value and the third specified value. (Easy to exclude entries included in primary search results)

このように、除外条件調整部170が、除外履歴記録部160に記録された除外データおよび除外候補データと、操作履歴記録部120に記録された操作履歴データとを比較して、推薦部150が利用する第2の規定値および第3の規定値を調整するので、ユーザの嗜好にあった検索結果を得るための検索条件を適切に設定することができる。   Thus, the exclusion condition adjustment unit 170 compares the exclusion data and exclusion candidate data recorded in the exclusion history recording unit 160 with the operation history data recorded in the operation history recording unit 120, and the recommendation unit 150 Since the second specified value and the third specified value to be used are adjusted, it is possible to appropriately set search conditions for obtaining a search result that suits the user's preference.

表示部180は、検索結果データ(図7参照)をディスプレイ等の画面に表示する手段である。ユーザは、かかる画面を参照して、番組の録画などを設定する。検索結果記録部190は、検索結果データを保管する手段である。ユーザは、検索結果記録部190に記録された検索結果データの参照や、検索結果データのうち、保存したいエントリを指定する。   The display unit 180 is means for displaying the search result data (see FIG. 7) on a screen such as a display. The user refers to the screen and sets recording of the program. The search result recording unit 190 is means for storing search result data. The user refers to the search result data recorded in the search result recording unit 190 and specifies an entry to be saved among the search result data.

次に、本実施例1にかかる情報検索装置100の各種の処理手順について説明する。図8、図9は、除外条件調整部170が第2、3の規定値を調整する処理を示すフローチャートであり、図10、図11は、本実施例1にかかる推薦部150が検索結果データを作成する処理を示すフローチャートである。   Next, various processing procedures of the information search apparatus 100 according to the first embodiment will be described. FIG. 8 and FIG. 9 are flowcharts showing the process in which the exclusion condition adjustment unit 170 adjusts the second and third specified values. FIGS. 10 and 11 show the search result data by the recommendation unit 150 according to the first embodiment. It is a flowchart which shows the process which produces.

図8に示すように、除外条件調整部170は、iの値を0に設定し(ステップS101)、操作履歴記録部120から操作履歴データを取得し(ステップS102)、除外履歴記録部160から除外データの一覧(M個)を取得する(ステップS103)。   As shown in FIG. 8, the exclusion condition adjustment unit 170 sets the value of i to 0 (step S101), acquires operation history data from the operation history recording unit 120 (step S102), and from the exclusion history recording unit 160. A list of excluded data (M) is acquired (step S103).

そして、除外条件調整部170は、iの値がMの値よりも小さいか否かを判定し、iの値がMの値以上である場合には(ステップS104,No)、処理を終了する。一方、iの値がMの値よりも小さい場合には(ステップS104,Yes)、操作履歴データと除外データ(i番目)とが同じ情報であるか否かを判定する(ステップS105)。   Then, the exclusion condition adjustment unit 170 determines whether or not the value of i is smaller than the value of M. If the value of i is equal to or greater than the value of M (No in step S104), the process ends. . On the other hand, when the value of i is smaller than the value of M (step S104, Yes), it is determined whether the operation history data and the exclusion data (i-th) are the same information (step S105).

操作履歴データと除外データ(i番目)とが異なる情報である場合には(ステップS106,No)、iに1を加算した値を新たなiの値に設定し(ステップS107)、ステップS104に移行する。一方、操作履歴データと除外データ(i番目)とが同じ情報である場合には(ステップS106,Yes)、第2の規定値を調整(第2の規定値を上げる)し(ステップS108)、処理を終了する。   If the operation history data and the excluded data (i-th) are different information (No in step S106), a value obtained by adding 1 to i is set as a new value of i (step S107), and the process proceeds to step S104. Transition. On the other hand, when the operation history data and the exclusion data (i-th) are the same information (step S106, Yes), the second specified value is adjusted (the second specified value is increased) (step S108), End the process.

このように、除外条件調整部170は、操作履歴データと除外データとが同じエントリ(情報)を含んでいる場合に、第2の規定値を上げるので、ユーザの嗜好に合わせて、除外条件を調整することができる。   As described above, the exclusion condition adjustment unit 170 increases the second specified value when the operation history data and the exclusion data include the same entry (information). Therefore, the exclusion condition adjustment unit 170 sets the exclusion condition according to the user's preference. Can be adjusted.

図9に示すように、除外条件調整部170は、iの値を0に設定し(ステップS201)、操作履歴記録部120から操作履歴データを取得し(ステップS202)、除外履歴記録部160から除外候補データの一覧(M個)を取得する(ステップS203)。   As illustrated in FIG. 9, the exclusion condition adjustment unit 170 sets the value of i to 0 (step S201), acquires operation history data from the operation history recording unit 120 (step S202), and from the exclusion history recording unit 160. A list (M) of exclusion candidate data is acquired (step S203).

そして、除外条件調整部170は、iの値がMの値よりも小さいか否かを判定し、iの値がMの値よりも小さい場合には(ステップS204,Yes)、操作履歴データと除外候補データ(i番目)とが同じ情報であるか否かを判定する(ステップS205)。   Then, the exclusion condition adjustment unit 170 determines whether or not the value of i is smaller than the value of M. If the value of i is smaller than the value of M (Yes in step S204), the operation history data and It is determined whether or not the exclusion candidate data (i-th) is the same information (step S205).

操作履歴データと除外候補データ(i番目)とが同じ情報である場合には(ステップS206,Yes)、検出フラグをオンに設定し(ステップS207)、iに1を加算した値を新たなiの値に設定し(ステップS208)、ステップS204に移行する。一方、操作履歴データと除外候補データ(i番目)とが異なる場合には(ステップS206,No)、ステップS208に移行する。   When the operation history data and the exclusion candidate data (i-th) are the same information (step S206, Yes), the detection flag is set to ON (step S207), and a value obtained by adding 1 to i is set as a new i. (Step S208), and the process proceeds to step S204. On the other hand, when the operation history data and the exclusion candidate data (i-th) are different (No at Step S206), the process proceeds to Step S208.

ところで、iの値がMの値以上である場合には(ステップS204,No)、検出フラグがオンであるか否かを判定し(ステップS209)、検出フラグがオフである場合には(ステップS210,No)、第2、3の規定値を調整(第2,3の規定値を下げる)し(ステップS211)、処理を終了する。一方、検出フラグがオンの場合には(ステップS210,Yes)、そのまま処理を終了する。   By the way, when the value of i is greater than or equal to the value of M (step S204, No), it is determined whether or not the detection flag is on (step S209), and when the detection flag is off (step S209). (S210, No), the second and third specified values are adjusted (lower the second and third specified values) (step S211), and the process is terminated. On the other hand, when the detection flag is on (step S210, Yes), the process is ended as it is.

このように、除外条件調整部170は、操作履歴データと除外候補データとが同じエントリを含んでいない場合に、第2,3の規定値を下げるので、ユーザの嗜好に合わせて、除外条件を調整することができる。   In this way, the exclusion condition adjustment unit 170 lowers the second and third specified values when the operation history data and the exclusion candidate data do not include the same entry, so that the exclusion condition is set according to the user's preference. Can be adjusted.

図10に示すように、推薦部150は、iの値を0に設定し(ステップS301)、検索結果候補インデックス(M個)を取得する(ステップS302)。そして、iの値がMの値よりも小さいか否かを判定し、iの値がMの値以上である場合には(ステップS303,No)、処理を終了する。   As shown in FIG. 10, the recommendation unit 150 sets the value of i to 0 (step S301), and acquires search result candidate indexes (M) (step S302). Then, it is determined whether or not the value of i is smaller than the value of M. If the value of i is equal to or greater than the value of M (No at Step S303), the process is terminated.

一方、iの値がMの値よりも小さい場合には(ステップS303,Yes)、jの値を0に設定し(ステップS304)、操作履歴インデックス(N個)を取得する(ステップS305)。そして、jの値がNの値よりも小さいか否かを判定し、jの値がNの値以上である場合には(ステップS306,No)、ステップS317に移行する。   On the other hand, when the value of i is smaller than the value of M (step S303, Yes), the value of j is set to 0 (step S304), and the operation history index (N pieces) is acquired (step S305). Then, it is determined whether or not the value of j is smaller than the value of N. If the value of j is greater than or equal to the value of N (step S306, No), the process proceeds to step S317.

一方、jの値がNの値よりも小さい場合には(ステップS306,Yes)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との類似度を算出し(ステップS307)、類似度が第2の規定値以上であるか否かを判定する(ステップS308)。   On the other hand, when the value of j is smaller than the value of N (step S306, Yes), the similarity between the search result candidate index (i-th) and the operation history index (j-th) is calculated (step S307), It is determined whether or not the similarity is greater than or equal to a second specified value (step S308).

類似度が第2の規定値未満である場合には(ステップS309,No)、ステップS315に移行する。一方、類似度が第2の規定値以上である場合には(ステップS309,Yes)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との放送開始時間が異なるか否かを判定する(ステップS310)。   When the similarity is less than the second specified value (No at Step S309), the process proceeds to Step S315. On the other hand, if the similarity is equal to or higher than the second specified value (step S309, Yes), it is determined whether or not the broadcast start time is different between the search result candidate index (i-th) and the operation history index (j-th). Determination is made (step S310).

放送開始時間が異なる場合には(ステップS311,Yes)、一次検索結果から、検索結果候補インデックス(i番目)に対応する番組のエントリを除外し(ステップS312)、ステップS317に移行する。   If the broadcast start times are different (step S311, Yes), the program entry corresponding to the search result candidate index (i-th) is excluded from the primary search result (step S312), and the process proceeds to step S317.

一方、放送開始時間が同じである場合には(ステップS311,No)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との放送開始日が同じか否かを判定する(ステップS313)。   On the other hand, if the broadcast start times are the same (step S311, No), it is determined whether the search start candidate index (i-th) and the operation history index (j-th) have the same broadcast start date (step). S313).

放送開始日が異なる場合には(ステップS314,No)、jの値に1を加算した値を新たなjの値とし(ステップS315)、ステップS306に移行する。一方、放送開始日が同じ場合には(ステップS314,Yes)、一次検索結果から、検索結果候補インデックス(i番目)に対応する番組のエントリを除外し(ステップS316)、iの値に1を加算した値を新たなiの値とし(ステップS317)、ステップS303に移行する。   If the broadcast start date is different (No in step S314), a value obtained by adding 1 to the value of j is set as a new value of j (step S315), and the process proceeds to step S306. On the other hand, if the broadcast start date is the same (step S314, Yes), the entry of the program corresponding to the search result candidate index (i-th) is excluded from the primary search result (step S316), and the value of i is set to 1. The added value is set as a new value of i (step S317), and the process proceeds to step S303.

このように、推薦部150は、検索結果候補インデックスと操作履歴インデックスとの内積を算出して、第2の規定値と比較した後に、番組の放送開始時間および放送開始日時に基づいて、一次検索結果から不要なデータを除外しているので、ユーザの嗜好にあった検索結果を作成することができる。   As described above, the recommendation unit 150 calculates the inner product of the search result candidate index and the operation history index, compares it with the second specified value, and then performs the primary search based on the broadcast start time and the broadcast start date and time of the program. Since unnecessary data is excluded from the results, a search result suitable for the user's preference can be created.

図11に示すように、推薦部150は、iの値を0に設定し(ステップS401)、検索結果候補インデックス(M個)を取得する(ステップS402)。そして、iの値がMの値よりも小さいか否かを判定し、iの値がMの値以上である場合には(ステップS403,No)、処理を終了する。   As shown in FIG. 11, the recommendation unit 150 sets the value of i to 0 (step S401), and acquires search result candidate indexes (M) (step S402). Then, it is determined whether or not the value of i is smaller than the value of M. If the value of i is equal to or greater than the value of M (No in step S403), the process is terminated.

一方、iの値がMの値よりも小さい場合には(ステップS403,Yes)、iの値に1を加算した値をjの値に設定し(ステップS404)、jの値がMの値よりも小さいか否かを判定し、jの値がMの値以上である場合には(ステップS405,No)、iの値に1を加算した値を新たなiの値に設定し(ステップS406)、ステップS403に移行する。   On the other hand, when the value of i is smaller than the value of M (step S403, Yes), a value obtained by adding 1 to the value of i is set as the value of j (step S404), and the value of j is the value of M. If the value of j is greater than or equal to the value of M (step S405, No), a value obtained by adding 1 to the value of i is set as a new value of i (step S405). S406), the process proceeds to step S403.

一方、jの値がMの値よりも小さい場合には(ステップS405,Yes)、検索結果候補インデックス(i番目)と検索結果候補インデックス(j番目)との類似度を算出し(ステップS407)、類似度が第2の規定値以上か否かを判定する(ステップS408)。   On the other hand, when the value of j is smaller than the value of M (step S405, Yes), the similarity between the search result candidate index (i-th) and the search result candidate index (j-th) is calculated (step S407). Then, it is determined whether or not the similarity is greater than or equal to a second specified value (step S408).

類似度が第2の規定値未満である場合には(ステップS409,No)、ステップS416に移行する。一方、類似度が第2の規定値以上である場合には(ステップS409,Yes)、検索結果候補インデックス(i番目)と検索結果候補インデックス(j番目)との放送開始時間が異なるか否かを判定する(ステップS410)。   When the similarity is less than the second specified value (No at Step S409), the process proceeds to Step S416. On the other hand, if the similarity is equal to or greater than the second specified value (step S409, Yes), whether or not the broadcast start time is different between the search result candidate index (i-th) and the search result candidate index (j-th). Is determined (step S410).

放送開示時間が異なる場合には(ステップS411,Yes)、検索結果候補インデックス(i番目)あるいは検索結果候補インデックス(j番目)のうち何れか一方のインデックスに対応する番組のエントリを、一次検索結果から除外し(ステップS412)、ステップS416に移行する。   If the broadcast disclosure times are different (step S411, Yes), the entry of the program corresponding to one of the search result candidate index (i-th) or the search result candidate index (j-th) is set as the primary search result. (Step S412), and the process proceeds to step S416.

一方、放送開始時間が同じである場合には(ステップS411,No)、検索結果候補インデックス(i番目)と検索結果候補インデックス(j番目)との放送開始日が同じであるか否かを判定する(ステップS413)。   On the other hand, if the broadcast start times are the same (step S411, No), it is determined whether the search start candidate index (i-th) and the search result candidate index (j-th) have the same broadcast start date. (Step S413).

放送開示日が異なる場合には(ステップS414,No)、ステップS416に移行する。一方、放送開示日が同じである場合には(ステップS414,Yes)、検索結果候補インデックス(i番目)あるいは検索結果候補インデックス(j番目)のうち何れか一方のインデックスに対応する番組のエントリを、一次検索結果から除外し(ステップS415)、jの値に1を加算した値を新たなjの値に設定し(ステップS416)、ステップS405に移行する。   When the broadcast disclosure date is different (step S414, No), the process proceeds to step S416. On the other hand, if the broadcast disclosure dates are the same (step S414, Yes), the program entry corresponding to one of the search result candidate index (i-th) or the search result candidate index (j-th) is selected. Then, it is excluded from the primary search result (step S415), a value obtained by adding 1 to the value of j is set as a new value of j (step S416), and the process proceeds to step S405.

このように、推薦部150は、検索結果候補インデックス同士の内積を算出して、第2の規定値と比較した後に、番組の放送開始時間および放送開始日時に基づいて、一次検索結果から不要なデータを除外しているので、ユーザの嗜好にあった検索結果を作成することができる。   As described above, the recommendation unit 150 calculates the inner product between the search result candidate indexes and compares it with the second specified value, and then, based on the broadcast start time and the broadcast start date / time of the program, the recommendation unit 150 eliminates unnecessary from the primary search result. Since the data is excluded, a search result that suits the user's preference can be created.

上述してきたように、本実施例1にかかる情報検索装置100は、除外条件調整部170が、操作履歴記録部120の操作履歴データと、除外履歴記録部160の除外データおよび除外候補データとを基にして、第2の規定値を調整し、推薦部150が、第2の規定値を基にして、一次検索結果から不要な番組のエントリを除外することにより検索結果をユーザに提供するので、ユーザの嗜好に合わせて除外条件を適切に設定することができると共に、ユーザのニーズに合った番組情報を提供することができる。   As described above, in the information search apparatus 100 according to the first embodiment, the exclusion condition adjustment unit 170 uses the operation history data of the operation history recording unit 120, the exclusion data and the exclusion candidate data of the exclusion history recording unit 160. Based on the second specified value, the recommendation unit 150 adjusts the second specified value, and provides the search result to the user by excluding unnecessary program entries from the primary search result. The exclusion condition can be appropriately set according to the user's preference, and program information meeting the user's needs can be provided.

また、本実施例1にかかる情報検索装置100は、各インデックスの類似度および第2の規定値に基づいて、検索結果を作成するので、メタデータ等に表記ゆれが存在する場合にでも、ユーザにとって不要な番組、あるいは重複する番組を検索結果から除外することができる。   In addition, since the information search apparatus 100 according to the first embodiment creates a search result based on the similarity of each index and the second specified value, even when there is notation fluctuation in metadata or the like, the user Programs that are unnecessary or duplicated can be excluded from the search results.

また、本実施例1にかかる情報検索装置100は、推薦部150が、類似度に加えて、番組の放送開始時間、放送開示日時に基づいて、一次検索結果から番組のエントリを除外するので、ユーザが既に操作済みの番組の再放送やサイマル放送となる番組を取り除いた状態で検索結果をユーザに提供することができる。   Further, in the information search apparatus 100 according to the first embodiment, the recommendation unit 150 excludes the program entry from the primary search result based on the broadcast start time and broadcast disclosure date and time in addition to the similarity. The search result can be provided to the user in a state in which the program that has already been operated by the user has been removed or the program to be a simulcast has been removed.

上記の実施例1では、番組の放送開始日、放送開始時間に基づいて、一次検索結果から不要な番組のエントリを除外していたが、これに限定されるものではない。例えば、検索対象がネット動画である場合には、ネット動画の配信長を基にして、一次検索結果から不要な動画の情報を除外することができる。本実施例2では、ネット動画の配信長を基にして、一次検索結果から不要な動画の情報を削除する情報検索装置200について説明を行う。   In the first embodiment, unnecessary program entries are excluded from the primary search result based on the broadcast start date and broadcast start time of the program. However, the present invention is not limited to this. For example, when the search target is a net moving image, unnecessary moving image information can be excluded from the primary search result based on the distribution length of the net moving image. In the second embodiment, an information search apparatus 200 that deletes unnecessary video information from the primary search result based on the distribution length of the net video will be described.

図12は、本実施例2にかかる情報検索装置200の構成を示す機能ブロック図である。同図に示すように、この情報検索装置200は、メタデータ取得部210と、操作履歴記録部220と、嗜好情報設定部230と、インデックス作成部240と、推薦部250と、除外履歴記録部260と、除外条件調整部270と、表示部280と、検索結果記録部290とを有する。なお、この情報検索装置200は、ネットワークに接続される通信装置や、放送波を受信する受信装置を備えているものとする(図示略)。   FIG. 12 is a functional block diagram of the configuration of the information search apparatus 200 according to the second embodiment. As shown in the figure, the information search apparatus 200 includes a metadata acquisition unit 210, an operation history recording unit 220, a preference information setting unit 230, an index creation unit 240, a recommendation unit 250, and an exclusion history recording unit. 260, an exclusion condition adjustment unit 270, a display unit 280, and a search result recording unit 290. The information search apparatus 200 includes a communication apparatus connected to a network and a receiving apparatus that receives broadcast waves (not shown).

メタデータ取得部210は、ネット動画のメタデータを、ネット動画の配信元から取得する手段である。ネット動画のメタデータは、動画の配信開始日時、配信長、配信元、ジャンル、タイトル、説明、配信期限などを有する。   The metadata acquisition unit 210 is means for acquiring the metadata of the net moving image from the distribution source of the net moving image. The metadata of a net moving image has a moving image distribution start date and time, a distribution length, a distribution source, a genre, a title, a description, a distribution deadline, and the like.

操作履歴記録部220は、ユーザがネット動画に対して行った各種の操作内容(使用、再生、閲覧、録画、自動再生、保存など)を、操作履歴データとして記録する手段である。図13は、本実施例2にかかる操作履歴データのデータ構造の一例を示す図である。同図に示すように、この操作履歴データは、ネット動画を識別するコンテンツ識別番号と、操作日時と、操作と、配信日時と、配信元と、配信長と、ジャンルと、タイトルと、説明とを有する。   The operation history recording unit 220 is a means for recording various operation contents (use, reproduction, browsing, recording, automatic reproduction, saving, etc.) performed by the user on the net moving image as operation history data. FIG. 13 is a diagram illustrating an example of the data structure of the operation history data according to the second embodiment. As shown in the figure, the operation history data includes a content identification number for identifying a net video, an operation date / time, an operation, a distribution date / time, a distribution source, a distribution length, a genre, a title, a description, Have

嗜好情報設定部230は、ユーザの好みのネット動画を検索するための検索条件を設定する手段である。嗜好情報設定部230は、入力装置(図示略)を介してユーザからキーワードを取得し、取得した各キーワードを検索条件として設定してもよいし、操作履歴記録部220に記録された操作履歴データに含まれるテキストを取得して、検索条件に設定してもよい。   The preference information setting unit 230 is a means for setting a search condition for searching for a user's favorite net moving image. The preference information setting unit 230 may acquire keywords from the user via an input device (not shown), set each acquired keyword as a search condition, or operation history data recorded in the operation history recording unit 220. May be acquired and set as a search condition.

インデックス作成部240は、メタデータ取得部210のメタデータ(検索対象)のインデックス(以下、検索対象インデックス)、操作履歴記録部220の操作履歴データのインデックス(以下、操作履歴インデックス)、嗜好情報設定部230の検索条件のインデックス(以下、検索条件インデックス)をそれぞれ作成する手段である。インデックス作成部240は、作成した検索対象インデックス、操作履歴インデックス、検索条件インデックスの情報を推薦部250に出力する。なお、インデックスの作成方法は、実施例1と同様であるため、説明を省略する。   The index creation unit 240 includes an metadata (search target) index (hereinafter referred to as a search target index) of the metadata acquisition unit 210, an operation history data index (hereinafter referred to as an operation history index) of the operation history recording unit 220, and preference information setting. This is a means for creating a search condition index (hereinafter referred to as a search condition index) of the unit 230. The index creation unit 240 outputs the created search target index, operation history index, and search condition index information to the recommendation unit 250. The index creation method is the same as that in the first embodiment, and a description thereof will be omitted.

推薦部250は、インデックス作成部240からインデックス(検索対象インデックス、操作履歴インデックス、検索条件インデックス)の情報を取得し、取得したインデックスに基づいて、ユーザに推奨するネット動画の検索結果を作成する手段である。推薦部250は、検索結果の候補となる一次検索結果を作成する処理、一次検索結果から不要なネット動画を取り除く処理を順に実行する。以下において、一次検索結果を作成する処理、不要なネット動画を取り除く処理について順に説明する。   The recommendation unit 250 obtains index information (search target index, operation history index, search condition index) from the index creation unit 240, and creates a search result of the net video recommended to the user based on the obtained index. It is. The recommendation unit 250 sequentially executes a process of creating a primary search result as a search result candidate and a process of removing unnecessary net moving images from the primary search result. In the following, a process for creating a primary search result and a process for removing unnecessary net moving images will be described in order.

(一次検索結果を作成する処理について)
推薦部250は、各検索対象インデックスと検索条件インデックスとの類似度を算出し、算出した類似度に基づいて一次検索結果を作成する。なお、ベクトル同士の類似度は、ベクトル間の内積(あるいは角度、相関係数)で表される。
(About processing to create primary search results)
The recommendation unit 250 calculates the similarity between each search target index and the search condition index, and creates a primary search result based on the calculated similarity. Note that the similarity between vectors is represented by an inner product (or angle, correlation coefficient) between the vectors.

推薦部250は、各検索対象インデックスと検索条件インデックスとの内積を算出し、算出した内積の値が第1の規定値以上となる検索対象インデックスと検索条件インデックスとの組を抽出する(実施例1と同様に、抽出した組に含まれる検索対象インデックスを、検索結果候補インデックスと表記する。)。そして、検索結果候補インデックスに対応する各種情報(コンテンツ識別番号、配信日時、配信元、配信長、ジャンル、タイトル、説明)を一次検索結果に登録する。   The recommendation unit 250 calculates the inner product of each search target index and the search condition index, and extracts a set of the search target index and the search condition index whose calculated inner product value is equal to or greater than the first specified value (Example) Similarly to 1, the search target index included in the extracted set is referred to as a search result candidate index. Various information (content identification number, delivery date, delivery source, delivery length, genre, title, description) corresponding to the search result candidate index is registered in the primary search result.

(不要なネット動画を取り除く処理について)
推薦部250は、検索結果候補インデックスと操作履歴インデックスとを基にして、不要なエントリを一次検索結果から除外する。一次検索結果から不要なエントリが除外されたものが、最終的な検索結果となる。推薦部250は、まず、検索結果候補インデックスと操作履歴インデックスとの内積を算出する。
(About the process of removing unnecessary internet video)
The recommendation unit 250 excludes unnecessary entries from the primary search result based on the search result candidate index and the operation history index. A final search result is obtained by removing unnecessary entries from the primary search result. The recommendation unit 250 first calculates the inner product of the search result candidate index and the operation history index.

そして、推薦部250は、算出した内積と、第2の規定値とを比較して、内積が第2の規定値以上となる検索結果候補インデックスと操作履歴インデックスとの組(以下、第1の組)を抽出する。第1の組に含まれる検索結果候補インデックスのネット動画は、対となる操作履歴インデックスのネット動画と同じネット動画である疑いが極めて高いものとなる。   Then, the recommendation unit 250 compares the calculated inner product with the second specified value, and sets the search result candidate index and the operation history index (hereinafter referred to as the first history index) that the inner product is equal to or greater than the second specified value. Group). The net moving image of the search result candidate index included in the first set is extremely likely to be the same net moving image as the net moving image of the paired operation history index.

推薦部250は、第1の組に含まれる各インデックスに対応するネット動画の配信長に基づいて、第1の組に含まれる検索結果候補インデックスが、ユーザにとって不要なネット動画のインデックスであるか否かを判定する。   The recommendation unit 250 determines whether the search result candidate index included in the first set is an index of the net moving image unnecessary for the user based on the distribution length of the net moving image corresponding to each index included in the first set. Determine whether or not.

具体的に、推薦部250は、第1の組において、検索結果候補インデックスに対応するネット動画の配信長と、操作履歴インデックスに対応するネット動画の配信長とを比較する。そして、各配信長の差が第4の規定値以内となる場合には、かかる第1の組における検索結果候補インデックスのネット動画は、ユーザが既に操作したネット動画(操作履歴データのネット動画)と同じネット動画であると判定する。   Specifically, the recommendation unit 250 compares the distribution length of the net moving image corresponding to the search result candidate index with the distribution length of the net moving image corresponding to the operation history index in the first set. If the difference between the distribution lengths is within the fourth specified value, the net video of the search result candidate index in the first set is the net video already operated by the user (net video of the operation history data). It is determined that it is the same online video.

推薦部250は、同じネット動画であると判定したネット動画の検索結果候補インデックスに対応するエントリを一次検索結果から除外すると共に、除外したエントリを除外データに登録する。図14は、本実施例2にかかる除外データのデータ構造の一例を示す図である。同図に示すように、この除外データは、一次検索結果から除外されたネット動画のコンテンツ識別番号と、配信日時と、配信元と、配信長と、ジャンルと、タイトルと、説明とを有する。   The recommendation unit 250 excludes the entry corresponding to the search result candidate index of the net moving image determined to be the same net moving image from the primary search result, and registers the excluded entry in the excluded data. FIG. 14 is a diagram illustrating an example of the data structure of the exclusion data according to the second embodiment. As shown in the figure, this exclusion data includes a content identification number, distribution date, distribution source, distribution length, genre, title, and description of the net moving image excluded from the primary search result.

続いて、推薦部250は、検索結果候補インデックス(ユーザが既に操作したネット動画と同じネット動画であると判定されたネット動画の検索結果候補インデックスを除く)同士の内積を算出し、算出した内積が第2の閾値以上となる検索結果候補インデックスの組(以下、第2の組)を抽出する。   Subsequently, the recommendation unit 250 calculates the inner product between the search result candidate indexes (excluding the search result candidate index of the net moving image determined to be the same net moving image as the net moving image already operated by the user), and calculates the calculated inner product. A set of search result candidate indexes (hereinafter referred to as the second set) in which is equal to or greater than the second threshold is extracted.

推薦部250は、第2の組に含まれる各インデックスに対応するネット動画の配信長に基づいて、第2の組に含まれる検索結果候補インデックスが、ユーザにとって不要なネット動画のインデックスであるか否かを判定する。   The recommendation unit 250 determines whether the search result candidate index included in the second set is an index of the net moving image unnecessary for the user based on the distribution length of the net moving image corresponding to each index included in the second set. Determine whether or not.

具体的に、推薦部250は、第2の組において、一方の検索結果候補インデックスに対応するネット動画の配信長と、もう一方の検索結果候補インデックスに対応するネット動画の配信長とを比較する。各配信長の差が第4の規定値以内となる場合には、かかる第2の組における一方の検索結果候補インデックスのネット動画が、もう一方の検索結果候補インデックスのネット動画と同じネット動画であると判定する。   Specifically, in the second set, the recommendation unit 250 compares the distribution length of the net video corresponding to one search result candidate index with the distribution length of the net video corresponding to the other search result candidate index. . When the difference between the distribution lengths is within the fourth specified value, the net video of one search result candidate index in the second set is the same net video as the net video of the other search result candidate index. Judge that there is.

推薦部250は、同じネット動画であると判定したネット動画の検索結果候補インデックスを含む第2の組中で、どちらか一方の検索結果候補インデックスを選択する。そして、選択した検索結果候補インデックスに対応するエントリを一次検索結果から除外すると共に、除外したエントリを除外データ(図14参照)に登録する。また、推薦部250は、作成した除外データを除外履歴記録部260に記録する。   The recommendation unit 250 selects one of the search result candidate indexes in the second set including the search result candidate index of the net moving image determined to be the same net moving image. Then, the entry corresponding to the selected search result candidate index is excluded from the primary search result, and the excluded entry is registered in the exclusion data (see FIG. 14). The recommendation unit 250 records the created exclusion data in the exclusion history recording unit 260.

ところで、推薦部250は、検索結果インデックスと操作履歴インデックスとの内積を算出し、算出した内積と、第2の規定値と第3の規定値(ただし、第2の規定値>第3の規定値)とを比較する。そして、内積が第3の規定値以上、第2の規定値未満となる検索結果候補インデックスと操作履歴インデックスとの組(以下、第3の組)を抽出する。第3の組に含まれる検索結果候補インデックスのネット動画は、対となる操作履歴インデックスのネット動画と同じネット動画となる疑いのあるものとなる。   Incidentally, the recommendation unit 250 calculates the inner product of the search result index and the operation history index, and calculates the inner product, the second specified value, and the third specified value (where the second specified value> the third specified value). Value). Then, a set of search result candidate indexes and operation history indexes (hereinafter referred to as a third set) in which the inner product is not less than the third specified value and less than the second specified value is extracted. The net moving image of the search result candidate index included in the third set is suspected to be the same net moving image as the net moving image of the paired operation history index.

推薦部250は、第3の組に含まれる各インデックスに対応するネット動画の配信長に基づいて、第3の組に組まれる検索結果候補インデックスが、ユーザにとって不要なネット動画のインデックスである可能性があるか否かを判定する。   Based on the distribution length of the net video corresponding to each index included in the third set, the recommendation unit 250 may search the candidate search result index included in the third set as an index of net video unnecessary for the user. It is determined whether there is sex.

具体的に、推薦部250は、第3の組において、検索結果候補インデックスに対応するネット動画の配信長と、操作履歴インデックスに対応する配信長とを比較する。そして、各配信長の差が第4の規定値以内となる場合には、かかる第3の組における検索結果候補インデックスのネット動画は、ユーザが既に操作したネット動画(操作履歴データのネット動画)と同じネット動画である可能性が高いと判定する。   Specifically, the recommendation unit 250 compares the distribution length of the net moving image corresponding to the search result candidate index with the distribution length corresponding to the operation history index in the third set. When the difference between the distribution lengths is within the fourth specified value, the net video of the search result candidate index in the third set is the net video already operated by the user (net video of the operation history data). It is determined that there is a high possibility that it is the same online video.

推薦部250は、同じネット動画である可能性が高いと判定したネット動画の検索結果候補インデックスの各種情報(コンテンツ識別番号、配信日時、配信元、配信長、ジャンル、タイトル、説明)を、除外候補データに登録する。推薦部250は、作成した除外候補データを除外履歴記録部260に記録する。   The recommendation unit 250 excludes various types of information (content identification number, distribution date / time, distribution source, distribution length, genre, title, description) of the search result candidate index of the net video that is determined to be highly likely to be the same net video. Register as candidate data. The recommendation unit 250 records the created exclusion candidate data in the exclusion history recording unit 260.

推薦部250は、一次検索結果から不要なネット動画を取り除いた残りのネット動画のエントリを検索結果データとして、表示部280および検索結果記録部290に出力する。図15は、本実施例2にかかる検索結果データのデータ構造の一例を示す図である。   The recommendation unit 250 outputs the remaining net moving image entries obtained by removing unnecessary net moving images from the primary search result to the display unit 280 and the search result recording unit 290 as search result data. FIG. 15 is a diagram illustrating an example of a data structure of search result data according to the second embodiment.

図15に示すように、この検索結果データは、検索順位、コンテンツ識別番号、配信日時、配信元、配信長、ジャンル、タイトル、説明を有する。推薦部250は、例えば、検索対象インデックスと検索条件インデックスとの類似度が高いエントリほど検索順位を小さく設定して、検索結果データのエントリを並び替えてもよい。   As shown in FIG. 15, this search result data includes a search order, a content identification number, a delivery date, a delivery source, a delivery length, a genre, a title, and a description. For example, the recommendation unit 250 may rearrange the entries of the search result data by setting a lower search order for an entry having a higher similarity between the search target index and the search condition index.

除外履歴記録部260は、除外データおよび除外候補データを記憶する手段である。除外履歴記録部260は、除外データあるいは除外候補データに登録されるエントリの数が規定数に達した場合や、記録してからの期間が規定期間よりも長くなったエントリを除外データ、除外候補データから削除してもよい。   The exclusion history recording unit 260 is means for storing exclusion data and exclusion candidate data. The exclusion history recording unit 260 excludes entries whose exclusion data or exclusion candidate data has reached the specified number, or entries whose recording period has become longer than the specified period. It may be deleted from the data.

除外条件調整部270は、除外履歴記録部260に記録された除外データおよび除外候補データと、操作履歴記録部220に記録された操作履歴データとを比較して、推薦部250が利用する第2の規定値および第3の規定値を調整する手段である。除外条件調整部270の具体的な処理の内容は、実施例1に示した除外条件調整部170と同じであるため、説明を省略する。   The exclusion condition adjustment unit 270 compares the exclusion data and the exclusion candidate data recorded in the exclusion history recording unit 260 with the operation history data recorded in the operation history recording unit 220, and uses the second data used by the recommendation unit 250. Means for adjusting the specified value and the third specified value. Since the specific processing content of the exclusion condition adjustment unit 270 is the same as that of the exclusion condition adjustment unit 170 shown in the first embodiment, the description thereof is omitted.

表示部280は、検索結果データ(図15参照)をディスプレイ等の画面に表示する手段である。ユーザは、かかる画面を参照して、ネット動画の録画などを設定する。検索結果記録部290は、検索結果データを保管する手段である。ユーザは、検索結果記録部290に記録された検索結果データの参照や、検索結果データのうち、保存したいエントリを指定する。   The display unit 280 is means for displaying the search result data (see FIG. 15) on a screen such as a display. The user refers to such a screen and sets recording of a net moving image. The search result recording unit 290 is means for storing search result data. The user refers to the search result data recorded in the search result recording unit 290 and designates an entry to be saved among the search result data.

次に、本実施例2にかかる情報検索装置200の処理手順について説明する。図16は、本実施例2にかかる推薦部250が検索結果データを作成する処理を示すフローチャートである。   Next, a processing procedure of the information search apparatus 200 according to the second embodiment will be described. FIG. 16 is a flowchart of a process in which the recommendation unit 250 according to the second embodiment creates search result data.

図16に示すように、推薦部250は、iの値を0に設定し(ステップS501)、検索結果候補インデックス(M個)を取得する(ステップS502)。そして、iの値がMの値よりも小さいか否かを判定し、iの値がMの値以上である場合には(ステップS503,No)、処理を終了する。   As illustrated in FIG. 16, the recommendation unit 250 sets the value of i to 0 (step S501), and acquires search result candidate indexes (M) (step S502). Then, it is determined whether or not the value of i is smaller than the value of M. If the value of i is equal to or greater than the value of M (step S503, No), the process ends.

一方、iの値がMの値よりも小さい場合には(ステップS503,Yes)、jの値を0に設定し(ステップS504)、操作履歴インデックス(N個)を取得する(ステップS505)。そして、jの値がNの値よりも小さいか否かを判定し、jの値がNの値以上である場合には(ステップS506,No)、ステップS503に移行する。   On the other hand, when the value of i is smaller than the value of M (step S503, Yes), the value of j is set to 0 (step S504), and the operation history index (N pieces) is acquired (step S505). Then, it is determined whether or not the value of j is smaller than the value of N. If the value of j is greater than or equal to the value of N (step S506, No), the process proceeds to step S503.

一方、jの値がNの値よりも小さい場合には(ステップS506,Yes)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との類似度を算出し(ステップS507)、類似度が第2の規定値以上であるか否かを判定する(ステップS508)。   On the other hand, when the value of j is smaller than the value of N (step S506, Yes), the similarity between the search result candidate index (i-th) and the operation history index (j-th) is calculated (step S507). It is determined whether or not the similarity is greater than or equal to a second specified value (step S508).

類似度が第2の規定値未満である場合には(ステップS509,No)、ステップS512に移行する。一方、類似度が第2の規定値以上である場合には(ステップS509,Yes)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との配信長の差が第4の規定値以内か否かを判定する(ステップS510)。   When the similarity is less than the second specified value (No at Step S509), the process proceeds to Step S512. On the other hand, when the degree of similarity is equal to or greater than the second specified value (step S509, Yes), the difference in distribution length between the search result candidate index (i-th) and the operation history index (j-th) is the fourth specified value. It is determined whether it is within the value (step S510).

配信長の差が第4の規定値外の場合は(ステップS511,No)、jの値に1を加算した値を新たなjの値とし(ステップS512)、ステップS506に移行する。一方、配信長の差が第4の規定値以内の場合は(ステップS511,Yes)、一次検索結果から、検索結果候補インデックス(i番目)に対応するネット動画のエントリを除外し(ステップS513)、ステップS503に移行する。   If the difference in delivery length is outside the fourth specified value (step S511, No), a value obtained by adding 1 to the value of j is set as a new value of j (step S512), and the process proceeds to step S506. On the other hand, if the difference in distribution length is within the fourth specified value (step S511, Yes), the entry of the net video corresponding to the search result candidate index (i-th) is excluded from the primary search result (step S513). The process proceeds to step S503.

上述してきたように、本実施例2にかかる情報検索装置200は、推薦部250が、検索結果候補インデックスと操作履歴インデックスとの内積を算出して、第2の規定値と比較した後に、ネット動画の配信長に基づいて、一次検索結果から不要なデータを除外しているので、ユーザのニーズにあった検索結果を作成することができる。   As described above, in the information search apparatus 200 according to the second embodiment, the recommendation unit 250 calculates the inner product of the search result candidate index and the operation history index and compares it with the second specified value. Since unnecessary data is excluded from the primary search result based on the distribution length of the moving image, it is possible to create a search result that meets the user's needs.

上記の実施例1では、番組の放送開始日、放送開始時間に基づいて、一次検索結果から不要な番組のエントリを除外していたが、これに限定されるものではない。例えば、検索対象がネット上で配信されるニュースである場合には、ニュースの配信日時を基にして、一次検索結果から不要なニュースの情報を除外することができる。本実施例3では、ニュースの配信日時を基にして、一次検索結果から不要なニュースの情報を除外する情報検索装置300について説明を行う。   In the first embodiment, unnecessary program entries are excluded from the primary search result based on the broadcast start date and broadcast start time of the program. However, the present invention is not limited to this. For example, when the search target is news distributed on the net, unnecessary news information can be excluded from the primary search result based on the distribution date of news. In the third embodiment, an information search apparatus 300 that excludes unnecessary news information from the primary search result based on the distribution date of news will be described.

図17は、本実施例3にかかる情報検索装置300の構成を示す機能ブロック図である。同図に示すように、この情報検索装置300は、メタデータ取得部310と、操作履歴記録部320と、嗜好情報設定部330と、インデックス作成部340と、推薦部350と、除外履歴記録部360と、除外条件調整部370と、表示部380と、検索結果記録部390とを有する。なお、この情報検索装置300は、ネットワークに接続される通信装置や、放送波を受信する受信装置を備えているものとする(図示略)。   FIG. 17 is a functional block diagram of the configuration of the information search apparatus 300 according to the third embodiment. As shown in the figure, the information search apparatus 300 includes a metadata acquisition unit 310, an operation history recording unit 320, a preference information setting unit 330, an index creation unit 340, a recommendation unit 350, and an exclusion history recording unit. 360, an exclusion condition adjustment unit 370, a display unit 380, and a search result recording unit 390. The information search device 300 includes a communication device connected to a network and a receiving device that receives broadcast waves (not shown).

メタデータ取得部310は、ニュースのメタデータを、ニュースの配信元から取得する手段である。ニュースのメタデータは、ニュースの配信開始日時、配信元、ジャンル、タイトル、説明、配信期限などを有する。   The metadata acquisition unit 310 is means for acquiring news metadata from a news distribution source. News metadata includes news delivery start date and time, delivery source, genre, title, description, delivery deadline, and the like.

操作履歴記録部320は、ユーザがニュース動画に対して行った各種の操作内容(使用、再生、閲覧、録画、自動再生、保存など)を、操作履歴データとして記録する手段である。図18は、本実施例3にかかる操作履歴データのデータ構造の一例を示す図である。同図に示すように、この操作履歴データは、ニュースを識別するコンテンツ識別番号と、操作日時と、操作と、配信日時と、配信元と、ジャンルと、タイトルと、説明とを有する。   The operation history recording unit 320 is a means for recording various operation contents (use, reproduction, browsing, recording, automatic reproduction, saving, etc.) performed on the news video by the user as operation history data. FIG. 18 is a diagram illustrating an example of the data structure of the operation history data according to the third embodiment. As shown in the figure, the operation history data includes a content identification number for identifying news, an operation date / time, an operation, a distribution date / time, a distribution source, a genre, a title, and a description.

嗜好情報設定部330は、ユーザの好みのニュースを検索するための検索条件を設定する手段である。嗜好情報設定部330は、入力装置(図示略)を介してユーザからキーワードを取得し、取得した各キーワードを検索条件として設定してもよいし、操作履歴記録部320に記録された操作履歴データに含まれるテキストを取得して、検索条件に設定してもよい。   The preference information setting unit 330 is a means for setting search conditions for searching for user-favorite news. The preference information setting unit 330 may acquire keywords from the user via an input device (not shown), set each acquired keyword as a search condition, or operation history data recorded in the operation history recording unit 320 May be acquired and set as a search condition.

インデックス作成部340は、メタデータ取得部310のメタデータ(検索対象)のインデックス(以下、検索対象インデックス)、操作履歴記録部320の操作履歴データのインデックス(以下、操作履歴インデックス)、嗜好情報設定部330の検索条件のインデックス(以下、検索条件インデックス)をそれぞれ作成する手段である。インデックス作成部340は、作成した検索対象インデックス、操作履歴インデックス、検索条件インデックスの情報を推薦部350に出力する。なお、インデックスの作成方法は、実施例1と同様であるため、説明を省略する。   The index creation unit 340 includes metadata (search target) index (hereinafter referred to as search target index) of the metadata acquisition unit 310, operation history data index (hereinafter referred to as operation history index) of the operation history recording unit 320, and preference information setting. This is a means for creating a search condition index (hereinafter referred to as a search condition index) of the unit 330. The index creation unit 340 outputs information about the created search target index, operation history index, and search condition index to the recommendation unit 350. The index creation method is the same as that in the first embodiment, and a description thereof will be omitted.

推薦部350は、インデックス作成部340からインデックス(検索対象インデックス、操作履歴インデックス、検索条件インデックス)の情報を取得し、取得したインデックスに基づいて、ユーザに推奨するニュースの検索結果を作成する手段である。推薦部350は、検索結果の候補となる一次検索結果を作成する処理、一次検索結果から不要なニュースを取り除く処理を順に実行する。以下において、一次検索結果を作成する処理、不要なニュースを取り除く処理について順に説明する。   The recommendation unit 350 is a means for acquiring index information (search target index, operation history index, search condition index) from the index generation unit 340 and generating search results of news recommended to the user based on the acquired index. is there. The recommendation unit 350 sequentially executes a process for creating a primary search result as a search result candidate and a process for removing unnecessary news from the primary search result. In the following, a process for creating a primary search result and a process for removing unnecessary news will be described in order.

(一次検索結果を作成する処理について)
推薦部350は、各検索対象インデックスと検索条件インデックスとの類似度を算出し、算出した類似度に基づいて一次検索結果を作成する。なお、ベクトル同士の類似度は、ベクトル間の内積(あるいは角度、相関係数)で表される。
(About processing to create primary search results)
The recommendation unit 350 calculates the similarity between each search target index and the search condition index, and creates a primary search result based on the calculated similarity. Note that the similarity between vectors is represented by an inner product (or angle, correlation coefficient) between the vectors.

推薦部350は、各検索対象インデックスと検索条件インデックスとの内積を算出し、算出した内積の値が第1の規定値以上となる検索対象インデックスと検索条件インデックスとの組を抽出する(実施例1と同様に、抽出した組に含まれる検索対象インデックスを、検索結果候補インデックスと表記する。)。そして、検索結果候補インデックスに対応する各種情報(コンテンツ識別番号、配信日時、配信元、ジャンル、タイトル、説明)を一次検索結果に登録する。   The recommendation unit 350 calculates the inner product of each search target index and the search condition index, and extracts a set of the search target index and the search condition index whose calculated inner product value is equal to or greater than the first specified value (Example) Similarly to 1, the search target index included in the extracted set is referred to as a search result candidate index. Then, various information (content identification number, delivery date, delivery source, genre, title, description) corresponding to the search result candidate index is registered in the primary search result.

(不要なニュースを取り除く処理について)
推薦部350は、検索結果候補インデックスと操作履歴インデックスとを基にして、不要なエントリを一次検索結果から除外する。一次検索結果から不要なエントリが除外されたものが、最終的な検索結果となる。推薦部350は、まず、検索結果候補インデックスと操作履歴インデックスとの内積を算出する。
(About processing to remove unnecessary news)
The recommendation unit 350 excludes unnecessary entries from the primary search result based on the search result candidate index and the operation history index. A final search result is obtained by removing unnecessary entries from the primary search result. The recommendation unit 350 first calculates the inner product of the search result candidate index and the operation history index.

そして、推薦部350は、算出した内積と、第2の規定値とを比較して、内積が第2の規定値以上となる検索結果候補インデックスと操作履歴インデックスとの組(以下、第1の組)を抽出する。第1の組に含まれる検索結果候補インデックスのニュースは、対となる操作履歴インデックスのニュースと同じものである疑いが極めて高い。   Then, the recommendation unit 350 compares the calculated inner product with the second specified value, and sets the search result candidate index and the operation history index (hereinafter referred to as the first history index) that the inner product is equal to or greater than the second specified value. Group). The news of the search result candidate index included in the first group is very likely to be the same as the news of the paired operation history index.

推薦部350は、第1の組に含まれる各インデックスに対応するニュースの配信日時に基づいて、第1の組に含まれる検索結果候補インデックスが、ユーザにとって不要なニュースのインデックスであるか否かを判定する。   The recommendation unit 350 determines whether or not the search result candidate index included in the first group is an index of news unnecessary for the user based on the distribution date and time of the news corresponding to each index included in the first group. Determine.

具体的に、推薦部350は、第1の組において、検索結果候補インデックスに対応するニュースの配信日時と、操作履歴インデックスに対応するニュースの配信日時とを比較する。そして、各配信日時の差が第5の規定値以内となる場合には、かかる第1の組における検索結果候補インデックスのニュースは、ユーザが既に操作したニュース(操作履歴データのニュース)と同じニュースであると判定する。   Specifically, in the first set, the recommendation unit 350 compares the news delivery date corresponding to the search result candidate index with the news delivery date corresponding to the operation history index. When the difference between the delivery dates and times is within the fifth specified value, the news of the search result candidate index in the first set is the same as the news already operated by the user (news of operation history data). It is determined that

推薦部350は、同じニュースであると判定したニュースの検索結果候補インデックスに対応するエントリを一次検索結果から除外すると共に、除外したエントリを除外データに登録する。図19は、本実施例3にかかる除外データのデータ構造の一例を示す図である。同図に示すように、この除外データは、一次検索結果から除外されたニュースのコンテンツ識別番号と、配信日時と、配信元と、ジャンルと、タイトルと、説明とを有する。   The recommendation unit 350 excludes the entry corresponding to the search result candidate index of the news determined to be the same news from the primary search result, and registers the excluded entry in the exclusion data. FIG. 19 is a diagram illustrating an example of the data structure of the exclusion data according to the third embodiment. As shown in the figure, this exclusion data includes the content identification number of the news excluded from the primary search result, the distribution date and time, the distribution source, the genre, the title, and the description.

続いて、推薦部350は、検索結果候補インデックス(ユーザが既に操作したニュースと同じニュースであると判定されたニュースの検索結果候補インデックスを除く)同士の内積を算出し、算出した内積が第2の閾値以上となる検索結果候補インデックスの組(以下、第2の組)を抽出する。   Subsequently, the recommendation unit 350 calculates the inner product between the search result candidate indexes (excluding the search result candidate index of the news determined to be the same news as the news that the user has already operated), and the calculated inner product is the second A set of search result candidate indexes (hereinafter referred to as a second set) that is equal to or greater than the threshold is extracted.

推薦部350は、第2の組に含まれる各インデックスに対応するニュースの配信日時に基づいて、第2の組に含まれる検索結果候補インデックスが、ユーザにとって不要なニュースのインデックスであるか否かを判定する。   The recommendation unit 350 determines whether or not the search result candidate index included in the second set is an index of news unnecessary for the user based on the distribution date and time of the news corresponding to each index included in the second set. Determine.

具体的に、推薦部350は、第2の組において、一方の検索結果候補インデックスに対応するニュースの配信日時と、もう一方の検索結果候補インデックスに対応するニュースの配信日時とを比較する。各配信日時の差が第5の規定値以内となる場合には、かかる第2の組における一方の検索結果候補インデックスのニュースが、もう一方の検索結果候補インデックスのニュースと同じニュースであると判定する。   Specifically, in the second set, the recommendation unit 350 compares the news delivery date corresponding to one search result candidate index with the news delivery date corresponding to the other search result candidate index. When the difference between the delivery dates is within the fifth specified value, it is determined that the news of one search result candidate index in the second set is the same news as the news of the other search result candidate index To do.

推薦部350は、同じニュースであると判定したニュースの検索結果候補インデックスを含む第2の組中で、どちらか一方の検索結果候補インデックスを選択する。そして、選択した検索結果候補インデックスに対応するエントリを一次検索結果から除外すると共に、除外したエントリを除外データ(図19参照)に登録する。また、推薦部350は、作成した除外データを除外履歴記録部360に記録する。   The recommendation unit 350 selects one of the search result candidate indexes in the second set including the search result candidate index of the news determined to be the same news. Then, the entry corresponding to the selected search result candidate index is excluded from the primary search result, and the excluded entry is registered in the exclusion data (see FIG. 19). Further, the recommendation unit 350 records the created exclusion data in the exclusion history recording unit 360.

ところで、推薦部350は、検索結果インデックスと操作履歴インデックスとの内積を算出し、算出した内積と、第2の規定値と第3の規定値(ただし、第2の規定値>第3の規定値)とを比較する。そして、内積が第3の規定値以上、第2の規定値未満となる検索結果候補インデックスと操作履歴インデックスとの組(以下、第3の組)を抽出する。第3の組に含まれる検索結果候補インデックスのニュースは、対となる操作履歴インデックスのニュースと同じニュースとなる疑いのあるものとなる。   Incidentally, the recommendation unit 350 calculates the inner product of the search result index and the operation history index, and calculates the inner product, the second specified value, and the third specified value (where the second specified value> the third specified value). Value). Then, a set of search result candidate indexes and operation history indexes (hereinafter referred to as a third set) in which the inner product is not less than the third specified value and less than the second specified value is extracted. The news of the search result candidate index included in the third group is suspected to be the same news as the news of the paired operation history index.

推薦部350は、第3の組に含まれる各インデックスに対応するニュースの配信日時に基づいて、第3の組に組まれる検索結果候補インデックスが、ユーザにとって不要なニュースのインデックスである可能性があるか否かを判定する。   The recommendation unit 350 may determine that the search result candidate index included in the third group is an index of news unnecessary for the user based on the distribution date and time of the news corresponding to each index included in the third group. It is determined whether or not there is.

具体的に、推薦部350は、第3の組において、検索結果候補インデックスに対応するニュースの配信日時と、操作履歴インデックスに対応する配信日時とを比較する。そして、各配信日時の差が第5の規定値以内となる場合には、かかる第3の組における検索結果候補インデックスのニュースは、ユーザが既に操作したニュース(操作履歴データのニュース)と同じニュースである可能性が高いと判定する。   Specifically, the recommendation unit 350 compares the distribution date and time of news corresponding to the search result candidate index with the distribution date and time corresponding to the operation history index in the third group. When the difference between the delivery dates and times is within the fifth specified value, the news of the search result candidate index in the third set is the same as the news already operated by the user (news of operation history data). It is determined that there is a high possibility.

推薦部350は、同じニュースである可能性が高いと判定したニュースの検索結果候補インデックスの各種情報(コンテンツ識別番号、配信日時、配信元、ジャンル、タイトル、説明)を、除外候補データに登録する。推薦部350は、作成した除外候補データを除外履歴記録部360に記録する。   The recommendation unit 350 registers various information (content identification number, distribution date, distribution source, genre, title, description) of the news search result candidate index determined to be highly likely to be the same news in the exclusion candidate data. . The recommendation unit 350 records the created exclusion candidate data in the exclusion history recording unit 360.

推薦部350は、一次検索結果から不要なニュースを取り除いた残りのニュースのエントリを検索結果データとして、表示部380および検索結果記録部390に出力する。図20は、本実施例3にかかる検索結果データのデータ構造の一例を示す図である。   The recommendation unit 350 outputs the remaining news entries obtained by removing unnecessary news from the primary search result to the display unit 380 and the search result recording unit 390 as search result data. FIG. 20 is a diagram illustrating an example of a data structure of search result data according to the third embodiment.

図20に示すように、この検索結果データは、検索順位、コンテンツ識別番号、配信日時、配信元、ジャンル、タイトル、説明を有する。推薦部350は、例えば、検索対象インデックスと検索条件インデックスとの類似度が高いエントリほど検索順位を小さく設定して、検索結果データのエントリを並び替えてもよい。   As shown in FIG. 20, the search result data includes a search order, a content identification number, a delivery date / time, a delivery source, a genre, a title, and a description. For example, the recommendation unit 350 may rearrange the entries of the search result data by setting a lower search order for an entry having a higher similarity between the search target index and the search condition index.

除外履歴記録部360は、除外データおよび除外候補データを記憶する手段である。除外履歴記録部360は、除外データあるいは除外候補データに登録されるエントリの数が規定数に達した場合や、記録してからの期間が規定期間よりも長くなったエントリを除外データ、除外候補データから削除してもよい。   The exclusion history recording unit 360 is means for storing exclusion data and exclusion candidate data. The exclusion history recording unit 360 excludes the entry whose exclusion data or exclusion candidate data has reached the specified number or the entry whose recording period is longer than the specified period from the exclusion data and the exclusion candidate. It may be deleted from the data.

除外条件調整部370は、除外履歴記録部360に記録された除外データおよび除外候補データと、操作履歴記録部320に記録された操作履歴データとを比較して、推薦部350が利用する第2の規定値および第3の規定値を調整する手段である。除外条件調整部370の具体的な処理の内容は、実施例1に示した除外条件調整部170と同じであるため、説明を省略する。   The exclusion condition adjustment unit 370 compares the exclusion data and exclusion candidate data recorded in the exclusion history recording unit 360 with the operation history data recorded in the operation history recording unit 320, and uses the second data used by the recommendation unit 350. Means for adjusting the specified value and the third specified value. Since the specific processing contents of the exclusion condition adjustment unit 370 are the same as those of the exclusion condition adjustment unit 170 shown in the first embodiment, the description thereof is omitted.

表示部380は、検索結果データ(図20参照)をディスプレイ等の画面に表示する手段である。ユーザは、かかる画面を参照して、ニュースの録画などを設定する。検索結果記録部390は、検索結果データを保管する手段である。ユーザは、検索結果記録部390に記録された検索結果データの参照や、検索結果データのうち、保存したいエントリを指定する。   The display unit 380 is means for displaying the search result data (see FIG. 20) on a screen such as a display. The user refers to this screen and sets news recording or the like. The search result recording unit 390 is means for storing search result data. The user refers to the search result data recorded in the search result recording unit 390, and specifies an entry to be saved among the search result data.

次に、本実施例3にかかる情報検索装置300の処理手順について説明する。図21は、本実施例3にかかる推薦部350が検索結果データを作成する処理を示すフローチャートである。   Next, a processing procedure of the information search apparatus 300 according to the third embodiment will be described. FIG. 21 is a flowchart of the process in which the recommendation unit 350 according to the third embodiment creates search result data.

図21に示すように、推薦部350は、iの値を0に設定し(ステップS601)、検索結果候補インデックス(M個)を取得する(ステップS602)。そして、iの値がMの値よりも小さいか否かを判定し、iの値がMの値以上である場合には(ステップS603,No)、処理を終了する。   As shown in FIG. 21, the recommendation unit 350 sets the value of i to 0 (step S601) and acquires search result candidate indexes (M) (step S602). Then, it is determined whether or not the value of i is smaller than the value of M. If the value of i is equal to or greater than the value of M (step S603, No), the process ends.

一方、iの値がMの値よりも小さい場合には(ステップS603,Yes)、jの値を0に設定し(ステップS604)、操作履歴インデックス(N個)を取得する(ステップS605)。そして、jの値がNのあたいよりも小さいか否かを判定し、jの値がNの値以上である場合には(ステップS606,No)、ステップS603に移行する。   On the other hand, when the value of i is smaller than the value of M (step S603, Yes), the value of j is set to 0 (step S604), and the operation history index (N pieces) is acquired (step S605). Then, it is determined whether or not the value of j is smaller than N. If the value of j is equal to or greater than the value of N (step S606, No), the process proceeds to step S603.

一方、jの値がNの値よりも小さい場合には(ステップS606,Yes)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との類似度を算出し(ステップS607)、類似度が第2の規定値以上であるか否かを判定する(ステップS608)。   On the other hand, when the value of j is smaller than the value of N (step S606, Yes), the similarity between the search result candidate index (i-th) and the operation history index (j-th) is calculated (step S607). It is determined whether or not the similarity is greater than or equal to a second specified value (step S608).

類似度が第2の規定値未満である場合には(ステップS609,No)、ステップS612に移行する。一方、類似度が第2の規定値以上である場合には(ステップS609,Yes)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との配信日時の差が第5の規定値以内か否かを判定する(ステップS610)。   When the similarity is less than the second specified value (No at Step S609), the process proceeds to Step S612. On the other hand, if the similarity is equal to or greater than the second specified value (step S609, Yes), the difference in delivery date and time between the search result candidate index (i-th) and the operation history index (j-th) is the fifth specified value. It is determined whether the value is within the range (step S610).

配信日時の差が第5の規定値外の場合には(ステップS611,No)、jの値に1を加算した値を新たなjの値とし(ステップS612)、ステップS606に移行する。一方、配信日時の差が第5の規定値以内の場合は(ステップS611,Yes)、一次検索結果から、検索結果候補インデックス(i番目)に対応するニュースのエントリを除外し(ステップS613)、ステップS603に移行する。   If the difference in delivery date / time is outside the fifth specified value (step S611, No), a value obtained by adding 1 to the value of j is set as a new value of j (step S612), and the process proceeds to step S606. On the other hand, if the difference in distribution date and time is within the fifth specified value (step S611, Yes), the news entry corresponding to the search result candidate index (i-th) is excluded from the primary search result (step S613), The process proceeds to step S603.

上述してきたように、本実施例3にかかる情報検索装置300は、推薦部350が、検索結果候補インデックスと操作履歴インデックスとの内積を算出して、第2の規定値と比較した後に、ニュースの配信日時に基づいて、一次検索結果から不要なデータを除外しているので、ユーザのニーズに合った検索結果を作成することができる。   As described above, in the information search apparatus 300 according to the third embodiment, after the recommendation unit 350 calculates the inner product of the search result candidate index and the operation history index and compares it with the second specified value, Since unnecessary data is excluded from the primary search result based on the distribution date and time, a search result that meets the user's needs can be created.

ところで、本実施例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部あるいは一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。   By the way, among the processes described in the present embodiment, all or a part of the processes described as being automatically performed can be manually performed, or the processes described as being performed manually can be performed. All or a part can be automatically performed by a known method. In addition, the processing procedure, control procedure, specific name, and information including various data and parameters shown in the above-described document and drawings can be arbitrarily changed unless otherwise specified.

また、図1、図12、図17に示した情報検索装置100,200,300の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部または任意の一部がCPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。   Each component of the information search apparatuses 100, 200, and 300 shown in FIGS. 1, 12, and 17 is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution / integration of each device is not limited to that shown in the figure, and all or a part thereof may be functionally or physically distributed or arbitrarily distributed in arbitrary units according to various loads or usage conditions. Can be integrated and configured. Furthermore, each processing function performed by each device may be realized by a CPU and a program that is analyzed and executed by the CPU, or may be realized as hardware by wired logic.

図22は、実施例1〜3にかかる情報検索装置100,200,300を構成するコンピュータ400のハードウェア構成を示す図である。図22に示すように、このコンピュータ(情報検索装置)400は、入力装置410、出力装置420、RAM(Random Access Memory)430、ROM(Read Only Memory)440、記憶媒体からデータを読み取る媒体読取装置450、他の装置との間でデータの送受信を行う通信装置460、CPU(Central Processing Unit)470、HDD(Hard Disk Drive)480をバス490で接続して構成される。   FIG. 22 is a diagram illustrating a hardware configuration of a computer 400 that configures the information search apparatuses 100, 200, and 300 according to the first to third embodiments. As shown in FIG. 22, the computer (information retrieval device) 400 includes an input device 410, an output device 420, a RAM (Random Access Memory) 430, a ROM (Read Only Memory) 440, and a medium reader that reads data from a storage medium 450, a communication device 460 that transmits / receives data to / from other devices, a CPU (Central Processing Unit) 470, and an HDD (Hard Disk Drive) 480 are connected by a bus 490.

そして、HDD480には、上記した情報検索装置100,200,300の機能と同様の機能を発揮する検索結果作成プログラム480aが記憶されている。CPU470が、検索結果作成プログラム480aを読み出して実行することにより、検索結果作成プロセス470aが起動される。ここで、検索結果作成プロセス470aは、図1,図12,図17に示した、メタデータ取得部110,210,310、操作履歴記録部120,220,320、嗜好情報設定部130,230,330、インデックス作成部140,240,340、推薦部150,250,350、除外履歴記録部160,260,360、除外条件調整部170,270,370、検索結果記録部190,290,390等に対応する。   The HDD 480 stores a search result creation program 480a that exhibits the same functions as the functions of the information search apparatuses 100, 200, and 300 described above. When the CPU 470 reads and executes the search result creation program 480a, the search result creation process 470a is activated. Here, the search result creation process 470a includes the metadata acquisition units 110, 210, and 310, the operation history recording units 120, 220, and 320, and the preference information setting units 130 and 230, shown in FIGS. 330, index creation unit 140, 240, 340, recommendation unit 150, 250, 350, exclusion history recording unit 160, 260, 360, exclusion condition adjustment unit 170, 270, 370, search result recording unit 190, 290, 390, etc. Correspond.

また、RAM430は、検索結果作成プロセス470aに利用される各種データ430aを記憶する。この各種データ430aは、メタデータ(図2参照)、操作履歴データ(図3参照)、除外データ(図5参照)、除外候補データ(図6参照)などに対応する。CPU470は、RAM430に格納された各種データ430aを読み出して、処理を実行することにより、検索結果データを作成する。   The RAM 430 stores various data 430a used for the search result creation process 470a. The various data 430a corresponds to metadata (see FIG. 2), operation history data (see FIG. 3), exclusion data (see FIG. 5), exclusion candidate data (see FIG. 6), and the like. The CPU 470 reads out various data 430a stored in the RAM 430 and executes processing to create search result data.

ところで、図22に示した検索結果作成プログラム480aは、必ずしも最初からHDD480に記憶させておく必要はない。たとえば、コンピュータに挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」、または、コンピュータの内外に備えられるハードディスクドライブ(HDD)などの「固定用の物理媒体」、さらには、公衆回線、インターネット、LAN、WANなどを介してコンピュータに接続される「他のコンピュータ(またはサーバ)」などに検索結果作成プログラム480aを記憶しておき、コンピュータがこれらから検索結果作成プログラム480aを読み出して実行するようにしてもよい。   By the way, the search result creation program 480a shown in FIG. 22 is not necessarily stored in the HDD 480 from the beginning. For example, a “portable physical medium” such as a flexible disk (FD), a CD-ROM, a DVD disk, a magneto-optical disk, or an IC card inserted into a computer, or a hard disk drive (HDD) provided inside or outside the computer. The search result creation program 480a is stored in the “fixed physical medium” of “Other computer (or server)” connected to the computer via a public line, the Internet, a LAN, a WAN, or the like. The computer may read out and execute the search result creation program 480a from these.

以上の実施例1〜3を含む実施形態に関し、更に以下の付記を開示する。   The following appendices are further disclosed with respect to the embodiments including the first to third embodiments.

(付記1)検索対象となる情報のメタデータを取得して保管するメタデータ取得部と、
ユーザによる過去の操作履歴の内容と、操作対象となった情報のメタデータとを対応付けた操作履歴の情報を保管する操作履歴記録部と、
前記メタデータ取得部で保管した検索対象の情報のメタデータと、前記操作履歴記録部で保管した操作対象の情報のメタデータのテキスト部分から、それぞれのインデックスを作成するインデックス作成部と、
前記インデックス作成部で作成した各インデックスを比較して各検索結果を得た後、前記操作履歴の情報と前記検索結果の情報とのインデックスの類似度、もしくは、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす検索結果を、除外する候補の検索結果となる除外検索結果として抽出する推薦部と、
前記推薦部が抽出した前記除外検索結果の情報を保管する除外履歴記録部と、
前記除外履歴記録部に保管された除外検索結果の情報と、前記操作履歴記録部に保管された操作履歴の情報とを基にして、前記推薦部が前記除外検索結果を抽出するための条件を調整する除外条件調整部と、
を備えることを特徴とする情報検索装置。
(Supplementary Note 1) A metadata acquisition unit that acquires and stores metadata of information to be searched;
An operation history recording unit for storing operation history information in which the contents of the past operation history by the user and the metadata of the information to be operated are associated;
An index creation unit that creates each index from the metadata of the information to be searched stored in the metadata acquisition unit and the text part of the metadata of the operation target information stored in the operation history recording unit;
After obtaining each search result by comparing each index created by the index creation unit, the similarity between the index of the operation history information and the search result information, or the index of the search result information A recommendation unit that extracts a search result whose similarity is within a predetermined range and a comparison result other than the text portion of the metadata satisfies a predetermined condition as an excluded search result that is a candidate search result to be excluded;
An exclusion history recording unit for storing information of the exclusion search result extracted by the recommendation unit;
Based on the information on the exclusion search result stored in the exclusion history recording unit and the information on the operation history stored in the operation history recording unit, the condition for the recommendation unit to extract the exclusion search result is as follows. An exclusion condition adjustment section to be adjusted;
An information retrieval apparatus comprising:

(付記2)前記推薦部は、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす場合に、比較した検索結果のうち一方の検索結果を、除外検索結果として抽出することを特徴とする付記1に記載の情報検索装置。 (Additional remark 2) The said recommendation part is compared and searched when the similarity of the index of the information of the said search result is in a predetermined range, and comparison results other than the text part of metadata satisfy | fill predetermined conditions. The information search device according to appendix 1, wherein one of the results is extracted as an excluded search result.

(付記3)前記除外条件調整部は、前記除外検索結果の情報と前記操作履歴記録部に保管された操作対象の情報とを比較して、一致する情報が含まれている場合に、前記インデックスの類似度の比較対象となる所定の範囲を狭めることを特徴とする付記1または2に記載の情報検索装置。 (Additional remark 3) The said exclusion condition adjustment part compares the information of the said exclusion search result, and the information of the operation object preserve | saved at the said operation history recording part, and the said index is contained when the information which corresponds is contained. 3. The information search device according to appendix 1 or 2, wherein a predetermined range to be compared with the degree of similarity is narrowed.

(付記4)前記除外条件調整部は、類似度が所定値以上となる第1除外情報と、類似度が所定値未満となる第2除外情報とを作成し、前記第2除外情報と、前記操作履歴記録部に保管された操作対象の情報とを比較して、一致する情報が含まれていない場合に、前記インデックスの類似度の比較対象となる所定の範囲を広めることを特徴とする付記1、2または3に記載の情報検索装置。 (Additional remark 4) The said exclusion condition adjustment part produces | generates the 1st exclusion information from which a similarity becomes more than predetermined value, and the 2nd exclusion information from which a similarity becomes less than predetermined value, The said 2nd exclusion information, A supplementary note that compares the information of the operation target stored in the operation history recording unit and expands a predetermined range to be compared with the similarity of the index when no matching information is included The information search device according to 1, 2, or 3.

(付記5)前記推薦部は、前記操作履歴の情報と検索結果の情報とのメタデータの放送開始時間、あるいは、検索結果同士のメタデータの放送開始時間を比較して、放送開始時間が異なっている検索結果を前記除外検索結果として抽出することを特徴とする付記1〜4のいずれか一つに記載の情報検索装置。 (Additional remark 5) The said recommendation part compares the broadcast start time of the metadata of the said operation history information and the information of a search result, or the broadcast start time of the metadata of search results, and broadcast start time differs. The information search device according to any one of appendices 1 to 4, wherein the search result is extracted as the excluded search result.

(付記6)前記推薦部は、前記操作履歴の情報と検索結果の情報とのメタデータの放送開始日、あるいは、検索結果同士のメタデータの放送開始日を比較して、放送開始日が同一となる検索結果を前記除外検索結果として抽出することを特徴とする付記1〜5のいずれか一つに記載の情報検索装置。 (Additional remark 6) The said recommendation part compares the broadcast start date of the metadata with the information of the said operation history, and the information of a search result, or the broadcast start date of the metadata of search results, and a broadcast start date is the same The information search device according to any one of appendices 1 to 5, wherein the search result is extracted as the exclusion search result.

(付記7)前記推薦部は、前記操作履歴の情報と前記検索結果の情報とのコンテンツの配信長、あるいは、検索結果同士のコンテンツの配信長を比較して、配信長の差が所定値未満となる検索結果を前記除外検索結果として抽出することを特徴とする付記1〜6のいずれか一つに記載の情報検索装置。 (Supplementary Note 7) The recommendation unit compares the content distribution length between the operation history information and the search result information or the content distribution length between the search results, and the difference in distribution length is less than a predetermined value. The information search device according to any one of appendices 1 to 6, wherein the search result is extracted as the exclusion search result.

(付記8)前記推薦部は、前記操作履歴の情報と前記検索結果の情報とのコンテンツの配信日時、あるいは、検索結果同士のコンテンツの配信日時を比較して、配信日時の差が所定値未満となる検索結果を前記除外検索結果として抽出することを特徴とする付記1〜7のいずれか一つに記載の情報検索装置。 (Supplementary Note 8) The recommendation unit compares the content distribution date and time between the operation history information and the search result information or the content distribution date and time between the search results, and the difference in distribution date and time is less than a predetermined value. The information search device according to any one of appendices 1 to 7, wherein the search result is extracted as the exclusion search result.

(付記9)情報検索装置が、
検索対象となる情報のメタデータを取得して記憶装置に保管するステップと、
ユーザによる過去の操作履歴の内容と、操作対象となった情報のメタデータとを対応付けた操作履歴の情報を記憶装置に保管するステップと、
前記記憶装置に保管した検索対象の情報のメタデータと、操作対象の情報のメタデータのテキスト部分から、それぞれのインデックスを作成するステップと、
作成した各インデックスを比較して各検索結果を得た後、前記操作履歴の情報と前記検索結果の情報とのインデックスの類似度、もしくは、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす検索結果を、除外する候補の検索結果となる除外検索結果として抽出するステップと、
前記除外検索結果の情報を記憶装置に保管するステップと、
前記記憶装置に保管された前記除外検索結果の情報と、前記操作履歴の情報とを基にして、前記除外検索結果を抽出するための条件を調整するステップと、
を含んだことを特徴とする検索方法。
(Supplementary note 9) The information retrieval device is
Obtaining metadata of information to be searched and storing it in a storage device;
Storing information of operation history in which the content of the past operation history by the user is associated with the metadata of the information to be operated in a storage device;
Creating each index from the metadata of the information to be searched stored in the storage device and the text portion of the metadata of the information to be operated;
After each of the created indexes is compared to obtain each search result, the index similarity between the operation history information and the search result information, or the index similarity between the search result information is a predetermined value. Extracting a search result within a range and a comparison result other than the text portion of the metadata that satisfies a predetermined condition as an excluded search result that is a candidate search result to be excluded;
Storing information of the excluded search result in a storage device;
Adjusting a condition for extracting the exclusion search result based on the information of the exclusion search result stored in the storage device and the information of the operation history;
The search method characterized by including.

(付記10)コンピュータに、
検索対象となる情報のメタデータを取得して記憶装置に保管するメタデータ取得手順と、
ユーザによる過去の操作履歴の内容と、操作対象となった情報のメタデータとを対応付けた操作履歴の情報を記憶装置に保管する操作履歴記録手順と、
前記記憶装置に保管した検索対象の情報のメタデータと、操作対象の情報のメタデータのテキスト部分から、それぞれのインデックスを作成するインデックス作成手順と、
作成した各インデックスを比較して各検索結果を得た後、前記操作履歴の情報と前記検索結果の情報とのインデックスの類似度、もしくは、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす検索結果を、除外する候補の検索結果となる除外検索結果として抽出する推薦手順と、
前記除外検索結果の情報を記憶装置に保管する除外候補記録手順と、
前記記憶装置に保管された前記除外検索結果の情報と、前記操作履歴の情報とを基にして、前記除外検索結果を抽出するための条件を調整する除外条件調整手順と、
を実行させることを特徴とする検索プログラム。
(Appendix 10)
A metadata acquisition procedure for acquiring metadata of information to be searched and storing it in a storage device;
An operation history recording procedure for storing, in a storage device, operation history information in which the contents of past operation history by the user and the metadata of the information to be operated are associated;
An index creation procedure for creating respective indexes from the metadata of the search target information stored in the storage device and the text portion of the metadata of the operation target information;
After each of the created indexes is compared to obtain each search result, the index similarity between the operation history information and the search result information, or the index similarity between the search result information is a predetermined value. A recommendation procedure for extracting a search result that satisfies a predetermined condition within a range and a comparison result other than the text portion of the metadata as a search result of a candidate to be excluded,
Exclusion candidate recording procedure for storing information of the exclusion search result in a storage device;
An exclusion condition adjustment procedure for adjusting a condition for extracting the exclusion search result based on the information of the exclusion search result stored in the storage device and the information of the operation history;
A search program characterized in that is executed.

本実施例1にかかる情報検索装置の構成を示す機能ブロック図である。1 is a functional block diagram illustrating a configuration of an information search apparatus according to a first embodiment. メタデータ取得部が保管するメタデータのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the metadata which a metadata acquisition part stores. 本実施例1にかかる操作履歴データのデータ構造の一例を示す図である。FIG. 3 is a diagram illustrating an example of a data structure of operation history data according to the first embodiment. インデックス間の類似度の計算方法を示す図である。It is a figure which shows the calculation method of the similarity between indexes. 本実施例1にかかる除外データの一例を示す図である。It is a figure which shows an example of the exclusion data concerning the present Example 1. 本実施例1にかかる除外候補データのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the exclusion candidate data concerning the present Example 1. FIG. 本実施例1にかかる検索結果データのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the search result data concerning the present Example 1. FIG. 本実施例1にかかる除外条件調整部が第2、3の規定値を調整する処理を示すフローチャートである(1)。It is a flowchart which shows the process which the exclusion condition adjustment part concerning the present Example 1 adjusts the 2nd, 3rd prescribed value (1). 本実施例1にかかる除外条件調整部が第2、3の規定値を調整する処理を示すフローチャートである(2)。It is a flowchart which shows the process in which the exclusion condition adjustment part concerning the present Example 1 adjusts the 2nd, 3rd prescribed value (2). 本実施例1にかかる推薦部が検索結果データを作成する処理を示すフローチャートである(1)。It is a flowchart which shows the process in which the recommendation part concerning the present Example 1 produces search result data (1). 本実施例1にかかる推薦部が検索結果データを作成する処理を示すフローチャートである(2)。It is a flowchart which shows the process in which the recommendation part concerning the present Example 1 produces search result data (2). 本実施例2にかかる情報検索装置の構成を示す機能ブロック図である。It is a functional block diagram which shows the structure of the information search device concerning the present Example 2. 本実施例2にかかる操作履歴データのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the operation history data concerning the present Example 2. 本実施例2にかかる除外データのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the exclusion data concerning the present Example 2. 本実施例2にかかる検索結果データのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the search result data concerning the present Example 2. 本実施例2にかかる推薦部が検索結果データを作成する処理を示すフローチャートである。10 is a flowchart illustrating a process in which a recommendation unit according to the second embodiment creates search result data. 本実施例3にかかる情報検索装置の構成を示す機能ブロック図である。FIG. 10 is a functional block diagram illustrating a configuration of an information search apparatus according to a third embodiment. 本実施例3にかかる操作履歴データのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the operation history data concerning the present Example 3. 本実施例3にかかる除外データのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the exclusion data concerning the present Example 3. 本実施例3にかかる検索結果データのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the search result data concerning the present Example 3. 本実施例3にかかる推薦部が検索結果データを作成する処理を示すフローチャートである。12 is a flowchart illustrating a process in which a recommendation unit according to the third embodiment creates search result data. 実施例1〜3にかかる情報検索装置を構成するコンピュータのハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of the computer which comprises the information search device concerning Examples 1-3. 従来技術の問題点を説明するための図である。It is a figure for demonstrating the problem of a prior art.

符号の説明Explanation of symbols

100,200,300 情報検索装置
110,210,310 メタデータ取得部
120,220,320 操作履歴記録部
130,230,330 嗜好情報設定部
140,240,340 インデックス作成部
150,250,350 推薦部
160,260,360 除外履歴記録部
170,270,370 除外条件調整部
180,280,380 表示部
190,290,390 検索結果記録部
400 コンピュータ
410 入力装置
420 出力装置
430 RAM
430a 各種データ
440 ROM
450 媒体読取装置
460 通信装置
470 CPU
470a 検索結果作成プロセス
480 HDD
480a 検索結果作成プログラム
490 バス
100, 200, 300 Information retrieval device 110, 210, 310 Metadata acquisition unit 120, 220, 320 Operation history recording unit 130, 230, 330 Preference information setting unit 140, 240, 340 Index creation unit 150, 250, 350 Recommendation unit 160, 260, 360 Exclusion history recording unit 170, 270, 370 Exclusion condition adjustment unit 180, 280, 380 Display unit 190, 290, 390 Search result recording unit 400 Computer 410 Input device 420 Output device 430 RAM
430a Various data 440 ROM
450 Media reader 460 Communication device 470 CPU
470a Search result creation process 480 HDD
480a Search result creation program 490 bus

Claims (5)

検索対象となる情報のメタデータを取得して保管するメタデータ取得部と、
ユーザによる過去の操作履歴の内容と、操作対象となった情報のメタデータとを対応付けた操作履歴の情報を保管する操作履歴記録部と、
前記メタデータ取得部で保管した検索対象の情報のメタデータと、前記操作履歴記録部で保管した操作対象の情報のメタデータのテキスト部分から、それぞれのインデックスを作成するインデックス作成部と、
前記インデックス作成部で作成した各インデックスを比較して各検索結果を得た後、前記操作履歴の情報と前記検索結果の情報とのインデックスの類似度、もしくは、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす検索結果を、除外する候補の検索結果となる除外検索結果として抽出する推薦部と、
前記推薦部が抽出した前記除外検索結果の情報を保管する除外履歴記録部と、
前記除外履歴記録部に保管された除外検索結果の情報と、前記操作履歴記録部に保管された操作履歴の情報とを基にして、前記推薦部が前記除外検索結果を抽出するための条件を調整する除外条件調整部と、
を備えることを特徴とする情報検索装置。
A metadata acquisition unit that acquires and stores metadata of information to be searched;
An operation history recording unit for storing operation history information in which the contents of the past operation history by the user and the metadata of the information to be operated are associated;
An index creation unit that creates each index from the metadata of the information to be searched stored in the metadata acquisition unit and the text part of the metadata of the operation target information stored in the operation history recording unit;
After obtaining each search result by comparing each index created by the index creation unit, the similarity between the index of the operation history information and the search result information, or the index of the search result information A recommendation unit that extracts a search result whose similarity is within a predetermined range and a comparison result other than the text portion of the metadata satisfies a predetermined condition as an excluded search result that is a candidate search result to be excluded;
An exclusion history recording unit for storing information of the exclusion search result extracted by the recommendation unit;
Based on the information on the exclusion search result stored in the exclusion history recording unit and the information on the operation history stored in the operation history recording unit, the condition for the recommendation unit to extract the exclusion search result is as follows. An exclusion condition adjustment section to be adjusted;
An information retrieval apparatus comprising:
前記推薦部は、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす場合に、比較した検索結果のうち一方の検索結果を、除外検索結果として抽出することを特徴とする請求項1に記載の情報検索装置。   The recommendation unit may include one of the compared search results when the similarity between the indexes of the search result information is within a predetermined range and a comparison result other than the text portion of the metadata satisfies a predetermined condition. The information search apparatus according to claim 1, wherein the search result is extracted as an excluded search result. 前記除外条件調整部は、前記除外検索結果の情報と前記操作履歴記録部に保管された操作対象の情報とを比較して、一致する情報が含まれている場合に、前記インデックスの類似度の比較対象となる所定の範囲を狭めることを特徴とする請求項1または2に記載の情報検索装置。   The exclusion condition adjustment unit compares the information of the exclusion search result with the information on the operation target stored in the operation history recording unit, and if the matching information is included, the similarity of the index is determined. The information search apparatus according to claim 1, wherein a predetermined range to be compared is narrowed. 前記除外条件調整部は、類似度が所定値以上となる第1除外情報と、類似度が所定値未満となる第2除外情報とを作成し、前記第2除外情報と、前記操作履歴記録部に保管された操作対象の情報とを比較して、一致する情報が含まれていない場合に、前記インデックスの類似度の比較対象となる所定の範囲を広めることを特徴とする請求項1、2または3に記載の情報検索装置。   The said exclusion condition adjustment part produces | generates the 1st exclusion information from which a similarity becomes more than predetermined value, and the 2nd exclusion information from which a similarity becomes less than a predetermined value, The said 2nd exclusion information and the said operation history recording part The predetermined range to be compared with the similarity of the index is expanded when the matching information is not included when the information on the operation target stored in the table is compared. Or the information search device of 3. 前記推薦部は、前記操作履歴の情報と検索結果の情報とのメタデータの放送開始時間、あるいは、検索結果同士のメタデータの放送開始時間を比較して、放送開始時間が異なっている検索結果を前記除外検索結果として抽出することを特徴とする請求項1〜4のいずれか一つに記載の情報検索装置。   The recommendation unit compares the broadcast start time of the metadata between the operation history information and the search result information, or compares the broadcast start time of the metadata between the search results, and the search results having different broadcast start times The information search device according to any one of claims 1 to 4, wherein the information is extracted as the exclusion search result.
JP2008110152A 2008-04-21 2008-04-21 Information retrieval device Expired - Fee Related JP5136181B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008110152A JP5136181B2 (en) 2008-04-21 2008-04-21 Information retrieval device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008110152A JP5136181B2 (en) 2008-04-21 2008-04-21 Information retrieval device

Publications (2)

Publication Number Publication Date
JP2009259150A JP2009259150A (en) 2009-11-05
JP5136181B2 true JP5136181B2 (en) 2013-02-06

Family

ID=41386469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008110152A Expired - Fee Related JP5136181B2 (en) 2008-04-21 2008-04-21 Information retrieval device

Country Status (1)

Country Link
JP (1) JP5136181B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5749676B2 (en) * 2012-03-28 2015-07-15 株式会社Nttドコモ RECOMMENDATION INFORMATION GENERATION DEVICE AND RECOMMENDATION INFORMATION GENERATION METHOD
JP5877775B2 (en) * 2012-09-03 2016-03-08 株式会社日立製作所 Content management apparatus, content management system, content management method, program, and storage medium
KR101488980B1 (en) * 2013-07-24 2015-02-04 동명대학교산학협력단 System and method for providing personalized internet information
JP7057640B2 (en) * 2017-09-20 2022-04-20 ヤフー株式会社 Information retrieval device, information retrieval method, and information retrieval program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4014713B2 (en) * 1997-12-19 2007-11-28 株式会社野村総合研究所 Search support system for multi-attribute data group
JP2002157272A (en) * 2000-11-21 2002-05-31 Fuji Xerox Co Ltd Business supporting device
JP3747847B2 (en) * 2001-12-14 2006-02-22 日本ビクター株式会社 Recording apparatus and recording / reproducing apparatus
JP2007213476A (en) * 2006-02-13 2007-08-23 Toshiba Corp Information collection system
JP4407661B2 (en) * 2006-04-05 2010-02-03 ソニー株式会社 Broadcast program reservation apparatus, broadcast program reservation method and program thereof

Also Published As

Publication number Publication date
JP2009259150A (en) 2009-11-05

Similar Documents

Publication Publication Date Title
JP5740814B2 (en) Information processing apparatus and method
KR101644789B1 (en) Apparatus and Method for providing information related to broadcasting program
CN106331778B (en) Video recommendation method and device
US8719248B2 (en) Semantic-based search engine for content
US8478759B2 (en) Information presentation apparatus and mobile terminal
CN101778233B (en) Data processing apparatus, data processing method
JP5359534B2 (en) Information processing apparatus and method, and program
JPWO2008081664A1 (en) Advertisement distribution system, advertisement distribution server, advertisement distribution method, program, and recording medium
JP2010061600A (en) Recommendation device and method, program, and recording medium
JP2010097249A (en) Electronic apparatus, content recommendation method, and program
US8195687B2 (en) Program retrieval support device for accumulating and searching pieces of program information and corresponding programs and a method for performing the same
CN110430476A (en) Direct broadcasting room searching method, system, computer equipment and storage medium
US20090083796A1 (en) Information recommendation apparatus and method
KR20080049604A (en) Tv program search apparatus
US8397263B2 (en) Information processing apparatus, information processing method and information processing program
JP5136181B2 (en) Information retrieval device
KR101051804B1 (en) System of targeting data service for web-based media contents
US20060085416A1 (en) Information reading method and information reading device
US20190082236A1 (en) Determining Representative Content to be Used in Representing a Video
JP2009141753A (en) Recorder of broadcast program
JP2004362019A (en) Information recommendation device, information recommendation method, information recommendation program and recording medium
JP2008227909A (en) Video retrieval apparatus
JP5335500B2 (en) Content search apparatus and computer program
JP2006340136A (en) Video image reproducing method, index information providing method, video image reproducing terminal, and video index creation and retrieval system
CN109933691B (en) Method, apparatus, device and storage medium for content retrieval

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110118

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121016

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121029

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151122

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees