JP5136181B2 - Information retrieval device - Google Patents
Information retrieval device Download PDFInfo
- Publication number
- JP5136181B2 JP5136181B2 JP2008110152A JP2008110152A JP5136181B2 JP 5136181 B2 JP5136181 B2 JP 5136181B2 JP 2008110152 A JP2008110152 A JP 2008110152A JP 2008110152 A JP2008110152 A JP 2008110152A JP 5136181 B2 JP5136181 B2 JP 5136181B2
- Authority
- JP
- Japan
- Prior art keywords
- search result
- information
- index
- exclusion
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
この発明は、情報を検索する情報検索装置に関し、特に、検索結果からユーザに不要な情報を適切に除外することができる情報検索装置に関するものである。 The present invention relates to an information search apparatus that searches for information, and more particularly to an information search apparatus that can appropriately exclude information unnecessary for a user from a search result.
近年、テレビ機能を搭載したPC(Personal Computer)や、PVR(Personal Video Recorder)などのようにテレビ番組(あるいは、ネット上で配信されるコンテンツ)を録画・再生する装置(以下、情報記録装置)が広く普及している。 In recent years, a device (hereinafter referred to as an information recording device) that records and plays back a TV program (or content distributed over the Internet) such as a PC (Personal Computer) equipped with a TV function or a PVR (Personal Video Recorder). Is widely spread.
そして、この情報記録装置は、ユーザの利便性を向上させるために、各種の機能を備えており、例えば、EPG(Electric Program Guide)から配信される電子番組表(メタデータ)を利用して、ユーザの好みの番組を自動的に検索・提示する機能や、検索した番組を自動的に録画する機能を備えている。 And this information recording device is provided with various functions in order to improve the convenience of the user, for example, using an electronic program guide (metadata) distributed from EPG (Electric Program Guide), It has a function of automatically searching and presenting a user's favorite program and a function of automatically recording the searched program.
しかしながら、情報記録装置によって検索される番組には、ドラマの再放送や、他の放送局で既に視聴済みの映画等のように、ユーザにとって不要な番組が含まれている場合があった。 However, there are cases where programs searched by the information recording apparatus include programs that are unnecessary for the user, such as re-broadcasts of dramas and movies that have already been viewed by other broadcast stations.
そこで、特許文献1では、ユーザが過去に録画した番組を操作履歴として保管しておき、検索結果と操作履歴とを比較して、ユーザが過去に録画した番組を検索結果から除外することで、ユーザにとって不要な番組を検索結果から取り除くという技術が公開されている。
Therefore, in
具体的に、特許文献1では、操作履歴に含まれる番組のジャンル、タイトル、放送局の組み合わせを特定し、特定した組合せと同じ組み合わせを有する番組を検索結果から取り除いている。また、番組のジャンルが映画の場合には、タイトルが同じ番組を検索結果から取り除いている。
Specifically, in
しかしながら、上述した従来の技術では、検索結果からユーザにとって不要な番組を取り除くための除外条件を適切に設定することができないという問題があった。 However, the above-described conventional technique has a problem that it is not possible to appropriately set an exclusion condition for removing a program unnecessary for a user from a search result.
図23は、従来技術の問題点を説明するための図である。図23の(a)は、ユーザの操作履歴を示し、図23の(b)は、不要な番組を除去する前の検索結果を示している。そして、図23の(c)は、従来の技術によって、不要な番組を除去した後の検索結果を示している。 FIG. 23 is a diagram for explaining the problems of the prior art. FIG. 23A shows a user operation history, and FIG. 23B shows a search result before an unnecessary program is removed. FIG. 23C shows search results after unnecessary programs are removed by the conventional technique.
ここで、図23の(c)に示す番組識別番号「1011」の番組は、操作履歴(図23の(a))に示す番組識別番号「1001」の番組の再放送であるため、不要な番組として取り除くべきであるが、放送局とタイトルとの組合せが異なっているため、検索結果から取り除くことができていない。 Here, the program with the program identification number “1011” shown in FIG. 23C is unnecessary because it is a rebroadcast of the program with the program identification number “1001” shown in the operation history (FIG. 23A). Although it should be removed as a program, it cannot be removed from the search result because the combination of the broadcasting station and the title is different.
同様に、図23の(c)に示す番組識別番号「1013」の番組は、操作履歴(図23の(a))に示す番組識別番号「1002」の番組の再放送であるため、不要な番組として取り除くべきであるが、放送局とタイトルとの組合せが異なっているため、検索結果から取り除くことができていない。 Similarly, the program with the program identification number “1013” shown in (c) of FIG. 23 is unnecessary because it is a rebroadcast of the program with the program identification number “1002” shown in the operation history ((a) of FIG. 23). Although it should be removed as a program, it cannot be removed from the search result because the combination of the broadcasting station and the title is different.
また、図23の(c)に示す番組識別番号「1012」の番組は、操作履歴(図23の(a))に示す番組識別番号「1002」の番組のサイマル放送(異なる放送波で同時に放送している番組)であるため、不要な番組として取り除くべきであるが、双方を比較するとジャンルが異なっているために、検索結果から取り除くことができていない。 In addition, the program with the program identification number “1012” shown in FIG. 23C is simultaneously broadcast on the program with the program identification number “1002” shown in the operation history (FIG. 23A). Therefore, it should be removed as an unnecessary program. However, when both are compared, the genre is different, so it cannot be removed from the search result.
一方、図23の(b)に示す番組識別番号「1014」、「1015」の番組は、それぞれ、操作履歴(図23の(a))に示す番組識別番号「1001」、「1002」の翌日以降に放送される番組であり、どちらも操作履歴の番組とは異なるため、検索結果に残しておくべきであるが、双方を比較すると放送局、ジャンル、タイトルの組合せが一致しているため、誤って検索結果から除外されている。 On the other hand, the programs with the program identification numbers “1014” and “1015” shown in FIG. 23B are the next day of the program identification numbers “1001” and “1002” shown in the operation history (FIG. 23A), respectively. It is a program that will be broadcast later, both of which are different from the operation history program, so it should be left in the search results, but when comparing both, the combination of broadcast station, genre, title matches, Accidentally excluded from search results.
このように、従来の技術では、検索結果から不要な番組を取り除くための除外条件を適切に設定することができていないため、ユーザにとって不要な番組を取り除き、ユーザにとって必要な情報を検索結果に残すことができていない。 As described above, in the conventional technique, the exclusion condition for removing the unnecessary program from the search result cannot be set appropriately. Therefore, the program unnecessary for the user is removed, and the information necessary for the user is included in the search result. I can't leave it.
この発明は、上述した従来技術による問題点を解消するためになされたものであり、ユーザに必要な番組を推奨できるように、除外条件を適切に設定することができる情報検索装置を提供することを目的とする。 The present invention has been made in order to solve the above-described problems caused by the prior art, and provides an information search apparatus capable of appropriately setting exclusion conditions so that a user can recommend a necessary program. With the goal.
上述した課題を解決し、目的を達成するため、この情報検索装置は、検索対象となる情報のメタデータを取得して保管するメタデータ取得部と、ユーザによる過去の操作履歴の内容と、操作対象となった情報のメタデータとを対応付けた操作履歴の情報を保管する操作履歴記録部と、前記メタデータ取得部で保管した検索対象の情報のメタデータと、前記操作履歴記録部で保管した操作対象の情報のメタデータのテキスト部分から、それぞれのインデックスを作成するインデックス作成部と、前記インデックス作成部で作成した各インデックスを比較して各検索結果を得た後、前記操作履歴の情報と前記検索結果の情報とのインデックスの類似度、もしくは、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす検索結果を、除外する候補の検索結果となる除外検索結果として抽出する推薦部と、前記推薦部が抽出した前記除外検索結果の情報を保管する除外履歴記録部と、前記除外履歴記録部に保管された除外検索結果の情報と、前記操作履歴記録部に保管された操作履歴の情報とを基にして、前記推薦部が前記除外検索結果を抽出するための条件を調整する除外条件調整部と、を備えることを要件とする。 In order to solve the above-described problems and achieve the object, this information search device includes a metadata acquisition unit that acquires and stores metadata of information to be searched, contents of past operation history by the user, and operations An operation history recording unit that stores operation history information associated with metadata of target information, metadata of search target information stored by the metadata acquisition unit, and storage by the operation history recording unit The index creation unit that creates each index from the text part of the metadata of the information to be operated and the respective indexes created by the index creation unit to obtain each search result, and then the operation history information And the index similarity between the search result information or the index similarity between the search result information is within a predetermined range, and A search unit that extracts a search result that satisfies a predetermined condition for a comparison result other than the text portion of the data as an excluded search result that is a search result of a candidate to be excluded, and stores information on the exclusion search result extracted by the recommendation unit Based on the exclusion history recording unit, the information on the exclusion search result stored in the exclusion history recording unit, and the operation history information stored in the operation history recording unit, the recommendation unit performs the exclusion search result And an exclusion condition adjustment unit that adjusts the conditions for extracting.
この情報検索装置によれば、除外履歴記録部に保管された除外検索結果の情報と、操作履歴記録部に保管された操作履歴の情報とを基にして、除外検索結果を抽出するための条件を調整するので、かかる条件をユーザのニーズに合わせて適切に設定でき、ユーザによって不要となる情報を検索結果から除外することができる。 According to this information search device, a condition for extracting an exclusion search result based on information on an exclusion search result stored in the exclusion history recording unit and information on an operation history stored in the operation history recording unit Therefore, such conditions can be appropriately set according to the user's needs, and information unnecessary by the user can be excluded from the search results.
以下に添付図面を参照して、この発明に係る情報検索装置の好適な実施の形態を詳細に説明する。 Exemplary embodiments of an information search apparatus according to the present invention will be explained below in detail with reference to the accompanying drawings.
まず、本実施例1にかかる情報検索装置の概要および特徴について説明する。本実施例1にかかる情報検索装置は、番組のメタデータ(電子番組表のデータ等)から生成されるインデックスとユーザの嗜好に基づいて生成されるインデックスとを比較して、ユーザの嗜好に合うと考えられる番組の検索結果を一旦抽出する。そして、情報検索装置は、所定の除外条件を用いて、ユーザに対して不要な番組を検索結果から除外し、除外した番組の情報(以下、除外データ)と、ユーザの番組に対する操作の履歴(操作履歴データ)とを基にして、除外条件を調整する。 First, an outline and features of the information search apparatus according to the first embodiment will be described. The information search apparatus according to the first embodiment compares an index generated from program metadata (such as electronic program guide data) with an index generated based on the user's preference, and matches the user's preference. The search result of the program considered to be once extracted. Then, the information search apparatus excludes a program unnecessary for the user from the search result using a predetermined exclusion condition, information on the excluded program (hereinafter, excluded data), and a history of operations on the user's program ( The exclusion condition is adjusted based on the operation history data.
このように、本実施例1にかかる情報検索装置は、除外データと操作履歴データとを基にして、除外条件を調整するので、除外条件を適切に設定でき、ユーザにとって不要な番組のみを検索結果から取り除くことができる。 As described above, since the information search apparatus according to the first embodiment adjusts the exclusion condition based on the exclusion data and the operation history data, the exclusion condition can be appropriately set and only the program unnecessary for the user is searched. Can be removed from the results.
次に、本実施例1にかかる情報検索装置100の構成について説明する。図1は、本実施例1にかかる情報検索装置100の構成を示す機能ブロック図である。同図に示すように、この情報検索装置100は、メタデータ取得部110と、操作履歴記録部120と、嗜好情報設定部130と、インデックス作成部140と、推薦部150と、除外履歴記録部160と、除外条件調整部170と、表示部180と、検索結果記録部190とを有する。なお、この情報検索装置100は、ネットワークに接続される通信装置や、放送波を受信する受信装置を備えているものとする(図示略)。
Next, the configuration of the information search apparatus 100 according to the first embodiment will be described. FIG. 1 is a functional block diagram of the configuration of the information search apparatus 100 according to the first embodiment. As shown in the figure, the information retrieval apparatus 100 includes a
このうち、メタデータ取得部110は、検索対象となる番組、ネット動画、ニュース(ネット上で配信されるニュース)などのメタデータを取得して保管する手段である。図2は、メタデータ取得部110が保管するメタデータのデータ構造の一例を示す図である。同図に示すように、このメタデータは、番組を識別するための番組識別番号と、放送日時と、放送局と、放送長と、放送波と、ジャンルと、タイトルと、番組の説明とを有する。
Among these, the
なお、図2のメタデータは、番組のメタデータを示している。ネット動画のメタデータは、動画の配信開始日時、配信長、配信元、ジャンル、タイトル、説明、配信期限などからなり、ニュースのメタデータは、ニュースの配信開始日時、配信元、ジャンル、タイトル、説明、配信期限などからなる。 Note that the metadata in FIG. 2 indicates the metadata of the program. Net video metadata includes video distribution start date, distribution length, distribution source, genre, title, description, distribution deadline, etc. News metadata includes news distribution start date, distribution source, genre, title, Consists of explanation, delivery deadline, etc.
メタデータ取得部110は、番組のメタデータを、放送波に重畳されているEPG(Electric Program Guide)や、ネットワークを通して提供されるEPGから取得する。また、メタデータ取得部110は、ネット動画やニュースのメタデータを、ネット動画の配信元やニュースの配信元から取得する。
The
操作履歴記録部120は、ユーザが番組、ネット動画、ニュースなどに対して行った各種の操作内容(視聴、再生、閲覧、録画、自動再生、保存など)を、操作履歴データとして記録する手段である。
The operation
図3は、本実施例1にかかる操作履歴データのデータ構造の一例を示す図である。同図に示すように、この操作履歴データは、番組識別番号と、操作日時と、操作内容となる操作と、放送日時と、放送局と、ジャンルと、タイトルと、説明とを有する。操作履歴記録部120は、操作履歴データに記録されるエントリの数が規定数に達した場合や、記録してからの期間が規定期間よりも長くなったエントリを操作履歴データから削除してもよい。
FIG. 3 is a diagram illustrating an example of the data structure of the operation history data according to the first embodiment. As shown in the figure, the operation history data includes a program identification number, an operation date and time, an operation that is operation content, a broadcast date and time, a broadcasting station, a genre, a title, and a description. The operation
嗜好情報設定部130は、ユーザの好みの番組、ネット動画、ニュースなどを検索するための検索条件を設定する手段である。嗜好情報設定部130は、入力装置(図示略)を介してユーザからキーワードを取得し、取得した各キーワードを検索条件として設定してもよいし、操作履歴記録部120に記録された操作履歴データに含まれるテキストを取得して、検索条件に設定してもよい。
The preference
インデックス作成部140は、メタデータ取得部110のメタデータ(検索対象)のインデックス(以下、検索対象インデックス)、操作履歴記録部120の操作履歴データのインデックス(以下、操作履歴インデックス)、嗜好情報設定部130の検索条件のインデックス(以下、検索条件インデックス)をそれぞれ作成する手段である。インデックス作成部140は、作成した検索対象インデックス、操作履歴インデックス、検索条件インデックスの情報を推薦部150に出力する。
The index creation unit 140 includes an index of metadata (search target) of the metadata acquisition unit 110 (hereinafter referred to as search target index), an index of operation history data of the operation history recording unit 120 (hereinafter referred to as operation history index), and preference information setting. This is means for creating an index of search conditions (hereinafter referred to as a search condition index) of the
インデックスの作成方法は、タイトル、説明、ジャンルなどに含まれるテキストを形態素解析やn−gram解析にかけてキーワードに分解した後、各キーワードの出現頻度などの統計量を用いて重み付けすることでインデックス(ベクトル)を作成する。以下において、検索対象インデックス、操作履歴インデックス、検索条件インデックスの作成方法について順に説明する。 The index is created by dividing the text included in the title, description, genre, etc. into keywords through morphological analysis or n-gram analysis, and then weighting them using statistics such as the appearance frequency of each keyword. ). Hereinafter, a method for creating a search target index, an operation history index, and a search condition index will be described in order.
(検索対象インデックスについて)
図2に示したメタデータの番組識別番号「1001」を例にして、検索対象インデックスの作成方法を説明する。インデックス作成部140は、番組識別番号「1001」のタイトル、説明、ジャンルなどに含まれるテキストを形態素解析にかけてキーワードに分解した場合に、キーワード「アップタウン、音楽、・・・」が含まれている場合には、ベクトル空間における、番組識別番号「1001」の基底は、「アップタウン」、「音楽」、・・・となる。
(About search target index)
A method of creating a search target index will be described using the metadata program identification number “1001” shown in FIG. 2 as an example. When the text included in the title, description, and genre of the program identification number “1001” is decomposed into keywords by performing morphological analysis, the index creating unit 140 includes the keywords “Uptown, Music,...”. In this case, the basis of the program identification number “1001” in the vector space is “Uptown”, “Music”,.
そして、各基底の大きさは、各キーワードの統計量となる。統計量としては、例えば、TF(Term Frequency)やDF(Document Frequency)を用いて算出する。TFは、ある番組(ネット動画、ニュースを含む)のテキスト中に特定のキーワードが出現する頻度であり、DFは、検索対象となる全番組中(例えば、図2に示したメタデータに含まれる全ての番組中)で、特定のキーワードを含む番組の数を示す。 The size of each base is a statistic of each keyword. The statistics are calculated using, for example, TF (Term Frequency) or DF (Document Frequency). TF is the frequency at which a specific keyword appears in the text of a certain program (including online video and news), and DF is included in all the programs to be searched (for example, included in the metadata shown in FIG. 2). The number of programs including a specific keyword in all programs).
統計量(基底の大きさ)を算出する具体的な式は、
統計量=TF/DF
となる。
The specific formula for calculating the statistic (base size) is
Statistics = TF / DF
It becomes.
例えば、図2に示した番組識別番号「1001」のテキストにキーワード「アップタウン」、「音楽」が出現する頻度(TF)がそれぞれ「0.8」、「0.6」であり、図2に示した全番組中で、キーワード「アップタウン」、「音楽」を含む番組の数(DF)が、それぞれ、「2」、「3」であった場合には、番組識別番号「1001」のインデックスは、「アップタウン(基底の大きさ0.4)、音楽(基底の大きさ0.2)」となる。なお、検索対象インデックスは、図2に示したメタデータに含まれる番組の数だけ作成される。 For example, the frequencies (TF) at which the keywords “Uptown” and “Music” appear in the text of the program identification number “1001” shown in FIG. 2 are “0.8” and “0.6”, respectively. If the numbers (DF) of the programs including the keywords “Uptown” and “Music” are “2” and “3”, respectively, the program identification number “1001” is shown. The index is “Uptown (base size 0.4), Music (base size 0.2)”. Note that the search target indexes are created for the number of programs included in the metadata shown in FIG.
(操作履歴インデックスについて)
図3に示した検索履歴データ「1001」を例にして、操作履歴インデックスの作成方法を説明する。インデックス作成部140は、番組識別番号「1001」のタイトル、説明、ジャンルなどに含まれるテキストを形態素解析にかけてキーワードに分解した場合に、キーワード「アップタウン、音楽、・・・」が含まれている場合には、ベクトル空間における、番組識別番号「1001」の基底は、「アップタウン」、「音楽」、・・・となる。
(About the operation history index)
A method for creating an operation history index will be described using the search history data “1001” shown in FIG. 3 as an example. When the text included in the title, description, and genre of the program identification number “1001” is decomposed into keywords by performing morphological analysis, the index creating unit 140 includes the keywords “Uptown, Music,...”. In this case, the basis of the program identification number “1001” in the vector space is “Uptown”, “Music”,.
そして、各基底の大きさは、各キーワードの統計量となる。統計量の算出方法は、検索インデックスにおいて説明した算出方法と同様である。図3に示した番組識別番号「1001」のテキストにキーワード「アップタウン」、「音楽」が出現する頻度(TF)がそれぞれ「0.8」、「0.6」であり、図2に示した全番組中で、キーワード「アップタウン」、「音楽」を含む番組の数(DF)が、それぞれ、「2」、「3」であった場合には、番組識別番号「1001」のインデックスは、「アップタウン(基底の大きさ0.4)、音楽(基底の大きさ0.2)」となる。なお、操作履歴インデックスは、図3に示した操作履歴データに含まれる番組の数だけ作成される。 The size of each base is a statistic of each keyword. The statistic calculation method is the same as the calculation method described in the search index. The frequencies (TF) at which the keywords “Uptown” and “Music” appear in the text of the program identification number “1001” shown in FIG. 3 are “0.8” and “0.6”, respectively. If the number of programs (DF) including the keywords “Uptown” and “Music” is “2” and “3”, respectively, the index of the program identification number “1001” is , “Uptown (base size 0.4), music (base size 0.2)”. Note that as many operation history indexes as the number of programs included in the operation history data shown in FIG. 3 are created.
(検索条件インデックスについて)
ここでは、操作履歴データ(図3参照)を用いた場合の検索条件インデックスの作成方法を説明する。インデックス作成部140は、操作履歴インデックスに含まれる全てのテキストを形態素解析にかけて、テキストをキーワードに分解する。テキストをキーワードに分解した結果、キーワード「アップタウン、音楽、ちりとり、・・・」が含まれている場合には、ベクトル空間における検索条件インデックスの規定は、「アップタウン」、「音楽」、「ちりとり」・・・となる。
(About search condition index)
Here, a method of creating a search condition index when using operation history data (see FIG. 3) will be described. The index creation unit 140 performs morphological analysis on all the texts included in the operation history index, and decomposes the texts into keywords. If the keyword “Uptown, Music, Dustpan,...” Is included as a result of dividing the text into keywords, the search condition index in the vector space is defined as “Uptown”, “Music”, “ Dustpan "...
そして、各基底の大きさは、各キーワードの統計量となる。統計量の算出方法は、検索インデックスにおいて説明した算出方法と同様である。操作履歴データのテキストにキーワード「アップタウン」、「音楽」、「ちりとり」が出現する頻度(TF)がそれぞれ「0.4」、「0.3」、「0.2」であり、図2に示した全番組中で、キーワード「アップタウン」、「音楽」、「ちりとり」を含む番組の数(DF)が、それぞれ、「2」、「3」、「2」であった場合には、検索条件インデックスは、「アップタウン(基底の大きさ0.2)、音楽(基底の大きさ0.1)、ちりとり(基底の大きさ0.1)」となる。 The size of each base is a statistic of each keyword. The statistic calculation method is the same as the calculation method described in the search index. The frequencies (TF) at which the keywords “Uptown”, “Music”, and “Dustpan” appear in the text of the operation history data are “0.4”, “0.3”, and “0.2”, respectively. When the number of programs (DF) including the keywords “Uptown”, “Music”, and “Dust” is “2”, “3”, and “2”, respectively, The search condition index is “uptown (base size 0.2), music (base size 0.1), dustpan (base size 0.1)”.
推薦部150は、インデックス作成部140からインデックス(検索対象インデックス、操作履歴インデックス、検索条件インデックス)の情報を取得し、取得したインデックスに基づいて、ユーザに推奨する番組の検索結果を作成する手段である。推薦部150は、検索結果の候補となる一次検索結果を作成する処理、一次検索結果から不要な番組を取り除く処理を順に実行する。以下において、一次検索結果を作成する処理、不要な番組を取り除く処理について順に説明する。
The
(一次検索結果を作成する処理について)
推薦部150は、各検索対象インデックスと検索条件インデックスとの類似度を算出し、算出した類似度に基づいて一次検索結果を作成する。なお、ベクトル同士の類似度は、ベクトル間の内積(あるいは角度、相関係数)で表される。図4は、インデックス間の類似度の計算方法を示す図である。ユーザの嗜好に合う情報ほど類似度が高くなる。
(About processing to create primary search results)
The
推薦部150は、各検索対象インデックスと検索条件インデックスとの内積を算出し、算出した内積の値が第1の規定値以上となる検索対象インデックスと検索条件インデックスとの組を抽出する(抽出した組に含まれる検索対象インデックスを、検索結果候補インデックスと表記する。)。そして、検索結果候補インデックスに対応する各種情報(番組識別番号、放送日時、放送局、ジャンル、タイトル、説明)を一次検索結果に登録する。
The
(不要な番組を取り除く処理について)
推薦部150は、検索結果候補インデックスと操作履歴インデックスとを基にして、不要なエントリを一次検索結果から除外する。一次検索結果から不要なエントリが除外されたものが、最終的な検索結果となる。推薦部150は、まず、検索結果候補インデックスと操作履歴インデックスとの内積を算出する。
(About processing to remove unnecessary programs)
The
そして、推薦部150は、算出した内積と、第2の規定値とを比較して、内積が第2の規定値以上となる検索結果候補インデックスと操作履歴インデックスとの組(以下、第1の組)を抽出する。第1の組に含まれる検索結果候補インデックスの番組は、対となる操作履歴インデックスの番組の再放送あるいはサイマル放送の疑いが極めて高い番組となる。
Then, the
推薦部150は、第1の組に含まれる各インデックスに対応する番組の放送日時(放送開始日、放送開始時間)に基づいて、第1の組に含まれる検索結果候補インデックスが、ユーザにとって不要な番組のインデックスであるか否かを判定する。
Based on the broadcast date and time (broadcast start date, broadcast start time) of the program corresponding to each index included in the first group, the
具体的に、推薦部150は、第1の組において、検索結果候補インデックスに対応する番組の放送開始時間と、操作履歴インデックスに対応する番組の放送開始時間とを比較する。そして、各放送開始時間が異なっている場合には、かかる第1の組における検索結果候補インデックスの番組は、ユーザが既に操作した番組(操作履歴データの番組)の再放送の番組であると判定する。
Specifically, the
また、推薦部150は、第1の組において、検索結果候補インデックスに対応する番組の放送開始日と、操作履歴インデックスに対応する番組の放送開始日とを比較する。そして、各放送開始日が同じとなる場合には、かかる第1の組における検索結果候補インデックスの番組は、ユーザが既に操作した番組(操作履歴データの番組)のサイマル放送であると判定する。
In the first group, the
推薦部150は、再放送あるいはサイマル放送であると判定した番組の検索結果候補インデックスに対応するエントリを一次検索結果から除外すると共に、除外したエントリを除外データに登録する。図5は、本実施例1にかかる除外データの一例を示す図である。同図に示すように、この除外データは、一次検索結果から除外された番組の番組識別番号と、放送日時と、放送局と、ジャンルと、タイトルと、説明とを有する。
The
続いて、推薦部150は、検索結果候補インデックス(再放送の番組あるいはサイマル放送の番組と判定された番組に対応する検索結果候補インデックスを除く)同士の内積を算出し、算出した内積が第2の閾値以上となる検索結果候補インデックスの組(以下、第2の組)を抽出する。
Subsequently, the
推薦部150は、第2の組に含まれる各インデックスに対応する番組の放送日時(放送開始日、放送開始時間)に基づいて、第2の組に含まれる検索結果候補インデックスが、ユーザにとって不要な番組のインデックスであるか否かを判定する。
Based on the broadcast date and time (broadcast start date, broadcast start time) of the program corresponding to each index included in the second set, the
具体的に、推薦部150は、第2の組において、一方の検索結果候補インデックスに対応する番組の放送開始時間と、もう一方の検索結果候補インデックスに対応する番組の放送開始時間とを比較する。そして、各放送開始時間が異なっている場合には、かかる第2の組における一方の検索結果候補インデックスの番組が、もう一方の検索結果候補インデックスの番組の再放送であると判定する。
Specifically, the
また、推薦部150は、第2の組において、一方の検索結果候補インデックスに対応する番組の放送開始日と、もう一方の検索結果候補インデックスに対応する番組の放送開始日とを比較する。そして、各放送開始日が同じとなる場合には、かかる第2の組における一方の検索結果候補インデックスの番組が、もう一方の検索結果候補インデックスの番組のサイマル放送であると判定する。
Further, the
推薦部150は、再放送あるいはサイマル放送であると判定した番組の検索結果候補インデックスを含む第2の組中で、どちらか一方の検索結果候補インデックスを選択する。そして、選択した検索結果候補インデックスに対応するエントリを一次検索結果から除外すると共に、除外したエントリを除外データ(図5参照)に登録する。また、推薦部150は、作成した除外データを除外履歴記録部160に記録する。
The
ところで、推薦部150は、検索結果インデックスと操作履歴インデックスとの内積を算出し、算出した内積と、第2の規定値と第3の規定値(ただし、第2の規定値>第3の規定値)とを比較する。そして、内積が第3の規定値以上、第2の規定値未満となる検索結果候補インデックスと操作履歴インデックスとの組(以下、第3の組)を抽出する。第3の組に含まれる検索結果候補インデックスの番組は、対となる操作履歴インデックスの番組の再放送あるいはサイマル放送の疑いのある番組となる。ただし、再放送あるいはサイマル放送である可能性は、第1の組よりも低い。
Incidentally, the
推薦部150は、第3の組に含まれる各インデックスに対応する番組の放送日時(放送開始日、放送開始時間)に基づいて、第3の組に組まれる検索結果候補インデックスが、ユーザにとって不要な番組のインデックスである可能性があるか否かを判定する。
The
具体的に、推薦部150は、第3の組において、検索結果候補インデックスに対応する番組の放送開始時間と、操作履歴インデックスに対応する番組の放送開始時間とを比較する。そして、各放送開始時間が異なっている場合には、かかる第3の組における検索結果候補インデックスの番組は、ユーザが既に操作した番組(操作履歴データの番組)の再放送の番組である可能性が高いと判定する。
Specifically, the
また、推薦部150は、第3の組において、検索結果候補インデックスに対応する番組の放送開始日と、操作履歴インデックスに対応する番組の放送開始日とを比較する。そして、各放送開始日が同じとなる場合には、かかる第3の組における検索結果候補インデックスの番組は、ユーザが既に操作した番組(操作履歴データの番組)のサイマル放送である可能性が高いと判定する。
In the third set, the
推薦部150は、再放送あるいはサイマル放送の可能性が高いと判定した番組の検索結果候補インデックスの各種情報(識別番号、放送日時、放送局、ジャンル、タイトル、説明)を、除外候補データに登録する。図6は、本実施例1にかかる除外候補データのデータ構造の一例を示す図である。同図に示すように、この除外候補データは、番組識別番号と、放送日時と、放送局と、ジャンルと、タイトルと、説明とを有する。推薦部150は、作成した除外候補データを除外履歴記録部160に記録する。
The
推薦部150は、一次検索結果から不要な番組を取り除いた残りの番組のエントリを検索結果データとして、表示部180および検索結果記録部190に出力する。図7は、本実施例1にかかる検索結果データのデータ構造の一例を示す図である。
The
図7に示すように、この検索結果データは、検索順位、番組識別番号、放送日時、放送局、ジャンル、タイトル、説明を有する。推薦部150は、例えば、検索対象インデックスと検索条件インデックスとの類似度が高いエントリほど検索順位を小さく設定して、検索結果データのエントリを並び替えてもよい。
As shown in FIG. 7, the search result data includes a search order, a program identification number, a broadcast date and time, a broadcast station, a genre, a title, and a description. For example, the
除外履歴記録部160は、除外データ(図5参照)および除外候補データ(図6参照)を記憶する手段である。除外履歴記録部160は、新たに検索が行われた場合や、除外データあるいは除外候補データに登録されるエントリの数が規定数に達した場合や、記録してからの期間が規定期間よりも長くなったエントリを除外データ、除外候補データから削除してもよい。
The exclusion
除外条件調整部170は、除外履歴記録部160に記録された除外データおよび除外候補データと、操作履歴記録部120に記録された操作履歴データとを比較して、推薦部150が利用する第2の規定値および第3の規定値を調整する手段である。
The exclusion
具体的に、除外条件調整部170は、除外データに含まれる各エントリと操作履歴データの各エントリとを比較して、放送日時、放送局、タイトル、説明が一致するエントリの組が存在するか否かを判定する。そして、除外条件調整部170は、一致するエントリの組が存在すると判定した場合には、推薦部150が利用する第2の規定値に所定の値を加算する。
Specifically, the exclusion
除外データに含まれる各エントリと操作履歴データの各エントリとを比較して、一致するエントリが存在するということは、除外されたエントリが本来は検索結果に残して欲しかったものであると考えられるため、第2の規定値に所定の値を加算して除外条件を厳しくする(一次検索結果に含まれるエントリを除外されにくくする)。 If each entry included in the excluded data is compared with each entry in the operation history data, and there is a matching entry, it is considered that the excluded entry originally wanted to be left in the search result. Therefore, the exclusion condition is tightened by adding a predetermined value to the second specified value (the entry included in the primary search result is not easily excluded).
一方、除外条件調整部170は、除外候補データに含まれる各エントリと操作履歴データの各エントリとを比較して、放送日時、放送局、タイトル、説明が一致するエントリの組が存在するか否かを判定する。そして、除外条件調整部170は、一致するエントリの組が存在しないと判定した場合には、推薦部150が利用する第2の規定値および第3の規定値から所定の値を減算する。
On the other hand, the exclusion
除外候補データに含まれる各エントリと操作履歴データの各エントリとを比較して、一致するエントリが存在しないということは、除外候補データに含まれるエントリ(除外候補データに含まれるエントリは、一次検索結果に残されている)が本来は検索結果に残して欲しくなかったものであると考えられるため、第2の規定値および第3の規定値から所定の値を減算して除外条件を緩くする(一次検索結果に含まれるエントリを除外しやすくする)。 Comparing each entry included in the exclusion candidate data with each entry in the operation history data, the fact that there is no matching entry means that the entry included in the exclusion candidate data (the entry included in the exclusion candidate data is the primary search) (Remaining in the result) is considered to be something that was originally not desired to be included in the search result, so that the exclusion condition is relaxed by subtracting a predetermined value from the second specified value and the third specified value. (Easy to exclude entries included in primary search results)
このように、除外条件調整部170が、除外履歴記録部160に記録された除外データおよび除外候補データと、操作履歴記録部120に記録された操作履歴データとを比較して、推薦部150が利用する第2の規定値および第3の規定値を調整するので、ユーザの嗜好にあった検索結果を得るための検索条件を適切に設定することができる。
Thus, the exclusion
表示部180は、検索結果データ(図7参照)をディスプレイ等の画面に表示する手段である。ユーザは、かかる画面を参照して、番組の録画などを設定する。検索結果記録部190は、検索結果データを保管する手段である。ユーザは、検索結果記録部190に記録された検索結果データの参照や、検索結果データのうち、保存したいエントリを指定する。
The
次に、本実施例1にかかる情報検索装置100の各種の処理手順について説明する。図8、図9は、除外条件調整部170が第2、3の規定値を調整する処理を示すフローチャートであり、図10、図11は、本実施例1にかかる推薦部150が検索結果データを作成する処理を示すフローチャートである。
Next, various processing procedures of the information search apparatus 100 according to the first embodiment will be described. FIG. 8 and FIG. 9 are flowcharts showing the process in which the exclusion
図8に示すように、除外条件調整部170は、iの値を0に設定し(ステップS101)、操作履歴記録部120から操作履歴データを取得し(ステップS102)、除外履歴記録部160から除外データの一覧(M個)を取得する(ステップS103)。
As shown in FIG. 8, the exclusion
そして、除外条件調整部170は、iの値がMの値よりも小さいか否かを判定し、iの値がMの値以上である場合には(ステップS104,No)、処理を終了する。一方、iの値がMの値よりも小さい場合には(ステップS104,Yes)、操作履歴データと除外データ(i番目)とが同じ情報であるか否かを判定する(ステップS105)。
Then, the exclusion
操作履歴データと除外データ(i番目)とが異なる情報である場合には(ステップS106,No)、iに1を加算した値を新たなiの値に設定し(ステップS107)、ステップS104に移行する。一方、操作履歴データと除外データ(i番目)とが同じ情報である場合には(ステップS106,Yes)、第2の規定値を調整(第2の規定値を上げる)し(ステップS108)、処理を終了する。 If the operation history data and the excluded data (i-th) are different information (No in step S106), a value obtained by adding 1 to i is set as a new value of i (step S107), and the process proceeds to step S104. Transition. On the other hand, when the operation history data and the exclusion data (i-th) are the same information (step S106, Yes), the second specified value is adjusted (the second specified value is increased) (step S108), End the process.
このように、除外条件調整部170は、操作履歴データと除外データとが同じエントリ(情報)を含んでいる場合に、第2の規定値を上げるので、ユーザの嗜好に合わせて、除外条件を調整することができる。
As described above, the exclusion
図9に示すように、除外条件調整部170は、iの値を0に設定し(ステップS201)、操作履歴記録部120から操作履歴データを取得し(ステップS202)、除外履歴記録部160から除外候補データの一覧(M個)を取得する(ステップS203)。
As illustrated in FIG. 9, the exclusion
そして、除外条件調整部170は、iの値がMの値よりも小さいか否かを判定し、iの値がMの値よりも小さい場合には(ステップS204,Yes)、操作履歴データと除外候補データ(i番目)とが同じ情報であるか否かを判定する(ステップS205)。
Then, the exclusion
操作履歴データと除外候補データ(i番目)とが同じ情報である場合には(ステップS206,Yes)、検出フラグをオンに設定し(ステップS207)、iに1を加算した値を新たなiの値に設定し(ステップS208)、ステップS204に移行する。一方、操作履歴データと除外候補データ(i番目)とが異なる場合には(ステップS206,No)、ステップS208に移行する。 When the operation history data and the exclusion candidate data (i-th) are the same information (step S206, Yes), the detection flag is set to ON (step S207), and a value obtained by adding 1 to i is set as a new i. (Step S208), and the process proceeds to step S204. On the other hand, when the operation history data and the exclusion candidate data (i-th) are different (No at Step S206), the process proceeds to Step S208.
ところで、iの値がMの値以上である場合には(ステップS204,No)、検出フラグがオンであるか否かを判定し(ステップS209)、検出フラグがオフである場合には(ステップS210,No)、第2、3の規定値を調整(第2,3の規定値を下げる)し(ステップS211)、処理を終了する。一方、検出フラグがオンの場合には(ステップS210,Yes)、そのまま処理を終了する。 By the way, when the value of i is greater than or equal to the value of M (step S204, No), it is determined whether or not the detection flag is on (step S209), and when the detection flag is off (step S209). (S210, No), the second and third specified values are adjusted (lower the second and third specified values) (step S211), and the process is terminated. On the other hand, when the detection flag is on (step S210, Yes), the process is ended as it is.
このように、除外条件調整部170は、操作履歴データと除外候補データとが同じエントリを含んでいない場合に、第2,3の規定値を下げるので、ユーザの嗜好に合わせて、除外条件を調整することができる。
In this way, the exclusion
図10に示すように、推薦部150は、iの値を0に設定し(ステップS301)、検索結果候補インデックス(M個)を取得する(ステップS302)。そして、iの値がMの値よりも小さいか否かを判定し、iの値がMの値以上である場合には(ステップS303,No)、処理を終了する。
As shown in FIG. 10, the
一方、iの値がMの値よりも小さい場合には(ステップS303,Yes)、jの値を0に設定し(ステップS304)、操作履歴インデックス(N個)を取得する(ステップS305)。そして、jの値がNの値よりも小さいか否かを判定し、jの値がNの値以上である場合には(ステップS306,No)、ステップS317に移行する。 On the other hand, when the value of i is smaller than the value of M (step S303, Yes), the value of j is set to 0 (step S304), and the operation history index (N pieces) is acquired (step S305). Then, it is determined whether or not the value of j is smaller than the value of N. If the value of j is greater than or equal to the value of N (step S306, No), the process proceeds to step S317.
一方、jの値がNの値よりも小さい場合には(ステップS306,Yes)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との類似度を算出し(ステップS307)、類似度が第2の規定値以上であるか否かを判定する(ステップS308)。 On the other hand, when the value of j is smaller than the value of N (step S306, Yes), the similarity between the search result candidate index (i-th) and the operation history index (j-th) is calculated (step S307), It is determined whether or not the similarity is greater than or equal to a second specified value (step S308).
類似度が第2の規定値未満である場合には(ステップS309,No)、ステップS315に移行する。一方、類似度が第2の規定値以上である場合には(ステップS309,Yes)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との放送開始時間が異なるか否かを判定する(ステップS310)。 When the similarity is less than the second specified value (No at Step S309), the process proceeds to Step S315. On the other hand, if the similarity is equal to or higher than the second specified value (step S309, Yes), it is determined whether or not the broadcast start time is different between the search result candidate index (i-th) and the operation history index (j-th). Determination is made (step S310).
放送開始時間が異なる場合には(ステップS311,Yes)、一次検索結果から、検索結果候補インデックス(i番目)に対応する番組のエントリを除外し(ステップS312)、ステップS317に移行する。 If the broadcast start times are different (step S311, Yes), the program entry corresponding to the search result candidate index (i-th) is excluded from the primary search result (step S312), and the process proceeds to step S317.
一方、放送開始時間が同じである場合には(ステップS311,No)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との放送開始日が同じか否かを判定する(ステップS313)。 On the other hand, if the broadcast start times are the same (step S311, No), it is determined whether the search start candidate index (i-th) and the operation history index (j-th) have the same broadcast start date (step). S313).
放送開始日が異なる場合には(ステップS314,No)、jの値に1を加算した値を新たなjの値とし(ステップS315)、ステップS306に移行する。一方、放送開始日が同じ場合には(ステップS314,Yes)、一次検索結果から、検索結果候補インデックス(i番目)に対応する番組のエントリを除外し(ステップS316)、iの値に1を加算した値を新たなiの値とし(ステップS317)、ステップS303に移行する。 If the broadcast start date is different (No in step S314), a value obtained by adding 1 to the value of j is set as a new value of j (step S315), and the process proceeds to step S306. On the other hand, if the broadcast start date is the same (step S314, Yes), the entry of the program corresponding to the search result candidate index (i-th) is excluded from the primary search result (step S316), and the value of i is set to 1. The added value is set as a new value of i (step S317), and the process proceeds to step S303.
このように、推薦部150は、検索結果候補インデックスと操作履歴インデックスとの内積を算出して、第2の規定値と比較した後に、番組の放送開始時間および放送開始日時に基づいて、一次検索結果から不要なデータを除外しているので、ユーザの嗜好にあった検索結果を作成することができる。
As described above, the
図11に示すように、推薦部150は、iの値を0に設定し(ステップS401)、検索結果候補インデックス(M個)を取得する(ステップS402)。そして、iの値がMの値よりも小さいか否かを判定し、iの値がMの値以上である場合には(ステップS403,No)、処理を終了する。
As shown in FIG. 11, the
一方、iの値がMの値よりも小さい場合には(ステップS403,Yes)、iの値に1を加算した値をjの値に設定し(ステップS404)、jの値がMの値よりも小さいか否かを判定し、jの値がMの値以上である場合には(ステップS405,No)、iの値に1を加算した値を新たなiの値に設定し(ステップS406)、ステップS403に移行する。 On the other hand, when the value of i is smaller than the value of M (step S403, Yes), a value obtained by adding 1 to the value of i is set as the value of j (step S404), and the value of j is the value of M. If the value of j is greater than or equal to the value of M (step S405, No), a value obtained by adding 1 to the value of i is set as a new value of i (step S405). S406), the process proceeds to step S403.
一方、jの値がMの値よりも小さい場合には(ステップS405,Yes)、検索結果候補インデックス(i番目)と検索結果候補インデックス(j番目)との類似度を算出し(ステップS407)、類似度が第2の規定値以上か否かを判定する(ステップS408)。 On the other hand, when the value of j is smaller than the value of M (step S405, Yes), the similarity between the search result candidate index (i-th) and the search result candidate index (j-th) is calculated (step S407). Then, it is determined whether or not the similarity is greater than or equal to a second specified value (step S408).
類似度が第2の規定値未満である場合には(ステップS409,No)、ステップS416に移行する。一方、類似度が第2の規定値以上である場合には(ステップS409,Yes)、検索結果候補インデックス(i番目)と検索結果候補インデックス(j番目)との放送開始時間が異なるか否かを判定する(ステップS410)。 When the similarity is less than the second specified value (No at Step S409), the process proceeds to Step S416. On the other hand, if the similarity is equal to or greater than the second specified value (step S409, Yes), whether or not the broadcast start time is different between the search result candidate index (i-th) and the search result candidate index (j-th). Is determined (step S410).
放送開示時間が異なる場合には(ステップS411,Yes)、検索結果候補インデックス(i番目)あるいは検索結果候補インデックス(j番目)のうち何れか一方のインデックスに対応する番組のエントリを、一次検索結果から除外し(ステップS412)、ステップS416に移行する。 If the broadcast disclosure times are different (step S411, Yes), the entry of the program corresponding to one of the search result candidate index (i-th) or the search result candidate index (j-th) is set as the primary search result. (Step S412), and the process proceeds to step S416.
一方、放送開始時間が同じである場合には(ステップS411,No)、検索結果候補インデックス(i番目)と検索結果候補インデックス(j番目)との放送開始日が同じであるか否かを判定する(ステップS413)。 On the other hand, if the broadcast start times are the same (step S411, No), it is determined whether the search start candidate index (i-th) and the search result candidate index (j-th) have the same broadcast start date. (Step S413).
放送開示日が異なる場合には(ステップS414,No)、ステップS416に移行する。一方、放送開示日が同じである場合には(ステップS414,Yes)、検索結果候補インデックス(i番目)あるいは検索結果候補インデックス(j番目)のうち何れか一方のインデックスに対応する番組のエントリを、一次検索結果から除外し(ステップS415)、jの値に1を加算した値を新たなjの値に設定し(ステップS416)、ステップS405に移行する。 When the broadcast disclosure date is different (step S414, No), the process proceeds to step S416. On the other hand, if the broadcast disclosure dates are the same (step S414, Yes), the program entry corresponding to one of the search result candidate index (i-th) or the search result candidate index (j-th) is selected. Then, it is excluded from the primary search result (step S415), a value obtained by adding 1 to the value of j is set as a new value of j (step S416), and the process proceeds to step S405.
このように、推薦部150は、検索結果候補インデックス同士の内積を算出して、第2の規定値と比較した後に、番組の放送開始時間および放送開始日時に基づいて、一次検索結果から不要なデータを除外しているので、ユーザの嗜好にあった検索結果を作成することができる。
As described above, the
上述してきたように、本実施例1にかかる情報検索装置100は、除外条件調整部170が、操作履歴記録部120の操作履歴データと、除外履歴記録部160の除外データおよび除外候補データとを基にして、第2の規定値を調整し、推薦部150が、第2の規定値を基にして、一次検索結果から不要な番組のエントリを除外することにより検索結果をユーザに提供するので、ユーザの嗜好に合わせて除外条件を適切に設定することができると共に、ユーザのニーズに合った番組情報を提供することができる。
As described above, in the information search apparatus 100 according to the first embodiment, the exclusion
また、本実施例1にかかる情報検索装置100は、各インデックスの類似度および第2の規定値に基づいて、検索結果を作成するので、メタデータ等に表記ゆれが存在する場合にでも、ユーザにとって不要な番組、あるいは重複する番組を検索結果から除外することができる。 In addition, since the information search apparatus 100 according to the first embodiment creates a search result based on the similarity of each index and the second specified value, even when there is notation fluctuation in metadata or the like, the user Programs that are unnecessary or duplicated can be excluded from the search results.
また、本実施例1にかかる情報検索装置100は、推薦部150が、類似度に加えて、番組の放送開始時間、放送開示日時に基づいて、一次検索結果から番組のエントリを除外するので、ユーザが既に操作済みの番組の再放送やサイマル放送となる番組を取り除いた状態で検索結果をユーザに提供することができる。
Further, in the information search apparatus 100 according to the first embodiment, the
上記の実施例1では、番組の放送開始日、放送開始時間に基づいて、一次検索結果から不要な番組のエントリを除外していたが、これに限定されるものではない。例えば、検索対象がネット動画である場合には、ネット動画の配信長を基にして、一次検索結果から不要な動画の情報を除外することができる。本実施例2では、ネット動画の配信長を基にして、一次検索結果から不要な動画の情報を削除する情報検索装置200について説明を行う。 In the first embodiment, unnecessary program entries are excluded from the primary search result based on the broadcast start date and broadcast start time of the program. However, the present invention is not limited to this. For example, when the search target is a net moving image, unnecessary moving image information can be excluded from the primary search result based on the distribution length of the net moving image. In the second embodiment, an information search apparatus 200 that deletes unnecessary video information from the primary search result based on the distribution length of the net video will be described.
図12は、本実施例2にかかる情報検索装置200の構成を示す機能ブロック図である。同図に示すように、この情報検索装置200は、メタデータ取得部210と、操作履歴記録部220と、嗜好情報設定部230と、インデックス作成部240と、推薦部250と、除外履歴記録部260と、除外条件調整部270と、表示部280と、検索結果記録部290とを有する。なお、この情報検索装置200は、ネットワークに接続される通信装置や、放送波を受信する受信装置を備えているものとする(図示略)。
FIG. 12 is a functional block diagram of the configuration of the information search apparatus 200 according to the second embodiment. As shown in the figure, the information search apparatus 200 includes a
メタデータ取得部210は、ネット動画のメタデータを、ネット動画の配信元から取得する手段である。ネット動画のメタデータは、動画の配信開始日時、配信長、配信元、ジャンル、タイトル、説明、配信期限などを有する。
The
操作履歴記録部220は、ユーザがネット動画に対して行った各種の操作内容(使用、再生、閲覧、録画、自動再生、保存など)を、操作履歴データとして記録する手段である。図13は、本実施例2にかかる操作履歴データのデータ構造の一例を示す図である。同図に示すように、この操作履歴データは、ネット動画を識別するコンテンツ識別番号と、操作日時と、操作と、配信日時と、配信元と、配信長と、ジャンルと、タイトルと、説明とを有する。
The operation
嗜好情報設定部230は、ユーザの好みのネット動画を検索するための検索条件を設定する手段である。嗜好情報設定部230は、入力装置(図示略)を介してユーザからキーワードを取得し、取得した各キーワードを検索条件として設定してもよいし、操作履歴記録部220に記録された操作履歴データに含まれるテキストを取得して、検索条件に設定してもよい。
The preference
インデックス作成部240は、メタデータ取得部210のメタデータ(検索対象)のインデックス(以下、検索対象インデックス)、操作履歴記録部220の操作履歴データのインデックス(以下、操作履歴インデックス)、嗜好情報設定部230の検索条件のインデックス(以下、検索条件インデックス)をそれぞれ作成する手段である。インデックス作成部240は、作成した検索対象インデックス、操作履歴インデックス、検索条件インデックスの情報を推薦部250に出力する。なお、インデックスの作成方法は、実施例1と同様であるため、説明を省略する。
The
推薦部250は、インデックス作成部240からインデックス(検索対象インデックス、操作履歴インデックス、検索条件インデックス)の情報を取得し、取得したインデックスに基づいて、ユーザに推奨するネット動画の検索結果を作成する手段である。推薦部250は、検索結果の候補となる一次検索結果を作成する処理、一次検索結果から不要なネット動画を取り除く処理を順に実行する。以下において、一次検索結果を作成する処理、不要なネット動画を取り除く処理について順に説明する。
The
(一次検索結果を作成する処理について)
推薦部250は、各検索対象インデックスと検索条件インデックスとの類似度を算出し、算出した類似度に基づいて一次検索結果を作成する。なお、ベクトル同士の類似度は、ベクトル間の内積(あるいは角度、相関係数)で表される。
(About processing to create primary search results)
The
推薦部250は、各検索対象インデックスと検索条件インデックスとの内積を算出し、算出した内積の値が第1の規定値以上となる検索対象インデックスと検索条件インデックスとの組を抽出する(実施例1と同様に、抽出した組に含まれる検索対象インデックスを、検索結果候補インデックスと表記する。)。そして、検索結果候補インデックスに対応する各種情報(コンテンツ識別番号、配信日時、配信元、配信長、ジャンル、タイトル、説明)を一次検索結果に登録する。
The
(不要なネット動画を取り除く処理について)
推薦部250は、検索結果候補インデックスと操作履歴インデックスとを基にして、不要なエントリを一次検索結果から除外する。一次検索結果から不要なエントリが除外されたものが、最終的な検索結果となる。推薦部250は、まず、検索結果候補インデックスと操作履歴インデックスとの内積を算出する。
(About the process of removing unnecessary internet video)
The
そして、推薦部250は、算出した内積と、第2の規定値とを比較して、内積が第2の規定値以上となる検索結果候補インデックスと操作履歴インデックスとの組(以下、第1の組)を抽出する。第1の組に含まれる検索結果候補インデックスのネット動画は、対となる操作履歴インデックスのネット動画と同じネット動画である疑いが極めて高いものとなる。
Then, the
推薦部250は、第1の組に含まれる各インデックスに対応するネット動画の配信長に基づいて、第1の組に含まれる検索結果候補インデックスが、ユーザにとって不要なネット動画のインデックスであるか否かを判定する。
The
具体的に、推薦部250は、第1の組において、検索結果候補インデックスに対応するネット動画の配信長と、操作履歴インデックスに対応するネット動画の配信長とを比較する。そして、各配信長の差が第4の規定値以内となる場合には、かかる第1の組における検索結果候補インデックスのネット動画は、ユーザが既に操作したネット動画(操作履歴データのネット動画)と同じネット動画であると判定する。
Specifically, the
推薦部250は、同じネット動画であると判定したネット動画の検索結果候補インデックスに対応するエントリを一次検索結果から除外すると共に、除外したエントリを除外データに登録する。図14は、本実施例2にかかる除外データのデータ構造の一例を示す図である。同図に示すように、この除外データは、一次検索結果から除外されたネット動画のコンテンツ識別番号と、配信日時と、配信元と、配信長と、ジャンルと、タイトルと、説明とを有する。
The
続いて、推薦部250は、検索結果候補インデックス(ユーザが既に操作したネット動画と同じネット動画であると判定されたネット動画の検索結果候補インデックスを除く)同士の内積を算出し、算出した内積が第2の閾値以上となる検索結果候補インデックスの組(以下、第2の組)を抽出する。
Subsequently, the
推薦部250は、第2の組に含まれる各インデックスに対応するネット動画の配信長に基づいて、第2の組に含まれる検索結果候補インデックスが、ユーザにとって不要なネット動画のインデックスであるか否かを判定する。
The
具体的に、推薦部250は、第2の組において、一方の検索結果候補インデックスに対応するネット動画の配信長と、もう一方の検索結果候補インデックスに対応するネット動画の配信長とを比較する。各配信長の差が第4の規定値以内となる場合には、かかる第2の組における一方の検索結果候補インデックスのネット動画が、もう一方の検索結果候補インデックスのネット動画と同じネット動画であると判定する。
Specifically, in the second set, the
推薦部250は、同じネット動画であると判定したネット動画の検索結果候補インデックスを含む第2の組中で、どちらか一方の検索結果候補インデックスを選択する。そして、選択した検索結果候補インデックスに対応するエントリを一次検索結果から除外すると共に、除外したエントリを除外データ(図14参照)に登録する。また、推薦部250は、作成した除外データを除外履歴記録部260に記録する。
The
ところで、推薦部250は、検索結果インデックスと操作履歴インデックスとの内積を算出し、算出した内積と、第2の規定値と第3の規定値(ただし、第2の規定値>第3の規定値)とを比較する。そして、内積が第3の規定値以上、第2の規定値未満となる検索結果候補インデックスと操作履歴インデックスとの組(以下、第3の組)を抽出する。第3の組に含まれる検索結果候補インデックスのネット動画は、対となる操作履歴インデックスのネット動画と同じネット動画となる疑いのあるものとなる。
Incidentally, the
推薦部250は、第3の組に含まれる各インデックスに対応するネット動画の配信長に基づいて、第3の組に組まれる検索結果候補インデックスが、ユーザにとって不要なネット動画のインデックスである可能性があるか否かを判定する。
Based on the distribution length of the net video corresponding to each index included in the third set, the
具体的に、推薦部250は、第3の組において、検索結果候補インデックスに対応するネット動画の配信長と、操作履歴インデックスに対応する配信長とを比較する。そして、各配信長の差が第4の規定値以内となる場合には、かかる第3の組における検索結果候補インデックスのネット動画は、ユーザが既に操作したネット動画(操作履歴データのネット動画)と同じネット動画である可能性が高いと判定する。
Specifically, the
推薦部250は、同じネット動画である可能性が高いと判定したネット動画の検索結果候補インデックスの各種情報(コンテンツ識別番号、配信日時、配信元、配信長、ジャンル、タイトル、説明)を、除外候補データに登録する。推薦部250は、作成した除外候補データを除外履歴記録部260に記録する。
The
推薦部250は、一次検索結果から不要なネット動画を取り除いた残りのネット動画のエントリを検索結果データとして、表示部280および検索結果記録部290に出力する。図15は、本実施例2にかかる検索結果データのデータ構造の一例を示す図である。
The
図15に示すように、この検索結果データは、検索順位、コンテンツ識別番号、配信日時、配信元、配信長、ジャンル、タイトル、説明を有する。推薦部250は、例えば、検索対象インデックスと検索条件インデックスとの類似度が高いエントリほど検索順位を小さく設定して、検索結果データのエントリを並び替えてもよい。
As shown in FIG. 15, this search result data includes a search order, a content identification number, a delivery date, a delivery source, a delivery length, a genre, a title, and a description. For example, the
除外履歴記録部260は、除外データおよび除外候補データを記憶する手段である。除外履歴記録部260は、除外データあるいは除外候補データに登録されるエントリの数が規定数に達した場合や、記録してからの期間が規定期間よりも長くなったエントリを除外データ、除外候補データから削除してもよい。
The exclusion
除外条件調整部270は、除外履歴記録部260に記録された除外データおよび除外候補データと、操作履歴記録部220に記録された操作履歴データとを比較して、推薦部250が利用する第2の規定値および第3の規定値を調整する手段である。除外条件調整部270の具体的な処理の内容は、実施例1に示した除外条件調整部170と同じであるため、説明を省略する。
The exclusion
表示部280は、検索結果データ(図15参照)をディスプレイ等の画面に表示する手段である。ユーザは、かかる画面を参照して、ネット動画の録画などを設定する。検索結果記録部290は、検索結果データを保管する手段である。ユーザは、検索結果記録部290に記録された検索結果データの参照や、検索結果データのうち、保存したいエントリを指定する。
The
次に、本実施例2にかかる情報検索装置200の処理手順について説明する。図16は、本実施例2にかかる推薦部250が検索結果データを作成する処理を示すフローチャートである。
Next, a processing procedure of the information search apparatus 200 according to the second embodiment will be described. FIG. 16 is a flowchart of a process in which the
図16に示すように、推薦部250は、iの値を0に設定し(ステップS501)、検索結果候補インデックス(M個)を取得する(ステップS502)。そして、iの値がMの値よりも小さいか否かを判定し、iの値がMの値以上である場合には(ステップS503,No)、処理を終了する。
As illustrated in FIG. 16, the
一方、iの値がMの値よりも小さい場合には(ステップS503,Yes)、jの値を0に設定し(ステップS504)、操作履歴インデックス(N個)を取得する(ステップS505)。そして、jの値がNの値よりも小さいか否かを判定し、jの値がNの値以上である場合には(ステップS506,No)、ステップS503に移行する。 On the other hand, when the value of i is smaller than the value of M (step S503, Yes), the value of j is set to 0 (step S504), and the operation history index (N pieces) is acquired (step S505). Then, it is determined whether or not the value of j is smaller than the value of N. If the value of j is greater than or equal to the value of N (step S506, No), the process proceeds to step S503.
一方、jの値がNの値よりも小さい場合には(ステップS506,Yes)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との類似度を算出し(ステップS507)、類似度が第2の規定値以上であるか否かを判定する(ステップS508)。 On the other hand, when the value of j is smaller than the value of N (step S506, Yes), the similarity between the search result candidate index (i-th) and the operation history index (j-th) is calculated (step S507). It is determined whether or not the similarity is greater than or equal to a second specified value (step S508).
類似度が第2の規定値未満である場合には(ステップS509,No)、ステップS512に移行する。一方、類似度が第2の規定値以上である場合には(ステップS509,Yes)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との配信長の差が第4の規定値以内か否かを判定する(ステップS510)。 When the similarity is less than the second specified value (No at Step S509), the process proceeds to Step S512. On the other hand, when the degree of similarity is equal to or greater than the second specified value (step S509, Yes), the difference in distribution length between the search result candidate index (i-th) and the operation history index (j-th) is the fourth specified value. It is determined whether it is within the value (step S510).
配信長の差が第4の規定値外の場合は(ステップS511,No)、jの値に1を加算した値を新たなjの値とし(ステップS512)、ステップS506に移行する。一方、配信長の差が第4の規定値以内の場合は(ステップS511,Yes)、一次検索結果から、検索結果候補インデックス(i番目)に対応するネット動画のエントリを除外し(ステップS513)、ステップS503に移行する。 If the difference in delivery length is outside the fourth specified value (step S511, No), a value obtained by adding 1 to the value of j is set as a new value of j (step S512), and the process proceeds to step S506. On the other hand, if the difference in distribution length is within the fourth specified value (step S511, Yes), the entry of the net video corresponding to the search result candidate index (i-th) is excluded from the primary search result (step S513). The process proceeds to step S503.
上述してきたように、本実施例2にかかる情報検索装置200は、推薦部250が、検索結果候補インデックスと操作履歴インデックスとの内積を算出して、第2の規定値と比較した後に、ネット動画の配信長に基づいて、一次検索結果から不要なデータを除外しているので、ユーザのニーズにあった検索結果を作成することができる。
As described above, in the information search apparatus 200 according to the second embodiment, the
上記の実施例1では、番組の放送開始日、放送開始時間に基づいて、一次検索結果から不要な番組のエントリを除外していたが、これに限定されるものではない。例えば、検索対象がネット上で配信されるニュースである場合には、ニュースの配信日時を基にして、一次検索結果から不要なニュースの情報を除外することができる。本実施例3では、ニュースの配信日時を基にして、一次検索結果から不要なニュースの情報を除外する情報検索装置300について説明を行う。 In the first embodiment, unnecessary program entries are excluded from the primary search result based on the broadcast start date and broadcast start time of the program. However, the present invention is not limited to this. For example, when the search target is news distributed on the net, unnecessary news information can be excluded from the primary search result based on the distribution date of news. In the third embodiment, an information search apparatus 300 that excludes unnecessary news information from the primary search result based on the distribution date of news will be described.
図17は、本実施例3にかかる情報検索装置300の構成を示す機能ブロック図である。同図に示すように、この情報検索装置300は、メタデータ取得部310と、操作履歴記録部320と、嗜好情報設定部330と、インデックス作成部340と、推薦部350と、除外履歴記録部360と、除外条件調整部370と、表示部380と、検索結果記録部390とを有する。なお、この情報検索装置300は、ネットワークに接続される通信装置や、放送波を受信する受信装置を備えているものとする(図示略)。
FIG. 17 is a functional block diagram of the configuration of the information search apparatus 300 according to the third embodiment. As shown in the figure, the information search apparatus 300 includes a
メタデータ取得部310は、ニュースのメタデータを、ニュースの配信元から取得する手段である。ニュースのメタデータは、ニュースの配信開始日時、配信元、ジャンル、タイトル、説明、配信期限などを有する。
The
操作履歴記録部320は、ユーザがニュース動画に対して行った各種の操作内容(使用、再生、閲覧、録画、自動再生、保存など)を、操作履歴データとして記録する手段である。図18は、本実施例3にかかる操作履歴データのデータ構造の一例を示す図である。同図に示すように、この操作履歴データは、ニュースを識別するコンテンツ識別番号と、操作日時と、操作と、配信日時と、配信元と、ジャンルと、タイトルと、説明とを有する。
The operation
嗜好情報設定部330は、ユーザの好みのニュースを検索するための検索条件を設定する手段である。嗜好情報設定部330は、入力装置(図示略)を介してユーザからキーワードを取得し、取得した各キーワードを検索条件として設定してもよいし、操作履歴記録部320に記録された操作履歴データに含まれるテキストを取得して、検索条件に設定してもよい。
The preference
インデックス作成部340は、メタデータ取得部310のメタデータ(検索対象)のインデックス(以下、検索対象インデックス)、操作履歴記録部320の操作履歴データのインデックス(以下、操作履歴インデックス)、嗜好情報設定部330の検索条件のインデックス(以下、検索条件インデックス)をそれぞれ作成する手段である。インデックス作成部340は、作成した検索対象インデックス、操作履歴インデックス、検索条件インデックスの情報を推薦部350に出力する。なお、インデックスの作成方法は、実施例1と同様であるため、説明を省略する。
The
推薦部350は、インデックス作成部340からインデックス(検索対象インデックス、操作履歴インデックス、検索条件インデックス)の情報を取得し、取得したインデックスに基づいて、ユーザに推奨するニュースの検索結果を作成する手段である。推薦部350は、検索結果の候補となる一次検索結果を作成する処理、一次検索結果から不要なニュースを取り除く処理を順に実行する。以下において、一次検索結果を作成する処理、不要なニュースを取り除く処理について順に説明する。
The
(一次検索結果を作成する処理について)
推薦部350は、各検索対象インデックスと検索条件インデックスとの類似度を算出し、算出した類似度に基づいて一次検索結果を作成する。なお、ベクトル同士の類似度は、ベクトル間の内積(あるいは角度、相関係数)で表される。
(About processing to create primary search results)
The
推薦部350は、各検索対象インデックスと検索条件インデックスとの内積を算出し、算出した内積の値が第1の規定値以上となる検索対象インデックスと検索条件インデックスとの組を抽出する(実施例1と同様に、抽出した組に含まれる検索対象インデックスを、検索結果候補インデックスと表記する。)。そして、検索結果候補インデックスに対応する各種情報(コンテンツ識別番号、配信日時、配信元、ジャンル、タイトル、説明)を一次検索結果に登録する。
The
(不要なニュースを取り除く処理について)
推薦部350は、検索結果候補インデックスと操作履歴インデックスとを基にして、不要なエントリを一次検索結果から除外する。一次検索結果から不要なエントリが除外されたものが、最終的な検索結果となる。推薦部350は、まず、検索結果候補インデックスと操作履歴インデックスとの内積を算出する。
(About processing to remove unnecessary news)
The
そして、推薦部350は、算出した内積と、第2の規定値とを比較して、内積が第2の規定値以上となる検索結果候補インデックスと操作履歴インデックスとの組(以下、第1の組)を抽出する。第1の組に含まれる検索結果候補インデックスのニュースは、対となる操作履歴インデックスのニュースと同じものである疑いが極めて高い。
Then, the
推薦部350は、第1の組に含まれる各インデックスに対応するニュースの配信日時に基づいて、第1の組に含まれる検索結果候補インデックスが、ユーザにとって不要なニュースのインデックスであるか否かを判定する。
The
具体的に、推薦部350は、第1の組において、検索結果候補インデックスに対応するニュースの配信日時と、操作履歴インデックスに対応するニュースの配信日時とを比較する。そして、各配信日時の差が第5の規定値以内となる場合には、かかる第1の組における検索結果候補インデックスのニュースは、ユーザが既に操作したニュース(操作履歴データのニュース)と同じニュースであると判定する。
Specifically, in the first set, the
推薦部350は、同じニュースであると判定したニュースの検索結果候補インデックスに対応するエントリを一次検索結果から除外すると共に、除外したエントリを除外データに登録する。図19は、本実施例3にかかる除外データのデータ構造の一例を示す図である。同図に示すように、この除外データは、一次検索結果から除外されたニュースのコンテンツ識別番号と、配信日時と、配信元と、ジャンルと、タイトルと、説明とを有する。
The
続いて、推薦部350は、検索結果候補インデックス(ユーザが既に操作したニュースと同じニュースであると判定されたニュースの検索結果候補インデックスを除く)同士の内積を算出し、算出した内積が第2の閾値以上となる検索結果候補インデックスの組(以下、第2の組)を抽出する。
Subsequently, the
推薦部350は、第2の組に含まれる各インデックスに対応するニュースの配信日時に基づいて、第2の組に含まれる検索結果候補インデックスが、ユーザにとって不要なニュースのインデックスであるか否かを判定する。
The
具体的に、推薦部350は、第2の組において、一方の検索結果候補インデックスに対応するニュースの配信日時と、もう一方の検索結果候補インデックスに対応するニュースの配信日時とを比較する。各配信日時の差が第5の規定値以内となる場合には、かかる第2の組における一方の検索結果候補インデックスのニュースが、もう一方の検索結果候補インデックスのニュースと同じニュースであると判定する。
Specifically, in the second set, the
推薦部350は、同じニュースであると判定したニュースの検索結果候補インデックスを含む第2の組中で、どちらか一方の検索結果候補インデックスを選択する。そして、選択した検索結果候補インデックスに対応するエントリを一次検索結果から除外すると共に、除外したエントリを除外データ(図19参照)に登録する。また、推薦部350は、作成した除外データを除外履歴記録部360に記録する。
The
ところで、推薦部350は、検索結果インデックスと操作履歴インデックスとの内積を算出し、算出した内積と、第2の規定値と第3の規定値(ただし、第2の規定値>第3の規定値)とを比較する。そして、内積が第3の規定値以上、第2の規定値未満となる検索結果候補インデックスと操作履歴インデックスとの組(以下、第3の組)を抽出する。第3の組に含まれる検索結果候補インデックスのニュースは、対となる操作履歴インデックスのニュースと同じニュースとなる疑いのあるものとなる。
Incidentally, the
推薦部350は、第3の組に含まれる各インデックスに対応するニュースの配信日時に基づいて、第3の組に組まれる検索結果候補インデックスが、ユーザにとって不要なニュースのインデックスである可能性があるか否かを判定する。
The
具体的に、推薦部350は、第3の組において、検索結果候補インデックスに対応するニュースの配信日時と、操作履歴インデックスに対応する配信日時とを比較する。そして、各配信日時の差が第5の規定値以内となる場合には、かかる第3の組における検索結果候補インデックスのニュースは、ユーザが既に操作したニュース(操作履歴データのニュース)と同じニュースである可能性が高いと判定する。
Specifically, the
推薦部350は、同じニュースである可能性が高いと判定したニュースの検索結果候補インデックスの各種情報(コンテンツ識別番号、配信日時、配信元、ジャンル、タイトル、説明)を、除外候補データに登録する。推薦部350は、作成した除外候補データを除外履歴記録部360に記録する。
The
推薦部350は、一次検索結果から不要なニュースを取り除いた残りのニュースのエントリを検索結果データとして、表示部380および検索結果記録部390に出力する。図20は、本実施例3にかかる検索結果データのデータ構造の一例を示す図である。
The
図20に示すように、この検索結果データは、検索順位、コンテンツ識別番号、配信日時、配信元、ジャンル、タイトル、説明を有する。推薦部350は、例えば、検索対象インデックスと検索条件インデックスとの類似度が高いエントリほど検索順位を小さく設定して、検索結果データのエントリを並び替えてもよい。
As shown in FIG. 20, the search result data includes a search order, a content identification number, a delivery date / time, a delivery source, a genre, a title, and a description. For example, the
除外履歴記録部360は、除外データおよび除外候補データを記憶する手段である。除外履歴記録部360は、除外データあるいは除外候補データに登録されるエントリの数が規定数に達した場合や、記録してからの期間が規定期間よりも長くなったエントリを除外データ、除外候補データから削除してもよい。
The exclusion
除外条件調整部370は、除外履歴記録部360に記録された除外データおよび除外候補データと、操作履歴記録部320に記録された操作履歴データとを比較して、推薦部350が利用する第2の規定値および第3の規定値を調整する手段である。除外条件調整部370の具体的な処理の内容は、実施例1に示した除外条件調整部170と同じであるため、説明を省略する。
The exclusion
表示部380は、検索結果データ(図20参照)をディスプレイ等の画面に表示する手段である。ユーザは、かかる画面を参照して、ニュースの録画などを設定する。検索結果記録部390は、検索結果データを保管する手段である。ユーザは、検索結果記録部390に記録された検索結果データの参照や、検索結果データのうち、保存したいエントリを指定する。
The
次に、本実施例3にかかる情報検索装置300の処理手順について説明する。図21は、本実施例3にかかる推薦部350が検索結果データを作成する処理を示すフローチャートである。
Next, a processing procedure of the information search apparatus 300 according to the third embodiment will be described. FIG. 21 is a flowchart of the process in which the
図21に示すように、推薦部350は、iの値を0に設定し(ステップS601)、検索結果候補インデックス(M個)を取得する(ステップS602)。そして、iの値がMの値よりも小さいか否かを判定し、iの値がMの値以上である場合には(ステップS603,No)、処理を終了する。
As shown in FIG. 21, the
一方、iの値がMの値よりも小さい場合には(ステップS603,Yes)、jの値を0に設定し(ステップS604)、操作履歴インデックス(N個)を取得する(ステップS605)。そして、jの値がNのあたいよりも小さいか否かを判定し、jの値がNの値以上である場合には(ステップS606,No)、ステップS603に移行する。 On the other hand, when the value of i is smaller than the value of M (step S603, Yes), the value of j is set to 0 (step S604), and the operation history index (N pieces) is acquired (step S605). Then, it is determined whether or not the value of j is smaller than N. If the value of j is equal to or greater than the value of N (step S606, No), the process proceeds to step S603.
一方、jの値がNの値よりも小さい場合には(ステップS606,Yes)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との類似度を算出し(ステップS607)、類似度が第2の規定値以上であるか否かを判定する(ステップS608)。 On the other hand, when the value of j is smaller than the value of N (step S606, Yes), the similarity between the search result candidate index (i-th) and the operation history index (j-th) is calculated (step S607). It is determined whether or not the similarity is greater than or equal to a second specified value (step S608).
類似度が第2の規定値未満である場合には(ステップS609,No)、ステップS612に移行する。一方、類似度が第2の規定値以上である場合には(ステップS609,Yes)、検索結果候補インデックス(i番目)と操作履歴インデックス(j番目)との配信日時の差が第5の規定値以内か否かを判定する(ステップS610)。 When the similarity is less than the second specified value (No at Step S609), the process proceeds to Step S612. On the other hand, if the similarity is equal to or greater than the second specified value (step S609, Yes), the difference in delivery date and time between the search result candidate index (i-th) and the operation history index (j-th) is the fifth specified value. It is determined whether the value is within the range (step S610).
配信日時の差が第5の規定値外の場合には(ステップS611,No)、jの値に1を加算した値を新たなjの値とし(ステップS612)、ステップS606に移行する。一方、配信日時の差が第5の規定値以内の場合は(ステップS611,Yes)、一次検索結果から、検索結果候補インデックス(i番目)に対応するニュースのエントリを除外し(ステップS613)、ステップS603に移行する。 If the difference in delivery date / time is outside the fifth specified value (step S611, No), a value obtained by adding 1 to the value of j is set as a new value of j (step S612), and the process proceeds to step S606. On the other hand, if the difference in distribution date and time is within the fifth specified value (step S611, Yes), the news entry corresponding to the search result candidate index (i-th) is excluded from the primary search result (step S613), The process proceeds to step S603.
上述してきたように、本実施例3にかかる情報検索装置300は、推薦部350が、検索結果候補インデックスと操作履歴インデックスとの内積を算出して、第2の規定値と比較した後に、ニュースの配信日時に基づいて、一次検索結果から不要なデータを除外しているので、ユーザのニーズに合った検索結果を作成することができる。
As described above, in the information search apparatus 300 according to the third embodiment, after the
ところで、本実施例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部あるいは一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。 By the way, among the processes described in the present embodiment, all or a part of the processes described as being automatically performed can be manually performed, or the processes described as being performed manually can be performed. All or a part can be automatically performed by a known method. In addition, the processing procedure, control procedure, specific name, and information including various data and parameters shown in the above-described document and drawings can be arbitrarily changed unless otherwise specified.
また、図1、図12、図17に示した情報検索装置100,200,300の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部または任意の一部がCPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。 Each component of the information search apparatuses 100, 200, and 300 shown in FIGS. 1, 12, and 17 is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution / integration of each device is not limited to that shown in the figure, and all or a part thereof may be functionally or physically distributed or arbitrarily distributed in arbitrary units according to various loads or usage conditions. Can be integrated and configured. Furthermore, each processing function performed by each device may be realized by a CPU and a program that is analyzed and executed by the CPU, or may be realized as hardware by wired logic.
図22は、実施例1〜3にかかる情報検索装置100,200,300を構成するコンピュータ400のハードウェア構成を示す図である。図22に示すように、このコンピュータ(情報検索装置)400は、入力装置410、出力装置420、RAM(Random Access Memory)430、ROM(Read Only Memory)440、記憶媒体からデータを読み取る媒体読取装置450、他の装置との間でデータの送受信を行う通信装置460、CPU(Central Processing Unit)470、HDD(Hard Disk Drive)480をバス490で接続して構成される。
FIG. 22 is a diagram illustrating a hardware configuration of a
そして、HDD480には、上記した情報検索装置100,200,300の機能と同様の機能を発揮する検索結果作成プログラム480aが記憶されている。CPU470が、検索結果作成プログラム480aを読み出して実行することにより、検索結果作成プロセス470aが起動される。ここで、検索結果作成プロセス470aは、図1,図12,図17に示した、メタデータ取得部110,210,310、操作履歴記録部120,220,320、嗜好情報設定部130,230,330、インデックス作成部140,240,340、推薦部150,250,350、除外履歴記録部160,260,360、除外条件調整部170,270,370、検索結果記録部190,290,390等に対応する。
The
また、RAM430は、検索結果作成プロセス470aに利用される各種データ430aを記憶する。この各種データ430aは、メタデータ(図2参照)、操作履歴データ(図3参照)、除外データ(図5参照)、除外候補データ(図6参照)などに対応する。CPU470は、RAM430に格納された各種データ430aを読み出して、処理を実行することにより、検索結果データを作成する。
The
ところで、図22に示した検索結果作成プログラム480aは、必ずしも最初からHDD480に記憶させておく必要はない。たとえば、コンピュータに挿入されるフレキシブルディスク(FD)、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」、または、コンピュータの内外に備えられるハードディスクドライブ(HDD)などの「固定用の物理媒体」、さらには、公衆回線、インターネット、LAN、WANなどを介してコンピュータに接続される「他のコンピュータ(またはサーバ)」などに検索結果作成プログラム480aを記憶しておき、コンピュータがこれらから検索結果作成プログラム480aを読み出して実行するようにしてもよい。
By the way, the search
以上の実施例1〜3を含む実施形態に関し、更に以下の付記を開示する。 The following appendices are further disclosed with respect to the embodiments including the first to third embodiments.
(付記1)検索対象となる情報のメタデータを取得して保管するメタデータ取得部と、
ユーザによる過去の操作履歴の内容と、操作対象となった情報のメタデータとを対応付けた操作履歴の情報を保管する操作履歴記録部と、
前記メタデータ取得部で保管した検索対象の情報のメタデータと、前記操作履歴記録部で保管した操作対象の情報のメタデータのテキスト部分から、それぞれのインデックスを作成するインデックス作成部と、
前記インデックス作成部で作成した各インデックスを比較して各検索結果を得た後、前記操作履歴の情報と前記検索結果の情報とのインデックスの類似度、もしくは、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす検索結果を、除外する候補の検索結果となる除外検索結果として抽出する推薦部と、
前記推薦部が抽出した前記除外検索結果の情報を保管する除外履歴記録部と、
前記除外履歴記録部に保管された除外検索結果の情報と、前記操作履歴記録部に保管された操作履歴の情報とを基にして、前記推薦部が前記除外検索結果を抽出するための条件を調整する除外条件調整部と、
を備えることを特徴とする情報検索装置。
(Supplementary Note 1) A metadata acquisition unit that acquires and stores metadata of information to be searched;
An operation history recording unit for storing operation history information in which the contents of the past operation history by the user and the metadata of the information to be operated are associated;
An index creation unit that creates each index from the metadata of the information to be searched stored in the metadata acquisition unit and the text part of the metadata of the operation target information stored in the operation history recording unit;
After obtaining each search result by comparing each index created by the index creation unit, the similarity between the index of the operation history information and the search result information, or the index of the search result information A recommendation unit that extracts a search result whose similarity is within a predetermined range and a comparison result other than the text portion of the metadata satisfies a predetermined condition as an excluded search result that is a candidate search result to be excluded;
An exclusion history recording unit for storing information of the exclusion search result extracted by the recommendation unit;
Based on the information on the exclusion search result stored in the exclusion history recording unit and the information on the operation history stored in the operation history recording unit, the condition for the recommendation unit to extract the exclusion search result is as follows. An exclusion condition adjustment section to be adjusted;
An information retrieval apparatus comprising:
(付記2)前記推薦部は、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす場合に、比較した検索結果のうち一方の検索結果を、除外検索結果として抽出することを特徴とする付記1に記載の情報検索装置。
(Additional remark 2) The said recommendation part is compared and searched when the similarity of the index of the information of the said search result is in a predetermined range, and comparison results other than the text part of metadata satisfy | fill predetermined conditions. The information search device according to
(付記3)前記除外条件調整部は、前記除外検索結果の情報と前記操作履歴記録部に保管された操作対象の情報とを比較して、一致する情報が含まれている場合に、前記インデックスの類似度の比較対象となる所定の範囲を狭めることを特徴とする付記1または2に記載の情報検索装置。
(Additional remark 3) The said exclusion condition adjustment part compares the information of the said exclusion search result, and the information of the operation object preserve | saved at the said operation history recording part, and the said index is contained when the information which corresponds is contained. 3. The information search device according to
(付記4)前記除外条件調整部は、類似度が所定値以上となる第1除外情報と、類似度が所定値未満となる第2除外情報とを作成し、前記第2除外情報と、前記操作履歴記録部に保管された操作対象の情報とを比較して、一致する情報が含まれていない場合に、前記インデックスの類似度の比較対象となる所定の範囲を広めることを特徴とする付記1、2または3に記載の情報検索装置。 (Additional remark 4) The said exclusion condition adjustment part produces | generates the 1st exclusion information from which a similarity becomes more than predetermined value, and the 2nd exclusion information from which a similarity becomes less than predetermined value, The said 2nd exclusion information, A supplementary note that compares the information of the operation target stored in the operation history recording unit and expands a predetermined range to be compared with the similarity of the index when no matching information is included The information search device according to 1, 2, or 3.
(付記5)前記推薦部は、前記操作履歴の情報と検索結果の情報とのメタデータの放送開始時間、あるいは、検索結果同士のメタデータの放送開始時間を比較して、放送開始時間が異なっている検索結果を前記除外検索結果として抽出することを特徴とする付記1〜4のいずれか一つに記載の情報検索装置。
(Additional remark 5) The said recommendation part compares the broadcast start time of the metadata of the said operation history information and the information of a search result, or the broadcast start time of the metadata of search results, and broadcast start time differs. The information search device according to any one of
(付記6)前記推薦部は、前記操作履歴の情報と検索結果の情報とのメタデータの放送開始日、あるいは、検索結果同士のメタデータの放送開始日を比較して、放送開始日が同一となる検索結果を前記除外検索結果として抽出することを特徴とする付記1〜5のいずれか一つに記載の情報検索装置。
(Additional remark 6) The said recommendation part compares the broadcast start date of the metadata with the information of the said operation history, and the information of a search result, or the broadcast start date of the metadata of search results, and a broadcast start date is the same The information search device according to any one of
(付記7)前記推薦部は、前記操作履歴の情報と前記検索結果の情報とのコンテンツの配信長、あるいは、検索結果同士のコンテンツの配信長を比較して、配信長の差が所定値未満となる検索結果を前記除外検索結果として抽出することを特徴とする付記1〜6のいずれか一つに記載の情報検索装置。
(Supplementary Note 7) The recommendation unit compares the content distribution length between the operation history information and the search result information or the content distribution length between the search results, and the difference in distribution length is less than a predetermined value. The information search device according to any one of
(付記8)前記推薦部は、前記操作履歴の情報と前記検索結果の情報とのコンテンツの配信日時、あるいは、検索結果同士のコンテンツの配信日時を比較して、配信日時の差が所定値未満となる検索結果を前記除外検索結果として抽出することを特徴とする付記1〜7のいずれか一つに記載の情報検索装置。
(Supplementary Note 8) The recommendation unit compares the content distribution date and time between the operation history information and the search result information or the content distribution date and time between the search results, and the difference in distribution date and time is less than a predetermined value. The information search device according to any one of
(付記9)情報検索装置が、
検索対象となる情報のメタデータを取得して記憶装置に保管するステップと、
ユーザによる過去の操作履歴の内容と、操作対象となった情報のメタデータとを対応付けた操作履歴の情報を記憶装置に保管するステップと、
前記記憶装置に保管した検索対象の情報のメタデータと、操作対象の情報のメタデータのテキスト部分から、それぞれのインデックスを作成するステップと、
作成した各インデックスを比較して各検索結果を得た後、前記操作履歴の情報と前記検索結果の情報とのインデックスの類似度、もしくは、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす検索結果を、除外する候補の検索結果となる除外検索結果として抽出するステップと、
前記除外検索結果の情報を記憶装置に保管するステップと、
前記記憶装置に保管された前記除外検索結果の情報と、前記操作履歴の情報とを基にして、前記除外検索結果を抽出するための条件を調整するステップと、
を含んだことを特徴とする検索方法。
(Supplementary note 9) The information retrieval device is
Obtaining metadata of information to be searched and storing it in a storage device;
Storing information of operation history in which the content of the past operation history by the user is associated with the metadata of the information to be operated in a storage device;
Creating each index from the metadata of the information to be searched stored in the storage device and the text portion of the metadata of the information to be operated;
After each of the created indexes is compared to obtain each search result, the index similarity between the operation history information and the search result information, or the index similarity between the search result information is a predetermined value. Extracting a search result within a range and a comparison result other than the text portion of the metadata that satisfies a predetermined condition as an excluded search result that is a candidate search result to be excluded;
Storing information of the excluded search result in a storage device;
Adjusting a condition for extracting the exclusion search result based on the information of the exclusion search result stored in the storage device and the information of the operation history;
The search method characterized by including.
(付記10)コンピュータに、
検索対象となる情報のメタデータを取得して記憶装置に保管するメタデータ取得手順と、
ユーザによる過去の操作履歴の内容と、操作対象となった情報のメタデータとを対応付けた操作履歴の情報を記憶装置に保管する操作履歴記録手順と、
前記記憶装置に保管した検索対象の情報のメタデータと、操作対象の情報のメタデータのテキスト部分から、それぞれのインデックスを作成するインデックス作成手順と、
作成した各インデックスを比較して各検索結果を得た後、前記操作履歴の情報と前記検索結果の情報とのインデックスの類似度、もしくは、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす検索結果を、除外する候補の検索結果となる除外検索結果として抽出する推薦手順と、
前記除外検索結果の情報を記憶装置に保管する除外候補記録手順と、
前記記憶装置に保管された前記除外検索結果の情報と、前記操作履歴の情報とを基にして、前記除外検索結果を抽出するための条件を調整する除外条件調整手順と、
を実行させることを特徴とする検索プログラム。
(Appendix 10)
A metadata acquisition procedure for acquiring metadata of information to be searched and storing it in a storage device;
An operation history recording procedure for storing, in a storage device, operation history information in which the contents of past operation history by the user and the metadata of the information to be operated are associated;
An index creation procedure for creating respective indexes from the metadata of the search target information stored in the storage device and the text portion of the metadata of the operation target information;
After each of the created indexes is compared to obtain each search result, the index similarity between the operation history information and the search result information, or the index similarity between the search result information is a predetermined value. A recommendation procedure for extracting a search result that satisfies a predetermined condition within a range and a comparison result other than the text portion of the metadata as a search result of a candidate to be excluded,
Exclusion candidate recording procedure for storing information of the exclusion search result in a storage device;
An exclusion condition adjustment procedure for adjusting a condition for extracting the exclusion search result based on the information of the exclusion search result stored in the storage device and the information of the operation history;
A search program characterized in that is executed.
100,200,300 情報検索装置
110,210,310 メタデータ取得部
120,220,320 操作履歴記録部
130,230,330 嗜好情報設定部
140,240,340 インデックス作成部
150,250,350 推薦部
160,260,360 除外履歴記録部
170,270,370 除外条件調整部
180,280,380 表示部
190,290,390 検索結果記録部
400 コンピュータ
410 入力装置
420 出力装置
430 RAM
430a 各種データ
440 ROM
450 媒体読取装置
460 通信装置
470 CPU
470a 検索結果作成プロセス
480 HDD
480a 検索結果作成プログラム
490 バス
100, 200, 300
430a
450
470a Search
480a Search
Claims (5)
ユーザによる過去の操作履歴の内容と、操作対象となった情報のメタデータとを対応付けた操作履歴の情報を保管する操作履歴記録部と、
前記メタデータ取得部で保管した検索対象の情報のメタデータと、前記操作履歴記録部で保管した操作対象の情報のメタデータのテキスト部分から、それぞれのインデックスを作成するインデックス作成部と、
前記インデックス作成部で作成した各インデックスを比較して各検索結果を得た後、前記操作履歴の情報と前記検索結果の情報とのインデックスの類似度、もしくは、前記検索結果の情報同士のインデックスの類似度が所定の範囲内で、かつ、メタデータのテキスト部分以外の比較結果が所定の条件を満たす検索結果を、除外する候補の検索結果となる除外検索結果として抽出する推薦部と、
前記推薦部が抽出した前記除外検索結果の情報を保管する除外履歴記録部と、
前記除外履歴記録部に保管された除外検索結果の情報と、前記操作履歴記録部に保管された操作履歴の情報とを基にして、前記推薦部が前記除外検索結果を抽出するための条件を調整する除外条件調整部と、
を備えることを特徴とする情報検索装置。 A metadata acquisition unit that acquires and stores metadata of information to be searched;
An operation history recording unit for storing operation history information in which the contents of the past operation history by the user and the metadata of the information to be operated are associated;
An index creation unit that creates each index from the metadata of the information to be searched stored in the metadata acquisition unit and the text part of the metadata of the operation target information stored in the operation history recording unit;
After obtaining each search result by comparing each index created by the index creation unit, the similarity between the index of the operation history information and the search result information, or the index of the search result information A recommendation unit that extracts a search result whose similarity is within a predetermined range and a comparison result other than the text portion of the metadata satisfies a predetermined condition as an excluded search result that is a candidate search result to be excluded;
An exclusion history recording unit for storing information of the exclusion search result extracted by the recommendation unit;
Based on the information on the exclusion search result stored in the exclusion history recording unit and the information on the operation history stored in the operation history recording unit, the condition for the recommendation unit to extract the exclusion search result is as follows. An exclusion condition adjustment section to be adjusted;
An information retrieval apparatus comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008110152A JP5136181B2 (en) | 2008-04-21 | 2008-04-21 | Information retrieval device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008110152A JP5136181B2 (en) | 2008-04-21 | 2008-04-21 | Information retrieval device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009259150A JP2009259150A (en) | 2009-11-05 |
JP5136181B2 true JP5136181B2 (en) | 2013-02-06 |
Family
ID=41386469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008110152A Expired - Fee Related JP5136181B2 (en) | 2008-04-21 | 2008-04-21 | Information retrieval device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5136181B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5749676B2 (en) * | 2012-03-28 | 2015-07-15 | 株式会社Nttドコモ | RECOMMENDATION INFORMATION GENERATION DEVICE AND RECOMMENDATION INFORMATION GENERATION METHOD |
JP5877775B2 (en) * | 2012-09-03 | 2016-03-08 | 株式会社日立製作所 | Content management apparatus, content management system, content management method, program, and storage medium |
KR101488980B1 (en) * | 2013-07-24 | 2015-02-04 | 동명대학교산학협력단 | System and method for providing personalized internet information |
JP7057640B2 (en) * | 2017-09-20 | 2022-04-20 | ヤフー株式会社 | Information retrieval device, information retrieval method, and information retrieval program |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4014713B2 (en) * | 1997-12-19 | 2007-11-28 | 株式会社野村総合研究所 | Search support system for multi-attribute data group |
JP2002157272A (en) * | 2000-11-21 | 2002-05-31 | Fuji Xerox Co Ltd | Business supporting device |
JP3747847B2 (en) * | 2001-12-14 | 2006-02-22 | 日本ビクター株式会社 | Recording apparatus and recording / reproducing apparatus |
JP2007213476A (en) * | 2006-02-13 | 2007-08-23 | Toshiba Corp | Information collection system |
JP4407661B2 (en) * | 2006-04-05 | 2010-02-03 | ソニー株式会社 | Broadcast program reservation apparatus, broadcast program reservation method and program thereof |
-
2008
- 2008-04-21 JP JP2008110152A patent/JP5136181B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009259150A (en) | 2009-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5740814B2 (en) | Information processing apparatus and method | |
KR101644789B1 (en) | Apparatus and Method for providing information related to broadcasting program | |
CN106331778B (en) | Video recommendation method and device | |
US8719248B2 (en) | Semantic-based search engine for content | |
US8478759B2 (en) | Information presentation apparatus and mobile terminal | |
CN101778233B (en) | Data processing apparatus, data processing method | |
JP5359534B2 (en) | Information processing apparatus and method, and program | |
JPWO2008081664A1 (en) | Advertisement distribution system, advertisement distribution server, advertisement distribution method, program, and recording medium | |
JP2010061600A (en) | Recommendation device and method, program, and recording medium | |
JP2010097249A (en) | Electronic apparatus, content recommendation method, and program | |
US8195687B2 (en) | Program retrieval support device for accumulating and searching pieces of program information and corresponding programs and a method for performing the same | |
CN110430476A (en) | Direct broadcasting room searching method, system, computer equipment and storage medium | |
US20090083796A1 (en) | Information recommendation apparatus and method | |
KR20080049604A (en) | Tv program search apparatus | |
US8397263B2 (en) | Information processing apparatus, information processing method and information processing program | |
JP5136181B2 (en) | Information retrieval device | |
KR101051804B1 (en) | System of targeting data service for web-based media contents | |
US20060085416A1 (en) | Information reading method and information reading device | |
US20190082236A1 (en) | Determining Representative Content to be Used in Representing a Video | |
JP2009141753A (en) | Recorder of broadcast program | |
JP2004362019A (en) | Information recommendation device, information recommendation method, information recommendation program and recording medium | |
JP2008227909A (en) | Video retrieval apparatus | |
JP5335500B2 (en) | Content search apparatus and computer program | |
JP2006340136A (en) | Video image reproducing method, index information providing method, video image reproducing terminal, and video index creation and retrieval system | |
CN109933691B (en) | Method, apparatus, device and storage medium for content retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120928 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121016 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121029 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151122 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |