JP2016212740A - コンテンツ検索システム、方法及びプログラム - Google Patents

コンテンツ検索システム、方法及びプログラム Download PDF

Info

Publication number
JP2016212740A
JP2016212740A JP2015097548A JP2015097548A JP2016212740A JP 2016212740 A JP2016212740 A JP 2016212740A JP 2015097548 A JP2015097548 A JP 2015097548A JP 2015097548 A JP2015097548 A JP 2015097548A JP 2016212740 A JP2016212740 A JP 2016212740A
Authority
JP
Japan
Prior art keywords
content
information
search
identification information
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015097548A
Other languages
English (en)
Inventor
大礎 遠藤
Hiroki Endo
大礎 遠藤
寿之 大亦
Toshiyuki Omata
寿之 大亦
松村 欣司
Kinji Matsumura
欣司 松村
藤澤 和也
Kazuya Fujisawa
和也 藤澤
謙二郎 加井
Kenjiro Kai
謙二郎 加井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK filed Critical Nippon Hoso Kyokai NHK
Priority to JP2015097548A priority Critical patent/JP2016212740A/ja
Publication of JP2016212740A publication Critical patent/JP2016212740A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザがコンテンツを容易に特定できるコンテンツ検索システム、方法及びプログラムを提供すること。【解決手段】コンテンツ検索システム1は、複数のコンテンツそれぞれに対応付けて、当該コンテンツを特定するための識別情報の組み合わせを1組以上、当該対応付けの重みと共に記憶する識別情報データベース11と、コンテンツの検索情報の入力を受け付ける入力情報解析部22と、検索情報と識別情報の組み合わせとのマッチング結果、及び重みに基づいて、複数のコンテンツから候補コンテンツを抽出する識別子抽出部23と、を備える。【選択図】図1

Description

本発明は、コンテンツを検索するシステム、方法及びプログラムに関する。
従来、映像、音声、書籍等、様々なコンテンツが作成され、多様なメディアを通じて公開されている。ユーザがこれらのコンテンツにアクセスする場合、コンテンツに応じた所定の識別子を指定することにより、対象のコンテンツが特定される。
特許文献1では、コンテンツ情報の特徴量から識別子を生成する技術が提案されている。
また、特許文献2では、利用者の情報によって、オリジナルコンテンツに含める付加リンク情報を変更する技術が提案されている。
国際公開第2007/043679号 特開2003−030193号公報
コンテンツにアクセスするためには、ユーザは、該当コンテンツの識別子を予め把握する必要がある。また、この識別子を把握するためには、ユーザは、コンテンツを一意に特定できるだけの十分な識別情報を知っている必要があった。ところが、コンテンツの識別子は、その命名者により多様なフォーマットが用いられているため、容易に解釈できなかった。
本発明は、ユーザがコンテンツを容易に特定できるコンテンツ検索システム、方法及びプログラムを提供することを目的とする。
本発明に係るコンテンツ検索システムは、複数のコンテンツそれぞれに対応付けて、当該コンテンツを特定するための識別情報の組み合わせを1組以上、当該対応付けの重みと共に記憶する記憶部と、前記コンテンツの検索情報の入力を受け付ける入力部と、前記検索情報と前記識別情報の組み合わせとのマッチング結果、及び前記重みに基づいて、前記複数のコンテンツから候補コンテンツを抽出する抽出部と、を備える。
前記コンテンツ検索システムは、前記候補コンテンツから一のコンテンツの選択入力を受け付ける選択部と、前記一のコンテンツに対応付けて、前記検索情報を前記識別情報として前記記憶部に追加記憶させる更新部と、を備えてもよい。
前記入力部は、前記一のコンテンツが選択されない場合に、前記検索情報の変更入力を受け付けてもよい。
前記更新部は、前記一のコンテンツが選択された際の前記検索情報が既存の識別情報の組み合わせを含む場合、当該組み合わせについての前記重みを上昇させてもよい。
前記識別情報は、ユーザの属性又は検索時の状況をユーザ情報として含み、前記入力部は、前記検索情報の一部として、前記ユーザ情報を取得してもよい。
前記入力部は、前記検索情報に含まれる要素の組み合わせを解析し、前記識別情報の形式に変換してもよい。
前記入力部は、前記検索情報の一部として、前記識別情報の人気度に基づくキーワードを含む環境情報を取得してもよい。
本発明に係るコンテンツ検索方法は、複数のコンテンツそれぞれに対応付けて、当該コンテンツを特定するための識別情報の組み合わせを1組以上、当該対応付けの重みと共に記憶する記憶部を参照するコンピュータが、前記コンテンツの検索情報の入力を受け付ける入力ステップと、前記検索情報と前記識別情報の組み合わせとのマッチング結果、及び前記重みに基づいて、前記複数のコンテンツから候補コンテンツを抽出する抽出ステップと、を実行する。
本発明に係るコンテンツ検索プログラムは、複数のコンテンツそれぞれに対応付けて、当該コンテンツを特定するための識別情報の組み合わせを1組以上、当該対応付けの重みと共に記憶する記憶部を参照するコンピュータに、前記コンテンツの検索情報の入力を受け付ける入力ステップと、前記検索情報と前記識別情報の組み合わせとのマッチング結果、及び前記重みに基づいて、前記複数のコンテンツから候補コンテンツを抽出する抽出ステップと、を実行させる。
本発明によれば、ユーザがコンテンツを容易に特定できる。
実施形態に係るコンテンツ検索システムの構成例を示す図である。 実施形態に係る識別情報データベースを例示する図である。 実施形態に係る識別情報データベースの更新手順を例示する図である。 実施形態に係る識別子解決処理を示すシーケンス図である。 実施形態に係る識別子が解決される第1のパターンを示す図である。 実施形態に係る識別子が解決される第2のパターンを示す図である。 実施形態に係る識別子が解決される第3のパターンを示す図である。
以下、本発明の実施形態の一例について説明する。
図1は、本実施形態に係るコンテンツ検索システム1の構成例を示す図である。
コンテンツ検索システム1は、格納装置10と、抽出装置20と、取得装置30とを備える。
格納装置10は、識別情報データベース11(記憶部)と、識別情報入力部12(更新部)とを備える。
識別情報データベース11は、コンテンツの実体を識別するための識別情報を管理するデータベースであり、コンテンツの実体に対して1組以上の識別情報の組み合わせが対応付けの重みと共に記憶される。
図2は、本実施形態に係る識別情報データベース11を例示する図である。
識別情報は、例えば、コンテンツの呼称、制作者又は配信者、配信媒体、配信日時等を含む。識別情報は、これらの他、コンテンツの内容に関する情報、コンテンツに対するユーザのコメント等、様々な情報を含んでよい。
これらの識別情報、及び識別情報の組み合わせは、コンテンツを必ずしも一意に特定するものではなく、同一の識別情報の組み合わせが複数のコンテンツに対してそれぞれ重み付けがされて対応付けられてもよい。
例えば、図2のように、同じタイトル名の複数のコンテンツ(例えば、映画とドラマ)が存在する場合、これらのコンテンツに同一の識別情報が対応付けられてもよい。この識別情報が指し示すコンテンツの実体、すなわちコンテンツ識別子は、状況によって変化する。したがって、実際に識別子として解決された割合等に基づく重みが設定される。
ここで、同一のコンテンツが異なる配信者又は配信方法によって提供されるとき、それぞれに異なる識別子が付与される場合が考えられる。この場合、識別情報データベース11上においては、それぞれ異なるコンテンツ実体(識別子)として登録されてもよい。すなわち、1つのコンテンツ実体に対して一意の識別子が付与されない場合であっても、複数の識別子として識別情報データベース11に登録可能である。
識別情報入力部12は、コンテンツの権利保持者又は配信者からEPG(Electronic Program Guide)等によって、あるいは抽出装置20又は取得装置30等から識別情報の入力を受け付け、識別情報データベース11に登録する。
また、識別情報入力部12は、識別情報の入力に応じて、組み合わせに対して付与されている重みの更新を行う。例えば、識別情報入力部12は、多数のユーザにより重複して入力された識別情報に対して、重み付けをより高く設定し、コンテンツ識別子と識別情報との関係性を高める。
図3は、本実施形態に係る識別情報データベース11の更新手順を例示する図である。
例えば、コンテンツの識別子と識別情報とが入力されたとき、これらが既存の情報と重複する場合、特に既存の識別情報の組み合わせを全て含む入力の場合には、識別情報入力部12は、この識別情報に対する重みを加算する。
このとき、コンテンツ制作者又は配信者等の一次配布者による情報が拡散され複数ユーザにより重複して入力されるため、要素の重み付けがデータの正確さに相関する。
また、新しい識別情報の組み合わせ、又は既存の識別情報の組み合わせに新しい識別情報を付加した入力であった場合には、識別情報入力部12は、この識別情報の組み合わせを識別情報データベース11へ新たに挿入する。
ここで、識別情報が重複することの判定は、所定の類似度に基づいてよく、識別情報入力部12は、所定の類似度に満たない識別情報の入力があった場合に、新しい情報として識別情報データベース11へ挿入する。
また、同じコンテンツに対して異なる識別子が付与されているとき、格納装置10は識別情報の重複等の関連性の高さによって、複数のコンテンツ実体(識別子)を同一のものとして適宜統合して扱ってもよい。例えば、識別情報入力部12は、識別情報が類似する複数の識別子のうち、いずれか1つを採用して他の識別子を統合するように識別情報データベース11を更新してもよい。
なお、識別情報データベース11は、2次元のテーブルとして例示したが、これには限られない。識別情報データベース11は、複数のテーブルが互いに関連するデータベースであってもよいし、カラムの内容が複数になる多次元のテーブル、又は識別情報の種別を示すタグの集合で表現される等、多様な形式が採用可能である。
また、重みの値に関して、初期値及び増減のルールは適宜設定されてよい。また、重みの値は相対的に評価されるため、減算を行わない構成であってもよい。あるいは、一定期間更新されなかった識別情報の組み合わせの重みを減算したり、この組み合わせ自体削除したりして、識別情報データベース11を最適化する構成であってもよい。
抽出装置20は、環境情報入力部21と、入力情報解析部22(入力部)と、識別子抽出部23(抽出部)と、識別子候補提示部24とを備える。
環境情報入力部21は、複数ユーザ(システム利用者全体)の傾向を示す環境情報として、例えばSNS(Social Networking Service)又はニュース情報等から得られる人気度に基づいたキーワードを取得する。
入力情報解析部22は、取得装置30から検索情報を受信すると共に、環境情報入力部21から環境情報を取得する。入力情報解析部22は、これらの情報を解析し、識別情報データベース11とマッチングするための情報に変換する。具体的には、入力情報解析部22は、例えば、検索情報のうち、ユーザにより入力された「昨日」と、ユーザ情報として取得した現在日時とからユーザが意図した日付を求める等、複数の識別情報の組み合わせを解析し、識別情報データベース11の記述形式に合わせた情報を生成する。
識別子抽出部23は、入力情報解析部22の解析結果を用いて格納装置10に問い合わせを行う。具体的には、識別子抽出部23は、解析結果を識別情報データベース11に記憶されている識別情報とマッチングした結果に対して、各識別情報の重みに基づいて順位付けした候補コンテンツの識別子のリストを抽出する。
このとき、識別子抽出部23は、例えば長期間更新されていない、又はコンテンツ自体の配信日時が古い場合の重みを低く調整してもよい。
識別子候補提示部24は、識別子抽出部23により抽出された候補コンテンツの識別子のリストを、取得装置30へ送信する。
取得装置30は、識別子要求部31と、ユーザ情報入力部32と、識別子選択部33(選択部)とを備える。
識別子要求部31は、ユーザからコンテンツ識別子の要求を受け付け、入力された検索情報を抽出装置20へ送信することにより、候補コンテンツの提示を要求する。また、識別子選択部33によりコンテンツが選択されない場合、検索情報の変更入力、すなわち情報の追加又は既に入力された情報の変更を受け付ける。
ユーザ情報入力部32は、検索情報の一部として、ユーザの年齢、性別、嗜好等の属性、又は検索時の日時、場所、移動速度、周囲の音量、気温、天気等の状況を含むユーザ情報を取得し、抽出装置20へ通知する。なお、ユーザの属性は、検索時に取得され、又は予め取得装置30に登録されていてよい。また、検索時の状況は、各種センサ情報又は演算情報等から取得される。
識別子選択部33は、抽出装置20から候補コンテンツの識別子のリストを受信し、このリストをユーザに提示すると共に、ユーザが意図する1つのコンテンツの識別子の選択入力を受け付ける。
識別子選択部33は、コンテンツ識別子の候補それぞれの重みに基づいて、例えば、上位の所定数を提示してもよいし、予め設定された閾値以上の重みがあるものを提示してもよい。また、識別子選択部33は、所定以上の重みを有する第1位の候補を、自動的に選択して提示してもよい。
なお、これらの候補コンテンツの絞り込みは、抽出装置20の識別子抽出部23が行ってもよい。
図4は、本実施形態に係るコンテンツ検索システム1による識別子解決処理を示すシーケンス図である。
ステップS1において、取得装置30は、抽出装置20に対して、検索情報として、コンテンツの識別情報及びユーザ情報を送信する。
ステップS2において、抽出装置20は、検索情報の一部として、環境情報を取得する。
ステップS3において、抽出装置20は、ステップS1及びステップS2で入力された検索情報を解析し、識別情報データベース11の記述に適合した形式に変換する。
ステップS4において、抽出装置20は、格納装置10の識別情報データベース11を参照し、検索情報にマッチング、すなわち一致、部分一致又は類似した候補コンテンツの識別子を抽出する。
ステップS5において、抽出装置20は、ステップS4で抽出した候補コンテンツの識別子及び重み付けを取得装置30へ送信する。さらに、抽出装置20は、候補コンテンツからユーザが選択するための補助となる情報として、コンテンツそのもの、ダイジェスト、テキスト情報等を送信してもよい。なお、これらの補助情報は、格納装置10に記憶されていてもよいし、抽出装置20が識別子に基づいて随時に取得してもよい。
ステップS6において、取得装置30は、ユーザからの選択入力を受け付けて、候補コンテンツの中に意図するコンテンツがあるか否かを判定する。この判定がYESの場合、処理はステップS8に移り、判定がNOの場合、処理はステップS7に移る。
ステップS7において、取得装置30は、ユーザに検索情報の追加入力を要求し、入力された追加の情報を含めた検索情報を再度、抽出装置20へ提供する。これにより、処理はステップS3に移り、新たな候補コンテンツが抽出されて取得装置30に提示される。
ステップS8において、取得装置30は、選択されたコンテンツを抽出装置20に通知する。これに応じて、抽出装置20は、選択されたコンテンツの識別子及び検索情報の解析結果を格納装置10へ提供し、識別情報データベース11に反映させる。
図5は、本実施形態に係る識別子解決処理によって識別子が解決される第1のパターンを示す図である。
この例では、ユーザは、取得装置30に対して「昨日のXXchの9時の映画」という検索情報を入力して、コンテンツの再生を要求している。
取得装置30は、ユーザから入力された情報に加えて、ユーザ情報として、年齢、性別、要求日時(xx年xx月7日)、要求地点(xx県xx市)を取得して抽出装置20へ送信する。
抽出装置20は、受信した検索情報のうち、要求日時(xx年xx月7日)と「昨日」という情報から日付情報を解析し、「XXch」というチャンネル番号と要求地点とから、配信者名(放送局)を解析する。この結果、抽出装置20は、{xx年xx月6日,○○放送局,9時又は21時,映画}という解析結果を得る。
抽出装置20は、解析結果を、格納装置10の識別情報データベース11と照合し、この例では、[{映画A,0.9},{映画B,0.05},{ドラマC,0.01},・・・]という候補コンテンツを重みと共に抽出している。
取得装置30は、候補コンテンツを提示し、ユーザからの選択入力を受け付ける。ユーザが候補の中に意図するコンテンツ(映画A)を発見し選択すると、抽出装置20は、検索情報(識別情報、ユーザ情報)の解析結果と共に、解決されたコンテンツの識別子を格納装置10へ通知し、識別情報データベース11を更新させる。
図6は、本実施形態に係る識別子解決処理によって識別子が解決される第2のパターンを示す図である。
この例では、ユーザは、取得装置30に対して「昨日の映画」という検索情報を入力して、コンテンツの再生を要求している。
取得装置30は、ユーザから入力された情報に加えて、ユーザ情報として、年齢、性別、要求日時(xx年xx月7日)、要求地点(xx県xx市)を取得して抽出装置20へ送信する。
抽出装置20は、受信した検索情報のうち、要求日時(xx年xx月7日)と「昨日」という情報から日付情報を解析する。この結果、抽出装置20は、{xx年xx月6日,映画}という解析結果を得る。
抽出装置20は、解析結果を、格納装置10の識別情報データベース11と照合し、この例では、[{映画B,0.10},{映画C,0.10},{映画D,0.10},{映画E,0.10},{映画F,0.10}]という候補コンテンツを重みと共に抽出している。
取得装置30は、候補コンテンツを提示し、ユーザからの選択入力を受け付ける。
このとき、ユーザは、候補の中に意図するコンテンツ(映画A)を発見できなかったので、追加で「XXch」という検索情報が入力される。
抽出装置20は、再度、検索情報の解析を行い、「XXch」というチャンネル番号と要求地点とから、配信者名(放送局)を解析する。この結果、抽出装置20は、{xx年xx月6日,○○放送局,映画}という解析結果を得る。
抽出装置20は、解析結果を、格納装置10の識別情報データベース11と照合し、この例では、[{映画A,0.60},{映画B,0.20},{映画C,0.10},{ドラマD,0.05},{ドラマE,0.02}]という候補コンテンツを重みと共に抽出している。
取得装置30は、候補コンテンツを提示し、ユーザからの選択入力を受け付ける。ユーザが候補の中に意図するコンテンツ(映画A)を発見し選択すると、抽出装置20は、識別子の解決に至った際の検索情報(識別情報、ユーザ情報)の解析結果と共に、解決されたコンテンツの識別子を格納装置10へ通知し、識別情報データベース11を更新させる。
図7は、本実施形態に係る識別子解決処理によって識別子が解決される第3のパターンを示す図である。
この例では、ユーザは、取得装置30に対して「昨日の映画」という検索情報を入力して、コンテンツの再生を要求している。
取得装置30は、ユーザから入力された情報に加えて、ユーザ情報として、年齢、性別、要求日時(xx年xx月7日)、要求地点(xx県xx市)を取得して抽出装置20へ送信する。
抽出装置20は、さらに環境情報として、SNS又は検索エンジン等で話題になっている、すなわち頻出しているキーワード(コンテンツ名、登場人物等)を取得する。
抽出装置20は、取得した検索情報のうち、要求日時(xx年xx月7日)と「昨日」という情報から日付情報を解析する。この結果、抽出装置20は、ユーザ情報及び環境情報と合わせて{20代,男性,xx年xx月6日,映画,(映画A),(映画Aの登場人物)}という解析結果を得る。
抽出装置20は、解析結果を、格納装置10の識別情報データベース11と照合し、この例では、[{映画A,0.8},{映画B,0.1},・・・]という候補コンテンツを重みと共に抽出している。
取得装置30は、候補コンテンツを提示し、ユーザからの選択入力を受け付ける。ユーザが候補の中に意図するコンテンツ(映画A)を発見し選択すると、抽出装置20は、識別子の解決に至った際の検索情報(識別情報、ユーザ情報、環境情報)の解析結果と共に、解決されたコンテンツの識別子を格納装置10へ通知し、識別情報データベース11を更新させる。
次に、取得装置30における検索情報の入力フォーマットを例示する。
(例1)
取得装置30は、SNS等の特定のサイトにおいて、所定のフォーマットによって特定される文字列を、検索情報として取得する。この場合、Webアプリケーション又はブラウザとして取得装置30の機能が実装される。
具体的には、例えば、2015年5月5日にユーザAがコンテンツαを視聴し、「・・・[[昨日のあのドラマ]]をぜひ見るべきだ!・・・」といった感想を投稿したとする。このとき、取得装置30は、2重ブラケットの中身を読み取り、{2015年5月4日,ドラマ}という検索情報を取得する。
取得装置30は、この検索情報に基づいて抽出装置20からコンテンツの識別子を取得すると、この識別子又はコンテンツ自体へのリンクを生成し、ユーザAのコメントに付与して投稿処理を行ってもよい。
さらに、取得装置30は、元のコメントのうち、例えば、「昨日」を「2015年5月4日」に、あるいは、2重ブラケットの中身をコンテンツの名称等に書き換えてもよい。
検索情報は、例えば「[[2015/5/4,ドラマ,1ch,21時]]」のように、所定の区切り文字(例えば「,」)によって複数の情報が入力されてもよい。
なお、2重ブラケットは、所定のフォーマットの一例であり、他の表現が採用されてもよい。
(例2)
取得装置30は、ブラウザに入力されたHTTP URLから検索情報を取得する。この場合、PC又はスマートフォン等のブラウザとして取得装置30の機能が実装される。また、URLでアクセス可能なHTTPサーバが抽出装置20として機能し、HTTPプロトコルのメッセージ上で、識別子解決の手続きが進行する。
具体的には、例えば、「http://昨日.ドラマ.xxx.xxx」というURLから、{昨日,ドラマ}という検索情報が取得される。この場合、「.xxx.xxx」が抽出装置20を示すドメインである。
このURLの記述方法は一例であり、この他にも例えば、キーワードの記述順序や略語を許容し、「http://ドラマ.昨日.xxx.xxx」、「http://yesterday.drama.xxx.xxx」、「http://drama.ystd.xxx.xxx」等が入力されてもよい。
また、取得装置30は、日付、チャンネル、時刻等のフォーマットを規定し、例えば「http://drama.2015−05−04.1ch.210000.xxx.xxx」のような入力を受け付けてもよい。この例では、「2015−05−04」が日付(2015年5月4日)、「1ch」がチャンネル(1チャンネル)、「210000」が時刻(21時00分00秒)である。
なお、HTTPプロトコルは一例であり、この他にも、例えば、WebSocketプロトコルによる記述「ws://」等が用いられてもよい。
(例3)
取得装置30は、特定のURLスキームによる記述から検索情報を取得する。この場合、PC又はスマートフォン等のOS、又はOSから呼び出されるアプリケーションとして取得装置30の機能が実装される。
具体的には、例えば、「cnt://昨日.ドラマ」というURLから、{昨日,ドラマ}という検索情報が取得される。また、例2と同様に、記述フォーマットのバリエーションとして、例えば、「cnt://ドラマ.昨日」、「cnt://yesterday.drama」、「cnt://drama.ystd」、「cnt://drama.2015−05−04.1ch.210000」等が入力されてもよい。
(例4)
取得装置30は、所定のアプリケーションにより表示される入力フォームに対してユーザが入力した検索情報を取得する。
入力フォーマットは、前述の例と同様でもよいし、改行等を入力情報の区切りとしてもよい。また、複数のテキストフィールドにそれぞれに検索情報の1つの要素が入力されてもよい。さらに、これらのテキストフィールドは、それぞれ入力される識別情報の種別が規定されてもよい。
本実施形態では、これらの入力フォーマットにかぎらず、多様なフォーマットが採用可能であり、取得装置30又は検索情報を解釈する抽出装置20において、入力フォーマットが登録されることにより、多様な表記、及び多様なレイヤで識別子解決処理が実行可能である。
本実施形態によれば、コンテンツ検索システム1は、検索情報として、ユーザが可読な文字列を手動で入力することにより、この検索情報を識別情報データベース11と照合し、マッチングした識別情報の重みに基づいて、候補コンテンツを抽出できる。識別情報データベース11において、コンテンツに対して多様な識別情報の組み合わせが重みと共に対応付けられるので、コンテンツ検索システム1は、ユーザ毎に異なる検索情報に適合して、容易に候補コンテンツを抽出できる。
この結果、コンテンツが多様なメディアを通じて様々な時間帯に配布されている状況においても、ユーザは、コンテンツの所在及び実体について正確に把握することなく、断片的な検索情報を用いてコンテンツを容易に識別し、意図するコンテンツの識別子を取得できる。
また、検索情報として可読な文字列が用いられることにより、ユーザの入力が容易になり、さらに、既存のネットワークサービスにも容易に適用可能となる。これにより、SNS等を介してコンテンツ識別子を含む情報共有が容易に行われる。
このとき、コンテンツ検索システム1は、候補コンテンツからユーザが一のコンテンツを選択できない場合、検索情報の追加又は変更の入力を受け付け、対話的な処理によって、容易にコンテンツを特定できる。
また、コンテンツ検索システム1は、コンテンツを一意に特定できるだけの十分な検索情報がない場合にも、検索するユーザ自身のユーザ情報、又は他ユーザを含む全体的な傾向である環境情報を取得し解釈することにより、コンテンツ特定の精度を向上できる。
また、コンテンツ検索システム1は、これらの入力された検索情報の各要素の組み合わせを解析し、識別情報データベース11と照合される形式に変換するので、より効率的に精度良く識別子解析処理を実行できる。
さらに、コンテンツ検索システム1は、コンテンツが特定された際の検索情報に基づいて、識別情報データベース11において、新たな識別情報の登録、又は重みの更新を行う。これにより、検索情報とコンテンツ識別子との関係がフィードバックされるので、コンテンツ検索システム1は、複数ユーザの情報を学習でき、さらにコンテンツ特定の精度を向上できる。
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。
本実施形態では、コンテンツ検索システム1において、格納装置10と抽出装置20と取得装置30とを設けたが、システム構成はこれには限られない。各装置の機能は、実際の運用に合わせて、適宜複数の装置(サーバ)に分散、又は単一の装置(サーバ)に統合されてよい。
本実施形態では、主にコンテンツ検索システムの構成と動作について説明したが、本発明はこれに限られず、各構成要素を備え、コンテンツを検索するための方法、又はプログラムとして構成されてもよい。
さらに、コンテンツ検索システムの機能を実現するためのプログラムをコンピュータで読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。
ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータで読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータで読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時刻の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時刻プログラムを保持しているものも含んでもよい。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
1 コンテンツ検索システム
10 格納装置
11 識別情報データベース(記憶部)
12 識別情報入力部(更新部)
20 抽出装置
21 環境情報入力部
22 入力情報解析部(入力部)
23 識別子抽出部(抽出部)
24 識別子候補提示部
30 取得装置
31 識別子要求部
32 ユーザ情報入力部
33 識別子選択部(選択部)

Claims (9)

  1. 複数のコンテンツそれぞれに対応付けて、当該コンテンツを特定するための識別情報の組み合わせを1組以上、当該対応付けの重みと共に記憶する記憶部と、
    前記コンテンツの検索情報の入力を受け付ける入力部と、
    前記検索情報と前記識別情報の組み合わせとのマッチング結果、及び前記重みに基づいて、前記複数のコンテンツから候補コンテンツを抽出する抽出部と、を備えるコンテンツ検索システム。
  2. 前記候補コンテンツから一のコンテンツの選択入力を受け付ける選択部と、
    前記一のコンテンツに対応付けて、前記検索情報を前記識別情報として前記記憶部に追加記憶させる更新部と、を備える請求項1に記載のコンテンツ検索システム。
  3. 前記入力部は、前記一のコンテンツが選択されない場合に、前記検索情報の変更入力を受け付ける請求項2に記載のコンテンツ検索システム。
  4. 前記更新部は、前記一のコンテンツが選択された際の前記検索情報が既存の識別情報の組み合わせを含む場合、当該組み合わせについての前記重みを上昇させる請求項2又は請求項3に記載のコンテンツ検索システム。
  5. 前記識別情報は、ユーザの属性又は検索時の状況をユーザ情報として含み、
    前記入力部は、前記検索情報の一部として、前記ユーザ情報を取得する請求項1から請求項4のいずれかに記載のコンテンツ検索システム。
  6. 前記入力部は、前記検索情報に含まれる要素の組み合わせを解析し、前記識別情報の形式に変換する請求項5に記載のコンテンツ検索システム。
  7. 前記入力部は、前記検索情報の一部として、前記識別情報の人気度に基づくキーワードを含む環境情報を取得する請求項1から請求項6のいずれかに記載のコンテンツ検索システム。
  8. 複数のコンテンツそれぞれに対応付けて、当該コンテンツを特定するための識別情報の組み合わせを1組以上、当該対応付けの重みと共に記憶する記憶部を参照するコンピュータが、
    前記コンテンツの検索情報の入力を受け付ける入力ステップと、
    前記検索情報と前記識別情報の組み合わせとのマッチング結果、及び前記重みに基づいて、前記複数のコンテンツから候補コンテンツを抽出する抽出ステップと、を実行するコンテンツ検索方法。
  9. 複数のコンテンツそれぞれに対応付けて、当該コンテンツを特定するための識別情報の組み合わせを1組以上、当該対応付けの重みと共に記憶する記憶部を参照するコンピュータに、
    前記コンテンツの検索情報の入力を受け付ける入力ステップと、
    前記検索情報と前記識別情報の組み合わせとのマッチング結果、及び前記重みに基づいて、前記複数のコンテンツから候補コンテンツを抽出する抽出ステップと、を実行させるためのコンテンツ検索プログラム。
JP2015097548A 2015-05-12 2015-05-12 コンテンツ検索システム、方法及びプログラム Pending JP2016212740A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015097548A JP2016212740A (ja) 2015-05-12 2015-05-12 コンテンツ検索システム、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015097548A JP2016212740A (ja) 2015-05-12 2015-05-12 コンテンツ検索システム、方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2016212740A true JP2016212740A (ja) 2016-12-15

Family

ID=57551803

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015097548A Pending JP2016212740A (ja) 2015-05-12 2015-05-12 コンテンツ検索システム、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2016212740A (ja)

Similar Documents

Publication Publication Date Title
US10275485B2 (en) Retrieving context from previous sessions
US9411888B2 (en) Hosted video discovery and publishing platform
US9218414B2 (en) System, method, and user interface for a search engine based on multi-document summarization
RU2693323C2 (ru) Способ и сервер для выбора элементов рекомендаций для пользователя
KR100886767B1 (ko) 지유아이 검색 서비스 제공 방법 및 시스템
US20110179062A1 (en) Apparatus and method for sharing social media content
CN101477527B (zh) 一种检索多媒体资源的方法及装置
JP2011108117A (ja) 話題特定システム、話題特定装置、クライアント端末、プログラム、話題特定方法、および情報処理方法
US9542395B2 (en) Systems and methods for determining alternative names
US20110225134A1 (en) System and method for enhanced find-in-page functions in a web browser
JP5115059B2 (ja) キーワード分類装置
WO2019187842A1 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム
US20110208707A1 (en) System and method for enhanced find-in-page functions in a web browser
US20090070309A1 (en) System and method for assisting a user in constructing a search query
CN108738362B (zh) 基于多层级引用符数据生成应用的深度链接
JP5037645B2 (ja) 関連情報提供サーバ、関連情報提供システム及び関連情報提供方法
JP2011002982A (ja) コンテンツ提供装置、コンテンツ提供方法およびコンテンツ提供プログラム
JP6760987B2 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム
JP5370532B2 (ja) ブログ収集サーバ
JP2016212740A (ja) コンテンツ検索システム、方法及びプログラム
JP6762678B2 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム
JP6830917B2 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム
US10091557B2 (en) Identifying and sharing video content on a digital network
JP6440459B2 (ja) 検索装置、検索方法及び検索プログラム
JP2011145813A (ja) 検索支援装置及び検索支援方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190404

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190528

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200128