JP6208105B2 - タグ付与装置、方法、及びプログラム - Google Patents

タグ付与装置、方法、及びプログラム Download PDF

Info

Publication number
JP6208105B2
JP6208105B2 JP2014190225A JP2014190225A JP6208105B2 JP 6208105 B2 JP6208105 B2 JP 6208105B2 JP 2014190225 A JP2014190225 A JP 2014190225A JP 2014190225 A JP2014190225 A JP 2014190225A JP 6208105 B2 JP6208105 B2 JP 6208105B2
Authority
JP
Japan
Prior art keywords
content
tag
input
registered
additional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014190225A
Other languages
English (en)
Other versions
JP2016062338A (ja
Inventor
昌之 岡本
昌之 岡本
布目 光生
光生 布目
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2014190225A priority Critical patent/JP6208105B2/ja
Priority to US14/848,014 priority patent/US20160085844A1/en
Priority to CN201510572364.1A priority patent/CN105447073A/zh
Publication of JP2016062338A publication Critical patent/JP2016062338A/ja
Application granted granted Critical
Publication of JP6208105B2 publication Critical patent/JP6208105B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明の実施形態は、タグ付与装置、方法、及びプログラムに関する。
Webページ、電子文書、電子書籍などの電子コンテンツを分類・整理する手段として、タグ(アノテーション、注釈などとも称される。)を付与する機能が電子コンテンツを扱う機器やサービスにおいて提供されている。こうした環境によれば、ユーザは、自分で入力したテキスト、他のユーザが入力したテキスト、又は機械的に決定されたテキストを用いることで電子コンテンツに対して所望のタグを付与することができる。タグは、例えば、コンテンツの検索に利用される。
しかしながら、ユーザがタグを付与する場合、検索のしやすさまではあまり考慮されないことが多い。タグが付与されたコンテンツを検索する方法としては、タグを選択することで絞り込み検索を行う方法と一般の文書検索同様の全文検索を行う方法が一般的である。ユーザが付与したタグが適切でない場合、絞り込み検索によって目的のコンテンツを探すのは困難である。その場合、ユーザは最終的に全文検索を用いることになり、付与されたタグが活用されていないことになる。ユーザが自分でタグを付与する自由度を持ちつつ、同時に検索可能性を高める技術が必要となる。
特開2012−043212号公報
本発明が解決しようとする課題は、ユーザが自分でコンテンツにタグを付与する自由度を持ちつつ、検索可能性を高めるタグ付与装置を提供することである。
一実施形態に係るタグ付与装置は、入力部、格納部、検索部、分析部、決定部、及び登録部を備える。入力部は、入力コンテンツに付与された入力タグを受け付ける。格納部は、登録コンテンツと該登録コンテンツに付与された登録タグとを対応付けて格納する。検索部は、前記格納部から、前記入力タグと一致する登録タグが付与されている登録コンテンツの集合である第1コンテンツ集合と、追加タグ候補に一致する登録タグが付与されている登録コンテンツの集合である第2コンテンツ集合と、を検索する。分析部は、前記第1コンテンツ集合のコンテンツ数、及び前記第1コンテンツ集合と前記第2コンテンツ集合との間の包含関係を分析する。決定部は、前記分析部による分析の結果に基づいて、前記入力コンテンツに追加的に付与する追加タグを決定する。登録部は、前記入力コンテンツを前記入力タグ及び前記追加タグと対応付けて前記格納部に登録する。
実施形態に係るタグ付与装置を示すブロック図。 (a)は絞り込み検索に失敗する例を示す図、(b)は充分な絞り込みが行えない例を示す図。 図1に示したタグ付与装置が実行するタグ登録処理を示すフローチャート。 図1に示した格納部におけるタグの管理例を示す図。 ユーザの興味に応じたタグ付け方法の違いを説明する図。 図1に示した格納部に蓄積された登録コンテンツの一部を示す図。 実施形態に係るコンテンツ検索装置を示すブロック図。
以下、図面を参照しながら種々の実施形態を説明する。以下の実施形態では、同様の構成要素に同様の参照符号を付して、重ねての説明を省略する。
図1は、一実施形態に係るタグ付与装置100を概略的に示している。タグ付与装置100は、タグを入力可能な端末及び端末上で利用されるアプリケーション又はサービスに適用され得る。タグは、アノテーション、注釈などとも称される。タグを入力可能な端末の例としては、パーソナルコンピュータ(PC)、スマートフォン、タブレット端末、電子書籍端末、ゲーム機などがある。
タグ付与装置100は、ユーザによって電子コンテンツに付与されたタグである入力タグに基づいて、電子コンテンツに追加的に付与するタグである追加タグを決定し、電子コンテンツを入力タグ及び追加タグと対応付けて保存する。追加タグは、ユーザが所望のコンテンツを検索することを容易にし、すなわち、検索可能性を高める。電子コンテンツの例には、Webページ、電子文書、電子書籍、テレビなどの番組、静止画、動画などが含まれる。タグを付与する操作は、電子コンテンツの保存機能、ブックマーク機能など、電子コンテンツを分類・整理する機能に含まれる。このような機能は、電子コンテンツを扱う機器やサービスにおいて提供されている。以下では、電子コンテンツを単にコンテンツと称する。
タグ付与装置100は、図1に示されるように、タグ入力部101、コンテンツ格納部102、検索部103、コンテンツ集合分析部104、追加タグ決定部105、及びコンテンツ登録部106を備える。タグ入力部101、検索部103、コンテンツ集合分析部104、追加タグ決定部105、及びコンテンツ登録部106は、例えば、中央演算処理装置(CPU)及びCPUが用いるメモリにより実現することができる。コンテンツ格納部102は、例えば、CPUが用いるメモリ又は補助記憶装置により実現することができる。
タグ入力部101は、コンテンツに付与された入力タグを受け付ける。以下では、ユーザによって入力タグを付与されたコンテンツを入力コンテンツと称する。入力タグは、入力コンテンツをコンテンツ格納部102に保存する際にユーザによって指定される。一例では、ユーザはキーボード又はソフトウェアキーボードを用いてテキストを直接入力する。他の例では、ユーザは発声によって入力タグを指定する。この場合、ユーザの発声が音声認識技術によってテキストに変換される。さらに他の例では、ユーザはタッチパネルを用いた手書き文字入力によって入力タグを指定する。この場合、ユーザの手書き文字は文字認識技術によってテキストに変換される。さらにまた他の例では、ユーザはアプリケーションによって推奨され提示されたタグ候補の中からいずれかを選択する。
コンテンツ格納部102は、コンテンツをコンテンツに付与されたタグとともに格納する。以下では、コンテンツ格納部102に格納されているコンテンツを登録コンテンツと称し、登録コンテンツに付与されているタグを登録タグと称する。
検索部103は、入力タグに基づいて、コンテンツ格納部102から、第1コンテンツ集合及び第2コンテンツ集合を含む複数のコンテンツ集合を検索する。第1コンテンツ集合は、入力タグと一致する登録タグが付与されている登録コンテンツの集合である。検索部103は、入力タグを検索クエリとして用いてコンテンツ格納部102を検索することによって、第1コンテンツ集合を取得する。検索クエリとしては、入力タグの他、コンテンツ集合分析部104による分析の結果に基づいて設定される追加タグ候補も用いられ得る。検索部103は、追加タグ候補でコンテンツ格納部102を検索し、それにより追加タグ候補と一致する登録タグが付与されている登録コンテンツの集合を第2コンテンツ集合として取得する。追加タグ候補が複数ある場合、追加タグ候補それぞれについて第2コンテンツ集合が生成される。
コンテンツ集合分析部104は、検索部103によって検索された複数のコンテンツ集合を分析する。具体的には、コンテンツ集合分析部104は、第1コンテンツ集合のコンテンツ数、及び第1コンテンツ集合と第2コンテンツ集合との間の包含関係を分析する。
追加タグ決定部105は、コンテンツ集合分析部104による分析の結果に基づいて、入力コンテンツに追加的に付与する追加タグを決定する。コンテンツ登録部106は、入力コンテンツを入力タグ及び追加タグと対応付けてコンテンツ格納部102に登録する。
上述したように、コンテンツは、ユーザが付与したタグ(入力タグ)及びタグ付与装置100によって推薦されたタグ(追加タグ)とともにコンテンツ格納部102に保存される。一般に、ユーザは検索のしやすさを考慮した上でコンテンツにタグを付与するとは限らない。このため、単にユーザが付与したタグのみをコンテンツに付与する場合には、検索の際に次に例示するような問題が生じることがある。
図2(a)は、絞り込み検索に失敗する例を示している。図2(a)に示されるように、「タブレット端末を用いた情報教育の現状と課題」に関するコンテンツを保存する際、ユーザがタブレットの話題という観点から「tablet」というタグを付与したとする。後に、ユーザは、教育の話題について調べることになり、このコンテンツを探そうとする。このとき、ユーザは、教育に関するコンテンツを探すために「education」というタグで絞り込み検索を行う。しかしながら、このコンテンツは絞り込みの範囲から外れるため、ユーザはこのコンテンツを探し出すことができない。
図2(b)は、充分に絞り込みを行えない例を示している。図2(b)に示されるように、「タブレット端末を用いた情報教育の現状と課題」に関するコンテンツを保存する際、ユーザが教育の話題という観点から「education」というタグを付与したとする。後に、ユーザは、このコンテンツを探すために、「education」というタグで絞り込み検索を行う。しかしながら、検索の結果として多数のコンテンツがユーザに提示され、上記コンテンツを容易に探し出せるほど絞り込みができない。
これらの状況に陥った場合、ユーザは最終的に例えば全文検索を用いることになり、付与したタグが活用されないことになる。本実施形態に係るタグ付与装置100は、ユーザが自分でタグを付与する自由度を持ちつつ、検索可能性を高めるために追加タグを付与する。
次に、タグ付与装置100の動作を説明する。
図3は、タグ付与装置100が実行するコンテンツ登録処理を概略的に示している。図3のステップS301では、タグ入力部101は、ユーザが入力コンテンツに付与した入力タグを受け付ける。ステップS302では、検索部103は、コンテンツ格納部102から入力タグに一致する登録タグが付与されている登録コンテンツを検索し、これら検索した登録コンテンツを第1コンテンツ集合として出力する。
ステップS303では、第1コンテンツ集合内の登録コンテンツに付与されている登録タグが追加タグ候補に設定され、追加タグ候補を用いてさらなる検索が行われる。各追加タグ候補について取得された登録コンテンツの集合は第2コンテンツ集合として出力される。具体的には、コンテンツ集合分析部104は、第1コンテンツ集合から1以上のサブ集合を生成する。サブ集合の生成方法例は、第1コンテンツ集合内の登録コンテンツに付与されている登録タグの中から第1コンテンツ集合内での入力コンテンツの絞り込み検索に寄与する(すなわち有用である)登録タグを選択し、選択した登録タグが付与されている登録コンテンツの集合をサブ集合に設定する。判定基準としては、ID3、C4.5などの決定木構築で利用される基準を用いることができる。サブ集合を形成する登録タグが追加タグ候補に設定される。なお、入力コンテンツ内の単語が追加タグ候補に設定されてもよい。
ステップS304では、コンテンツ集合分析部104は、第1コンテンツ集合を包含する第2コンテンツ集合があるか否かを判定する。一実施形態では、第2コンテンツ集合が第1コンテンツ集合を包含するとは、第1コンテンツ集合全体が第2コンテンツ集合に含まれることを指す。他の実施形態では、この条件は緩和されてもよい。すなわち、第2コンテンツ集合が第1コンテンツ集合を包含するとは、第1コンテンツ集合内の全ての登録コンテンツに対する、第1コンテンツ集合と第2コンテンツ集合の両方に含まれる登録コンテンツの割合が閾値以上であることを指すことができる。第1コンテンツ集合を包含する第2コンテンツ集合が存在する場合は、処理はステップS305に進み、第1コンテンツ集合を包含する第2コンテンツ集合が存在しない場合は、処理はステップS306に進む。
ステップS305では、追加タグ決定部105は、第1コンテンツ集合を包含する第2コンテンツ集合を形成する登録タグを追加タグとして決定する。ステップS305で決定された追加タグは、入力タグの上位概念に相当する。
ステップS306では、コンテンツ集合分析部104は、第1コンテンツ集合のコンテンツ数が閾値以上であるか否かを判定する。この閾値は、予め決められた定数であってもよく、コンテンツ格納部102に格納されている登録コンテンツの数に応じて調整するなど、変更可能であってもよい。第1コンテンツ集合のコンテンツ数が閾値以上である場合、処理はステップS307に進み、第1コンテンツ集合の要素数が閾値未満である場合、処理はステップS308に進む。
ステップS307では、追加タグ決定部105は、第1コンテンツ集合内の登録コンテンツに付与されていて第1コンテンツ集合内での入力コンテンツの絞り込み検索に寄与する登録タグを追加タグとして決定する。具体的には、追加タグ決定部105は、サブ集合のうちの入力コンテンツが適合するサブ集合を形成する登録タグを追加タグとして決定する。また、第1コンテンツ集合内の登録コンテンツに付与されている登録タグの中から、IDF(Inverse Document Frequency)が高い登録タグを追加タグとして選択してもよい。これにより、サブ集合内で入力コンテンツをさらに絞り込みやすくなる。或いは、追加タグ決定部105は、第1コンテンツ集合内での入力タグの絞り込み検索に寄与する入力コンテンツ中の単語を追加タグとして決定してもよい。ステップS307で決定された追加タグは、入力タグの下位概念に相当する。
ステップS308では、コンテンツ登録部106は、入力コンテンツを、入力タグ及び追加タグ決定部105によって決定された追加タグに対応付けてコンテンツ格納部102に登録する。
このようにして、本実施形態に係るタグ付与装置100は、ユーザが指定した入力タグに基づいて追加タグを決定し登録する。それにより、ユーザの意図を考慮してタグの補完を行うことができる。
図4は、コンテンツ格納部102におけるタグの管理例を示している。図4に示される表は、コンテンツID、タグ順序、タグ名称、タグ種別、及び追加日時のフィールドを含む。コンテンツIDは、登録コンテンツを識別するための情報である。図4では、登録コンテンツ自体に関する情報は省略されている。タグ順序は、例えば、表示上の優先順位をタグに付ける場合などに利用する情報である。タグ名称は、タグの名称(文字列)を表す。タグ種別は、「ユーザ入力」、「追加タグ」などのタグの種別を表す。「ユーザ入力」は、対応するタグ名称がユーザによって付与されたことを示し、「追加タグ」は、対応するタグ名称がタグ付与装置100によって付与されたことを示す。追加日時は、タグ名称が付与された日時を示す。例えば、コンテンツIDが1002である登録コンテンツには、1つの入力タグと2つの追加タグが対応付けられている。
図5は、同じ入力コンテンツに異なる入力タグが付与された場合における追加タグの付与され方の違いを例示している。ユーザが「タブレット端末を用いた情報教育の現状と課題」という内容のコンテンツに対して、教育の観点から「情報教育」という入力タグを付与したとする。この場合、上位概念に相当する「教育」というタグが付与され、下位概念に相当する「タブレット活用」というタグが付与される。
一方、ユーザが機器の観点から「タブレット」という入力タグを付与したとする。この場合、上位概念に相当する「デジタル機器」というタグが付与され、下位概念に相当する、タブレット端末の活用方法の1つである「教育利用」というタグが付与される。
なお、ここでの「情報教育」及び「タブレット」といったタグの名称はユーザが付与するものであるため、ユーザの利用形態によって具体的に付与される名称は変わり得る。
図6を参照して、ユーザがIT(Information Technology:情報技術)に関するコンテンツ及び教育に関するコンテンツをコンテンツ格納部102に新規に保存する場合について説明する。図6は、タグ「IT」、タグ「education」、タグ「science」などの登録タグが付与された登録コンテンツを抜粋して示している。図6に示される配置は、登録コンテンツ間の話題の近さを表すための便宜的なものである。
ユーザが「生物の進化に関する教育のあり方」に関するコンテンツをタグ「science」を付与して保存する場合を想定する。図6に示される例では、登録タグ「science」が付与されている登録コンテンツの多くは、登録タグ「education」も付与されている。このため、登録タグ「education」が追加タグとして決定される。
また、登録タグ「science」が付与されている登録コンテンツの数、すなわち、第1コンテンツ集合のコンテンツ数が閾値以上である場合、サブ集合を形成する登録タグとして、「biology」、「math」、「english」などが抽出される。サブ集合それぞれと入力コンテンツとの類似性が計算される。計算基準としては、文書ベクトルのコサイン類似度やBM25など、コンテンツを構成する素性(feature)に基づく指標であれば何であっても構わない。このうち、タグ「biology」に対応するサブ集合が入力コンテンツに最も近いとすると、タグ「biology」が追加タグとして決定される。
なお、第1コンテンツ集合のコンテンツ数が閾値以上である場合、追加タグは、入力コンテンツに含まれる単語(文字列)から選択してもよい。第1コンテンツ集合をクラスタリングにより1以上のクラスタに分類し、入力コンテンツが含まれるクラスタを代表する単語をIDFなどの指標により抽出し、抽出した単語を追加タグとして決定する。クラスタリング手法としては、階層型クラスタリングやk−means法など、一般的に使用される手法を用いることができる。この例では、「生物」、「進化」といった入力コンテンツ中の単語が追加タグとして決定され得る。
次に、ユーザが「タブレット端末を用いた情報教育の現状と課題」に関するコンテンツをタグ「IT」を付与して保存する場合を想定する。タグ「IT」が付与されている登録コンテンツの数が閾値以上である場合、入力コンテンツに最も近いサブ集合を形成する登録タグ「education」、入力コンテンツ中の単語「情報教育」などが追加タグとして決定される。
図6の例では、「science」又は「IT」を入力タグとして与えた場合に基づいてコンテンツ集合を図示しているが、同じコンテンツに対しユーザが異なるタグを付与する場合には、同じコンテンツ集合に対しても、包含関係を構成するタグが変わり得る。
なお、入力コンテンツと内容が類似する登録コンテンツに、入力タグと名称が異なる登録タグが付与されている場合、追加タグ決定部105は、この登録タグを入力タグの同義語とみなす。例えば、「情報技術」と「IT」は同義語とみなす。具体的には、追加タグ決定部105は、この登録タグを追加タグとして決定することができ、或いは、登録タグ及び入力タグの名称を一方に統一することができる。前者の場合、登録コンテンツに入力タグと同じ名称の登録タグが付与されることができる。
次に、上述した方式に従ってタグが付与されたコンテンツの集合からユーザが所望するコンテンツを検索するためのコンテンツ検索装置について説明する。
図7は、一実施形態に係るコンテンツ検索装置700を概略的に示している。コンテンツ検索装置700は、図7に示されるように、タグ入力部701、コンテンツ格納部702、検索部703、及び表示部704を備える。タグ入力部701、コンテンツ格納部702、及び検索部703はそれぞれ、図1に示されるタグ入力部101、コンテンツ格納部102、及び検索部103と同様の動作を行う。このため、タグ入力部701、コンテンツ格納部702、及び検索部703については、詳細な説明を省略する。
表示部704は、検索クエリの入力画面、検索結果の画面などの各種画面を表示する。例えば、表示部704は、図2(a)に示されるように、検索クエリ候補としての複数のタグをユーザに提示する画面を表示する。タグ入力部701は、提示されたタグからユーザによって選択されたタグを受け付ける。検索部703は、コンテンツ格納部702から、選択されたタグに一致する登録タグが付与されている登録コンテンツを検索する。表示部704は、検索の結果得られた登録コンテンツの一覧を提示する画面を表示する。
以上のように、本実施形態に係るタグ付与装置100は、ユーザによるタグ入力を通じ整理の観点に自由度を持つ。さらに、タグ付与装置100は、絞り込み検索を考慮し階層的関係にあるタグを補完する。これにより、分類の容易さと検索の手間削減の両方が実現される。
(変形例)
本実施形態に係るタグ付与装置100は、ユーザが入力タグを付与したタイミングで追加タグを付与する。この場合、登録コンテンツ及び登録タグが少ない場合と登録コンテンツ及び登録タグが多い場合とで、同じ入力コンテンツに同じ入力タグを付与しても追加タグが異なり得る。特に前者の場合で付与される追加タグは不十分である可能性がある。
本実施形態の変形例では、入力コンテンツに追加タグを付与する処理は、所定のタイミングで或いはユーザが明示的な操作を行ったタイミングで実行される。所定のタイミングは、例えば、定期的な見直しを行う時点などである。ユーザが明示的な操作を行ったタイミングは、例えば、ユーザがコンテンツの検索操作を実行した時点などである。この場合、例えば、登録コンテンツ全体で、或いは、検索クエリとして指定されたタグに一致する登録タグが付与されている登録コンテンツのように限定された範囲で、追加タグの付与処理が実行される。追加タグの付与処理を再度実行するかどうかの判断基準は、例えば、前回のタグ付与処理を実行してから経過した時間に基づくことができる。具体的には、前回のタグ付与処理を実行してから所定の期間が経過した登録コンテンツを対象として追加タグの付与処理を再度実行する。
定期的な見直しを行う場合についても、コンテンツの選択基準に関しては上述したものと同様であり得る。それ以外に、コンテンツ集合自体が大きく変わるタイミングで追加タグを見直すことも考えられる。例えば、テレビ番組をコンテンツとして扱う場合を考える。この場合、タグとしては、ユーザが自分で付与するタグもあれば、番組表のようなメタデータに記載されている情報、例えば、主演者名、ジャンル、放送局などがタグになり得る。ユーザが自分で録画し管理する番組に関しては、ユーザがタグを入力又は選択し、それに応じて追加タグが付与されるものとする。録画されていないが番組表に掲載されている他の番組も存在する。このような場合、毎日自動的に新しい番組が登録され、古い番組が削除されることになる。また、番組構成の改編や、放送局の新設のように、管理対象のコンテンツ群に大きな変更がある場合、管理される番組の内容が一度に大きく変化することが考えられる。それに伴い、タグの管理内容も影響を受けることから、タグの構成を全体的に見直す必要がある。
実施形態に係るタグ付与装置は持ち運び可能なハードウェア装置への実装を想定しているが、その機能の一部はネットワークを介して接続された外部サーバ上で実行してもよい。また、タグ付与装置は、CPUなどの制御装置と、ROMやRAMなどの記憶装置と、HDDなどの外部記憶装置と、液晶表示装置などの表示装置と、キーボードやマウスなどの入力装置と、を備えた一般的なコンピュータに実装することもできる。
上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述したタグ付与装置による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD−ROM、CD−R、CD−RW、DVD−ROM、DVD±R、DVD±RW、Blu−ray(登録商標)Discなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態のタグ付与装置と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
100…タグ付与装置、101…タグ入力部、102…コンテンツ格納部、103…検索部、104…コンテンツ集合分析部、105…追加タグ決定部、106…コンテンツ登録部、700…コンテンツ検索装置、701…タグ入力部、702…コンテンツ格納部、703…検索部、704…表示部。

Claims (7)

  1. 入力コンテンツに付与された入力タグを受け付ける入力部と、
    登録コンテンツと該登録コンテンツに付与された登録タグとを対応付けて格納する格納部と、
    前記格納部から、前記入力タグと一致する登録タグが付与されている登録コンテンツの集合である第1コンテンツ集合と、追加タグ候補に一致し、前記第1コンテンツ集合内の登録コンテンツに付与されている登録タグに一致する登録タグが対応付けられている登録コンテンツの集合である第2コンテンツ集合と、を検索する検索部と、
    前記第1コンテンツ集合のコンテンツ数、及び前記第1コンテンツ集合と前記第2コンテンツ集合との間の包含関係を分析する分析部と、
    前記第1コンテンツ集合の前記コンテンツ数が閾値以上である場合、前記第1コンテンツ集合内の登録コンテンツに付与されていて前記第1コンテンツ集合内での前記入力コンテンツの絞り込み検索に寄与する登録タグを、または、前記第1コンテンツ集合内での前記入力コンテンツの絞り込み検索に寄与する前記入力コンテンツ中の単語を、第1の追加タグとして決定する第1の決定部と、
    前記第2コンテンツ集合が前記第1コンテンツ集合を包含する場合、前記追加タグ候補を第2の追加タグとして決定する第2の決定部と、
    前記入力コンテンツを前記入力タグ及び前記第1の追加タグと前記第2の追加タグとの少なくとも一方を含む追加タグと対応付けて前記格納部に登録する登録部と、
    を具備するタグ付与装置。
  2. 前記入力コンテンツに前記追加タグを付与する処理は、所定のタイミングでまたはユーザが明示的な操作を行ったタイミングで実行される、請求項1に記載のタグ付与装置。
  3. 前記第2コンテンツ集合が前記第1コンテンツ集合を包含するとは、前記第1コンテンツ集合内の全ての登録コンテンツに対する、前記第1コンテンツ集合と前記第2コンテンツ集合の両方に含まれる登録コンテンツの割合が閾値以上であることを指す、請求項に記載のタグ付与装置。
  4. 前記第1の決定部及び前記第2の決定部は、前記入力コンテンツと内容が類似する登録コンテンツに、前記入力タグと異なる登録タグが付与されている場合、該登録タグを前記入力タグの同義語とみなす、請求項1に記載のタグ付与装置。
  5. 前記分析部は、前記第1コンテンツ集合からサブ集合を生成し、該サブ集合を形成する登録タグを前記追加タグ候補に設定する、請求項1に記載のタグ付与装置。
  6. 入力コンテンツに付与された入力タグを受け付けることと、
    登録コンテンツと該登録コンテンツに付与された登録タグとを対応付けて格納する格納部から、前記入力タグと一致する登録タグが付与されている登録コンテンツの集合である第1コンテンツ集合と、追加タグ候補に一致し、前記第1コンテンツ集合内の登録コンテンツに付与されている登録タグに一致する登録タグが対応付けられている登録コンテンツの集合である第2コンテンツ集合と、を検索することと、
    前記第1コンテンツ集合のコンテンツ数、及び前記第1コンテンツ集合と前記第2コンテンツ集合との間の包含関係を分析することと、
    前記第1コンテンツ集合の前記コンテンツ数が閾値以上である場合、前記第1コンテンツ集合内の登録コンテンツに付与されていて前記第1コンテンツ集合内での前記入力コンテンツの絞り込み検索に寄与する登録タグを、または、前記第1コンテンツ集合内での前記入力コンテンツの絞り込み検索に寄与する前記入力コンテンツ中の単語を、第1の追加タグとして決定することと、
    前記第2コンテンツ集合が前記第1コンテンツ集合を包含する場合、前記追加タグ候補を、第2の追加タグとして決定することと、
    前記入力コンテンツを前記入力タグ及び前記第1の追加タグと前記第2の追加タグとの少なくとも一方を含む追加タグと対応付けて前記格納部に登録することと、
    を具備するタグ付与方法。
  7. コンピュータを、
    入力コンテンツに付与された入力タグを受け付ける入力手段、
    登録コンテンツと該登録コンテンツに付与された登録タグとを対応付けて格納する格納手段から、前記入力タグと一致する登録タグが付与されている登録コンテンツの集合である第1コンテンツ集合と、追加タグ候補に一致し、前記第1コンテンツ集合内の登録コンテンツに付与されている登録タグに一致する登録タグが対応付けられている登録コンテンツの集合である第2コンテンツ集合と、を検索する検索手段、
    前記第1コンテンツ集合のコンテンツ数、及び前記第1コンテンツ集合と前記第2コンテンツ集合との間の包含関係を分析する分析手段、
    前記第1コンテンツ集合の前記コンテンツ数が閾値以上である場合、前記第1コンテンツ集合内の登録コンテンツに付与されていて前記第1コンテンツ集合内での前記入力コンテンツの絞り込み検索に寄与する登録タグを、または、前記第1コンテンツ集合内での前記入力コンテンツの絞り込み検索に寄与する前記入力コンテンツ中の単語を、第1の追加タグとして決定する第1の決定手段と、
    前記第2コンテンツ集合が前記第1コンテンツ集合を包含する場合、前記追加タグ候補を第2の追加タグとして決定する第2の決定手段、及び
    前記入力コンテンツを前記入力タグ及び前記第1の追加タグと前記第2の追加タグとの少なくとも一方を含む追加タグと対応付けて前記格納手段に登録する登録手段として機能させるためのタグ付与プログラム。
JP2014190225A 2014-09-18 2014-09-18 タグ付与装置、方法、及びプログラム Active JP6208105B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014190225A JP6208105B2 (ja) 2014-09-18 2014-09-18 タグ付与装置、方法、及びプログラム
US14/848,014 US20160085844A1 (en) 2014-09-18 2015-09-08 Tag adding apparatus and tag adding method
CN201510572364.1A CN105447073A (zh) 2014-09-18 2015-09-10 标签赋予装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014190225A JP6208105B2 (ja) 2014-09-18 2014-09-18 タグ付与装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2016062338A JP2016062338A (ja) 2016-04-25
JP6208105B2 true JP6208105B2 (ja) 2017-10-04

Family

ID=55525955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014190225A Active JP6208105B2 (ja) 2014-09-18 2014-09-18 タグ付与装置、方法、及びプログラム

Country Status (3)

Country Link
US (1) US20160085844A1 (ja)
JP (1) JP6208105B2 (ja)
CN (1) CN105447073A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11112436B2 (en) 2018-03-26 2021-09-07 Analog Devices International Unlimited Company Spark gap structures for detection and protection against electrical overstress events
CN109284401A (zh) * 2018-08-31 2019-01-29 广州视源电子科技股份有限公司 课件标签添加、课件推荐方法、装置和存储介质
JP7026659B2 (ja) * 2019-06-20 2022-02-28 本田技研工業株式会社 応答装置、応答方法、およびプログラム
US20210090105A1 (en) * 2019-09-24 2021-03-25 Iterate Studio Inc. Technology opportunity mapping

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3606556B2 (ja) * 2000-05-16 2005-01-05 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報整理方法、情報処理装置、記憶媒体、およびプログラム伝送装置
US9501467B2 (en) * 2007-12-21 2016-11-22 Thomson Reuters Global Resources Systems, methods, software and interfaces for entity extraction and resolution and tagging
US8819066B2 (en) * 2007-12-21 2014-08-26 International Business Machines Corporation Employing organizational context within a collaborative tagging system
JP2010039989A (ja) * 2008-08-08 2010-02-18 Hitachi Systems & Services Ltd コンテンツ管理システム及びコンテンツ管理方法
JP5430960B2 (ja) * 2009-02-09 2014-03-05 株式会社東芝 コンテンツ分類装置、方法及びプログラム
JP2010224622A (ja) * 2009-03-19 2010-10-07 Nomura Research Institute Ltd タグ付与方法およびタグ付与プログラム
JP5292247B2 (ja) * 2009-09-30 2013-09-18 Kddi株式会社 コンテンツタグ収集方法、コンテンツタグ収集用プログラム、コンテンツタグ収集システム及びコンテンツ検索システム
JP5404290B2 (ja) * 2009-10-06 2014-01-29 キヤノン株式会社 情報処理装置及び情報処理方法
US9442928B2 (en) * 2011-09-07 2016-09-13 Venio Inc. System, method and computer program product for automatic topic identification using a hypertext corpus
CN103198057B (zh) * 2012-01-05 2017-11-07 深圳市世纪光速信息技术有限公司 一种自动给文档添加标签的方法和装置
US20130212115A1 (en) * 2012-02-09 2013-08-15 Gface Gmbh Tag inheritance
US20140006426A1 (en) * 2012-06-21 2014-01-02 Market76, Inc. Engine, system and method of providing vertical social networks for client oriented service providers
US9619046B2 (en) * 2013-02-27 2017-04-11 Facebook, Inc. Determining phrase objects based on received user input context information

Also Published As

Publication number Publication date
JP2016062338A (ja) 2016-04-25
US20160085844A1 (en) 2016-03-24
CN105447073A (zh) 2016-03-30

Similar Documents

Publication Publication Date Title
US11720572B2 (en) Method and system for content recommendation
Onyancha Forty-five years of LIS research evolution, 1971–2015: An informetrics study of the author-supplied keywords
JP6014725B2 (ja) 単文/複文構造の自然言語クエリに対する検索および情報提供方法並びにシステム
US9251130B1 (en) Tagging annotations of electronic books
US20120117051A1 (en) Multi-modal approach to search query input
US20160034512A1 (en) Context-based metadata generation and automatic annotation of electronic media in a computer network
US20140186817A1 (en) Ranking and recommendation of open education materials
Arguello Aggregated search
CN109241319B (zh) 一种图片检索方法、装置、服务器和存储介质
Zablith et al. The OU linked open data: production and consumption
JP6208105B2 (ja) タグ付与装置、方法、及びプログラム
US11061947B2 (en) Efficient corpus search and annotation management for a question answering system
US20120179709A1 (en) Apparatus, method and program product for searching document
US11392632B1 (en) Systems and methods for locating media using a tag-based query
US11275777B2 (en) Methods and systems for generating timelines for entities
US11037062B2 (en) Learning apparatus, learning method, and learning program
Dias et al. The impact of semantic annotation techniques on content-based video lecture recommendation
Dalton et al. Local and global query expansion for hierarchical complex topics
McGrath Musings on Faceted Search, Metadata, and Library Discovery Interfaces
Wang et al. Constructing learning maps for lecture videos by exploring wikipedia knowledge
JP2009098811A (ja) 文書分類装置およびプログラム
US10503773B2 (en) Tagging of documents and other resources to enhance their searchability
CN112989011B (zh) 数据查询方法、数据查询装置和电子设备
JP5162215B2 (ja) データ処理装置、データ処理方法、および、プログラム
CN115618873A (zh) 数据处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160913

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170724

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170906

R151 Written notification of patent or utility model registration

Ref document number: 6208105

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350