JP2011248762A - 分類装置、コンテンツ検索システム、コンテンツ分類方法、コンテンツ検索方法及びプログラム - Google Patents
分類装置、コンテンツ検索システム、コンテンツ分類方法、コンテンツ検索方法及びプログラム Download PDFInfo
- Publication number
- JP2011248762A JP2011248762A JP2010123275A JP2010123275A JP2011248762A JP 2011248762 A JP2011248762 A JP 2011248762A JP 2010123275 A JP2010123275 A JP 2010123275A JP 2010123275 A JP2010123275 A JP 2010123275A JP 2011248762 A JP2011248762 A JP 2011248762A
- Authority
- JP
- Japan
- Prior art keywords
- search
- content
- classification
- category
- history
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】分類情報格納部330は、カテゴリが既知のコンテンツに対応するカテゴリの情報を格納する。履歴受信部310は、コンテンツの検索履歴を受信する。検索履歴は、コンテンツを検索するために用いられた検索語を含む。コンテンツ情報格納部320は、検索履歴を格納するとともに、コンテンツが検索された頻度を検索語毎に集計し、その集計結果を格納する。分類部340は、分類情報格納部330に格納された情報と、コンテンツ情報格納部320に格納された情報とを用いて、カテゴリが未知のコンテンツを分類する。分類部340は、カテゴリが未知のコンテンツの検索に用いられた検索語とカテゴリが既知のコンテンツの検索に用いられた検索語(及びそのカテゴリ)とに基づいて、カテゴリが未知のコンテンツを分類する。
【選択図】図3
Description
さらに好ましい態様において、前記分類部は、検索された頻度に応じたスコアを前記検索語毎に算出し、当該スコアを用いて前記第2のコンテンツを分類する。
他の好ましい態様において、前記分類装置は、URL(Uniform Resource Locator)の少なくとも一部が共通する前記第1のコンテンツ又は前記第2のコンテンツどうしが同一のカテゴリに分類されることを特徴とする。
図1は、本発明の一実施形態の全体構成を示す図である。本実施形態のコンテンツ検索システム110は、ユーザがコンテンツを検索するために用いられるものであり、複数のユーザのクライアント端末120によってアクセスされる。クライアント端末120は、通信ネットワーク130を介してコンテンツ検索システム110にアクセスするコンピュータ装置であり、例えば、パーソナルコンピュータ、携帯電話機、スマートフォンなどである。クライアント端末120は、通信ネットワーク130と通信を行う手段と、文字入力等の操作を受け付ける手段と、検索結果を表示する手段とを少なくとも備える。通信ネットワーク130は、インターネット、イントラネット、移動体通信網などであり、また、これらを組み合わせた複合的なネットワークであってもよい。
図5は、頻度情報のデータ構造を例示する図である。この例において、頻度情報は、URLと、検索語と、頻度とを対応付けて記述したデータである。
なお、検索履歴情報又は頻度情報は、コンテンツが分類済みであるか否か(すなわち、カテゴリが既知か未知か)を表すフラグを含んでいてもよい。
また、コンテンツ検索システム110は、周知のキーワード検索による検索結果と、コンテンツをカテゴリ毎に分類して表示する検索結果とをユーザに提供することができる。コンテンツ検索システム110は、これらの検索結果を両方提示してもよいし、ユーザによる事前の設定に応じていずれかの検索結果を択一的に提示するようにしてもよい。
Xi=(xi1,xi2,xi3,…,xiV) …(1)
Yi=(yi1,yi2,yi3,…,yiL) …(2)
上述した実施形態は、本発明の実施の一態様である。本発明は、上述した実施形態に対して以下の変形を適用した態様で実施することも可能である。なお、以下に示す変形例は、必要に応じて、各々を適当に組み合わせて実施されてもよいものである。
上述したとおり、本発明に係るコンテンツは、その分類に際して自然言語処理が不要である。すなわち、本発明に係るコンテンツは、文字列を含まないデータであっても分類可能である。したがって、本発明は、文字列を含むか否かを問わず、ユーザが検索可能なあらゆるデータを分類の対象にすることができる。
本発明に係る分類装置は、URLの少なくとも一部が共通する複数のコンテンツがある場合に、これらが同一のカテゴリに分類されるように動作するものであってもよい。このようにすれば、カテゴリが未知のコンテンツをより高速に分類することが可能であるとともに、検索されたことが一度もないコンテンツであっても分類が可能になる場合がある。なお、本例において、カテゴリの共通化は、ドメイン名、ホスト名、FQDN(Fully Qualified Domain Name)などを単位として行われる。また、URLがパス名(ディレクトリ名)によって階層分けされている場合には、かかる階層がカテゴリに対応付けられていてもよい。さらに、URLにパラメータ部(図4等の例における「?」以降の文字列)が含まれる場合には、パラメータ部以外の部分が共通しているURLのカテゴリを共通化することも可能である。
上述した実施形態においては、コンテンツの分類処理は、カテゴリが未知のコンテンツに対してのみ実行された。しかし、本発明は、カテゴリが既知のコンテンツにも分類処理を実行し、必要に応じて、コンテンツのカテゴリを変更できるようにしてもよい。このようにすれば、コンテンツの内容が時間の経過に応じて(URLは変えずに)変更されたとしても、より適切なカテゴリに再分類することが可能となる。具体的には、制御部221は、カテゴリが既知のコンテンツに対して上述した分類モデルを適用し、既に算出されたスコアと新たに算出されたスコアとの間に一定以上の乖離がある場合に、既に算出されたスコアを新たに算出されたスコアに書き換えるようにしてもよい。
本発明は、コンテンツ情報や分類情報の記憶手段を分類装置から分離した態様でも実施可能である。すなわち、本発明に係る分類装置は、コンテンツ情報や分類情報を格納する手段を別体に構成したものであってもよい。
本発明は、上述した実施形態のように分類装置と検索装置とを別体にするのではなく、これらを単一のコンピュータ装置で実現することも可能である。また、本発明は、コンテンツを分類し、又は検索するための方法や、コンピュータ装置を上述した分類装置や検索装置として機能させるためのプログラムとしても提供可能である。かかるプログラムは、光ディスク等の記録媒体に記録した形態で提供されたり、インターネット等のネットワークを介して、コンピュータにダウンロードさせ、これをインストールして利用可能にするなどの形態で提供されたりすることも可能である。
Claims (8)
- 所定のカテゴリに従って分類された第1のコンテンツと、当該コンテンツを検索するために用いられた検索語とを対応付けた検索履歴を取得する第1の取得部と、
前記カテゴリが未知である第2のコンテンツを検索するために用いられた検索語を取得する第2の取得部と、
前記第1の取得部により取得された検索履歴と前記第2の取得部により取得された検索語とを比較することによって、前記第2のコンテンツを前記カテゴリに従って分類する分類部と
を備える分類装置。 - 前記分類部は、前記検索語毎の検索された頻度に基づいて前記第2のコンテンツを分類する
ことを特徴とする請求項1に記載の分類装置。 - 前記分類部は、検索された頻度に応じたスコアを前記検索語毎に算出し、当該スコアを用いて前記第2のコンテンツを分類する
ことを特徴とする請求項2に記載の分類装置。 - URL(Uniform Resource Locator)の少なくとも一部が共通する前記第1のコンテンツ又は前記第2のコンテンツどうしが同一のカテゴリに分類されることを特徴とする請求項1ないし3のいずれかに記載の分類装置。
- 請求項1ないし4のいずれかに記載の分類装置と、ユーザにより入力された検索語に対応するコンテンツを当該ユーザに提示する検索装置とを有し、
前記検索装置が、前記入力された検索語に対応するコンテンツを前記カテゴリ毎に分類した態様で提示するための提示部を備える
ことを特徴とするコンテンツ検索システム。 - 所定のカテゴリに従って分類された第1のコンテンツと、当該コンテンツを検索するために用いられた検索語とを対応付けた検索履歴を取得するステップと、
前記カテゴリが未知である第2のコンテンツを検索するために用いられた検索語を取得するステップと、
前記取得された検索履歴と前記取得された検索語とを比較することによって、前記第2のコンテンツを前記カテゴリに従って分類するステップと
を有することを特徴とするコンテンツ分類方法。 - 所定のカテゴリに従って分類された第1のコンテンツと、当該コンテンツを検索するために用いられた検索語とを対応付けた検索履歴を取得するステップと、
前記カテゴリが未知である第2のコンテンツを検索するために用いられた検索語を取得するステップと、
前記取得された検索履歴と前記取得された検索語とを比較することによって、前記第2のコンテンツを前記カテゴリに従って分類するステップと、
入力された検索語に対応する前記第1のコンテンツ又は前記第2のコンテンツを前記カテゴリ毎に分類した態様でユーザに提示するステップと
を有することを特徴とするコンテンツ検索方法。 - コンピュータに、
所定のカテゴリに従って分類された第1のコンテンツと、当該コンテンツを検索するために用いられた検索語とを対応付けた検索履歴を取得するステップと、
前記カテゴリが未知である第2のコンテンツを検索するために用いられた検索語を取得するステップと、
前記取得された検索履歴と前記取得された検索語とを比較することによって、前記第2のコンテンツを前記カテゴリに従って分類するステップと
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010123275A JP2011248762A (ja) | 2010-05-28 | 2010-05-28 | 分類装置、コンテンツ検索システム、コンテンツ分類方法、コンテンツ検索方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010123275A JP2011248762A (ja) | 2010-05-28 | 2010-05-28 | 分類装置、コンテンツ検索システム、コンテンツ分類方法、コンテンツ検索方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011248762A true JP2011248762A (ja) | 2011-12-08 |
JP2011248762A5 JP2011248762A5 (ja) | 2013-04-11 |
Family
ID=45413915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010123275A Pending JP2011248762A (ja) | 2010-05-28 | 2010-05-28 | 分類装置、コンテンツ検索システム、コンテンツ分類方法、コンテンツ検索方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011248762A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012198710A (ja) * | 2011-03-18 | 2012-10-18 | Fujitsu Ltd | カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム |
US20210303718A1 (en) * | 2020-03-31 | 2021-09-30 | Citrix Systems, Inc. | Context based data leak prevention of sensitive information |
US11539709B2 (en) | 2019-12-23 | 2022-12-27 | Citrix Systems, Inc. | Restricted access to sensitive content |
US11544415B2 (en) | 2019-12-17 | 2023-01-03 | Citrix Systems, Inc. | Context-aware obfuscation and unobfuscation of sensitive content |
US11582266B2 (en) | 2020-02-03 | 2023-02-14 | Citrix Systems, Inc. | Method and system for protecting privacy of users in session recordings |
US11627102B2 (en) | 2020-08-29 | 2023-04-11 | Citrix Systems, Inc. | Identity leak prevention |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004341942A (ja) * | 2003-05-16 | 2004-12-02 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類用プログラムおよびコンテンツ分類用プログラムを記憶した記憶媒体 |
JP2006139382A (ja) * | 2004-11-10 | 2006-06-01 | Canon Inc | 情報処理装置及びその制御方法、プログラム |
JP2008217157A (ja) * | 2007-02-28 | 2008-09-18 | Nippon Telegr & Teleph Corp <Ntt> | 操作履歴を利用した自動情報整理装置、方法、およびプログラム |
JP2010061213A (ja) * | 2008-09-01 | 2010-03-18 | Nec Corp | 情報処理装置、情報分類方法及びプログラム |
-
2010
- 2010-05-28 JP JP2010123275A patent/JP2011248762A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004341942A (ja) * | 2003-05-16 | 2004-12-02 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類用プログラムおよびコンテンツ分類用プログラムを記憶した記憶媒体 |
JP2006139382A (ja) * | 2004-11-10 | 2006-06-01 | Canon Inc | 情報処理装置及びその制御方法、プログラム |
JP2008217157A (ja) * | 2007-02-28 | 2008-09-18 | Nippon Telegr & Teleph Corp <Ntt> | 操作履歴を利用した自動情報整理装置、方法、およびプログラム |
JP2010061213A (ja) * | 2008-09-01 | 2010-03-18 | Nec Corp | 情報処理装置、情報分類方法及びプログラム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012198710A (ja) * | 2011-03-18 | 2012-10-18 | Fujitsu Ltd | カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム |
US11544415B2 (en) | 2019-12-17 | 2023-01-03 | Citrix Systems, Inc. | Context-aware obfuscation and unobfuscation of sensitive content |
US11539709B2 (en) | 2019-12-23 | 2022-12-27 | Citrix Systems, Inc. | Restricted access to sensitive content |
US11582266B2 (en) | 2020-02-03 | 2023-02-14 | Citrix Systems, Inc. | Method and system for protecting privacy of users in session recordings |
US20210303718A1 (en) * | 2020-03-31 | 2021-09-30 | Citrix Systems, Inc. | Context based data leak prevention of sensitive information |
US11627102B2 (en) | 2020-08-29 | 2023-04-11 | Citrix Systems, Inc. | Identity leak prevention |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10289618B2 (en) | Third party search applications for a search system | |
US8751466B1 (en) | Customizable answer engine implemented by user-defined plug-ins | |
RU2696230C2 (ru) | Поиск, основанный на комбинировании пользовательских данных отношений | |
CN102073699B (zh) | 用于基于用户行为来改善搜索结果的方法、装置和设备 | |
US20160179816A1 (en) | Near Real Time Auto-Suggest Search Results | |
CN107862022B (zh) | 文化资源推荐系统 | |
US20110307432A1 (en) | Relevance for name segment searches | |
US8639687B2 (en) | User-customized content providing device, method and recorded medium | |
US20060190446A1 (en) | Web search system and method thereof | |
US20160283952A1 (en) | Ranking information providers | |
KR102454954B1 (ko) | 검색 동작 출력 엘리먼트에 대한 액션 표시자 | |
JP2011248762A (ja) | 分類装置、コンテンツ検索システム、コンテンツ分類方法、コンテンツ検索方法及びプログラム | |
CN106462613A (zh) | 基于用户属性来对建议进行排名 | |
US11144555B2 (en) | Keyword reporting for mobile applications | |
KR100671077B1 (ko) | 페이지 묶음을 이용한 정보 검색 서비스 제공 서버, 방법및 시스템 | |
US20170323019A1 (en) | Ranking information providers | |
KR101346927B1 (ko) | 검색 장치, 검색 방법, 및 검색 프로그램을 기억하는 컴퓨터 판독 가능한 기록 매체 | |
JP5271952B2 (ja) | サーバ装置、評価方法、及び評価プログラム | |
JP2020067700A (ja) | 情報収集方法、情報収集処理装置および情報収集プログラム | |
JP2012113348A (ja) | 分類装置、コンテンツ検索システム、コンテンツ分類方法、コンテンツ検索方法及びプログラム | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP2015026345A (ja) | 検索装置、検索システムおよびプログラム | |
JP4571648B2 (ja) | Web情報提供装置及びその方法、プログラム | |
JP6916136B2 (ja) | 検索支援装置、検索支援方法、及び検索支援プログラム | |
JP2011221877A (ja) | 関連語抽出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130222 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140114 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140715 |