JP4779961B2 - 文書選択装置及び文書選択プログラム - Google Patents
文書選択装置及び文書選択プログラム Download PDFInfo
- Publication number
- JP4779961B2 JP4779961B2 JP2006343521A JP2006343521A JP4779961B2 JP 4779961 B2 JP4779961 B2 JP 4779961B2 JP 2006343521 A JP2006343521 A JP 2006343521A JP 2006343521 A JP2006343521 A JP 2006343521A JP 4779961 B2 JP4779961 B2 JP 4779961B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- user
- cluster
- unit
- recommended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
文書データベース101は、ユーザに提供する文書を格納するためのデータベースである。文書データベース101には、複数の文書データが格納され、それらの文書の中からレコメンド文書選択部103またはクラスタレコメンド文書選択部105によって選択された文書が、レコメンド文書編集部106及びレコメンド文書出力部107を介してユーザに提供される。また、文書データベース101に格納される文書データは、どのようなデータ形式であってもよく、テキスト形式、HTML形式等であってもよく、あるいは、特定のアプリケーションによって読み取り可能なデータ形式であってもよい。
ユーザ文書入力部102は、ユーザ文書111を入力するための機能部である。ユーザ文書入力部102は、入力されたユーザ文書111をレコメンド文書選択部103に入力する。ユーザ文書111は、文書データベース101からレコメンド文書を選択するために用いられる文書であって、ユーザがアクセスしたWebから取得したHTML文書のような文書であってもよく、ユーザが作成した電子メールのような文書であってもよい。また、本実施形態においては、入力されるユーザ文書111は1つであるものとして説明するが、複数のユーザ文書が入力されるようにしてもよい。
レコメンド文書選択部103は、ユーザ文書入力部102から入力されたユーザ文書111と類似する内容の文書をレコメンド文書112として文書データベース101から選択するための機能部である。レコメンド文書選択部103は、ユーザ文書入力部102から入力されるユーザ文書111を受け取り、ユーザ文書111の内容に基づいて文書データベース101からレコメンド文書112を選択する。
クラスタ判定部104は、入力されたユーザ文書111がどのクラスタ(カテゴリ)に属するかを判定するための機能部である。このとき、判定されるクラスタには、ユーザ文書格納部108によって生成され、クラスタ分析部109に格納されるユーザ文書が分類されるクラスタが用いられる。また、クラスタ分析部109によって、予め各クラスタのクラスタ中心が算出され、ユーザ文書格納部108またはその他の記憶部に格納されているものとする。
クラスタレコメンド文書選択部105は、クラスタ判定部104によって判定されたクラスタ(カテゴリ)と近い内容の文書を文書データベース101から選択するための機能部である。各文書が判定されたクラスタと近い内容であるか否かを判定する方法としては、クラスタ判定部104においてクラスタを判定するのに用いられたのと同様の方法を用いることができる。例えば、文書データベース101内の各文書のベクトルと選択されたクラスタのクラスタ中心との距離を類似度として計算し、距離の値が小さい文書を類似度が高いと判定するようにしてもよい。
レコメンド文書編集部106は、選択されたレコメンド文書112を出力用に編集するための機能部である。レコメンド文書編集部106は、レコメンド文書選択部103またはクラスタレコメンド文書選択部105のいずれかからレコメンド文書112を受け取り、受け取ったレコメンド文書112を出力用に編集する。具体的には、例えば、HTML形式等の、予め決められた所定のデータ形式にレコメンド文書112を変換してもよく、入力されたユーザ文書111とレコメンド文書112とをマージしたり、選択された複数のレコメンド文書112をマージして、1つのレコメンド文書を生成するようにしてもよい。編集後、レコメンド文書編集部106は、レコメンド文書出力部107にレコメンド文書112を渡す。
レコメンド文書出力部107は、レコメンド文書編集部106で編集されたレコメンド文書112をユーザに提供するために出力する機能部である。出力方法は、例えば、ディスプレイ上にレコメンド文書112が表示されるようにしてもよく、HTML等の形式のデータがネットワークを通じて送信されるようにしてもよい。あるいは、ネットワークを通じて電子メールによって送信されるようにしてもよく、FAXやプリンタ等に出力されるようにしてもよい。
ユーザ文書格納部108は、入力されたユーザ文書を蓄積して格納するための記憶部である。ユーザ文書111は、レコメンド文書選択部103またはクラスタレコメンド文書選択部105のいずれかによってレコメンド文書が選択された後、ユーザ文書格納部108に格納される。
クラスタ分析部109は、ユーザ文書に対しクラスタ分析(クラスタリング)を行い、ユーザ文書を複数のクラスタ(カテゴリ)に分類するための機能部である。具体的には、ユーザ文書格納部108に格納されているユーザ文書を所定のクラスタ分析手法により分類し、内容が類似している複数の文書が同じクラスタに属するようにクラスタを生成する。ここで用いられるクラスタ分析手法は、例えば、機械学習を用いた既知のクラスタ分析手法であって、具体的には、ナイーブ・ベイズ(Naive Bayes)やk近傍法、決定木等の手法であってもよい。
ユーザ文書削除部110は、ユーザ文書格納部108に格納されたユーザ文書を予め定められた所定の条件に従って削除するための機能部である。ユーザ文書を削除する条件(以下、削除条件という)とは、例えば、ユーザ文書格納部108に格納されているユーザ文書の数が一定の値を超えた場合、または、ユーザ文書の蓄積期間(格納されてからの経過時間)が一定期間を超えた場合等である。ユーザ文書削除部110は、定期的または新たにユーザ文書がユーザ文書格納部108に格納される際等に、ユーザ文書格納部108に格納されているユーザ文書の状態をチェックし、削除条件に合致する場合は、削除処理を行う。
101 文書データベース
102 ユーザ文書入力部
103 レコメンド文書選択部
104 クラスタ判定部
105 クラスタレコメンド文書選択部
106 レコメンド文書編集部
107 レコメンド文書出力部
108 ユーザ文書格納部
109 クラスタ分析部
110 ユーザ文書削除部
111 ユーザ文書
112 レコメンド文書
Claims (9)
- 複数の文書を格納する文書データベースと、
前記文書データベースから選択されるレコメンド文書を決定するのに用いられるユーザ文書が入力されるユーザ文書入力部と、
前記入力されたユーザ文書の内容に基づいて、前記ユーザ文書と内容が類似する前記レコメンド文書を前記文書データベースから選択するレコメンド文書選択部と、
過去に入力された前記ユーザ文書を、当該ユーザ文書が分類されるクラスタと対応付けて格納するユーザ文書格納部と、
前記入力されたユーザ文書が分類される前記クラスタを判定するクラスタ判定部と、
前記クラスタ判定部で判定されたクラスタの情報に基づいて、前記レコメンド文書を前記文書データベースから選択するクラスタレコメンド文書選択部と、
前記ユーザ文書格納部に格納された前記ユーザ文書が所定の条件に合致する場合に、前記ユーザ文書格納部に格納された所定の前記ユーザ文書を削除するユーザ文書削除部と、
前記ユーザ文書格納部に格納された前記ユーザ文書のうち、いずれかの前記ユーザ文書が削除された場合に、前記ユーザ文書格納部に格納された前記ユーザ文書に対しクラスタ分析を行うクラスタ分析部と、
を備え、
前記クラスタ分析部は、前記クラスタ分析部による分析結果に従って前記各ユーザ文書が分類されるクラスタの情報を前記ユーザ文書格納部に格納することを特徴とする、文書選択装置。 - 前記レコメンド文書選択部は、
前記入力されたユーザ文書と前記文書データベース内の前記文書との類似度を計算し、前記類似度が所定の基準値を超える前記文書がある場合にのみ、前記類似度が高い順に前記文書データベースから前記レコメンド文書を選択し、
前記類似度が前記基準値を超える前記文書がない場合、前記クラスタ判定部は、前記入力されたユーザ文書が分類される前記クラスタを判定し、
前記クラスタレコメンド文書選択部は、前記クラスタ判定部において判定された前記クラスタと、前記文書データベース内の前記文書との類似度を計算し、前記類似度が高い順に前記文書データベースから前記レコメンド文書を選択することを特徴とする、請求項1に記載の文書選択装置。 - 前記クラスタ分析部は、互いに内容が類似している複数の前記ユーザ文書を同じクラスタに分類することを特徴とする、請求項1または2記載の文書選択装置。
- 前記クラスタ判定部は、前記ユーザ文書格納部に格納される前記クラスタのうち、前記クラスタの中心が前記ユーザ文書に最も近いクラスタを前記ユーザ文書のクラスタと判定することを特徴とする、請求項1〜3のいずれか1項に記載の文書選択装置。
- 前記ユーザ文書削除部は、格納されている期間が所定の範囲を超える前記ユーザ文書が前記ユーザ文書格納部の中に存在する場合に、前記ユーザ文書を削除することを特徴とする、請求項1〜4のいずれか1項に記載の文書選択装置。
- 前記ユーザ文書削除部は、前記ユーザ文書のうち格納された日時が古い順に前記ユーザ文書を削除することを特徴とする、請求項1〜5のいずれか1項に記載の文書選択装置。
- 前記ユーザ文書削除部は、前記クラスタのうち分類される前記ユーザ文書数が最も多い前記クラスタに属する前記ユーザ文書を削除することを特徴とする、請求項1〜6のいずれか1項に記載の文書選択装置。
- 前記ユーザ文書削除部は、前記クラスタのうち前記クラスタレコメンド文書選択部において前記文書データベースから選択される文書の数が最も少ない前記クラスタに属する前記ユーザ文書を削除することを特徴とする、請求項1〜7のいずれか1項に記載の文書選択装置。
- コンピュータを請求項1〜8のいずれかに記載の文書選択装置として機能させるための文書選択プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006343521A JP4779961B2 (ja) | 2006-12-20 | 2006-12-20 | 文書選択装置及び文書選択プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006343521A JP4779961B2 (ja) | 2006-12-20 | 2006-12-20 | 文書選択装置及び文書選択プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008158590A JP2008158590A (ja) | 2008-07-10 |
JP4779961B2 true JP4779961B2 (ja) | 2011-09-28 |
Family
ID=39659463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006343521A Expired - Fee Related JP4779961B2 (ja) | 2006-12-20 | 2006-12-20 | 文書選択装置及び文書選択プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4779961B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6390139B2 (ja) * | 2014-03-31 | 2018-09-19 | 大日本印刷株式会社 | 文書検索装置、文書検索方法、プログラム、及び、文書検索システム |
JP6050284B2 (ja) * | 2014-06-20 | 2016-12-21 | ヤフー株式会社 | 抽出装置、抽出方法及び抽出プログラム |
JP6243885B2 (ja) * | 2015-10-16 | 2017-12-06 | Necパーソナルコンピュータ株式会社 | 情報処理装置、およびプログラム |
JP7134814B2 (ja) * | 2018-09-28 | 2022-09-12 | キヤノン株式会社 | システム、ページデータ出力方法、及びプログラム |
JP7157015B2 (ja) * | 2019-07-11 | 2022-10-19 | フリーサイン株式会社 | スマートコントラクトシステム及びプログラム |
JP7291272B2 (ja) * | 2019-07-11 | 2023-06-14 | フリーサイン株式会社 | スマートコントラクトシステム及びプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3326985B2 (ja) * | 1994-09-09 | 2002-09-24 | 富士通株式会社 | 画像情報管理装置 |
JPH09101991A (ja) * | 1995-07-31 | 1997-04-15 | Toshiba Corp | 情報フィルタリング装置 |
JP2001175659A (ja) * | 1999-12-14 | 2001-06-29 | Canon Inc | 文書管理システム、文書管理方法および記憶媒体 |
JP2003030223A (ja) * | 2001-07-12 | 2003-01-31 | Fuji Photo Film Co Ltd | 画像分類方法および装置並びにプログラム |
JP2003167907A (ja) * | 2001-12-03 | 2003-06-13 | Dainippon Printing Co Ltd | 情報提供方法およびシステム |
JP4643183B2 (ja) * | 2004-06-25 | 2011-03-02 | シャープ株式会社 | 翻訳装置および翻訳プログラム |
-
2006
- 2006-12-20 JP JP2006343521A patent/JP4779961B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008158590A (ja) | 2008-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8200667B2 (en) | Method and apparatus for constructing user profile using content tag, and method for content recommendation using the constructed user profile | |
US8140584B2 (en) | Adaptive data classification for data mining | |
EP2234024B1 (en) | Context based video finder | |
JP4650541B2 (ja) | 推薦装置および方法、プログラム、並びに記録媒体 | |
US8410347B2 (en) | Music recommendation method with respect to message service | |
US6912550B2 (en) | File classification management system and method used in operating systems | |
JP4678546B2 (ja) | 推薦装置および方法、プログラム、並びに記録媒体 | |
JP4779961B2 (ja) | 文書選択装置及び文書選択プログラム | |
US20090006368A1 (en) | Automatic Video Recommendation | |
KR101453382B1 (ko) | 사용자별 검색어 추천 시스템과 방법 및 이를 구현할 수 있는 컴퓨터로 읽을 수 있는 기록 매체 | |
JP7252914B2 (ja) | 検索提案を提供する方法、装置、機器及び媒体 | |
US20100217755A1 (en) | Classifying a set of content items | |
US20140229476A1 (en) | System for Information Discovery & Organization | |
KR20130119246A (ko) | 감성 기반 콘텐츠 추천 장치 및 방법 | |
JP2008204444A (ja) | データ処理装置、データ処理方法及び検索装置 | |
KR101206160B1 (ko) | 사용자 선호도와 컨텐츠 내용을 고려한 컨텐츠 추천 방법 | |
JPWO2008087728A1 (ja) | キーワード管理プログラム、キーワード管理システムおよびキーワード管理方法 | |
JP2007219929A (ja) | 感性評価システム及び方法 | |
CN110910188A (zh) | 课程优化与推荐的方法、装置、存储介质和终端设备 | |
KR101110026B1 (ko) | 지역 정보 검색 장치 및 방법 | |
JP4606349B2 (ja) | 話題画像抽出方法及び装置及びプログラム | |
JP2007249600A (ja) | 目的データをカテゴリに分類する方法 | |
JP2005293384A (ja) | コンテンツレコメンドシステムと方法、及びコンテンツレコメンドプログラム | |
CN106934007B (zh) | 关联信息的推送方法及装置 | |
CN112612867B (zh) | 新闻稿件传播分析方法、计算机可读存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110301 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110425 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110607 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110620 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140715 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |