JP4757016B2 - 文書分類プログラム、文書分類装置、および文書分類方法 - Google Patents
文書分類プログラム、文書分類装置、および文書分類方法 Download PDFInfo
- Publication number
- JP4757016B2 JP4757016B2 JP2005368274A JP2005368274A JP4757016B2 JP 4757016 B2 JP4757016 B2 JP 4757016B2 JP 2005368274 A JP2005368274 A JP 2005368274A JP 2005368274 A JP2005368274 A JP 2005368274A JP 4757016 B2 JP4757016 B2 JP 4757016B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- learning
- category
- classification
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
しかし、既存の分類手法は静的に与えられた文書集合を分類することが目的であるためカテゴリ内の記事が同等に扱われる。日々動的に配信される新着記事においては、日にちの近い記事がより重要であるなどの特徴があるが、既存の手法では古い記事が障害となり、最新のトピックに関連する文書を適切に分類できない。
図1は、本実施の形態の概略を示す図である。図1に示すように、本実施の形態は、学習文書記憶手段1、重み設定手段2、学習手段3、分類手段4、学習文書格納手段5、および表示手段6で構成される。
このような構成により、まず、重み設定手段2により、学習文書記憶手段1に格納されている学習文書1aa,1ab,・・・,1ba,1bb,・・・それぞれに関して、学習文書に付与された時刻情報で示される時刻から現在までの経過時間が計算される。そして、重み設定手段2により、経過期間に応じた重みが設定され、学習文書の特徴を示す素性に対してその学習文書の重みが設定される。
次に、本実施の形態の詳細を説明する。以下の実施の形態では、ネットワークに接続されたクライアントにおいて、ニュースなどの記事(ブログなどで公開されるコラムも含むものとする)に関する文書を分類する場合の例を説明する。
記事閲覧ユーザインタフェース125は、ユーザからの操作入力に応答して、指定分野記事記憶部130に格納された記事をモニタ11に表示する。また、記事閲覧ユーザインタフェース125は、表示した記事に関して、カテゴリに属さないことを示す操作入力があると、その内容を判定結果変更部126に通知する。
図6は、初期学習処理の手順を示すフローチャートである。以下、図6に示す処理をステップ番号に沿って説明する。
[ステップS12]学習器121は、トレーニングデータ記憶部110に格納されたトレーニングデータに基づいて、カテゴリ毎の特徴を学習する。
図7は、記事収集処理の手順を示すフローチャートである。以下、図7に示す処理をステップ番号に沿って説明する。
[ステップS24]最新記事収集部122は、新しい記事が収集できたか否かを判断する。新しい記事が収集できた場合、最新記事収集部122は収集した記事を分類器123に渡し、処理をステップS25に進める。新しい記事が見つからなかった場合、処理がステップS21に進められる。
[ステップS26]分類器123は、予め用意されたカテゴリに属する記事を、指定分野記事記憶部130に格納する。
[ステップS31]記事閲覧ユーザインタフェース125は、ユーザからの操作入力に応答して、最新記事一覧をモニタ11に表示する。
[ステップS35]記事閲覧ユーザインタフェース125は、ユーザから、表示された記事がカテゴリに含まれるべきでないことを示す操作入力(負例指定入力)が行われたか否かを判断する。負例指定入力があった場合、記事閲覧ユーザインタフェース125はその旨を判定結果変更部126に通知し、処理をステップS36に進める。負例指定入力がなければ、処理がステップS32に進められる。
[ステップS41]学習器121は、ユーザにより再学習処理終了の操作入力が行われたか否かを判断する。再学習処理終了の操作入力が行われた場合、処理が終了する。再学習処理終了の操作入力が行われていなければ、処理がステップS42に進められる。
[ステップS44]学習器121は、学習結果を分類器123に設定する。その後、処理がステップS41に進められる。
図10は、記事の古さと重みの関係を示す図である。図10の横軸は、記事の配信時から現在までの経過時間t(tは0以上の正の実数)を示している。図中の左方向が正の軸である。縦軸は、記事の重みW(Wは、0以上1以下の実数)を示している。
W=f(t)=1−t/N ・・・(1)
という関数を示している。ここで、Nは過去のどれくらいまで遡って記事を使うかを示す定数である(Nは0以上の実数)。式(1)に示す関数を用いることにより、過去の記事よりも最近の記事に重みをかけた学習が可能となる。
W=f(t)=exp(−t) ・・・(2)
という関数を示している。式(2)の関数は話題の変化が大きいカテゴリの文書に適している。
W=f(t)=1 ・・・(3)
という関数を示している。式(3)の関数は、過去の記事を均等に学習に用いることを示しており、一般的な文書分類と等価になる。
図11は、周期的に減衰率が変化する減衰関数の例を示す図である。図11の横軸は、記事の配信時から現在までの経過時間t(tは0以上の正の実数)を示している。図中の左方向が正の軸である。縦軸は、記事の重みW(Wは、0以上1以下の実数)を示している。
W=f(t)=exp(−t)sin{(2π×t)/Y} ・・・(4)
ここで、πは円周率、Yは周期である(Yは0以上の実数)。周期性の発見は、文書中に出現する語の頻度の推移により行うことができる。式(4)に示す関数を用いることで、例えばオリンピックなどの定期的なイベントにおいて、より高い精度での分類が可能となる。
「春は名のみの風の寒さよ。」
この文から、以下のような素性集合が生成される。
「春,名,風,寒さ,春_は,は_名,名_のみ,のみ_の,の_風,風_の,の_寒さ,寒さ_よ,春―名,春―風,春―寒さ,名―風,名―寒さ,風―寒さ」
学習器121は、生成された素性集合内の各素性に対し、記事内にその素性が存在する数を設定する。例えば、記事内に、「春」という文字が2回出現する場合、素性「春」に「2」という数値が設定される。
まず、ある記事の配信元が、カテゴリに含まれる全体の記事の配信元のどれくらいの割合を占めるかを示す情報を、学習結果に加える。また、ある記事が、カテゴリに含まれる他の記事とリンク関係を持っているか否かに関する情報を、学習結果に加える。例えば、学習器121は、カテゴリに含まれる割合が所定値以上の配信元(ドメイン名など)を学習結果に加え、そのドメインに対して正の値を設定する。また、学習器121は、カテゴリに含まれる記事内に、互いにリンク関係を有する記事が所定数以上であれば、そのカテゴリ内の記事に対するリンクを有するという条件を学習結果として定義し、その条件に正の値を設定する。
図13は、取得記事の表示例を示す図である。取得記事は、記事表示画面70に表示される。
カテゴリリスト表示部71には、設定されているカテゴリのリストが表示される。カテゴリリスト表示部71に表示されたカテゴリから、ユーザが任意のカテゴリを選択すると、選択されたカテゴリに含まれる記事の最新の記事のリストが記事一覧表示部72に表示される。そして、記事一覧表示部72に表示された記事から、ユーザが任意の記事を選択すると、その記事の内容が記事表示部73に表示される。
Score(w)=InCatFreq(w)/OutCatFreq(w) ・・・(5)
ここでInCatFreq(w)はカテゴリ内での単語wの頻度であり、OutCatFreq(w)はカテゴリ外の記事全体における単語wの頻度である。カテゴリ内に含まれる各単語についてこの式で与えられるスコアScore(w)を計算し、スコアの最も高い単語がカテゴリ名として選択される。
郵政民営化→衆議院解散→刺客→自民党大勝→新人議員
もし郵政民営化のトピックに関する記事だけを学習事例として使用していたら、後のトピックの記事の分類を誤り、取りこぼす可能性が高くなる。また、トピックが推移しているにもかかわらず、以前のトピックに関する記事を多く分類してしまうのも適切ではない。以前のトピックに関する記事も重要でありそれらも分類するべきだが、それと同時により最近のトピックの記事を積極的に分類すべきである。本実施の形態で説明した分類手法では、新しい記事ほど重みの値が大きくなるため、最近のトピックを多く含む記事が、カテゴリ内の特徴をより的確に表していると判断できる。
1)動的に追加される新着記事が分類対象である。そのため、最新の記事を用いてトレーニングデータも逐次更新され、最新のトレーニングデータに基づく学習が繰り返し行われる。
2)文書の学習時の関連度の計算のために日付の情報を用いた重み付けを行い、その重みは時間の経過と共に減衰させる。これにより、最新のトピックを強く反映させた学習が行われる。
3)正例のトレーニングデータに共通する素性に加え、配信元やリンク関係を関連度の計算に用いる。これにより、記事の内容だけでなく付加された他の情報を用いて、カテゴリの判別を適切に行うことができる。
以上説明した実施の形態の主な技術的特徴は、以下の付記の通りである。
コンピュータを、
時刻情報が付与された学習文書を、所定のカテゴリに属す正例と前記カテゴリに属さない負例とに分けて記憶する学習文書記憶手段、
前記学習文書記憶手段に格納されている前記学習文書それぞれに関して、前記学習文書に付与された前記時刻情報で示される時刻から現在までの経過時間を計算し、前記経過期間に応じた重みを設定し、前記学習文書の特徴を示す素性に対して前記学習文書の重みを設定する重み設定手段、
前記カテゴリに対する正例の前記学習文書の素性のうち、重みの値が大きい素性ほど前記カテゴリの特徴を強く表しているものと評価し、各素性が前記カテゴリの特徴を示すか否かを示す学習結果を生成する学習手段、
分類対象文書が入力されると、前記学習手段により生成された前記学習結果に基づいて、前記分類対象文書が前記カテゴリに属するか否かを判断する分類手段、
前記分類対象文書に対して前記時刻情報を付与し、前記分類手段において前記カテゴリに属すると判断された場合には、前記分類対象文書を正例の前記学習文書として前記学習文書記憶手段に格納し、前記分類手段において前記カテゴリに属さないと判断された場合には、前記分類対象文書を負例の前記学習文書として前記学習文書記憶手段に格納する学習文書格納手段、
前記分類手段において前記カテゴリに属すると判断された前記分類対象文書を表示する表示手段、
として機能させることを特徴とする文書分類プログラム。
(付記3) 前記重み設定手段は、前記経過時間に応じた前記重みの減少率を一定にして、前記経過期間に応じた重みを設定することを特徴とする付記2記載の文書分類プログラム。
前記分類手段は、前記分類対象文書に含まれる各素性の関連度を合算し、合算結果が正の値であれば前記分類対象文書が前記カテゴリに属すると判断し、合算結果が負の値であれば前記分類対象文書が前記カテゴリに属さないと判断することを特徴とする付記1記載の文書分類プログラム。
前記学習手段は、前記カテゴリに含まれる正例の前記学習文書の前記配信元情報に基づいて、正例の前記学習文書の所定の割合以上を配信している配信元を検出し、検出した配信元の前記配信元情報を前記学習結果に含め、
前記分類手段は、前記カテゴリに属することに関して、前記学習結果に含まれる前記配信情報で示される配信元から配信された前記分類対象文書を、他の配信元から配信された文書よりも有利に判定することを特徴とする付記1記載の文書分類プログラム。
前記分類手段は、前記カテゴリに属することに関して、前記学習結果に含まれる前記リンク条件を満たす前記分類対象文書を、他の文書よりも有利に判定することを特徴とする付記1記載の文書分類プログラム。
前記表示手段により表示された前記分類対象文書に関して、ユーザからの操作入力によって、前記カテゴリに属すべきでないことが示された場合、前記分類対象文書に対応する前記学習文書を、正例から負例に変更する判定結果変更手段として機能させることを特徴とする付記1記載の文書分類プログラム。
(付記11) 文書を内容に応じて分類するための文書分類装置において、
時刻情報が付与された学習文書を、所定のカテゴリに属す正例と前記カテゴリに属さない負例とに分けて記憶する学習文書記憶手段と、
前記学習文書記憶手段に格納されている前記学習文書それぞれに関して、前記学習文書に付与された前記時刻情報で示される時刻から現在までの経過時間を計算し、前記経過期間に応じた重みを設定し、前記学習文書の特徴を示す素性に対して前記学習文書の重みを設定する重み設定手段と、
前記カテゴリに対する正例の前記学習文書の素性のうち、重みの値が大きい素性ほど前記カテゴリの特徴を強く表しているものと評価し、各素性が前記カテゴリの特徴を示すか否かを示す学習結果を生成する学習手段と、
分類対象文書が入力されると、前記学習手段により生成された前記学習結果に基づいて、前記分類対象文書が前記カテゴリに属するか否かを判断する分類手段と、
前記分類対象文書に対して前記時刻情報を付与し、前記分類手段において前記カテゴリに属すると判断された場合には、前記分類対象文書を正例の前記学習文書として前記学習文書記憶手段に格納し、前記分類手段において前記カテゴリに属さないと判断された場合には、前記分類対象文書を負例の前記学習文書として前記学習文書記憶手段に格納する学習文書格納手段と、
前記分類手段において前記カテゴリに属すると判断された前記分類対象文書を表示する表示手段と、
を有することを特徴とする文書分類装置。
前記コンピュータが、
時刻情報が付与された学習文書を、所定のカテゴリに属す正例と前記カテゴリに属さない負例とに分けて記憶する学習文書記憶手段に格納されている前記学習文書それぞれに関して、前記学習文書に付与された前記時刻情報で示される時刻から現在までの経過時間を計算し、前記経過期間に応じた重みを設定し、前記学習文書の特徴を示す素性に対して前記学習文書の重みを設定し、
前記カテゴリに対する正例の前記学習文書の素性のうち、重みの値が大きい素性ほど前記カテゴリの特徴を強く表しているものと評価し、各素性が前記カテゴリの特徴を示すか否かを示す学習結果を生成し、
分類対象文書が入力されると、前記学習手段により生成された前記学習結果に基づいて、前記分類対象文書が前記カテゴリに属するか否かを判断し、
前記分類対象文書に対して前記時刻情報を付与し、前記カテゴリに属すると判断された場合には、前記分類対象文書を正例の前記学習文書として前記学習文書記憶手段に格納し、前記カテゴリに属さないと判断された場合には、前記分類対象文書を負例の前記学習文書として前記学習文書記憶手段に格納し、
前記カテゴリに属すると判断された前記分類対象文書を表示する、
ことを特徴とする文書分類方法。
1aa,1ab,・・・ 学習文書
1ba,1bb,・・・ 学習文書
2 重み設定手段
3 学習手段
4 分類手段
5 学習文書格納手段
6 表示手段
7 分類対象文書
Claims (11)
- 文書を内容に応じて分類するための文書分類プログラムにおいて、
コンピュータを、
時刻情報が付与された学習文書を、所定のカテゴリに属する正例と前記カテゴリに属さない負例とに分けて記憶する学習文書記憶手段、
前記学習文書記憶手段に格納されている学習文書それぞれに関して、学習文書に付与された時刻情報で示される時刻から現在までの経過時間を計算し、該経過期間に応じた重みを設定し、該学習文書に含まれる言語情報を構成する要素であり該学習文書の特徴を示す素性に対して、該学習文書の重みを設定する重み設定手段、
前記カテゴリに対する正例の学習文書の素性のうち、重みの値が大きい素性ほど前記カテゴリの特徴を強く表しているものと評価し、各素性が前記カテゴリの特徴を示すか否かを示す学習結果を生成する学習手段、
分類対象文書が入力されると、前記学習手段により生成された前記学習結果に基づいて、前記分類対象文書が前記カテゴリに属するか否かを判断する分類手段、
前記分類手段において前記分類対象文書が前記カテゴリに属すると判断された場合には、時刻情報付きの前記分類対象文書を正例の学習文書として前記学習文書記憶手段に格納し、前記分類手段において前記分類対象文書が前記カテゴリに属さないと判断された場合には、時刻情報付きの前記分類対象文書を負例の学習文書として前記学習文書記憶手段に格納する学習文書格納手段、
として機能させることを特徴とする文書分類プログラム。 - 前記コンピュータを、さらに、
前記分類手段において前記分類対象文書が前記カテゴリに属すると判断された場合、前記分類対象文書を表示する表示手段、
として機能させることを特徴とする請求項1記載の文書分類プログラム。 - 前記重み設定手段は、経過時間が長いほど重みを小さくすることを特徴とする請求項1記載の文書分類プログラム。
- 前記重み設定手段は、経過時間に応じた重みの減少率を一定にして、該経過期間に応じた重みを設定することを特徴とする請求項3記載の文書分類プログラム。
- 前記重み設定手段は、経過時間が長いほど重みの減少率を小さくして、該経過期間に応じた重みを設定することを特徴とする請求項3記載の文書分類プログラム。
- 前記重み設定手段は、経過時間に応じて、重みを周期的に減少と増加とを繰り返させて、該経過期間に応じた重みを設定することを特徴とする請求項1記載の文書分類プログラム。
- 前記学習手段は、前記学習結果において、前記カテゴリの特徴を表す素性に対して正の関連度を設定し、前記カテゴリの特徴を表さない素性に対して負の関連度を設定し、
前記分類手段は、前記分類対象文書に含まれる各素性の関連度を合算し、合算結果が正の値であれば前記分類対象文書が前記カテゴリに属すると判断し、合算結果が負の値であれば前記分類対象文書が前記カテゴリに属さないと判断することを特徴とする請求項1乃至6のいずれかに記載の文書分類プログラム。 - 前記学習文書記憶手段は、学習文書に関連づけて、該学習文書の配信元を示す配信元情報を記憶しており、
前記学習手段は、前記カテゴリに含まれる正例の学習文書の配信元情報に基づいて、正例の学習文書の所定の割合以上を配信している配信元を検出し、検出した該配信元の配信元情報を前記学習結果に含め、
前記分類手段は、前記カテゴリに属することに関して、前記学習結果に含まれる配信元情報で示される配信元から配信された前記分類対象文書を、他の配信元から配信された文書よりも有利に判定することを特徴とする請求項1乃至7のいずれかに記載の文書分類プログラム。 - 前記学習手段は、前記カテゴリに含まれる正例の学習文書のうち、他の正例の学習文書にリンクを張っている学習文書の割合が所定値以上の場合、他の正例の学習文書に対するリンクを含むというリンク条件を前記学習結果に含め、
前記分類手段は、前記カテゴリに属することに関して、前記学習結果に含まれる前記リンク条件を満たす前記分類対象文書を、他の文書よりも有利に判定することを特徴とする請求項1乃至8のいずれかに記載の文書分類プログラム。 - 文書を内容に応じて分類するための文書分類装置において、
時刻情報が付与された学習文書を、所定のカテゴリに属する正例と前記カテゴリに属さない負例とに分けて記憶する学習文書記憶手段と、
前記学習文書記憶手段に格納されている学習文書それぞれに関して、学習文書に付与された時刻情報で示される時刻から現在までの経過時間を計算し、該経過期間に応じた重みを設定し、該学習文書に含まれる言語情報を構成する要素であり該学習文書の特徴を示す素性に対して、該学習文書の重みを設定する重み設定手段と、
前記カテゴリに対する正例の学習文書の素性のうち、重みの値が大きい素性ほど前記カテゴリの特徴を強く表しているものと評価し、各素性が前記カテゴリの特徴を示すか否かを示す学習結果を生成する学習手段と、
分類対象文書が入力されると、前記学習手段により生成された前記学習結果に基づいて、前記分類対象文書が前記カテゴリに属するか否かを判断する分類手段と、
前記分類手段において前記分類対象文書が前記カテゴリに属すると判断された場合には、時刻情報付きの前記分類対象文書を正例の学習文書として前記学習文書記憶手段に格納し、前記分類手段において前記分類対象文書が前記カテゴリに属さないと判断された場合には、時刻情報付きの前記分類対象文書を負例の学習文書として前記学習文書記憶手段に格納する学習文書格納手段と、
を有することを特徴とする文書分類装置。 - コンピュータにより、文書を内容に応じて分類するための文書分類方法において、
前記コンピュータが、
時刻情報が付与された学習文書を、所定のカテゴリに属する正例と前記カテゴリに属さない負例とに分けて記憶する学習文書記憶手段に格納されている学習文書それぞれに関して、学習文書に付与された時刻情報で示される時刻から現在までの経過時間を計算し、該経過期間に応じた重みを設定し、該学習文書に含まれる言語情報を構成する要素であり該学習文書の特徴を示す素性に対して、該学習文書の重みを設定し、
前記カテゴリに対する正例の学習文書の素性のうち、重みの値が大きい素性ほど前記カテゴリの特徴を強く表しているものと評価し、各素性が前記カテゴリの特徴を示すか否かを示す学習結果を生成し、
分類対象文書が入力されると、前記学習手段により生成された前記学習結果に基づいて、前記分類対象文書が前記カテゴリに属するか否かを判断し、
前記分類対象文書が前記カテゴリに属すると判断された場合には、前記分類対象文書を正例の学習文書として時刻情報付きで前記学習文書記憶手段に格納し、前記分類対象文書が前記カテゴリに属さないと判断された場合には、前記分類対象文書を負例の学習文書として時刻情報付きで前記学習文書記憶手段に格納する、
ことを特徴とする文書分類方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005368274A JP4757016B2 (ja) | 2005-12-21 | 2005-12-21 | 文書分類プログラム、文書分類装置、および文書分類方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005368274A JP4757016B2 (ja) | 2005-12-21 | 2005-12-21 | 文書分類プログラム、文書分類装置、および文書分類方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007172249A JP2007172249A (ja) | 2007-07-05 |
JP4757016B2 true JP4757016B2 (ja) | 2011-08-24 |
Family
ID=38298738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005368274A Expired - Fee Related JP4757016B2 (ja) | 2005-12-21 | 2005-12-21 | 文書分類プログラム、文書分類装置、および文書分類方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4757016B2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5167891B2 (ja) * | 2008-03-21 | 2013-03-21 | Jfeスチール株式会社 | 結果予測装置、及び、これを用いた製品品質予測方法 |
JP5332918B2 (ja) * | 2009-06-04 | 2013-11-06 | 富士通株式会社 | 区分データレコメンド方法、プログラム、及び装置 |
JP5348786B2 (ja) * | 2010-01-05 | 2013-11-20 | 株式会社Kddi研究所 | 検索キーワード辞書に対する非検索キーワード辞書を用いた文章検索プログラム、サーバ及び方法 |
JP5346841B2 (ja) * | 2010-02-22 | 2013-11-20 | 株式会社野村総合研究所 | 文書分類システムおよび文書分類プログラムならびに文書分類方法 |
JP5192518B2 (ja) * | 2010-08-04 | 2013-05-08 | 三菱電機インフォメーションシステムズ株式会社 | 文書検索システム、文書検索方法および文書検索プログラム |
CN103299304B (zh) | 2011-01-13 | 2016-09-28 | 三菱电机株式会社 | 分类规则生成装置和分类规则生成方法 |
JP5661588B2 (ja) * | 2011-10-06 | 2015-01-28 | ヤフー株式会社 | 情報表示装置、プログラム、情報表示方法及び情報表示システム |
JP5696106B2 (ja) * | 2012-09-05 | 2015-04-08 | 日本電信電話株式会社 | 同義タグ抽出装置及び方法及びプログラム |
JP5827208B2 (ja) | 2012-11-30 | 2015-12-02 | 株式会社Ubic | 文書管理システムおよび文書管理方法並びに文書管理プログラム |
JP5827206B2 (ja) * | 2012-11-30 | 2015-12-02 | 株式会社Ubic | 文書管理システムおよび文書管理方法並びに文書管理プログラム |
KR101981075B1 (ko) * | 2015-03-31 | 2019-05-22 | 가부시키가이샤 프론테오 | 데이터 분석 시스템, 데이터 분석 방법, 데이터 분석 프로그램, 및 기록매체 |
CN106951422B (zh) * | 2016-01-07 | 2021-05-28 | 腾讯科技(深圳)有限公司 | 网页训练的方法和装置、搜索意图识别的方法和装置 |
JP6373320B2 (ja) * | 2016-09-08 | 2018-08-15 | ヤフー株式会社 | 生成装置、生成方法、及び生成プログラム |
JP6939205B2 (ja) * | 2016-11-11 | 2021-09-22 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
JP6839001B2 (ja) * | 2017-03-14 | 2021-03-03 | 日本放送協会 | モデル学習装置、情報判定装置およびそれらのプログラム |
JP7243402B2 (ja) * | 2019-04-11 | 2023-03-22 | 富士通株式会社 | 文書処理方法、文書処理プログラムおよび情報処理装置 |
JP7346110B2 (ja) * | 2019-07-08 | 2023-09-19 | キヤノン株式会社 | システム、方法、及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02260001A (ja) * | 1989-03-31 | 1990-10-22 | Matsushita Electric Ind Co Ltd | ファジィ同定器 |
JP2001167124A (ja) * | 1999-12-13 | 2001-06-22 | Sharp Corp | 文書分類装置及び文書分類プログラムを記録した記録媒体 |
JP2002202984A (ja) * | 2000-11-02 | 2002-07-19 | Fujitsu Ltd | ルールベースモデルに基づくテキスト情報自動分類装置 |
JP2002222083A (ja) * | 2001-01-29 | 2002-08-09 | Fujitsu Ltd | 事例蓄積装置および方法 |
JP4225542B2 (ja) * | 2003-06-25 | 2009-02-18 | 日本電信電話株式会社 | キーワードベクトル辞書生成装置とシステムおよびプログラム |
-
2005
- 2005-12-21 JP JP2005368274A patent/JP4757016B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007172249A (ja) | 2007-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4757016B2 (ja) | 文書分類プログラム、文書分類装置、および文書分類方法 | |
JP5940647B2 (ja) | 文書の電子的調査 | |
US10896214B2 (en) | Artificial intelligence based-document processing | |
US10366119B2 (en) | Customized content stream utilizing dwelltime-based machine learning | |
US20160299923A1 (en) | Systems and Methods for Cleansing Automated Robotic Traffic | |
Agarwal et al. | Statistical methods for recommender systems | |
US8150822B2 (en) | On-line iterative multistage search engine with text categorization and supervised learning | |
US20080319973A1 (en) | Recommending content using discriminatively trained document similarity | |
US20180341686A1 (en) | System and method for data search based on top-to-bottom similarity analysis | |
WO2006116516A2 (en) | Temporal search results | |
WO2010081238A1 (en) | Method and system for document classification | |
US8856109B2 (en) | Topical affinity badges in information retrieval | |
CN113139141B (zh) | 用户标签扩展标注方法、装置、设备及存储介质 | |
US10289624B2 (en) | Topic and term search analytics | |
CN112307336A (zh) | 热点资讯挖掘与预览方法、装置、计算机设备及存储介质 | |
Walsh et al. | Analysis of transaction logs from National Museums Liverpool | |
CN117743848A (zh) | 一种用户画像生成方法、装置、电子设备及存储介质 | |
CN116882414A (zh) | 基于大规模语言模型的评语自动生成方法及相关装置 | |
JP2005267095A (ja) | 情報表示方法及び装置及び情報表示プログラム | |
KR102126911B1 (ko) | KeyplayerRank를 이용한 소셜 미디어상의 주제별 키플레이어 탐지 방법 | |
Hao et al. | An Algorithm for Generating a Recommended Rule Set Based on Learner's Browse Interest | |
Kühl et al. | Automatically quantifying customer need tweets: Towards a supervised machine learning approach | |
Kelly et al. | A user-centered approach to evaluating topic models | |
US20200226159A1 (en) | System and method of generating reading lists | |
Robles et al. | Collaborative filtering using interval estimation naive Bayes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080416 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110531 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110531 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4757016 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140610 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |