JP2009259250A - 文書の分類器を生成する方法とそのシステム - Google Patents
文書の分類器を生成する方法とそのシステム Download PDFInfo
- Publication number
- JP2009259250A JP2009259250A JP2009097929A JP2009097929A JP2009259250A JP 2009259250 A JP2009259250 A JP 2009259250A JP 2009097929 A JP2009097929 A JP 2009097929A JP 2009097929 A JP2009097929 A JP 2009097929A JP 2009259250 A JP2009259250 A JP 2009259250A
- Authority
- JP
- Japan
- Prior art keywords
- classifier
- training data
- result
- rough
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 分類器を生成する方法は、オブジェクト集合についてクラスタリング結果の取得し、ラフな分類器を取得するためにオブジェクト集合についてラフなカテゴリ分類結果を生成し、最終的な分類器を生成するためにクラスタリング結果でラフなカテゴリ分類結果を調整する。1つの実施例では、ラフなカテゴリ分類結果は、整合モジュールによってクラスタリング結果と整合することが可能である。このように、カテゴリ名称および対応する意味論的解析から生じる可能な限りのる偏りを制御することが可能である。本発明の分類器生成方法およびシステムによれば、文書分類の精度および拡張性は非常に改善される。
【選択図】 図1
Description
本発明は、この技術分野における既存の文書分類アプローチの前述の課題に鑑みて提案された。
取得した文書集合は、ステップ202に示すように、ラフなカテゴリ化結果(つまり、ラフな分類器)を生成するために、ラフカテゴリ化のためのラフカテゴリ化手段102に提供される。例えば、既存の教師あり文書分類、半教師あり文書分類あるいは背景技術で説明したような教師なし文書分類方法のうちの何れかが、ラフなかカテゴリ化の目的を実施するために適用することができる。ある実施の形態においては、例えば、後述するように、トレーニングデータを含む分類を学習する方法が、ラフな分類を生成するために採用することができる。異なるアプリケーション要求に従って、分類器を学習するためのトレーニングデータは、手作業でラベル付けされたトレーニングデータとして外部から入力することができ、あるいは、外部知識源からのカテゴリ名称に関する意味的な情報を参照することにより自動的に生成することができる。トレーニングデータの生成処理手順の詳細については、後述する。
上述のように、ラフなカテゴリ分類結果が一連の順位スコアとして表わされるものと仮定する。
Cをカテゴリ集合とする。文書di∈Dとカテゴリci∈Cに対して、順位スコアs(di、cj)は、diがcjに属する可能性を暗黙に示している。よって、式1によってスコアを正規化する。
その結果、P(cj|di)=s'(di、cj)と見なすことができる。
ここで、事前確率P(cj|di)はラフな分類結果から得る。
明らかに、基礎的統計を利用することにより可能性を以下のように計算することができる。
よって、最終の整合モデルは以下のように示すことができる。
単語「スパム」は、WordNetにおいて2つの意味を有することができる。すなわち、(意味1):主として豚肉から作られた缶詰肉と、(意味2):不要な電子メールである。
我々は、製品プロファイル分類のための「スパム」の同義語を選ぶためにそれらを区別する必要がある。したがって、「スパム+主として豚肉から作られた缶詰肉」と「スパム+不要な電子メール」は、文書集合(すなわち製品プロファイル集合)に送られる2つのクエリとして使用することができる。
前者のクエリに対して、20のヒットがあり、後者のクエリに対して、100のヒットがあったとする。100>20であるので、この分類タスクの文脈中の「スパム」が意味2を有すると判断することができる。その後、意味2の同義語(すなわち「ジャンク電子メール」)が選択される。
図8に戻り、ステップ704において、生成された適切なキーワードは、中間の分類結果(すなわち中間の分類器)を取得するために、文書の集合を分類するための分類部504に供給される。次に、ステップ705において、中間の分類結果は必要なトレーニングデータの生成のためにトレーニングデータ生成部505に供給される。その後、処理手順700が終了する。
図7に示すように、この例において、分類部504は、検索部601およびカテゴリラベル付け部602を含む。再び図8におけるステップ704を参照すると、ステップ704は、いくつかのサブステップを含んでいることを示している。まず、サブステップ7041において、検索部601はキーワード生成部503からカテゴリ名称関連キーワードを受け取り、文書の集合を検索するために代表的なプロファイルとしてキーワードを利用する。その後、ステップ7042において、探索結果がそうであるように、ヒットリストはカテゴリラベル付け部602に送った。ラベルは、文書分類を達成するために対応するカテゴリにヒットリスト中のすべてあるいはいくつかの(例えば、最初の200)文書をラベルを付けられる。
例えば、「anti_spam」の製品カテゴリについて、「Spam+Junk email」が、検索のための文書集合に関連するキーワードとして送られる。
ここで、「スパム」は、カテゴリ名称(すなわち「anti_spam」)から識別される。また、「ジャンク電子メール」はWordNetから選択された同義語である。
ヒットリストにおいて返された結果が1000あると仮定すると、「anti_spam」製品の代表的な製品概要として上位の200の項目を選択するかもしれない。
上位の200の製品概要が、製品がanti_spam機能を有するか、あるいは製品が「anti_spam」カテゴリに属するかどうかを人が判断するために利用する全ての必要な特徴を保持すると思われる。
図9の方法との差異は事前確率の計算にある。
種々の分類器からの文書分類結果について一定の特別の方法を採用することができるかもしれない。例えば、NB分類器が採用されるとき、事前確率は、分類器から直接返される各対のカテゴリcjおよび文書diについてP(cj|di)である。
(a)初期のトレーニングデータT:C→Powerset(D)(すなわち、ラベル付けされた文書部分集合)の入力;
(b)TによりNB分類器の学習、また各カテゴリ文書対(c,d) ∈C×Dに対してP(c|d)を取得するためにその学習結果を利用;
(c)各(c、d)∈C×Dに対して、d∈C’がクラスタリング結果内であれば、整合モデルによりP(c|d、c’)を計算するために、P’(c|d)=P(c|d、c’)とする;
(d)データT’:C→Powerset(D)をトレーニングするためのいくつかの新たなラベル付けされた文書を生成;
ここで、各c∈C, T’(c)は、文書集合D−domain(T)(D間の差集合およびTのドメイン集合)の内でP’(c|d)が最も上位である文書を含んでいる。
(e)T'=Φであるなら反復処理を終了し、そうでなければ、T:=T+T'とし、ステップb)にジャンプし、次の反復を開始する。
反復学習処理中に、反復サイクルはそれぞれ、カテゴリ文書対P’(c|d)の事後確率関数によって表わすことが可能な分類器を生成する。もちろん、本発明に関する分類器はNB分類器に制限ではない。他の種類の分類器は、明らかに本発明に適用することが可能である。
ベイジアンモデルを含む次のような式を有する
最大尤度法に基づいて、P(C’|Fk)を最大にする特定のFkを見つけ出す。
言うまでもなく、お互いに独立した文書とすると、次のように表すことができる。
ここで、c’(d)が文書dが属するクラスターであり、c(d)はdが分類器Fkに属するカテゴリである。
同様に、上述した整合モデルの尤度計算として、Fkの尤度関数は以下の通
りである。
そして、最終分類器は、
として導かれる。
10:分類器生成サブシステム
101:取得手段101
102:ラフカテゴリ化手段
103:調整・生成手段
104:クラスタリング結果ベース
105:文書ベース
107:文書クラスタリング手段
108:文書分類結果ベース
106:最終分類器
301:事前確率計算ユニット
302:整合ユニット
401A:トレーニングデータ生成ユニット
402:学習ユニット
401B:トレーニングデータ生成ユニット
402:学習ユニット
403:カテゴリ名称ベース
404:外部知識源
501:カテゴリ名称取得部
502:語義曖昧性解消部
503:キーワード生成部
504:分類部
505:トレーニングデータ生成部
504:分類部
601:検索部
602:カテゴリラベル付け部
505:トレーニングデータ生成部
8011:事前確率計算ユニット
8012:整合ユニット
802:トレーニングデータ選択部
803:分類器
Claims (25)
- 分類器を生成する方法であって、
オブジェクト集合についてクラスタリング結果の取得し、
ラフな分類器を取得するためにオブジェクト集合についてラフなカテゴリ分類結果を生成し、
最終的な分類器を生成するために前記クラスタリング結果でラフな前記カテゴリ分類結果を調整する
ことを特徴とする分類器の生成方法。 - 前記ラフなカテゴリ分類結果を調整するステップが、
前記ラフなカテゴリ分類結果に対応する事前確率を計算するステップと、
整合結果に対応する事後確率を生成する確率方法によって、前記クラスタリング結果に対して前記ラフなカテゴリ分類結果を整合させるステップと、
前記事後確率によって前記最終的な分類器を生成するステップとを含むことを特徴とする請求項1に記載の分類器の生成方法。 - 前記確率方法が、ベイズの推論方法であることを特徴とする請求項2に記載の分類器の生成方法。
- 前記ラフな分類器を得るために前記ラフなカテゴリ分類結果を生成するステップは、
トレーニングデータを取得するステップと、
前記トレーニングデータにより前記ラフな分類器を学習するステップとを含むことを特徴とする請求項1に記載の分類器の生成方法。 - 前記トレーニングデータは、手作業でラベル付けされたトレーニングデータであることを特徴とする請求項4に記載の分類器の生成方法。
- 前記トレーニングデータは、
前記オブジェクト集合に関するカテゴリ名称を取得するステップと、
前記カテゴリ名称に基づいて関連するキーワードを生成するステップと、
中間のカテゴリ分類結果を取得するために前記関連するキーワードで前記オブジェクト集合を分類するステップと、
前記中間のカテゴリ分類結果から前記トレーニングデータを取得するステップとにより、
自動的に生成されることを特徴とする請求項4に記載の分類器の生成方法。 - 前記関連するキーワードを生成するステップは、さらに、
外部知識源を参照して取得した前記カテゴリ名称について語義曖昧性解消を実行するステップと、
語義曖昧性解消の後に前記カテゴリ名称に基づいて前記関連するキーワードを生成するステップとを含むことを特徴とする請求項6に記載の分類器の生成方法。 - 前記キーワードは、代表的なプロファイルとして使用され、
前記中間のカテゴリ分類結果を取得するステップは、
前記オブジェクト集合を検索するために前記代表的なプロファイルをクエリ用語として利用するステップと、
対応するカテゴリに対する探索結果としてのヒットリストにおけるオブジェクトにラベルを付けるステップとを含むことを特徴とする請求項6に記載の分類器の生成方法。 - 前記ヒットリスト中の上位の所定数のオブジェクトが対応するカテゴリにレベル付けされることを特徴とする請求項8に記載の分類器の生成方法。
- 前記中間のカテゴリ分類結果からのトレーニングデータを取得するステップは、
中間の分類器を生成するために前記クラスタリング結果で中間のカテゴリ分類結果を調整するステップと、
生成された中間の分類器に対応する調整されたカテゴリ分類結果から選ばれたトレーニングデータを取得するステップとを含むことを特徴とする請求項6に記載の分類器の生成方法。 - 前記最終的な分類器を生成するために前記クラスタリング結果でラフなカテゴリ分類結果を調整するステップにおいて、
トレーニングデータを初期のトレーニングデータとして使用し、ラフな分類器を初期の分類器として使用するにより、反復分類器学習が実行され、
それにより、中間の分類器のグループが生成され、当該中間の分類器のグループから最適な分類器が最終的な分類器として選択されることを特徴とする請求項4に記載の分類器の生成方法。 - 前記最適な分類器は、クラスタリング結果に最も一致する分類器であることを特徴とする請求項11に記載の分類器の生成方法。
- 前記反復分類器学習における反復の1サイクルが、
反復の前のサイクルで生成されたトレーニングデータで反復の現在のサイクルに対応する中間の分類器を学習するステップと、
反復の現在のサイクルの中間のカテゴリ分類結果を取得するために、反復の現在のサイクルに対応する学習された中間の分類器を使用することにより、オブジェクト集合を分類するステップと、
反復の次のサイクルのために使用されるトレーニングデータを生成するために、クラスタリング結果で反復の現在のサイクルの中間のカテゴリ分類結果を調整するステップとを含むことを特徴とする請求項11に記載の分類器の生成方法。 - 分類器を生成するシステムであって、
オブジェクト集合についてクラスタリング結果の取得する取得手段と、
ラフな分類器を取得するためにオブジェクト集合についてラフなカテゴリ分類結果を生成するラフなカテゴリ化手段と、
最終的な分類器を生成するために前記クラスタリング結果でラフな前記カテゴリ分類結果を調整する調整・生成手段と
を備えることを特徴とする分類器生成システム。 - 前記調整・生成手段が、
前記ラフなカテゴリ分類結果に対応する事前確率を計算する事前確率計算ユニットと、
整合結果に対応する事後確率を生成する確率方法によって、前記クラスタリング結果に対して前記ラフなカテゴリ分類結果を整合させ、前記事後確率によって前記最終的な分類器を生成するる整合ユニットとを備えることを特徴とする請求項14に記載の分類器生成システム。 - 前記確率方法が、ベイズの推論方法であることを特徴とする請求項15に記載の分類器生成システム。
- 前記ラフなカテゴリ化手段が、
トレーニングデータを取得するトレーニングデータ生成ユニットと、
前記トレーニングデータにより前記ラフな分類器を学習する学習ユニットとを備えることを特徴とする請求項14に記載の分類器生成システム。 - 前記トレーニングデータ生成ユニットは、外部から手作業でラベル付けされたトレーニングデータを取得することを特徴とする請求項17に記載の分類器生成システム。
- カテゴリ名称に関するドメインを格納するカテゴリ名称ベースを備え、
前記トレーニングデータ生成ユニットが、
前記オブジェクト集合に関するカテゴリ名称を取得するカテゴリ名称取得部と、
前記カテゴリ名称に基づいて関連するキーワードを生成するキーワード生成部と、
中間のカテゴリ分類結果を取得するために前記関連するキーワードで前記オブジェクト集合を分類する分類部と、
前記中間のカテゴリ分類結果から前記トレーニングデータを取得するトレーニングデータ生成部とを備え、自動的に前記トレーニングデータを生成することを特徴とする請求項17に記載の分類器生成システム。 - 前記カテゴリ名称に関する知識を格納する外部知識源をさらに備え、
前記トレーニングデータ生成ユニットは、前記外部知識源を参照して取得したカテゴリ名称について語義曖昧性解消を実行する語義曖昧性解消部を備え、
前記トレーニングデータ生成部は、語義曖昧性解消の後にカテゴリ名称に基づいて関連するキーワードを生成することを特徴とする請求項19に記載の分類器生成システム。 - 前記キーワードは、代表的なプロファイルとして使用され、
前記分類部は、
前記オブジェクト集合を検索するために前記代表的なプロファイルをクエリ用語として利用する検索部と、
対応するカテゴリに対する探索結果としてのヒットリストにおけるオブジェクトにラベルを付けるカテゴリラベル付け部とを備えることを特徴とする請求項19に記載の分類器生成システム。 - 前記カテゴリラベル付け部は、前記ヒットリスト中の上位の所定数のオブジェクトを対応するカテゴリにレベル付けすることを特徴とする請求項21に記載の分類器生成システム。
- 前記トレーニングデータ生成部は、
中間の分類器を生成するために前記クラスタリング結果で中間のカテゴリ分類結果を調整する調整・生成部と、
生成された中間の分類器に対応する調整されたカテゴリ分類結果から選ばれたトレーニングデータを取得するトレーニングデータ選択部とを備えることを特徴とする請求項19に記載の分類器生成システム。 - 前記調整・生成手段は、トレーニングデータを初期のトレーニングデータとして使用し、ラフな分類器を初期の分類器として使用するにより、反復分類器学習を実行し、中間の分類器のグループを生成し、当該中間の分類器のグループから最適な分類器を最終的な分類器として選択することを特徴とする請求項17に記載の分類器生成システム。
- 前記最適な分類器は、クラスタリング結果に最も一致する分類器であることを特徴とする請求項24に記載の分類器生成システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810094208.9 | 2008-04-18 | ||
CN200810094208.9A CN101561805B (zh) | 2008-04-18 | 2008-04-18 | 文档分类器生成方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009259250A true JP2009259250A (ja) | 2009-11-05 |
JP4926198B2 JP4926198B2 (ja) | 2012-05-09 |
Family
ID=41220612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009097929A Expired - Fee Related JP4926198B2 (ja) | 2008-04-18 | 2009-04-14 | 文書の分類器を生成する方法とそのシステム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4926198B2 (ja) |
CN (1) | CN101561805B (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011198137A (ja) * | 2010-03-19 | 2011-10-06 | Toshiba Corp | 文書分類装置およびプログラム |
JP2013161330A (ja) * | 2012-02-07 | 2013-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 学習データ生成装置、検索装置、学習データ生成方法、検索方法及びそのプログラム |
WO2014097670A1 (ja) * | 2012-12-21 | 2014-06-26 | 富士ゼロックス株式会社 | 文書分類装置及びプログラム |
JP2015520901A (ja) * | 2012-05-25 | 2015-07-23 | クリムゾン・ヘキサゴン・インコーポレイテッドCrimson Hexagon, Inc. | カテゴリー割合を算出するシステムおよび方法 |
WO2020122286A1 (ko) * | 2018-12-13 | 2020-06-18 | (주)한국플랫폼서비스기술 | 자동 분류저장 기술을 이용한 dbms-ai 프레임 워크 및 이를 이용한 자동분류저장 방법 |
CN113474769A (zh) * | 2019-02-20 | 2021-10-01 | 日立产业控制解决方案有限公司 | 图像检索装置以及监督数据提取方法 |
CN113934848A (zh) * | 2021-10-22 | 2022-01-14 | 马上消费金融股份有限公司 | 一种数据分类方法、装置和电子设备 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012095971A1 (ja) * | 2011-01-13 | 2012-07-19 | 三菱電機株式会社 | 分類ルール生成装置、分類ルール生成方法、分類ルール生成プログラム及び記録媒体 |
CN102789449B (zh) * | 2011-05-20 | 2016-08-03 | 日电(中国)有限公司 | 对评论文本进行评价的方法和装置 |
CN103246670B (zh) | 2012-02-09 | 2016-02-17 | 深圳市腾讯计算机系统有限公司 | 微博排序、搜索、展示方法和系统 |
CN103246685B (zh) * | 2012-02-14 | 2016-12-14 | 株式会社理光 | 将对象实例的属性规则化为特征的方法和设备 |
CN103324632B (zh) * | 2012-03-22 | 2016-08-03 | 日电(中国)有限公司 | 一种基于协同学习的概念识别方法及装置 |
CN103678643B (zh) * | 2013-12-20 | 2017-02-08 | 公安部第三研究所 | 一种针对关联关系的语义区分能力度量方法 |
CN104809131B (zh) * | 2014-01-27 | 2021-06-25 | 董靖 | 电子文档的自动分类系统和方法 |
CN105631488A (zh) * | 2014-09-23 | 2016-06-01 | 无锡卓识科技有限公司 | 一种数字对象分类器生成方法 |
CA3008462A1 (en) * | 2016-04-05 | 2017-10-12 | Thomson Reuters Global Resources Unlimited Company | Self-service classification system |
CN108536791B (zh) * | 2018-03-30 | 2019-07-30 | 北京百度网讯科技有限公司 | 基于神经网络的搜索方法、设备及存储介质 |
CN109726288A (zh) * | 2018-12-28 | 2019-05-07 | 上海点融信息科技有限责任公司 | 基于人工智能处理的文本分类方法和装置 |
CN109754020B (zh) * | 2019-01-10 | 2020-08-04 | 东华理工大学 | 融合多层级渐进策略和非监督学习的地面点云提取方法 |
CN110399544A (zh) * | 2019-06-27 | 2019-11-01 | 迪安诊断技术集团股份有限公司 | 电子病历数字对象分类器生成方法以及最终分类器系统 |
CN111709293B (zh) * | 2020-05-18 | 2023-10-03 | 杭州电子科技大学 | 一种基于ResUNet神经网络的化学结构式分割方法 |
CN111931875B (zh) * | 2020-10-10 | 2021-10-08 | 北京世纪好未来教育科技有限公司 | 数据处理方法、电子设备及计算机可读介质 |
TWI777496B (zh) * | 2021-04-16 | 2022-09-11 | 台達電子工業股份有限公司 | 知識實體識別方法及知識實體識別裝置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1078971A (ja) * | 1996-09-02 | 1998-03-24 | Canon Inc | 文書分類装置及び文書分類方法 |
JP2001195379A (ja) * | 2000-01-14 | 2001-07-19 | Nippon Telegr & Teleph Corp <Ntt> | 多数決予測機械の構成方法、多数決予測機械及びその記録媒体 |
JP2003132332A (ja) * | 2001-10-26 | 2003-05-09 | Fujitsu Ltd | 学習データ作成支援装置 |
JP2005182611A (ja) * | 2003-12-22 | 2005-07-07 | Fuji Xerox Co Ltd | 文書分類方法、文書分類装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1766871A (zh) * | 2004-10-29 | 2006-05-03 | 中国科学院研究生院 | 基于上下文的半结构化数据语义提取的处理方法 |
-
2008
- 2008-04-18 CN CN200810094208.9A patent/CN101561805B/zh not_active Expired - Fee Related
-
2009
- 2009-04-14 JP JP2009097929A patent/JP4926198B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1078971A (ja) * | 1996-09-02 | 1998-03-24 | Canon Inc | 文書分類装置及び文書分類方法 |
JP2001195379A (ja) * | 2000-01-14 | 2001-07-19 | Nippon Telegr & Teleph Corp <Ntt> | 多数決予測機械の構成方法、多数決予測機械及びその記録媒体 |
JP2003132332A (ja) * | 2001-10-26 | 2003-05-09 | Fujitsu Ltd | 学習データ作成支援装置 |
JP2005182611A (ja) * | 2003-12-22 | 2005-07-07 | Fuji Xerox Co Ltd | 文書分類方法、文書分類装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011198137A (ja) * | 2010-03-19 | 2011-10-06 | Toshiba Corp | 文書分類装置およびプログラム |
JP2013161330A (ja) * | 2012-02-07 | 2013-08-19 | Nippon Telegr & Teleph Corp <Ntt> | 学習データ生成装置、検索装置、学習データ生成方法、検索方法及びそのプログラム |
JP2015520901A (ja) * | 2012-05-25 | 2015-07-23 | クリムゾン・ヘキサゴン・インコーポレイテッドCrimson Hexagon, Inc. | カテゴリー割合を算出するシステムおよび方法 |
WO2014097670A1 (ja) * | 2012-12-21 | 2014-06-26 | 富士ゼロックス株式会社 | 文書分類装置及びプログラム |
JP2014123286A (ja) * | 2012-12-21 | 2014-07-03 | Fuji Xerox Co Ltd | 文書分類装置及びプログラム |
AU2013365452B2 (en) * | 2012-12-21 | 2017-05-25 | Fujifilm Business Innovation Corp. | Document classification device and program |
US10353925B2 (en) | 2012-12-21 | 2019-07-16 | Fuji Xerox Co., Ltd. | Document classification device, document classification method, and computer readable medium |
WO2020122286A1 (ko) * | 2018-12-13 | 2020-06-18 | (주)한국플랫폼서비스기술 | 자동 분류저장 기술을 이용한 dbms-ai 프레임 워크 및 이를 이용한 자동분류저장 방법 |
CN113474769A (zh) * | 2019-02-20 | 2021-10-01 | 日立产业控制解决方案有限公司 | 图像检索装置以及监督数据提取方法 |
CN113934848A (zh) * | 2021-10-22 | 2022-01-14 | 马上消费金融股份有限公司 | 一种数据分类方法、装置和电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP4926198B2 (ja) | 2012-05-09 |
CN101561805A (zh) | 2009-10-21 |
CN101561805B (zh) | 2014-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4926198B2 (ja) | 文書の分類器を生成する方法とそのシステム | |
Yih et al. | Semantic parsing via staged query graph generation: Question answering with knowledge base | |
Sordoni et al. | A hierarchical recurrent encoder-decoder for generative context-aware query suggestion | |
Yang et al. | Large-scale high-precision topic modeling on twitter | |
Gao et al. | Visual-textual joint relevance learning for tag-based social image search | |
Blanco et al. | Entity recommendations in web search | |
US9846836B2 (en) | Modeling interestingness with deep neural networks | |
US9542652B2 (en) | Posterior probability pursuit for entity disambiguation | |
US8027977B2 (en) | Recommending content using discriminatively trained document similarity | |
US8538898B2 (en) | Interactive framework for name disambiguation | |
Miotto et al. | A generative context model for semantic music annotation and retrieval | |
Zhou et al. | A survey on multi-modal social event detection | |
US8620837B2 (en) | Determination of a basis for a new domain model based on a plurality of learned models | |
JP7257585B2 (ja) | 深層cca及び能動ペアワイズクエリを用いるマルチモーダル検索及びクラスタリングのための方法 | |
Duan et al. | One size does not fit all: Customizing ontology alignment using user feedback | |
Samadi et al. | Openeval: Web information query evaluation | |
Peng et al. | Multimodal ensemble fusion for disambiguation and retrieval | |
Lin et al. | E-commerce product query classification using implicit user’s feedback from clicks | |
WO2023057988A1 (en) | Generation and use of content briefs for network content authoring | |
Bing et al. | Learning a unified embedding space of web search from large-scale query log | |
Adami et al. | Clustering documents into a web directory for bootstrapping a supervised classification | |
Belattar et al. | CBIR using relevance feedback: comparative analysis and major challenges | |
Manjula et al. | Visual and tag-based social image search based on hypergraph ranking method | |
CN107341169B (zh) | 一种基于信息检索的大规模软件信息站标签推荐方法 | |
Anusha et al. | Multi-classification and automatic text summarization of Kannada news articles |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110520 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110927 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111208 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120207 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120207 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |