JP2008282111A5 - - Google Patents

Download PDF

Info

Publication number
JP2008282111A5
JP2008282111A5 JP2007124084A JP2007124084A JP2008282111A5 JP 2008282111 A5 JP2008282111 A5 JP 2008282111A5 JP 2007124084 A JP2007124084 A JP 2007124084A JP 2007124084 A JP2007124084 A JP 2007124084A JP 2008282111 A5 JP2008282111 A5 JP 2008282111A5
Authority
JP
Japan
Prior art keywords
document
similarity
input document
classification
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007124084A
Other languages
English (en)
Other versions
JP2008282111A (ja
JP4479745B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2007124084A priority Critical patent/JP4479745B2/ja
Priority claimed from JP2007124084A external-priority patent/JP4479745B2/ja
Publication of JP2008282111A publication Critical patent/JP2008282111A/ja
Publication of JP2008282111A5 publication Critical patent/JP2008282111A5/ja
Application granted granted Critical
Publication of JP4479745B2 publication Critical patent/JP4479745B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (6)

  1. コンピュータにて、入力文書に類似する文書を検索する処理を実施する類似文書検索方法であって、
    前記コンピュータの情報処理手段により、
    前記文書を識別する情報、前記文書の分類および前記入力文書との類似度から構成されるレコードを複数有する記憶手段の前記各レコードの前記文書の分類と、前記入力文書の分類とを照合する処理と、
    共通する分類がある場合に、該共通する分類に関連付いた前記入力文書の類似度に予め決められた補正値を加算し、または該共通する分類に関連付いた前記入力文書の類似度に予め決められた割合を乗じ、その演算結果を前記入力文書の類似度に加算し、または前記各レコードの前記入力文書との類似度のうち一番高い入力文書との類似度に予め決められた割合を乗じ、その演算結果を前記入力文書の類似度に加算して、前記入力文書の類似度を補正する処理と、
    前記各レコードの情報を出力する処理とを実施する、
    ことを特徴とする類似文書検索方法。
  2. 前記各レコードの情報を出力する処理は、前記文書の検索順位を示す情報とともに、前記各レコードの前記入力文書の類似度が高い順に出力する処理である、
    ことを特徴とする請求項1に記載の類似文書検索方法。
  3. 入力文書に類似する文書を検索する類似文書検索装置であって、
    前記文書を識別する情報、前記文書の分類および前記入力文書との類似度から構成されるレコードを複数有する記憶手段と、
    前記記憶手段の前記各レコードの前記文書の分類と、前記入力文書の分類とを照合する手段と、
    共通する分類がある場合に、該共通する分類に関連付いた前記入力文書の類似度に予め決められた補正値を加算し、または該共通する分類に関連付いた前記入力文書の類似度に予め決められた割合を乗じ、その演算結果を前記入力文書の類似度に加算し、または前記各レコードの前記入力文書との類似度のうち一番高い入力文書との類似度に予め決められた割合を乗じ、その演算結果を前記入力文書の類似度に加算して、前記入力文書の類似度を補正する手段と、
    前記各レコードの情報を出力する手段とを有する、
    を有することを特徴とする類似文書検索装置。
  4. 前記各レコードの情報を出力する手段は、前記文書の検索順位を示す情報とともに、前記各レコードの前記入力文書の類似度が高い順に出力する手段である、
    ことを特徴とする請求項3に記載の類似文書検索装置
  5. コンピュータに、入力文書に類似する文書を検索する処理を実行させるプログラムであって、
    前記文書を識別する情報、前記文書の分類および前記入力文書との類似度から構成されるレコードを複数有する記憶手段の前記各レコードの前記文書の分類と、前記入力文書の分類とを照合する処理と、
    共通する分類がある場合に、該共通する分類に関連付いた前記入力文書の類似度に予め決められた補正値を加算し、または該共通する分類に関連付いた前記入力文書の類似度に予め決められた割合を乗じ、その演算結果を前記入力文書の類似度に加算し、または前記各レコードの前記入力文書との類似度のうち一番高い入力文書との類似度に予め決められた割合を乗じ、その演算結果を前記入力文書の類似度に加算して、前記入力文書の類似度を補正する処理と
    を実行させる、
    ことを特徴とする特徴とするプログラム。
  6. 前記各レコードの情報を出力する処理は、前記文書の検索順位を示す情報とともに、前記各レコードの前記入力文書の類似度が高い順に出力する処理である、
    ことを特徴とする請求項6に記載のプログラム。
JP2007124084A 2007-05-09 2007-05-09 文書の類似度補正方法、プログラムおよびコンピュータ Active JP4479745B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007124084A JP4479745B2 (ja) 2007-05-09 2007-05-09 文書の類似度補正方法、プログラムおよびコンピュータ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007124084A JP4479745B2 (ja) 2007-05-09 2007-05-09 文書の類似度補正方法、プログラムおよびコンピュータ

Publications (3)

Publication Number Publication Date
JP2008282111A JP2008282111A (ja) 2008-11-20
JP2008282111A5 true JP2008282111A5 (ja) 2009-05-07
JP4479745B2 JP4479745B2 (ja) 2010-06-09

Family

ID=40142894

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007124084A Active JP4479745B2 (ja) 2007-05-09 2007-05-09 文書の類似度補正方法、プログラムおよびコンピュータ

Country Status (1)

Country Link
JP (1) JP4479745B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4521459B2 (ja) * 2008-12-18 2010-08-11 株式会社日立製作所 文書分類装置、文書分類方法およびプログラム
JP5324677B2 (ja) * 2012-02-24 2013-10-23 株式会社日立製作所 類似文書検索支援装置及び類似文書検索支援プログラム
WO2016103409A1 (ja) * 2014-12-25 2016-06-30 株式会社日立製作所 検索システム
JP6623547B2 (ja) 2015-05-12 2019-12-25 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Similar Documents

Publication Publication Date Title
Liu et al. Supervised matrix factorization for cross-modality hashing
JP2010086412A5 (ja)
JP2005293589A5 (ja)
JP2008250666A5 (ja)
JP2010538375A5 (ja)
WO2015184992A1 (zh) 一种识别重复图片的方法、图片搜索去重方法及其装置
JP2008537264A5 (ja)
JP5616444B2 (ja) 文書インデックス化およびデータクエリングのための方法およびシステム
JP2013535737A5 (ja)
JP2007172102A5 (ja)
JP2011028749A5 (ja)
JP2008257469A5 (ja)
JP2005309853A5 (ja)
JP2009187400A5 (ja)
JP2020129389A5 (ja)
JP2008282111A5 (ja)
JP2009080525A5 (ja)
JP2009271792A5 (ja)
JP2008003944A5 (ja)
JP2014526727A5 (ja)
JP2007035022A5 (ja)
JP2020071678A5 (ja)
JP2007206964A5 (ja)
JP2015533674A5 (ja)
JP2009032154A5 (ja)