JP2014056516A5 - 情報処理装置、方法、およびプログラム - Google Patents

情報処理装置、方法、およびプログラム Download PDF

Info

Publication number
JP2014056516A5
JP2014056516A5 JP2012202037A JP2012202037A JP2014056516A5 JP 2014056516 A5 JP2014056516 A5 JP 2014056516A5 JP 2012202037 A JP2012202037 A JP 2012202037A JP 2012202037 A JP2012202037 A JP 2012202037A JP 2014056516 A5 JP2014056516 A5 JP 2014056516A5
Authority
JP
Japan
Prior art keywords
document
arrangement
field
map
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012202037A
Other languages
English (en)
Other versions
JP5700007B2 (ja
JP2014056516A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2012202037A priority Critical patent/JP5700007B2/ja
Priority claimed from JP2012202037A external-priority patent/JP5700007B2/ja
Publication of JP2014056516A publication Critical patent/JP2014056516A/ja
Publication of JP2014056516A5 publication Critical patent/JP2014056516A5/ja
Application granted granted Critical
Publication of JP5700007B2 publication Critical patent/JP5700007B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

上記目的を達成するための第1の発明は、複数の文書に対してそれぞれの文書内容に基づいて各々の文書が属する度合いを算出して分野を特定する分野特定手段と、他文書と弁別するためのキーワードを前記文書から抽出するキーワード抽出手段と、前記分野特定手段による前記度合いを用いて、前記キーワード間の関係性を示すためのマップへ前記分野を配置するための配置情報を生成するマップ生成手段と、前記マップ生成手段によって生成された配置情報に基づいて、配置された分野に属する文書を特定する配置特定手段と、
前記配置特定手段によって特定された文書について前記キーワード抽出手段によって抽出した当該文書のキーワードを、当該文書が属する分野の前記マップにおける配置へ表示する表示手段と、を備えたことを特徴とする。
上記目的を達成するための第2の発明は、情報処理装置において文書を分類する方法であって、前記情報処理装置の分野特定手段は、複数の文書に対してそれぞれの文書内容に基づいて各々の文書が属する度合いを算出して分野を特定する分野特定ステップと、前記情報処理装置のキーワード抽出手段は、他文書と弁別するためのキーワードを前記文書から抽出するキーワード抽出ステップと、前記情報処理装置のマップ生成手段は、前記分野特定ステップによる前記度合いを用いて、前記キーワード間の関係性を示すためのマップへ前記分野を配置するための配置情報を生成するマップ生成ステップと、前記情報処理装置の配置特定手段は、前記マップ生成ステップによって生成された配置情報に基づいて、配置された分野に属する文書を特定する配置特定ステップと、前記情報処理装置の表示手段は、前記配置特定ステップによって特定された文書について前記キーワード抽出手段によって抽出した当該文書のキーワードを、当該文書が属する分野の前記マップにおける配置へ表示する表示ステップと、 を実行することを特徴とする。
上記目的を達成するための第3の発明は、文書を分類する情報処理装置において読取実行されるプログラムであって、前記情報処理装置を、複数の文書に対してそれぞれの文書内容に基づいて各々の文書が属する度合いを算出して分野を特定する分野特定手段と、他文書と弁別するためのキーワードを前記文書から抽出するキーワード抽出手段と、前記分野特定手段による前記度合いを用いて、前記キーワード間の関係性を示すためのマップへ前記分野を配置するための配置情報を生成するマップ生成手段と、前記マップ生成手段によって生成された配置情報に基づいて、配置された分野に属する文書を特定する配置特定手段と、前記配置特定手段によって特定された文書について前記キーワード抽出手段によって抽出した当該文書のキーワードを、当該文書が属する分野の前記マップにおける配置へ表示する表示手段と、して機能させること特徴とする。

Claims (13)

  1. 複数の文書に対してそれぞれの文書内容に基づいて各々の文書が属する度合いを算出して分野を特定する分野特定手段と、
    他文書と弁別するためのキーワードを前記文書から抽出するキーワード抽出手段と、
    前記分野特定手段による前記度合いを用いて、前記キーワード間の関係性を示すためのマップへ前記分野を配置するための配置情報を生成するマップ生成手段と、
    前記マップ生成手段によって生成された配置情報に基づいて、配置された分野に属する文書を特定する配置特定手段と、
    前記配置特定手段によって特定された文書について前記キーワード抽出手段によって抽出した当該文書のキーワードを、当該文書が属する分野の前記マップにおける配置へ表示する表示手段と、
    を備えたことを特徴とする情報処理装置。
  2. 前記分野特定手段は、それぞれの文書に対して、前記度合いを用いて、複数の分野を特定することを特徴とする請求項1に記載の情報処理装置。
  3. 前記キーワード抽出手段は、他文書と弁別するための度合いが高いキーワードを前記文書から抽出することを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記マップ生成手段は、前記分野特定手段による前記度合いを用いて、前記マップへ表示するための分野の配置及び当該分野が属する文書の度合いを算出して配置情報とし、
    前記配置特定手段は、前記分野特定手段による前記度合いと、前記マップ生成手段により生成された配置情報に基づく前記度合いと、を用いて、前記配置された分野に属する文書を特定することを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
  5. 前記配置特定手段は、前記分野特定手段による前記度合いと、前記マップ生成手段により生成された配置情報に基づく前記度合いと、から求まる距離を用いて、前記配置された分野に属する文書を特定することを特徴とする請求項4に記載の情報処理装置。
  6. 前記配置特定手段は、最も小さい前記距離を用いて、前記配置された分野に属する文書を特定することを特徴とする請求項5に記載の情報処理装置。
  7. 前記マップ生成手段は、自己組織化マップを用いて、前記マップのユニットへ分野を配置するための配置情報を生成することを特徴とする請求項1乃至6の何れか1項に記載の情報処理装置。
  8. 前記表示手段は、前記配置特定手段によって特定された文書について前記キーワード抽出手段によって抽出したキーワードの出現頻度に応じて、当該文書が属する分野の前記マップにおける配置に前記キーワードを表示することを特徴とする請求項1乃至7の何れか1項に記載の情報処理装置。
  9. 前記表示手段は、前記配置特定手段によって特定される文書について前記キーワード抽出手段によって抽出したキーワードの出現頻度と、当該マップの配置情報から特定されるマップにおける配置と、を乗じて得られた値を、前記キーワードの全てのマップの配置に対して求めて加算し、当該加算した値を、前記キーワードの全てのマップの配置における出現頻度の総和で除算して得られた値を用いて、前記マップにおける配置へ前記キーワードを表示することを特徴とする請求項1乃至8の何れか1項に記載の情報処理装置。
  10. 前記マップへの各配置に対する分野が属する度合いから階層的なクラスタリングを行うことで前記マップへの配置を要素とするクラスタを算出するクラスタ算出手段と、
    前記キーワードに対応する配置情報から特定される配置が、前記クラスタ算出手段によって算出されたクラスタの配置に最も近いクラスタを特定するクラスタ特定手段と、
    前記表示手段は、前記クラスタ算出手段によって算出した関係性のあるクラスタ間に対応するキーワード間を関係性のある旨を識別して表示することを特徴とする請求項1乃至9の何れか1項に記載の情報処理装置。
  11. 前記表示手段は、上位のクラスタと当該上位のクラスタに関係する下位のクラスタとを、関係性があるものとして識別して表示することを特徴とする請求項10に記載の情報処理装置。
  12. 情報処理装置において文書を分類する方法であって、
    前記情報処理装置の分野特定手段は、複数の文書に対してそれぞれの文書内容に基づいて各々の文書が属する度合いを算出して分野を特定する分野特定ステップ
    前記情報処理装置のキーワード抽出手段は、他文書と弁別するためのキーワードを前記文書から抽出するキーワード抽出ステップと、
    前記情報処理装置のマップ生成手段は、前記分野特定ステップによる前記度合いを用いて、前記キーワード間の関係性を示すためのマップへ前記分野を配置するための配置情報を生成するマップ生成ステップと、
    前記情報処理装置の配置特定手段は、前記マップ生成ステップによって生成された配置情報に基づいて、配置された分野に属する文書を特定する配置特定ステップと、
    前記情報処理装置の表示手段は、前記配置特定ステップによって特定された文書について前記キーワード抽出手段によって抽出した当該文書のキーワードを、当該文書が属する分野の前記マップにおける配置へ表示する表示ステップと、
    を実行することを特徴とする文書を分類する方法。
  13. 文書を分類する情報処理装置において読取実行されるプログラムであって、
    前記情報処理装置を、
    複数の文書に対してそれぞれの文書内容に基づいて各々の文書が属する度合いを算出して分野を特定する分野特定手段と、
    他文書と弁別するためのキーワードを前記文書から抽出するキーワード抽出手段と、
    前記分野特定手段による前記度合いを用いて、前記キーワード間の関係性を示すためのマップへ前記分野を配置するための配置情報を生成するマップ生成手段と、
    前記マップ生成手段によって生成された配置情報に基づいて、配置された分野に属する文書を特定する配置特定手段と、
    前記配置特定手段によって特定された文書について前記キーワード抽出手段によって抽出した当該文書のキーワードを、当該文書が属する分野の前記マップにおける配置へ表示する表示手段と、
    して機能させること特徴とするプログラム。
JP2012202037A 2012-09-13 2012-09-13 情報処理装置、方法、およびプログラム Active JP5700007B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012202037A JP5700007B2 (ja) 2012-09-13 2012-09-13 情報処理装置、方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012202037A JP5700007B2 (ja) 2012-09-13 2012-09-13 情報処理装置、方法、およびプログラム

Publications (3)

Publication Number Publication Date
JP2014056516A JP2014056516A (ja) 2014-03-27
JP2014056516A5 true JP2014056516A5 (ja) 2014-09-04
JP5700007B2 JP5700007B2 (ja) 2015-04-15

Family

ID=50613756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012202037A Active JP5700007B2 (ja) 2012-09-13 2012-09-13 情報処理装置、方法、およびプログラム

Country Status (1)

Country Link
JP (1) JP5700007B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016157467A1 (ja) 2015-03-31 2016-10-06 株式会社Ubic データ分析システム、データ分析方法、データ分析プログラム、および、記録媒体
WO2020133186A1 (zh) * 2018-12-28 2020-07-02 深圳市世强元件网络有限公司 一种文档信息提取方法、存储介质及终端
JP2021015430A (ja) * 2019-07-11 2021-02-12 京セラドキュメントソリューションズ株式会社 書類管理装置及び書類管理システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003167914A (ja) * 2001-11-30 2003-06-13 Fujitsu Ltd マルチメディア情報検索方法、プログラム、記録媒体及びシステム
US7392474B2 (en) * 2004-04-30 2008-06-24 Microsoft Corporation Method and system for classifying display pages using summaries
JP5141152B2 (ja) * 2007-09-20 2013-02-13 富士通株式会社 テキスト解析プログラム、テキスト解析方法、およびテキスト解析装置
JP5346841B2 (ja) * 2010-02-22 2013-11-20 株式会社野村総合研究所 文書分類システムおよび文書分類プログラムならびに文書分類方法

Similar Documents

Publication Publication Date Title
EP2743846A3 (en) Information search method and device and computer readable recording medium thereof
SG10201804876PA (en) Method and system for comparing 3d models
EP2750077A3 (en) Object detection methods, display methods and apparatuses
MX2016002854A (es) Recuperacion de imagenes por contenido.
RU2013125240A (ru) Фильтрация информации из социальной сети с целью ее индивидуализированного отображения на фоне карты местности
JP2006048532A5 (ja)
GB2514049A (en) Generating visualizations of display group of tags representing content instances in objects satisfying search criteria
JP2013250861A5 (ja)
WO2014022504A3 (en) Interface method and system for browsing previews of digital media
MX2015001733A (es) Navegacion de objeto tridimensional en documentos.
JP2014063246A5 (ja) 画像分類装置、電子アルバム作成装置、及び画像分類方法、プログラム
JP2014115915A5 (ja)
JP2012069097A5 (ja)
RU2014131913A (ru) Устройство обработки информации, способ обработки информации и программа
JP2013250862A5 (ja)
JP2014109871A5 (ja)
JP2008242543A5 (ja)
JP2016517989A5 (ja)
JP2014056516A5 (ja) 情報処理装置、方法、およびプログラム
JP2011086062A5 (ja) コンテンツ関係可視化装置、表示制御装置、コンテンツ関係可視化方法およびプログラム
EP2733643A3 (en) System and method facilitating designing of classifier while recognizing characters in a video
WO2012000185A1 (en) Method and system of determining similarity between elements of electronic document
CN106021529A (zh) 一种基于平行坐标系的海量文件流转可视化方法
JP6144968B2 (ja) 情報提示装置、方法、及びプログラム
EP2711822A3 (en) Method for determining three-dimensional visual effect on information element using apparatus with touch sensitive display