JP2016081412A - 情報処理システム、情報処理プログラム、及び、情報処理方法 - Google Patents
情報処理システム、情報処理プログラム、及び、情報処理方法 Download PDFInfo
- Publication number
- JP2016081412A JP2016081412A JP2014214334A JP2014214334A JP2016081412A JP 2016081412 A JP2016081412 A JP 2016081412A JP 2014214334 A JP2014214334 A JP 2014214334A JP 2014214334 A JP2014214334 A JP 2014214334A JP 2016081412 A JP2016081412 A JP 2016081412A
- Authority
- JP
- Japan
- Prior art keywords
- partial
- document set
- feature word
- feature
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】文書集合における特徴語であって、前記文書集合の部分文書集合において特徴的に出現するものを部分特徴語として決定する部分特徴語決定手段と、前記部分特徴語決定手段から取得した前記部分特徴語を出力する部分特徴語出力手段と、を備える。
【選択図】 図1
Description
(第一実施形態)
<第一実施形態の構成>
第一実施形態の構成例について説明する。図1は第一実施形態の構成例を示すブロック図である。
<第一実施形態の動作>
以下、第一実施形態の動作について具体例を用いて詳しく説明する。本実施形態では、ユーザは、営業成績の良い営業所の営業日報から営業成績向上のための有用な情報を得、各営業所に展開するためにテキストマイニングを行うものとする。すなわち、テキストマイニングにおける特徴語抽出の対象となる文書は、複数の営業所から回収された営業日報である。営業日報の構成の一例を、図3に示す。ここで、各営業日報に付されている、それらを分類しうる情報が属性値である。属性値には、例えばその文書を「いつ」「誰が」「何について」書いたものかを示すような情報が該当する。具体的には、図4に示す営業日報における「2014年8月8日」「鈴木 太郎」「T社」等の記載が該当する。各文書の属性値は、予めユーザが各文書に対応付けて文書集合DB21等に登録しても良いし、ユーザが予め属性値記入欄の位置情報を学習させたシステムが、文書をスキャンする際に、自動的に位置情報から属性値を認識し、文書に対応付けて記憶するものとしても良い。また、各属性値の上位概念にあたる情報を、属性カテゴリとする。属性カテゴリには、例えば図3の営業日報における「訪問日」「作成者」「取引先」等の記載が該当する。属性カテゴリついても、属性値と同様に、予めユーザが各文書に対応付けて文書集合DB等に登録しても良いし、文書の位置情報から自動的にシステムが認識して記憶するものとしても良い。あるいは、ユーザが予め各属性値に対応する属性カテゴリをDB等に記憶させ、システムが文書の属性値を認識すると、DB等から自動的に属性カテゴリを割り当てるようにしても良い。
(第二実施形態)
<第二実施形態の構成>
次に、第二実施形態の構成例について説明する。図8は第二実施形態の構成例を示すブロック図である。本実施形態に係るシステムは、上記第一実施形態と比べると、表示手段32がユーザに表示する特徴語が、入力手段31からの入力により変化する点で異なる。入力手段31は、ユーザが非表示にすべきと判断した特徴語の入力を受け付け、当該特徴語を表示手段32に送信する。表示手段32は、特徴語出力手段23から取得した特徴語のうち、入力手段31から取得した特徴語と重複しない特徴語をユーザに表示する。なお、その他の構成および動作は、第一実施形態と同様のため、入力手段31および表示手段32以外の説明を省略する。
<第二実施形態の動作>
図9は、第二実施形態の動作の例を示すシーケンス図である。図9において、S1〜S11は図2と同様であるので、説明を省略する。
(第三実施形態)
<第三実施形態の構成>
次に、第三実施形態の構成例について説明する。図11は第三実施形態の構成例を示すブロック図である。本実施形態に係るシステムは、上記第二実施形態と比べると、非表示属性決定手段13、非表示属性DB14、表示制御手段33を有する点が異なる。
<第三実施形態の動作>
図12および図13は、第三実施形態の動作の例を示すシーケンス図である。
(第四実施形態)
<第四実施形態の構成>
第四実施形態の構成例について説明する。図15は第四実施形態の構成例を示すブロック図である。
上述した各実施形態は本発明を具体化した一例に過ぎず、請求の範囲に記載された本発明の趣旨の範囲内であれば、種々変更することができるものである。
2 特徴語抽出システム
3 ユーザ端末
11 部分特徴語決定手段
12 部分特徴語出力手段
13 非表示属性決定手段
14 非表示属性DB
21 文書集合DB
22 特徴語決定手段
23 特徴語出力手段
31 入力手段
32 表示手段
33 表示制御手段
41 CPU
42 ROM
43 通信制御部
44 RAM
45 記憶部
Claims (10)
- 文書集合における特徴語のうち、
前記文書集合の部分文書集合における特徴度と、少なくとも一つの他の部分文書集合における特徴度との差が所定値以上である部分文書集合の特徴語、または
前記文書集合の部分文書集合における特徴度が所定値以上である部分文書集合の特徴語を、部分特徴語として決定する部分特徴語決定手段と、
前記部分特徴語決定手段から取得した前記部分特徴語を出力する部分特徴語出力手段と、
を備える情報処理システム。 - 前記文書集合における特徴語のうち、前記部分特徴語出力手段から取得した前記部分特徴語と重複する特徴語以外を表示する表示手段
を備える請求項1記載の情報処理システム。 - 前記部分特徴語出力手段から取得した前記部分特徴語を表示する表示手段
を備える請求項1記載の情報処理システム。 - 前記部分文書集合は、前記文書集合を構成する文書のうち、共通の属性値が付された文書を集めて生成される
請求項1乃至3記載の情報処理システム。 - 前記表示手段は、前記部分特徴語が特徴的に出現する部分文書集合を成す文書に共通して付されている属性値、当該属性値を分類する属性カテゴリを表示する
請求項4記載の情報処理システム。 - ユーザが任意の特徴語を入力する入力手段を備え、
前記表示手段は、前記文書集合における特徴語のうち、前記入力手段から取得した特徴語と重複する特徴語以外を表示する
請求項2乃至5記載の情報処理システム。 - 前記入力手段から取得した特徴語が特徴的に出現する部分文書集合を成す文書に共通して付されている属性値のうち、所定の条件を満たす属性値を非表示属性値として決定する非表示属性決定手段と、
前記非表示属性値を登録する非表示属性データベースを備え、
前記表示手段は、前記文書集合における特徴語のうち、前記非表示属性データベースに登録されている属性値が付された文書から成る部分文書集合において特徴的に出現する特徴語以外を表示する
請求項6記載の情報処理システム。 - 前記入力手段から取得した特徴語が特徴的に出現する部分文書集合を成す文書に共通して付されている属性値が分類される属性カテゴリのうち、所定の条件を満たす属性カテゴリを非表示属性カテゴリとして決定する非表示属性決定手段と、
前記非表示属性カテゴリを登録する非表示属性データベースを備え、
前記表示手段は、前記文書集合における特徴語のうち、前記非表示属性データベースに登録されている非表示属性カテゴリに分類される属性値が付された文書から成る部分文書集合において特徴的に出現する特徴語以外を表示する
請求項6または7記載の情報処理システム。 - 文書集合における特徴語のうち、
前記文書集合の部分文書集合における特徴度と、少なくとも一つの他の部分文書集合における特徴度との差が所定値以上である部分文書集合の特徴語、または
前記文書集合の部分文書集合における特徴度が所定値以上である部分文書集合の特徴語を、部分特徴語として決定する部分特徴語決定処理と、
前記部分特徴語決定手段から取得した前記部分特徴語を出力する部分特徴語出力処理と、
をコンピュータに実行させる情報処理プログラム。 - 文書集合における特徴語のうち、
前記文書集合の部分文書集合における特徴度と、少なくとも一つの他の部分文書集合における特徴度との差が所定値以上である部分文書集合の特徴語、または
前記文書集合の部分文書集合における特徴度が所定値以上である部分文書集合の特徴語を、部分特徴語として決定し、
前記部分特徴語決定手段から取得した前記部分特徴語を出力する、
情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014214334A JP6455068B2 (ja) | 2014-10-21 | 2014-10-21 | 情報処理システム、情報処理プログラム、及び、情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014214334A JP6455068B2 (ja) | 2014-10-21 | 2014-10-21 | 情報処理システム、情報処理プログラム、及び、情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016081412A true JP2016081412A (ja) | 2016-05-16 |
JP6455068B2 JP6455068B2 (ja) | 2019-01-23 |
Family
ID=55958730
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014214334A Active JP6455068B2 (ja) | 2014-10-21 | 2014-10-21 | 情報処理システム、情報処理プログラム、及び、情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6455068B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001318939A (ja) * | 2000-05-09 | 2001-11-16 | Hitachi Ltd | 文書処理方法及び装置並びにその処理プログラムを記憶した媒体 |
JP2006099423A (ja) * | 2004-09-29 | 2006-04-13 | Hitachi Software Eng Co Ltd | テキストマイニングサーバ及びプログラム |
WO2011071174A1 (ja) * | 2009-12-10 | 2011-06-16 | 日本電気株式会社 | テキストマイニング方法、テキストマイニング装置及びテキストマイニングプログラム |
-
2014
- 2014-10-21 JP JP2014214334A patent/JP6455068B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001318939A (ja) * | 2000-05-09 | 2001-11-16 | Hitachi Ltd | 文書処理方法及び装置並びにその処理プログラムを記憶した媒体 |
JP2006099423A (ja) * | 2004-09-29 | 2006-04-13 | Hitachi Software Eng Co Ltd | テキストマイニングサーバ及びプログラム |
WO2011071174A1 (ja) * | 2009-12-10 | 2011-06-16 | 日本電気株式会社 | テキストマイニング方法、テキストマイニング装置及びテキストマイニングプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6455068B2 (ja) | 2019-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10621281B2 (en) | Populating values in a spreadsheet using semantic cues | |
CN105068993B (zh) | 一种评估文本难度的方法 | |
US8849649B2 (en) | System and method for determining sentiment expressed in documents | |
US9218568B2 (en) | Disambiguating data using contextual and historical information | |
JP5683037B2 (ja) | 取引関係マップ生成システム及びプログラム | |
US20140195897A1 (en) | Text Summarization | |
US20110161069A1 (en) | Method, computer program product and apparatus for providing a threat detection system | |
US9075870B2 (en) | System, method and apparatus for detecting related topics and competition topics based on topic templates and association words | |
CN103714450A (zh) | 自然语言度量条件警告产生 | |
CN103714114A (zh) | 自然语言度量条件警告编排 | |
Wang et al. | A machine learning analysis of Twitter sentiment to the Sandy Hook shootings | |
JP6681661B2 (ja) | アクセス解析画像提供装置、アクセス解析画像提供方法、及びプログラム | |
JP2008084151A (ja) | 情報表示装置および情報表示方法 | |
JP2015026388A (ja) | 取引関係マップ生成システム及びプログラム | |
WO2015030214A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US20140325405A1 (en) | Auto-completion of partial line pattern | |
CN109408502A (zh) | 一种数据标准处理方法、装置及其存储介质 | |
JP2016153998A (ja) | サービスの評価装置及びサービスの評価方法 | |
US20130268833A1 (en) | Apparatus and method for visualizing hyperlinks using color attribute values | |
US11829421B2 (en) | Dynamic graph generation for interactive data analysis | |
US11776078B2 (en) | Systems and methods for generating strategic competitive intelligence data relevant for an entity | |
JP6455068B2 (ja) | 情報処理システム、情報処理プログラム、及び、情報処理方法 | |
CN109242403A (zh) | 一种需求管理方法及计算机设备 | |
JP2014041466A (ja) | Webサーバシステム、応答制御方法、および、プログラム | |
EP3942499A1 (en) | Analyzing resumes and highlighting non-traditional resumes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170915 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180726 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6455068 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |