JP2006244298A - テキストマイング方法及びテキストマイニング装置 - Google Patents
テキストマイング方法及びテキストマイニング装置 Download PDFInfo
- Publication number
- JP2006244298A JP2006244298A JP2005061292A JP2005061292A JP2006244298A JP 2006244298 A JP2006244298 A JP 2006244298A JP 2005061292 A JP2005061292 A JP 2005061292A JP 2005061292 A JP2005061292 A JP 2005061292A JP 2006244298 A JP2006244298 A JP 2006244298A
- Authority
- JP
- Japan
- Prior art keywords
- word
- frequency
- attribute value
- attribute
- appearance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 本発明によれば、分析対象テキストから抽出した単語又は属性値を2以上に分類して一覧表示し、利用者によりこの2以上の関係を提供し、利用者から単語または属性値を指定されると、指定された単語または属性値に連動して、絞込みをして一覧表示するものである。即ち、一覧表示と絞込み指定とが連動しているため、一覧表示を概観しながらその関係を維持した更なる絞込みが容易にでき、更にその絞り込んだ結果を一覧表示することがでる。この結果、データ分析が容易になる。
【選択図】 図1
Description
図1は、本実施の形態におけるテキストマイニング装置及びその周辺の構成図である。
実施の形態1では、分析対象テキストから抽出した単語及び属性値を2以上に分類して一覧表示するものであるが、本実施の形態は、テキストから抽出した複合語をグループ化して一覧表示するものである。
実施の形態1では、分析対象テキストから抽出した単語又は属性値を2以上に分類して一覧表示をするが、本実施の形態では、一覧表示手段により属性値の比率を表示する。
実施の形態1では、分析対象テキストから抽出した単語又は属性値を2以上に分類して一覧表示するものであるが、本実施の形態は、選択した単語及び属性値の出現頻度をグラフ表示することで可視化する。
101 登録手段
102 単語DB
103 属性データベース
104 単語情報抽出手段
105 属性情報抽出手段
106 第1のメモリ
107 第2のメモリ
108 第1の単語頻度算出手段
109 第1の属性値度算出手段
110 一覧表示手段
111 選択指示手段
112 第2の単語頻度算出手段
113 第2の属性値頻度算出手段
114 カテゴリ辞書
200 複合語グループ化手段
201 複合語一覧表示手段
300 属性値比率計算手段
301 属性値比率一覧表示手段
400 可視化手段
Claims (7)
- 利用者により予め指定されたカテゴリに基づいて第1のメモリからこの指定されたカテゴリに属する単語、この単語の出現頻度及びこの単語の出現位置からなる単語情報を抽出する第1の単語頻度算出ステップと、
第2のメモリから各レコードID及びこの各レコードIDに対応し利用者により予め指定された属性に属する属性値からなる属性情報を抽出し、この指定された属性毎に各属性値の出現頻度を算出する第1の属性値頻度算出ステップと、
上記第1の単語頻度算出ステップにより得たカテゴリ毎の単語及びこの単語毎の出現頻度と、上記第1の属性値頻度算出ステップにより得た属性毎の属性値及びこの属性値毎の出現頻度と、を一覧表示する第1の一覧表示ステップと、
利用者に対してこの一覧表示された単語の選択を促し、利用者に単語を選択させる選択指示ステップと、
この選択された単語の出現位置から得られる文番号と選択された単語以外の各単語の出現位置から得られる文番号とから、この各カテゴリに属する各単語が上記選択された単語と同一文に出現する頻度を算出する第2の単語頻度算出ステップと、
この選択された単語の出現位置から得られるレコードIDと各属性値のレコードIDとから、各属性における各属性値が上記選択された単語と同一レコードに出現する頻度を算出する第2の属性値頻度算出ステップと、
上記第2の単語頻度算出ステップにより得たカテゴリ毎の単語及びこの単語別の出現頻度と、上記第2の属性値頻度算出ステップにより得た上記属性値及びこの属性値別の出現頻度と、を一覧表示する第2の一覧表示ステップと、
を備えたテキストマイニング方法。 - 利用者により予め指定されたカテゴリに基づいて第1のメモリからこの指定されたカテゴリに属する単語、この単語の出現頻度及びこの単語の出現位置からなる単語情報を抽出する第1の単語頻度算出ステップと、
第2のメモリから各レコードID及びこの各レコードIDに対応し利用者により予め指定された属性に属する属性値からなる属性情報を抽出し、この指定された属性毎に属性値の出現頻度を算出する第1の属性値頻度算出ステップと、
上記第1の単語頻度算出ステップにより得たカテゴリ毎の単語及びこの単語毎の出現頻度と、上記第1の属性値頻度算出ステップにより得た属性毎の属性値及びこの属性値毎の出現頻度と、を一覧表示する第1の一覧表示ステップと、
利用者に対してこの一覧表示された属性値の選択を促し、利用者に属性値を選択させる選択指示ステップと、
この選択された属性値のレコードIDと各カテゴリにおける各単語の出現位置から得られるレコードIDとに基づいて、各カテゴリにおける各単語が上記選択された属性値と同一のレコードに出現する頻度を算出する第2の単語頻度算出ステップと、
上記選択された属性値のレコードIDと同一のレコードIDに対応し、かつ上記選択された属性値が属する属性以外の属性における各属性値の出現する頻度を算出する第2の属性値頻度算出ステップと、
上記第2の単語頻度算出ステップにより得たカテゴリ別の単語及びこの単語別出現頻度と、上記第2の属性値頻度算出ステップにより得た上記属性値及びこの属性値頻度と、を一覧表示する第2の一覧表示ステップと、
を備えたテキストマイニング方法。 - 第2の属性値頻度算出ステップは、
属性値毎に、予め指定された属性に属する属性値の出現頻度を分母とし、選択指示ステップにより利用者に選択された単語と同一のレコードに出現する属性値の出現頻度を分子として属性値の比率を算出する
ことを特徴とする請求項1又は2に記載のテキストマイニング方法。 - 第1の単語頻度算出ステップは、
予め指定されたカテゴリに属する単語が複合語である場合には、この複合語の構成要素に基づいてグループ化し、
第1の一覧表示ステップは、
グループ化された内容を一覧表示する
ことを特徴とする請求項1乃至3に記載のテキストマイニング方法。 - 第1の一覧表示ステップは、
第1の単語頻度算出ステップで出力されるカテゴリ毎の単語の出現頻度と、第1の属性値頻度算出ステップで出力される属性毎の属性値の出現頻度と、をグラフ表示する
ことを特徴とする請求項1乃至4に記載のテキストマイニング方法。 - 利用者により予め指定されたカテゴリに基づいて第1のメモリからこの指定されたカテゴリに属する単語、この単語の出現頻度及びこの単語の出現位置からなる単語情報を抽出する第1の単語頻度算出手段と、
第2のメモリから各レコードID及びこの各レコードIDに対応し利用者により予め指定された属性に属する属性値からなる属性情報を抽出し、この指定された属性毎に各属性値の出現頻度を算出する第1の属性値頻度算出手段と、
上記第1の単語頻度算出手段により得たカテゴリ毎の単語及びこの単語毎の出現頻度と、上記第1の属性値頻度算出手段により得た属性毎の属性値及びこの属性値毎の出現頻度と、を一覧表示する第1の一覧表示手段と、
利用者に対してこの一覧表示された単語の選択を促し、利用者に単語を選択させる選択指示手段と、
この選択された単語の出現位置から得られる文番号と選択された単語以外の各単語の出現位置から得られる文番号とから、この各カテゴリに属する各単語が上記選択された単語と同一文に出現する頻度を算出する第2の単語頻度算出手段と、
この選択された単語の出現位置から得られるレコードIDと各属性値のレコードIDとから、各属性における各属性値が上記選択された単語と同一レコードに出現する頻度を算出する第2の属性値頻度算出手段と、
上記第2の単語頻度算出手段により得たカテゴリ毎の単語及びこの単語別の出現頻度と、上記第2の属性値頻度算出手段により得た上記属性値及びこの属性値別の出現頻度と、を一覧表示する第2の一覧表示手段と、
を備えたテキストマイニング装置。 - 利用者により予め指定されたカテゴリに基づいて第1のメモリからこの指定されたカテゴリに属する単語、この単語の出現頻度及びこの単語の出現位置からなる単語情報を抽出する第1の単語頻度算出手段と、
第2のメモリから各レコードID及びこの各レコードIDに対応し利用者により予め指定された属性に属する属性値からなる属性情報を抽出し、この指定された属性毎に属性値の出現頻度を算出する第1の属性値頻度算出手段と、
上記第1の単語頻度算出手段により得たカテゴリ毎の単語及びこの単語毎の出現頻度と、上記第1の属性値頻度算出手段により得た属性毎の属性値及びこの属性値毎の出現頻度と、を一覧表示する第1の一覧表示手段と、
利用者に対してこの一覧表示された属性値の選択を促し、利用者に属性値を選択させる選択指示手段と、
この選択された属性値のレコードIDと各カテゴリにおける各単語の出現位置から得られるレコードIDとに基づいて、各カテゴリにおける各単語が上記選択された属性値と同一のレコードに出現する頻度を算出する第2の単語頻度算出手段と、
上記選択された属性値のレコードIDと同一のレコードIDに対応し、かつ上記選択された属性値が属する属性以外の属性における各属性値の出現する頻度を算出する第2の属性値頻度算出手段と、
上記第2の単語頻度算出手段により得たカテゴリ別の単語及びこの単語別出現頻度と、上記第2の属性値頻度算出手段により得た上記属性値及びこの属性値頻度と、を一覧表示する第2の一覧表示手段と、
を備えたテキストマイニング装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005061292A JP4595590B2 (ja) | 2005-03-04 | 2005-03-04 | テキストマイング方法及びテキストマイニング装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005061292A JP4595590B2 (ja) | 2005-03-04 | 2005-03-04 | テキストマイング方法及びテキストマイニング装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006244298A true JP2006244298A (ja) | 2006-09-14 |
JP4595590B2 JP4595590B2 (ja) | 2010-12-08 |
Family
ID=37050638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005061292A Expired - Fee Related JP4595590B2 (ja) | 2005-03-04 | 2005-03-04 | テキストマイング方法及びテキストマイニング装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4595590B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008062822A1 (fr) * | 2006-11-22 | 2008-05-29 | Nec Corporation | Dispositif d'exploration de texte, procédé d'exploration de texte et programme d'exploration de texte |
JP2009069874A (ja) * | 2007-09-10 | 2009-04-02 | Sharp Corp | コンテンツ検索装置、コンテンツ検索方法、プログラム、および記録媒体 |
US10289674B2 (en) | 2014-10-30 | 2019-05-14 | International Business Machines Corporation | Generation apparatus, generation method, and program |
JP2019185491A (ja) * | 2018-04-12 | 2019-10-24 | 富士通株式会社 | 特定プログラム、生成プログラム、特定方法、生成方法および情報処理装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001052013A (ja) * | 1999-08-06 | 2001-02-23 | Ricoh Co Ltd | 文書処理装置、文書処理方法および文書処理プログラムを記録した媒体 |
JP2002041547A (ja) * | 2000-07-27 | 2002-02-08 | Ricoh Co Ltd | 情報分析支援装置、システム、方法及び情報分析支援を実行するための記録媒体 |
JP2004246491A (ja) * | 2003-02-12 | 2004-09-02 | Mitsubishi Electric Corp | テキストマイニング装置及びテキストマイニングプログラム |
JP2004334761A (ja) * | 2003-05-12 | 2004-11-25 | Mitsubishi Electric Corp | 自由意見分析システム |
-
2005
- 2005-03-04 JP JP2005061292A patent/JP4595590B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001052013A (ja) * | 1999-08-06 | 2001-02-23 | Ricoh Co Ltd | 文書処理装置、文書処理方法および文書処理プログラムを記録した媒体 |
JP2002041547A (ja) * | 2000-07-27 | 2002-02-08 | Ricoh Co Ltd | 情報分析支援装置、システム、方法及び情報分析支援を実行するための記録媒体 |
JP2004246491A (ja) * | 2003-02-12 | 2004-09-02 | Mitsubishi Electric Corp | テキストマイニング装置及びテキストマイニングプログラム |
JP2004334761A (ja) * | 2003-05-12 | 2004-11-25 | Mitsubishi Electric Corp | 自由意見分析システム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008062822A1 (fr) * | 2006-11-22 | 2008-05-29 | Nec Corporation | Dispositif d'exploration de texte, procédé d'exploration de texte et programme d'exploration de texte |
JP2009069874A (ja) * | 2007-09-10 | 2009-04-02 | Sharp Corp | コンテンツ検索装置、コンテンツ検索方法、プログラム、および記録媒体 |
US10289674B2 (en) | 2014-10-30 | 2019-05-14 | International Business Machines Corporation | Generation apparatus, generation method, and program |
US10296579B2 (en) | 2014-10-30 | 2019-05-21 | International Business Machines Corporation | Generation apparatus, generation method, and program |
JP2019185491A (ja) * | 2018-04-12 | 2019-10-24 | 富士通株式会社 | 特定プログラム、生成プログラム、特定方法、生成方法および情報処理装置 |
JP2022095952A (ja) * | 2018-04-12 | 2022-06-28 | 富士通株式会社 | 生成プログラム、生成方法および情報処理装置 |
JP7135399B2 (ja) | 2018-04-12 | 2022-09-13 | 富士通株式会社 | 特定プログラム、特定方法および情報処理装置 |
JP7351372B2 (ja) | 2018-04-12 | 2023-09-27 | 富士通株式会社 | 生成プログラム、生成方法および情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4595590B2 (ja) | 2010-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6915308B1 (en) | Method and apparatus for information mining and filtering | |
US8578328B2 (en) | Method for presenting candidate for link target to component in web application, as well as computer program and computer system for the same | |
US9881064B2 (en) | Systems and methods for using graphical representations to manage query results | |
US10120654B2 (en) | Domain specific language design | |
US9092411B2 (en) | Understanding data in data sets | |
US11550853B2 (en) | Using natural language expressions to define data visualization calculations that span across multiple rows of data from a database | |
JP4595590B2 (ja) | テキストマイング方法及びテキストマイニング装置 | |
JP2007304796A (ja) | データベース解析システム及びデータベース解析方法及びプログラム | |
JP2004021445A (ja) | テキストデータ分析システム、テキストデータ分析方法およびコンピュータプログラム | |
Castellani Ribeiro et al. | An urban data profiler | |
US20090228794A1 (en) | Business specification comprehension assistance system and method | |
JP5096850B2 (ja) | 検索結果表示方法、検索結果表示プログラムおよび検索結果表示装置 | |
JP2013182289A (ja) | 回路設計支援装置、回路設計支援方法、及び回路設計支援用プログラム | |
JP2005165754A (ja) | テキストマイニング分析装置、テキストマイニング分析方法、及びテキストマイニング分析プログラム | |
JP2006023968A (ja) | 固有表現抽出方法および装置並びにそれらに用いるプログラム | |
KR20190043965A (ko) | 검색 필드 설정을 위한 시각적 ui 제공 시스템 및 방법과 이를 저장한 기록매체 | |
JP2006018596A (ja) | データ階層表示装置およびデータ階層表示プログラム | |
KR100718745B1 (ko) | 텍스트 마이닝을 이용한 특허 검색 시스템 및 그 방법 | |
JP2020057272A (ja) | ワークショップ支援システム及びワークショップ支援方法 | |
JP2019053763A (ja) | テキスト可視化システム、テキスト可視化方法、及び、プログラム | |
EP4361840A1 (en) | Process mining repository for analyzing process data | |
US20220156253A1 (en) | Compact display of matching results | |
JP5083627B2 (ja) | 少数意見抽出装置 | |
JP2007072961A (ja) | データベース検索方法、プログラム及び装置 | |
US11281676B2 (en) | Time-based display of search results |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071126 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100528 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100608 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100804 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100824 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100906 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131001 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |