JP4805491B2 - Dictionary management program and computer system - Google Patents

Dictionary management program and computer system Download PDF

Info

Publication number
JP4805491B2
JP4805491B2 JP2001241130A JP2001241130A JP4805491B2 JP 4805491 B2 JP4805491 B2 JP 4805491B2 JP 2001241130 A JP2001241130 A JP 2001241130A JP 2001241130 A JP2001241130 A JP 2001241130A JP 4805491 B2 JP4805491 B2 JP 4805491B2
Authority
JP
Japan
Prior art keywords
text
data
dictionary
computer system
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001241130A
Other languages
Japanese (ja)
Other versions
JP2003050814A (en
Inventor
佳代子 磯尾
恭子 牧野
誠司 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001241130A priority Critical patent/JP4805491B2/en
Publication of JP2003050814A publication Critical patent/JP2003050814A/en
Application granted granted Critical
Publication of JP4805491B2 publication Critical patent/JP4805491B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、データ解析に利用される辞書データを管理する辞書管理プログラム及びコンピュータシステムに関する。
【0002】
【従来の技術】
テキストマイニング技術の具体的な内容には、テキストデータに基づいて文脈を理解し、テキストデータの要約抽出、テキストデータの分類、テキストデータの検索などを行う技術、テキストデータから知識を抽出する技術、テキストで記述されている情報(定性情報)から数量化した情報(定量情報)を取得する技術などがある。広義には、テキストデータについてのデータマイニングにより得られる結果の分析を行う技術もテキストマイニング技術に含まれる。
【0003】
テキストマイニングシステム(マイニングエンジン)では、概念定義辞書を利用して分析処理を実行する。
【0004】
図13は、従来のテキストマイニングシステムの構成を例示するブロック図である。
【0005】
このテキストマイニングシステム1は、主に入力部2と、情報抽出部3と、出力部4と、概念定義辞書5を具備している。
【0006】
概念定義辞書5は、テキストで記述される情報を構成する各種のテキスト要素とその属性とを対応付けて登録する。この概念定義辞書5に登録されているテキスト要素は、分析処理において判断基準として利用される。
【0007】
例えば、「一歩リード」というテキスト要素に属性ID「G001」が対応付けされている。また、「POSは順調」というテキスト要素に属性ID「G009」が対応付けされている。属性ID「G001」、「G009」は「良い情報」である旨を示す。
【0008】
入力部2は、分析対象のデータとして収集された日報データ61〜6nを入力する。
【0009】
情報抽出部3は、入力された日報データ61〜6nから概念定義辞書5に登録されているテキスト要素を抽出し、その抽出されたテキスト要素の属性に基づいて、テキストマイニングを行う。例えば、「良い情報」である旨を示すテキスト要素を含んでいる日報データを、「良い日報」と判断し、抽出する。
【0010】
出力部4は、テキストマイニング結果7を表示する。
【0011】
これにより、日報データ61〜6nのうち「良い日報」であると判断された日報データ7を表示することが可能である。
【0012】
この従来のテキストマイニングシステム1において、テキストマイニングの内容を変化させたい場合には、概念定義辞書5の登録内容を修正する必要がある。
【0013】
修正する場合には、例えばテキストエディタを利用して概念定義辞書プログラムを編集する。または、修正を指示するコマンドを入力して概念定義辞書5を修正する。
【0014】
【発明が解決しようとする課題】
概念定義辞書プログラムをテキストエディタで修正する作業、又はコマンド入力により概念定義辞書5を修正する作業は、テキストマイニングシステム1の構造に熟知した技術者が行う必要がある。
【0015】
したがって、従来においては、テキストマイニングシステム1の構造を熟知していない者が概念定義辞書5の内容を変更することは困難である。
【0016】
また、テキストマイニングシステム1の構造に熟知している者であっても、テキストエディタ等による編集作業を行った結果、コーディングミスに基づくバグを発生させることがある。
【0017】
本発明は、以上のような実情に鑑みてなされたもので、辞書データの修正作業を容易化するための辞書管理プログラム及びコンピュータシステムを提供することを目的とする。
【0018】
【課題を解決するための手段】
本発明を実現するにあたって講じた具体的手段について以下に説明する。
【0019】
第1発明は、判断基準となる語、句、節のうちの少なくとも一つを含むテキスト要素とその属性とが登録されている概念定義辞書データを用いて、データベースに記憶されている複数の分析対象テキストデータから任意の属性を含むテキストデータを抽出するテキストマイニング処理を実行するコンピュータシステムに、テキストマイニング処理の結果に含まれているテキストデータにチェックボックスを割り当てた結果画面を表示する結果表示機能を実現させ、コンピュータシステムに、チェックボックスに対するチェック状況を受け付ける修正候補受付機能を実現させ、コンピュータシステムに、結果画面上でチェックされたチェックボックスに割り当てられているテキストデータを抽出し、抽出されたテキストデータの一覧を含む修正候補画面を表示する修正候補表示機能を実現させ、コンピュータシステムに、修正候補画面で表示されている概念定義辞書データのテキスト要素の修正又は当該テキスト要素に対する属性の修正の指定を受け付ける指定受付機能を実現させ、コンピュータシステムに、指定に基づいて、概念定義辞書データのテキスト要素又は属性を修正する修正機能を実現させるための辞書管理プログラムに関する。
【0021】
なお、概念定義辞書データの修正とは、判断基準となるテキスト要素の追加、変更、削除、さらに判断基準となるテキスト要素に対する属性の追加、変更、削除などをいう。また、分析対象テキストデータとしては例えば日報データなどが適用可能である。この場合、テキストマイニング処理において判断基準となるテキスト要素又は概念定義辞書データの修正対象となるテキスト要素には、日報に記載されている語、句、節などがある。
【0022】
この第1の発明を実施することにより、概念定義辞書データの修正を容易に行うことができる。
【0023】
また、テキストマイニング処理後の結果を参考にしてユーザが概念定義辞書データを修正するため、ユーザの意図するテキストマイニングを実現可能な状態に概念定義辞書データをバージョンアップさせることができ、その後のテキストマイニングの精度向上を図ることができる。
【0025】
ユーザは、テキストマイニング結果に不満のあるテキストデータのみを集めてその内容を検討し、適切にテキストマイニング可能となるように概念定義辞書データを修正できる。これにより、ユーザは修正内容の決定を効率的に行うことができる。
【0028】
の発明は、上記第1発明の辞書管理プログラムにおいて、コンピュータシステムに、データベースに記憶されている複数の分析対象テキストデータの中から、指定受付機能によって受け付けられた指定に係るテキスト要素又は属性を含むテキストデータを抽出し、この抽出されたテキストデータを含む確認画面を表示する確認表示機能をさらに実現させる。そして、修正機能は、確認画面の表示後に実行される。
【0029】
この第の発明を実施することにより、ユーザは修正しようとするテキスト要素又は属性を含むすべてのテキストデータに対して検討を行い、適切な修正内容を決定することができる。
【0031】
上記第1又は第2の発明に係る辞書管理プログラム、あるいは、これらの辞書管理プログラムを記録した記録媒体を用いることによって、計算機システム、サーバやクライアント等の計算機に対して、簡単に上述した動作を実施可能な機能を付加することができる。
【0032】
また、上記第1又はの発明を実現可能な手段を具備した辞書管理システムを発明の対象としてもよい。
【0033】
【発明の実施の形態】
以下、図面を参照しながら本発明の実施の形態について説明する。なお、以下において上記図13と同一の部分については同一の符号を付してその説明を省略する。
【0034】
(第1の実施の形態)
本実施の形態においては、テキストマイニングシステム1の構造に詳しくない者であっても、GUI(Graphical User Interface)を使用し、概念定義辞書5の修正を可能とする辞書管理プログラムについて説明する。
【0035】
図1は、本実施の形態に係る辞書管理プログラムを実行する計算機システムの構成例を示すブロック図である。
【0036】
辞書管理プログラム8は、記録媒体9に記録されており、計算機システムに読み込まれることによりこの計算機システム上で修正候補受付機能10、修正候補表示機能11、指定受付機能12、修正機能13を実現する。
【0037】
修正候補受付機能10は、テキストマイニングの結果抽出された日報データにチェックボックスを割り当てた結果画面を表示し、ユーザによるチェックボックスのチェック状況を受け付ける。
【0038】
図2は、修正候補受付機能10によって表示される画面である。この結果画面14に対し、ユーザは、修正を望むテキスト要素を含む日報データに割り当てられているチェックボックスを指定する。
【0039】
修正候補表示機能11は、結果画面14上でチェックされた日報データのみを抽出し、一覧表示する。
【0040】
図3は、修正候補表示機能11によって表示される画面である。この修正候補画面15を参照し、ユーザはどのテキスト要素をどのように修正するかを決定する。
【0041】
指定受付機能12は、概念定義辞書5に対する修正操作の内容の指定を受け付ける。
【0042】
例えば、指定された修正操作がテキスト要素の追加の場合、指定受付機能12は、追加するテキスト要素とその属性の指定を受け付ける。
【0043】
図4は、指定受付機能12によって表示されるテキスト要素追加用の画面である。概念追加画面16には、登録済みのテキスト要素が表示されており、さらに新規追加するテキスト要素を入力するエリアが表示されている。
【0044】
一方、指定された修正操作がテキスト要素の削除の場合、指定受付機能12は、概念定義辞書に登録されているテキスト要素一覧を表示し、その一覧上で削除するテキスト要素の指定を受け付ける。
【0045】
図5は、指定受付機能12によって表示されるテキスト要素削除用の画面である。概念削除画面17には、登録済みのテキスト要素が表示されている。ユーザは一覧上で削除するテキスト要素を指定し、削除ボタンを押す。
【0046】
その他同様に、指定受付機能12は、テキスト要素の変更、さらに属性の追加、変更、削除などの作業も支援する。
【0047】
修正機能13は、指定受付機能12によって受け付けられた指定にしたがって、概念定義辞書5を修正する。
【0048】
図6は、上記辞書管理プログラム8によって実行される辞書管理方法のフロー図である。
【0049】
まず、日報分析の結果画面14が表示され(S1)、ユーザからチェックボタンへの指定が受け付けられる(S2)。
【0050】
次に、チェックボタンによりチェックされた日報データのみが抽出され、修正候補画面15が表示される(S3)。
【0051】
次に、修正候補画面15上で修正対象の要素がマウスで指定され、その指定内容が受け付けられる(S4)。
【0052】
そして、概念追加画面16又は概念削除画面17などの画面が表示され、ユーザから修正対象の要素に対する修正内容が受け付けられ(S5)、受け付けられた修正内容にしたがって概念定義辞書が修正される(S6)。
【0053】
以上説明したように、本実施の形態に係る辞書管理プログラム8を利用することで、テキストマイニングシステム1の構造に詳しくない者であっても、GUIを利用し、容易に概念定義辞書の内容を修正することができる。また、容易に修正可能であるためコーディングミスを防止できる。
【0054】
また、テキストマイニング結果を参照しつつ修正を行うことで、有効かつ適切に概念定義辞書5を修正することができ、これによりマイニング結果の精度を向上させることができる。
【0055】
また、まず修正候補のみを抽出し、その後修正内容を指定することで、ユーザは修正内容の判断を効率的かつ適切に行うことができる。
【0056】
(第2の実施の形態)
本実施の形態においては、修正対象の要素が指定されると、その要素を含む日報データ全てを抽出して表示し、ユーザの修正内容の判断に利用させる辞書管理プログラムについて説明する。
【0057】
図7は、本実施の形態に係る辞書管理プログラムを実行する計算機システムの構成例を示すブロック図である。
【0058】
辞書管理プログラム18は、記録媒体9から計算機システムに読み込まれることによりこのシステム上で確認画面表示機能19を実現する点に特徴がある。辞書管理プログラム18によって実現されるその他の機能10〜13は上述しているため説明を省略する。
【0059】
確認画面表示機能19は、収集された日報データを保存している日報データベース20をアクセスし、指定受付機能12によって指定された要素を持つ全ての日報データを抽出する。
【0060】
そして、確認画面表示機能19は、抽出された日報データを表示する。
【0061】
図8は上記辞書管理プログラム18によって実行される辞書管理方法のフロー図である。
【0062】
日報分析の結果画面が表示されてから修正対象の要素の指定が受け付けられるまでのステップ(S1〜S4)は、上記図6の場合と同様であるため説明を省略する。
【0063】
修正対象の要素の指定が受け付けられると、その要素を含む全ての日報データが日報データベース20から抽出され、確認画面として表示される(S41)。
【0064】
ユーザは、確認画面に表示された日報データを考慮して要素の修正内容などを検討する。
【0065】
そして、修正対象の要素に対する修正内容の受け付け(S5)、概念定義辞書5の修正が実行される(S6)。
【0066】
例えば、ユーザは、図9に示す修正候補表示画面15aに表示されている日報データの「売場改善」という要素に「良い情報」である旨を示す属性を付して概念定義辞書5に登録しようと考えたとする。
【0067】
この場合、ユーザは、この「売場改善」という要素をマウスで反転させるなどの手法を用いて指定する。
【0068】
すると、図10に示すように、「売場改善」という要素を持つ日報データが全て確認画面28に表示される。
【0069】
これにより、ユーザは、テキストマイニングにより「売場改善のための会議が開かれました」という日報データが「良い日報」として抽出されることは好ましくないと判断し、「売場改善」という要素の登録を見送ることができる。
【0070】
以上説明したように、本実施の形態に係る辞書管理プログラム18を利用することで、テキストマイニングの結果のみならず、テキストマイニング前の日報データもユーザは修正の判断に用いることができる。
【0071】
なお、上記各実施の形態に係る辞書管理プログラムにより実行される各機能は、同様の作用を実現可能であれば配置を変更させてもよく、また各機能を自由に組合せてもよい。
【0072】
また、上記各実施の形態においては、日報データの指定の方法に、チェックボックスを使用する方法を用いている。しかしながら、これに限定されるものではなく、日報データの番号、日時、作成者などで日報データを指定してもよい。
【0073】
また、上記各実施の形態においては、修正対象の要素の指定方法に、マウスで指定する方法を用いている。しかしながら、これに限定されるものではなく、テキスト入力などで修正対象の要素を指定してもよい。
【0074】
また、上記各実施の形態においては、日報データなどのようなテキストデータに対するユーザの意思決定を支援しているが、テキストデータ中の概念、テキスト要素に限らず、番号、属性ID(グループ情報)などに対するユーザの意思決定を支援する場合にも、同様の手法を用いることにより同様の効果を得ることができる。
【0075】
上記各実施の形態に係る辞書管理プログラムは、例えば磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記録媒体に書き込んでコンピュータに適用可能である。またこのプログラムは、通信媒体により伝送してコンピュータに適用することも可能である。上記機能を実現するコンピュータは、記録媒体に記録されたプログラムを読み込み、プログラムによって動作が制御されることにより、上述した機能を実現する。
【0076】
また、上記各実施の形態に係る辞書管理プログラムの実現する機能と同様の動作を行う手段を備えた辞書管理装置を利用しても、同様の効果を得ることができる。
【0077】
(第3の実施の形態)
本実施の形態においては、上記第1及び第2の実施の形態に係る辞書管理プログラムの変形例について説明する。
【0078】
図11は、本実施の形態に係る辞書管理プログラムの適用例を例示するブロック図である。
【0079】
上記第1及び第2の実施の形態では、日報データなどのテキストデータに対する分析結果を利用して辞書管理プログラム8、18により概念定義辞書5の修正を行っている。
【0080】
しかしながら、本実施の形態に係る辞書管理プログラム21は、様々な種類の入力データ22に対する分析結果23に基づいて概念定義辞書5を修正する。
【0081】
例えば、音声データ22bを入力し、この音声データ22bをテキストデータに変換して分析を行い、その分析結果23に基づいて辞書管理プログラム21により概念定義辞書5を修正する。
【0082】
また、画像データ22cを入力し、この画像データ22cに対して分析を行い、その分析結果23に基づいて辞書管理プログラム21により概念定義辞書5を修正する。この場合、概念定義辞書5には、データ要素として画像データが登録され、各データ要素に属性が付される。
【0083】
(第4の実施の形態)
本実施の形態においては、上記各実施の形態に係る辞書管理プログラム8、18、21の利用態様について説明する。以下においては、辞書管理プログラム8の場合について説明するが、辞書管理プログラム18、21の場合も同様である。
【0084】
図12は、本実施の形態に係る辞書管理プログラム8の利用態様を例示するブロック図である。
【0085】
この図12において、テキストマイニングシステム1により実施されるサービスは、ASP(アプリケーション・サービス・プロバイダ)24により提供される。
【0086】
また、辞書管理プログラム8により実施されるサービスも、ASP24により提供される。
【0087】
ユーザ25は、自己のクライアント26から例えばインターネットなどのようなネットワーク27を経由してASP24の管理するテキストマイニングシステム1を利用することで、日報データの分析を容易に実施できる。
【0088】
また、ユーザ25は、分析結果を得て概念定義辞書5を修正したい場合、ASP24の管理する辞書管理プログラム8を利用することで、容易に概念定義辞書5を修正することができ、分析結果の適切化を実現できる。
【0089】
そして、ASP24のサービスの提供を受けることで、ユーザ25は、自己でテキストマイニングシステム1及び辞書管理プログラム8を運用する場合よりも保守、運用の面で効率的に分析サービスを利用できる。
【0090】
【発明の効果】
以上詳記したように本発明においては、容易に辞書データを修正することができ、修正ミスを防止できる。また、辞書データの修正を適切に行うことでその後の分析精度を向上させることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る辞書管理プログラムを実行する計算機システムの構成例を示すブロック図。
【図2】修正候補受付機能によって表示される画面を例示する図。
【図3】修正候補表示機能によって表示される画面を例示する図。
【図4】指定受付機能によって表示されるテキスト要素追加用の画面を例示する図。
【図5】指定受付機能によって表示されるテキスト要素削除用の画面を例示する図。
【図6】同実施の形態に係る辞書管理プログラムによって実行される辞書管理方法のフロー図。
【図7】本発明の第2の実施の形態に係る辞書管理プログラムを実行する計算機システムの構成例を示すブロック図。
【図8】同実施の形態に係る辞書管理プログラムによって実行される辞書管理方法のフロー図。
【図9】修正候補表示機能によって表示される修正候補表示画面にユーザが修正対象の要素を指定した状態を例示する図。
【図10】確認画面表示機能によって表示される確認画面を例示する図。
【図11】本発明の第3の実施の形態に係る辞書管理プログラムの適用例を例示するブロック図。
【図12】本発明の第4の実施の形態に係る辞書管理プログラムの利用態様を例示するブロック図。
【図13】従来のテキストマイニングシステムの構成を例示するブロック図。
【符号の説明】
1…テキストマイニングシステム
2…入力部
3…情報抽出部
4…出力部
5…概念定義辞書
61〜6n…日報データ
8、18、21…辞書管理プログラム
9…記録媒体
10…修正候補受付機能
11…修正候補表示機能
12…指定受付機能
13…修正機能
19…確認画面表示機能
20…日報データベース
22…入力データ
23…分析結果
24…ASP
25…ユーザ
26…クライアント
27…ネットワーク
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a dictionary management program and a computer system for managing dictionary data used for data analysis.
[0002]
[Prior art]
Specific contents of text mining technology include understanding the context based on text data, extracting text data summary, classifying text data, searching text data, etc., extracting knowledge from text data, There is a technique for acquiring quantified information (quantitative information) from information (qualitative information) described in text. In a broad sense, the text mining technique includes a technique for analyzing a result obtained by data mining of text data.
[0003]
In a text mining system (mining engine), analysis processing is executed using a concept definition dictionary.
[0004]
FIG. 13 is a block diagram illustrating the configuration of a conventional text mining system.
[0005]
The text mining system 1 mainly includes an input unit 2, an information extraction unit 3, an output unit 4, and a concept definition dictionary 5.
[0006]
The concept definition dictionary 5 registers various text elements constituting the information described by text and their attributes in association with each other. The text elements registered in the concept definition dictionary 5 are used as judgment criteria in the analysis process.
[0007]
For example, an attribute ID “G001” is associated with a text element “one step lead”. Further, the attribute ID “G009” is associated with the text element “POS is in good order”. The attribute IDs “G001” and “G009” indicate “good information”.
[0008]
The input unit 2 inputs daily report data 61 to 6n collected as analysis target data.
[0009]
The information extraction unit 3 extracts text elements registered in the concept definition dictionary 5 from the input daily report data 61 to 6n, and performs text mining based on the attributes of the extracted text elements. For example, daily report data including a text element indicating “good information” is determined as “good daily report” and extracted.
[0010]
The output unit 4 displays the text mining result 7.
[0011]
Thereby, it is possible to display the daily report data 7 determined to be the “good daily report” among the daily report data 61 to 6n.
[0012]
In the conventional text mining system 1, when it is desired to change the contents of text mining, it is necessary to correct the registered contents of the concept definition dictionary 5.
[0013]
For correction, the concept definition dictionary program is edited using, for example, a text editor. Alternatively, the concept definition dictionary 5 is corrected by inputting a command for instructing correction.
[0014]
[Problems to be solved by the invention]
The work of correcting the concept definition dictionary program with a text editor or the process of correcting the concept definition dictionary 5 by inputting a command needs to be performed by an engineer familiar with the structure of the text mining system 1.
[0015]
Therefore, conventionally, it is difficult for a person who is not familiar with the structure of the text mining system 1 to change the contents of the concept definition dictionary 5.
[0016]
Even a person who is familiar with the structure of the text mining system 1 may cause a bug based on a coding error as a result of editing with a text editor or the like.
[0017]
The present invention has been made in view of the above circumstances, and an object thereof is to provide a dictionary management program and a computer system for facilitating dictionary data correction work.
[0018]
[Means for Solving the Problems]
Specific means taken for realizing the present invention will be described below.
[0019]
The first invention, the term a criterion, phrases, using the concept definition dictionary data and text elements and their attributes including at least one of the sections has been registered, the plurality stored in the database A result display that displays a result screen in which check boxes are assigned to text data included in the results of text mining processing on a computer system that executes text mining processing that extracts text data including arbitrary attributes from the text data to be analyzed This function realizes the correction candidate acceptance function that accepts the check status for the check box on the computer system, and extracts the text data assigned to the check box checked on the result screen to the computer system Including list of text data A designation accepting function that realizes a correction candidate display function for displaying a candidate screen, and that accepts designation of correction of text elements of the concept definition dictionary data displayed on the correction candidate screen or attribute correction for the text elements. The present invention relates to a dictionary management program for realizing a correction function for correcting a text element or attribute of concept definition dictionary data based on designation .
[0021]
Note that the correction of the concept definition dictionary data means addition, change, or deletion of a text element that is a determination criterion, and addition, change, or deletion of an attribute to the text element that is a determination criterion. For example, daily report data can be applied as the text data to be analyzed. In this case, the text element or concept definition dictionary modification subject to text elements of the data as a criterion in the text mining processing, word listed in daily, phrases, and the like sections.
[0022]
By implementing the first invention, it is possible to easily correct the concept definition dictionary data.
[0023]
Moreover, the text for mining after processing results with reference user modifies the concept definition dictionary data, it is possible to a concept definition dictionary data text mining feasible condition intended by the user is upgraded, subsequent text Mining accuracy can be improved.
[0025]
The user can collect only text data dissatisfied with the text mining result, examine the contents, and correct the concept definition dictionary data so that the text mining can be appropriately performed. Thereby, the user can determine the correction contents efficiently.
[0028]
According to a second aspect of the present invention, in the dictionary management program according to the first aspect of the invention, a text element related to a designation received by a designation reception function from a plurality of analysis target text data stored in a database in a computer system, or A confirmation display function for extracting text data including attributes and displaying a confirmation screen including the extracted text data is further realized. Then, the correction function is executed after the confirmation screen is displayed.
[0029]
By implementing the second aspect of the invention , the user can examine all text data including the text element or attribute to be corrected and determine appropriate correction contents.
[0031]
By using the dictionary management program according to the first or second invention or a recording medium recording these dictionary management programs, the above-described operation can be easily performed on a computer such as a computer system, a server, or a client. Functions that can be implemented can be added.
[0032]
The dictionary management system provided with means capable of realizing the first or second invention may be the subject of the invention.
[0033]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the following, the same parts as those in FIG.
[0034]
(First embodiment)
In the present embodiment, a dictionary management program that allows a person who is not familiar with the structure of the text mining system 1 to modify the concept definition dictionary 5 using a GUI (Graphical User Interface) will be described.
[0035]
FIG. 1 is a block diagram showing a configuration example of a computer system that executes a dictionary management program according to the present embodiment.
[0036]
The dictionary management program 8 is recorded in the recording medium 9 and is read into the computer system, thereby realizing the correction candidate reception function 10, the correction candidate display function 11, the designation reception function 12, and the correction function 13 on this computer system. .
[0037]
The correction candidate accepting function 10 displays a result screen in which check boxes are assigned to daily report data extracted as a result of text mining, and accepts the check status of the check boxes by the user.
[0038]
FIG. 2 is a screen displayed by the correction candidate acceptance function 10. On the result screen 14, the user designates a check box assigned to daily report data including a text element desired to be corrected.
[0039]
The correction candidate display function 11 extracts only the daily report data checked on the result screen 14 and displays it as a list.
[0040]
FIG. 3 is a screen displayed by the correction candidate display function 11. With reference to the correction candidate screen 15, the user determines which text element is to be corrected and how.
[0041]
The designation accepting function 12 accepts designation of the content of the correction operation for the concept definition dictionary 5.
[0042]
For example, when the designated correction operation is addition of a text element, the designation receiving function 12 receives designation of a text element to be added and its attribute.
[0043]
FIG. 4 is a screen for adding a text element displayed by the designation receiving function 12. The concept addition screen 16 displays registered text elements, and further displays an area for inputting a text element to be newly added.
[0044]
On the other hand, when the designated correction operation is deletion of a text element, the designation receiving function 12 displays a list of text elements registered in the concept definition dictionary and accepts designation of a text element to be deleted on the list.
[0045]
FIG. 5 is a text element deletion screen displayed by the designation receiving function 12. On the concept deletion screen 17, registered text elements are displayed. The user specifies a text element to be deleted on the list and presses the delete button.
[0046]
Similarly, the designated reception function 12 also supports operations such as changing text elements and adding, changing, and deleting attributes.
[0047]
The correction function 13 corrects the concept definition dictionary 5 in accordance with the specification received by the specification reception function 12.
[0048]
FIG. 6 is a flowchart of the dictionary management method executed by the dictionary management program 8.
[0049]
First, a daily report analysis result screen 14 is displayed (S1), and a user designates a check button (S2).
[0050]
Next, only the daily report data checked by the check button is extracted, and the correction candidate screen 15 is displayed (S3).
[0051]
Next, the modification target element is designated with the mouse on the modification candidate screen 15, and the designated content is accepted (S4).
[0052]
Then, a screen such as the concept addition screen 16 or the concept deletion screen 17 is displayed, and the correction content for the element to be corrected is received from the user (S5), and the concept definition dictionary is corrected according to the received correction content (S6). ).
[0053]
As described above, by using the dictionary management program 8 according to the present embodiment, even those who are not familiar with the structure of the text mining system 1 can easily use the GUI to easily read the contents of the concept definition dictionary. It can be corrected. Moreover, since it can be easily corrected, coding errors can be prevented.
[0054]
Further, by making corrections while referring to the text mining results, the concept definition dictionary 5 can be corrected effectively and appropriately, thereby improving the accuracy of the mining results.
[0055]
In addition, by extracting only the correction candidates and then specifying the correction contents, the user can efficiently and appropriately determine the correction contents.
[0056]
(Second Embodiment)
In the present embodiment, a description will be given of a dictionary management program that, when an element to be corrected is designated, extracts and displays all daily report data including the element and uses it for determining the correction contents of the user.
[0057]
FIG. 7 is a block diagram showing a configuration example of a computer system that executes the dictionary management program according to the present embodiment.
[0058]
The dictionary management program 18 is characterized in that a confirmation screen display function 19 is realized on this system by being read from the recording medium 9 into the computer system. Since the other functions 10 to 13 realized by the dictionary management program 18 have been described above, description thereof will be omitted.
[0059]
The confirmation screen display function 19 accesses the daily report database 20 storing the collected daily report data, and extracts all daily report data having elements designated by the designation reception function 12.
[0060]
Then, the confirmation screen display function 19 displays the extracted daily report data.
[0061]
FIG. 8 is a flowchart of the dictionary management method executed by the dictionary management program 18.
[0062]
Steps (S1 to S4) from when the daily report analysis result screen is displayed until the specification of the element to be corrected is accepted are the same as those in FIG.
[0063]
When designation of the element to be corrected is accepted, all daily report data including the element is extracted from the daily report database 20 and displayed as a confirmation screen (S41).
[0064]
The user considers the correction contents of the element in consideration of the daily report data displayed on the confirmation screen.
[0065]
Then, the correction contents for the correction target element are received (S5), and the concept definition dictionary 5 is corrected (S6).
[0066]
For example, the user will add an attribute indicating “good information” to the element of “sales improvement” of the daily report data displayed on the correction candidate display screen 15a shown in FIG. Suppose that
[0067]
In this case, the user designates this “sales improvement” element using a technique such as reversing with the mouse.
[0068]
Then, as shown in FIG. 10, all daily report data having an element of “Sales floor improvement” is displayed on the confirmation screen 28.
[0069]
As a result, the user determines that it is not desirable to extract the daily report data “A meeting for improving the sales floor” as “good daily report” by text mining, and register the element of “Sales floor improvement”. I can see off.
[0070]
As described above, by using the dictionary management program 18 according to the present embodiment, the user can use not only the result of text mining but also daily report data before text mining for correction determination.
[0071]
Note that the functions executed by the dictionary management program according to each of the above embodiments may be rearranged as long as a similar action can be realized, and the functions may be freely combined.
[0072]
In each of the above embodiments, a method using a check box is used as a method for designating daily report data. However, the present invention is not limited to this, and daily report data may be designated by the daily report data number, date and time, creator, or the like.
[0073]
In each of the above embodiments, a method of specifying with the mouse is used as the method of specifying the correction target element. However, the present invention is not limited to this, and the element to be corrected may be specified by text input or the like.
[0074]
In each of the above embodiments, the user's decision making for text data such as daily report data is supported. However, the number and attribute ID (group information) are not limited to the concept and text element in the text data. The same effect can be obtained by using the same method even when supporting the user's decision making.
[0075]
The dictionary management program according to each of the above embodiments can be applied to a computer by writing in a recording medium such as a magnetic disk (flexible disk, hard disk, etc.), an optical disk (CD-ROM, DVD, etc.), and a semiconductor memory. The program can also be applied to a computer by being transmitted through a communication medium. A computer that realizes the above functions implements the above-described functions by reading a program recorded on a recording medium and controlling the operation by the program.
[0076]
The same effect can be obtained even if a dictionary management device having means for performing the same operation as the function realized by the dictionary management program according to each of the above embodiments is used.
[0077]
(Third embodiment)
In the present embodiment, a modified example of the dictionary management program according to the first and second embodiments will be described.
[0078]
FIG. 11 is a block diagram illustrating an application example of the dictionary management program according to the present embodiment.
[0079]
In the first and second embodiments, the concept definition dictionary 5 is corrected by the dictionary management programs 8 and 18 using the analysis result of text data such as daily report data.
[0080]
However, the dictionary management program 21 according to the present embodiment corrects the concept definition dictionary 5 based on the analysis result 23 for various types of input data 22.
[0081]
For example, the voice data 22 b is input, the voice data 22 b is converted into text data, analysis is performed, and the concept definition dictionary 5 is corrected by the dictionary management program 21 based on the analysis result 23.
[0082]
Further, the image data 22 c is input, the image data 22 c is analyzed, and the concept definition dictionary 5 is corrected by the dictionary management program 21 based on the analysis result 23. In this case, image data is registered as data elements in the concept definition dictionary 5, and attributes are assigned to the respective data elements.
[0083]
(Fourth embodiment)
In the present embodiment, usage modes of the dictionary management programs 8, 18, and 21 according to the above embodiments will be described. In the following, the case of the dictionary management program 8 will be described, but the same applies to the case of the dictionary management programs 18 and 21.
[0084]
FIG. 12 is a block diagram illustrating a usage mode of the dictionary management program 8 according to the present embodiment.
[0085]
In FIG. 12, the service implemented by the text mining system 1 is provided by an ASP (Application Service Provider) 24.
[0086]
Further, the service executed by the dictionary management program 8 is also provided by the ASP 24.
[0087]
The user 25 can easily analyze the daily report data by using the text mining system 1 managed by the ASP 24 from the client 26 via the network 27 such as the Internet.
[0088]
When the user 25 wants to correct the concept definition dictionary 5 by obtaining the analysis result, the user 25 can easily correct the concept definition dictionary 5 by using the dictionary management program 8 managed by the ASP 24, and Appropriateness can be realized.
[0089]
By receiving the service provided by the ASP 24, the user 25 can use the analysis service more efficiently in terms of maintenance and operation than when the text mining system 1 and the dictionary management program 8 are operated by itself.
[0090]
【The invention's effect】
As described above in detail, in the present invention, dictionary data can be easily corrected, and correction errors can be prevented. Further, the subsequent analysis accuracy can be improved by appropriately correcting the dictionary data.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration example of a computer system that executes a dictionary management program according to a first embodiment of the present invention.
FIG. 2 is a diagram illustrating a screen displayed by a correction candidate acceptance function.
FIG. 3 is a diagram illustrating a screen displayed by a correction candidate display function.
FIG. 4 is a diagram illustrating a screen for adding a text element displayed by a designated reception function.
FIG. 5 is a diagram illustrating a screen for deleting a text element displayed by a designated reception function.
FIG. 6 is a flowchart of a dictionary management method executed by the dictionary management program according to the embodiment.
FIG. 7 is a block diagram showing a configuration example of a computer system that executes a dictionary management program according to a second embodiment of the present invention.
FIG. 8 is a flowchart of a dictionary management method executed by the dictionary management program according to the embodiment.
FIG. 9 is a diagram exemplifying a state in which a user specifies an element to be corrected on a correction candidate display screen displayed by a correction candidate display function;
FIG. 10 is a diagram illustrating a confirmation screen displayed by a confirmation screen display function.
FIG. 11 is a block diagram illustrating an application example of a dictionary management program according to a third embodiment of the invention.
FIG. 12 is a block diagram illustrating a usage mode of a dictionary management program according to a fourth embodiment of the invention.
FIG. 13 is a block diagram illustrating the configuration of a conventional text mining system.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ... Text mining system 2 ... Input part 3 ... Information extraction part 4 ... Output part 5 ... Concept definition dictionary 61-6n ... Daily report data 8, 18, 21 ... Dictionary management program 9 ... Recording medium 10 ... Correction candidate reception function 11 ... Correction candidate display function 12 ... designation reception function 13 ... correction function 19 ... confirmation screen display function 20 ... daily report database 22 ... input data 23 ... analysis result 24 ... ASP
25 ... User 26 ... Client 27 ... Network

Claims (4)

判断基準となる語、句、節のうちの少なくとも一つを含むテキスト要素とその属性とが登録されている概念定義辞書データを用いて、データベースに記憶されている複数の分析対象テキストデータから任意の属性を含むテキストデータを抽出するテキストマイニング処理を実行するコンピュータシステムに、前記テキストマイニング処理の結果に含まれているテキストデータにチェックボックスを割り当てた結果画面を表示する結果表示機能を実現させ、Arbitrary from multiple text data to be analyzed stored in the database using concept definition dictionary data in which text elements including at least one of words, phrases, and clauses as criteria for judgment and their attributes are registered In a computer system that executes text mining processing that extracts text data including the attribute of the above, a result display function that displays a result screen in which a check box is assigned to the text data included in the result of the text mining processing is realized,
前記コンピュータシステムに、前記チェックボックスに対するチェック状況を受け付ける修正候補受付機能を実現させ、  In the computer system, to realize a correction candidate reception function for receiving a check status for the check box,
前記コンピュータシステムに、前記結果画面上でチェックされたチェックボックスに割り当てられているテキストデータを抽出し、抽出されたテキストデータの一覧を含む修正候補画面を表示する修正候補表示機能を実現させ、  Extracting text data assigned to the check box checked on the result screen in the computer system, realizing a correction candidate display function for displaying a correction candidate screen including a list of extracted text data,
前記コンピュータシステムに、前記修正候補画面で表示されている前記概念定義辞書データのテキスト要素の修正又は当該テキスト要素に対する属性の修正の指定を受け付ける指定受付機能を実現させ、  In the computer system, to realize a designation reception function that accepts the modification of the text element of the concept definition dictionary data displayed on the modification candidate screen or the modification of the attribute for the text element,
前記コンピュータシステムに、前記指定に基づいて、前記概念定義辞書データのテキスト要素又は属性を修正する修正機能を実現させる  Causing the computer system to implement a correction function for correcting a text element or attribute of the concept definition dictionary data based on the designation;
ための辞書管理プログラム。Dictionary management program for.
請求項1記載の辞書管理プログラムにおいて、The dictionary management program according to claim 1,
前記コンピュータシステムに、前記データベースに記憶されている前記複数の分析対象テキストデータの中から、前記指定受付機能によって受け付けられた前記指定に係るテキスト要素又は属性を含むテキストデータを抽出し、この抽出されたテキストデータを含む確認画面を表示する確認表示機能をさらに実現させ、  The computer system extracts text data including the text element or attribute related to the designation received by the designation receiving function from the plurality of analysis target text data stored in the database, and the extracted Realizes a confirmation display function that displays a confirmation screen containing the text data,
前記修正機能は、前記確認画面の表示後に実行される  The correction function is executed after the confirmation screen is displayed.
ことを特徴とする辞書管理プログラム。A dictionary management program characterized by that.
判断基準となる語、句、節のうちの少なくとも一つを含むテキスト要素とその属性とが登録されている概念定義辞書データを用いて、データベースに記憶されている複数の分析対象テキストデータから任意の属性を含むテキストデータを抽出するテキストマイニング処理を実行するテキストマイニングシステムと、Arbitrary from multiple text data to be analyzed stored in the database using concept definition dictionary data in which text elements including at least one of words, phrases, and clauses as criteria for judgment and their attributes are registered A text mining system that executes text mining processing to extract text data including the attributes of
前記テキストマイニング処理の結果に含まれているテキストデータにチェックボックスを割り当てた結果画面を表示する結果表示手段と、  A result display means for displaying a result screen in which a check box is assigned to the text data included in the result of the text mining process;
前記チェックボックスに対するチェック状況を受け付ける修正候補受付手段と、  Correction candidate accepting means for accepting a check status for the check box;
前記結果画面上でチェックされたチェックボックスに割り当てられているテキストデータを抽出し、抽出されたテキストデータの一覧を含む修正候補画面を表示する修正候補表示手段と、  Correction candidate display means for extracting the text data assigned to the check box checked on the result screen, and displaying a correction candidate screen including a list of the extracted text data;
前記修正候補画面で表示されている前記概念定義辞書データのテキスト要素の修正又は当該テキスト要素に対する属性の修正の指定を受け付ける指定受付手段と、  Designation accepting means for accepting designation of text element modification of the concept definition dictionary data displayed on the modification candidate screen or attribute modification for the text element;
前記指定に基づいて、前記概念定義辞書データのテキスト要素又は属性を修正する修正手段と  Correction means for correcting a text element or attribute of the concept definition dictionary data based on the designation;
を具備するコンピュータシステム。A computer system comprising:
請求項3記載のコンピュータシステムにおいて、The computer system according to claim 3.
前記データベースに記憶されている前記複数の分析対象テキストデータの中から、前記指定受付手段によって受け付けられた前記指定に係るテキスト要素又は属性を含むテキストデータを抽出し、この抽出されたテキストデータを含む確認画面を表示する確認表示手段をさらに具備し、  Text data including the text element or attribute related to the designation received by the designation receiving means is extracted from the plurality of analysis target text data stored in the database, and the extracted text data is included. A confirmation display means for displaying a confirmation screen;
前記修正手段は、前記確認画面の表示後に、前記辞書定義データのテキスト要素又は属性を修正する  The correction means corrects the text element or attribute of the dictionary definition data after the confirmation screen is displayed.
ことを特徴とするコンピュータシステム。A computer system characterized by that.
JP2001241130A 2001-08-08 2001-08-08 Dictionary management program and computer system Expired - Lifetime JP4805491B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001241130A JP4805491B2 (en) 2001-08-08 2001-08-08 Dictionary management program and computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001241130A JP4805491B2 (en) 2001-08-08 2001-08-08 Dictionary management program and computer system

Publications (2)

Publication Number Publication Date
JP2003050814A JP2003050814A (en) 2003-02-21
JP4805491B2 true JP4805491B2 (en) 2011-11-02

Family

ID=19071633

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001241130A Expired - Lifetime JP4805491B2 (en) 2001-08-08 2001-08-08 Dictionary management program and computer system

Country Status (1)

Country Link
JP (1) JP4805491B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103353864A (en) * 2012-11-20 2013-10-16 深圳市华傲数据技术有限公司 Method and system for excavating approximate dictionary rule of database, and database terminal

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968481B (en) * 2012-11-20 2016-11-16 深圳市华傲数据技术有限公司 A kind of data base approximates method for digging, system and the database terminal of dictionary rule

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04273521A (en) * 1991-02-28 1992-09-29 Toshiba Corp Selection supporting system
JPH05204975A (en) * 1992-01-30 1993-08-13 Hitachi Ltd Information filtering device and filtering method
JPH0668143A (en) * 1992-08-19 1994-03-11 Oki Electric Ind Co Ltd Translation dictionary generation aid system
JPH06149886A (en) * 1992-11-12 1994-05-31 Nippon Telegr & Teleph Corp <Ntt> Text type data base device with marking function
JP3388057B2 (en) * 1995-04-13 2003-03-17 富士通株式会社 Dictionary creation support device
JPH0950436A (en) * 1995-08-04 1997-02-18 Canon Inc Method and device for retrieving video image
JP3244084B2 (en) * 1995-09-04 2002-01-07 松下電器産業株式会社 Keyword search formula generation apparatus and keyword search formula generation method
JPH10162012A (en) * 1996-11-27 1998-06-19 Matsushita Electric Ind Co Ltd Sentence classification device
JP3764618B2 (en) * 1999-12-27 2006-04-12 株式会社東芝 Document information extraction device and document classification device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103353864A (en) * 2012-11-20 2013-10-16 深圳市华傲数据技术有限公司 Method and system for excavating approximate dictionary rule of database, and database terminal
CN103353864B (en) * 2012-11-20 2016-08-31 深圳市华傲数据技术有限公司 A kind of data base approximates method for digging, system and the database terminal of dictionary rule

Also Published As

Publication number Publication date
JP2003050814A (en) 2003-02-21

Similar Documents

Publication Publication Date Title
US6279006B1 (en) Structured data management system and computer-readable recording medium storing structured data management program
JP2009187414A (en) Analytic attribute entry extraction program, analytic attribute entry extracting method, and information analyzing device
JP2005284987A (en) Document structure editing program, document structure editing method, document structure editing apparatus, and computer readable recording medium with document structure editing program recorded thereon
JP5675676B2 (en) Business analysis design support device, business analysis design support method, and business analysis design support program
JP6003263B2 (en) Minutes creation support apparatus, minutes creation support system, minutes creation support method, and program
JP2007034674A (en) Incident management program
JP4908024B2 (en) Project management support apparatus, project management support method, and project management support program
JP4805491B2 (en) Dictionary management program and computer system
JPH11265368A (en) Working procedure management system
JP2008181218A (en) Input support method and device
JP2008077208A (en) Business flow editing program, business flow editing device and business flow editing method
JPH1139293A (en) Document management method and document retrieval method and device
JP6336922B2 (en) Business impact location extraction method and business impact location extraction device based on business variations
JPH09245052A (en) Structured document processor
US20080104093A1 (en) Time Sharing Managing Apparatus, Document Creating Apparatus, Document Reading Apparatus, Time Sharing Managing Method, Document Creating Method, and Document Reading Method
JP4303921B2 (en) Text mining system, method and program
US7546320B2 (en) Computer implemented method, system and program product for reviewing a message associated with computer program code
JP2002342137A (en) Device and method for managing document and recording medium
JPH10214294A (en) Clinical trial report preparation system
JP4180099B2 (en) Recording medium recording sequence analysis program, sequence analysis apparatus, and sequence analysis method
JP2011043930A (en) System, server device, apparatus and method for processing business form, and program
JP5076621B2 (en) Patent analysis program, patent analysis method and patent analysis apparatus
JP2007034806A (en) Information processor and program
JP4405187B2 (en) Dictionary evaluation program, system and method
JP2002269124A (en) Device and method for processing document and storage medium stored with document processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080408

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100831

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110719

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110811

R151 Written notification of patent or utility model registration

Ref document number: 4805491

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140819

Year of fee payment: 3

EXPY Cancellation because of completion of term