JP4395094B2 - Text mining system - Google Patents
Text mining system Download PDFInfo
- Publication number
- JP4395094B2 JP4395094B2 JP2005101476A JP2005101476A JP4395094B2 JP 4395094 B2 JP4395094 B2 JP 4395094B2 JP 2005101476 A JP2005101476 A JP 2005101476A JP 2005101476 A JP2005101476 A JP 2005101476A JP 4395094 B2 JP4395094 B2 JP 4395094B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- license
- analysis
- charge
- registration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005065 mining Methods 0.000 title claims description 39
- 238000004458 analytical method Methods 0.000 claims description 175
- 238000012790 confirmation Methods 0.000 claims description 46
- 238000004364 calculation method Methods 0.000 claims description 32
- 239000000284 extract Substances 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 5
- 238000000034 method Methods 0.000 description 67
- 238000007726 management method Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、テキストマイニングシステムに関する。 The present invention relates to a text mining system.
製品企画や品質管理などの業務で必要とされる重要な情報を、蓄積された大量のテキスト、例えばアンケート、修理依頼書などから抽出して概念辞書を作成し、分析を行い、業務改善のために活用することを可能とするテキストマイニングシステムが、近年増加している。
この様な従来のテキストマイニングシステムは実際に使ってみないと効果の多少を事前にユーザは判断できない。売り切りのパッケージソフトウェアのような一律の料金設定では、興味はあるものの効果を判断できないユーザにとっては高額に見えてしまう。一方、効果が出たため十分に利用するようになったユーザからも、使用量に見合った料金を徴収できない。本発明は、前述のような問題点を解決するためのものであり、テキストマイニングに適した従量制の課金を行うことができるテキストマイニングシステムを得ることが目的である。 Such a conventional text mining system cannot be judged in advance by the user unless it is actually used. Uniform pricing such as sold out packaged software can be expensive for users who are interested but cannot determine the effect. On the other hand, it is not possible to collect a fee commensurate with the amount of use even from a user who has come to use it sufficiently because of the effect. The present invention is for solving the above-described problems, and an object of the present invention is to obtain a text mining system capable of performing pay-as-you-go billing suitable for text mining.
本発明に係るテキストマイニングシステムは、ライセンス保持を確認するためのライセンスIDと、解析対象である複数の文書の登録とを受付ける登録受付部と、前記文書に含まれる単語と、前記単語の共起情報とを抽出するテキスト解析部と、前記単語と、前記共起情報から算出した概念ベクトルとを関連付けて概念辞書を作成する概念辞書作成部と、複数の前記概念辞書を記憶する概念辞書記憶部と、前記ライセンスIDと、前記文書の指定と、分析条件の指定とを受付ける分析受付部と、前記文書に係る前記概念辞書を、前記分析条件により分析した結果を出力する分析部と、前記ライセンスIDごとに、予め定められた課金種別と、現状値とを格納する制限記憶部と、前記ライセンスIDに対応する前記課金種別に応じて、予め定められた処理の実行回数、作成物の個数、又は作成物の量を、現状値に加算する制限確認部と、前記制限記憶部が格納する前記ライセンスIDに対応する現状値と、前記課金種別に応じて予め定められた料金単価とから、料金を計算する料金算定部とを備え、前記制限確認部は、前記ライセンスIDに対応する課金種別が概念辞書業務範囲であり、かつ、前記概念辞書作成部が新規の概念辞書を作成する場合、前記新規の概念辞書において、前記概念辞書記憶部に記憶された既存の概念辞書と単語が重複する割合が、すべての前記既存の概念辞書のいずれかひとつについて、予め定められた値よりも小さい場合には、概念辞書業務範囲に対応する現状値に1を加算することを特徴とする。 A text mining system according to the present invention includes a license ID for confirming license retention, a registration receiving unit that receives registration of a plurality of documents to be analyzed, a word included in the document, and a co-occurrence of the word A text analysis unit that extracts information; a concept dictionary creation unit that creates a concept dictionary by associating the word with a concept vector calculated from the co-occurrence information; and a concept dictionary storage unit that stores a plurality of the concept dictionaries An analysis receiving unit that receives the license ID, the specification of the document, and the specification of an analysis condition, an analysis unit that outputs a result of analyzing the concept dictionary related to the document according to the analysis condition, and the license For each ID, a predetermined storage type for storing a predetermined charging type and a current value, and a predetermined storage type according to the charging type corresponding to the license ID. A limit confirmation unit that adds the number of executions of the processed processing, the number of created products, or the amount of created products to the current value, a current value corresponding to the license ID stored in the limit storage unit, and the charge type And a charge calculation unit for calculating a charge from a predetermined charge unit price. The restriction confirmation unit has a charge type corresponding to the license ID within the concept dictionary business range, and creates the concept dictionary. When the unit creates a new concept dictionary, in the new concept dictionary, the ratio of overlapping words with the existing concept dictionary stored in the concept dictionary storage unit is any one of all the existing concept dictionaries. Is smaller than a predetermined value, 1 is added to the current value corresponding to the conceptual dictionary work range .
前記制限記憶部は、前記ライセンスIDごとに制限値をさらに格納し、前記制限確認部は、前記現状値に加算すると制限値を越えると判断した時に、前記登録受付部、又は前記分析受付部は処理を中断することを特徴とする。 The limit storage unit further stores a limit value for each license ID, and when the limit confirmation unit determines that the limit value is exceeded when added to the current value, the registration receiving unit or the analysis receiving unit The process is interrupted.
前記制限値として値を指定できる他に、無制限を指定できることを特徴とする。 In addition to being able to specify a value as the limit value, it is possible to specify unlimited.
前記制限記憶部は、さらに前記ライセンスIDごとに、複数の課金種別に基づく料金の算定種別として、和、高、及び安のいずれかの値を有する料金算定種別を格納し、前記制限確認部は、前記ライセンスIDに対応する複数の課金種別に応じて、各々の前記課金種別に対応する現状値に加算し、前記料金算定部は、前記ライセンスIDに対応する複数の課金種別に応じて、各々の前記課金種別に対応する料金を算出し、前記料金算定方法が和であれば、各々の前記料金の和を、前記料金算定方法が高であれば、最も高い前記料金を、前記料金算定方法が安であれば、最も安い前記料金を、前記ライセンスIDに対する料金とすることを特徴とする。 The restriction storage unit further stores, for each license ID, a charge calculation type having a value of sum, high, or low as a charge calculation type based on a plurality of charge types, and the restriction confirmation unit includes , According to a plurality of billing types corresponding to the license ID, and added to the current value corresponding to each of the billing types, the charge calculation unit, respectively according to the plurality of billing types corresponding to the license ID If the charge calculation method is a sum, the sum of the respective charges is calculated. If the charge calculation method is high, the highest charge is calculated as the charge calculation method. If the price is low, the cheapest fee is set as the fee for the license ID.
前記制限記憶部は、前記ライセンスIDごとに、複数の前記課金種別に基づく制限種別として、すべて、又はひとつのいずれかの値を有する制限結合種別をさらに格納し、前記制限確認部は、前記制限種別がすべての場合、前記ライセンスIDに対応する複数の課金種別に応じて、各々の前記課金種別に対応する現状値に加算し、加算後の値が、すべての現状値について制限値を越えた場合、前記登録受付部はエラーを出力し、前記制限種別がひとつの場合、前記ライセンスIDに対応する複数の課金種別に応じて、各々の前記課金種別に対応する現状値に加算し、ひとつの現状値について制限値を越えた場合、前記登録受付部は処理を中断することを特徴とする。 The restriction storage unit further stores, for each license ID, a restriction combination type having all or one value as a restriction type based on a plurality of the charge types, and the restriction confirmation unit includes the restriction check unit When the type is all, the value is added to the current value corresponding to each of the charge types according to a plurality of charge types corresponding to the license ID, and the value after the addition exceeds the limit value for all the current values In this case, the registration receiving unit outputs an error, and when the restriction type is one, according to a plurality of charging types corresponding to the license ID, it adds to the current value corresponding to each of the charging types, When the current value exceeds the limit value, the registration receiving unit interrupts the processing.
前記分析受付部は、ユーザIDを受付けて、前記ユーザIDが予め定められた前記ライセンスIDに対応するユーザIDでなければエラーとすることを特徴とする。 The analysis accepting unit accepts a user ID and makes an error if the user ID is not a user ID corresponding to a predetermined license ID.
前記登録受付部は、複数のクライアント端末から、前記ライセンスIDと前記文書を受信し、前記テキスト解析部は、前記ライセンスIDごとに、前記単語の前記共起情報とを抽出し、前記概念辞書作成部は、前記ライセンスIDごとに、前記概念辞書を作成し、前記分析受付部は、前記ユーザIDごとに、前記ユーザIDと、前記文書の指定と、前記分析条件の指定とを受信し、前記分析部は、前記ユーザIDごとに、前記分析条件により分析した結果を前記クライアント端末に対して送信することを特徴とする。 The registration accepting unit, a plurality of clients terminal, receiving the document and the license ID, the text analysis unit for each of the license ID, extracts the said co-occurrence information of the word, the concept dictionary creation unit, for each of the license ID, to create the concept dictionary, the analysis reception unit, to the user ID your capital, receives and the user ID, and the designation of the document, and the designation of the analysis conditions The analysis unit transmits the analysis result according to the analysis condition to the client terminal for each user ID.
本発明によれば、テキストマイニングにおいて、従量制の課金を実現できるので、効果を判断できていないユーザにとっても初期導入の決断がし易くなる。また、効果が出たため使用量が多くなったユーザからは多くの使用料金を徴収することに納得を得られやすい。 According to the present invention, in the text mining, a pay-as-you-go system can be realized, so that the user who has not been able to judge the effect can easily make an initial introduction decision. Moreover, it is easy to be convinced to collect a lot of usage fees from users who have increased the amount of usage due to the effect.
実施の形態1.
以下、図1を用いて、本実施の形態におけるテキストマイニングシステムの構成を説明する。本実施の形態におけるテキストマイニングシステムは、分析対象である文書の登録を行うための登録受付部101、テキスト解析部102、概念辞書作成部103、文書索引作成部104、及び属性情報作成部105と、登録した文書に関連する情報を格納するための文書記憶部106、テキスト解析結果記憶部107、概念辞書記憶部108、文書索引記憶部109、属性情報記憶部110、及び管理情報記憶部111と、登録した文書の分析を行うための、分析受付部112、及び分析部113と、登録に係る課金を行うための登録課金種別確認部114、及び登録制限確認部115と、登録に係る課金に関連する情報を格納するための登録制限記憶部116と、分析に係る課金を行うための分析課金種別確認部117、及び分析制限確認部118と、分析に係る課金に関連する情報を格納するための分析制限記憶部119と、予め定められた期間の料金算定を行う料金算定部120と、料金算定に関連する情報を格納するための課金情報記憶部121とから構成される。
Hereinafter, the configuration of the text mining system according to the present embodiment will be described with reference to FIG. The text mining system according to the present embodiment includes a
登録受付部101は、ユーザからライセンスID122、登録条件123、及び文書124を受付けて、テキスト解析部102、概念辞書作成部103、文書索引作成部104、及び属性情報作成部105を制御し、かつ制御に係るデータを送受信することにより、登録条件123に従って、文書124を文書記憶部106に格納し、文書124から分析部113において分析に必要となる情報を作成して、テキスト解析結果記憶部107、概念辞書記憶部108、文書索引記憶部109、属性情報記憶部110、及び管理情報記憶部111に格納する。
The
また、さらに登録受付部101は、登録課金種別確認部114、登録制限確認部115を制御し、かつ制御に係るデータを送受信することにより、登録制限記憶部116に格納されたライセンスID122に係る課金種別を確認し、課金種別と登録処理の使用状況に応じて、従量制の課金を行うために必要な値をカウントし、登録制限記憶部116に格納する。
Further, the
ライセンスID122は、テキストマイニングシステムを使用するライセンス保持を確認するためのIDであり、例えば、テキストマイニングシステムの使用契約を結ぶある通信販売会社のマーケッティング部門に割り振られたライセンスIDである。登録条件123は、既存の文書、又は既存の概念辞書を使用するかどうかを確認するための条件であり、図2において後述する。文書124は、分析したい文書の集まりであり、例えばお歳暮に関するアンケートを集めたもの、特定商品に係る修理依頼書を集めたものなどである。
The
テキスト解析部102は、文書124に含まれる単語と、前記単語の共起情報(同一文書、同一段落、同一文など、所定範囲で共に出現する2つの単語の組合せ)とを抽出し、テキスト解析結果記憶部107に記憶する。概念辞書作成部103は、テキスト解析部102で抽出された単語と、共起情報から算出した概念ベクトルとを関連付けて概念辞書を作成し、概念辞書記憶部108に記憶する。文書索引作成部104は、テキスト解析結果記憶部107から文書124の文書索引情報を作成し、文書索引記憶部109に格納する。属性情報作成部105は、文書124に含まれる各文書に付与される属性を抽出し属性情報を作成し、属性情報記憶部110に格納する。
The
なお、登録受付部101は、前述のライセンスID122、文書記憶部106に格納した文書、概念辞書記憶部108に格納した概念辞書、属性情報記憶部110に格納した属性情報を関連付けて、管理情報記憶部111に記憶する。
The
登録課金種別確認部114は、登録制限記憶部116に格納されたライセンスID122に係る課金種別を取得する。登録制限確認部115は、登録受付部101が制御して行う登録処理の流れの中で、登録処理の使用状況と課金種別に応じて、従量制の課金を行うために必要な値をカウントし、登録制限記憶部116に格納する。
The registered billing type confirmation unit 114 acquires the billing type related to the
分析受付部112は、ユーザからユーザID125、及び分析条件126を受付けて、分析部113を制御し、かつ制御に係るデータを送受信することにより、分析条件126で指定された文書を、分析条件126で指定された方法で分析して、分析結果127を出力する。
The
また、さらに分析受付部112は、ユーザID125に対応するライセンスID122を管理情報記憶部111から取得し、分析課金種別確認部117、分析制限確認部118を制御し、かつ制御に係るデータを送受信することにより、分析制限記憶部119に格納されたライセンスID122に係る課金種別を確認し、課金種別と分析処理の使用状況に応じて、従量制の課金を行うために必要な値をカウントし、分析制限記憶部119に格納する。
Further, the
ユーザID126は、ライセンスID122ごとに割り振られた分析者を確認するためのIDであり、例えば、テキストマイニングシステムの使用契約を結ぶある通信販売会社のマーケッティング部門のAさんに割り振られたライセンスIDである。分析条件126は、分析対象の文書、分析手法、及び分析の軸となる属性又はキーワードなどの情報を指定する条件である。分析結果127には、例えば、主要キーワードの抽出、属性ごとの傾向分析、時系列な傾向分析などを行った結果が出力される。
The user ID 126 is an ID for confirming an analyst assigned for each
分析受付部112は、分析受付部で受付けたユーザID125に対応するライセンスIDを取得し、分析部113に分析を依頼する。分析部113は、管理情報記憶部111を参照して、分析部113から受付けたライセンスIDと、分析条件126で指定された文書とに関連付けされた概念辞書、文書索引情報、及び属性情報を、各々概念辞書記憶部108、文書索引記憶部109、及び属性情報記憶部110から取得して、これらを用いて分析を行い、分析受付部112を介して分析結果127を出力する。
The
分析課金種別確認部117は、分析制限記憶部119に格納されたライセンスID122に係る課金種別を取得する。分析制限確認部118は、分析受付部112が制御して行う分析処理の流れの中で、課金種別に応じて、従量制の課金を行うために必要な値をカウントし、分析制限記憶部119に格納する。
The analysis billing type confirmation unit 117 acquires the billing type related to the
料金算定部120は、テキストマイニングシステムの管理者からの指示を受付け、又は予め定められた期日に自動的に、登録制限記憶部116及び分析制限記憶部119に格納した登録処理、及び分析処理の使用状況と、課金情報記憶部121に格納した料金単価とにより、ライセンスID122ごとの料金128を算定する。
The
以下、図2を用いて、図1の登録条件123について説明する。図1を用いて説明したように、本実施の形態におけるテキストマイニングシステムは、登録受付部101の制御により、文書から概念辞書と文書索引情報と属性情報とを作成し、文書と関連付けて格納するという登録処理と、分析受付部112の制御により、概念辞書と文書索引情報と属性情報とを用いて分析する分析処理と、料金算定部120により料金算定処理とを行うものである。しかし、登録条件の指定によっては、すべてのデータを新規に作成するのではなく、既存のデータを流用することができる。登録条件123には、例えば、新規文書登録かつ新規概念辞書作成、新規文書登録かつ既存概念辞書流用、及び追加文書登録かつ既存概念辞書流用がある。
Hereinafter, the
登録条件123が新規文書登録かつ新規概念辞書作成の場合は、登録受付部101は受付けた文書124を文書記憶部106に格納し、テキスト解析部102は、文書124を解析した結果をテキスト解析結果記憶部107に格納し、概念辞書作成部103は、テキスト解析結果記憶部107に格納したテキスト解析結果から、概念辞書を作成して概念辞書記憶部108に格納し、文書索引作成部104は、テキスト解析結果記憶部107に格納したテキスト解析結果から、文書索引情報を作成して文書索引記憶部109に格納し、属性情報記憶部110は、文書123から属性情報を作成して属性情報記憶部110に格納し、新規の文書123と、新規の概念辞書と、新規の文書索引情報と、新規の属性情報との関係を管理情報記憶部111に格納し、これらのデータが後の分析処理に使用される。例えば図2の行201に例を示すが、通常は、アンケート1文書から、アンケート1辞書を作成し、後の分析処理では、アンケート1文書の分析にアンケート1辞書を使用する。
When the
登録条件123が新規文書登録かつ既存概念辞書作成の場合は、登録受付部101は受付けた文書124を文書記憶部106に格納し、テキスト解析部102は、文書124を解析した結果をテキスト解析結果記憶部107に格納し、概念辞書作成部103は概念辞書を作成せずに、代わって登録受付部101が既存の概念辞書の指定を受付け、文書索引作成部104は、テキスト解析結果記憶部107に格納したテキスト解析結果から、文書索引情報を作成して文書索引記憶部109に格納し、属性情報記憶部110は、文書123から属性情報を作成して属性情報記憶部110に格納し、新規の文書123と、既存の概念辞書と、新規の文書索引情報と、新規の属性情報との関係を管理情報記憶部111に格納し、これらのデータが後の分析処理に使用される。例えば図2の行202に例を示すが、アンケート1文書とアンケート2文書とが、比較的似通った内容であると予想される場合には、時間又は概念辞書記憶部108の記憶容量を節約するために、概念辞書は作成せずに、後の分析処理では、アンケート1文書の分析にアンケート1辞書を使用する。
When the
登録条件123が追加文書登録かつ既存概念辞書作成の場合は、登録受付部101は、指定された既存の文書に、新規に受付けた文書124を追加した文書を文書記憶部106に格納し、テキスト解析部102は、追加した文書を解析した結果をテキスト解析結果記憶部107に格納し、概念辞書作成部103は概念辞書を作成せずに、代わって既存の文書が使用していた既存の概念辞書と関連付け、文書索引作成部104は、テキスト解析結果記憶部107に格納したテキスト解析結果から、文書索引情報を作成して文書索引記憶部109に格納し、属性情報記憶部110は、追加した文書から属性情報を作成して属性情報記憶部110に格納し、追加した文書と、既存の概念辞書と、新規の文書索引情報と、新規の属性情報との関係を管理情報記憶部111に格納し、これらのデータが後の分析処理に使用される。例えば図2の行202に例を示すが、アンケート1文書とアンケート2文書とが、比較的似通った内容であると予想される場合には、時間又は概念辞書記憶部108の記憶容量を節約するために、概念辞書は作成せずに、後の分析処理では、アンケート1文書とアンケート2文書との分析にアンケート1辞書を使用する。
When the
次に、図3から図8までを用いて、各記憶部が格納するデータの内容を説明する。文書記憶部106は、複数の文書を格納し、通常は、1回の登録処理で受付けた文書を、ひとまとまりの文書として格納する。ただし、登録条件123の指定によっては、図2を用いて説明したように、既存の文書に新規の文書を追加して格納することもある。
Next, the contents of data stored in each storage unit will be described with reference to FIGS. The
テキスト解析結果記憶部107は、登録対象の文書(前述のように、新規の文書の場合は、既存の文書に新規の文書を追加した場合がある。)に含まれる単語と、単語の共起情報(同一文書、同一段落、同一文など、所定範囲で共に出現する2つの単語の組合せ)とを格納する。なお、テキスト解析結果記憶部107は一時的な記憶領域であり、1回の登録処理完了後、その内容は消去される。
The text analysis
概念辞書記憶部108は、複数の概念辞書を格納する。図3は、ひとつの概念辞書の例である。列301は登録対象の文書に含まれる単語であり、列302以降は、前述の共起情報をSVD(特異値分解)という手法を用いて圧縮した概念ベクトル306である。
The concept
文書索引記憶部109は、複数の文書索引情報を格納する。ひとつの文書索引情報は、ひとつの登録対象の文書に対応して作成される。また、ひとつの文書索引情報は、ひとつの登録対象の文書124に含まれる、さらに細かなレベルの文書各々について、文書索引情報を関連付けたものである。
The document
属性情報記憶部110は、複数の属性情報を格納する。ひとつの属性情報は、ひとつの登録対象の文書に対応して作成される。また、ひとつの属性情報は、ひとつの登録対象の文書に含まれる、さらに細かなレベルの文書各々について付与された属性情報をまとめたものである。
The attribute
管理情報記憶部111は、前述のようにして、ライセンスID122と、作成された登録対象の文書、概念辞書、文書索引情報、及び属性情報などの登録物の関連情報を格納する。図4は、登録物の関連情報の例であり、ライセンスID401、文書名402、概念辞書名403、文書索引情報名404、及び属性情報名405を保有する。
As described above, the management
さらに、管理情報記憶部111は、ライセンス情報を格納する。図5は、ライセンス情報の例である。ライセンス情報は、ライセンスID501、及びユーザID502を関連付けて保有する。その他に、ライセンスIDに係るライセンス相手の名称、パスワードなどの属性情報、ユーザIDに係る分析者の名称、パスワードなどの属性情報を保有していてもよい。
Furthermore, the management
登録制限記憶部116は、従量制課金の従量である現状値、及び使用制限を行うための制限値を格納する。図6は、登録制限記憶部116のデータ例であり、ライセンスID601、課金種別602、現状値603、及び制限値603を保有する。本実施の形態では、ひとつのライセンスID601に対して、ひとつの課金種別602、現状値603、及び制限値604が定義される。ライセンスID601、及び課金種別602の値は、予め設定されている。現状値603には、登録処理の流れの中で、登録制限確認部115により課金種別602と登録処理の使用状況に応じてカウントされた値が常時更新される。制限値604の値は、予め設定されており、現状値603が制限値を超えると、登録処理の使用が制限される。なお、制限値604には、あえて無制限を指定することもできる。この場合には、登録処理の使用は制限されない。
The registration
分析制限記憶部119は、従量制課金の従量である現状値、及び使用制限を行うための制限値を格納する。図7は、分析制限記憶部119のデータ例であり、登録制限記憶部116と同様に、ライセンスID601、課金種別602、現状値603、及び制限値603を保有するが、課金種別602については、分析処理に適した課金種別が設定される。本実施の形態では、ひとつのライセンスID601に対して、ひとつの課金種別602、現状値603、及び制限値604が定義される。ライセンスID601、及び課金種別602の値は、予め設定されている。現状値603には、分析処理の流れの中で、分析制限確認部118により課金種別602と登録処理の使用状況に応じてカウントされた値が常時更新される。制限値604の値は、予め設定されており、現状値603が制限値を超えると、分析処理の使用が制限される。
The analysis
課金情報記憶部121は、料金算定を行うための料金単価を格納する。図8は、課金情報記憶部121のデータ例であり、課金対象処理801、課金種別602、及び料金単価803を保有する。課金種別602ごとに、課金対象処理801及び料金単価803が予め設定される。課金対象処理801は、該当する課金種別602が、登録処理及び分析処理いずれの使用状況に係る者であるかを設定する。料金単価803は、該当する課金種別602について、登録制限記憶部116の現状値603、及び分析制限記憶部119の現状値603の1カウントについての、料金単価を設定する。
The billing
課金種別602は、従量制課金の従量とする対象の種別を定義するものであり、予め定められた処理の実行回数、作成物の個数、又は作成物の量などが考えられる。さらに具体的な例を上げれば、文書登録回数、文書追加回数、概念辞書作成回数、文書量、単語数、概念辞書容量、概念辞書業務範囲、分析実行回数などがある。
The
文書登録回数とは、新規の文書124を登録する回数である。文書追加回数とは、既存の文書に新規の文書124を追加する回数である。概念辞書作成回数とは、新規の概念辞書を作成する回数である。文書量とは、新規の文書124に含まれる語数である。単語数とは、新規の文書124に含まれる語数である。概念辞書容量とは、新規の概念辞書の容量である。単位はMBなど、予め定められている。概念辞書業務範囲とは、新規の概念辞書が、該当ライセンスID122に係る既存の概念辞書と比較した時に、異なる業務範囲に係る概念辞書であるか否かの判断であり、詳しくは後述する。分析実行回数とは、分析を行う回数である。
The number of document registrations is the number of times a
以下、図9を用いて、本実施の形態におけるテキストマイニングシステムのH/W構成を説明する。テキストマイニングシステムは、バスで接続された外部記憶装置901、CPU(中央処理装置)902、メインメモリ(主記憶装置)903、入力装置904、表示装置905、及び通信装置906から構成される。テキストマイニングシステムの文書記憶部106、概念辞書記憶部108、文書索引記憶部109、属性情報記憶部110、管理情報記憶部111、登録制限記憶部116、分析制限記憶部119、及び課金情報記憶部121などの各記憶部は、例えばハードディスク、フロッピー(登録商標)ディスク、MO、CD、DVD、磁気テープなどの外部記憶装置901で構成される。また、テキスト解析結果記憶部107、及びプログラムの実行に必要となる一時的な記憶領域は、例えばRAM(Random Access Memory)などのメインメモリ(主記憶装置)903、又は外部記憶装置901で構成される。登録受付部101、テキスト解析部102、概念辞書作成部103、文書索引作成部104、属性情報作成部105、分析受付部112、分析部113、登録課金種別確認部114、登録制限確認部115、分析課金種別確認部117、分析制限確認部118、料金算定部120は、外部記憶装置901、メインメモリ(主記憶装置)903、及びCPU(中央処理装置)902で構成され、外部記憶装置901からメインメモリ(主記憶装置)903にロードされたデータ処理に係わるプログラムがCPU(中央処理装置)902に順次読み込まれて処理を行う。また、各処理部は、例えばマウス、キーボードなどの入力装置904、LANやWANなどに接続された通信装置906、例えばディスプレイなどの表示装置805などを介して、入力を受付けたり、出力を行うことができる。
Hereinafter, the H / W configuration of the text mining system according to the present embodiment will be described with reference to FIG. The text mining system includes an
以下、図10から図12までを用いて、本実施の形態における登録処理の流れを説明する。登録受付部101は、ライセンスID122を受付ける(ステップS1001)。登録受付部101は、管理情報記憶部111を参照して、該当ライセンスID122の存在を確認する(ステップS1002)。なお、該当ライセンスID122が存在しなければ、登録処理を中断し、エラーの旨を出力する。登録課金種別確認部114は、登録制限記憶部116を参照して、該当ライセンスID122の登録に係る課金種別602を取得する(ステップS1003)。登録受付部101は、ユーザから、登録条件123の指定、文書124を受付ける(ステップS1004)。
Hereinafter, the flow of registration processing in the present embodiment will be described with reference to FIGS. The
登録制限確認部115は、課金種別602が文書登録回数であり、登録条件123が新規文書登録を指定している場合、登録制限記憶部116の該当するライセンスID122の現状値603に1を加算する。登録制限確認部115は、課金種別602が文書追加回数であり、登録条件123が追加文書登録を指定している場合、登録制限記憶部116の該当するライセンスID122の現状値603に1を加算する。登録制限確認部115は、課金種別602が概念辞書作成回数であり、登録条件123が新規概念辞書作成を指定している場合、登録制限記憶部116の該当するライセンスID122の現状値603に1を加算する。登録制限確認部115は、課金種別602が文書量である場合、文書124の文字数をカウントし、登録制限記憶部116の該当するライセンスID122の現状値603に文字数を加算する。(ステップS1005)。なお、ここで加算後の現状値603が制限値604を超えた場合は、現状値603を元に戻し、登録処理を中断し、エラーの旨を出力する。
The registration
登録受付部101は、文書記憶部106に文書124を保管する(ステップS1006)。なお、登録条件123が追加文書登録を指定している場合には、指定された既存の文書に文書124を追加する。
The
テキスト解析部102は、該当文書124に含まれるテキストを解析し、単語に分割し、共起情報を作成する(ステップS1101)。
The
登録制限確認部115は、課金種別602が単語数である場合、テキスト解析部102がカウントした単語数を取得し、登録制限記憶部116の該当するライセンスID122の現状値603に単語数を加算する。(ステップS1102)。なお、ここで加算後の現状値603が制限値604を超えた場合は、現状値603を元に戻し、文書記憶部106に登録された文書も元に戻し、登録処理を中断し、エラーの旨を出力する。
When the
登録制限確認部115は、課金種別602が概念辞書容量であり、登録条件123が新規概念辞書作成を指定している場合、テキスト解析部102がカウントした単語数を取得し、単語数に予め定められた数値を乗算することにより、概念辞書容量の推測値を算出し、登録制限記憶部116の該当するライセンスID122の現状値602に推測値を加算して、制限値604を超える場合には、その旨出力する。(ステップS1103)。なお、この時、登録処理の継続又は中断の判断を受付けて、中断を受付けた場合には、文書記憶部106に登録された文書も元に戻し、登録処理を中断し、エラーの旨を出力する。
When the
テキスト解析部102は、解析結果をテキスト解析結果記憶部107に格納する(ステップS1104)。
The
概念辞書作成部103は、テキスト解析結果から、各単語の概念ベクトルを計算して概念辞書を作成する(ステップS1105)。なお、登録条件123が既存概念辞書流用を指定している場合には、概念辞書は作成せず、ステップS1105、S1106、ステップS1107は実行しない。
The concept
登録制限確認部115は、課金種別602が概念辞書容量であり、登録条件123が新規概念辞書作成を指定している場合、概念辞書作成部103が作成した概念辞書の容量を取得し、登録制限記憶部116の該当するライセンスID122の現状値603に概念辞書容量を加算する。登録制限確認部115は、課金種別602が概念辞書業務範囲であり、登録条件123が新規概念辞書作成を指定している場合、概念辞書作成部103が作成した概念辞書の業務範囲を、登録された単語の既存の概念辞書との重複割合から判定し、業務範囲が既存の概念辞書いずれとも異なると判定されれば、登録制限記憶部116の該当するライセンスID122の現状値603に1を加算する(ステップS1106)。なお、ここで加算後の現状値603が制限値604を超えた場合は、現状値603を元に戻し、文書記憶部106に登録された文書も元に戻し、登録処理を中断し、エラーの旨を出力する。なお、このような概念辞書業務範囲判定の方法については、図15を用いて後述する。
The registration
概念辞書作成部103は、作成した概念辞書を、概念辞書記憶部108に格納する(ステップS1107)。
The concept
文書索引作成部104は、テキスト解析結果から文書索引情報を作成し、文書索引記憶部109に格納する(ステップS1201)。属性情報作成部105は、文書124の属性情報を作成し、属性情報記憶部110に格納する(ステップS1202)。登録受付部101は、ライセンスID410と、各記憶部に格納された文書、概念辞書、文書索引、属性情報の各名称を関連付けて、図4に例示するように管理情報記憶部111に保管する(ステップS1203)。登録受付部は、テキスト解析結果記憶部107のテキスト解析結果を削除する(ステップS1204)。
The document
以下、図13を用いて、本実施の形態における分析処理の流れを説明する。分析受付部112は、ユーザID125を受付ける(ステップS1301)。分析受付部112は、管理情報記憶部111を参照して、該当ユーザID125と、対応するライセンスID122の存在を確認する(ステップS1302)。なお、該当ユーザID125が存在しなければ、登録処理を中断する。分析課金種別確認部117は、登録制限記憶部116を参照して、該当ライセンスID122の分析に係る課金種別602を取得する(ステップS1303)。
Hereinafter, the flow of analysis processing in the present embodiment will be described with reference to FIG. The
分析制限確認部118は、課金種別602が分析実行回数である場合、分析制限記憶部119の該当するライセンスID122の現状値603に1を加算する(ステップS1304)。なお、ここで加算後の現状値603が制限値604を超えた場合は、現状値603を元に戻し、分析処理を中断し、エラーの旨を出力する。
If the
分析受付部112は、ユーザから分析対象の文書名、及び分析条件126(キーワード、属性など)を受付け、分析部113に該当分析対象文書124の該当分析条件126による分析を依頼する(ステップS1305)。
The
分析部113は、該当分析対象文書124に対応する概念辞書、文書索引情報、属性情報を取得して、該当分析条件126により分析し、分析結果127を出力する(ステップS1306)。
The
以下、図14を用いて、本実施の形態における料金算定処理の流れを説明する。すべてのライセンスIDについて、ステップS1401からステップS1406までの処理を繰り返す(ステップS1401)。料金算定部120は、登録制限記憶部116及び分析制限記憶部119から、該当ライセンスID122に係る現状値603を取得する(ステップS1402)。料金算定部120は、課金情報記憶部121を参照し、登録処理及び分析処理に係る料金を各々算出し、すべて加算し、該当ライセンスID122の料金128とする(ステップS1403)。
Hereinafter, the flow of fee calculation processing in the present embodiment will be described with reference to FIG. The process from step S1401 to step S1406 is repeated for all license IDs (step S1401). The
料金算定部120は、料金128を出力する(ステップS1404)。料金算定部120は、登録制限記憶部116及び分析制限記憶部119の該当ライセンスID122に係る現状値603を0にする(ステップS1405)。すべてのライセンスID122について算定していれば、料金算定処理を完了する。それ以外の場合は、ステップS1401に戻る。
The
以下、図15を用いて、本実施の形態における概念辞書業務範囲判定処理の流れを説明する。本処理は、図11のステップS1106で説明した、課金種別602が概念辞書業務範囲である場合に、登録制限確認部115が概念辞書業務範囲判定を行う処理の流れである。
Hereinafter, the flow of the concept dictionary work range determination process in the present embodiment will be described with reference to FIG. This processing is a flow of processing in which the registration
すべての既存概念辞書について、ステップS1501からステップS1505までの処理を繰り返す(ステップS1501)。新規の概念辞書と既存の概念辞書との両方に、重複して格納された重複単語数を確認する(ステップS1502)。重複単語数を、新規の概念辞書に登録された単語数により割算した、重複割合を取得する(ステップS1503)。 The processing from step S1501 to step S1505 is repeated for all existing concept dictionaries (step S1501). The number of duplicate words stored redundantly in both the new concept dictionary and the existing concept dictionary is confirmed (step S1502). The duplication ratio obtained by dividing the number of duplicate words by the number of words registered in the new concept dictionary is acquired (step S1503).
重複割合が予め定められた値よりも小さいくなければ、ステップS1507に進む。それ以外の場合は、ステップS1505に進む。(ステップS1504)。
すべての既存概念辞書について確認していれば、ステップS1506に進む。それ以外の場合は、ステップS1501に戻る(ステップS1505)。
If the overlap ratio is not smaller than a predetermined value, the process proceeds to step S1507. In cases other than that described here, process flow proceeds to Step S1505. (Step S1504).
If all the existing concept dictionaries have been confirmed, the process proceeds to step S1506. Otherwise, the process returns to step S1501 (step S1505).
新規概念辞書は、すべての既存概念辞書に対して、単語の重複割合が予め定められた値よりも小さいことが、確認された。すなわち新規概念辞書は、既存の概念辞書のいずれと比べても、異なる用語が多く使用されており、業新規概念辞書は、既存の概念辞書のいずれとも異なる業務範囲であると判断する。(ステップS1506)。
新規概念辞書は、少なくともひとつの既存概念辞書に対して、単語の重複割合が予め定められた値よりも小さくないことが、確認された。すなわち新規概念辞書は、少なくともひとつの既存概念辞書に対して、似通った用語が多く使用されており、新規概念辞書は、既存の概念辞書のいずれかと同じ業務範囲であると判断する。(ステップS1507)。
It was confirmed that the new concept dictionary has a word overlapping ratio smaller than a predetermined value with respect to all existing concept dictionaries. That is, the new concept dictionary uses a lot of different terms compared to any of the existing concept dictionaries, and the business new concept dictionary is determined to have a different business scope from any of the existing concept dictionaries. (Step S1506).
New concept dictionary, for at least one existing concept dictionary, that overlap percentage of words is not rather smaller than a predetermined value, was confirmed. That is, the new concept dictionary uses many similar terms with respect to at least one existing concept dictionary, and the new concept dictionary is determined to be within the same business scope as any of the existing concept dictionaries. (Step S1507).
本発明によれば、テキストマイニングにおいて、従量制の課金を実現できるので、効果を判断できていないユーザにとっても初期導入の決断がし易くなる。また、効果が出たため使用量が多くなったユーザからは多くの使用料金を徴収することに納得を得られやすい。 According to the present invention, in the text mining, a pay-as-you-go system can be realized, so that the user who has not been able to judge the effect can easily make an initial introduction decision. Moreover, it is easy to be convinced to collect a lot of usage fees from users who have increased the amount of usage due to the effect.
課金種別として、概念辞書業務範囲を指定できることにより、客先でテキストマイニングシステムの使用部門や用途が広がった場合に、課金を増加させることが出来る。
As the accounting classification, and more that you can specify the concept dictionary business scope, if the use departments and applications of text mining system has spread in the customer, it is possible to increase the billing.
制限値の指定により、ユーザが予想以上の支出となるのを防ぐことができる。 By specifying the limit value, it is possible to prevent the user from spending more than expected.
制限値に無制限を指定できることにより、ライセンスIDによって、制限をかける場合と、制限をかけない場合とを使い分けることができる。 Since it is possible to designate unlimited as the limit value, it is possible to selectively use a case where the restriction is applied and a case where the restriction is not applied depending on the license ID.
ライセンスIDごとにユーザIDを複数設定することができる。テキストマイニングシステムのひとつの運用形態としては、登録処理は、定期的業務として、クライアント側管理者が実施し、分析処理は、様々なノウハウを持つ、複数の人物が試行錯誤を繰り返しながら不定期に行うことが想定されるが、このような運用形態に対応できる。 A plurality of user IDs can be set for each license ID. As one operation mode of the text mining system, the registration process is performed as a regular operation by the client-side administrator, and the analysis process is performed irregularly while repeating various trials and errors with various know-how. Although it is assumed to be performed, it is possible to cope with such an operation mode.
実施の形態2.
次に実施の形態2について説明する。本実施の形態では、ひとつのライセンスID601に対して、複数の課金種別602を設定できる実施例を説明する。本実施の形態におけるテキストマイニングシステムの構成は、実施の形態1で説明した図1と同じである。ただし、登録制限記憶部116に格納されるデータが、実施の形態1とは異なる。
Next, a second embodiment will be described. In this embodiment, an example in which a plurality of charging
図16は、本実施の形態における、登録制限記憶部116のデータ例であり、ライセンスID601、課金種別602、現状値603、及び制限値603に加えて、料金結合種別1601、及び制限結合種別1602を保有する。本実施の形態では、ひとつのライセンスID601に対して、複数の課金種別602、現状値603、及び制限値604が定義され、ひとつのライセンスID601に対して、ひとつの料金結合種別1601、及び制限結合種別1602が定義される。
FIG. 16 is a data example of the registration
ライセンスID601、及び課金種別602の値は、予め設定されている。現状値603には、登録処理の流れの中で、登録制限確認部115により課金種別602と登録処理の使用状況に応じてカウントされた値が常時更新される。これは複数の課金種別602について、実行される。制限値604の値は、予め設定されており、現状値603が制限値を超えると、登録処理の使用が制限される。料金結合種別1601は予め設定されており、複数の課金種別602に係る料金をどのように合わせるのかを表す値として、和、高、及び安を設定できる。制限結合種別1602は予め設定されており、複数の課員種別602に係る制限をどのように合わせるのかを表す値として、全て、及びひとつを設定できる。
The values of the
実施の形態1では、図10から図12に示す登録処理のステップS1005、ステップS1102、及びステップS1106において、課金種別602に応じた現状値603の加算を行うが、本実施の形態でも同様であり、複数の課金種別602について、加算を行う。
In the first embodiment, in step S1005, step S1102, and step S1106 of the registration process shown in FIGS. 10 to 12, the
また、実施の形態1では、ステップS1005、ステップS1102、及びステップS1106において、加算後の現状値603が制限値604を超えた場合は、現状値603を元に戻し、登録処理を中断し、エラーの旨を出力しているが、本実施の形態では、制限結合種別1602の値に応じて、以下のように処理を進める。制限結合手段1602が全ての場合には、登録処理を行うライセンス者のライセンスID601に係る全ての課金種別602について、現状値603が制限値604を超えた場合には、現状値603を元に戻し、登録処理を中断し、エラーの旨を出力する。制限結合手段1602がひとつの場合には、登録処理を行うライセンス者のライセンスID601に係るひとつの課金種別602について、現状値603が制限値604を超えた場合には、現状値603を元に戻し、登録処理を中断し、エラーの旨を出力する。
In the first embodiment, if the
実施の形態1では、図13に示す分析処理のステップS1304において、課金種別602に応じた現状値603の加算と、現状値603が制限値604を超えた場合の、分析処理の中断を行う。本実施の形態では、分析処理については、ひとつの課金種別602しか用意していないので、分析処理についての動作は、実施の形態1と同様である。なお、分析処理についても複数の課金種別602がある場合には、登録処理の場合と同様に、すべての課金種別602について加算を行い、制限結合種別1602に応じて、制限を行う。
In the first embodiment, in step S1304 of the analysis process shown in FIG. 13, addition of the
また、実施の形態1では、図14に示す料金算定処理のステップS1403において、料金算定部120は、課金情報記憶部121を参照し、登録処理及び分析処理に係る料金を各々算出し、すべて加算し、該当ライセンスIDの料金とするが、本実施の形態では、料金結合種別1601の値に応じて、以下のように処理を進める。
Further, in the first embodiment, in step S1403 of the charge calculation process shown in FIG. 14, the
料金算定部120は、課金情報記憶部121を参照し、料金算定対象のライセンスID601に係る全ての課金種別602について、課金種別602ごとの料金を算出する。次に、料金算定部120は、料金結合種別1601が和の場合は、課金種別602ごとの料金の和を算出する。又は、料金結合種別1601が高の場合は、課金種別602ごとの料金の中で、最も高い料金を選択する。又は、料金結合種別1601が安の場合は、課金種別602ごとの料金の中で、最も安い料金を選択する。このようにして算出又は選択された料金を、該当ライセンスIDの料金とする。
The
本実施の形態の発明によれば、テキストマイニングにおいて、複数の課金種別を用いて、クライアントのニーズに応じた柔軟な従量制の課金を実現できる。 According to the invention of the present embodiment, in text mining, it is possible to realize flexible metered billing according to client needs using a plurality of billing types.
また、複数の課金種別を用いて、クライアントのニーズに応じた柔軟な使用制限を実現できる。 Further, by using a plurality of billing types, it is possible to realize flexible usage restrictions according to client needs.
なお、実施の形態1又は実施の形態2において、図1を用いて説明したテキストマイニングシステムの構成に、文書索引作成部104、属性情報作成部105、文書索引記憶部109、属性情報記憶部110を含めなくてもよい。
この場合には、図4を用いて説明した管理情報記憶部111は、文書索引情報名404、及び属性情報名405を保有せず、ライセンスID401、文書名402、及び概念辞書名403を保有する。図12を用いて説明した登録処理の流れでは、ステップS1201、及びステップS1202は不要となる。図13を用いて説明した分析処理の流れのステップS1306では、分析部113は、該当分析対象文書124に対応する概念辞書を取得して、該当分析条件126により分析し、分析結果127を出力する。
In the first embodiment or the second embodiment, the structure of the text mining system described with reference to FIG. 1 includes the document
In this case, the management
なお、実施の形態1又は実施の形態2において説明したテキストマイニングシステムは、LANやWANなどに接続された通信装置906を介して、複数のクライアント端末に対して、入出力を可能としてもよい。
Note that the text mining system described in the first embodiment or the second embodiment may allow input / output to / from a plurality of client terminals via the
本発明によれば、LAN、又はWANを通じて、多数のクライアントにテキストマイニングシステムを提供することができ、クライアントにとっては初期導入しやすく、また、テキストマイニングシステムを運営する管理者側にとっても、多数のクライアントを管理しやすい。 According to the present invention, a text mining system can be provided to a large number of clients via a LAN or a WAN, and it is easy for the client to introduce the text mining system. Easy to manage clients.
その他にも、総合的に以下のような効果がある。テキストマイニングシステムの効果を判断できていないユーザにとっても初期導入の決断がし易くなる。また、効果が出たため使用量が多くなったユーザからは多くの使用料金を徴収することに納得を得られやすい。社内のイントラネットで複数ユーザがサーバ上のテキストマイニング装置を使用する場合には、従量制の課金を実現することによって、規模に応じた使用料金を徴収することができる。テキストマイニング装置をインターネット上のサーバで稼動し、あらかじめ登録した技術文書や特許情報などの分析機能を一般に提供するサービスを想定した場合、従量制の課金を実現することによって、規模に応じた使用料金を徴収することができる。 In addition, there are the following effects overall. Even for users who have not been able to judge the effect of the text mining system, it is easy to make an initial introduction decision. Moreover, it is easy to be convinced to collect a lot of usage fees from users who have increased the amount of usage due to the effect. When a plurality of users use a text mining device on a server in an in-house intranet, a usage fee corresponding to the scale can be collected by realizing charge-based billing. Assuming a service that operates a text mining device on a server on the Internet and generally provides analysis functions such as pre-registered technical documents and patent information, the usage fee according to the scale can be obtained by realizing metered billing. Can be collected.
101 登録受付部、102 テキスト解析部、103 概念辞書作成部、104 文書索引作成部、105 属性情報作成部、106 文書記憶部、107 テキスト解析結果記憶部、108 概念辞書記憶部、109 文書索引記憶部、110 属性情報記憶部、111 管理情報記憶部、112 分析受付部、113 分析部、114 登録課金種別確認部、115 登録制限確認部(制限確認部)、116 登録制限記憶部(制限記憶部)、117 分析課金種別確認部、118 分析制限確認部(制限確認部)、119 分析制限記憶部(制限記憶部)、120 料金算定部、121 課金情報記憶部。
DESCRIPTION OF
Claims (7)
前記文書に含まれる単語と、前記単語の共起情報とを抽出するテキスト解析部と、
前記単語と、前記共起情報から算出した概念ベクトルとを関連付けて概念辞書を作成する概念辞書作成部と、
複数の前記概念辞書を記憶する概念辞書記憶部と、
前記ライセンスIDと、前記文書の指定と、分析条件の指定とを受付ける分析受付部と、
前記文書に係る前記概念辞書を、前記分析条件により分析した結果を出力する分析部と、
前記ライセンスIDごとに、予め定められた課金種別と、現状値とを格納する制限記憶部と、
前記ライセンスIDに対応する前記課金種別に応じて、予め定められた処理の実行回数、作成物の個数、又は作成物の量を、現状値に加算する制限確認部と、
前記制限記憶部が格納する前記ライセンスIDに対応する現状値と、前記課金種別に応じて予め定められた料金単価とから、料金を計算する料金算定部と
を備え、
前記制限確認部は、前記ライセンスIDに対応する課金種別が概念辞書業務範囲であり、かつ、前記概念辞書作成部が新規の概念辞書を作成する場合、前記新規の概念辞書において、前記概念辞書記憶部に記憶された既存の概念辞書と単語が重複する割合が、すべての前記既存の概念辞書のいずれかひとつについて、予め定められた値よりも小さい場合には、概念辞書業務範囲に対応する現状値に1を加算する
ことを特徴とするテキストマイニングシステム。 A registration receiving unit for receiving a license ID for confirming license holding and registration of a plurality of documents to be analyzed;
A text analysis unit that extracts words included in the document and co-occurrence information of the words;
A concept dictionary creating unit that creates a concept dictionary by associating the word with a concept vector calculated from the co-occurrence information;
A concept dictionary storage unit for storing a plurality of the concept dictionaries;
An analysis reception unit that receives the license ID, the specification of the document, and the specification of analysis conditions;
An analysis unit that outputs a result of analyzing the concept dictionary according to the document according to the analysis condition;
A limit storage unit for storing a predetermined charging type and a current value for each license ID;
In accordance with the billing type corresponding to the license ID, a limit confirmation unit that adds a predetermined number of processing executions, the number of creations, or the amount of creations to the current value;
A charge calculation unit for calculating a charge from a current value corresponding to the license ID stored in the restriction storage unit and a charge unit price determined in advance according to the charge type ;
When the charge type corresponding to the license ID is a concept dictionary service range and the concept dictionary creation unit creates a new concept dictionary, the restriction confirmation unit stores the concept dictionary in the new concept dictionary. If the ratio of overlapping words with existing concept dictionaries stored in the section is smaller than a predetermined value for any one of all the existing concept dictionaries, the current status corresponding to the concept dictionary work range A text mining system characterized by adding 1 to a value .
前記制限確認部は、前記現状値に加算すると制限値を越えると判断した時に、
前記登録受付部、又は前記分析受付部は処理を中断することを
特徴とする請求項1に記載のテキストマイニングシステム。 The limit storage unit further stores a limit value for each license ID,
When the limit confirmation unit determines that the limit value is exceeded when added to the current value,
The text mining system according to claim 1, wherein the registration reception unit or the analysis reception unit interrupts processing.
ことを特徴とする請求項2に記載のテキストマイニングシステム。 The text mining system according to claim 2 , wherein an unlimited value can be designated in addition to a value that can be designated as the restricted value.
前記制限確認部は、前記ライセンスIDに対応する複数の課金種別に応じて、各々の前記課金種別に対応する現状値に加算し、
前記料金算定部は、前記ライセンスIDに対応する複数の課金種別に応じて、各々の前記課金種別に対応する料金を算出し、
前記料金算定方法が和であれば、各々の前記料金の和を、前記料金算定方法が高であれば、最も高い前記料金を、前記料金算定方法が安であれば、最も安い前記料金を、前記ライセンスIDに対する料金とする
ことを特徴とする請求項1から3のいずれかひとつに記載のテキストマイニングシステム。 The limit storage unit further stores, for each license ID, a charge calculation type having a value of sum, high, or low as a charge calculation type based on a plurality of charge types,
The restriction confirmation unit adds to the current value corresponding to each of the charging types according to a plurality of charging types corresponding to the license ID,
The charge calculation unit calculates a charge corresponding to each of the charge types according to a plurality of charge types corresponding to the license ID,
If the charge calculation method is sum, the sum of the charges, if the charge calculation method is high, the highest charge, if the charge calculation method is low, the cheapest charge, The text mining system according to any one of claims 1 to 3 , wherein the fee is a fee for the license ID.
前記制限確認部は、
前記制限種別がすべての場合、前記ライセンスIDに対応する複数の課金種別に応じて、各々の前記課金種別に対応する現状値に加算し、加算後の値が、すべての現状値について制限値を越えた場合、前記登録受付部はエラーを出力し、
前記制限種別がひとつの場合、前記ライセンスIDに対応する複数の課金種別に応じて、各々の前記課金種別に対応する現状値に加算し、ひとつの現状値について制限値を越えた場合、前記登録受付部は処理を中断する
ことを特徴とする請求項2から3のいずれかひとつに記載のテキストマイニングシステム。 The restriction storage unit further stores, for each license ID, a restriction combination type having all or one of the values as a restriction type based on a plurality of the charge types,
The restriction confirmation unit
When the restriction types are all, according to a plurality of charging types corresponding to the license ID, it is added to the current value corresponding to each of the charging types, and the value after the addition is set as a limiting value for all current values. If it exceeds, the registration reception unit will output an error,
When there is one restriction type, the registration is added to the current value corresponding to each of the charge types according to a plurality of charge types corresponding to the license ID, and when the limit value is exceeded for one current value, the registration The text mining system according to any one of claims 2 to 3 , wherein the reception unit interrupts the processing.
ことを特徴とする請求項1から5のいずれかひとつに記載のテキストマイニングシステム。 Wherein the analysis reception unit accepts a user ID, according to any one of claims 1 to 5, wherein the user ID is characterized in that an error unless the user ID corresponding to the license ID to a predetermined Text mining system.
前記テキスト解析部は、前記ライセンスIDごとに、前記単語の前記共起情報とを抽出し、
前記概念辞書作成部は、前記ライセンスIDごとに、前記概念辞書を作成し、
前記分析受付部は、前記ユーザIDごとに、前記ユーザIDと、前記文書の指定と、前記分析条件の指定とを受信し、
前記分析部は、前記ユーザIDごとに、前記分析条件により分析した結果を前記クライアント端末に対して送信する
ことを特徴とする請求項6に記載のテキストマイニングシステム。 The registration accepting unit, a plurality of clients terminal, receiving the document and the license ID,
The text analysis unit extracts the co-occurrence information of the word for each license ID,
The concept dictionary creation unit creates the concept dictionary for each license ID,
Wherein the analysis reception unit, the user ID your capital, receiving said user ID, and designation of the document, and a designation of the analysis condition,
The text mining system according to claim 6 , wherein the analysis unit transmits a result of analysis according to the analysis condition to the client terminal for each user ID.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005101476A JP4395094B2 (en) | 2005-03-31 | 2005-03-31 | Text mining system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005101476A JP4395094B2 (en) | 2005-03-31 | 2005-03-31 | Text mining system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006285396A JP2006285396A (en) | 2006-10-19 |
JP4395094B2 true JP4395094B2 (en) | 2010-01-06 |
Family
ID=37407291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005101476A Active JP4395094B2 (en) | 2005-03-31 | 2005-03-31 | Text mining system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4395094B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023188229A1 (en) * | 2022-03-31 | 2023-10-05 | 三菱電機株式会社 | Monitoring assistance system, monitoring assistance device, and monitoring assistance method |
-
2005
- 2005-03-31 JP JP2005101476A patent/JP4395094B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2006285396A (en) | 2006-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2811408C (en) | Determining local tax structures in an accounting application through user contribution | |
KR100692209B1 (en) | Method and system for providing information of commodity customized to each user | |
EP3029581B1 (en) | Processing program, processing system, and processing method | |
WO2018011895A1 (en) | Data processing flow management system and method | |
Thakur | Car rental system | |
KR20200132193A (en) | Apparatus and method for searching personalized shopping information | |
CN111639121A (en) | Big data platform and method for constructing customer portrait | |
JP6260694B2 (en) | Ordering program, ordering device and ordering method | |
CN108305134B (en) | Safety detection method, equipment and system for air ticket order | |
Andriani et al. | Designing a Web-Based Inventory Application at General Steel Supplier Using Extreme Programming Method:- | |
JP4395094B2 (en) | Text mining system | |
KR102547033B1 (en) | Method for providing information in the way user selected using keyword recognition function | |
JP5685654B1 (en) | Portal site system and method of using application, content, and service using portal site system | |
JP6772626B2 (en) | Information processing equipment, information processing programs, information processing methods and information processing systems | |
JP5934736B2 (en) | Merchant-provided data output system | |
KR20180113306A (en) | Method, Apparatus and Computer-Readable Medium of searching insertion image for writing post. | |
KR101651957B1 (en) | Portal site cost distribution/recovery system | |
JP2006039691A (en) | System and method for providing material for business activity and program for providing material for business activity | |
JP5662595B1 (en) | Portal site usage results collection system and portal site usage results collection method | |
Giovanoli et al. | Building a knowledge base for guiding users through the cloud life cycle | |
JP2010020507A (en) | Charge calculation system | |
US11657070B2 (en) | Management of data warehouse for electronic payment transaction processing networks | |
Averweg | Historical overview of decision support systems (DSS) | |
KR101745403B1 (en) | User authority management system and meyhod thereof | |
Odeh et al. | Cloud Computing-Based Theoretical Transfer from Physical to Virtual Machines |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090519 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090716 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091013 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091016 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4395094 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121023 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121023 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131023 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |