JP2000331018A - Electronic information reception equipment and electronic information processing method - Google Patents

Electronic information reception equipment and electronic information processing method

Info

Publication number
JP2000331018A
JP2000331018A JP13974999A JP13974999A JP2000331018A JP 2000331018 A JP2000331018 A JP 2000331018A JP 13974999 A JP13974999 A JP 13974999A JP 13974999 A JP13974999 A JP 13974999A JP 2000331018 A JP2000331018 A JP 2000331018A
Authority
JP
Japan
Prior art keywords
electronic information
topic
data
module
mail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP13974999A
Other languages
Japanese (ja)
Inventor
Michimasa Aramaki
道昌 荒巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP13974999A priority Critical patent/JP2000331018A/en
Publication of JP2000331018A publication Critical patent/JP2000331018A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

PROBLEM TO BE SOLVED: To inform a user of only data which seems to be a topic by automatically analyzing contents of stored mail list data. SOLUTION: This electronic information reception equipment is provided with a central processing unit 4 which processes requested information, a communication equipment 1 which communicates with an external computer, a display device 3 on which windows, graphic elements, characters, etc., are displayed, an input device 2 like a keyboard, a tablet, or a mouse with which data of characters, numerical values, positions, etc., are inputted, a main storage device 5 where a program being in course of execution like an operating system or a window system is stored, and a secondary storage device 6 where programs, text data, etc., are stored, and the secondary storage device 6 is provided with a data analysis module 10 which automatically statistically analyzes electronic information delivered and stored by electronic mails and electronic news to automatically generate topic information in each field.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、電子メールや電子
ニュースなどにより配信された電子情報を処理する電子
情報受信装置および電子情報処理方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an electronic information receiving apparatus and an electronic information processing method for processing electronic information distributed by electronic mail, electronic news, and the like.

【0002】[0002]

【従来の技術】近年、インターネットの普及に伴い、電
子メールの利用や、電子ニュースの配信サービスが盛ん
になってきた。中でも、メーリングリスト(メールリス
ト)とよばる情報提供サービスは、膨大な数、種類に及
び、自分の興味や関心のあるメーリングリストに登録し
ておけば、日々電子メールによりニュースが配信され
る。このようなインターネットを介した電子情報の配信
利用は、分野を問わず今後益々広まっていくと思われ
る。
2. Description of the Related Art In recent years, with the spread of the Internet, electronic mail and electronic news distribution services have become popular. Among them, an information providing service called a mailing list (mail list) is enormous in number and types, and news is distributed by e-mail every day if registered in a mailing list of interest or interest. Such distribution and use of electronic information via the Internet is expected to become increasingly widespread in any field.

【0003】従来の電子情報受信装置では、メールシス
テムやニュースリーダといった表示装置で、配信者を特
定する記号、電文のタイトル、日付などを一覧表にして
表示し、読み手側がそれらの情報を選択して内容を読む
といった方法を取っていた。
In a conventional electronic information receiving apparatus, a display device such as a mail system or a news reader displays a symbol for identifying a distributor, a title of a message, a date, and the like in a list, and a reader selects the information. And read the contents.

【0004】図12は従来の電子情報受信装置を示すブ
ロック図である。
FIG. 12 is a block diagram showing a conventional electronic information receiving apparatus.

【0005】図12において、61はモデムなど通信を
おこなうための通信装置、62はキーボードやマウスと
いった入力装置、63は受信した電子情報を表示するた
めの表示装置、64は中央処理装置(CPU)、65は
処理中のプログラムや値を一時的に記憶する主記憶装
置、66はメール情報を表示、編集、送信するための処
理モジュールやメールデータを保存したり記憶するため
の二次記憶装置であり、二次記憶装置66は、受信した
メールを表示するためのメール表示モジュール67と、
メール送信を行うためのメール送信モジュール68と、
メール文書を編集するための文書編集モジュール69と
から成る。
In FIG. 12, reference numeral 61 denotes a communication device such as a modem for performing communication, 62 denotes an input device such as a keyboard and a mouse, 63 denotes a display device for displaying received electronic information, and 64 denotes a central processing unit (CPU). , 65 is a main storage device for temporarily storing the program or value being processed, 66 is a processing module for displaying, editing and transmitting mail information and a secondary storage device for storing and storing mail data. Yes, the secondary storage device 66 includes a mail display module 67 for displaying the received mail,
An e-mail transmission module 68 for performing e-mail transmission;
A document editing module 69 for editing a mail document.

【0006】このように構成された電子情報受信装置に
ついて、二次記憶装置66のメール表示モジュール67
による処理を図13を用いて説明する。図13は図12
の電子情報受信装置のメール表示モジュール67による
処理を示すフローチャートである。
[0006] With regard to the electronic information receiving apparatus configured as described above, the mail display module 67 of the secondary storage device 66 is used.
Will be described with reference to FIG. FIG. 13 shows FIG.
9 is a flowchart showing processing by the mail display module 67 of the electronic information receiving device of FIG.

【0007】先ず通信装置61を介してメールが届いて
いるかの問い合わせを行う(S61)。届いていると判
定した場合は、受信したメールデータを二次記憶装置6
6に保存する(S62)。届いていないと判定した場合
は、ステップ63に移る。ステップ63では、現在二次
記憶装置66に保存されているメールデータを主記憶装
置65に読み込み、一覧表形式で表示する。この一覧表
には、メールの本文は表示されず、送信者、送信時間、
タイトルが表示される。メールデータには、メールの内
容、メールのタイトル、送信者のメールアドレス、送信
時間などが含まれる。次に、ユーザの選択モードに入る
(S64)。この選択モードにおいて、ユーザは、画面
上に表示されているメール一覧表から、読みたい情報も
しくは終了をインデック番号やマウスにより選択する。
終了以外のインデックス番号が入力された場合は、イン
デックの示すメールデータの本文(メール文書)を画面
に表示する。ユーザがメールの本文を読み終わった場合
は、ステップ63に戻り、他のメール本文の参照等を行
う。もし、ステップ64において終了ボタンが選択され
た場合は、このメール表示モジュールの処理は終了す
る。
First, an inquiry is made as to whether a mail has arrived via the communication device 61 (S61). If it is determined that the mail has arrived, the received mail data is stored in the secondary storage device 6.
6 (S62). If it is determined that it has not arrived, the process proceeds to step 63. In step 63, the mail data currently stored in the secondary storage device 66 is read into the main storage device 65 and displayed in a list form. This list does not show the body of the message,
The title is displayed. The mail data includes the contents of the mail, the title of the mail, the mail address of the sender, the transmission time, and the like. Next, a user selection mode is entered (S64). In this selection mode, the user selects the information to be read or the end from the mail list displayed on the screen using the index number or the mouse.
When an index number other than the end is input, the body of the mail data indicated by the index (mail document) is displayed on the screen. When the user has finished reading the body of the mail, the process returns to step 63 to refer to another body of the mail. If the end button is selected in step 64, the processing of the mail display module ends.

【0008】次に、記事をある特徴量に基づいて分類す
るアルゴリズム手法であるファジークラスタリングにつ
いて説明する。ファジークラスタリングは、ばらついた
データ群をいくつかのグループに分割する方法である。
このとき、同一グループ内のデータは類似した性質を持
ち、グループ間の平均的性質はできるだけ異なるように
分割する。いま、N個のデータをx1,x2,x3,・
・・、xnとし、このデータ集合をXとすると、(数
1)のようになる。
Next, fuzzy clustering, which is an algorithm for classifying articles based on certain feature amounts, will be described. Fuzzy clustering is a method of dividing a dispersed data group into several groups.
At this time, the data in the same group has similar properties, and the data is divided so that the average properties between the groups are as different as possible. Now, N data are represented by x1, x2, x3,.
.., Xn, and when this data set is X, the following equation (1) is obtained.

【0009】[0009]

【数1】 (Equation 1)

【0010】これをc個のクラスタ{2≦c<n}に分
割することを考える。いま、xjがk番目のクラスタに
属するらしさをukjとする。ハードクラスタリングで
は、ukjは0か1の2値であるが、ファジークラスタ
リングでは0から1までの任意の値をとるもとのする。
(数2)はハードクラスタリングを示し、(数3)はフ
ァジークラスタリングを示す。
Consider dividing this into c clusters {2 ≦ c <n}. Now, let ukj be the likelihood that xj belongs to the k-th cluster. In hard clustering, ukj is a binary value of 0 or 1, but in fuzzy clustering, ukj assumes an arbitrary value from 0 to 1.
(Equation 2) indicates hard clustering, and (Equation 3) indicates fuzzy clustering.

【0011】[0011]

【数2】 (Equation 2)

【0012】[0012]

【数3】 (Equation 3)

【0013】ただし、いずれの場合もukjは(数4)
のようになる。
However, in each case, ukj is (Equation 4)
become that way.

【0014】[0014]

【数4】 (Equation 4)

【0015】ファジークラスタリングは、1つのデータ
が2つ以上のクラスタに属することを認める。しかし、
その帰属度の総和は1であって、uは各クラスタへの帰
属の重みである。このようなuを求めるアルゴリズムは
存在する。このアルゴリズムとしては、Dunnが提唱
し、J.C.Bezdekが一般化したファジーC−m
eans法(C手段法)があり、これはファジー集合を
利用してuを求めるものである。
Fuzzy clustering recognizes that one data belongs to more than one cluster. But,
The sum of the degrees of membership is 1, and u is the weight of membership to each cluster. There is an algorithm for obtaining such u. This algorithm is proposed by Dunn, C. Fuzzy C-m generalized by Bezdek
There is an eans method (C means method), which obtains u using a fuzzy set.

【0016】いま、(数3)を満足するukjを要素と
するc×n行列U(分割行列)の集合をMfcと書く。
一方、(数1)のRdは特徴空間とよばれ、xk=(x
k1、xk2、…、xkd)を特徴ベクトルという。ク
ラスタリングとは、データ集合Xと分割行列Uとを連結
することである。連結されたものをUkと書く。ファジ
ークラスタリングアルゴリズムでは、最適のUkを求め
るため、次のグループ内の自乗誤差の和を目的関数に
し、エネルギー最小化問題として扱う。これを(数5)
に示す。
Now, a set of a c × n matrix U (partition matrix) having ukj as an element satisfying (Equation 3) is written as Mfc.
On the other hand, Rd in (Equation 1) is called a feature space, and xk = (x
k1, xk2,..., xkd) are called feature vectors. The clustering is to connect the data set X and the division matrix U. The concatenated one is written as Uk. In the fuzzy clustering algorithm, in order to find the optimum Uk, the sum of the square errors in the next group is used as an objective function and treated as an energy minimization problem. This is (Equation 5)
Shown in

【0017】[0017]

【数5】 (Equation 5)

【0018】ここで、xjはd次元の測定データで、v
kはk番目のクラスタの中心でd次元である。‖*‖は
任意のノルムであって、測定データとクラスタ中心との
類似性を表す。(数5)のエネルギー関数を最小にする
ukjとvkは、m>1に対して次式(数6)、(数
7)を満たす。
Here, xj is d-dimensional measurement data, and v
k is the center of the k-th cluster and is d-dimensional. {*} Is an arbitrary norm and represents the similarity between the measurement data and the cluster center. Ukj and vk that minimize the energy function of (Equation 5) satisfy the following equations (Equation 6) and (Equation 7) for m> 1.

【0019】[0019]

【数6】 (Equation 6)

【0020】[0020]

【数7】 (Equation 7)

【0021】(数5)を極小にするようなukjは、次
の書きの手順(手順1〜手順4)を繰り返すことによっ
て求めることができる。
The ukj that minimizes (Equation 5) can be obtained by repeating the following writing procedure (procedure 1 to procedure 4).

【0022】(手順1)mとクラスタ数cを仮定し、
(数6)でノルムを適当に定義する。また、Uの初期値
U(0)を適当に与える。U(0)は、ukjに無関係
にランダムに選ぶ。
(Procedure 1) Assuming m and the number of clusters c,
The norm is appropriately defined by (Equation 6). Also, an initial value U (0) of U is appropriately given. U (0) is randomly selected regardless of ukj.

【0023】(手順2)U(0)と(数7)を用いてク
ラスタ中心vk(0)を計算する。
(Procedure 2) A cluster center vk (0) is calculated using U (0) and (Equation 7).

【0024】(手順3)vk(0)と(数6)を用いて
U(1)を求める。
(Procedure 3) U (1) is obtained using vk (0) and (Equation 6).

【0025】(手順4)適当なノルム、しきい値εを定
義して‖U(p)−U(p−1)‖≦εか否かを判定す
る。
(Procedure 4) An appropriate norm and threshold value ε are defined, and it is determined whether or not {U (p) −U (p−1)} ≦ ε.

【0026】手順1〜手順4を‖U(p)−U(p−
1)‖≦εとなるまで繰り返す。
Steps 1 to 4 are defined as ‖U (p) -U (p-
1) Repeat until ‖ ≦ ε.

【0027】以上が、従来ファジークラスタリングの従
来技術の説明である。
The above is an explanation of the conventional technique of the conventional fuzzy clustering.

【0028】[0028]

【発明が解決しようとする課題】しかしながら、従来の
電子情報受信装置では、配信されたメールデータに対し
て、メールの一覧表からタイトル等を見ながら興味ある
データを一つ一つ選択しながら、内容を確認しなければ
ならず、複数のメールリストに登録したり数日間参照し
ないような場合は、未読のメールが莫大な数に及ぶこと
になり、配信情報の全体を把握するためには、手間と時
間がかかってしまい、結局未読のメールが増え、二次記
憶装置に蓄積されていき、必要な時にまとめて検索しな
ければならないという問題点を有していた。これは、メ
ールリストの登録数に制限がないためにユーザの興味が
増大するに従ってメールリストの種類も増加すること、
および、配信者の意図で配信メール数が増減することが
原因である。
However, in the conventional electronic information receiving apparatus, while looking at titles and the like from a list of e-mails and selecting data of interest one by one with respect to the distributed e-mail data, If you have to check the content, and if you do not subscribe to multiple email lists or browse for several days, you will receive a huge number of unread emails, and in order to grasp the entire distribution information, It takes time and effort, and the number of unread mails increases in the end, accumulates in the secondary storage device, and has a problem that it is necessary to collectively search when necessary. This is because there is no limit on the number of mail lists registered, so the type of mail list increases as the user's interest increases,
Also, this is because the number of distribution mails increases or decreases according to the distributor's intention.

【0029】この電子情報受信装置および電子情報処理
方法では、蓄積されたメールリストデータの内容解析を
自動的に行い、トピックと思われるデータのみをユーザ
へ知らせることが要求されている。
In the electronic information receiving apparatus and the electronic information processing method, it is required to automatically analyze the contents of the stored mail list data and to inform the user of only data considered to be a topic.

【0030】本発明は、蓄積されたメールリストデータ
の内容解析を自動的に行い、トピックと思われるデータ
のみをユーザへ知らせることができる電子情報受信装
置、および、蓄積されたメールリストデータの内容解析
を自動的に行い、トピックと思われるデータのみをユー
ザへ知らせるための電子情報処理方法を提供することを
目的とする。
According to the present invention, an electronic information receiving apparatus capable of automatically analyzing the contents of accumulated mail list data and notifying a user of only data considered to be a topic, and the contents of accumulated mail list data An object of the present invention is to provide an electronic information processing method for automatically performing analysis and notifying a user of only data considered to be a topic.

【0031】[0031]

【課題を解決するための手段】上記課題を解決するため
に本発明の電子情報受信装置は、要求された情報を処理
する中央処理装置と、外部コンピュータとの通信を行う
通信装置と、ウィンドウ、図形要素、文字などを表示す
る表示装置と、文字、数値、位置などデータを入力する
キーボード、タブレット、マウス等の入力装置と、オペ
レーティングシステム、ウィンドウシステムなど実行中
のプログラムを記憶するための主記憶装置と、プログラ
ム、テキストデータ等を記憶するための二次記憶装置と
を有する電子情報受信装置であって、二次記憶装置は、
電子メールや電子ニュースによって配信され、内蔵メモ
リに蓄積された電子情報に対して自動的に統計解析を行
って分野毎のトピック情報を自動的に生成するデータ解
析モジュールを有する構成を備えている。
According to the present invention, there is provided an electronic information receiving apparatus comprising: a central processing unit for processing requested information; a communication unit for communicating with an external computer; A display device that displays graphic elements, characters, etc., an input device such as a keyboard, tablet, and mouse that inputs data such as characters, numerical values, and positions, and a main memory for storing running programs such as an operating system and a window system Device, a program, an electronic information receiving device having a secondary storage device for storing text data and the like, the secondary storage device,
The system includes a data analysis module that automatically performs statistical analysis on electronic information distributed by e-mail or electronic news and stored in a built-in memory to automatically generate topic information for each field.

【0032】これにより、蓄積されたメールリストデー
タの内容解析を自動的に行い、トピックと思われるデー
タのみをユーザへ知らせることができる電子情報受信装
置が得られる。
Thus, an electronic information receiving apparatus capable of automatically analyzing the contents of the stored mail list data and notifying the user of only data considered to be a topic can be obtained.

【0033】上記課題を解決するために本発明の電子情
報処理方法は、要求された情報を処理する中央処理装置
と、外部コンピュータとの通信を行う通信装置と、ウィ
ンドウ、図形要素、文字などを表示する表示装置と、文
字、数値、位置などデータを入力するキーボード、タブ
レット、マウス等の入力装置と、オペレーティングシス
テム、ウィンドウシステムなど実行中のプログラムを記
憶するための主記憶装置と、プログラム、テキストデー
タ等を記憶するための二次記憶装置とを有する電子情報
受信装置における電子情報処理方法であって、電子メー
ルや電子ニュースによって配信され、内蔵メモリに蓄積
された電子情報に対して自動的に統計解析を行って分野
毎のトピック情報を自動的に生成するデータ解析ステッ
プを有する構成を備えている。
In order to solve the above problems, an electronic information processing method according to the present invention comprises a central processing unit for processing requested information, a communication device for communicating with an external computer, a window, graphic elements, characters, and the like. A display device to be displayed, an input device such as a keyboard, tablet, and mouse for inputting data such as characters, numerical values, and positions; a main storage device for storing a running program such as an operating system and a window system; a program; and text. An electronic information processing method in an electronic information receiving device having a secondary storage device for storing data and the like, wherein the electronic information is automatically distributed to electronic information distributed by electronic mail or electronic news and stored in a built-in memory. A configuration with a data analysis step that automatically generates topic information for each field by performing statistical analysis Eteiru.

【0034】これにより、蓄積されたメールリストデー
タの内容解析を自動的に行い、トピックと思われるデー
タのみをユーザへ知らせるための電子情報処理方法が得
られる。
As a result, an electronic information processing method for automatically analyzing the contents of the stored mail list data and notifying the user of only data considered to be a topic is obtained.

【0035】[0035]

【発明の実施の形態】本発明の請求項1に記載の電子情
報受信装置は、要求された情報を処理する中央処理装置
と、外部コンピュータとの通信を行う通信装置と、ウィ
ンドウ、図形要素、文字などを表示する表示装置と、文
字、数値、位置などデータを入力するキーボード、タブ
レット、マウス等の入力装置と、オペレーティングシス
テム、ウィンドウシステムなど実行中のプログラムを記
憶するための主記憶装置と、プログラム、テキストデー
タ等を記憶するための二次記憶装置とを有する電子情報
受信装置であって、二次記憶装置は、電子メールや電子
ニュースによって配信され、内蔵メモリに蓄積された電
子情報に対して自動的に統計解析を行って分野毎のトピ
ック情報を自動的に生成するデータ解析モジュールを有
することとしたものである。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An electronic information receiving apparatus according to a first aspect of the present invention comprises a central processing unit for processing requested information, a communication unit for communicating with an external computer, a window, a graphic element, A display device that displays characters and the like, an input device such as a keyboard, a tablet, and a mouse for inputting data such as characters, numerical values, and positions; a main storage device for storing a running program such as an operating system and a window system; An electronic information receiving device having a secondary storage device for storing programs, text data, and the like, wherein the secondary storage device receives electronic information distributed by e-mail or electronic news and stored in a built-in memory. Has a data analysis module that automatically performs statistical analysis and automatically generates topic information for each field. It is.

【0036】この構成により、トピック情報が自動的に
確定するという作用を有する。
With this configuration, there is an effect that topic information is automatically determined.

【0037】請求項2に記載の電子情報受信装置は、請
求項1に記載の電子情報受信装置において、データ解析
モジュールは、蓄積された電子情報としてのメール文書
に対して形態素解析を行う形態素解析モジュールと、形
態素解析モジュールでの形態素解析の結果に対してヒス
トグラム解析を行うヒストグラム生成モジュールと、ヒ
ストグラム生成モジュールでのヒストグラム解析の結果
に基づいてトピックキーワード候補を生成し、トピック
キーワード候補に対して時系列ヒストグラムを生成し、
トピックキーワードファジー推論を実行してトピックキ
ーワードを確定するトピックキーワード判定モジュール
と、トピックキーワード判定モジュールでの確定したト
ピックキーワードに基づいて全蓄積メール文書を分類す
るクラスタリングモジュールと、クラスタリングモジュ
ールでの分類結果を表示する分類結果表示モジュールと
を有することとしたものである。
According to a second aspect of the present invention, in the electronic information receiving apparatus according to the first aspect, the data analysis module performs a morphological analysis on the mail document as the stored electronic information. Module, a histogram generation module that performs histogram analysis on the result of the morphological analysis in the morphological analysis module, and a topic keyword candidate that is generated based on the result of the histogram analysis in the histogram generation module. Generate a series histogram,
A topic keyword determination module that determines topic keywords by executing topic keyword fuzzy inference, a clustering module that classifies all stored mail documents based on the topic keywords determined by the topic keyword determination module, and a classification result obtained by the clustering module And a classification result display module for displaying.

【0038】この構成により、確定したトピックキーワ
ードに基づいて全蓄積メール文書が分類され、分類結果
が表示され、トピック情報が詳細にユーザに知らされる
という作用を有する。
With this configuration, all stored mail documents are classified based on the determined topic keyword, the classification result is displayed, and the user is notified of the topic information in detail.

【0039】請求項3に記載の電子情報処理方法は、要
求された情報を処理する中央処理装置と、外部コンピュ
ータとの通信を行う通信装置と、ウィンドウ、図形要
素、文字などを表示する表示装置と、文字、数値、位置
などデータを入力するキーボード、タブレット、マウス
等の入力装置と、オペレーティングシステム、ウィンド
ウシステムなど実行中のプログラムを記憶するための主
記憶装置と、プログラム、テキストデータ等を記憶する
ための二次記憶装置とを有する電子情報受信装置におけ
る電子情報処理方法であって、電子メールや電子ニュー
スによって配信され、内蔵メモリに蓄積された電子情報
に対して自動的に統計解析を行って分野毎のトピック情
報を自動的に生成するデータ解析ステップを有すること
としたものである。
The electronic information processing method according to claim 3, wherein the central processing unit processes the requested information, the communication device communicates with an external computer, and the display device displays windows, graphic elements, characters, and the like. And input devices such as a keyboard, tablet, and mouse for inputting data such as characters, numerical values, and positions; a main storage device for storing running programs such as an operating system and a window system; and programs and text data. An electronic information processing method in an electronic information receiving apparatus having a secondary storage device for performing statistical analysis automatically on electronic information distributed by electronic mail or electronic news and stored in a built-in memory. And a data analysis step for automatically generating topic information for each field.

【0040】この構成により、トピック情報が自動的に
確定するという作用を有する。
With this configuration, there is an effect that topic information is automatically determined.

【0041】請求項4に記載の電子情報処理方法は、請
求項3に記載の電子情報処理方法において、データ解析
ステップは、蓄積された電子情報としてのメール文書に
対して形態素解析を行う形態素解析ステップと、形態素
解析ステップでの形態素解析の結果に対してヒストグラ
ム解析を行うヒストグラム生成ステップと、ヒストグラ
ム生成ステップでのヒストグラム解析の結果に基づいて
トピックキーワード候補を生成し、トピックキーワード
候補に対して時系列ヒストグラムを生成し、トピックキ
ーワードファジー推論を実行してトピックキーワードを
確定するトピックキーワード判定ステップと、トピック
キーワード判定ステップでの確定したトピックキーワー
ドに基づいて全蓄積メール文書を分類するクラスタリン
グステップと、クラスタリングステップでの分類結果を
表示する分類結果表示ステップとを有することとしたも
のである。
According to a fourth aspect of the present invention, in the electronic information processing method according to the third aspect, the data analyzing step includes performing a morphological analysis on the mail document as the stored electronic information. A histogram generating step of performing a histogram analysis on the result of the morphological analysis in the morphological analysis step; generating a topic keyword candidate based on the result of the histogram analysis in the histogram generating step; A topic keyword determining step of generating a series histogram and executing topic keyword fuzzy inference to determine a topic keyword; a clustering step of classifying all stored mail documents based on the topic keywords determined in the topic keyword determining step; In which it was decided to have a classification result display step of displaying a result of classification in Staring step.

【0042】この構成により、確定したトピックキーワ
ードに基づいて全蓄積メール文書が分類され、分類結果
が表示され、トピック情報が詳細にユーザに知らされる
という作用を有する。
With this configuration, all stored mail documents are classified based on the determined topic keyword, the classification result is displayed, and the topic information is notified to the user in detail.

【0043】以下、本発明の実施の形態について、図1
〜図11を用いて説明する。
Hereinafter, an embodiment of the present invention will be described with reference to FIG.
This will be described with reference to FIG.

【0044】(実施の形態1)図1は本発明の実施の形
態1による電子情報受信装置を示すブロック図である。
図1において、1は外部コンピュータ(例えば電子情報
発信装置)との通信を行うモデムなどの通信装置、2は
文字、数値、位置などデータを入力するキーボード、タ
ブレット、マウス等の入力装置、3はウィンドウ、図形
要素、文字などを表示する表示装置、4は要求された情
報を処理する中央処理装置(CPU)、5は処理中のプ
ログラムや値を一時的に記憶する主記憶装置、6は受信
した電子情報の処理モジュールやテーブルなどを記憶す
る二次記憶装置である。二次記憶装置6は、メール表示
モジュール7と、メール送信モジュール8と、文書編集
モジュール9と、受信メールを蓄積したデータを解析す
るデータ解析モジュール10とから成る。また、データ
解析モジュール10は、形態素解析モジュール11と、
ヒストグラム生成モジュール12と、トピックキーワー
ド判定モジュール13と、トピックキーワード表示モジ
ュール14と、クラスタリングモジュール15と、分類
結果表示モジュール16とから構成される。トピックキ
ーワードとは、ユーザが指定する一定期間の中で集中的
に頻出する話題の記事を特定するするためのキーワード
である。
(Embodiment 1) FIG. 1 is a block diagram showing an electronic information receiving apparatus according to Embodiment 1 of the present invention.
In FIG. 1, reference numeral 1 denotes a communication device such as a modem for communicating with an external computer (for example, an electronic information transmission device); 2 denotes an input device such as a keyboard, tablet, and mouse for inputting data such as characters, numerical values, and positions; A display device for displaying windows, graphic elements, characters, etc., 4 is a central processing unit (CPU) for processing requested information, 5 is a main storage device for temporarily storing programs and values being processed, and 6 is a reception device. And a secondary storage device for storing a processing module, a table, and the like for the obtained electronic information. The secondary storage device 6 includes a mail display module 7, a mail transmission module 8, a document editing module 9, and a data analysis module 10 for analyzing data obtained by storing received mail. The data analysis module 10 includes a morphological analysis module 11 and
It comprises a histogram generation module 12, a topic keyword determination module 13, a topic keyword display module 14, a clustering module 15, and a classification result display module 16. The topic keyword is a keyword for specifying a topic article that frequently appears intensively during a certain period designated by the user.

【0045】以上のように構成された電子情報受信装置
について、その動作を図2〜図7を用いて説明する。図
2は図1の電子情報受信装置のメール表示モジュール7
およびデータ解析モジュール10の動作を示すフローチ
ャートであり、図3はデータ解析モジュール10の動作
を示すフローチャート、図4はヒストグラム作成のフロ
ーチャート、図5はトピックキーワードの時系列分析の
説明図、図6(a)〜(e)はトピックキーワード分類
説明図、図7はトピックキーワード判定のためのファジ
ーメンバーシップ関数を示す関数図である。なお、図2
では、ステップ4のみがデータ解析モジュール10の動
作を示し、他のステップはメール表示モジュール7の動
作を示す。
The operation of the electronic information receiving apparatus configured as described above will be described with reference to FIGS. FIG. 2 shows a mail display module 7 of the electronic information receiving apparatus of FIG.
FIG. 3 is a flowchart showing the operation of the data analysis module 10, FIG. 4 is a flowchart of creating a histogram, FIG. 5 is an explanatory diagram of time series analysis of topic keywords, and FIG. a) to (e) are explanatory diagrams of topic keyword classification, and FIG. 7 is a function diagram showing a fuzzy membership function for topic keyword determination. Note that FIG.
Then, only step 4 shows the operation of the data analysis module 10, and the other steps show the operation of the mail display module 7.

【0046】図2において先ず、通信装置1を介してメ
ールデータが届いているかの問い合わせを行う(S
1)。届いていると判定した場合は、受信したメールデ
ータを二次記憶装置6に保存する(S2)。届いていな
いと判定した場合は、ステップ3に移る。ステップ3で
は、現在二次記憶装置6の内蔵メモリ(図示せず)に保
存されているメールデータを主記憶装置5に読み込む。
メールデータには、メールの内容、メールのタイトル、
送信者のメールアドレス、送信時間などが含まれる。主
記憶装置5に読み込まれたメールデータは、一覧表形式
で表示される(S3)。この一覧表には、メールデータ
の本文(メール文書)は表示されず、送信者、送信時
間、タイトルが表示される。次に、データ解析モジュー
ル10は、蓄積された過去のメールリストからユーザの
指定期間に対するデータ解析を実施し、一覧表形式で結
果を表示する(S4)。次に、ユーザの選択モードに入
る(S5)。この選択モードにおいて、ユーザは、画面
上に表示されているメール一覧表から、読みたい情報も
しくは終了をインデック番号やマウスにより選択する。
終了以外のインデックス番号が入力された場合は、ステ
ップ6に移行し、インデックスの示すメールデータの本
文を画面に表示する。ユーザがメールデータの本文を読
み終わった場合は、ステップ3に戻り、他のメールデー
タ本文の参照等を行う。ステップ5において終了が選択
された場合は、このメール表示モジュールが終了する。
In FIG. 2, first, an inquiry is made as to whether mail data has arrived via the communication device 1 (S
1). If it is determined that the mail has arrived, the received mail data is stored in the secondary storage device 6 (S2). If it is determined that it has not arrived, the process proceeds to step 3. In step 3, the mail data currently stored in the internal memory (not shown) of the secondary storage device 6 is read into the main storage device 5.
Email data includes email content, email title,
Includes the sender's email address, sending time, etc. The mail data read into the main storage device 5 is displayed in a list format (S3). This list does not display the text (mail document) of the mail data, but displays the sender, transmission time, and title. Next, the data analysis module 10 performs data analysis for the designated period of the user from the accumulated past mail list, and displays the result in a list format (S4). Next, it enters the user selection mode (S5). In this selection mode, the user selects the information to be read or the end from the mail list displayed on the screen using the index number or the mouse.
If an index number other than the end is input, the process proceeds to step 6, where the text of the mail data indicated by the index is displayed on the screen. When the user has finished reading the body of the mail data, the process returns to step 3 to refer to another body of the mail data. If the end is selected in step 5, the mail display module ends.

【0047】図3に、図2のステップ4のデータ解析処
理を示す。図3の処理は、過去に蓄積されたメールリス
トの内容から重要なトピックキーワードを抽出し、ユー
ザが効率的にメールリストのチェックを行える機能を実
現するためのものである。
FIG. 3 shows the data analysis processing in step 4 of FIG. The process of FIG. 3 is for realizing a function of extracting important topic keywords from the contents of the mail list accumulated in the past and enabling the user to efficiently check the mail list.

【0048】図3において先ず、形態素解析モジュール
11は、二次記憶装置5内のメモリ(内蔵メモリ、図示
せず)に蓄積された全てのメール文書に対して形態素解
析を実行する(S21)。形態素解析は、(表1)に示
すようなメール文書を単語毎に分解し、(表2)に示す
ように単語の品詞の認定を行うものである。
In FIG. 3, first, the morphological analysis module 11 performs a morphological analysis on all mail documents stored in a memory (built-in memory, not shown) in the secondary storage device 5 (S21). In the morphological analysis, a mail document as shown in (Table 1) is decomposed for each word, and the part of speech of the word is recognized as shown in (Table 2).

【0049】[0049]

【表1】 [Table 1]

【0050】[0050]

【表2】 [Table 2]

【0051】ここでは、名詞のみを抽出し、後に説明す
るトピックキーワードの候補とする。この形態素解析実
行後、ヒストグラム生成モジュール12は、ヒストグラ
ム解析を実行する(S22)。ヒストグラム解析は、形
態素解析の結果抽出された名詞単語に対して出現回数を
カウントアップするもので、これにより、蓄積されたメ
ール文書の中でどの名詞単語が多く頻出するかを分析す
ることができる。次に、トピックキーワード候補生成処
理に移り、トピックキーワード判定モジュール13は、
ヒストグラム解析の結果、上位5%の単語をトピックキ
ーワードの候補とする(S23)。次に、トピックキー
ワード判定モジュール13は時系列ヒストグラム生成に
移る(S24)。ここでは、ユーザの指定した期間内の
メール文書を時系列で10分割し、トピックキーワード
毎に再度ヒストグラムを生成する。その後、トピックキ
ーワード判定モジュール13はトピックキーワードファ
ジー推論を実行し、トピックキーワード毎にヒストグラ
ム頻出傾向を分析し、トピックキーワードとしての適性
値を決定する(S25)。ステップ25でトピックキー
ワードの適性値の上位10個をトピックキーワードとし
て確定し、ステップ26において、クラスタリングモジ
ュール15は、クラスタリングロジックを用いて、トピ
ックキーワードの出現回数を特徴量とし、全蓄積メール
を分類する。この分類結果をもとに、ユーザに対して出
力装置を介して結果表示を行う(S27)。なお、トピ
ックキーワード表示モジュール14はトピックキーワー
ドをヒストグラム等で表示するものである。
Here, only the nouns are extracted and set as candidates for topic keywords described later. After performing the morphological analysis, the histogram generation module 12 performs a histogram analysis (S22). The histogram analysis counts up the number of appearances of the noun words extracted as a result of the morphological analysis, so that it is possible to analyze which noun words appear frequently in the accumulated mail document. . Next, the process proceeds to a topic keyword candidate generation process.
As a result of the histogram analysis, the top 5% words are set as topic keyword candidates (S23). Next, the topic keyword determination module 13 shifts to time series histogram generation (S24). Here, the mail document within the period designated by the user is divided into ten in time series, and a histogram is generated again for each topic keyword. Thereafter, the topic keyword determination module 13 executes a topic keyword fuzzy inference, analyzes a histogram frequent tendency for each topic keyword, and determines an appropriate value as a topic keyword (S25). In step 25, the top 10 keywords having the appropriate values of the topic keywords are determined as topic keywords. In step 26, the clustering module 15 classifies all stored mails using the number of appearances of the topic keywords as a feature amount using clustering logic. . Based on this classification result, the result is displayed to the user via the output device (S27). The topic keyword display module 14 displays topic keywords in a histogram or the like.

【0052】次に、ステップ22およびステップ24で
実行するヒストグラム処理について図4を用いて説明す
る。
Next, the histogram processing executed in steps 22 and 24 will be described with reference to FIG.

【0053】図4において先ず、形態素解析結果の名詞
単語リストを先頭から一つずつ読み込む(S31)。次
に、リストが終端でないと判定した場合(S32)はス
テップ33に移り、既に存在する単語であれば、その単
語のカウンタをインクリメントし(S34)、新規の単
語であれば、新たに単語のフィールドを設けカウント1
をセットする(S35)。この操作を順に繰り返し、ス
テップ32においてリストの終端まできたら、ヒストグ
ラムテーブルをカウントの高い順に並べ替え(S3
6)、この処理を終了する。
In FIG. 4, first, a noun word list as a result of morphological analysis is read one by one from the beginning (S31). Next, when it is determined that the list is not at the end (S32), the process proceeds to step 33, where if the word already exists, the counter of the word is incremented (S34). Set up field and count 1
Is set (S35). This operation is repeated in order, and when the list reaches the end in step 32, the histogram table is rearranged in descending order of count (S3
6), this process ends.

【0054】(表3)に、ヒストグラム処理の結果得ら
れたトピックキーワード候補リストのサンプルを示す。
Table 3 shows a sample topic keyword candidate list obtained as a result of the histogram processing.

【0055】[0055]

【表3】 [Table 3]

【0056】(表3)において、上から頻出度の高い順
番に配置され、キーワードとヒストグラムのカウントが
保持される。また図5に、ステップ24の時系列による
ヒストグラム解析を行った結果の例をしめす。時系列
は、指定期間を一律に10分割するもので、夫々の分割
区間での単語の頻出回数が図5のグラフの縦軸の値とし
て示される。
In (Table 3), keywords and histogram counts are stored in descending order of frequency from the top. FIG. 5 shows an example of the result of the histogram analysis based on the time series in step S24. The time series uniformly divides the designated period into ten, and the frequency of occurrence of words in each divided section is shown as a value on the vertical axis of the graph of FIG.

【0057】次に、ステップ25のトピックキーワード
ファジー推論の処理について図6、図7を用いて説明す
る。このファジー推論は、IF−THEN形式で記述さ
れたルールをもとにトピックキーワードの適性を判定す
るためのものである。ステップ24までに得られた情報
は、トピックキーワード候補の時系列毎の頻出パターン
であり、これらは、全単語に占める重みと、ユーザの指
定期間によって微妙に判定が異なる。この微妙な判定を
ファジー推論を使って制御することで従来の1,0の判
定では困難であった制御が可能となる。
Next, the topic keyword fuzzy inference process in step 25 will be described with reference to FIGS. This fuzzy inference is for determining the suitability of a topic keyword based on rules described in IF-THEN format. The information obtained up to step 24 is a frequent pattern of topic keyword candidates in each time series, and the judgment is slightly different depending on the weight of all words and the period designated by the user. By controlling this delicate determination using fuzzy inference, it becomes possible to perform control that was difficult with the conventional determination of 1,0.

【0058】先ず、トピックキーワードを図6に示すよ
うに5種類のパターンに分類する。分類Iは、前半ピー
ク型、分類IIは中盤ピーク型、分類IIIは後半ピー
ク型、分類IVは、複数ピーク型、分類Vは、それ以外
のタイプである。図5に示した時系列ヒストグラムがこ
れらの分類パターンの何れに近いかを、0,1の値では
なく、後に説明するファジー数によって表現し、ルール
に記述する。
First, topic keywords are classified into five types of patterns as shown in FIG. Class I is the first half peak type, Class II is the middle peak type, Class III is the second peak type, Class IV is the multiple peak type, and Class V is the other type. Which of the classification patterns the time series histogram shown in FIG. 5 is closer to is represented not by the values of 0 and 1 but by a fuzzy number described later and described in a rule.

【0059】(表4)に、トピックキーワード判定のた
めのファジールールの例を示す。
Table 4 shows examples of fuzzy rules for determining topic keywords.

【0060】[0060]

【表4】 [Table 4]

【0061】(表4)の例は、IFの条件部分に、分類
パターンへの適合度、出現頻度、指定期間といった条件
がファジー数で与えられた変数によって記述され、TH
EN部分には、トレンドキーワードとしての適性値を算
出するための適合がファジー数として表現される。演算
は、MAX−MIN演算法を用いる。
In the example of (Table 4), the conditions such as the degree of conformity to the classification pattern, the appearance frequency, and the designated period are described in the condition part of the IF by a variable given by a fuzzy number.
In the EN part, the adaptation for calculating the appropriateness value as the trend keyword is expressed as a fuzzy number. The calculation uses the MAX-MIN calculation method.

【0062】次に、図7のトピックキーワード判定のた
めのファジーメンバーシップ関数を用いてファジー数の
定量化方法について説明する。図10は、VT(Ver
yTrue(1))、RT(Rather True
(2))、PT(Prob−ably True
(3))、VF(Very False(4))、RT
(Rather False(5))、PT(Prob
ably False(6))、UN(Unknown
(7))の7種類のファジー数を示している。ファジー
数は、メンバーシップ関数と呼ばれる関数で与えられ、
図7中のグラフの(1)〜(7)で示される。これらを
定量化するためには、αカットと呼ばれるレベル値が使
用され、図中の例では、αを0.75に設定することに
より、VF=[0、0.1]、VT=[0.9,1.
0]といった区間定量値を得ることができる。
Next, a method for quantifying the number of fuzzies using the fuzzy membership function for topic keyword determination in FIG. 7 will be described. FIG. 10 shows a VT (Ver
yTrue (1)), RT (Rather True
(2)), PT (Prob-ally True
(3)), VF (Very False (4)), RT
(Rather False (5)), PT (Prob
ably False (6)), UN (Unknown
(7)) shows seven types of fuzzy numbers. The fuzzy number is given by a function called the membership function,
These are indicated by (1) to (7) in the graph in FIG. In order to quantify these, a level value called α cut is used. In the example in the figure, by setting α to 0.75, VF = [0, 0.1] and VT = [0 .9,1.
0] can be obtained.

【0063】以上よりステップ25でトピックキーワー
ドの判定結果が得られ、適性値が上位10個をトピック
キーワードと認定し、ステップ26のクラスタリング、
ステップ27の結果表示を経てユーザに解析結果を知ら
せる。
As described above, the result of the topic keyword determination is obtained in step 25, and the top 10 keywords having the highest suitability values are identified as topic keywords.
After the result display in step 27, the user is notified of the analysis result.

【0064】図8はトピックキーワードの表示例を示す
表示図である。この表示例では、解析を行ったメール文
書の対象期間を表示し、トピックキーワードとその適性
値を重要度として表示し、クラスタリングの結果、所属
する分類への帰属度の高いものを最前面にしてニュース
IDのアイコンを表示する。
FIG. 8 is a display diagram showing a display example of a topic keyword. In this display example, the target period of the analyzed mail document is displayed, the topic keyword and its suitability value are displayed as importance, and as a result of clustering, the one with the highest degree of belonging to the classification to which it belongs is brought to the front. A news ID icon is displayed.

【0065】図9は記事分類説明図である。各記事1・
・・nに含まれるキーワードの適合度を特徴量として、
ファジークラスタリングを実行する。その結果、各分類
(クラスタ)と各々の記事の分類への帰属度とを求める
ことができる。
FIG. 9 is an explanatory diagram of article classification. Each article 1
..The relevance of the keywords contained in n
Perform fuzzy clustering. As a result, each class (cluster) and the degree of belonging of each article to the class can be obtained.

【0066】図10はファジークラスタリングの処理フ
ローを示すフローチャートである。図10において先
ず、キーワード集合を決定し、この時のキーワード数を
n個、また其々のキーワードをX={x1,x2,x
3,…,xn}とする(S41)。次に、分類数kを適
当に与え、初期化のエネルギー関数の値U(0)の値を
与える(S42)。そして、初期分類Uの平均ベクトル
Vを求め、U(0)をU(1)に変更する(S43)。
収束値εを設定し、A=|U(k+1)−U(k+2)
|を計算する(S44)。この値が|U(k+1)−U
(k+2)|≦εを満たすか否かを判定し(S45)、
満たさないと判定した場合はステップ42に戻り、この
処理を繰り返す。また、|U(k+1)−U(k+2)
|≦εを満たすと判定した場合は終了となる。終了時点
のkの値が最終的な分類数となり、平均ベクトルVが分
類の中心となる。また、行列ベクトルUnk各値が、其
々の記事の分類への帰属度となる。
FIG. 10 is a flowchart showing the processing flow of fuzzy clustering. In FIG. 10, first, a keyword set is determined, the number of keywords at this time is set to n, and each keyword is expressed as X = {x1, x2, x
3,..., Xn} (S41). Next, the number of classifications k is given appropriately, and the value of the energy function value U (0) for initialization is given (S42). Then, the average vector V of the initial classification U is obtained, and U (0) is changed to U (1) (S43).
A convergence value ε is set, and A = | U (k + 1) −U (k + 2)
Is calculated (S44). This value is | U (k + 1) -U
It is determined whether (k + 2) | ≦ ε is satisfied (S45),
If it is determined that the condition is not satisfied, the process returns to step 42, and this process is repeated. Also, | U (k + 1) -U (k + 2)
If it is determined that | ≦ ε is satisfied, the process ends. The value of k at the end time is the final number of classifications, and the average vector V is the center of the classification. In addition, each value of the matrix vector Unk is a degree of belonging to the classification of each article.

【0067】図11はクラスタリング後の表示例を示す
表示図である。表示画面には、分類毎に分類中心的特徴
量であるキーワードが表示され、分類に属する記事の集
合がリストとして帰属度の高い順に表示される。記事の
参照は、マウスなどのポインティングデバイスで記事を
選択することによって、各々の記事を参照できる。
FIG. 11 is a display diagram showing a display example after clustering. On the display screen, a keyword that is a classification central feature amount is displayed for each classification, and a set of articles belonging to the classification is displayed as a list in descending order of the degree of belonging. Articles can be referred to by selecting each article with a pointing device such as a mouse.

【0068】以上のように本実施の形態によれば、蓄積
された電子情報としてのメール文書に対して形態素解析
を行う形態素解析モジュール11と、形態素解析の結果
に対してヒストグラム解析を行うヒストグラム生成モジ
ュール12と、ヒストグラム解析の結果に基づいてトピ
ックキーワード候補を生成し、トピックキーワード候補
に対して時系列ヒストグラムを生成し、トピックキーワ
ードファジー推論を実行してトピックキーワードを確定
するトピックキーワード判定モジュール13と、確定し
たトピックキーワードに基づいて全蓄積メール文書を分
類するクラスタリングモジュール15と、クラスタリン
グモジュールでの分類結果を表示する分類結果表示モジ
ュール16とを備えたことにより、確定したトピックキ
ーワードに基づいて全蓄積メール文書を分類して分類結
果を表示することができるので、ユーザは、トピック情
報を容易に知ることができ、効果的かつ効率的に有益な
トピック情報を得ることができる。
As described above, according to the present embodiment, the morphological analysis module 11 that performs morphological analysis on the mail document as the stored electronic information, and the histogram generation that performs histogram analysis on the result of the morphological analysis A module 12 for generating a topic keyword candidate based on the result of the histogram analysis, generating a time-series histogram for the topic keyword candidate, and executing a topic keyword fuzzy inference to determine a topic keyword; A clustering module 15 for classifying all stored mail documents based on the determined topic keyword, and a classification result display module 16 for displaying the classification result in the clustering module. It is possible to display the classification result to classify all the stored mail document, the user can know the topic information easier, it is possible to obtain effective and efficient beneficial topical information.

【0069】[0069]

【発明の効果】以上のように本発明の請求項1に記載の
電子情報受信装置によれば、要求された情報を処理する
中央処理装置と、外部コンピュータとの通信を行う通信
装置と、ウィンドウ、図形要素、文字などを表示する表
示装置と、文字、数値、位置などデータを入力するキー
ボード、タブレット、マウス等の入力装置と、オペレー
ティングシステム、ウィンドウシステムなど実行中のプ
ログラムを記憶するための主記憶装置と、プログラム、
テキストデータ等を記憶するための二次記憶装置とを有
する電子情報受信装置であって、二次記憶装置は、電子
メールや電子ニュースによって配信され、内蔵メモリに
蓄積された電子情報に対して自動的に統計解析を行って
分野毎のトピック情報を自動的に生成するデータ解析モ
ジュールを有することにより、分野毎のトピック情報が
自動的に生成されるので、トピック情報を自動的に確定
することができるという有利な効果が得られる。
As described above, according to the electronic information receiving apparatus of the first aspect of the present invention, a central processing unit for processing requested information, a communication apparatus for communicating with an external computer, a window, A display device for displaying graphics, graphic elements, characters, etc., a keyboard, tablet, mouse, etc. for inputting data such as characters, numerical values, positions, etc., and a main unit for storing running programs, such as an operating system and a window system. A storage device, a program,
An electronic information receiving device having a secondary storage device for storing text data and the like, wherein the secondary storage device automatically distributes electronic information distributed by electronic mail or electronic news and stored in a built-in memory. By having a data analysis module that automatically performs statistical analysis and automatically generates topic information for each field, topic information for each field is automatically generated, so that topic information can be automatically determined. The advantageous effect that it can be obtained is obtained.

【0070】請求項2に記載の電子情報受信装置によれ
ば、請求項1に記載の電子情報受信装置において、デー
タ解析モジュールは、蓄積された電子情報としてのメー
ル文書に対して形態素解析を行う形態素解析モジュール
と、形態素解析モジュールでの形態素解析の結果に対し
てヒストグラム解析を行うヒストグラム生成モジュール
と、ヒストグラム生成モジュールでのヒストグラム解析
の結果に基づいてトピックキーワード候補を生成し、ト
ピックキーワード候補に対して時系列ヒストグラムを生
成し、トピックキーワードファジー推論を実行してトピ
ックキーワードを確定するトピックキーワード判定モジ
ュールと、トピックキーワード判定モジュールでの確定
したトピックキーワードに基づいて全蓄積メール文書を
分類するクラスタリングモジュールと、クラスタリング
モジュールでの分類結果を表示する分類結果表示モジュ
ールとを有することにより、確定したトピックキーワー
ドに基づいて全蓄積メール文書を分類して分類結果を表
示することができるので、ユーザは、トピック情報を容
易に知ることができ、効果的かつ効率的に有益なトピッ
ク情報を得ることができるという有利な効果が得られ
る。
According to the electronic information receiving apparatus of the second aspect, in the electronic information receiving apparatus of the first aspect, the data analysis module performs a morphological analysis on the mail document as the stored electronic information. A morphological analysis module, a histogram generation module that performs a histogram analysis on the result of the morphological analysis in the morphological analysis module, and a topic keyword candidate based on the result of the histogram analysis in the histogram generation module. Topic keyword determination module that generates a time series histogram and performs topic keyword fuzzy inference to determine topic keywords, and a cluster that classifies all stored mail documents based on the topic keywords determined by the topic keyword determination module And a classification result display module that displays the classification result in the clustering module, the classification result can be displayed by classifying all the stored mail documents based on the determined topic keyword. And the topic information can be easily known, and useful topic information can be obtained effectively and efficiently.

【0071】請求項3に記載の電子情報処理方法によれ
ば、要求された情報を処理する中央処理装置と、外部コ
ンピュータとの通信を行う通信装置と、ウィンドウ、図
形要素、文字などを表示する表示装置と、文字、数値、
位置などデータを入力するキーボード、タブレット、マ
ウス等の入力装置と、オペレーティングシステム、ウィ
ンドウシステムなど実行中のプログラムを記憶するため
の主記憶装置と、プログラム、テキストデータ等を記憶
するための二次記憶装置とを有する電子情報受信装置に
おける電子情報処理方法であって、電子メールや電子ニ
ュースによって配信され、内蔵メモリに蓄積された電子
情報に対して自動的に統計解析を行って分野毎のトピッ
ク情報を自動的に生成するデータ解析ステップを有する
ことにより、分野毎のトピック情報が自動的に生成され
るので、トピック情報を自動的に確定することができる
という有利な効果が得られる。
According to the electronic information processing method of the present invention, a central processing unit for processing requested information, a communication device for communicating with an external computer, and windows, graphic elements, characters, and the like are displayed. Display device, characters, numbers,
Input devices such as a keyboard, tablet, and mouse for inputting data such as positions, a main storage device for storing running programs such as an operating system and a window system, and a secondary storage for storing programs, text data, and the like. An electronic information processing method in an electronic information receiving apparatus having a device, wherein statistical information is automatically analyzed for electronic information distributed by electronic mail or electronic news and stored in a built-in memory, and topic information for each field is provided. Is automatically generated, the topic information for each field is automatically generated, so that an advantageous effect that the topic information can be automatically determined is obtained.

【0072】請求項4に記載の電子情報処理方法によれ
ば、請求項3に記載の電子情報処理方法において、デー
タ解析ステップは、蓄積された電子情報としてのメール
文書に対して形態素解析を行う形態素解析ステップと、
形態素解析ステップでの形態素解析の結果に対してヒス
トグラム解析を行うヒストグラム生成ステップと、ヒス
トグラム生成ステップでのヒストグラム解析の結果に基
づいてトピックキーワード候補を生成し、トピックキー
ワード候補に対して時系列ヒストグラムを生成し、トピ
ックキーワードファジー推論を実行してトピックキーワ
ードを確定するトピックキーワード判定ステップと、ト
ピックキーワード判定ステップでの確定したトピックキ
ーワードに基づいて全蓄積メール文書を分類するクラス
タリングステップと、クラスタリングステップでの分類
結果を表示する分類結果表示ステップとを有することに
より、確定したトピックキーワードに基づいて全蓄積メ
ール文書を分類して分類結果を表示することができるの
で、ユーザは、トピック情報を容易に知ることができ、
効果的かつ効率的に有益なトピック情報を得ることがで
きるという有利な効果が得られる。
According to the electronic information processing method of the fourth aspect, in the electronic information processing method of the third aspect, the data analysis step performs a morphological analysis on the mail document as the stored electronic information. A morphological analysis step;
A histogram generation step of performing a histogram analysis on the result of the morphological analysis in the morphological analysis step, and generating a topic keyword candidate based on the result of the histogram analysis in the histogram generation step, and generating a time-series histogram for the topic keyword candidate A topic keyword determining step of generating and executing a topic keyword fuzzy inference to determine a topic keyword; a clustering step of classifying all stored mail documents based on the topic keyword determined in the topic keyword determining step; and a clustering step. By having the classification result display step of displaying the classification result, all the stored mail documents can be classified based on the determined topic keywords and the classification result can be displayed. The click information can be easily known,
The advantageous effect that useful topic information can be obtained effectively and efficiently is obtained.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態1による電子情報受信装置
を示すブロック図
FIG. 1 is a block diagram showing an electronic information receiving apparatus according to a first embodiment of the present invention.

【図2】図1の電子情報受信装置のメール表示モジュー
ルおよびデータ解析モジュールの動作を示すフローチャ
ート
FIG. 2 is a flowchart showing operations of a mail display module and a data analysis module of the electronic information receiving device of FIG.

【図3】データ解析モジュールの動作を示すフローチャ
ート
FIG. 3 is a flowchart showing the operation of the data analysis module;

【図4】ヒストグラム作成のフローチャートFIG. 4 is a flowchart for creating a histogram.

【図5】トピックキーワードの時系列分析の説明図FIG. 5 is an explanatory diagram of a time series analysis of topic keywords.

【図6】(a)トピックキーワード分類説明図 (b)トピックキーワード分類説明図 (c)トピックキーワード分類説明図 (d)トピックキーワード分類説明図 (e)トピックキーワード分類説明図FIG. 6 (a) Illustration of topic keyword classification (b) Illustration of topic keyword classification (c) Illustration of topic keyword classification (d) Illustration of topic keyword classification (e)

【図7】トピックキーワード判定のためのファジーメン
バーシップ関数を示す関数図
FIG. 7 is a function diagram showing a fuzzy membership function for topic keyword determination.

【図8】トピックキーワードの表示例を示す表示図FIG. 8 is a display diagram showing a display example of a topic keyword.

【図9】記事分類説明図FIG. 9 is an explanatory diagram of article classification.

【図10】ファジークラスタリングの処理フローを示す
フローチャート
FIG. 10 is a flowchart showing a processing flow of fuzzy clustering.

【図11】クラスタリング後の表示例を示す表示図FIG. 11 is a display diagram showing a display example after clustering.

【図12】従来の電子情報受信装置を示すブロック図FIG. 12 is a block diagram showing a conventional electronic information receiving apparatus.

【図13】図12の電子情報受信装置のメール表示モジ
ュールによる処理を示すフローチャート
FIG. 13 is a flowchart showing processing by the mail display module of the electronic information receiving device in FIG. 12;

【符号の説明】[Explanation of symbols]

1 通信装置 2 入力装置 3 表示装置 4 中央処理装置(CPU) 5 主記憶装置 6 二次記憶装置 7 メール表示モジュール 8 メール送信モジュール 9 文書編集モジュール 10 データ解析モジュール 11 形態素解析モジュール 12 ヒストグラム生成モジュール 13 トピックキーワード判定モジュール 14 トピックキーワード表示モジュール 15 クラスタリングモジュール 16 分類結果表示モジュール Reference Signs List 1 communication device 2 input device 3 display device 4 central processing unit (CPU) 5 main storage device 6 secondary storage device 7 mail display module 8 mail transmission module 9 document editing module 10 data analysis module 11 morphological analysis module 12 histogram generation module 13 Topic keyword judgment module 14 Topic keyword display module 15 Clustering module 16 Classification result display module

フロントページの続き Fターム(参考) 5B075 NK32 NR12 PP02 PP03 PQ02 UU24 5B089 GA21 JA31 KA04 KC32 KC59 LB14 5K030 GA17 HA06 HB00 HB19 KA01 KA02 LE16 9A001 BB02 BB03 BB04 CC02 FF01 FF03 FF07 GG05 HH03 HH33 JJ14 JJ15 JJ73 KK37 KK56Continued on the front page F-term (reference) 5B075 NK32 NR12 PP02 PP03 PQ02 UU24 5B089 GA21 JA31 KA04 KC32 KC59 LB14 5K030 GA17 HA06 HB00 HB19 KA01 KA02 LE16 9A001 BB02 BB03 BB04 CC02 FF01 FF03 JJ03 KK03 JJ FF03 GG07

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】要求された情報を処理する中央処理装置
と、外部コンピュータとの通信を行う通信装置と、ウィ
ンドウ、図形要素、文字などを表示する表示装置と、文
字、数値、位置などデータを入力するキーボード、タブ
レット、マウス等の入力装置と、オペレーティングシス
テム、ウィンドウシステムなど実行中のプログラムを記
憶するための主記憶装置と、プログラム、テキストデー
タ等を記憶するための二次記憶装置とを有する電子情報
受信装置であって、前記二次記憶装置は、電子メールや
電子ニュースによって配信され、内蔵メモリに蓄積され
た電子情報に対して自動的に統計解析を行って分野毎の
トピック情報を自動的に生成するデータ解析モジュール
を有することを特徴とする電子情報受信装置。
1. A central processing unit for processing requested information, a communication device for communicating with an external computer, a display device for displaying windows, graphic elements, characters, etc., and data for characters, numerical values, positions, etc. It has an input device such as a keyboard, tablet, and mouse for input, a main storage device for storing a running program such as an operating system and a window system, and a secondary storage device for storing a program, text data, and the like. An electronic information receiving device, wherein the secondary storage device automatically performs statistical analysis on electronic information distributed by electronic mail or electronic news and stored in a built-in memory to automatically obtain topic information for each field. An electronic information receiving apparatus, comprising: a data analysis module that generates the data.
【請求項2】前記データ解析モジュールは、蓄積された
電子情報としてのメール文書に対して形態素解析を行う
形態素解析モジュールと、前記形態素解析モジュールで
の形態素解析の結果に対してヒストグラム解析を行うヒ
ストグラム生成モジュールと、前記ヒストグラム生成モ
ジュールでのヒストグラム解析の結果に基づいてトピッ
クキーワード候補を生成し、前記トピックキーワード候
補に対して時系列ヒストグラムを生成し、トピックキー
ワードファジー推論を実行してトピックキーワードを確
定するトピックキーワード判定モジュールと、前記トピ
ックキーワード判定モジュールでの確定したトピックキ
ーワードに基づいて全蓄積メール文書を分類するクラス
タリングモジュールと、前記クラスタリングモジュール
での分類結果を表示する分類結果表示モジュールとを有
することを特徴とする請求項1に記載の電子情報受信装
置。
2. The data analysis module according to claim 1, further comprising: a morphological analysis module configured to perform a morphological analysis on the mail document as stored electronic information; and a histogram configured to perform a histogram analysis on a result of the morphological analysis performed by the morphological analysis module. A generating module, generating topic keyword candidates based on the result of the histogram analysis in the histogram generating module, generating a time-series histogram for the topic keyword candidates, executing topic keyword fuzzy inference to determine topic keywords A topic keyword determination module, a clustering module for classifying all stored mail documents based on the topic keywords determined by the topic keyword determination module, and a classification result by the clustering module. Electronic information receiving apparatus according to claim 1, characterized in that it comprises a classification result display module.
【請求項3】要求された情報を処理する中央処理装置
と、外部コンピュータとの通信を行う通信装置と、ウィ
ンドウ、図形要素、文字などを表示する表示装置と、文
字、数値、位置などデータを入力するキーボード、タブ
レット、マウス等の入力装置と、オペレーティングシス
テム、ウィンドウシステムなど実行中のプログラムを記
憶するための主記憶装置と、プログラム、テキストデー
タ等を記憶するための二次記憶装置とを有する電子情報
受信装置における電子情報処理方法であって、電子メー
ルや電子ニュースによって配信され、内蔵メモリに蓄積
された電子情報に対して自動的に統計解析を行って分野
毎のトピック情報を自動的に生成するデータ解析ステッ
プを有することを特徴とする電子情報処理方法。
3. A central processing unit for processing requested information, a communication device for communicating with an external computer, a display device for displaying windows, graphic elements, characters, etc., and data for characters, numerical values, positions, etc. It has an input device such as a keyboard, tablet, and mouse for input, a main storage device for storing a running program such as an operating system and a window system, and a secondary storage device for storing a program, text data, and the like. An electronic information processing method in an electronic information receiving apparatus, wherein statistical analysis is automatically performed on electronic information distributed by electronic mail or electronic news and stored in a built-in memory to automatically obtain topic information for each field. An electronic information processing method having a data analysis step of generating.
【請求項4】前記データ解析ステップは、蓄積された電
子情報としてのメール文書に対して形態素解析を行う形
態素解析ステップと、前記形態素解析ステップでの形態
素解析の結果に対してヒストグラム解析を行うヒストグ
ラム生成ステップと、前記ヒストグラム生成ステップで
のヒストグラム解析の結果に基づいてトピックキーワー
ド候補を生成し、前記トピックキーワード候補に対して
時系列ヒストグラムを生成し、トピックキーワードファ
ジー推論を実行してトピックキーワードを確定するトピ
ックキーワード判定ステップと、前記トピックキーワー
ド判定ステップでの確定したトピックキーワードに基づ
いて全蓄積メール文書を分類するクラスタリングステッ
プと、前記クラスタリングステップでの分類結果を表示
する分類結果表示ステップとを有することを特徴とする
請求項3に記載の電子情報処理方法。
4. The data analyzing step includes a morphological analysis step of performing a morphological analysis on the mail document as accumulated electronic information, and a histogram performing a histogram analysis on a result of the morphological analysis in the morphological analyzing step. Generating a topic keyword candidate based on the result of the histogram analysis in the generating step and the histogram generating step, generating a time-series histogram for the topic keyword candidate, and executing topic keyword fuzzy inference to determine the topic keyword Topic keyword determination step, a clustering step of classifying all stored mail documents based on the topic keyword determined in the topic keyword determination step, and a classification result display for displaying a classification result in the clustering step Electronic information processing method according to claim 3, characterized in that it comprises a step.
JP13974999A 1999-05-20 1999-05-20 Electronic information reception equipment and electronic information processing method Pending JP2000331018A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13974999A JP2000331018A (en) 1999-05-20 1999-05-20 Electronic information reception equipment and electronic information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13974999A JP2000331018A (en) 1999-05-20 1999-05-20 Electronic information reception equipment and electronic information processing method

Publications (1)

Publication Number Publication Date
JP2000331018A true JP2000331018A (en) 2000-11-30

Family

ID=15252501

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13974999A Pending JP2000331018A (en) 1999-05-20 1999-05-20 Electronic information reception equipment and electronic information processing method

Country Status (1)

Country Link
JP (1) JP2000331018A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312513A (en) * 2000-02-21 2001-11-09 Sony Corp Information processing system, information processing method, and program housing medium
JP2004318408A (en) * 2003-04-15 2004-11-11 Tokyo Electric Power Co Inc:The Apparatus and program for analyzing gist of text
JP2007188240A (en) * 2006-01-12 2007-07-26 Yafoo Japan Corp Warning device of e-mail, mail server, and warning method of e-mail
JP2009157450A (en) * 2007-12-25 2009-07-16 Nec Corp Mail sorting system, mail retrieving system, and mail destination sorting system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312513A (en) * 2000-02-21 2001-11-09 Sony Corp Information processing system, information processing method, and program housing medium
JP4605415B2 (en) * 2000-02-21 2011-01-05 ソニー株式会社 Information processing apparatus and method, and recording medium
JP2004318408A (en) * 2003-04-15 2004-11-11 Tokyo Electric Power Co Inc:The Apparatus and program for analyzing gist of text
JP2007188240A (en) * 2006-01-12 2007-07-26 Yafoo Japan Corp Warning device of e-mail, mail server, and warning method of e-mail
JP2009157450A (en) * 2007-12-25 2009-07-16 Nec Corp Mail sorting system, mail retrieving system, and mail destination sorting system

Similar Documents

Publication Publication Date Title
CN107967575B (en) Artificial intelligence platform system for artificial intelligence insurance consultation service
US7167866B2 (en) Selective multi level expansion of data base via pivot point data
Tong et al. Support vector machine active learning with applications to text classification
US8341158B2 (en) User&#39;s preference prediction from collective rating data
EP1678635B1 (en) Method and apparatus for automatic file clustering into a data-driven, user-specific taxonomy
US20030145009A1 (en) Method and system for measuring the quality of a hierarchy
Deng et al. An improved fuzzy clustering method for text mining
CN112085565B (en) Deep learning-based information recommendation method, device, equipment and storage medium
CN110516704B (en) MLKNN multi-label classification method based on association rule
CN111753087A (en) Public opinion text classification method and device, computer equipment and storage medium
CN112395421B (en) Course label generation method and device, computer equipment and medium
EP1240566B1 (en) Determining whether a variable is numeric or non-numeric
CN115481355A (en) Data modeling method based on category expansion
CN110222179B (en) Address book text classification method and device and electronic equipment
JP2000331018A (en) Electronic information reception equipment and electronic information processing method
CN109376230B (en) Crime prediction method, crime prediction system, storage medium, and server
CN111259442A (en) Differential privacy protection method for decision tree under MapReduce framework
CN113095073B (en) Corpus tag generation method and device, computer equipment and storage medium
Seyyedi et al. Enhancing effectiveness of dimension reduction in text classification
Ibitoye et al. Customer Churn Predictive Analytics using Relative Churn Fuzzy Feature-Weight Model in Telecoms
CN107391674B (en) New type mining method and device
CN110880013A (en) Text recognition method and device
Islam et al. Architecture of adaptive spam filtering based on machine learning algorithms
US7356604B1 (en) Method and apparatus for comparing scores in a vector space retrieval process
Islam et al. An architecture of active learning SVMs with relevance feedback for classifying E-mail

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060517

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090512

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090929