JPH1196178A - 情報抽出方法、情報抽出装置及び情報抽出プログラムを記録した記録媒体 - Google Patents

情報抽出方法、情報抽出装置及び情報抽出プログラムを記録した記録媒体

Info

Publication number
JPH1196178A
JPH1196178A JP9257383A JP25738397A JPH1196178A JP H1196178 A JPH1196178 A JP H1196178A JP 9257383 A JP9257383 A JP 9257383A JP 25738397 A JP25738397 A JP 25738397A JP H1196178 A JPH1196178 A JP H1196178A
Authority
JP
Japan
Prior art keywords
information
expression pattern
pattern
date
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9257383A
Other languages
English (en)
Other versions
JP3574551B2 (ja
Inventor
Takaaki Hasegawa
隆明 長谷川
Shinichiro Takagi
伸一郎 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP25738397A priority Critical patent/JP3574551B2/ja
Publication of JPH1196178A publication Critical patent/JPH1196178A/ja
Application granted granted Critical
Publication of JP3574551B2 publication Critical patent/JP3574551B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 多量の電子化文書から、様々な言語的表現パ
ターンやラベル表現パターンを用いて必要な情報を容易
に抽出する。 【解決手段】 日時表記パターン、日時表現パターン、
場所表現パターン、通知表現パターン、対象者表現パタ
ーン、ラベル表現パターン、委託表現パターン、期限表
現パターン、連絡先表現パターン、対象物表現パター
ン、手段表現パターンなどを格納するパターン格納手段
と、各パターンと入力文書とのパターンマッチングによ
りイベントに関するイベント名、開催日時、開催場所、
対象者の情報や、委託された行為の種別、期限、連絡先
などを抽出する抽出手段とを設ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータを用
いて、電子化された文書から必要な情報を自動抽出する
技術に関し、詳しくは、電子メールなどの各種の通知文
書から読み手にとって重要な情報を抽出する方法及びそ
の装置、さらには情報抽出プログラムを記録した記録媒
体に関するものである。
【0002】
【従来の技術】従来、コンピュータを用いて、文書中か
ら必要な情報を抽出する方法としては、形態素解析処理
によって文書を単語に分割し情報を抽出する方法や、視
覚的効果を持つ文書レイアウト情報を用いてパターンマ
ッチングを行い情報を抽出する方法などがある。
【0003】
【発明が解決しようとする課題】電子メールの文書など
は常に正しく文法通りに記述されるわけではないし、未
知語や略語なども多く含まれていることが多い。そのよ
うな文書を対象として形態素解析を用いても、うまく解
析処理ができない。また、膨大な数の辞書を逐一検索す
るため時間が掛かり、日々蓄積される大量の文書を一度
に短時間で処理するには限界がある。一方、視覚的効果
を持つ文書レイアウト情報を用いたパターンマッチング
では、レイアウト情報がある文書でなければ情報を抽出
することができないという制約がある。
【0004】本発明は、上記の点に鑑みなされたもの
で、その目的は、各種の通知文書などについて、通知さ
れた内容からイベントの開催日時や開催場所など、その
通知が含んでいる重要な情報であるイベント情報や受信
した人が委託される行為の種別や期限などの委託行為情
報を自動的に抽出することにある。
【0005】
【課題を解決するための手段】本発明の情報抽出方法
は、あらかじめ文書を記述する際に用いられる様々な言
語的表現パターンやラベル表現パターンを記憶手段に格
納しておき、入力された文書と前記言語的表現パターン
やラベル表現パターンとのパターンマッチングにより、
電子化された文書から読み手にとって必要とする情報を
自動的に抽出することを特徴とする。
【0006】また、本発明の情報抽出装置は、数字や記
号から構成された日付や時間を表す日時表記パターン、
日時に付加され日時を表現する日時表現パターン、場所
に付加され場所を表現する場所表現パターン、イベント
の通知の行為を表す通知表現パターン、イベント名を挙
げて通知表現を補助する補助表現パターン、イベント名
を修飾する修飾表現パターン、対象者を表す対象者表現
パターン、視覚的効果を持つラベルを表すラベル表現パ
ターン、相手に委託する行為を表す委託表現パターン、
相手に委託する行為の期限を表す期限表現パターン、相
手に委託する行為の期限の具体的な単語や日時を表す期
限表記パターン、相手に委託する行為の対象物を表す対
象物表現パターン、相手に委託する行為の手段を表す手
段表現パターン、相手に委託する行為の連絡先を表す連
絡先表現パターンなどを格納するパターン格納手段と、
該パターン格納手段の各パターンと入力された文書との
パターンマッチングにより、イベントに関するイベント
名を抽出するイベント名抽出手段、開催日時を抽出する
日時抽出手段、開催場所を抽出する場所抽出手段、対象
者を抽出する対象者抽出手段、視覚的効果を持つ任意の
ラベルを抽出するラベル抽出手段、イベントに関して委
託された行為の種別、期限、連絡先、対象物、手段を抽
出する委託行為抽出手段、及び、委託される行為の期限
情報と通知文書作成日時とを照合し、文書の緊急の度合
いを判断する緊急度判定手段などを備えることを特徴と
する。
【0007】さらに、本発明は、上記各手段の各処理プ
ロセスを上記各パターンとともに情報抽出プログラムと
して、あらかじめ記録したコンピュータ読み取り可能な
記録媒体を提供することを特徴とする。
【0008】例えば、会議の案内の通知を電子メールに
よって受信する場合について述べると、イベント名抽出
手段は通知文書から通知表現パターン、補助パターン、
修飾パターンを用いてイベント名を抽出し、日時抽出手
段は日時表記パターンと日時表現パターンを用いてイベ
ントの開催日時を抽出し、場所抽出手段は場所表現パタ
ーンを用いてイベントの開催場所を抽出し、対象者抽出
手段は対象者表現パターンを用いてイベントの対象者を
抽出する。ラベル抽出手段はラベル表現パターンを用い
ることによって任意のラベルの内容を抽出する。委託行
為抽出手段は委託表現パターン、期限表現パターン、連
絡先表現パターン、対象物表現パターン、手段表現パタ
ーンとを用いて受信した人が委託される行為の種別、期
限、連絡先、対象物、手段を抽出する。緊急度判定手段
は通知文書作成日時と委託された行為の期限とを照合す
ることによって緊急の度合いを判定する。
【0009】
【発明の実施の形態】以下、図面を用いて本発明の実施
形態を説明する。図1は本発明の一実施形態を示す全体
的構成図である。図において、処理装置10は所謂コン
ピュータ本体であり、記憶装置20は内蔵ハードディス
ク、外付けハードディスク、その他の記憶装置である。
ここで、処理装置10は、機能的に、全体を制御する制
御手段100、抽出手段120及び緊急度判定手段13
0に大別され、抽出手段120は、イベント名抽出手段
111、日時抽出手段112、場所抽出手段113、対
象者抽出手段114、ラベル抽出手段115、委託行為
抽出手段116で構成される。記憶装置20はパターン
格納手段200、テーブル格納手段220に分かれ、パ
ターン格納手段200には、日時表記パターン201、
日時表現パターン202、場所表現パターン203、通
知表現パターン204、対象者表現パターン205、ラ
ベル表現パターン206、委託表現パターン207、期
限表現パターン208、期限表記パターン209、連絡
先表現パターン210補助表現パターン211、修飾表
現パターン212、対象物表現パターン213及び手段
表現パターン214が格納され、テーブル格納手段22
0には期限変換テーブル221と緊急度算出テーブル2
22が格納される。
【0010】図2に、図1のパターン格納手段200の
各表記・表現パターンの具体例を示し、図3に、テーブ
ル格納手段220の各テーブルの具体例を示す。
【0011】図1の抽出手段110の各手段111〜1
16は、制御手段100の制御下で、電子化文書を入力
し、パターン格納手段200の各パターン201〜21
4とのパターンマッチングにより、イベント情報、委託
行為情報、ラベル情報を抽出し出力する。例えば、イベ
ント名抽出手段111、日時抽出手段112、場所抽出
手段103は、パターン格納手段200にある通知表現
パターン201、日時表記パターン202、日時表現パ
ターン203、場所表現パターン204、補助表現パタ
ーン205、修飾表現パターン206によってパターン
マッチングを行い、入力された電子化文書からイベント
の名称、開催日時、開催場所のイベント情報を抽出す
る。対象者抽出手段114は、対象者表現パターン20
7によってパターンマッチングを行い、イベントの対象
者を抽出する。ラベル抽出手段115は、ラベル表現パ
ターン208によってパターンマッチッチングを行い、
マッチしたキーワードの長さを記憶することによって、
任意のラベル情報を抽出する。委託行為抽出手段116
は、委託表現パターン209、期限表現パターン21
0、連絡先表現パターン211、対象物表現パターン2
13、手段表現パターン214によってパターンマッチ
ングを行い、通知を受けた人が委託される行為の種別、
期限、連絡先、対象物、手段の委託行為情報を抽出す
る。また、緊急度判定手段120は、期限変換テーブル
221、緊急度算出テーブル222を用い、抽出手段1
10により抽出された、委託された行為の期限情報と文
書作成日時を照合して、緊急度を判定し出力する。
【0012】図4は開催場所抽出の流れ図、図5はイベ
ント名抽出の流れ図である。図4と図5において、抽出
手段110は、制御手段100の制御下で、図2に示す
ような日時表記パターン、日時表現パターン、場所表現
パターン、通知表現パターン、補助表現パターン、修飾
表現パターンを使い、イベント名抽出手段111、日時
抽出手段112、場所抽出手段113によって、イベン
ト名、イベントの開催日時、開催場所を抽出する。即
ち、図4において、入力された電子化文書に通知表現パ
ターンがあれば、それを含む一文を切り出し、文頭から
通知表現パターンが見つかるまでパターンマッチッチン
グを行い、その文中に日時表記パターンがあるならば、
直後に日時表現パターンがあるかどうかを調べる。日時
表記パターンがなければ、イベント名抽出手段111を
実行する。日時表現パターンがあれば、それが開始時間
表現パターンであれば開始時間として、そうでなければ
終了時間として日時表記パターンから抽出する。次に場
所表現パターンがあるかどうかを調べ、あれば開催場所
として抽出する。図5に示すように、イベント名抽出手
段111は、補助表現パターンがあればそこまでを抽出
してこれを保持し、パターンマッチングを先に進め、修
飾表現パターンがあればさらに先に進め、これを通知表
現パターンにマッチするまで繰り返し、最終的に抽出さ
れた情報をイベント名とする。
【0013】図6は委託行為抽出の流れ図である。委託
行為抽出手段116は、文書に図2に示す委託表現パタ
ーン、期限表現パターン、連絡先表現パターン、対象物
表現パターン、手段表現パターンを使って、入力された
電子化文書から、受信した人が委託される行為の種別、
期限、連絡先、対象物、手段を抽出する。即ち、図6に
示すように、入力文書に委託表現があれば、委託表現を
含む文全体を切り出し、委託表現にマッチするまで文頭
からパターンマッチングを行い、期限表記バターンと期
限表現パターンがあれば期限情報を抽出する。連絡先表
現パターンがあれば、連絡先情報を抽出する。対象物表
現パターンがあれば、対象物情報を抽出する。手段表現
パターンがあれば、手段情報を抽出する。
【0014】図7は任意ラベル抽出の流れ図である。ラ
ベル抽出手段115は、図2に示すようなラベル表現パ
ターンを用いて、入力された電子化文書から任意のラベ
ルを抽出する。即ち、図7に示すように、日時キーワー
ドや場所キーワードにマッチする文字列があれば、それ
をラベルと見なし、文字列間にスペースの有無を調べ
る。スペースが含まれていれば、その文字列の長さを記
憶し、ラベル表現パターンがある限り、保持しているラ
ベルの長さとマッチする文字列をラベルとして抽出す
る。スペースが含まれていなければ、ラベル表現パター
ンがあるか調べ、あればラベルを抽出する。
【0015】図1の緊急度判定手段120は、文書に付
けられている日時情報と抽出手段110によって抽出さ
れた期限情報とを比較し差分を求める。そして、図3
(a)に示すような期限変換テーブルに基づき、明示さ
れた時刻以外の期限情報を時刻に変換し、図3(b)に
示すような緊急度算出テーブルに基づき、緊急度を算出
し出力する。
【0016】以下に、具体的処理例を示す。例えば、図
8に示すサンプル文書1では、「あります」という通知
表現にマッチするので、その一文を切り出し、文頭から
パターンマッチングを行い、「12月10日(火)1
5:00」の文字列が日時表記パターンとマッチするた
め、直後を調べ、「〜」が開始表現パターンにマッチ
し、「16:30」が日時表記パターンとマッチし、直
後の「に」が終了時間表現とマッチする。このため、こ
れらの文字列を開始時間と終了時間として抽出する。こ
の文字列の後に、「104C会議室で」において「で」
という場所表現パターンにマッチするので、「104C
会議室」を開催場所として抽出する。また、「ネットワ
ーク利用促進のために」が「に」という修飾表現パター
ンにマッチするため、パターンマッチングを先へ進め
る。「イントラネット講習会が」で「が」という補助表
現パターンにマッチするため、「イントラネット講習
会」を抽出し、パターンマッチングを先に進める。「あ
ります」は「あります」という通知表現にマッチするの
で、「イントラネット講習会」をイベント名として抽出
する。また、イベントの対象者は、「知技G各位」に
「各位」という対象者表現パターンがマッチするので、
対象者を「知技G」として抽出する。ラベル表現パター
ンが見つからないので、ラベル情報はなしである。
【0017】また、「受講実績と参加の可否(否の場合
は理由を添えて)を小原まで11/18日中にご回答く
ださい。」という部分が「回答」という委託表現パター
ンにマッチするので、この一文を切り出す。まず、「受
講実績と参加の可否(否の場合は理由を添えて)を」の
部分が「を」という対象物表現パターンにマッチするの
で、「受講実績と参加の可否(否の場合は理由を添え
て)」を委託行為の対象物として抽出する。次に「小原
まで」の部分が「まで」という連絡先表現パターンにマ
ッチするので、「小原」を委託行為の連絡先として抽出
する。最後に「11/18日中に」の部分が「中に」と
いう期限表現パターンにマッチするので、「11/18
日」を委託行為の期限として抽出する。
【0018】緊急度判定では、文書作成日時が11月1
4日13時53分で、抽出された委託行為の期限情報が
11月18日23時59分と変換され、両者の差分を取
り、4日と20時間6分から、緊急度は一週間以内の
0.4と算出される。
【0019】次に、図9のサンプル文書2を用いて、ラ
ベル情報の抽出について説明する。スペースを含むこと
を許した日時キーワードと場所キーワードでパターンマ
ッチングを行うと、「日時」と「場所」が抽出され、ラ
ベル表現パターンは「・」にマッチする。それぞれ「日
時」と「場 所」として表されており、キーワー
ドの文字数はいずれも全角文字4文字分である。ラベル
表現「・」と全角文字4文字分でパターンマッチを行
い、「会費」「交通手段」「集合場所」「経路」「その
他」という任意のラベルを抽出し、そのラベルに対応す
る情報を抽出する。
【0020】以上、本発明の一実施形態について説明し
たが、図1の抽出手段110の各手段111〜116及
び緊急度判定手段120はまとめて情報抽出プログラム
として実現される。さらに、この情報抽出プログラムに
は、図2に示すような各表記・表現パターン及び図3
(a)、(b)に示すような期限変換/緊急度算出テー
ブルを付加する。この各表記・表現パターン及び期限変
換/緊急度算出テーブルの付加された情報抽出プログラ
ムを、FD若しくはCD−ROM等の記録媒体にコンピ
ュータで読み取り可能な形式で記録する。この記録媒体
に記録された情報抽出プログラムをコンピュータにイン
ストールすることで、図1に示すような構成がコンピュ
ータ上に構築される。
【0021】
【発明の効果】以上のように、本発明によれば、計算機
の負荷を軽くして、より早く一度に、多量の電子化され
た文書から、重要な情報であるイベントの開催日時、開
催場所、イベント名、対象者等のイベント情報、文書作
成者が付けた任意のラベル情報、委託されている行為の
種別、期限、連絡先、対象物、手段等の委託された情
報、文書が持っている緊急性の一部又は全部を抽出する
ことが可能になる。
【図面の簡単な説明】
【図1】本発明の一実施形態を示す全体構成図である。
【図2】パターン格納手段の各表現パターンの一例であ
る。
【図3】期限変換テーブル、緊急度算出テーブルの一例
である。
【図4】日時抽出と場所抽出の流れ図である。
【図5】イベント名抽出の流れ図である。
【図6】委託行為抽出の流れ図である。
【図7】ラベル抽出の流れ図である。
【図8】文書の一例である。
【図9】文書の他の一例である。
【符号の説明】
10 処理装置 100 制御手段 110 抽出手段 111 イベント名抽出手段 112 日時抽出手段 113 場所抽出手段 114 対象者抽出手段 115 ラベル抽出手段 116 委託行為抽出手段 120 緊急度判定手段 20 記憶装置 200 パターン格納手段 201 日時表記パターン 202 日時表現パターン 203 場所表現パターン 204 通知表現パターン 205 対象者表現パターン 206 ラベル表現パターン 207 委託表現パターン 208 期限表現パターン 209 期限表記パターン 210 連絡先表現パターン 211 補助表現パターン 212 修飾表現パターン 213 対象物表現パターン 214 手段表現パターン 220 テーブル格納手段 221 期限変換テーブル 222 緊急度算出テーブル

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータを用いて、電子メールなど
    のプレーンテキストで記述された文書から必要な情報を
    自動的に抽出する方法であって、 あらかじめ文書の記述に用いられる様々な言語的表現パ
    ターンやラベル表現パターンを記憶手段に格納してお
    き、入力された文書と前記言語的表現パターンやラベル
    表現パターンとのパターンマッチングにより、電子化さ
    れた文書から読み手にとって必要とする情報を抽出する
    ことを特徴とする情報抽出方法。
  2. 【請求項2】 電子メールなどプレーンテキストで記述
    された文書から必要な情報を抽出する装置であって、 数字や記号から構成される日付や時間を表す日時表記パ
    ターン、日時に付加されることにより日時を表現する日
    時表現パターン、場所に付加されることにより場所を表
    現する場所表現パターン、イベントを通知する行為を表
    す通知表現パターン、文書の対象者を表す対象者表現パ
    ターン、視覚的効果を持たせるために項目化されたラベ
    ルを表すラベル表現パターン、相手に委託する行為を表
    す委託表現パターン、相手に委託する行為の期限を表す
    期限表現パターン、相手に委託する行為の連絡先を表す
    連絡先表現パターン、相手に委託する行為の対象物を表
    す対象物表現パターン、相手に委託する行為の手段を表
    す手段表現パターンの一部あるいは全部を格納するパタ
    ーン格納手段と、 前記パターン格納手段に格納された、各パターンと入力
    された文書とのパターンマッチングにより、あるイベン
    トに関するイベント名、開催日時、開催場所、対象者の
    情報や、委託された行為の種別、期限、連絡の一部ある
    いは全部先を抽出する抽出手段とを有し、 電子化された文書から読み手にとって必要とする情報を
    抽出することを特徴とする情報抽出装置。
  3. 【請求項3】 請求項2記載の情報抽出装置において、
    抽出手段は、パターン格納手段にある日時表記パターン
    と日時表現パターンを組み合わせることによって、イベ
    ントの開催日時を抽出する日時抽出手段をに有すること
    を特徴とする情報抽出装置。
  4. 【請求項4】 請求項2記載の情報抽出装置において、
    抽出手段は、パターン格納手段にある場所表現パターン
    を日時表現パターンの前後でパターンマッチングするこ
    とによって、イベントの開催場所を抽出する場所抽出手
    段を有することを特徴とする情報抽出装置。
  5. 【請求項5】 請求項2記載の情報抽出装置において、
    抽出手段は、パターン格納手段にある通知表現パターン
    を用いてパターンマッチングすることによって、イベン
    トの名前を抽出するイベント名抽出手段を有することを
    特徴とする情報抽出装置。
  6. 【請求項6】 請求項2記載の情報抽出装置において、
    抽出手段は、パターン格納手段にある対象者表現パター
    ンを用いてパターンマッチングすることによって、イベ
    ントの通知の対象者を抽出する対象者抽出手段を有する
    ことを特徴とする情報抽出装置。
  7. 【請求項7】 請求項2記載の情報抽出装置において、
    抽出手段は、パターン格納手段にある期限表現パターン
    を用いてパターンマッチングすることによって、通知を
    受信した人が委託された行為の期限を抽出し、連絡先表
    現パターンを用いてパターンマッチングすることによっ
    て、通知を受信した人が委託された行為の連絡先を抽出
    し、対象物表現パターンを用いてパターンマッチングす
    ることによって、通知を受信した人が委託された行為の
    対象物を抽出し、手段表現パターンを用いてパターンマ
    ッチングすることによって、通知を受信した人が委託さ
    れた行為の手段を抽出し、委託行為表現パターンを用い
    てパターンマッチングすることによって、通知を受信し
    た人が委託された行為を抽出する委託行為抽出手段を有
    することを特徴とする情報抽出装置。
  8. 【請求項8】 請求項2記載の情報抽出装置において、
    抽出手段は、入力された文書中の日時に関するキーワー
    ドと場所に関するキーワードを格納している場所キーワ
    ードとを、パターン格納手段にあるラベル表現パターン
    とを組み合わせて、パターンマッチングすることによっ
    て、視覚的な効果を持つラベルとして記述された、イベ
    ントの開催日時と開催場所を抽出し、上記キーワードが
    視覚的に整形されている場合でも、イベントの開催日時
    と開催場所を抽出するラベル抽出手段を有することを特
    徴とする情報抽出装置。
  9. 【請求項9】 請求項2記載の情報抽出装置において、
    抽出手段は視覚的に整形されたイベントの開催日時と開
    催場所のキーワードの長さを計り、これを保持し、パタ
    ーン格納手段にあるラベル表現パターンと組み合わせる
    ことによって、イベントの開催日時や開催場所以外の任
    意のキーワードを持つラベルを抽出するラベル抽出手段
    を有することを特徴とする情報抽出装置。
  10. 【請求項10】 請求項2記載の情報抽出装置におい
    て、通知を受信した人が委託される行為の期限情報を格
    納する手段と、前記格納された期限情報と入力された文
    書の文書作成日時を照合することによって、緊急の度合
    いを判定する緊急度判定手段を有することを特徴とする
    情報抽出装置。
  11. 【請求項11】 電子化された文書から読み手にとって
    必要な情報を抽出する情報抽出プログラムを記録したコ
    ンピュータ読み取り可能な記録媒体であって、 数字や記号から構成される日付や時間を表す日時表記パ
    ターン、日時に付加され日時を表現する日時表現パター
    ン、場所に付加され場所を表現する場所表現パターン、
    イベントの通知の行為を表す通知表現パターン、イベン
    ト名を挙げて通知表現を補助する補助表現パターン、イ
    ベント名を修飾する修飾表現パターン、対象者を表す対
    象者表現パターン、視覚的効果を持つラベルを表すラベ
    ル表現パターン、相手に委託する行為を表す委託表現パ
    ターン、相手に委託する行為の期限を表す期限表現パタ
    ーン、相手に委託する行為の期限の具体的な単語や日時
    を表す期限表記パターン、相手に委託する行為の対象物
    を表す対象物表現パターン、相手に委託する行為の手段
    を表す手段表現パターン、相手に委託する行為の連絡先
    を表す連絡先表現パターン、及び、委託される行為の期
    限情報を記録するとともに、各パターンと入力された文
    書とのパターンマッチングにより、イベントに関するイ
    ベント名を抽出するイベント名抽出プロセス、開催日時
    を抽出する日時抽出プロセス、開催場所を抽出する場所
    抽出プロセス、対象者を抽出する対象者抽出プロセス、
    視覚的効果を持つ任意のラベルを抽出するラベル抽出プ
    ロセス、イベントに関して委託された行為の種別、期
    限、連絡先、対象物、手段を抽出する委託行為抽出プロ
    セス、及び、委託される行為の期限情報と通知文書作成
    日時とを照合し、文書の緊急の度合いを判断する緊急度
    判定プロセスを記録してなる記録媒体。
JP25738397A 1997-09-22 1997-09-22 情報抽出方法、情報抽出装置及び情報抽出プログラムを記録した記録媒体 Expired - Fee Related JP3574551B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25738397A JP3574551B2 (ja) 1997-09-22 1997-09-22 情報抽出方法、情報抽出装置及び情報抽出プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25738397A JP3574551B2 (ja) 1997-09-22 1997-09-22 情報抽出方法、情報抽出装置及び情報抽出プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JPH1196178A true JPH1196178A (ja) 1999-04-09
JP3574551B2 JP3574551B2 (ja) 2004-10-06

Family

ID=17305633

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25738397A Expired - Fee Related JP3574551B2 (ja) 1997-09-22 1997-09-22 情報抽出方法、情報抽出装置及び情報抽出プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3574551B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001101162A (ja) * 1999-09-27 2001-04-13 Just Syst Corp 文書処理装置、及び文書処理プログラムが記憶された記憶媒体
JP2004157841A (ja) * 2002-11-07 2004-06-03 Nec Corp 意見抽出装置、意見抽出方法、意見抽出プログラム
JP2007133903A (ja) * 2007-01-18 2007-05-31 Nec Corp 意見抽出装置、意見抽出方法、意見抽出プログラム
WO2008149843A1 (ja) * 2007-06-05 2008-12-11 Nec Corporation 情報提示システム、情報提示方法及び情報提示用プログラム
JP2010191864A (ja) * 2009-02-20 2010-09-02 Nec Corp タスク自動生成システム、その方法及びそのプログラム
KR101349970B1 (ko) * 2011-07-05 2014-01-14 네이버 주식회사 문서에서 사건정보를 추출하는 사건정보 추출 시스템 및 방법
JP2014049052A (ja) * 2012-09-04 2014-03-17 Kddi Corp イベントに関するコメント文章のみ検出するイベントコメント文章検出装置、プログラム及び方法
WO2014061288A1 (ja) * 2012-10-19 2014-04-24 株式会社コナミデジタルエンタテインメント 予約支援装置、予約支援装置の制御方法、及び、予約支援装置のプログラムを記録したコンピュータ読み取り可能な非一過性の記録媒体

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09244969A (ja) * 1996-03-05 1997-09-19 Nippon Telegr & Teleph Corp <Ntt> パーソナル情報抽出方法及び装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09244969A (ja) * 1996-03-05 1997-09-19 Nippon Telegr & Teleph Corp <Ntt> パーソナル情報抽出方法及び装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001101162A (ja) * 1999-09-27 2001-04-13 Just Syst Corp 文書処理装置、及び文書処理プログラムが記憶された記憶媒体
JP2004157841A (ja) * 2002-11-07 2004-06-03 Nec Corp 意見抽出装置、意見抽出方法、意見抽出プログラム
JP2007133903A (ja) * 2007-01-18 2007-05-31 Nec Corp 意見抽出装置、意見抽出方法、意見抽出プログラム
JP4501940B2 (ja) * 2007-01-18 2010-07-14 日本電気株式会社 意見抽出装置、意見抽出方法、意見抽出プログラム
WO2008149843A1 (ja) * 2007-06-05 2008-12-11 Nec Corporation 情報提示システム、情報提示方法及び情報提示用プログラム
JP5333216B2 (ja) * 2007-06-05 2013-11-06 日本電気株式会社 情報提示システム、情報提示方法及び情報提示用プログラム
JP2010191864A (ja) * 2009-02-20 2010-09-02 Nec Corp タスク自動生成システム、その方法及びそのプログラム
KR101349970B1 (ko) * 2011-07-05 2014-01-14 네이버 주식회사 문서에서 사건정보를 추출하는 사건정보 추출 시스템 및 방법
JP2014049052A (ja) * 2012-09-04 2014-03-17 Kddi Corp イベントに関するコメント文章のみ検出するイベントコメント文章検出装置、プログラム及び方法
WO2014061288A1 (ja) * 2012-10-19 2014-04-24 株式会社コナミデジタルエンタテインメント 予約支援装置、予約支援装置の制御方法、及び、予約支援装置のプログラムを記録したコンピュータ読み取り可能な非一過性の記録媒体
JP2014099144A (ja) * 2012-10-19 2014-05-29 Konami Digital Entertainment Co Ltd 予約支援装置、予約支援装置の制御方法、及び、予約支援装置のプログラム

Also Published As

Publication number Publication date
JP3574551B2 (ja) 2004-10-06

Similar Documents

Publication Publication Date Title
US9501467B2 (en) Systems, methods, software and interfaces for entity extraction and resolution and tagging
JP6074420B2 (ja) 自動的タスク抽出およびカレンダーエントリー
US20130006986A1 (en) Automatic Classification of Electronic Content Into Projects
US20040024585A1 (en) Linguistic segmentation of speech
EP1331574B1 (en) Named entity interface for multiple client application programs
CN110738055A (zh) 文本的实体识别方法、设备及存储介质
CN112258144A (zh) 基于自动构建目标实体集的政策文件信息匹配和推送方法
JP3574551B2 (ja) 情報抽出方法、情報抽出装置及び情報抽出プログラムを記録した記録媒体
CN115759071A (zh) 基于大数据的政务敏感信息识别系统和方法
Choudhary et al. The ldc-il speech corpora
CN111177401A (zh) 一种电网自由文本知识抽取方法
CN112257442A (zh) 一种基于扩充语料库神经网络的政策文件信息提取方法
Terblanche et al. Ontology‐based employer demand management
Karkaletsis et al. Named-entity recognition from Greek and English texts
CN115186657A (zh) 错敏信息检测方法、装置、计算机设备及存储介质
Terras Reading the readers: Modelling complex humanities processes to build cognitive systems
Attia et al. GWU-HASP-2015@ QALB-2015 shared task: priming spelling candidates with probability
Suriyachay et al. Thai named entity tagged corpus annotation scheme and self verification
CN113901793A (zh) 结合rpa和ai的事件抽取方法及装置
JP4965766B2 (ja) 関係情報抽出装置および属性情報抽出装置
Maekawa Kotonoha and BCCWJ: development of a balanced corpus of contemporary written Japanese
Charoenpornsawat et al. Feature-based proper name identification in Thai
Sakahira et al. Creating a Disaster Chain Diagram from Japanese Newspaper Articles Using Mechanical Methods
Park et al. Second order probabilistic models for within-document novelty detection in academic articles
Hliudzyk et al. Key pedagogical aspects of the study of philology by university students in the framework of the management of the educational process

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040406

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040629

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040702

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080709

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080709

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090709

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090709

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100709

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100709

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110709

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120709

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130709

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees