JP2000148767A - 文書重要文ランキング方法、文書重要文ランキング装置、及び文書重要文ランキングプログラムを記録した記録媒体 - Google Patents

文書重要文ランキング方法、文書重要文ランキング装置、及び文書重要文ランキングプログラムを記録した記録媒体

Info

Publication number
JP2000148767A
JP2000148767A JP10315120A JP31512098A JP2000148767A JP 2000148767 A JP2000148767 A JP 2000148767A JP 10315120 A JP10315120 A JP 10315120A JP 31512098 A JP31512098 A JP 31512098A JP 2000148767 A JP2000148767 A JP 2000148767A
Authority
JP
Japan
Prior art keywords
importance
sentence
document
ranking
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10315120A
Other languages
English (en)
Other versions
JP3612597B2 (ja
Inventor
Muneyuki Horii
統之 堀井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP31512098A priority Critical patent/JP3612597B2/ja
Publication of JP2000148767A publication Critical patent/JP2000148767A/ja
Application granted granted Critical
Publication of JP3612597B2 publication Critical patent/JP3612597B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】電子メールのような短くかつ定型的な構造を持
たない文書に対しても各文の重要度を付与できる文書重
要文ランキング方法、文書重要文ランキング装置、及び
文書重要文ランキングプログラムを記録した記録媒体を
提供することを目的とする。 【解決手段】入力された文書を解析し、該解析された文
書を文単位に分割し、表現の重要度を記述したテーブル
を参照して、該文単位に分割された各文中に含まれてい
る表現の重要度から各文に重要度を付与する。また、重
要度を調整する表現を記述したテーブルを参照して、各
文の重要度を調整する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書の要約等を目
的として文書中の各文に重要度を付与する文書重要文ラ
ンキング方法、文書重要文ランキング装置、及び文書重
要文ランキングプログラムを記録した記録媒体に関す
る。
【0002】
【従来の技術】大量の情報、特にWWWや電子メールと
いった電子的な情報を効率良く概観し、必要な情報だけ
を取得するためには、文書の要約技術が必要不可欠であ
り、一般的には文書中から重要文を抽出する重要文抽出
技術が用いられる。また、要約文書の分量は制限される
場合が多いため、その制限に応じた要約が可能となるよ
うに、抽出する重要文はその重要度に応じてランキング
されていることが望ましい。
【0003】重要文抽出技術には、 ・文書中の単語頻度を利用する手法 ・文書中の位置情報を利用する手法 ・文間の関係を解析して文書構造を利用する手法 ・文書中の手がかり表現を利用する手法 などがあり、それぞれ各文に対して重要度を付与するこ
とができ、付与された重要度を利用して、分量制限に応
じた文書要約を行うことができることが望ましい。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
各手法は、新聞記事、学術論文のようにある程度の長さ
があり、また定型的な構造を持った文書を対象とした場
合には有効であるが、電子メールのように短くかつ定型
的な構造を持たない文書に対してはあまり効果がない。
【0005】上記の「文書中の手がかり表現を利用する
手法」で、短くかつ定型的な構造を持たない電子メール
のような文書に対して有効な手法として、「文書重要文
抽出方法、文書重要文抽出装置及び文書重要文抽出プロ
グラムを記録した記録媒体」(掘井他、特願平10−7
0688)が提案されているが、この手法は重要文の抽
出を行う場合は効果的であるが、各文に重要度を付与す
ることは出来ない。
【0006】本発明は上記の点に鑑みてなされたもの
で、表現の重要度を記述したテーブルを用意し、各文中
に含まれている表現の重要度から各文の重要度を決定す
ることにより、電子メールのような短くかつ定型的な構
造を持たない文書に対しても各文の重要度を付与できる
文書重要文ランキング方法、文書重要文ランキング装
置、及び文書重要文ランキングプログラムを記録した記
録媒体を提供することを目的とする。
【0007】
【発明を解決するための手段】上記目的を達成するため
に、本発明は次のように構成される。本発明は、文書中
の各文に重要度を付与する文書重要文ランキング方法で
あって、入力された文書を解析し、該解析された文書を
文単位に分割し、表現の重要度を記述した第1のテーブ
ルを参照して、該文単位に分割された各文中に含まれて
いる表現の重要度から各文に重要度を付与する。
【0008】上記構成は、前記解析が、前記文書の各単
語毎に表層表記、標準表記、及び品詞の属性を付与する
ことである。上記構成はまた、前記第1のテーブルに
は、接続情報、表層表記、標準表記、及び品詞の組毎に
重要度が記述されている。また上記発明は、重要度を調
整する表現を記述した第2のテーブルを参照して、前記
各文の重要度を調整することを含む。
【0009】更に上記発明は、前記各文に付与された重
要度を参照して、前記文書を要約することを含む。上記
目的を達成するために、本発明は次のようにも構成され
る。本発明は、文書中の各文に重要度を付与する文書重
要文ランキング装置であって、文書を入力する手段と、
入力された文書を解析する手段と、該解析された文書を
文単位に分割する手段と、表現の重要度を記述した第1
のテーブルを参照して該文単位に分割された各文中に含
まれている表現の重要度から各文に重要度を付与する手
段とを有する。
【0010】上記構成において、前記解析する手段は、
前記文書の各単語毎に表層表記、標準表記、及び品詞の
属性を付与する手段を有する。また上記構成において、
前記第1のテーブルには、接続情報、表層表記、標準表
記、及び品詞の組毎に重要度が記述されている。上記発
明はまた、重要度を調整する表現を記述した第2のテー
ブルを参照して、前記各文の重要度を調整する手段を含
む。
【0011】更に、上記発明は前記各文に付与された重
要度を参照して、前記文書を要約する手段を含む。上記
目的を達成するために、本発明はまた次のように構成さ
れる。本発明は、文書中の各文に重要度を付与する文書
重要文ランキングプログラムを記録したコンピュータ読
み取り可能な記録媒体であって、該プログラムにより、
入力された文書を解析し、該解析された文書を文単位に
分割し、表現の重要度を記述した第1のテーブルを参照
して、該文単位に分割された各文中に含まれている表現
の重要度から各文に重要度を付与する。
【0012】上記構成において、本発明の記録媒体は、
前記プログラムにより、前記文書の各単語毎に表層表
記、標準表記、及び品詞の属性を付与する。本発明の記
録媒体はまた、上記構成において、前記第1のテーブル
には、接続情報、表層表記、標準表記、及び品詞の組毎
に重要度が記述されている。本発明の記録媒体はまた、
前記プログラムにより、重要度を調整する表現を記述し
た第2のテーブルを参照して、前記各文の重要度を調整
することを含む。
【0013】本発明は更に、前記プログラムにより、前
記各文に付与された重要度を参照して、前記文書を要約
することを含む。上述のとおり本発明によれば、表現の
重要度を記述したテーブルを用意し、各文中に含まれて
いる表現の重要度から各文の重要度を決定することとし
たため、電子メールのような短くかつ定型的な構造を持
たない文書に対しても各文の重要度を付与することがで
きる。
【0014】
【発明の実施の形態】まず、本発明の文書重要文ランキ
ング方法の概要を図1のフローチャートを用いて説明す
る。図1に示すように、文書を入力し(ステップ1)、
入力された文書を形態素解析し(ステップ2)、形態素
解析された文書を文単位に分割し(ステップ3)、表現
の重要度を記述した重要度付与テーブルを参照して、文
単位に分割された各文中に含まれている表現の重要度か
ら各文に重要度を付与し(ステップ4)、重要度を調整
する表現を記述した重要度調整テーブルを参照して、各
文の重要度を調整する(ステップ5)。ここで、ステッ
プ5の各文の重要度を調整する処理は、場合によっては
省略し、ステップ4で付与した各文の重要度を最終的な
重要度としてもよい。
【0015】図2は、本発明の文書重要文ランキング装
置の一実施例の概略ブロック図である。本文書重要文ラ
ンキング装置は、文書入力部10、形態素解析部20、
単文分割部30、重要度付与部40、重要度調整部5
0、重要度付与テーブル60、及び重要度調整テーブル
70で構成される。文書入力部10は、重要文ランキン
グの対象となる文書の入力を行い、入力された文書を形
態素解析部20に送出する。形態素解析部20は、文書
入力部10より受け取った文書を形態素解析し、形態素
解析された文書を単文分割部30に送出する。単文分割
部30は、形態素解析部20より受け取った文書を文単
位に分割し、文単位に分割された文書を重要度付与部4
0に送出する。
【0016】重要度付与部40は、重要度付与テーブル
60を参照することにより、単文分割部30より受け取
った文書の各文中に含まれている表現の重要度から各文
に重要度を付与する。重要度付与テーブル60には、重
要度を規定する表現の形態素情報と重要度が記述されて
いる。重要度は数値が高いほど重要であることを表す。
重要度付与テーブル60に記述されている表現を含んだ
文には、含んでいる表現のうちもっとも高い値の重要度
が付与される。重要度付与テーブル60に記述されてい
る表現を含んでいない文には、デフォルトで設定された
重要度が付与される。各文に重要度が付与された文書は
重要度調整部50に送出される。
【0017】重要度調整部50は、重要度調整テーブル
70を参照することにより、重要度付与部40より受け
取った文書の各文に付与された重要度を調整する。重要
度調整テーブル70には、重要度を調整する表現の形態
素情報と重要度調整値が記述されている。重要度調整テ
ーブル70に記述された表現を含んだ文に付与されてい
る重要度は、含んでいる表現の重要度調整値により調整
される。
【0018】上記の構成は、例えば図3に示すコンピュ
ータシステムで実現される。同図に示すように、本コン
ピュータシステムは、CPU100、メモリ110、外
部記憶装置120、ディスプレイ130、キーボード1
40、通信処理装置150を備え、メモリ110又は外
部記憶装置120に記録されたプログラム及びデータが
CPU100で処理されて動作する。また、キーボード
140及びディスプレイ130で入出力を行い、通信処
理装置150により外部と通信する。
【0019】上述した文書入力部10、形態素解析部2
0、単文分割部30、重要度付与部40、重要度調整部
50、重要度付与テーブル60、及び重要度調整テーブ
ル70等をプログラム及びデータで構成することによ
り、CPU100において上述した処理が実行される。
次に、具体例を用いて、本発明による、文書中の各文に
重要度を付与する手法を説明する。文書入力部10で、
以下の電子メール文書が入力された場合を考える。
【0020】<入力> 「横須賀情報通信 高木様 NTT(登録商標)商事の竹石です。いつもお世話にな
っております。システム緊急会議についてのお願いで
す。貴社に納入して頂いた在庫管理システムが今朝ダウ
ンし、現在非常モードで稼働中です。主な状況は以下の
通りです。
【0021】・端末からアクセスしても初期画面が表示
されません。 ・バックアップデータがリストアできません。 年末時期で業務に支障があり、早急に対応策を検討しな
ければなりません。至急電話を頂けないでしょうか?本
日15時から17時にNTT商事本社会議室で緊急対策
会議を行いますので、ご出席をお願いしたいと思いま
す。
【0022】申し訳ありませんが、よろしくお願いしま
す。」 形態素解析部20では、上記入力文書を形態素解析す
る。たとえば、上記入力文書のうち、NTT商事の竹石
です。を形態素解析した結果は以下のようになる。(上
段が原文「表層表記」及び分割点、中段が各単語の標準
表記、下段が各単語の品詞を表す。) NTT /商事 /の /竹石 /です /。/ NTT 商事 の 竹石 だ 。
【0023】固有名詞(企業名) 普通名詞 接続助詞
固有名詞(姓) 判定詞 句点文書入力部10で入力
された文書は全て形態素解析部20により上記と同様に
形態素解析される。単文分割部30では、形態素解析さ
れた文書を文単位に分割する。上記形態素解析された文
書は、以下のように文単位に分割される。(説明の都合
上、分割された文の順番に文番号を付与している。また
形態素情報は省略している。) 1 横須賀情報通信 高木様 2 NTT商事の竹石です。
【0024】3 いつもお世話になっております。 4 システム緊急会議についてのお願いです。 5 貴社に納入して頂いた在庫管理システムが今朝ダウ
ンし、現在非常モードで稼働中です。 6 主な状況は以下の通りです。
【0025】7 ・端末からアクセスしても初期画面が
表示されません。 8 ・バックアップデータがリストアできません。 9 年末時期で業務に支障があり、早急に対応策を検討
しなければなりません。 10 至急電話を頂けないでしょうか? 11 本日15時から17時にNTT商事本社会議室で
緊急対策会議を行いますので、ご出席をお願いしたいと
思います。
【0026】12 申し訳ありませんが、よろしくお願
いします。 重要度付与部40では、単文分割部30で分割された各
文に対し、重要度付与テーブル60に記述されている表
現が含まれているかどうかを調べ、含まれている場合に
はそれらの表現の重要度のうちもっとも高い値を、含ま
れていない場合にはデフォルトで設定された値を、各文
の重要度として付与する。
【0027】重要度付与テーブル60の例を図4に示
す。図4の重要度付与テーブルは、重要度を規定する表
現の形態素情報と重要度から構成される。形態素情報
は、1組以上の接続情報、表層表記、標準表記、品詞の
4つの組から構成される。接続情報は、次の形態素の位
置を規定する。“next”は次の形態素が直後にある
ことを表し、“far”は次の形態素が離れていても良
いことを表す。また、“end”は文末であることを表
し、“−”は次に形態素情報がないことを表す。表層表
記、標準表記、品詞における“*”は全てにマッチする
ことを表す。重要度は数値が高いほど重要であることを
表す。
【0028】たとえば、 1 横須賀情報通信 高木様 では、「様(文末)」の部分が重要度付与テーブルのテ
ーブルID100の表現にマッチする。それ以外の部分
は重要度付与テーブルとマッチしないので、テーブルI
D100の重要度“1”が文番号1の文の重要度とな
る。(重要度の値は文の最後に[]で囲って表すものと
する。) 1 横須賀情報通信 高木様[1] 同様に、 2 NTT商事の竹石です。
【0029】3 いつもお世話になっております。 は、それぞれ「竹石です」の部分がテーブルID101
(重要度“2”)にマッチ、「世話になっ」の部分がテ
ーブルID102(重要度“1”)にマッチし、共に1
部分しかマッチしないので、それぞれのテーブルIDの
重要度が文の重要度となり、 2 NTT商事の竹石です。[2] 3 いつもお世話になっております。[1] である。
【0030】4 システム緊急会議についてのお願いで
す。 は、「について」がテーブルID103(重要度
“5”)にマッチ、「お願いです」がテーブルID10
6(重要度“4”)にマッチする。複数の表現とマッチ
した場合は、もっとも高い値の重要度を付与するので、
この場合はテーブルID103の重要度“5”が付与さ
れる。
【0031】4 システム緊急会議についてのお願いで
す。[5] 文番号5、6、7、8、9はいずれも重要度付与テーブ
ルにマッチする表現がないので、デフォルトで設定され
た値を付与する。デフォルト値を“3”として、 5 貴社に納入して頂いた在庫管理システムが今朝ダウ
ンし、現在非常モードで稼働中です。[3〕 6 主な状況は以下の通りです。[3] 7 ・端末からアクセスしても初期画面が表示されませ
ん。[3] 8 ・バックアップデータがリストアできません。
[3〕 9 年末時期で業務に支障があり、早急に対応策を検討
しなければなりません。[3] である。
【0032】10 至急電話を頂けないでしょうか? 11 本日15時から17時にNTT商事本社会議室で
緊急対策会議を行いますので、ご出席をお願いしたいと
思います。 12 申し訳ありませんが、よろしくお願いします。 は、それぞれ「か?」の部分がテーブルID104(重
要度“4”)にマッチ、「お願いし」の部分がテーブル
ID105(重要度“4”)にマッチ、「が、よろしく
お願いし」の部分がテーブルID107(重要度
“1”)とマッチし、いずれも1部分しかマッチしない
ので、それぞれのテーブルIDの重要度が文の重要度と
なる。(文番号12は、「、」と「お願い」の間に「よ
ろしく」が入っているが、テーブルID103の「、」
の接続情報が“far”になっているので、「お願い」
が離れていても構わない。) 10 至急電話を頂けないでしょうか?[4] 11 本日15時から17時にNTT商事本社会議室で
緊急対策会議を行いますので、ご出席をお願いしたいと
思います。[4] 12 申し訳ありませんが、よろしくお願いします。
[1] したがって、各文に重要度が付与された以下の文書が重
要度調整部50へ送出される。
【0033】1 横須賀情報通信 高木様[1] 2 NTT商事の竹石です。[2] 3 いつもお世話になっております。[1] 4 システム緊急会議についてのお願いです。[5〕 5 貴社に納入して頂いた在庫管理システムが今朝ダウ
ンし、現在非常モードで稼働中です。[3] 6 主な状況は以下の通りです。[3] 7 ・端末からアクセスしても初期画面が表示されませ
ん。[3] 8 ・バックアップデータがリストアできません。
[3] 9 年末時期で業務に支障があり、早急に対応策を検討
しなければなりません。[3] 10 至急電話を頂けないでしょうか?[4] 11 本日15時から17時にNTT商事本社会議室で
緊急対策会議を行いますので、ご出席をお願いしたいと
思います。[4] 12 申し訳ありませんが、よろしくお願いします。
[1] 重要度調整部50では、重要度付与部40から受け取っ
た文書の各文に対し、重要度調整テーブル70に記述さ
れている表現が含まれているかどうかを調べ、含まれて
いる場合、該当する文の重要度は、含んでいる表現の重
要度調整値に従い重要度の値を調整する。
【0034】重要度調整テーブル70の例を図5に示
す。図5の重要度調整テーブルは、重要度を調整する表
現の形態素情報と重要度調整値から構成される。形態素
情報の形式は図4の重要度付与テーブルと同様である。
重要度調整値は重要度の増減度合であり、形態素情報に
マッチする表現が見つかった場合に、該当する文の重要
度を重要度調整値に従い調整する。
【0035】本実施例における例では、 9 年末時期で業務に支障があり、早急に対応策を検討
しなければなりません。[3] 10 至急電話を頂けないでしょうか?[4] の2文が図5の重要度調整テーブルの表現を含んでい
る。文番号9は「早急に」がテーブルID200(重要
度調整値“+0.5”)とマッチ、文番号10は「至
急」がテーブルID201(重要度調整値“+2”)と
マッチするので、それぞれの文の重要度を重要度調整値
に従って調整すると、 9 年末時期で業務に支障があり、早急に対応策を検討
しなければなりません。[3.5] 10 至急電話を頂けないでしょうか?[6] となる。
【0036】したがって、重要度調整部50では、各文
の重要度が付与、調整された以下の文書が出力となる。 1 横須賀情報通信 高木様[1] 2 NTT商事の竹石です。[2] 3 いつもお世話になっております。[1] 4 システム緊急会議についてのお願いです。[5] 5 貴社に納入して頂いた在庫管理システムが今朝ダウ
ンし、現在非常モードで稼働中です。[3] 6 主な状況は以下の通りです。[3] 7 ・端末からアクセスしても初期画面が表示されませ
ん。[3] 8 ・バックアップデータがリストアできません。
[3] 9 年末時期で業務に支障があり、早急に対応策を検討
しなければなりません。[3.5] 10 至急電話を頂けないでしょうか?[6] 11 本日15時から17時にNTT商事本社会議室で
緊急対策会議を行いますので、ご出席をお願いしたいと
思います。[4] 12 申し訳ありませんが、よろしくお願いします。
[1] 上記実施例で、各文に重要度が付与されたことにより、
要約文書の分量に応じた重要文抽出が可能となる。1文
だけ抽出するならば、重要度が最大値“6”である文番
号10を抽出して、 <要約文書>至急電話を頂けないでしょうか?となる。
2文抽出ならば、重要度“5”の文番号4も抽出され、 <要約文書>システム緊急会議についてのお願いです。
【0037】至急電話を頂けないでしょうか?となり、
3文抽出ならば、重要度“4”の文番号11も抽出さ
れ、 <要約文書>システム緊急会議についてのお願いです。
至急電話を頂けないでしょうか? 本日15時から17時にNTT商事本社会議室で緊急対
策会議を行いますので、ご出席をお願いしたいと思いま
す。という具合である。文字数による分量の制約がある
場合も、制限文字数に入るだけ重要度の高い順に文を抽
出してくればよい。
【0038】上記実施例では、重要度付与部40で各文
に重要度を付与したあと、重要度調整部50で各文の重
要度の調整を行なったが、重要度調整部50は省略して
重要度付与部40で付与した各文の重要度を最終的な値
としてもよい。その場合、重要度が最大である文は、文
番号4(重要度“5”)になるので、1文抽出の場合、
<要約文書>システム緊急会議についてのお願いです。
【0039】となる。仮に文番号10に「至急」という
表現が無かった場合には重要度調整部50で重要度調整
を行なっても同じ結果になる。2文抽出の場合には、重
要度“4”の文が文番号10、11と2文あるため、何
らかの手段によりどちらかを選択することになる。
(「先に書かれている文」「文字数が短い文」等の手
段。) 以上、図2の本発明の文書重要文ランキング装置の実施
例について説明した。
【0040】次に本発明の記録媒体について説明する。
本発明における文書重要文ランキングプログラムを記録
した記録媒体は図3に示す構成と同様な構成のコンピュ
ータシステムにおけるメモリ110又は外部記憶装置1
20のいずれか又は両方に相当する。また、光磁気ディ
スク、磁気ディスク、磁気テープ等の可搬媒体、又は電
子メモリ、ハードディスク等も本発明の記録媒体に相当
し、これらの記録媒体に格納された本発明の文書重要文
ランキングプログラムを図3に示すようなコンピュータ
システムにローディングすることにより一般のコンピュ
ータシステムにおいて本発明における文書重要文ランキ
ング方法の実施が可能となる。また、本発明のプログラ
ムのローディングは通信処理装置150を介してネット
ワークからも行われ得る。
【0041】なお、本発明は上記の実施例に限定されて
おらず、特許請求の範囲内で種々変更・応用が可能であ
る。
【0042】
【発明の効果】上述のように本発明によれば、文の重要
度を決定する表現を記述したテーブルを用意するだけ
で、文書中の各文に対し重要度を付与することができる
ため、文数、文字数の制約に応じた文書要約が可能にな
る。本発明は、定型的な構造を持った文書のみならず、
特に、短くかつ定型的な構造を持たない電子メール文書
等の要約に効果が大きい。
【図面の簡単な説明】
【図1】本発明の文書重要文ランキング方法の処理フロ
ーを示すフローチャートである。
【図2】本発明の文書重要文ランキング装置の一実施例
の概略ブロック図である。
【図3】本発明の文書重要文ランキング装置の一実施例
のハードブロック図である。
【図4】本発明に用いる重要度付与テーブルの内容例を
示す図である。
【図5】本発明に用いる重要度調整テーブルの内容例を
示す図である。
【符号の説明】
10 文書入力部 20 形態素解析部 30 単文分割部 40 重要度付与部 50 重要度調整部 60 重要度付与テーブル 70 重要度調整テーブル 100 CPU 110 メモリ 120 外部記憶装置 130 ディスプレイ 140 キーボード 150 通信処理装置

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】文書中の各文に重要度を付与する文書重要
    文ランキング方法であって、 入力された文書を解析し、該解析された文書を文単位に
    分割し、表現の重要度を記述した第1のテーブルを参照
    して、該文単位に分割された各文中に含まれている表現
    の重要度から各文に重要度を付与することを特徴とする
    文書重要文ランキング方法。
  2. 【請求項2】前記解析は、 前記文書の各単語毎に表層表記、標準表記、及び品詞の
    属性を付与する請求項1記載の文書重要文ランキング方
    法。
  3. 【請求項3】前記第1のテーブルには、 接続情報、表層表記、標準表記、及び品詞の組毎に重要
    度が記述されている請求項1記載の文書重要文ランキン
    グ方法。
  4. 【請求項4】重要度を調整する表現を記述した第2のテ
    ーブルを参照して、前記各文の重要度を調整することを
    含む請求項1記載の文書重要文ランキング方法。
  5. 【請求項5】前記各文に付与された重要度を参照して、
    前記文書を要約することを含む請求項1記載の文書重要
    文ランキング方法。
  6. 【請求項6】文書中の各文に重要度を付与する文書重要
    文ランキング装置であって、 文書を入力する手段と、入力された文書を解析する手段
    と、該解析された文書を文単位に分割する手段と、表現
    の重要度を記述した第1のテーブルを参照して該文単位
    に分割された各文中に含まれている表現の重要度から各
    文に重要度を付与する手段とを有することを特徴とする
    文書重要文ランキング装置。
  7. 【請求項7】前記解析する手段は、 前記文書の各単語毎に表層表記、標準表記、及び品詞の
    属性を付与する手段を有する請求項6記載の文書重要文
    ランキング装置。
  8. 【請求項8】前記第1のテーブルには、 接続情報、表層表記、標準表記、及び品詞の組毎に重要
    度が記述されている請求項6記載の文書重要文ランキン
    グ装置。
  9. 【請求項9】重要度を調整する表現を記述した第2のテ
    ーブルを参照して、前記各文の重要度を調整する手段を
    含む請求項6記載の文書重要文ランキング装置。
  10. 【請求項10】前記各文に付与された重要度を参照し
    て、前記文書を要約する手段を含む請求項6記載の文書
    重要文ランキング装置。
  11. 【請求項11】文書中の各文に重要度を付与する文書重
    要文ランキングプログラムを記録したコンピュータ読み
    取り可能な記録媒体であって、該プログラムにより、 入力された文書を解析し、該解析された文書を文単位に
    分割し、表現の重要度を記述した第1のテーブルを参照
    して、該文単位に分割された各文中に含まれている表現
    の重要度から各文に重要度を付与することを特徴とする
    文書重要文ランキングプログラムを記録した記録媒体。
  12. 【請求項12】前記プログラムにより、 前記文書の各単語毎に表層表記、標準表記、及び品詞の
    属性を付与する請求項11記載の文書重要文ランキング
    プログラムを記録した記録媒体。
  13. 【請求項13】前記第1のテーブルには、 接続情報、表層表記、標準表記、及び品詞の組毎に重要
    度が記述されている請求項11記載の文書重要文ランキ
    ングプログラムを記録した記録媒体。
  14. 【請求項14】前記プログラムにより、 重要度を調整する表現を記述した第2のテーブルを参照
    して、前記各文の重要度を調整することを含む請求項1
    1記載の文書重要文ランキングプログラムを記録した記
    録媒体。
  15. 【請求項15】前記プログラムにより、 前記各文に付与された重要度を参照して、前記文書を要
    約することを含む請求項11記載の文書重要文ランキン
    グプログラムを記録した記録媒体。
JP31512098A 1998-11-05 1998-11-05 文書重要文ランキング方法、文書重要文ランキング装置、及び文書重要文ランキングプログラムを記録した記録媒体 Expired - Lifetime JP3612597B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31512098A JP3612597B2 (ja) 1998-11-05 1998-11-05 文書重要文ランキング方法、文書重要文ランキング装置、及び文書重要文ランキングプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31512098A JP3612597B2 (ja) 1998-11-05 1998-11-05 文書重要文ランキング方法、文書重要文ランキング装置、及び文書重要文ランキングプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2000148767A true JP2000148767A (ja) 2000-05-30
JP3612597B2 JP3612597B2 (ja) 2005-01-19

Family

ID=18061657

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31512098A Expired - Lifetime JP3612597B2 (ja) 1998-11-05 1998-11-05 文書重要文ランキング方法、文書重要文ランキング装置、及び文書重要文ランキングプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3612597B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024144A (ja) * 2000-07-05 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> 電子メール転送方法及び装置及び電子メール転送プログラムを格納した記憶媒体
WO2002027547A1 (fr) * 2000-09-25 2002-04-04 Kabushiki Kaisha Toshiba Procede pour relayer un message electronique, procede pour reconstituer un message raccourci, et station de relais de messages electroniques
JP2002132799A (ja) * 2000-10-20 2002-05-10 Oki Electric Ind Co Ltd 電子メール要約転送システム
JP2013161457A (ja) * 2012-02-08 2013-08-19 Nippon Telegr & Teleph Corp <Ntt> 文書要約装置及び方法及びプログラム
CN106776533A (zh) * 2015-11-20 2017-05-31 衍利行资产有限公司 用于分析一段文本的方法和系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024144A (ja) * 2000-07-05 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> 電子メール転送方法及び装置及び電子メール転送プログラムを格納した記憶媒体
WO2002027547A1 (fr) * 2000-09-25 2002-04-04 Kabushiki Kaisha Toshiba Procede pour relayer un message electronique, procede pour reconstituer un message raccourci, et station de relais de messages electroniques
JP2002132799A (ja) * 2000-10-20 2002-05-10 Oki Electric Ind Co Ltd 電子メール要約転送システム
JP2013161457A (ja) * 2012-02-08 2013-08-19 Nippon Telegr & Teleph Corp <Ntt> 文書要約装置及び方法及びプログラム
CN106776533A (zh) * 2015-11-20 2017-05-31 衍利行资产有限公司 用于分析一段文本的方法和系统
US10755594B2 (en) 2015-11-20 2020-08-25 Chrysus Intellectual Properties Limited Method and system for analyzing a piece of text
CN106776533B (zh) * 2015-11-20 2021-05-07 衍利行资产有限公司 用于分析一段文本的方法和系统

Also Published As

Publication number Publication date
JP3612597B2 (ja) 2005-01-19

Similar Documents

Publication Publication Date Title
US7440900B2 (en) Voice message processing system and method
US5127003A (en) Digital/audio interactive communication network
Schmandt Phoneshell: the telephone as computer terminal
US5621658A (en) Method and apparatus for communicating an electronic action from a data processing system to another data processing system via an audio device
US20030224760A1 (en) Method and apparatus for controlling data provided to a mobile device
JP2002334071A (ja) 言語的にインテリジェントなテキスト圧縮
EP1331574A1 (en) Named entity interface for multiple client application programs
US20060215298A1 (en) Information presentation apparatus, and information presentation method and program for use therein
US6631368B1 (en) Methods and apparatus for operating on non-text messages
US6240405B1 (en) Information processors having an agent function and storage mediums which contain processing programs for use in the information processor
US20040098266A1 (en) Personal speech font
JP2000148767A (ja) 文書重要文ランキング方法、文書重要文ランキング装置、及び文書重要文ランキングプログラムを記録した記録媒体
JPH11316762A (ja) 電子メール要約転送表示方法及び装置及び電子メール要約転送表示プログラムを格納した記憶媒体
JP2001272990A (ja) 対話記録編集装置
JPH11272686A (ja) 文書重要文抽出方法、文書重要文抽出装置及び文書重要文抽出プログラムを記録した記録媒体
JPH0944516A (ja) 情報フィルタリング装置
JP3849356B2 (ja) 文字変換装置及びその方法と文字変換のためのプログラムを記録した記録媒体
JP3691773B2 (ja) 文章解析方法とその方法を利用可能な文章解析装置
JP2021117759A (ja) テキスト情報編集装置及びテキスト情報編集方法
JP2000339241A (ja) 電子メールサブジェクト補完方法及び装置及び電子メールサブジェクト補完プログラムを格納した記憶媒体
JPH1069472A (ja) 文書処理装置及び文書処理プログラムを格納した記憶媒体
JP7304269B2 (ja) 書き起こし支援方法及び書き起こし支援装置
JP7317887B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
KR100277834B1 (ko) 도서 낭독 시스템 및 서비스 처리 방법
JP3529040B2 (ja) データベース装置、データベース管理方法及びデータベースの管理プログラムを格納する記憶媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040706

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040928

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041011

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071105

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081105

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091105

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101105

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101105

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111105

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111105

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121105

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121105

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131105

Year of fee payment: 9

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term