JP2002049632A - 要約システムとその要約方法、及び要約プログラムを記録した記録媒体 - Google Patents

要約システムとその要約方法、及び要約プログラムを記録した記録媒体

Info

Publication number
JP2002049632A
JP2002049632A JP2000236104A JP2000236104A JP2002049632A JP 2002049632 A JP2002049632 A JP 2002049632A JP 2000236104 A JP2000236104 A JP 2000236104A JP 2000236104 A JP2000236104 A JP 2000236104A JP 2002049632 A JP2002049632 A JP 2002049632A
Authority
JP
Japan
Prior art keywords
sentence
importance
thread
article
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000236104A
Other languages
English (en)
Inventor
Masaru Kusui
大 久寿居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2000236104A priority Critical patent/JP2002049632A/ja
Publication of JP2002049632A publication Critical patent/JP2002049632A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 電子メールやネットニュースやインターネッ
トの電子掲示板等におけるように、スレッドにまとめら
れた互いに関連する内容の記事を一括して要約する要約
システムを提供する。 【解決手段】 同一の主題に関する複数の記事をまとめ
たスレッドの、記事内容の要約文を生成する要約システ
ム100において、スレッド内の各記事の各文毎に当該
文がスレッド内の他の文との関係において成す重要度で
ある位置重要度を判定する位置重要度決定部16と、ス
レッド内の各記事において使用される各単語のスレッド
内において示される重要度である単語重要度を判定する
単語重要度決定部15と、各文に対する単語重量度の平
均値と位置重要度の値とを、定められた重み付けに従い
加えた値を、各文の重要度である文重要度として判定す
る文重要度決定部17と、文重要度が高く判定された文
を取り出して、取り出した文を予め定められた設定に基
づいて適切に配置することにより、スレッドの要約文を
生成する要約文作成部10を備えることを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文章の要約を自動
生成する要約システムに関し、特に、電子メールやネッ
トニュースや電子掲示板等の記事を要約する要約システ
ムとその要約方法、及び要約プログラムを記録した記録
媒体に関する。
【0002】
【従来の技術】要約システムは、電子メールやその他の
文章ファイルから、自動的にその内容の要約を出力する
システムである。
【0003】要約システムにより作成される要約文によ
り、多数の受信メール等の内容を確認する利用者の手間
が削減され、また長大な文章ファイルの記載内容を把握
することが容易となる。
【0004】従来の、要約システムによる要約文の作成
方法は、例えば、文章中の各単語の重要である度合いを
示す単語重要度を算出したり、又これを用いて文章中の
各文の重要である度合いを示す文重要度を算出し、この
重要度の高い文を抽出して、これを元の記載順等の所定
の順番に並べることにより、要約文書を作成することが
できる。
【0005】ここで、この従来の方式における単語重要
度の算出方法は、例えば、文章中の各単語の出現頻度を
算出し出現頻度に特徴のある単語や、また利用者やシス
テムにより指定された単語に対して高い重要度を設定す
る方式があり、また文重要度の算出方法は、例えば、文
中に含まれる各単語の単語重要度の和の値を用いる方式
がある。
【0006】こうした、従来の要約システムには、特開
平11−184865号公報や、特開平11−3167
62号公報に開示された従来技術がある。
【0007】
【発明が解決しようとする課題】しかし、上述した従来
の要約システムでは、以下に述べるような問題点があっ
た。
【0008】第1に、従来の要約システムでは、要約の
対象は一つの文章ファイルであり、複数のファイルをま
とめて要約の対象に指定することができなかった。
【0009】今日では、電子メールやネットニュース
や、インターネットのウェブサイト等において開設され
る電子掲示板等の多くの場面において、各テーマ毎にそ
の関連する記事をツリー構造等によるスレッド毎にまと
めて表示する方式が採用されている。しかし、こうした
スレッドにまとめられた記事は、相互に関連し同一のテ
ーマに関する記事であっても、これを全て一括して要約
することはできなかった。
【0010】第2に、電子メール等の要約対象の文章に
おいては、メール受信者への挨拶や、メール差出人の名
前や、他のメールの内容の引用等が書式や記載位置等の
慣例に従い記載されているが、従来の要約システムで
は、文章中の各文や各単語がこうした独特の項目である
かどうかを、重要度の算出において区別していなかっ
た。
【0011】第3に、電子メールやネットニュース等の
記事においては、記事の題名や送信元や送信先等の詳細
の情報を示すためのヘッダが備えられているが、従来の
要約システムでは、このヘッダに示される情報をメール
の転送等のために使用するのみであって、本文中の単語
の単語重要度の判定等の、要約文の作成処理のために使
用することはできなかった。
【0012】本発明の第1の目的は、上記従来技術の欠
点を解決し、スレッドにまとめられた互いに関連する内
容の記事を一括して要約する要約システムとその要約方
法、及び要約プログラムを記録した記録媒体を提供する
ことである。
【0013】本発明の第2の目的は、上記従来技術の欠
点を解決し、文章中の各文章や各単語が、挨拶ではなく
本文の内容に関するものであるか、また他のメール等を
引用する文章であるか等を自動的に識別することにより
重要度を適正に判定し、その内容を適切に要約する要約
システムとその要約方法、及び要約プログラムを記録し
た記録媒体を提供することである。
【0014】本発明の第3の目的は、上記従来技術の欠
点を解決し、要約対象の電子メールやネットニュース等
の各記事のヘッダ情報を解析し、その解析結果を用いて
各記事やスレッド内の記事を適切に要約する要約システ
ムとその要約方法、及び要約プログラムを記録した記録
媒体を提供することである。
【0015】
【課題を解決するための手段】上記目的を達成するため
本発明の要約システムは、同一の主題に関する複数の記
事をまとめたスレッドの、記事内容の要約文を生成する
要約システムにおいて、前記スレッド内の各記事の各文
毎に、当該文が前記スレッド内の他の文との関係におい
て成す重要度である、位置重要度を判定する位置重要度
決定手段を備え、生成する要約文に、前記位置重要度の
高い文をより優先して含めることを特徴とする。
【0016】請求項2の本発明の要約システムは、前記
位置重要度の判定結果を参照し、前記スレッド内の各記
事の各文毎の重要度である文重要度を判定する文重要度
決定手段と、前記文の内で文重要度が高く判定された文
を取り出して、前記取り出した文を予め定められた設定
に基づいて適切に配置することにより、前記スレッドの
要約文を生成する手段を備えることを特徴とする。
【0017】請求項3の本発明の要約システムは、前記
スレッド内の各記事において使用される各単語の、前記
スレッド内において示される重要度である単語重要度を
判定する単語重要度決定手段を備え、前記文重要度決定
手段は、前記スレッド内の各記事の各文毎に、当該文に
おいて使用される各単語に対する前記単語重要度の判定
結果及び前記位置重要度の判定結果を参照し、前記文重
要度を判定することを特徴とする。
【0018】請求項4の本発明の要約システムは、前記
文重要度決定手段は、各文に対して、前記単語重量度の
平均値と前記位置重要度の値とを、予め定められた重み
付けに従い加えた値を、前記文重要度と判定することを
特徴とする。
【0019】請求項5の本発明の要約システムは、利用
者から、高い単語重要度を設定する単語の指定を受け付
けることを特徴とする。
【0020】請求項6の本発明の要約システムは、前記
ヘッダ部分のSubjectの項目における単語の、単
語重要度を上げるか否かの指定を受け付けることを特徴
とする。
【0021】請求項7の本発明の要約システムは、前記
スレッドは、複数の記事をツリー構造にまとめたもので
あることを特徴とする。
【0022】請求項8の本発明の要約システムは、ノー
ド数の多い記事に含まれる文の文重要度を上げることを
特徴とする。
【0023】請求項9の本発明の要約システムは、枝分
かれの多い記事に含まれる文の文重要度を上げることを
特徴とする。
【0024】請求項10の本発明の要約システムは、他
の記事から引用した文の文重要度を下げることを特徴と
する。
【0025】請求項11の本発明の要約システムは、要
約対象の前記記事を、電子メール又はネットニュースと
することを特徴とする。
【0026】請求項12の本発明の要約方法は、同一の
主題に関する複数の記事をまとめたスレッドの、記事内
容の要約文を生成する要約方法において、前記スレッド
内の各記事の各文毎に、当該文が前記スレッド内の他の
文との関係において成す重要度である、位置重要度を判
定するステップを備え、生成する要約文に、前記位置重
要度の高い文をより優先して含めることを特徴とする。
【0027】請求項13の本発明の要約方法は、前記位
置重要度の判定結果を参照し、前記スレッド内の各記事
の各文毎の重要度である文重要度を判定するステップ
と、前記文の内で文重要度が高く判定された文を取り出
して、前記取り出した文を予め定められた設定に基づい
て適切に配置することにより、前記スレッドの要約文を
生成するステップを備えることを特徴とする。
【0028】請求項14の本発明の要約方法は、前記ス
レッド内の各記事において使用される各単語の、前記ス
レッド内において示される重要度である単語重要度を判
定するステップと、前記スレッド内の各記事の各文毎
に、当該文において使用される各単語に対する前記単語
重要度の判定結果及び前記位置重要度の判定結果を参照
し、前記文重要度を判定するステップを備えることを特
徴とする。
【0029】請求項15の本発明の要約方法は、各文に
対して、前記単語重量度の平均値と前記位置重要度の値
とを、予め定められた重み付けに従い加えた値を、前記
文重要度と判定するステップを備えることを特徴とす
る。
【0030】請求項16の本発明の要約プログラムを記
録した記録媒体は、コンピュータを制御することによ
り、同一の主題に関する複数の記事をまとめたスレッド
の記事内容の要約文を生成する要約プログラムを記録し
た記録媒体において、前記スレッド内の各記事の各文毎
に、当該文が前記スレッド内の他の文との関係において
成す重要度である、位置重要度を判定するステップを備
え、生成する要約文に、前記位置重要度の高い文をより
優先して含めることを特徴とする。
【0031】請求項17の本発明の要約プログラムを記
録した記録媒体は、前記位置重要度の判定結果を参照
し、前記スレッド内の各記事の各文毎の重要度である文
重要度を判定するステップと、前記文の内で文重要度が
高く判定された文を取り出して、前記取り出した文を予
め定められた設定に基づいて適切に配置することによ
り、前記スレッドの要約文を生成するステップを備える
ことを特徴とする。
【0032】請求項18の本発明の要約プログラムを記
録した記録媒体は、前記スレッド内の各記事において使
用される各単語の、前記スレッド内において示される重
要度である単語重要度を判定するステップと、前記スレ
ッド内の各記事の各文毎に、当該文において使用される
各単語に対する前記単語重要度の判定結果及び前記位置
重要度の判定結果を参照し、前記文重要度を判定するス
テップを備えることを特徴とする。
【0033】請求項19の本発明の要約プログラムを記
録した記録媒体は、各文に対して、前記単語重量度の平
均値と前記位置重要度の値とを、予め定められた重み付
けに従い加えた値を、前記文重要度と判定するステップ
を備えることを特徴とする。
【0034】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0035】図1は、本発明の第1の実施の形態による
要約システム100の構造を示すブロック図である。
【0036】図1を参照すると、本実施の形態の要約シ
ステム100は、要約文作成部10、記事解析部11、
記事構造化部12、単語分割部13、単語頻度データベ
ース14、単語重要度決定部15、位置重要度決定部1
6、文重要度決定部17、記事データベース20、入力
部30、出力部40を備える。
【0037】記事データベース20は、要約処理の対象
である記事や文章を記録する。
【0038】記事データベース20に記録する記事や文
章は、例えば、利用者が通信ネットワークを介して受信
した電子メールやネットニュースの記事や、インターネ
ットやパソコン通信等の電子掲示板システムに投稿され
た記事等である。
【0039】また、これらの要約対象の記事は、同一の
テーマや関連する記事毎に複数の記事をスレッドにまと
めることができる。これは例えば、電子メールソフト等
における受信メールの一覧表示において前の記事の下に
返信記事の一覧を順次表示するツリー構造等により、複
数の記事を一つのスレッド内にまとめることができる。
【0040】入力部30は、利用者による要約システム
100への操作を受け付ける。
【0041】入力部30が受け付ける操作は、例えば、
要約する記事やスレッドの指定や、要約において重視す
る点をシステムに通知するための注目発言者や注目キー
ワードの指定等がある。
【0042】出力部40は、要約処理の実行により作成
された要約文を出力する。要約文の出力方法は、例え
ば、利用者のコンピュータ等のディスプレイに表示した
り、ワードプロセッサや、ウェブブラウザや、本実施の
形態の要約システム100に対応するメールソフトに対
し要約文のデータを通知して表示させる方式や、利用者
のメールアドレスに対し送信する等の方式が可能であ
る。
【0043】要約文作成部10は、本実施の形態の要約
システム100の他の各部とデータや命令を送受し、要
約文の作成処理を実行する。
【0044】本実施の形態の要約文作成部10は、要約
対象のスレッド内の各記事の各文毎の重要度の判定を受
けて、重要と判定された文を取り出して、これを所定の
順番(投稿順等)に並べることにより、要約文を作成す
る。
【0045】以下に説明するように、各文毎の重要度の
判定は、本実施の形態の要約システム100の残りの各
部により処理される。
【0046】図2は、本実施の形態における記事の解析
処理を説明するためのフローチャートであり、図3は、
本実施の形態における要約文の作成処理を説明するため
のフローチャートである。
【0047】まず、本実施の形態の要約システム100
は、予め要約対象の記事を解析し、その解析結果をデー
タベース等に記録しておく。
【0048】この事前の処理においては、記事解析部1
1、記事構造化部12、単語分割部13により、各記事
の参照関係や本文中における引用文等の個所が認識さ
れ、また記事において使用される単語の頻度が単語頻度
データベース14に記録される。
【0049】また、要約対象の記事が、電子メールやネ
ットニュースにおけるように、各記事がその記事の情報
を記載したヘッダを含む形態においては、そのヘッダに
記載された情報を解析し利用する。
【0050】図2を参照すると、まず要約対象の記事を
新たに受け付けて記事データベース20に登録されると
(ステップ201)、記事解析部11は、登録された記
事の解析を実行する(ステップ202)。
【0051】この、新規記事の受付は、例えば、新しい
電子メールやネットニュースの記事を受信した場合に自
動的に登録する方式や、利用者が要約システム100を
操作してハードディスクに記録された記事のデータを指
定する等の方式が可能である。
【0052】図7は、記事データベース20に登録され
た記事の一例を示す図であり、図4は、本実施の形態の
記事解析部11による記事の解析処理(ステップ20
2)の一例を説明するためのフローチャートである。
【0053】図4の例を参照すると、記事解析部11に
よる、図7の例に示されるような電子メールやネットニ
ュース等の記事を解析する処理は、まず、記事データベ
ース20から記録された記事を取り出し(ステップ40
1)、取り出した記事をヘッダ部分と本文部分に分けて
ヘッダ情報を解析し(ステップ402)、本文部分を引
用部分、返答部分、シグネチャ部分に分類し引用部分と
返答部分の対応関係を判定する(ステップ403)。
【0054】記事解析部11によるヘッダ部分の解析に
おいては、例えば、図7の記事に対して「Messag
e−Id」(メッセージ識別子)が“<0012345
@prov.ne.jp>”であり、「In−Repl
y−To」(返信先アドレス)が“<001000@p
rovider.ne.jp>”であり、「Date」
(日付)が“Wed,12 Jan 2000 12:
16:00 +0900”であり、「From」(送信
元アドレス)が“tanaka@prov.ne.j
p”であり、「To」(送信先アドレス)が“Mail
ingList@address.ne.jp”であ
り、「Subject」(題名)が“Re:HDD増
設”であることが解析される。
【0055】記事解析部11による本文部分の解析にお
いては、引用部分を示す行頭の“>”や、記事の末尾の
シグネチャ部分や、電子メールの先頭等において記載さ
れることがあるメールプロバイダによる広告部分等の区
切りを示す記号を検出することにより、文章をこれらの
各部に区別することができる。
【0056】例えば、図7の記事に対して、行頭の
“>”を検出することにより、“> 新しいHDDは、
〜”以下の2行が引用部分であると認識され、同一の記
号“/”の並びを区切りとして検出することにより、
“/////”以下の2行をシグネチャ部分と解析する
ことができる。
【0057】また、一般に引用部分に続く段落には、引
用部分に対する返答の記載が行われるため、“増設HD
Dのパーティションを〜”以下の3行の段落を、引用部
分に対応する返答部分であると解析される。
【0058】この例では、本文中に引用と返答の対応が
一組の場合であるが、一つの記事本文中に複数の引用と
返答の組が含まれている場合においても、同様にして解
析することができる。
【0059】以上のようにして、記事解析部11による
記事の解析処理が終了すると、続いて記事構造化部12
は、この新規記事を含む記事データベース20内の各記
事の参照関係を判定する(ステップ203)。
【0060】記事構造化部12による各記事の参照関係
の判定は、記事解析部11による解析結果に基づき、記
事のヘッダ情報や引用と返答の組の情報を参照して行う
ことができる。
【0061】図9は、本実施の形態の記事構造化部12
による参照関係の判定結果の一例を示す図であり、ここ
では図6、図7、図8に示される3つの記事に対して、
参照される記事を親とし参照する記事を子として、順次
各記事をツリー構造に配置している。
【0062】また、単語分割部13により、単語頻度デ
ータベース14の更新を行う(ステップ204)。
【0063】図5は、本実施の形態の単語分割部13に
よる、単語頻度データベース14の更新処理の一例を説
明するフローチャートであり、単語分割部13は、この
新たな記事を単語毎に分割し(ステップ501)、記事
内で使用される単語の出現頻度を数え(ステップ50
2)、単語頻度データベース14の各テーブルの記録を
更新する(ステップ503)。この単語の出現頻度の情
報は、各単語毎の重要度の判定に用いられる。
【0064】単語分割部13による文章の単語への分割
方法は、例えば、形態素解析を使う方法や、ひらがな、
カタカナ、漢字、アルファベット、数字などの文字種が
変わる毎に単語区切りとみなす方法等、各種の従来の技
術を用いることができる。
【0065】また、本実施の形態の各単語の出現頻度の
数え上げ処理においては、記事解析部11における解析
結果を用いることにより、引用記号(引用を示す記号、
例えば“>”等)や、引用部分の文章に含まれる単語
や、シグネチャ部分を除くことができる。その他にも、
シソーラス辞書(類義語辞書)を用いて同義語は一つに
まとめて数えたり、付属語の無視や、数え上げにおいて
無視する語句を規定する不要語辞書を備えて不要語辞書
に含まれる単語を省く等の処理を行うことが可能であ
り、これらの方法を用いることにより要約の精度を高め
ることができる。
【0066】単語頻度データベース14は、単語分割部
13により数え上げられたデータを記録するための各種
のテーブルを備えており、例えば、各記事に含まれる単
語の出現頻度を記録する記事キーワード出現頻度テーブ
ル、各スレッドに含まれる単語の出現頻度を記録するス
レッドキーワード出現頻度テーブル、記事データベース
に含まれるスレッドを記録するスレッドテーブル、記事
データベース全体で含まれる単語の出現頻度を記録する
データベースキーワード出現頻度テーブル等を備え、こ
れらのテーブルのデータを単語分割部13による処理結
果を受けて各最新の情報に更新する。
【0067】ここで、具体例を用いて、単語分割部13
による処理を説明する。図7の記事を処理対処の記事と
し、又この例では、文字種が変わる毎に単語区切りとみ
なし、引用部分とシグネチャ部分に含まれる単語を数え
ない方式を用いるものとする。
【0068】単語分割部13が、上記方式により図7に
示す記事に対して含まれる単語を分割し、その各単語の
出現回数を数えると、「新、HDD(2)、E、ドライ
ブ(2)、認識、増設、パーティション(3)、基本、
作成(2)、思、削除、拡張」(括弧内の数字は記事内
での出現回数)、として結果が得られる。
【0069】図10は、図7に示す記事に含まれるキー
ワード出現頻度テーブルの一例を示す図である。この一
覧表においては、記事のMessage−Idと、記事
内に含まれる単語とその出現回数との対応を示してる。
【0070】図11は、スレッドキーワード出現頻度テ
ーブルの一例を示す図であり、図9に示されるスレッド
を構成する図6、図7、図8の各記事における記事キー
ワード出現頻度テーブルを合成したものであり、「Me
ssage−Id」の欄にはスレッドのルート(根)で
ある図6の記事のMessage−Idを示し、スレッ
ドを構成する各記事内に含まれる単語とその出現回数と
の対応を示してる。
【0071】図12は、記事データベース20内の各ス
レッドの治乱を示すスレッドテーブルの一例を示す図で
ある。図12の例では、は、記事データベース20内の
各スレッドを、その各スレッドのルートにあたる記事の
Message−Idを用いて表示している。また、こ
のスレッドテーブルにおいては、図9のスレッドを、そ
のスレッドのルートの記事(図6の記事)のメッセージ
ID(001000@provider.ne.jp)を用いて示している。
【0072】図13は、記事データベース20内の記事
全体のキーワード出現頻度を示すデータベースキーワー
ド出現頻度テーブルである。データベースキーワード出
現頻度テーブルは、例えば、各スレッドのスレッドキー
ワード出現頻度テーブルに示される出現頻度を合成した
値を用いて示すことができる。
【0073】次に、図3に示される、本実施の形態にお
ける要約文の作成処理を説明する。
【0074】要約文の作成処理においては、単語重要度
決定部15、位置重要度決定部16、文重要度決定部1
7等により、要約対象のスレッド内の記事を分析して各
文の重要度を判定し、重要度の高い文を取り出して要約
文を生成する。また、この重要度の判定においては、上
述の事前処理により更新された単語頻度データベース1
4の記録を参照する。
【0075】まず、入力部30から、利用者による要約
文の作成要求を受け付ける(ステップ301)。
【0076】この要約文の作成要求においては、要約対
象の記事やスレッドの指定を行う。その指定を行う操作
においては、例えば、マウスやキーボードを用いてコン
ピュータの画面上にツリー構造により表示される各記事
やスレッドを指定する等の方法が可能である。
【0077】また更に、要約文の作成要求においては、
要約対象の指定の他に、注目する発言者や重要なキーワ
ードの指定や、要約における詳細な設定を指定できるも
のとすることも可能である。ここで、要約における詳細
な設定としては、例えば、要約の方針として、「全体的
に要約」又「結論を中心に要約」を選択して指定する要
約意図の指示を行うこと等が可能である。
【0078】このように、要約文の作成要求を受け付け
ると、続いて単語重要度決定部15により、各単語の重
要度である単語重要度の判定を行う(ステップ30
2)。
【0079】これは、要約文の作成要求に応じて、要約
文作成部10が記事構造化部12から指定された記事を
含むスレッドを取り出し、単語分割部13が管理する単
語頻度データベース14を参照して、単語重要度決定部
15が各単語の重要度を決定する。
【0080】ここで、各単語の重要度の判定方法の詳細
な一実施例を説明する。
【0081】本実施の形態の単語重要度決定部15は、
各単語の重要度を、各単語の出現頻度を初期値として、
以下に示される操作によりその値を増減させて決定す
る。
【0082】(1)データベースキーワード出現頻度一
覧表において、出現頻度の多い単語の重要度を下げる。
【0083】(2)データベースキーワード出現頻度一
覧表において、出現頻度が少ない単語であり、かつスレ
ッド内で出現頻度が多い単語の重要度を上げる。
【0084】(3)予め利用者が指定したキーワード
の、重要度を上げる。
【0085】(4)利用者が指定した要約意図が「全体
的に要約」である場合には、記事のSubject(題
名)に含まれる単語の重要度を上げる。
【0086】(5)利用者が指定した要約意図が「結論
を中心に要約」である場合には、記事のSubject
に含まれる単語の重要度を下げる。
【0087】ここで、出現頻度の多いか少ないかの判定
方法は、例えば、上位20%、下位20%等の所定の範
囲に含まれるかどうかをチェックすることによる方法等
が可能である。
【0088】元の重要度の値の上げ下げは、例えば、2
0%増、20%減というように、所定の定数を乗じるこ
とによる方法等が可能である。この場合の増減率は、例
えば利用者が指定したキーワードの場合には重要度を3
0%上げるというように、それぞれの操作で異なる乗率
を用いてもよい。また更に、データベースキーワード出
現頻度一覧表において出現頻度の多い単語の場合に、出
現頻度が多いほど重要度の減少率を大きくするといった
方法も可能である。
【0089】ここで、具体例を用いて、単語重要度決定
部15による単語重要度の判定処理を説明する。ここで
は、利用者が図9に示すスレッドの要約作成を指示し、
注目する発言者やキーワードの指定はなく、要約意図と
して「全体的に要約」を選択した例を考える。
【0090】また、単語重要度を増減する処理において
は、その各ステップにおいて20%増又は20%減の処
理を実行するものとして説明する。
【0091】まず、単語分割部13が管理する単語頻度
データベース14から、図9のスレッドの各記事に含ま
れる単語とその出現頻度の対応を示すテーブルである図
11のスレッドキーワード出現頻度テーブルと、図13
のデータベースキーワード出現頻度テーブルを取り出
す。
【0092】ここで図13のデータベースキーワード出
現頻度テーブルにおいては、「データ」から「作成」ま
でが上位20%に含まれる単語であり、「プライマリ」
から下が下位20%に含まれる単語とする。
【0093】重要度の増減は、前述の方法により以下の
ように実行される。
【0094】(1)データベースキーワード出現頻度テ
ーブルにおいて、出現頻度が上位20%に含まれる単語
の重要度を、20%下げる。この条件にあてはまる単語
は「増設、認識、新、接続、作成」である。
【0095】(2)データベースキーワード出現頻度テ
ーブルにおいて、出現頻度が下位20%に含まれる単語
であり、かつスレッドキーワード出現頻度テーブルにお
いて出現頻度が上位20%に含まれる単語の重要度を、
20%上げる。この条件にあてはまる単語は「プライマ
リ、IDE」である。
【0096】(3)利用者が指定した要約意図が「全体
的に要約」の場合においては、記事のSubjectに
含まれる単語の重要度を20%上げる。図9のスレッド
の各記事のSubjectは、「HDD増設」及びこの
記事に対する返信であるため、この条件に該当する単語
は「HDD、増設」である。
【0097】図14は、上記の増減処理の実行により得
られる、本実施の形態の単語重要度決定部15による単
語重要度の判定結果を示す図である。
【0098】各単語の重要度が決定されると、次に要約
文作成部10は、位置重要度決定部16に指示して、ス
レッドに含まれる各記事中の各文の位置重要度を決定す
る(ステップ303)。
【0099】各文の位置重要度は、その文のスレッド内
の他の文との関連において示される重要度であり、各文
が含まれる記事内の文の位置的特徴、各文が含まれる記
事の特徴、各文が含まれる記事を含むスレッドの特徴を
考慮して決定される。
【0100】ここでは、各記事のヘッダ部分、引用部
分、シグネチャ部分等におけるような、不要な部分や他
の記事と重複する部分を除いた残りの各文に関して位置
重要度を計算する。
【0101】位置重要度は、各文毎に“1”を初期値と
して設定し、以下の処理により値を増減することにより
決定する。
【0102】(1)スレッドの特徴として、スレッドの
ツリー構造の形状を調べる。
【0103】スレッド木構造のルートから末端の各葉に
至るまでの各記事のノード数(子ノード数)を調べ、ノ
ード数を多く備える記事に含まれる文の位置重要度を上
げる。
【0104】また、スレッドのツリー構造の各ノード毎
に枝分かれの数を調べ、枝分かれの数が多い記事に含ま
れる文の位置重要度を上げる。
【0105】スレッドのルートにあたる記事には質問事
項が記載されていることが多く、末端の葉にあたる記事
には質問の最終的な回答や結論が含まれることが多いた
め、こうしたルートの記事と末端の葉にあたる記事に含
まれる文の位置重要度を上げる。
【0106】(2)各文の記事内において記載された位
置を識別し、各文の位置重要度を評価する。
【0107】子にあたる記事から引用されている文は、
位置重要度を上げる。
【0108】スレッドのツリー構造のルートにあたる記
事の投稿者を調べ、同じ投稿者の記事に含まれる引用で
ない文は、位置重要度を上げる。これは、再び関連する
質問を行っていたり、その他最初の質問に関する説明等
が記載されていることが多いため重視するのである。
【0109】記事中の引用と返答のペアを検出し、ルー
トにあたる記事以外でペアになっていない部分において
は、挨拶文等の不要な部分であることが多いため位置重
要度を下げ、一組しかペアがない場合には結論が述べら
れている場合が多いため位置重要度を上げる。
【0110】重要度の上げ下げは、例えば、20%増又
は20%減のように定数を掛ける等の方法により行うこ
とができる。また、この増減率は、各操作毎に異なるも
のでもよく、それぞれに適切な乗率を用いればよい。
【0111】ここで、具体例を用いて、位置重要度決定
部16による位置重要度の判定処理を説明する。ここで
は、利用者が図9に示すスレッドの要約作成を指示し、
注目する発言者やキーワードは特に指定せず、要約意図
として「全体的に要約」を選択した例を考える。
【0112】また、位置重要度を増減する処理において
は、その各ステップにおいて20%増又は20%減の処
理を実行するものとして説明する。
【0113】図9のスレッドを構成する図7、図6、図
8に示した記事から、ヘッダ部分、引用部分、シグネチ
ャ部分の不要な部分を除くと、図15に示される文51
から文55までの5つの文が残る。
【0114】スレッドの木構造に対して、根から各葉ま
でのノード数を調べると、各記事のノード数は、図6の
記事、図7の記事、図8の記事の順に多く、ノード数の
多い記事に含まれる文の位置重要度を20%ずつ増加さ
せる。
【0115】ここでは、文51から文55までの全ての
記事の文の位置重要度を、20%ずつ増加させるものと
する。
【0116】また、このスレッド木構造は枝分かれを持
たないため、枝分かれの多い記事に含まれる文の位置重
要度の増加は行わない。
【0117】スレッドの根にあたる図6記事、末端の葉
にあたる図8の記事に含まれる文の位置重要度を20%
ずつ増加させるため、これらの記事に含まれる文であ
る、文51、文52、文53、文55の位置重要度を、
20%ずつ増加させる。
【0118】子にあたる記事で引用されている文の位置
重要度を上げるため、文53と文54の位置重要度を2
0%ずつ増加させる。
【0119】スレッドのツリー構造のルートにあたる記
事の投稿者を調べ、同じ投稿者の記事に含まれる文の位
置重要度を上げるため、文55の位置重要度を20%増
加させる。
【0120】記事中の引用と返答のペアを探し、根にあ
たる記事以外でペアになっていない部分では挨拶等であ
ることが多いため位置重要度を下げ、一組しかペアがな
い場合には結論を述べている場合が多いので位置重要度
を上げる。よって、文54と文55の文の位置重要度を
20%ずつ増加させる。
【0121】以上の、重要度の増減を行った後の各文の
位置重要度の値は、小数点第二位まで計算すると、文5
1の文の位置重要度は“1.44”、文52の文の位置
重要度は“1.44”、文53の文の位置重要度は
“1.73”、文54の文の位置重要度は“1.7
3”、文55の文の位置重要度は“2.07”、と決定
される。
【0122】このようにして各文の位置重要度が決定さ
れると、次に要約文作成部10は、文重要度決定部17
に指示して、スレッドに含まれる各記事中の各文の文重
要度を決定する(ステップ304)。
【0123】文の重要度は、これまでに判定された各単
語の重要度や、各文の位置重要度を用いて算定すること
ができる。例えば、重みパラメータ“α”を用いて「文
重要度=(単語重要度の平均値)+α*(位置重要
度)」として決定することができる。
【0124】ここで、文重要度決定部17による文重要
度の判定を、上述の具体例を用いて説明する。重みパラ
メータ“α”は、“2”として説明する。
【0125】まず、文51の場合は次のように計算され
る。
【0126】文51は、「プライマリ、マスタ、接続、
HDD、IDE、2、区切、C、D、ドライブ、使」と
いう単語を含むため、図14に示された各単語の重要度
により文51の単語重要度の和は、1.2+2+0.8
+6+1.2+1+1+1+2+6+1=23.2と計
算され、文51に含まれる単語数が11のため単語重要
度の平均値は23.2/11=2.11である。従っ
て、文51の文重要度は2.11+2*1.44=4.
99と計算される。
【0127】同様に、文52の文重要度は“5.7
2”、文53の文重要度は“7.06”、文54の文重
要度は“5.86”、文55の文重要度は“5.14”
と計算される。
【0128】各文の文重要度が決定されると、要約文作
成部10は、要約文の作成を行う(ステップ305)。
【0129】この、要約文作成部10による要約文の作
成方法は、例えば、文重要度の高い文から順に取り出
し、各文の出現順序順に並べる等の方法により要約文を
作成することができる。作成した要約文は、出力部40
を通して利用者に提示しる。
【0130】ここで、取り出す文の分量は、全体の文に
対する要約文の文の数を要約率として予め設定しておく
方式や、予め取り出す文の数を指定しておいたり、利用
者が要約文の作成要求を行うときにその数や割合を入力
して指定する等の方法が可能である。
【0131】例えば、2つの文を取り出して要約文を作
成する場合においては、要約文作成部10は、文重要度
の大きい順に文53と文54が取り出し、各文の出現順
に並べることにより、「新しいHDDはEドライブとし
て認識させたいのですが、どのようにすればよいのでし
ょうか。増設HDDのパーティションを基本パーティシ
ョンで作成されたと思いますので、これを削除し拡張パ
ーティションを作成すればEドライブになります。」が
要約文として生成され、出力部40を通して利用者に提
示される。
【0132】以上説明した本実施の形態の要約システム
100により、電子メールやネットニュースやインター
ネットの電子掲示板等におけるように、スレッドにまと
められた互いに関連する内容の記事を一括して要約する
ことができる。
【0133】なお、本実施の形態の要約システム100
は、要約文作成部10、記事解析部11、記事構造化部
12、単語分割部13、単語頻度データベース14、単
語重要度決定部15、位置重要度決定部16、文重要度
決定部17等の機能や、その他の機能をハードウェア的
に実現することは勿論として、各機能を備えるコンピュ
ータプログラムを、コンピュータ処理装置のメモリにロ
ードされることで実現することができる。このコンピュ
ータプログラムは、磁気ディスク、半導体メモリその他
の記録媒体90に格納される。そして、その記録媒体か
らコンピュータ処理装置にロードされ、コンピュータ処
理装置の動作を制御することにより、上述した各機能を
実現する。
【0134】また、上記第1の実施の形態においては、
スレッドにおいて各記事をツリー構造(木構造)に配置
しているが、この形態に限られるものではなく、記事構
造化部12は、各記事内において引用を行う全ての記事
を参照先として判定する方式も同様に可能である。
【0135】また、上記第1の実施の形態においては、
電子メールやネットニュースの記事やスレッドを要約の
対象としているが、これに限られるものではなく、他の
記事への参照やリンクの設定を備える任意のひとまとま
りの記事を、同様に要約の対象とすることができる。
【0136】例えば、インターネットのウェブページ
を、各ウェブサイト毎にまとめて一括して要約すること
等が考えられる。ただし、ウェブページにおいては、電
子メール等の様にヘッダ情報を備えないため、この場合
は、第1の実施の形態におけるヘッダ情報に対する処理
は省略する。
【0137】以上好ましい実施の形態及び実施例をあげ
て本発明を説明したが、本発明は必ずしも上記実施の形
態及び実施例に限定されるものではなく、その技術的思
想の範囲内において様々に変形して実施することができ
る。
【0138】
【発明の効果】以上説明したように本発明の要約システ
ムによれば、以下のような効果が達成される。
【0139】第1に、電子メールやネットニュースやイ
ンターネットの電子掲示板等におけるように、スレッド
にまとめられた互いに関連する内容の記事を一括して要
約することができる。
【0140】第2に、スレッド内の記事を一括して要約
する場合において、他の記事を引用した個所や記事内の
挨拶文等を自動的に認識することにより、要約文におい
て同一の文章が重複して現れることや、挨拶文等の不要
な文を含むことを防止することができる。
【0141】第3に、スレッド内における各記事の重要
度を適正に識別して要約文を作成することができる。例
えば、ツリー構造に各記事が配置されたスレッドにおい
ては、スレッド内の議論の出発点であるルートの記事や
他の多くの記事により引用される記事等を重視して、こ
れらの重要な記事の文章を、要約文により多く取り入れ
ることができる。
【図面の簡単な説明】
【図1】 本発明の第1の実施の形態による要約システ
ムの構造を示すブロック図である。
【図2】 本発明の第1の実施の形態における記事の解
析処理を説明するためのフローチャートである。
【図3】 本発明の第1の実施の形態における要約文の
作成処理を説明するためのフローチャートである。
【図4】 本発明の第1の実施の形態の記事解析部によ
る記事の解析処理の一例を説明するためのフローチャー
トである。
【図5】 本発明の第1の実施の形態の単語分割部によ
る単語頻度データベースの更新処理の一例を説明するた
めのフローチャートである。
【図6】 本発明の第1の実施の形態の記事データベー
スに記録された記事の一例を示す図である。
【図7】 本発明の第1の実施の形態の記事データベー
スに記録された記事の一例を示す図である。
【図8】 本発明の第1の実施の形態の記事データベー
スに記録された記事の一例を示す図である。
【図9】 本発明の第1の実施の形態の記事構造化部に
よる参照関係の判定結果の一例を示す図である。
【図10】 本発明の第1の実施の形態の単語頻度デー
タベースに記録されたキーワード出現頻度テーブルの一
例を示す図である。
【図11】 本発明の第1の実施の形態の単語頻度デー
タベースに記録されたスレッドキーワード出現頻度テー
ブルの一例を示す図である。
【図12】 本発明の第1の実施の形態の単語頻度デー
タベースに記録されたスレッドテーブル一例を示す図で
ある。
【図13】 本発明の第1の実施の形態の単語頻度デー
タベースに記録されたデータベースキーワード出現頻度
テーブルの一例を示す図である。
【図14】 本発明の第1の実施の形態のスレッドに含
まれる単語重要度の計算結果の一例を示す図である。
【図15】 本発明の第1の実施の形態のスレッドに含
まれる文の一例を示す図である。
【符号の説明】
100 要約システム 10 要約文作成部 11 記事解析部 12 記事構造化部 13 単語分割部 14 単語頻度データベース 15 単語重要度決定部 16 位置重要度決定部 17 文重要度決定部 20 記事データベース 30 入力部 40 出力部 51、52、53、54、55 文 90 記録媒体

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 同一の主題に関する複数の記事をまとめ
    たスレッドの、記事内容の要約文を生成する要約システ
    ムにおいて、 前記スレッド内の各記事の各文毎に、当該文が前記スレ
    ッド内の他の文との関係において成す重要度である、位
    置重要度を判定する位置重要度決定手段を備え、 生成する要約文に、前記位置重要度の高い文をより優先
    して含めることを特徴とする要約システム。
  2. 【請求項2】 前記位置重要度の判定結果を参照し、前
    記スレッド内の各記事の各文毎の重要度である文重要度
    を判定する文重要度決定手段と、 前記文の内で文重要度が高く判定された文を取り出し
    て、前記取り出した文を予め定められた設定に基づいて
    適切に配置することにより、前記スレッドの要約文を生
    成する手段を備えることを特徴とする請求項1に記載の
    要約システム。
  3. 【請求項3】 前記スレッド内の各記事において使用さ
    れる各単語の、前記スレッド内において示される重要度
    である単語重要度を判定する単語重要度決定手段を備
    え、 前記文重要度決定手段は、 前記スレッド内の各記事の各文毎に、当該文において使
    用される各単語に対する前記単語重要度の判定結果及び
    前記位置重要度の判定結果を参照し、前記文重要度を判
    定することを特徴とする請求項2に記載の要約システ
    ム。
  4. 【請求項4】 前記文重要度決定手段は、 各文に対して、前記単語重量度の平均値と前記位置重要
    度の値とを、予め定められた重み付けに従い加えた値
    を、前記文重要度と判定することを特徴とする請求項3
    に記載の要約システム。
  5. 【請求項5】 利用者から、高い単語重要度を設定する
    単語の指定を受け付けることを特徴とする請求項3又は
    請求項4に記載の要約システム。
  6. 【請求項6】 前記ヘッダ部分のSubjectの項目
    における単語の、単語重要度を上げるか否かの指定を受
    け付けることを特徴とする請求項3から請求項5のいず
    れか一つに記載の要約システム。
  7. 【請求項7】 前記スレッドは、複数の記事をツリー構
    造にまとめたものであることを特徴とする請求項1から
    請求項6のいずれか一つに記載の要約システム。
  8. 【請求項8】 ノード数の多い記事に含まれる文の文重
    要度を上げることを特徴とする請求項1から請求項7の
    いずれか一つに記載の要約システム。
  9. 【請求項9】 枝分かれの多い記事に含まれる文の文重
    要度を上げることを特徴とする請求項1から請求項8の
    いずれか一つに記載の要約システム。
  10. 【請求項10】 他の記事から引用した文の文重要度を
    下げることを特徴とする請求項1から請求項9のいずれ
    か一つに記載の要約システム。
  11. 【請求項11】 要約対象の前記記事を、電子メール又
    はネットニュースとすることを特徴とする請求項1から
    請求項10のいずれか一つに記載の要約システム。
  12. 【請求項12】 同一の主題に関する複数の記事をまと
    めたスレッドの、記事内容の要約文を生成する要約方法
    において、 前記スレッド内の各記事の各文毎に、当該文が前記スレ
    ッド内の他の文との関係において成す重要度である、位
    置重要度を判定するステップを備え、 生成する要約文に、前記位置重要度の高い文をより優先
    して含めることを特徴とする要約方法。
  13. 【請求項13】 前記位置重要度の判定結果を参照し、
    前記スレッド内の各記事の各文毎の重要度である文重要
    度を判定するステップと、 前記文の内で文重要度が高く判定された文を取り出し
    て、前記取り出した文を予め定められた設定に基づいて
    適切に配置することにより、前記スレッドの要約文を生
    成するステップを備えることを特徴とする請求項12に
    記載の要約方法。
  14. 【請求項14】 前記スレッド内の各記事において使用
    される各単語の、前記スレッド内において示される重要
    度である単語重要度を判定するステップと、 前記スレッド内の各記事の各文毎に、当該文において使
    用される各単語に対する前記単語重要度の判定結果及び
    前記位置重要度の判定結果を参照し、前記文重要度を判
    定するステップを備えることを特徴とする請求項13に
    記載の要約方法。
  15. 【請求項15】 各文に対して、前記単語重量度の平均
    値と前記位置重要度の値とを、予め定められた重み付け
    に従い加えた値を、前記文重要度と判定するステップを
    備えることを特徴とする請求項14に記載の要約方法。
  16. 【請求項16】 コンピュータを制御することにより、
    同一の主題に関する複数の記事をまとめたスレッドの記
    事内容の要約文を生成する要約プログラムを記録した記
    録媒体において、 前記スレッド内の各記事の各文毎に、当該文が前記スレ
    ッド内の他の文との関係において成す重要度である、位
    置重要度を判定するステップを備え、 生成する要約文に、前記位置重要度の高い文をより優先
    して含めることを特徴とする要約プログラムを記録した
    記録媒体。
  17. 【請求項17】 前記位置重要度の判定結果を参照し、
    前記スレッド内の各記事の各文毎の重要度である文重要
    度を判定するステップと、 前記文の内で文重要度が高く判定された文を取り出し
    て、前記取り出した文を予め定められた設定に基づいて
    適切に配置することにより、前記スレッドの要約文を生
    成するステップを備えることを特徴とする請求項16に
    記載の要約プログラムを記録した記録媒体。
  18. 【請求項18】 前記スレッド内の各記事において使用
    される各単語の、前記スレッド内において示される重要
    度である単語重要度を判定するステップと、前記スレッ
    ド内の各記事の各文毎に、当該文において使用される各
    単語に対する前記単語重要度の判定結果及び前記位置重
    要度の判定結果を参照し、前記文重要度を判定するステ
    ップを備えることを特徴とする請求項17に記載の要約
    プログラムを記録した記録媒体。
  19. 【請求項19】 各文に対して、前記単語重量度の平均
    値と前記位置重要度の値とを、予め定められた重み付け
    に従い加えた値を、前記文重要度と判定するステップを
    備えることを特徴とする請求項18に記載の要約プログ
    ラムを記録した記録媒体。
JP2000236104A 2000-08-03 2000-08-03 要約システムとその要約方法、及び要約プログラムを記録した記録媒体 Withdrawn JP2002049632A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000236104A JP2002049632A (ja) 2000-08-03 2000-08-03 要約システムとその要約方法、及び要約プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000236104A JP2002049632A (ja) 2000-08-03 2000-08-03 要約システムとその要約方法、及び要約プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2002049632A true JP2002049632A (ja) 2002-02-15

Family

ID=18728214

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000236104A Withdrawn JP2002049632A (ja) 2000-08-03 2000-08-03 要約システムとその要約方法、及び要約プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2002049632A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005234635A (ja) * 2004-02-17 2005-09-02 Fuji Xerox Co Ltd 文書要約装置および方法
EP1591941A1 (en) * 2004-04-27 2005-11-02 Avaya Technology Corp. Method and apparatus for summarizing one or more text messages using indicative summaries
JP2007087138A (ja) * 2005-09-22 2007-04-05 Nec Corp 通信端末、メール配信サーバおよびメール配信システム
JP2009048394A (ja) * 2007-08-20 2009-03-05 Nippon Telegr & Teleph Corp <Ntt> 文書間距離演算装置、文書間距離演算方法、プログラムおよび記録媒体
JP5933863B1 (ja) * 2015-05-22 2016-06-15 株式会社Ubic データ分析システム、制御方法、制御プログラム、および記録媒体
WO2017094202A1 (ja) * 2015-12-01 2017-06-08 アイマトリックス株式会社 画像処理を応用した文書構造解析装置
JP6205466B1 (ja) * 2016-07-19 2017-09-27 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06348696A (ja) * 1993-06-03 1994-12-22 Xerox Corp 自動識別方法
JPH09106331A (ja) * 1995-10-12 1997-04-22 Hitachi Ltd 電子掲示板ブラウザ
JPH10134066A (ja) * 1996-10-29 1998-05-22 Matsushita Electric Ind Co Ltd 文章集約装置
JPH1125099A (ja) * 1997-06-27 1999-01-29 Hitachi Ltd 電子会議システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06348696A (ja) * 1993-06-03 1994-12-22 Xerox Corp 自動識別方法
JPH09106331A (ja) * 1995-10-12 1997-04-22 Hitachi Ltd 電子掲示板ブラウザ
JPH10134066A (ja) * 1996-10-29 1998-05-22 Matsushita Electric Ind Co Ltd 文章集約装置
JPH1125099A (ja) * 1997-06-27 1999-01-29 Hitachi Ltd 電子会議システム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005234635A (ja) * 2004-02-17 2005-09-02 Fuji Xerox Co Ltd 文書要約装置および方法
EP1591941A1 (en) * 2004-04-27 2005-11-02 Avaya Technology Corp. Method and apparatus for summarizing one or more text messages using indicative summaries
US8868670B2 (en) 2004-04-27 2014-10-21 Avaya Inc. Method and apparatus for summarizing one or more text messages using indicative summaries
JP2007087138A (ja) * 2005-09-22 2007-04-05 Nec Corp 通信端末、メール配信サーバおよびメール配信システム
JP2009048394A (ja) * 2007-08-20 2009-03-05 Nippon Telegr & Teleph Corp <Ntt> 文書間距離演算装置、文書間距離演算方法、プログラムおよび記録媒体
JP5933863B1 (ja) * 2015-05-22 2016-06-15 株式会社Ubic データ分析システム、制御方法、制御プログラム、および記録媒体
WO2016189606A1 (ja) * 2015-05-22 2016-12-01 株式会社Ubic データ分析システム、制御方法、制御プログラム、および記録媒体
WO2017094202A1 (ja) * 2015-12-01 2017-06-08 アイマトリックス株式会社 画像処理を応用した文書構造解析装置
JP6205466B1 (ja) * 2016-07-19 2017-09-27 ヤフー株式会社 生成装置、生成方法、及び生成プログラム
JP2018013876A (ja) * 2016-07-19 2018-01-25 ヤフー株式会社 生成装置、生成方法、及び生成プログラム

Similar Documents

Publication Publication Date Title
US10853566B2 (en) Systems and methods for automatically creating tables using auto-generated templates
JP3703080B2 (ja) ウェブコンテンツを簡略化するための方法、システムおよび媒体
AU2012327239B8 (en) Method and apparatus for automatically summarizing the contents of electronic documents
US20160342578A1 (en) Systems, Methods, and Media for Generating Structured Documents
US8868670B2 (en) Method and apparatus for summarizing one or more text messages using indicative summaries
US20150067476A1 (en) Title and body extraction from web page
US20070078889A1 (en) Method and system for automated knowledge extraction and organization
TW200527863A (en) Method and apparatus for filtering email spam based on similarity measures
KR20160042896A (ko) 마이닝된 하이퍼링크 텍스트 스니펫을 통한 이미지 브라우징
US20070179937A1 (en) Apparatus, method, and computer program product for extracting structured document
JP2002049632A (ja) 要約システムとその要約方法、及び要約プログラムを記録した記録媒体
JP2003141027A (ja) 要約作成方法および要約作成支援装置およびプログラム
US11615164B2 (en) Dynamic website creation system and method
JP2010165218A (ja) 電子メール表示制御装置、電子メール表示制御方法、及び、プログラム
JP5178077B2 (ja) 議論状況把握支援装置および方法
JP2001265774A (ja) 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム
CN109670183A (zh) 一种文本重要性的计算方法、装置、设备和存储介质
JP2002215645A (ja) 文書処理装置
US20220138407A1 (en) Document Writing Assistant with Contextual Search Using Knowledge Graphs
JP2000250908A (ja) 電子書籍の作成支援装置
JP3465615B2 (ja) 検索方法ならびに装置及び同方法がプログラムされ記録された記録媒体
US9280603B2 (en) Generating descriptions of matching resources based on the kind, quality, and relevance of available sources of information about the matching resources
JP4484957B1 (ja) 検索式生成装置、検索式生成方法、およびプログラム
KR20210136609A (ko) 영상 뉴스 콘텐츠 생성 장치 및 방법
JP5495425B2 (ja) 未知語を含む文章を修正するための文章修正プログラム、方法及び文章解析サーバ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091221

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100219

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20100419