JPH11345233A - 文書処理方法および装置ならびに記録媒体 - Google Patents

文書処理方法および装置ならびに記録媒体

Info

Publication number
JPH11345233A
JPH11345233A JP3155099A JP3155099A JPH11345233A JP H11345233 A JPH11345233 A JP H11345233A JP 3155099 A JP3155099 A JP 3155099A JP 3155099 A JP3155099 A JP 3155099A JP H11345233 A JPH11345233 A JP H11345233A
Authority
JP
Japan
Prior art keywords
document
sentence
display area
electronic document
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3155099A
Other languages
English (en)
Other versions
JP4214598B2 (ja
Inventor
Katashi Nagao
確 長尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP03155099A priority Critical patent/JP4214598B2/ja
Priority to US09/282,349 priority patent/US7200808B1/en
Publication of JPH11345233A publication Critical patent/JPH11345233A/ja
Application granted granted Critical
Publication of JP4214598B2 publication Critical patent/JP4214598B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/048Indexing scheme relating to G06F3/048
    • G06F2203/04803Split screen, i.e. subdividing the display area or the window area into separate subareas

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 文書の要約を作成する。 【解決手段】 電子文書を処理するものであって、制御
部11は、入力部20への入力に応じて上記電子文書の
要約を表示する表示部30の表示領域の全表示領域内に
おける大きさを設定し、設定された表示領域の大きさに
基づいて要約の長さを決定し、表示領域内におさまるよ
う上記電子文書の要約を作成する作成し、作成された要
約を、表示部30の領域に表示させるように制御する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文書を処理する文
書処理方法および装置ならびに文書を処理する文書処理
プログラムが記録された記録媒体、詳しくは、文書の要
約を表示する要約ウィンドウのサイズに応じて要約を生
成するような文書処理方法および装置ならびに記録媒体
に関する。
【0002】
【従来の技術】従来、インターネットにおいて、ウィン
ドウ形式でハイパーテキスト型情報を提供するアプリケ
ーションサービスとしてWWW(World Wide Web)が提
供されている。
【0003】WWWは、文書の作成、公開または共有化
の文書処理を実行し、新しいスタイルの文書の在り方を
示したシステムである。しかし、文書の実際上の利用の
観点からは、文書の内容に基づいた文書の分類や要約と
いった、WWWを越える高度な文書処理が求められてい
る。このような高度な文書処理には、文書の内容の機械
的な処理が不可欠である。
【0004】しかしながら、文書の内容の機械的な処理
は、以下のような理由から依然として困難である。第1
に、ハイパーテキストを記述する言語であるHTML
(Hyper Text Markup Language)は、文書の表現につい
ては規定するが、文書の内容についてはほとんど規定し
ない。第2に、文書間に構成されたハイパーテキストの
ネットワークは、文書の読者にとって文書の内容を理解
するために必ずしも利用しやすいものではない。第3
に、一般に文章の著作者は読者の便宜を念頭に置かずに
著作するが、文書の読者の便宜が著作者の便宜と調整さ
れることはない。
【0005】このように、WWWは新しい文書の在り方
を示したシステムであるが、文書を機械的に処理しない
ために、高度な文書処理を行うことができなかった。換
言すると、高度な文書処理を実行するためには、文書を
機械的に処理することが必要となる。
【0006】そこで、文書の機械的な処理を目標とし
て、文書の機械的な処理を支援するシステムが自然言語
研究の成果に基づいて開発されている。自然言語研究に
よる文書処理の最初のステップとして、文書の著作者等
による文書の内部構造についての属性情報、いわゆるタ
グの付与を前提とした、文書に付与されたタグを利用す
る機械的な文書処理が提案されている。
【0007】ところで、ユーザは、たとえばいわゆるサ
ーチエンジンのような情報検索システムを利用して、イ
ンターネットを介して提供される膨大な情報から、所望
の情報を探し出すようにしている。この情報検索システ
ムは、指定されたキーワードに基づいて情報を検索し、
検索した情報をユーザに提供するシステムである。ユー
ザは、提供された情報から、所望の情報を選択する。
【0008】このように、容易に情報を検索することが
できるが、ユーザは、情報検索システムにより、提供さ
れた情報を一読し、概略を理解して、それが希望するも
のであるか否かを判断しなければならない。この作業
は、特に、提供された情報の量が多いとき、ユーザにと
って大きな負担となる。そこで、最近、テキスト情報、
すなわち文書の内容を自動的に要約するシステム、いわ
ゆる、自動要約作成システムが注目されている。
【0009】自動要約作成システムは、元の情報、すな
わち文書の大意を保持したまま、テキスト情報の長さ、
複雑さを減らすことにより、要約を作成するシステムで
あり、ユーザは、その要約を一読することで、文書の概
略を理解することができる。
【0010】通常、自動要約作成システムは、テキスト
中の文や単語を一つの単位とし、それに何らかの情報を
基に重要度を付与し、順序付けする。そして、上位に順
序付けられた文や単語が寄せ集められて、要約が作成さ
れる。
【0011】
【発明が解決しようとする課題】このように、自動要約
作成システムにより、文書から容易に要約を作成するこ
とは可能だが、従来、自動要約作成システムにより作成
される要約の情報量は、文書の情報量や、重要度の設定
方法などにより決定されていた。例えば、要約が簡略す
ぎて、文書の概略を把握できないとき、ユーザは、より
詳細な要約を参照することができない。
【0012】本発明は、上述の実情に鑑みて提案される
ものであって、ユーザの要求に対応した要約を作成し、
提供することができるような文書処理方法および装置、
ならびにユーザの要求に対応した要約を作成し、提供す
ることができるような文書処理プログラムが記録された
記録媒体を提供することを目的とする。
【0013】
【課題を解決するための手段】上述の課題を解決するた
めに、本発明に係る文書処理方法は、電子文書を処理す
る文書処理方法において、上記電子文書の要約を表示す
る表示領域の全表示領域内における大きさを設定する設
定工程と、上記設定工程で設定された表示領域の大きさ
に基づいて要約の長さを決定する決定工程と、上記決定
工程による決定に対応して、上記表示領域内におさまる
よう上記電子文書の要約を作成する作成工程と、上記作
成工程で作成された要約を、上記領域に表示させるよう
に制御する制御工程とを有するものである。
【0014】本発明に係る文書処理装置は、電子文書を
処理する文書処理装置において、上記電子文書の要約を
表示する表示領域の全表示領域内における大きさを設定
する設定手段と、上記設定手段で設定された表示領域の
大きさに基づいて要約の長さを決定する決定手段と、上
記決定手段による決定に対応して、上記表示領域内にお
さまるよう上記電子文書の要約を作成する作成手段と、
上記作成手段で作成された要約を、上記領域に表示させ
るように制御する制御手段とを有するものである。
【0015】本発明に係る記録媒体は、電子文書を処理
する文書処理プログラムが記録された記録媒体であっ
て、上記文書処理プログラムは、上記電子文書の要約を
表示する表示領域の全表示領域内における大きさを設定
する設定処理と、上記設定処理で設定された表示領域の
大きさに基づいて要約の長さを決定する決定処理と、上
記決定処理による決定に対応して、上記表示領域内にお
さまるよう上記電子文書の要約を作成する作成処理と、
上記作成処理で作成された要約を、上記領域に表示させ
るように制御する制御処理とを有するものである。
【0016】
【発明の実施の形態】以下、図面を参照して、本発明に
係る文書処理方法および装置ならびに記録媒体の実施の
形態について説明する。
【0017】本発明の実施の形態としての文書処理装置
は、図1に示すように、制御部11およびインターフェ
ース12を備える本体10と、ユーザからの入力を受け
付けて本体10に送る入力部20と、外部からの信号を
受信して本体10に送る受信部21と、サーバ24と本
体10との通信を処理する通信部22と、本体10から
の出力を表示する表示部30と、記録媒体32に対して
情報を記録/再生する記録/再生部31と、ハードディ
スク33とを有している。
【0018】本体10は、制御部11およびインターフ
ェース12を有し、この文書処理装置の主要な部分を構
成している。制御部11は、この文書処理装置における
処理を集中して実行するCPU13と、揮発性のメモリ
であるRAM14と、不揮発性のメモリであるROM1
5とを有している。CPU13は、たとえばROM14
に記録された手順にしたがって、必要な場合にはデータ
を一時的にRAM14に格納して、プログラムを実行す
るための制御を行う。インターフェース12には、入力
部20、受信部21、通信部23、表示部30、記録/
再生部31およびハードディスク33が接続される。イ
ンターフェース12は、制御部11からの制御の下に、
入力部20および受信部21からのデータの入力、表示
部30へのデータの送信について、データを送信するタ
イミングを調整したり、データの形式を変換したりす
る。
【0019】入力部20は、この文書処理装置に対する
ユーザの入力を受け付ける部分である。この入力部20
は、たとえばキーボードやマウスにより構成される。ユ
ーザは、この入力部20を用い、キーボードによりキー
ワードを入力したり、マウスにより表示部30に表示さ
れているテキスト情報である文書のエレメントを選択し
て入力したりすることができる。ここで、エレメントと
は文書を構成する要素であって、たとえば文書、文およ
び語が含まれる。
【0020】受信部21は、この文書処理装置に外部か
らたとえば通信回線を介して送信される信号を受信する
部分である。この受信部21は、たとえば電子文書であ
る複数の文書を受信する。受信部21は、受信したデー
タを本体10に送る。
【0021】通信部17は、たとえばモデム、ターミナ
ルアダプタなどにより構成され、電話回線を介してイン
ターネット23に接続され、インターネット23に接続
されているサーボ24にアクセスし、そこからデータを
受信することができるようになされている。
【0022】出力部30は、この文書処理装置からの出
力結果を表示するものである。この出力部30は、たと
えば陰極線管(cathode ray tube;CRT)や液晶表示装置
(liquid crystal display;LCD)から構成され、たとえ
ば単数または複数のウィンドウを表示し、このウィンド
ウ上に文字、図形等を表示したりする。
【0023】記録/再生部31は、この文書処理装置の
制御部11の制御の下に、たとえばいわゆるフロッピー
ディスクのような記録媒体32に対して情報の記録/再
生を行う。記録媒体32には、たとえばユーザが文書中
の任意の部分の重要性を上げるアルゴリズムが記録され
ている。なお、この記録媒体32についてはさらに後述
する。ハードディスク33は、大容量の磁気記録媒体で
あって、データの記録に用いられる。
【0024】次に、上述のように構成される文書処理装
置の動作について説明する。ユーザが入力部15を操作
し、インターネット21を介して通信を行うためのプロ
グラムを起動し、サーバ24(サーチエンジン)のURL
(Uniform Resource Locator)を入力すると、制御部11
は通信部22を制御し、サーバ24にアクセスさせる。
このときサーバ24は、インターネット23を介して文
書処理装置の通信部22に、検索画面のデータを出力す
る。CPU13はこのデータを表示部30に出力し、表
示させる。ユーザがこの検索画面上で所定のキーワード
などを入力し、検索を指令すると、通信部22から電話
回線、インターネット23を介して、サーチエンジンと
してのサーバ34に検索命令が送信される。
【0025】サーバ24は、検索命令を受けると、この
検索命令を実行し、得られた検索結果をインターネット
23を介して通信部22に送信する。制御部11は、通
信部21を制御し、サーバ23からの検索結果を受信さ
せ、その一部を表示部30に表示させる。いまの場合、
サーバ23からは、「TCP」のキーワードを含む各種
の情報が送信され、表示部16には、下記に示すよう
な、文書が表示される。
【0026】「TCP/IP(Transmission Control Protocol
/Internet Protocol)の歴史は、北米の、いや世界のコ
ンピュータネットワークの歴史であるといっても過言で
はない。そしてそのTCP/IPの歴史は、ARPANETを抜きに
して語ることはできない。ARPANETは正式名称をAdvance
d Research Project Agency Network(高等研究計画局
ネットワーク)といい、アメリカ国防省DOD(Department
of Defence)の国防高等研究計画局(DARPA:Defence Adv
anced Reserch Project Agency)がスポンサーとなって
構築されてきた、実験および研究用のパケット交換ネッ
トワークである。1969年北米西海岸の4箇所の大学、研
究機関のホストコンピュータを50kbpsの回線で結んだき
わめて小規模なネットワークからARPANETは出発した。
【0027】当時は1945年に世界初のコンピュータであ
るENIACがペンシルベニア大学で開発され、1964年には
じめてICを理論素子として実装し、第3世代のコンピュ
ータの歴史を形成したIBMの360シリーズが開発され、や
っとコンピュータが産声をあげたばかりあった。この時
代背景を考えると、将来のコンピュータ通信の最盛を見
越したこのようなプロジェクトは、まさに米国ならでは
のものであったといえるだろう。」この文書は、その内
部構造をタグ付けによる属性情報によって記述されてい
る。文書処理装置における文書処理は、文書に付与され
たタグを参照して行われる。本実施の形態においては、
文書の構造を示す統語論的タグとともに、多言語間で文
書の機械的な内容理解を可能にするような意味的・語用
論的タグを文書に付与している。
【0028】本実施の形態においては、統語論的なタグ
付けとしては、文書のツリー状の内部構造を記述するタ
グ付けがある。すなわち、本実施の形態においては、図
2に示すように、このタグ付けによる内部構造、文書、
文、語彙エレメント等の各エレメント、通常リンク、参
照・被参照リンク等が、タグとしてあらかじめ文書に付
与されている。図中において、白丸“○”は文書の要素
すなわちエレメントであり、最下位の白丸は文書におけ
る最小レベルの語に対応する、語彙エレメントである。
また、実線は語、句、節、文等の文書の構造を示す通常
リンク(normallink )である。破線は参照・被参照に
よる係り受け関係を示す参照リンク(reference link)
である。文書のタグ付けによる内部構造は、上位から下
位への順序で、文書(document)、文書の下位であり段
落の上位であるオプションのサブディビジョン(subdiv
ision )、オプションの段落(paragraph)、文(sente
nce )、文の下位であるサブセンテンシャルセグメント
(subsentential segment)、・
・・、最下位の語彙エレメントのような階層構造であ
る。
【0029】本実施の形態においては、意味論・語用論
的なタグ付けとしては、係り受け、たとえば代名詞の指
示対象、多義語の意味のように統語(syntacti
c)・意味(semantic)等の情報を記述するタグ付けが
ある。本実施の形態においては、このようなタグ付け
は、HTML(Hyper Text Markup Language)と同様に
XML(Extended Markup Language)の形式のタグであ
る。
【0030】文章のタグ付けによる内部構造の一例を次
に示すが、文章へのタグ付けはこの方法に限られないこ
とはもちろんである。
【0031】たとえば、“Time flies like an arro
w.”という文については、 <文><名詞句 語義=“time0”>time</名詞句> <動詞句><動詞 語義=“fly1”>flies</動詞> <形容動詞句><形容動詞 語義=like0>like</形
容動詞> <名詞句>an <名詞 語義=“arrow0”>arrow</名詞></名詞
句> </形容動詞句></動詞句>.</文> というようにタグ付けすることができる。ここで<文
>、<名詞>、<名詞句>、<動詞>、<動詞句>、<
形容動詞>、<形容動詞句>は、それぞれ一文、名詞、
名詞句、動詞、動詞句、前置詞句、後置詞句を含む形容
詞/形容詞句、形容詞句/形容動詞句のような文の統語
構造(syntactic structure )を表している。タグは、
エレメントの先端の前および終端の後に対応して配置さ
れる。ここでは、エレメントの終端の後ろに配置される
タグは、記号“/”により、文書の最小単位の要素、す
なわちエレメントの終端であることを示している。この
エレメントは統語的構成素、すなわち句、節、および文
を示す。なお、語義=time0は、語timeの有する複数の
意味、すなわち複数の語義のうちの第0番目の意味を指
している。具体的には、timeには名詞と動詞があるが、
ここではtimeが名詞であることを示している。たとえ
ば、語“オレンジ”は色と果物の意味があるが、これら
も語義によって区別することができる。
【0032】先に図2で説明したような文書のタグ付け
は、図3のウインドウ101に示すように、その統語構
造を表示することができる。このウインドウ101にお
いては、右半分103が語彙エレメントを、左半分10
2が文の構造を示している。
【0033】このウィンドウ101には、タグ付けされ
た次に示すような文書が表示されている。この文書にお
いても、タグによって統語構造が記述されている。次に
示す文書は、「A氏のB会が終わったC市で、一部の大
衆紙と一般紙がその写真報道を自主規制する方針を紙面
で明らかにした。」についてのタグ付けによる内部構造
を示すものである。 <文書><文><形容動詞句 関係=“場所”><名詞
句><形容動詞句 場所=“C市”> <形容動詞句 関係=“主語”><名詞句 識別子=
“B会”><形容動詞句関係 “位置”>A氏の</形
容動詞句>B会</名詞句>が</形容動詞句>終わっ
た</形容動詞句><地名 識別子=“C市”>C市<
/地名></名詞句>で、</形容動詞句><形容動詞
句 関係=“主語”><名詞句 識別子=新聞" 統語=
“並列”><名詞句><形容動詞句>一部の</形容動
詞句>大衆紙</名詞句>と<名詞>一般紙</名詞>
</名詞句>が</形容動詞句><形容動詞句 関係=
“目的語”><形容動詞句 関係=“内容” 主語=
“新聞”><形容動詞句 関係=“目的語”><名詞句
><形容動詞句><名詞 共参照=“B”>そ</名詞
>の</形容動詞句>写真報道</名詞句>を</形容
動詞句> 自主規制する</形容動詞句>方針を</形容動詞句> <形容動詞句 関係=“場所”>紙面で</形容動詞句
> 明らかにした。</文></文書> この文章においては、「一部の大衆紙と一般紙」のよう
に、統語=“並列”は並列を表す。並列の定義は、係り
受け関係を共有すると言うことである。特に何も指定が
ない場合は、たとえば、<名詞句 関係=x><名詞>
A</名詞><名詞>B</名詞></名詞句> はA
がBに依存関係のあることを表す。また、関係=x はこ
の<名詞句>エレメントの関係属性を表している。
【0034】続いて、タグ付けにおける、統語、意味、
修辞についての相互関係を記述する関係属性について説
明する。
【0035】主語、目的語、間接目的語のような文法機
能、動作主、被動作者、受益者などのような主題役割、
および理由、結果などのような修辞関係はこの関係属性
によって表示する。関係属性は関係=*** という形で表
される。本実施の形態では、比較的容易な文法機能、す
なわち、主語、目的語、間接目的語のような文における
当該語の機能について関係属性を記述する。
【0036】次に、上述のようにタグ付けされた文書を
要約する方法について説明する。最初に図4で概略的な
流れを示し、後述する図6で詳細に説明する。上記のよ
うな文書が表示部30に表示されている状態において、
ユーザがその文書の要約を作成したい場合には、入力部
20を操作し、自動要約作成モードを指令する。制御部
11は、この指令が入力されたときに図4のステップを
実行する。
【0037】はじめに、ステップS1において、制御部
11は、ハードディスク33に保存されている自動要約
作成プログラムを起動し、表示部30を制御し、図5に
示すような自動要約作成プログラムの初期画面を表示さ
せる。この例においては、表示部30に表示されたウィ
ンドウ100は、ドキュメント名表示部101、キーワ
ード入力部102、および実行ボタン103が表示され
ている表示領域110(上側)、文書が表示される表示
領域120(中央)、そして文書の要約が表示される表
示領域130(下側)に区分されている。
【0038】表示領域110のドキュメント名表示部1
01には、表示領域120に表示される文書のドキュメ
ント名などが表示される。キーワード入力部102に
は、キーワードが入力される。キーワードがキーワード
入力部102に入力されると、そのキーワードに対応し
た、文書の要約が作成される。実行ボタン103が、オ
ンされると、表示領域120に表示されている文書の要
約作成処理が実行される。
【0039】表示領域120には、文書が表示される。
いまの場合、上記した文書が表示領域120に表示され
る。ユーザは、入力部15を操作して、入手した文書の
一部を選択し、それを要約することもできるし、また文
章全体を要約することもできる。なお、表示領域120
において、表示領域120の右端および下側に設けられ
ている矢印を操作することにより、表示を縦方向または
横方向にスクロールすることができる。
【0040】表示領域130には、要約が表示される。
現在、要約は作成されていないので、表示領域130に
は、何も表示されていない。ユーザは、入力部15を操
作して、表示領域130の表示範囲(大きさ)を変更す
ることができる。図5には、表示範囲が広げられた表示
領域130が表されている。
【0041】次に、ステップS2において、ユーザが入
力部20を操作し、表示領域110の実行ボタン103
をオンすると、ステップS3において、制御部11は、
所定の規則に基づいて、文書の中の文または単語などを
エレメント、すなわち要素として、エレメントそれぞれ
に重要度を付与して、その重要度とともにRAM14に
供給し、記憶させる。重要度の設定方法には、例えば、
Zechnerが提案する、単語にtf*idf法で重み付し、文中
に出現する単語の重みの総和を文の重要度とする方法や
活性拡散を用いる方法などがある。前者の詳細は、下記
に示す文献に説明されている。
【0042】K.Zechner. Fast generation of abstract
s from general domain text corpora by extracting r
elevant sentences. In Proc. of the 16th Internatio
nalConference on Computational Linguistics, pp.986
-989,1996 本実施の形態においては、重要度として、後述するよう
な活性拡散に基づいた中心活性値を採用することにす
る。
【0043】なお、重要度の設定方法は、上記した方法
以外の方法を利用することもできる。また、表示領域1
10のキーワード入力部102にキーワードを入力する
ことにより、そのキーワードに基づいた重要度の設定を
行うことができる。
【0044】ステップS4において、制御部11は、表
示領域130の表示範囲の大きさを測定し、ステップS
5において、その測定結果と予め指定された文字の大き
さに基づいて、表示領域130に表示される要約の長さ
(例えば、文字数)を決定する。決定された文字数以内
であれば、要約は表示領域130を超えて表示されな
い。
【0045】次に、ステップS6において、制御部11
は、作成される要約が、ステップS5で決定された文字
数を超えないように、RAM13から、重要度の高い順
に文または単語を選択する。
【0046】ステップS7において、制御部11は、ス
テップS6で選択された文または単語をつなぎ合わせ
て、要約を作成し、表示部16の表示領域130に表示
させる。
【0047】このようにして、例えば、下記に示すよう
な要約が、表示領域130に表示される。
【0048】「TCP/IPの歴史は、ARPANETを抜きにして
語ることはできない。ARPANETは1969年北米西海岸の4
箇所の大学、研究機関のホストコンピュータを50kbpsの
回線で結んだ小規模なネットワークからARPANETは出発
した。当時は1964年にIBMの360シリーズが開発された。
この時代背景を考えると、将来のコンピュータ通信の最
盛を見越したこのようなプロジェクトは、まさに米国な
らではのものであったといえるだろう。」ユーザは、文
章を一読する代わりに、上記の要約を読み、文章の概要
を理解し、文章が所望する情報であるか否かを判定する
ことができる。
【0049】続いて、要約を作成する処理の図4に示す
ものより詳細の制御を含む例について図6に示すフロー
チャートを参照して詳細に説明する。この一連の工程
は、ステップS2において実行ボタン103をオンする
ことによって開始される。
【0050】文書から要約を作成する処理は、文書のタ
グ付けによる内部構造に基づいて実行される。上述した
ように、ウィンドウ100において要約を表示する表示
領域130のサイズは変更することができる。文書処理
装置の制御部11は、新たにウィンドウ101が表示部
30のウィンドウ100に描画されるか表示領域130
のサイズが変更され、実行ボタン103が操作されたと
きには、表示領域130に適合するようにウィンドウ1
00の表示領域120に表示されている文書から要約を
作成する処理を実行する。
【0051】図6の最初のステップS20では、文書処
理装置の制御部11は、活性拡散を行う。本実施の形態
においては、活性拡散により得られた中心活性値を重要
度として採用することにより、文書の要約を行う。すな
わち、タグ付けによる内部構造を与えられた文書におい
ては、活性拡散と呼ばれる処理を行うことにより、各エ
レメントにタグ付けによる内部構造に応じた中心活性値
を付与することができる。活性拡散は、中心活性値の高
いエレメントと関わりのあるエレメントにも高い中心活
性値を与えるような処理である。すなわち、活性拡散
は、照応(共参照)表現とその先行詞の間で中心活性値が
等しくなり、それ以外では中心活性値が減衰するような
中心活性値についての演算である。この中心活性値は、
タグ付けによる内部構造に応じて決定されるので、タグ
付けによる内部構造を考慮した文書の分析に利用するこ
とができる。
【0052】なお、このステップS20は、ステップS
3の重要度付与に対応している。ここでの重要度とは、
中心活性値である。
【0053】活性拡散は、図7のフローチャートに示す
一連の行程にしたがって、文書処理装置の制御部11の
制御の下に実行される。
【0054】最初のステップS31では、制御部11
は、各エレメントの初期化を行う。制御部11は、語彙
エレメントを除いたすべてのエレメントと語彙エレメン
トに対して中心活性値の初期値を割り当てる。たとえ
ば、中心活性値の初期値として語彙エレメントを除いた
すべてのエレメントに1を、語彙エレメントに零を、そ
れぞれ割り当てればよい。また、制御部11は、各エレ
メントの中心活性値の初期値に均一ではない値を割り当
てることにより、活性拡散の結果得られた中心活性値の
初期値の偏りを反映することができる。例えば、ユーザ
が安心を有するエレメントに対しては、中心活性値の初
期値を高く設定することにより、ユーザの関心を反映し
た中心活性値を得ることができる。
【0055】参照・被参照関係のエレメントを連結する
参照・被参照リンクと、通常リンクに関しては、エレメ
ントを連結するリンクの端点の端点活性値を零に設定す
る。制御部11は、このようにして付与した端点活性値
の初期値をたとえばRAM14に記録する。
【0056】ステップS32においては、文書処理装置
の制御部11は、図8に示すように、文書を構成するエ
レメントEiを計数するカウンタの初期化を行う。すな
わち、エレメントを計数するカウンタのカウント値iを
1に設定する。すなわち、このカウンタは、第1番目の
エレメントE1を参照している。
【0057】この図8においては、文書を構成するエレ
メントとリンクの構造の一部として、エレメントEi
よびエレメントEjが示されている。エレメントEiとエ
レメントEjとは、中心活性値eiおよびejをそれぞれ
有し、リンクLijにて接続されている。リンクLijのエ
レメントEiに接続する端点はTij、エレメントEjに接
続する端点はTjiである。エレメントEiは、リンクL
ijにより接続されるエレメントEjの他に、リンク
ik、LilおよびLimによって図示しないエレメントE
k、ElおよびEmにそれぞれ接続している。エレメント
jは、リンクLjiにより接続されるエレメントEiの他
に、リンクLjp、LjqおよびLjrによって図示しないエ
レメントEp、EqおよびErにそれぞれ接続している。
【0058】ステップS33においては、文書処理装置
の制御部11は、カウンタが参照するエレメントについ
て、新たな中心活性値を計算するリンク処理を実行す
る。このリンク処理については、さらに後述する。
【0059】ステップS34においては、文書処理装置
の制御部11は、文書中のすべてのエレメントについて
新たな中心活性値の計算が完了したか否かを判断する。
そして、制御部11は、文書中のすべてのエレメントに
ついて新たな中心活性値の計算が完了したときには“Y
ES”としてステップS35に処理を進め、文書中のす
べてのエレメントについて中心活性値の計算が完了して
いないときには“NO”としてステップS36に処理を
進める。
【0060】具体的には、制御部11は、カウンタのカ
ウント値iが、文書の含むエレメントの総数に達したか
否かを判断する。そして、制御部11は、カウンタのカ
ウント値iが文書に含まれるエレメントの総数に達した
ときには、すべてのエレメントが計算済みとしてステッ
プS35に処理を進め、カウンタのカウント値iが文書
に含まれるエレメントの総数に達していないときにはす
べてのエレメントについて計算が終了していないとして
ステップS37に処理を進める。
【0061】ステップS37においては、文書処理装置
の制御部11は、カウンタのカウント値iを1増加させ
て、カウンタのカウント値をi+1とする。このことに
より、カウンタはi+1番目のエレメント、すなわち次
のエレメントを参照する。そして、処理はステップS3
2に戻り、端点活性値の計算およびこれに続く一連の行
程が、次のi+1番目のエレメントについて実行され
る。
【0062】具体的には、制御部11は、エレメントを
計数するカウンタのカウント値iを1増加する。このこ
とにより、カウンタはステップS32で中心活性値が計
算された次のエレメントを参照することになる。
【0063】ステップS35においては、文書処理装置
の制御部11は、文書に含まれるすべてのエレメントの
中心活性値の変化分、すなわち新たに計算された中心活
性値の元の中心活性値に対する変化分について、文書に
含まれるすべてのエレメントについて平均値を計算す
る。
【0064】文書処理装置の制御部11は、たとえばR
AM14に記録された元の中心活性値と新たに計算した
中心活性値を、文書に含まれるすべてのエレメントにつ
いて読み出す。制御部11は、新たに計算した中心活性
値の元の中心活性値に対するそれぞれの変化分の総和を
文書に含まれるエレメントの総数で除することにより、
すべてのエレメントの中心活性値の変化分の平均値を計
算する。制御部11は、このように計算したすべてのエ
レメントの中心活性値の変化分の平均値を、たとえばR
AM14に記録する。
【0065】ステップS36においては、制御部11
は、ステップS35で計算したすべてのエレメントの中
心活性値の変化分の平均値が、予め設定された閾値以内
であるか否かを判断する。そして、制御部11は、上記
変化分が閾値以内であると“YES”としてこの一連の
行程を終了する。上記制御部11は、上記変化分が閾値
以内でないときには“NO”として、ステップS32に
てカウンタのカウント値iを1に設定して文書のエレメ
ントの中心活性値を計算する一連の行程を再び実行す
る。この一連の行程にて構成されるステップS32から
ステップS36に至るループが繰り返される毎に上記変
化分は徐々に減少する。
【0066】続いて、ステップS33にて実行される中
心活性値を計算するリンク処理について、図9に示すフ
ローチャートを参照して説明する。
【0067】ステップS51においては、文書処理装置
の制御部11は、文書を構成するエレメントEjを計数
するカウンタの初期化を行う。すなわち、エレメントを
計数するカウンタのカウント値jを1に設定する。すな
わち、このカウンタは、第1番目のエレメントEjを参
照している。
【0068】ステップS52においては、エレメントE
iとEjを接続するリンクLijにおいては、制御部11
は、タグを参照することにより、そのリンクLijが通常
リンクであるか否かを判断する。制御部11は、リンク
ijについて、そのリンクが、語に対応する語彙エレメ
ント、文に対応する文エレメント、段落に対応する段落
エレメントなどの間の関係を示す通常リンクと、参照・
被参照による係り受けの関係を示す参照リンクのいずれ
であるかを判断する。制御部11は、そのリンクが通常
リンクのときには“YES”としてステップS53に処
理を進め、そのリンクが参照リンクのときには“NO”
としてステップS54に処理を進める。
【0069】ステップS53においては、通常リンクL
ijに対して、接続された端点の新たな端点活性値を計算
する処理が行われる。この端点活性値の計算について、
図9を参照して説明する。
【0070】ここでは、ステップS52における判別に
より、リンクLijは通常リンクであることが明らかにな
っている。通常リンクLijを介してエレメントEiに接
続される端点Tijの新たな端点活性値tijは、エレメン
トEiの端点活性値のうち、リンクLij以外のリンクに
接続するすべての端点の端点活性値tik、tilおよびt
imと、このエレメントEiがリンクLijにより接続され
るエレメントEjの中心活性値ejを加算し、この加算で
得た値を文書に含まれるエレメントの総数で除すること
により求められる。
【0071】エレメントEiの端点Tijの端点活性値
は、端点Tijを一端とするリンクLijが通常リンクの場
合、リンクLijの他端が接続されているエレメントEj
の端点の端点活性値のうちそのリンクLijと接続されて
いる端点Tjiを除いたすべての端点の端点活性値、およ
びそのリンクLijが接続されるエレメントEjの中心活
性値ejの和を文書全体に含まれるエレメントの総数で
除することにより得られる。このような手順により、活
性拡散における中心活性値の収束が保証されることにな
る。
【0072】文書処理装置の制御部11は、たとえばR
AM14に記録されたデータから、必要な端点活性値お
よび中心活性値を読み出す。制御部11は、読み出され
た端点活性値および中心活性値について、上述のように
その通常リンクと接続された端点の端点活性値を計算す
る。そして制御部11は、このように計算した新たな端
点活性値を、たとえばRAM14に記録する。
【0073】ステップS54においては、参照リンクに
対して、そのリンクの端点の端点活性値を計算する処理
が行われる。
【0074】ステップS52における判別により、リン
クLijは参照リンクであることが明らかになっている。
通常リンクLijに関して、エレメントEiに接続する端
点Ti jの端点活性値tijは、このリンクLijを除いたエ
レメントEiに接続するすべてのリンクLik、Lilおよ
びLimの端点活性値tik、tilおよびtimと、このエレ
メントEiがリンクLijにより接続するエレメントEj
中心活性値ejを加算することにより求められる。
【0075】エレメントEiの端点Tijの端点活性値
は、端点Tijを一端とするリンクLijが参照リンクの場
合、リンクLijの他端が接続されているエレメントEj
の端点の端点活性値のうちそのリンクLijと接続されて
いる端点Tjiを除いたすべての端点の端点活性値、およ
びそのリンクLijが接続されるエレメントEjの中心活
性値ejの和を取ることにより得られる。
【0076】文書処理装置の制御部11は、たとえばR
AM14に記録されたデータから、必要な端点活性値お
よび中心活性値を読み出す。制御部11、読み出された
端点活性値および中心活性値を用いて、上述のように参
照リンクと接続された端点の新たな端点活性値を計算す
る。そして制御部11は、このように計算した端点活性
値を、たとえばRAM14に記録する。
【0077】ステップS53における通常リンクの処
理、およびステップS54における参照リンクの処理
は、ステップS52からステップS56のループにある
ように、カウントのカウント値iにより参照されている
エレメントEiに接続するすべてのエレメントEjについ
てのリンクLijに対して実行される。
【0078】ステップS55においては、文書処理装置
の制御部11は、ステップS53またはステップS54
での処理に基づいて、エレメントEiの端点活性値を計
算する。制御部11は、この計算により得られた端点活
性値をたとえばRAM14に記録する。
【0079】ステップS56においては、エレメントE
iに接続するすべてのリンクについて端点活性値tij
計算されたか否かが判別される。そして、すべてのリン
クについて端点活性値が計算されているときには“YE
S”としてステップS57に進み、すべてのリンクにつ
いて端点活性値が計算されていないときには“NO”と
してステップS58に進む。
【0080】ステップS57においては、S56にてエ
レメントEiのすべてのリンクLijについて端点活性値
ijが求められたことが判別されたので、エレメントE
iの中心活性値eiの更新を実行する。
【0081】エレメントEiの中心活性値eiの新たな値
すなわち更新値は、エレメントEiのすべての端点の端
点活性値との和ei’=ei+Σtj’を取ることにより
求められる。ここで、“’”は、新たな値という意味で
ある。このように、新たな活性値は、各エレメントにリ
ンクを介して接続する端点の端点活性値の総和を元の活
性値に加えることにより得られる。
【0082】文書処理装置の制御部11は、たとえばR
AM14に記録されたデータから必要な端点活性値tij
を読み出す。制御部11は、上述したような計算を実行
し、そのエレメントEiの中心活性値eiを算出する。そ
して、制御部11は、計算した新たな中心活性値ei
たとえばRAM14に記録する。
【0083】活性拡散の結果を用いて、図6において
は、上述したステップS20に続いてステップS21で
は、文書処理装置の制御部11は、表示部30に表示さ
れているウィンドウ51の文書処理部53のサイズ、具
体的にはこの文書処理部53に表示可能な最大文字数を
sと設定する。また、文書処理装置の制御部11は、
要約の文字列を格納するsを初期化して初期値s
0=””と設定する。制御部11は、このように設定し
た、文書表示部53に表示可能な最大文字数wsおよび
要約の文字列を格納するsの初期値s0を、たとえばR
AM14に記録する。
【0084】なお、このステップS21は、ステップS
4での表示領域30の表示範囲の測定と、ステップS4
での要約文の総文字数の決定に対応している。すなわ
ち、このステップS21では、測定の結果、表示可能な
最大文字数wsが与えられている。
【0085】ステップS22では、文書処理装置の制御
部11は、要約の骨格の順次の作成をカウントするカウ
ンタのカウント値iを零に設定する。すなわち、制御部
11は、カウント値について、i=0と設定する。制御
部11は、このように設定したカウント値iをたとえば
RAM14に記録する。
【0086】ステップS23では、文書処理装置の制御
部11は、カウンタのカウント値iについて、文章から
i番目に平均中心活性値の高い文の骨格を抽出する。平
均中心活性値とは、一つの文を構成する各エレメントの
中心活性値を平均したものである。制御部11は、たと
えばRAM14に記録した要約を格納するsi-1を読み
出し、このsi-1に対して抽出した文の骨格の文字列を
加えて、siとする。そして、制御部11は、このよう
にして得たsiを、たとえばRAM14に記録する。同
時に、制御部11は、上記文の骨格に含まれないエレメ
ントの中心活性値順のリストliを作成し、このリスト
iをたとえばRAM14に記録する。
【0087】すなわち、このステップS23において
は、要約のアルゴリズムは、活性拡散の結果を用いて、
平均中心活性値の大きい順に文を選択し、選択された文
の骨格の抽出する。文の骨格は、文から抽出した必須要
素により構成される。必須要素になりうるのは、エレメ
ントの主辞(head)と、主語(subject)、目的語(objec
t)、間接目的語(indirect object)、所有者(posesso
r)、原因(cause)、条件(condition)または比較(compari
son)の関係属性を有する要素と、等位構造が必須要素の
ときにはそれに直接含まれるエレメントとが必須要素を
構成するものである。そして、文の必須要素をつなげて
文の骨格を生成し、要約に加える。
【0088】ステップS24では、文書処理装置の制御
部11は、siの長さがウィンドウ51の要約表示部5
4の最大文字数wsより大きいか否かを判断する。そし
て、制御部11は、siの長さが最大文字数wsより大き
いときには“YES”としてこの一連の処理を終了す
る。制御部は、siの長さが最大文字数wsより大きくな
いときには“NO”として処理をステップS25に進め
る。すなわち、このステップS24においては、要約が
指定された分量に達したときは終了する。まだ余裕があ
る場合は、次に中心活性値の高い文と省略したエレメン
トの中心活性値を比較して、高いほうを要約に加えるも
のである。
【0089】ステップS29では、文書処理装置の制御
部11は、ステップS24でsiの長さが最大文字数ws
より大きいと判断されたので、要約をsi-1に設定す
る。この場合、要約はウィンドウにおさまらないのでs
i=s0=“”を出力する。したがって、このときには要
約は表示されないこととなる。そして、制御部11は、
この一連の工程を終了する。
【0090】ステップS25では、文書処理装置の制御
部11は、i+1番目に平均中心活性値が中心活性値
と、ステップS23で作成したリストliの要素の最も
中心活性値が高い要素の中心活性値を比較する。そし
て、制御部11は、i+1番目に平均中心活性値が高い
文の中心活性値がリストliの要素の最も中心活性値が
高い要素の中心活性値より高いときには“YES”とし
て処理を次のステップS27に進める。制御部11は、
i+1番目に平均中心活性値が高い文の中心活性値がリ
ストliの要素の最も中心活性値が高い要素の中心活性
値より高くないときには“NO”として処理をステップ
S26に進める。
【0091】ステップS26では、文書処理装置の制御
部11は、カウンタのカウント値iを1だけ増加させ
る。そして、制御部11は、処理をステップS23に戻
す。
【0092】ステップS27においては、文書処理装置
の制御部11は、リストliの最も中心活性値の高い要
素eをsiに加えてssiを生成する。eをliから削除
する。そして、制御部11は、このようにして生成した
ssiをたとえばRAM14に記録する。
【0093】なお、このステップS27を中心として、
ステップS22からステップS28までが、重要度の高
い順から文または単語を選択するステップS6に対応し
ている。すなわち、ステップS22からステップS28
にいたるステップにより、重要度、すなわち中心活性値
の順に文または単語が選択される。
【0094】ステップS28においては、文書処理装置
の制御部11は、ssiの長さがウィンドウ51の要約
表示部54の最大文字数wsより大きいか否かを判別す
る。制御部11は、ssiの長さがwsより大きいときに
は“YES”としてこの一連の工程を終了する。制御部
11は、ssiの長さがwsより大きくないときには“N
O”として処理をステップS25に戻す。
【0095】ステップS30においては、文書処理装置
の制御部11は、ステップS28でSSiの長さが最大
文字数wsより大きいと判断されたので、要約文をsi
設定する。これにより、最大文字数wsより大きくなら
ないように要約文が生成される。そして、制御部11
は、この一連の工程を終了する。
【0096】なお、ステップS29およびステップS3
0は、要約を定義するので、要約の作成および表示をお
こなうステップS7の一部に対応している。
【0097】次に、図5に示したような要約が表示部3
0に表示されたウィンドウ100の表示領域130に表
示されている状態において、その要約の情報量を変更す
る場合の制御部11の動作を、図10のフローチャート
を参照して説明する。
【0098】ステップS61において、制御部11は、
ユーザの入力部20の操作に対応して、表示部30に表
示されたウィンドウの表示領域130の表示範囲が変更
されるまで待機し、表示領域130の表示範囲が変更さ
れると、ステップS62に進み、その表示範囲を確保す
るとともに測定する。
【0099】以下、ステップS63乃至S65で行われ
る処理は、図4のステップS5乃至7で行われる処理と
同様の処理であり、表示領域130の表示範囲に対応し
た要約文が作成され、処理が終了する。例えば、マウス
のドラッグ操作により表示領域130の表示範囲が広げ
られると、下記に示すような、より詳細な要約文が作成
され、図11に示すウィンドウ100の表示領域(下
側)130に表示される。
【0100】「TCP/IPの歴史は、ARPANETを抜きにして
語ることはできない。ARPANETは、アメリカ国防省DODの
国防高等研究計画局がスポンサーとなって構築されてき
た、実験および研究用のパケット交換ネットワークであ
る。1969年北米西海岸の4箇所の大学、研究機関のホス
トコンピュータを50kbpsの回線で結んだきわめて小規模
なネットワークからARPANETは出発した。当時は1945年
に世界初のコンピュータであるENIACがペンシルベニア
大学で開発され、1964年にはじめてICを理論素子として
実装したIBMの360シリーズが開発され、やっとコンピュ
ータが産声をあげたばかりあった。この時代背景を考え
ると、将来のコンピュータ通信の最盛を見越したこのよ
うなプロジェクトは、まさに米国ならではのものであっ
たといえるだろう。」このように、表示された要約文が
簡略すぎて、文書の概略を把握することができない場
合、ユーザは、表示領域130の表示範囲を広げること
で、より多くの情報量を有するより詳細な要約文を参照
することができる。
【0101】次に、本発明を適用した記録媒体の実施の
形態について説明する。この記録媒体32は、複数のエ
レメントから構成される階層化された内部構造を有し、
内部構造に関するタグによる属性情報が付与された電子
文書を処理する文書処理プログラムが記録された記録媒
体である。この文書処理プログラムは、記電子文書の要
約を表示する表示領域を確保する確保処理と、上記確保
処理で確保された表示領域の大きさに基づいて要約の長
さを決定する決定処理と、決定処理による決定に対応し
て、電子文書の要約を作成する作成処理と、作成処理で
作成された要約を、表示領域に表示させるように制御す
る制御処理とを有する。
【0102】そして、上記作成処理は、電子文書の内部
構成に基づいてその各要素に重み付けを設定する重み付
け設定処理と、重み付け設定処理で設定された重み付け
に基づいて、電子文書に重み付けを配分するように演算
する重み付け演算処理と、電子文書を構成する文につい
て、重み付け演算処理での演算の結果に基づいて、文を
構成する要素の重み付けの平均の重み付けが大きな順序
で文を選択する文選択処理と、文選択処理で選択された
文から必須構成要素を抽出する必須構成要素抽出処理
と、上記必須構成要素抽出処理で抽出した必須構成要素
を接続して文の骨格を生成する文骨格生成処理と、文骨
格生成処理で生成した文の骨格を要約として出力する出
力処理とを有する。ここで、必須要素抽出処理において
は、要素の主辞(head)と、主語(subject)、目的語
(object)、間接目的語(indirectobject)、所有者
(posessor)、原因(cause)、条件(condition)また
は比較(comparison)の関係属性を有する要素と、等位
構造が必須のときにはそれに直接含まれる要素とが必須
要素を構成する。
【0103】なお、上記出力処理は、上記文骨格生成処
理で生成した文の骨格と、上記文選択処理で選択された
文を構成する必須構成要素以外の要素とのいずれかを要
約として出力することもできる。
【0104】また、記録媒体32は、文書の要約を、所
定の表示領域に表示させる文書処理プログラムが記録さ
れた記録媒体であって、上記文書処理プログラムは、上
記文書の要約を表示する上記表示領域の大きさを測定す
る測定処理と、上記測定処理により測定された上記表示
領域の大きさに基づいて、上記要約の長さを決定する決
定処理と、上記決定処理による決定に対応して、上記文
書の要約を作成する要約作成処理と、上記要約作成処理
により作成された上記要約を、上記表示領域に表示させ
るように表示を制御する制御処理とを有するものであ
る。
【0105】なお、上記したような処理を行うコンピュ
ータプログラムをユーザに提供する提供媒体としては、
磁気ディスク、CD-ROM、固体メモリなどの記録媒体の
他、ネットワーク、衛星などの通信媒体を利用すること
ができる。
【0106】なお、上記例においては、インターネット
を介して入手した文書について説明したが、これだけで
はなく、例えばフロッピーディスクから取り出された文
書にも適用でき、文書の要約文を作成することができ
る。
【0107】なお、本実施の形態においては、文書への
タグ付けの方法の一例を示したが、本発明がこのタグ付
けの方法に限定されないことはもちろんである。また、
本実施の形態においては、文書処理装置の受信部21に
外部から文書が送信されるとしたが、本発明はこれに限
定されない。たとえば、上記文書は、文書処理装置のR
OM13に書き込まれていたり、記録/再生部31にお
いて記録媒体32から読み出されてもよい。
【0108】また、上述の実施の形態においては、ポイ
ンティングデバイスの一例としてマウスを例示した。し
かし、本実施の形態におけるポインティングデバイスは
マウスに限定されることはな。本実施の形態において
は、ポインティングデバイスとして、たとえばスタイラ
スペンも利用することができる。
【0109】
【発明の効果】本発明によれば、表示領域の表示範囲に
対応して要約文を作成し、表示するようにしたので、ユ
ーザの要求に対応した要約文を提供することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態を適用した文書処理装置の
概略的な構成を示すブロック図である。
【図2】文書のタグによる内部構造を示す図である。
【図3】文書のタグによる内部構造を表示したウィンド
ウを示す図である。
【図4】要約作成の処理のフローチャートである。
【図5】文書とその要約を表示したウィンドウを示す図
である。
【図6】要約作成処理の一部を詳細に示す図である。
【図7】活性拡散の処理のフローチャートである。
【図8】活性拡散の処理を説明する図である。
【図9】活性拡散のリンク処理を示す図である。
【図10】表示領域の変更を示す図である。
【図11】文書とその要約を表示したウィンドウを示す
図である。
【符号の説明】
10 本体、11 制御部、12 インターフェース、
13 CPU、20入力部、21 受信部、22 通信
部、30 表示部、31 記録/再生部、32 ハード
ディスク

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 電子文書を処理する文書処理方法におい
    て、 上記電子文書の要約を表示する表示領域の全表示領域内
    における大きさを設定する設定工程と、 上記設定工程で設定された表示領域の大きさに基づいて
    要約の長さを決定する決定工程と、 上記決定工程による決定に対応して、上記表示領域内に
    おさまるよう上記電子文書の要約を作成する作成工程
    と、 上記作成工程で作成された要約を、上記領域に表示させ
    るように制御する制御工程とを有することを特徴とする
    文書処理方法。
  2. 【請求項2】 上記電子文書は、複数の要素から構成さ
    れる階層化された内部構造を有し、上記内部構造に関す
    る属性情報が付与されたものであることを特徴とする請
    求項1記載の文書処理方法。
  3. 【請求項3】 上記作成工程は、 上記電子文書の内部構成に基づいてその各要素に重み付
    けを設定する重み付け設定工程と、 上記重み付け設定工程で設定された重み付けに基づい
    て、上記電子文書に重み付けを配分するように演算する
    重み付け演算工程と、 上記電子文書を構成する文について、上記重み付け演算
    工程での演算の結果に基づいて、上記文を構成する要素
    の重み付けの平均の重み付けが大きな順序で文を選択す
    る文選択工程と、 上記文選択工程で選択された文から必須構成要素を抽出
    する必須構成要素抽出工程と、 上記必須構成要素抽出工程で抽出した必須構成要素を接
    続して文の骨格を生成する文骨格生成工程と、 上記文骨格生成工程で生成した文の骨格を要約として出
    力する出力工程とを有することを特徴とする請求項1記
    載の文書処理方法。
  4. 【請求項4】 上記必須要素抽出工程においては、要素
    の主辞(head)と、主語(subject)、目的語(objec
    t)、間接目的語(indirect object)、所有者(poses
    sor)、原因(cause)、条件(condition)または比較
    (comparison)の関係属性を有する要素と、等位構造が
    必須のときにはそれに直接含まれる要素とが必須要素を
    構成することを特徴とする請求項3記載の文書処理方
    法。
  5. 【請求項5】 上記出力工程は、上記文骨格生成工程で
    生成した文の骨格に、上記文選択工程で選択された文の
    要素であって、上記文骨格生成工程された文の骨格以外
    で最も重み付けの大きい要素をさらに加えて要約として
    出力することを特徴とする請求項3記載の文書処理方
    法。
  6. 【請求項6】 上記表示領域を変更する変更手段をさら
    に有することを特徴とする請求項1記載の文書処理方
    法。
  7. 【請求項7】 電子文書を処理する文書処理装置におい
    て、 上記電子文書の要約を表示する表示領域の全表示領域内
    における大きさを設定する設定手段と、 上記設定手段で設定された表示領域の大きさに基づいて
    要約の長さを決定する決定手段と、 上記決定手段による決定に対応して、上記表示領域内に
    おさまるよう上記電子文書の要約を作成する作成手段
    と、 上記作成手段で作成された要約を、上記領域に表示させ
    るように制御する制御手段とを有することを特徴とする
    文書処理装置。
  8. 【請求項8】 電子文書を処理する文書処理プログラム
    が記録された記録媒体であって、上記文書処理プログラ
    ムは、 上記電子文書の要約を表示する表示領域の全表示領域内
    における大きさを設定する設定処理と、 上記設定処理で設定された表示領域の大きさに基づいて
    要約の長さを決定する決定処理と、 上記決定処理による決定に対応して、上記表示領域内に
    おさまるよう上記電子文書の要約を作成する作成処理
    と、 上記作成処理で作成された要約を、上記領域に表示させ
    るように制御する制御処理とを有することを特徴とする
    記録媒体。
JP03155099A 1998-04-02 1999-02-09 文書処理方法および装置ならびに記録媒体 Expired - Fee Related JP4214598B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP03155099A JP4214598B2 (ja) 1998-04-02 1999-02-09 文書処理方法および装置ならびに記録媒体
US09/282,349 US7200808B1 (en) 1998-04-02 1999-03-31 Electronic document processor

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10-89758 1998-04-02
JP8975898 1998-04-02
JP03155099A JP4214598B2 (ja) 1998-04-02 1999-02-09 文書処理方法および装置ならびに記録媒体

Publications (2)

Publication Number Publication Date
JPH11345233A true JPH11345233A (ja) 1999-12-14
JP4214598B2 JP4214598B2 (ja) 2009-01-28

Family

ID=26370036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03155099A Expired - Fee Related JP4214598B2 (ja) 1998-04-02 1999-02-09 文書処理方法および装置ならびに記録媒体

Country Status (2)

Country Link
US (1) US7200808B1 (ja)
JP (1) JP4214598B2 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005122743A (ja) * 2003-10-15 2005-05-12 Fuji Xerox Co Ltd ハイブリッドテキスト要約を決定する方法、システム、及び、制御プログラム、談話構文解析方法、システム、及び、該システムにおける方法、談話構成要素にテキストを分割する方法及びシステム、談話の構造表現を決定する方法及びシステム、ハイブリッドテキスト要約システム
WO2005081220A1 (ja) * 2004-02-19 2005-09-01 Sharp Kabushiki Kaisha データ表示装置、データ表示プログラムおよびデータ表示プログラムを記録したコンピュータ読取り可能な記録媒体
JP2007265458A (ja) * 2001-01-26 2007-10-11 Microsoft Corp 複数の圧縮オプションを生成する方法およびコンピュータ
CN100433008C (zh) * 2004-09-29 2008-11-12 株式会社东芝 用于创建文档摘要的系统和方法
JP2011022914A (ja) * 2009-07-17 2011-02-03 Casio Computer Co Ltd 情報処理装置およびその制御プログラム
JP2013016106A (ja) * 2011-07-06 2013-01-24 Kyocera Communication Systems Co Ltd 要約文生成装置
JP2013218689A (ja) * 2012-04-06 2013-10-24 Samsung Electronics Co Ltd ディスプレイ上のオブジェクトを実行する方法及びそのデバイス
JP2014075142A (ja) * 2013-11-27 2014-04-24 Casio Comput Co Ltd 情報処理装置およびその制御プログラム
JP2016057669A (ja) * 2014-09-05 2016-04-21 日本電信電話株式会社 情報提示装置および情報提示プログラム
US9632682B2 (en) 2012-04-06 2017-04-25 Samsung Electronics Co., Ltd. Method and device for executing object on display
US10042535B2 (en) 2012-04-06 2018-08-07 Samsung Electronics Co., Ltd. Method and device for executing object on display

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2368672A (en) * 2000-04-19 2002-05-08 Ford Global Tech Inc Online invention disclosure system
US7770109B2 (en) * 2005-12-16 2010-08-03 Microsoft Corporation Adaptive layout for content
US9904436B2 (en) 2009-08-11 2018-02-27 Pearl.com LLC Method and apparatus for creating a personalized question feed platform
US9646079B2 (en) 2012-05-04 2017-05-09 Pearl.com LLC Method and apparatus for identifiying similar questions in a consultation system
US9183191B2 (en) 2009-09-24 2015-11-10 At&T Intellectual Property I, L.P. Forwarding selected document passages from an electronic reader
US8280888B1 (en) * 2012-05-04 2012-10-02 Pearl.com LLC Method and apparatus for creation of web document titles optimized for search engines
US9275038B2 (en) 2012-05-04 2016-03-01 Pearl.com LLC Method and apparatus for identifying customer service and duplicate questions in an online consultation system
US9501580B2 (en) 2012-05-04 2016-11-22 Pearl.com LLC Method and apparatus for automated selection of interesting content for presentation to first time visitors of a website
US10540439B2 (en) * 2016-04-15 2020-01-21 Marca Research & Development International, Llc Systems and methods for identifying evidentiary information
US20230185954A1 (en) * 2021-12-15 2023-06-15 Bank Of America Corporation Transmission of Sensitive Data in a Communication Network

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4864501A (en) 1987-10-07 1989-09-05 Houghton Mifflin Company Word annotation system
JPH01144171A (ja) * 1987-11-30 1989-06-06 Toshiba Corp 電子ファイリング装置
JP2783558B2 (ja) 1988-09-30 1998-08-06 株式会社東芝 要約生成方法および要約生成装置
JPH05242165A (ja) * 1992-02-28 1993-09-21 Mitsubishi Electric Corp 画像データベースシステム
US5384703A (en) 1993-07-02 1995-01-24 Xerox Corporation Method and apparatus for summarizing documents according to theme
US5623679A (en) * 1993-11-19 1997-04-22 Waverley Holdings, Inc. System and method for creating and manipulating notes each containing multiple sub-notes, and linking the sub-notes to portions of data objects
US5963205A (en) * 1995-05-26 1999-10-05 Iconovex Corporation Automatic index creation for a word processor
US5691708A (en) * 1995-08-14 1997-11-25 Lotus Development Corporation Text abstraction method and apparatus
US5867164A (en) * 1995-09-29 1999-02-02 Apple Computer, Inc. Interactive document summarization
JPH09259028A (ja) * 1996-03-19 1997-10-03 Toshiba Corp 情報呈示方法
US5913215A (en) * 1996-04-09 1999-06-15 Seymour I. Rubinstein Browse by prompted keyword phrases with an improved method for obtaining an initial document set
AU746762B2 (en) * 1997-04-16 2002-05-02 British Telecommunications Public Limited Company Data summariser
US6175830B1 (en) * 1999-05-20 2001-01-16 Evresearch, Ltd. Information management, retrieval and display system and associated method

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007265458A (ja) * 2001-01-26 2007-10-11 Microsoft Corp 複数の圧縮オプションを生成する方法およびコンピュータ
JP2005122743A (ja) * 2003-10-15 2005-05-12 Fuji Xerox Co Ltd ハイブリッドテキスト要約を決定する方法、システム、及び、制御プログラム、談話構文解析方法、システム、及び、該システムにおける方法、談話構成要素にテキストを分割する方法及びシステム、談話の構造表現を決定する方法及びシステム、ハイブリッドテキスト要約システム
JP4706227B2 (ja) * 2003-10-15 2011-06-22 富士ゼロックス株式会社 ハイブリッドテキスト要約を決定する方法、システム、及び、制御プログラム、談話構文解析方法、システム、及び、該システムにおける方法、談話構成要素にテキストを分割する方法及びシステム、談話の構造表現を決定する方法及びシステム、ハイブリッドテキスト要約システム
WO2005081220A1 (ja) * 2004-02-19 2005-09-01 Sharp Kabushiki Kaisha データ表示装置、データ表示プログラムおよびデータ表示プログラムを記録したコンピュータ読取り可能な記録媒体
JP2005234227A (ja) * 2004-02-19 2005-09-02 Sharp Corp データ表示装置、データ表示プログラムおよびデータ表示プログラムを記録したコンピュータ読取り可能な記録媒体
CN100433008C (zh) * 2004-09-29 2008-11-12 株式会社东芝 用于创建文档摘要的系统和方法
JP2011022914A (ja) * 2009-07-17 2011-02-03 Casio Computer Co Ltd 情報処理装置およびその制御プログラム
JP2013016106A (ja) * 2011-07-06 2013-01-24 Kyocera Communication Systems Co Ltd 要約文生成装置
JP2013218689A (ja) * 2012-04-06 2013-10-24 Samsung Electronics Co Ltd ディスプレイ上のオブジェクトを実行する方法及びそのデバイス
US9632682B2 (en) 2012-04-06 2017-04-25 Samsung Electronics Co., Ltd. Method and device for executing object on display
US9760266B2 (en) 2012-04-06 2017-09-12 Samsung Electronics Co., Ltd. Method and device for executing object on display
US9792025B2 (en) 2012-04-06 2017-10-17 Samsung Electronics Co., Ltd. Method and device for executing object on display
US9940003B2 (en) 2012-04-06 2018-04-10 Samsung Electronics Co., Ltd. Method and device for executing object on display
US10042535B2 (en) 2012-04-06 2018-08-07 Samsung Electronics Co., Ltd. Method and device for executing object on display
US10216390B2 (en) 2012-04-06 2019-02-26 Samsung Electronics Co., Ltd. Method and device for executing object on display
US10649639B2 (en) 2012-04-06 2020-05-12 Samsung Electronics Co., Ltd. Method and device for executing object on display
US11150792B2 (en) 2012-04-06 2021-10-19 Samsung Electronics Co., Ltd. Method and device for executing object on display
JP2014075142A (ja) * 2013-11-27 2014-04-24 Casio Comput Co Ltd 情報処理装置およびその制御プログラム
JP2016057669A (ja) * 2014-09-05 2016-04-21 日本電信電話株式会社 情報提示装置および情報提示プログラム

Also Published As

Publication number Publication date
JP4214598B2 (ja) 2009-01-28
US7200808B1 (en) 2007-04-03

Similar Documents

Publication Publication Date Title
JP4214598B2 (ja) 文書処理方法および装置ならびに記録媒体
US7721192B2 (en) User interface for a resource search tool
JP4810469B2 (ja) 検索支援装置、プログラム及び検索支援システム
EP1109151A1 (en) Electronic document processor
JP2002334034A (ja) コンテンツをクライアントへ提供する方法、装置、及びコンピュータ・プログラム
JPH11161682A (ja) 情報検索装置、情報検索方法及び記録媒体
JP3789614B2 (ja) ブラウザシステム、音声プロキシサーバ、リンク項目の読み上げ方法及びリンク項目の読み上げプログラムを格納した記憶媒体
KR100403947B1 (ko) 개인용 전자문서를 생성하는 방법, 시스템 및 컴퓨터프로그램 제조물
JP3143345B2 (ja) 文字列検索装置
US6985147B2 (en) Information access method, system and storage medium
WO2000043909A1 (fr) Procede et dispositif de traitement de documents et support d'enregistrement
JP2007025786A (ja) コンテンツ検索装置、コンテンツ検索プログラムおよびコンテンツ検索方法
JPH11184865A (ja) 文書要約装置
JP3383049B2 (ja) 文書検索装置
JPH1145261A (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000099526A (ja) 文書情報抽出装置
JP4186321B2 (ja) 文書処理方法及び装置並びに記録媒体
JP4044644B2 (ja) 電子掲示板システム、電子掲示板プログラムが記憶された記憶媒体、及び電子掲示板の活性化方法
JP2001109762A (ja) 文書処理方法及び装置並びに記録媒体
JP2000222326A (ja) 学習支援方法及びシステム及び学習支援プログラムを格納した記憶媒体
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001167130A (ja) 加重値表現構造を含むマルチメディアデータ構造及びマルチメディアディスプレー方法
JP4320819B2 (ja) 文書処理方法および装置ならびに記録媒体
JPWO2004111879A1 (ja) ナビゲーションマップ表示方法及びナビゲーションマップ表示システム
JP2001043219A (ja) 文書処理方法及び装置並びに記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080318

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080515

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080811

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080818

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081014

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081027

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111114

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees