JP2002229985A - 構造化文書処理装置、構造化文書処理方法およびコンピュータに構造化文書処理を実行させるためのプログラム - Google Patents

構造化文書処理装置、構造化文書処理方法およびコンピュータに構造化文書処理を実行させるためのプログラム

Info

Publication number
JP2002229985A
JP2002229985A JP2001030260A JP2001030260A JP2002229985A JP 2002229985 A JP2002229985 A JP 2002229985A JP 2001030260 A JP2001030260 A JP 2001030260A JP 2001030260 A JP2001030260 A JP 2001030260A JP 2002229985 A JP2002229985 A JP 2002229985A
Authority
JP
Japan
Prior art keywords
structured document
output
processing
document
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001030260A
Other languages
English (en)
Other versions
JP2002229985A5 (ja
Inventor
Koichi Narahara
孝一 楢原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001030260A priority Critical patent/JP2002229985A/ja
Publication of JP2002229985A publication Critical patent/JP2002229985A/ja
Publication of JP2002229985A5 publication Critical patent/JP2002229985A5/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 重要な要素を出力させる際の判定精度を高め
ること。 【解決手段】 構造化文書処理装置をパーソナルコンピ
ュータに適用したPC100は、構造化文書記述言語に
より記述された要素の内容を出力可能に処理する構造化
文書処理装置であって、構造化文書記述言語により記述
された構造化文書を入力する文書入力部101と、文書
入力部101により入力された構造化文書中の各要素の
タグの種類にしたがって当該要素を出力させるか否かを
決定する出力決定部134と、出力決定部134により
出力させると決定された要素を出力可能に処理する文書
整形部135と、を備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、構造化文書処理装
置、構造化文書処理方法、コンピュータに構造化文書処
理を実行させるためのプログラムに関し、特に、構造化
文書記述言語で記述された文書を、タグの種類や個数に
基づいて表示または印刷する構造化文書処理装置、構造
化文書処理方法および、コンピュータに構造化文書処理
を実行させるためのプログラムに関する。
【0002】
【従来の技術】従来、インターネット環境の発展により
HTML(HyperText Markup Lan
guage)、XML(eXtensible Mar
kupLanguage:拡張可能な印付け言語)など
に代表される構造化文書記述言語が広く利用されてい
る。
【0003】構造化文書記述言語とは、構造化文書を記
述するための規約である。構造化文書は、要素の集合か
らなり、各要素は、タグと要素の内容とから構成され
る。要素の内容とは、構造化文書の作成者が表示させた
いと考える文書や図形などの構造化文書の実体的部分を
いう。タグとは、その要素の内容を表示する際のフォン
トの大きさなど、その要素の出力態様ないし属性を指定
する構造化文書の規約的部分をいう。
【0004】構造化文書の作成者は、出力させたい要素
の内容に、タグという印付けをおこない、構造化文書を
作成する。なお、要素の内容は、文字データや画像デー
タの他にも、音声データなどを含めることも可能であ
る。
【0005】HTMLとXMLの違いは利用可能なタグ
の種類にある。HTMLはあらかじめ定められた約80
種類のタグを使用する言語であるのに対し、XMLは文
書作成者が自由にタグの種類を設計可能な言語である。
【0006】図11は、HTMLで記述した文書情報、
いわゆるソースであり、図12は、XMLで記述した文
書情報(ソース)である。これらを、Internet
Explorler(マイクロソフト社の登録商標)
やNetscape Navigator(Netsc
ape Communications社の登録商標)
といったブラウザで処理すると、図13に示した内容で
出力、すなわち、コンピュータ画面上に表示される。ま
た、一定の操作をおこなうことにより、プリンタから出
力、すなわち、印刷することもできる。
【0007】図13に示したように、図11もしくは図
12に示したソースからはいずれも同一の出力が得られ
る。一方、図11および図12に示したように、同一の
出力結果を得るソースであっても、HTMLとXMLで
は、使用されているタグの種類が異なっていることが確
認できる。XMLは、HTMLと比較して、要素の内容
の出力態様ないし属性を詳細に記述できる点が大きく異
なる。従来では、構造化文書記述言語により、豊富なコ
ンテンツを閲覧者ないし利用者に提供することが可能で
あった。
【0008】
【発明が解決しようとする課題】しかしながら、従来で
は以下のような問題点があった。図13の例では、出力
すべき内容が少ないので、CRTなどの画面に表示する
場合は画面内に文書全体が表示可能であり、印刷装置な
どで印刷する場合はA4サイズの用紙1枚以内に印刷可
能である。しかしながら、出力すべき内容は一画面分も
しくは1ページ分に限られるわけではないので、この場
合は画面のスクロールが必要であったり、複数ページに
印刷する必要がある。
【0009】このとき、その出力内容を見る者の閲覧効
率や利用効率のため、重要な要素のみを選択して表示ま
たは印刷する技術が求められていた。たとえば、従来で
は、文字データ、画像データ、URL参照ポインタのと
いった各要素の内容自体の種別や各要素の内容のデータ
量にしたがって、その要素が重要であるか否かを判断し
ていた。換言すると、要素が重要であるか否かを、要素
の物理的特性によって判断していた。
【0010】また、特開平11―203100号「ネッ
トワークプリンタ及びネットワーク印刷方法」では、H
TMLで記述された文書情報から重要な要素を利用者側
が判断し選択する技術が開示されている。しかしなが
ら、この場合でもやはり、選択の基準が、文字データの
みを持つ要素であったり、画像データのみを持つ要素で
あったり、また、データ量や画像サイズが少ない要素を
対象としている。したがって、この従来技術も、要素が
重要であるか否かを、要素の物理量によって判断したも
のであった。
【0011】このような判断をおこなうと、要素の意味
内容に即して重要度が判断されるわけではないので、次
のような誤判定が生じるという問題点があった。例え
ば、長い文章で構成される要素と短い文章で構成される
要素とがあった場合に、従来技術ではデータ量の少ない
文章を重要なデータとして判定している。しかしなが
ら、長い文章の方が重要な場合もあり、この場合は誤判
定になるという問題点があった。
【0012】また、WWW(World Wide W
eb)等で提供されている文書情報には、広告等の重要
でない冗長な要素が含まれている場合がある。従来技術
では、URL参照ポインタと画像データから構成されて
いる要素を、広告情報であり、重要でないと判断してい
るが、重要な要素が広告と同様の構成で記述されている
場合もあり、この場合は誤判定になるという問題点があ
った。
【0013】すなわち、従来の技術では、重要な要素を
出力させる場合に、要素の物理量にしたがって当該要素
を重要か否かを判断していたので、判定精度が必ずしも
高くないという問題点があった。
【0014】本発明は上記に鑑みてなされたものであっ
て、重要な要素を出力させる際の判定精度を高めること
を目的とする。
【0015】
【課題を解決するための手段】上記の目的を達成するた
めに、請求項1に記載の構造化文書処理装置は、構造化
文書記述言語により記述された要素の内容を出力可能に
処理する構造化文書処理装置であって、前記構造化文書
記述言語により記述された構造化文書を入力する構造化
文書入力手段と、前記構造化文書入力手段により入力さ
れた構造化文書中の各要素のタグの種類にしたがって当
該要素を出力させるか否かを決定する出力決定手段と、
前記出力決定手段により出力させると決定された要素を
出力可能に処理する構造化文書処理手段と、を備えたこ
とを特徴とする。
【0016】すなわち、請求項1にかかる発明は、タグ
を基に重要度を判定し、構造化文書内で重要な意味を持
つ要素を特定できる。
【0017】また、請求項2に記載の構造化文書処理装
置は、構造化文書記述言語により記述された要素の内容
を出力可能に処理する構造化文書処理装置であって、前
記構造化文書記述言語により記述された構造化文書を入
力する構造化文書入力手段と、前記構造化文書入力手段
により入力された構造化文書の要素中に定義されるタグ
の個数にしたがって、もしくは、当該要素中に定義され
るタグの中でさらにタグが段階的に定義される場合の当
該階層の深さにしたがって、当該要素を出力させるか否
かを決定する出力決定手段と、前記出力決定手段により
出力させると決定された要素を出力可能に処理する構造
化文書処理手段と、を備えたことを特徴とする。
【0018】すなわち、請求項2にかかる発明は、タグ
と各要素間の論理構造を基に重要度を判定し、構造化文
書内で重要な意味を持つ要素を特定できる。
【0019】また、請求項3に記載の構造化文書処理装
置は、請求項1または2に記載の構造化文書処理装置に
おいて、前記構造化文書処理手段により出力可能に処理
された前記要素の内容を出力する構造化文書出力手段を
具備したことを特徴とする。
【0020】また、請求項3にかかる発明は、構造化文
書のうちの重要な要素の内容を出力する。
【0021】また、請求項4に記載の構造化文書処理装
置は、請求項3に記載の構造化文書処理装置において、
前記構造化文書出力手段が、表示装置もしくは印刷装置
であることを特徴とする。
【0022】すなわち、請求項4にかかる発明は、重要
な要素を出力させる際の判定精度を高める構造化文書処
理装置を提供することができる。
【0023】また、請求項5に記載の構造化文書処理方
法は、構造化文書記述言語により記述された要素の内容
を出力可能に処理する構造化文書処理方法であって、前
記構造化文書記述言語により記述された構造化文書を入
力する構造化文書入力工程と、前記構造化文書入力工程
で入力された構造化文書中の各要素のタグの種類にした
がって当該要素を出力させるか否かを決定する出力決定
工程と、前記出力決定工程で出力させると決定された要
素を出力可能に処理する構造化文書処理工程と、前記構
造化文書処理工程で出力可能に処理された前記要素の内
容を出力する構造化文書出力工程と、を含んだことを特
徴とする。
【0024】すなわち、請求項5にかかる発明は、タグ
を基に重要度を判定し、構造化文書内で重要な意味を持
つ要素を特定できる。
【0025】また、請求項6に記載の構造化文書処理方
法は、構造化文書記述言語により記述された要素の内容
を出力可能に処理する構造化文書処理方法であって、前
記構造化文書記述言語により記述された構造化文書を入
力する構造化文書入力工程と、前記構造化文書入力工程
で入力された構造化文書の要素中に定義されるタグの個
数にしたがって、もしくは、当該要素中に定義されるタ
グの中でさらにタグが段階的に定義される場合の当該階
層の深さにしたがって、当該要素を出力させるか否かを
決定する出力決定工程と、前記出力決定工程で出力させ
ると決定された要素を出力可能に処理する構造化文書処
理工程と、前記構造化文書処理工程で出力可能に処理さ
れた前記要素の内容を出力する構造化文書出力工程と、
を含んだことを特徴とする。
【0026】すなわち、請求項6にかかる発明は、タグ
と各要素間の論理構造を基に重要度を判定し、構造化文
書内で重要な意味を持つ要素を特定できる。
【0027】また、請求項7に記載の構造化文書処理方
法は、請求項5または6に記載の構造化文書処理方法に
おいて、前記構造化文書出力工程では、表示装置もしく
は印刷装置を介して前記要素の内容を出力することを特
徴とする。
【0028】すなわち、請求項7にかかる発明は、重要
な要素を出力させる際の判定精度を高める構造化文書処
理方法を提供することができる。
【0029】また、請求項8に記載のプログラムは、構
造化文書記述言語により記述された要素の内容を出力可
能に処理するプログラムであって、コンピュータを、前
記構造化文書記述言語により記述された構造化文書を入
力する構造化文書入力手段と、前記構造化文書入力手段
により入力された構造化文書中の各要素のタグの種類に
したがって当該要素を出力させるか否かを決定する出力
決定手段と、前記出力決定手段により出力させると決定
された要素を出力可能に処理する構造化文書処理手段と
して機能させることを特徴とする。
【0030】すなわち、請求項8にかかる発明は、タグ
を基に重要度を判定させ、構造化文書内で重要な意味を
持つ要素を特定させることができる。
【0031】また、請求項9に記載のプログラムは、構
造化文書記述言語により記述された要素の内容を出力可
能に処理するプログラムであって、コンピュータを、前
記構造化文書記述言語により記述された構造化文書を入
力する構造化文書入力手段と、前記構造化文書入力手段
により入力された構造化文書の要素中に定義されるタグ
の個数にしたがって、もしくは、当該要素中に定義され
るタグの中でさらにタグが段階的に定義される場合の当
該階層の深さにしたがって、当該要素を出力させるか否
かを決定する出力決定手段と、前記出力決定手段により
出力させると決定された要素を出力可能に処理する構造
化文書処理手段、として機能させることを特徴とする。
【0032】すなわち、請求項9にかかる発明は、タグ
と各要素間の論理構造を基に重要度を判定させ、構造化
文書内で重要な意味を持つ要素を特定させることができ
る。
【0033】また、請求項10に記載のプログラムは、
請求項8または9に記載のプログラムにおいて、さら
に、コンピュータを、前記構造化文書処理手段により出
力可能に処理された前記要素の内容を出力する構造化文
書出力手段として機能させるプログラムを含んだことを
特徴とする。
【0034】すなわち、請求項10にかかる発明は、構
造化文書の重要な要素の内容を出力させる。
【0035】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照しながら詳細に説明する。 実施の形態1.実施の形態1では、構造化文書記述言語
としてXMLが使用された構造化文書を入力し、要素の
タグないし論理構造にしたがって、その内容を出力する
構造化文書処理装置を、パーソナルコンピュータ(P
C)に適用した例について説明する。ここでは、まず、
XMLが使用された構造化文書について説明し、つぎに
装置(PC)について説明する。
【0036】(XMLが使用された構造化文書の説明)
図1は、実施の形態1で使用される、XMLが使用され
た構造化文書の構成例を示した図である。なお、図1
は、説明の便宜上、図12で示した構造化文書と同一の
構成としている。また、図1には便宜的に行番号を記し
ているが実際に必要とされるものではない。
【0037】構造化文書とは、前述したように、構造化
文書記述言語で記述された文書であり、要素の内容、す
なわち、文書作成者が伝達したい情報(文章、画像、音
声など)が、山パーレン<>で示されるタグで囲まれた
文章である(図1参照)。タグは要素の内容を表示する
際のフォントの大きさなど、その要素の出力態様ないし
属性を指定する構造化文書の規約的部分である。図1に
示した例でいうと、doc、title、main等の
文字列がタグである。
【0038】構造化文書は、XML宣言、文書型宣言、
文書エンティティの3つのブロックから構成される。図
1の例では、1行目がXML宣言、3〜12行目が文書
型宣言、14〜31行目が文書の実体的部分、すなわ
ち、文書作成者が閲覧者ないし利用者に伝達したい内容
をしるす部分である。なお、この文書の実体的部分を、
以降において適宜文書エンティティと称する。
【0039】つぎに、構造化文書の各ブロックについて
説明する。XML宣言とは、この構造化文書がXMLで
記述されていることを明示する宣言である。文書型宣言
とは、構造化文書に含まれる要素の属性や文書の論理構
造といった文書型定義がなされる宣言である。たとえ
ば、文書型定義では要素の名前、要素間の親子関係、子
要素の出現順序、出現回数などを規定する。
【0040】論理構造とは、タグの入籠構造をいう。図
2は、構造化文書のタグの入籠構造の一例を示した説明
図である。図には、図1に示した構造化文書のタグの入
籠構造を示している。図に示したように、タグ「do
c」はルート(最上位の要素の属性を示すタグ)に相当
し、下位に、「title」、「main」、「mis
c」、「img」を含んだ構造となっている。
【0041】文書エンティティは出力させたい文書の実
体的内容を記述したブロックである。この文書エンティ
ティは、ルートとなる要素中で、始まりを示すタグ(開
始タグ)で始まり、終わりを示すタグ(終了タグ)で終
わる。全ての要素は開始タグ、終了タグを持ち、各要素
の内容は開始タグと終了タグの間に記述する。開始タグ
は<タグ名>、終了タグは</タグ名>と記述し、タグ
名には文書型定義で定義した要素の名前を用いる。たと
えばタグ「doc」の開始タグは「<doc>」、終了
タグは「</doc>」である。
【0042】以上説明したように、XMLを用いて記述
された構造化文書により、後述する構造化処理装置を用
いて、重要度に応じて出力スタイルを変更することが可
能となる。
【0043】(構造化文書処理装置の内容)つぎに、本
願発明の構造化文書処理装置をパーソナルコンピュータ
(PC)に適用した例を図面を参照しながら説明する。
図3は、本発明を実施する構造化文書処理装置をPCに
適用した例の機能ブロック図である。図4は、本発明を
実施するPCの構成例を示した説明図である。
【0044】PC100は、構造化文書を入力する文書
入力部101と、文書入力部101で入力された構造化
文書を初め後述するテーブルやスタイルシートを格納す
る格納部102と、構造化文書を出力可能に処理する文
書処理部103と、文書処理部103で処理された構造
化文書を実際に出力する文書出力部104と、どの重要
度まで出力させるかを指定する重要度指定部105と、
を有する。なお、出力とは、表示、印刷、スピーカから
の音声出力など、人間の五官により知覚可能に処理され
たものすべてを含む。
【0045】ハードウェア構成としては、PC100
は、構造化文書を出力可能に変換処理するCPU201
(図4参照)と、CPU201のワークエリアであるR
AM202と、OSを含み様々なソフトウェアを格納
し、また、構造化文書を含み様々なファイルを格納する
ハードディスク203と、構造化文書を表示するCRT
204と、CRT204の出力制御をおこなうビデオカ
ード205と、構造化文書を印刷するプリンタ206
と、各種の指示をおこなうキーボード207と、プリン
タ206やキーボード207の入出力を制御するI/F
208と、インターネットに接続しWebサーバから構
造化文書ファイルを入力するモデム209と、を有す
る。
【0046】また、ハードディスク203は、PC10
0の基本動作を制御するOS231と、構造化文書を解
析し、出力可能に処理するプログラムであるXML解析
アプリケーション232と、プリンタドライバ233
と、ブラウザ234と、を有する。なお、使用の態様に
よっては、XML解析アプリケーション232は、ブラ
ウザ234やOS231に組み込まれていてもよい。ま
た、ブラウザ234はOS231に組み込まれていても
よい。
【0047】ハードディスク203は、さらに、図1に
示したような構造化文書を電子ファイルである構造化文
書ファイル235として格納する。ハードディスク20
3は、この他、構造化文書ファイル235にリンクの張
られている画像ファイル236、画像ファイル237お
よび音声ファイル238等を格納する。
【0048】また、ハードディスク203は、文書処理
部103で使用するテーブル239と、スタイルシート
240とを格納する。なお、後に詳述するが、テーブル
239は、要素の内容を出力させるか否かを決定する際
の判断材料として用いられる参照テーブルであり、スタ
イルシート240は、出力フォーマットを決定する補助
情報である。
【0049】つぎに、各部の内容を説明する。 (文書入力部101の内容)文書入力部101は、構造
化文書を入力する。入力とは、構造化文書をエディタを
用いて入力することを意味する場合もあれば、インター
ネット等を通じてWebサーバから入力することも意味
する。また、ハードディスクに203に格納された構造
化文書ファイル235を読み出すことであってもよい。
すなわち、入力とは、PC100内に構造化文書が作成
ないし取り込まれることを意味する。文書入力部101
は、モデム209とOS231もしくはキーボード20
7によりその機能を実現することができる。
【0050】(格納部102の内容)格納部102は、
文書入力部101で入力された構造化文書を格納する文
書格納部121と、後述する出力決定部で参照するテー
ブル239を格納するテーブル格納部122と、後述す
る文書整形部で使用するスタイルシートを格納するスタ
イルシート格納部123とを有する。格納部102は、
ハードディスク203およびRAM202によりその機
能を実現することができる。
【0051】また、ハードディスク203やRAM20
2以外でも、CD−ROM、MOなどによりその機能を
実現することができる。なお、構造化文書は、テキスト
文書を入力するいわゆるエディタを用いて作成すること
ができる。また、専用のエディット機能を持つエディタ
を利用し、文書型定義で規定された論理構造にしたがっ
て文書を作成することもできる。
【0052】(文書処理部103の内容)文書処理部1
03は、構造化文書をCRT204やプリンタ206で
出力可能に処理する。文書処理部103は、入力した文
書がXMLの使用された構造化文書であるかを判定する
文書種判定部131と、XMLが使用された構造化文書
の要素をタグと要素の内容とに分離する要素分離部13
2と、要素の構造を後述するツリー構造のデータとして
解析する要素解析部133と、ツリー構造のデータを参
照しつつ、タグやタグの入籠構造もしくは要素の内容の
重要度を入力し、どの要素の内容を出力すべきか決定す
る出力決定部134と、決定された要素の内容を整形す
る文書整形部135と、を有する。
【0053】文書処理部103は、OS231、XML
解析アプリケーション232、プリンタドライバ23
3、ブラウザ234、CPU201によりその機能を実
現することができる。なお、文書処理部103の具体的
な処理内容については後述する。
【0054】(文書出力部104の内容)文書出力部1
04は、文書処理部103で処理された文書を出力す
る。具体的には、CRT204やプリンタ206から構
成される。なお、スピーカも含まれる。これは、構造化
文書で音声ファイルが参照されている場合には、スピー
カからその音声ファイルの内容が出力されるからであ
る。
【0055】つぎに、文書処理部103の処理内容を詳
述する。 (文書処理部103:文書種判定部131の内容)文書
種判定部131は、読み込んだファイルがXMLで記述
されているかを判定する。XMLが使用された構造化文
書の場合には、上述したように、XML宣言、文書型宣
言、文書エンティティの3ブロックが順に記載されてい
る。したがって、文書種判定部131は、ファイルの内
容を順次読み込み、XML宣言ブロックが記述されてい
るかを判定する。文書種判定部131は、XML解析ア
プリケーション232もしくはブラウザ234、および
CPU201によりその機能を実現することができる。
【0056】(文書処理部103:要素分離部132の
内容)要素分離部132は、文書種判定部131により
XMLが使用された構造化文書であると判定されたファ
イルの各要素をタグと要素の内容とに分離する。この分
離により構造化文書のタグの構造を管理する要素解析部
133での処理が容易となる。要素分離部132は、X
ML解析アプリケーション232およびCPU201に
よりその機能を実現することができる。
【0057】(文書処理部103:要素解析部133の
内容)要素解析部133は、要素分離部132で分離さ
れたタグと要素の内容を構文解析ツリー(以降では適宜
構文解析木と称する)と呼ばれる図2に示したようなツ
リー構造のデータに振り分け管理する。すなわち、木構
造の各節を、タグ、属性、要素の内容を一組として管理
する。なお、図2では要素の内容の表示を省略してい
る。図に示したように、タグ「doc」の中には、さら
にタグ「main」が定義され、このタグ「main」
では、さらにタグ「section」が定義されてい
る。
【0058】すなわち、タグが階層的に定義されてい
る。なお、ここで説明したタグ「main」は、図から
明らかなように、さらに2階層の深さのタグを有してい
る。要素解析部133は、XML解析アプリケーション
232と、CPU201によりその機能を実現すること
ができる。
【0059】(文書処理部103:出力決定部134の
内容)出力決定部134は、テーブル格納部122に格
納されているテーブル239を参照して、タグに使われ
ている文字列の意味を解析し、文書出力部104から出
力させるべき要素であるか否かを決定する。出力決定部
134は、出力決定の指標とすべくタグの内容を、まず
カテゴリに分類する。
【0060】ここで、XMLではタグは自由に設計する
ことが可能なため、使用するタグには要素の意味を表す
文字列を用いることができる。実際に、文章のタイトル
を表す要素には「title」、「Title」、「タ
イトル」等のタグを用い、文書の内容を表す要素には
「contents」、「Contents」、「内
容」、「本文」等のタグを用いることができる。
【0061】図5は、テーブル格納部122に格納され
たテーブル239の内容の一例を表した説明図である。
テーブル239の左列はタグの意味を表すカテゴリ、中
央列はカテゴリに属するタグ、右列は要素内容を出力さ
せるか否かを決定する重要度であり、各カテゴリに対し
て付与されている。なお、図の例ではカテゴリと重要度
が1対1に対応しているが、これに限られるものではな
い。
【0062】図6は、カテゴリと、タグと、重要度との
関係の他の例を示した図である。C1は、タイトルに関
連するタグのカテゴリであるが、タグが日本語で表示さ
れるもの(具体的にはタグ「タイトル」)については重
要度がlevel1、タグが英語で表示されるもの(具
体的にはタグ「title」、「Title」)につい
ては重要度がlevel2に設定されている。この様に
分類しておくことで、文書作成者は、日本語タグに対し
ては、重要度のより高い要素の内容を記述し、英語タグ
に対しては、重要度の少し低い内容を記述する等してタ
グを使い分けることができる。たとえば言語の異なる国
に同一コンテンツを配信する際に役立つ。
【0063】テーブル239を参照することにより、木
構造の各節に対する意味解析処理が行われる。本実施例
ではタグの文字列を解析することにより意味を推定して
いるが、この方式に限定することはなく他の方式を用い
ても構わない。意味解析処理は、図2に示した構文解析
木の各節で管理されているタグないし要素の内容の重要
度を判定する処理である。重要度の判定は重要度に関す
る情報が登録されたテーブル239を利用する。図5に
示したテーブル239のlevel1、level2、
level3がカテゴリに対応した重要度であり、数値
が小さいほど重要度が高い情報であることを示す。出力
決定部134は、このテーブル239を参照することに
より図2に示した構文解析木の各節の重要度を判定す
る。判定結果は構文解析木と共に格納部102に記憶し
てもよい。
【0064】重要度を判定する際には、ユーザが重要度
を指定し、指定された重要度よりも高い重要度の要素を
出力可能に処理する。この指定は、重要度指定部105
によりおこなう。重要度指定部105は、キーボード2
07によりその機能を実現することができるが、この
他、マウスやバーコードリーダなどによって入力しても
よい。たとえば、ユーザが重要度としてlevel2を
指定した場合は、level1、level2に対応す
るタグの要素が全て選択され、出力可能に処理される。
【0065】なお、使用の態様によっては、重要度でな
くカテゴリを指定して、指定されたカテゴリを出力する
ようにしてもよい。出力決定部134は、XML解析ア
プリケーション232、テーブル239、スタイルシー
ト240、CPU201によりその機能を実現すること
ができる。なお、ここでは、テーブル格納部122に格
納したテーブル239を出力決定部134が参照する例
について説明したが、これに限ることなく、要素解析部
133が参照する態様であってもよい。
【0066】(文書処理部103:文書整形部135の
内容)文書整形部整形装置は、重要項目選択装置で選択
された要素に対して文書整形の規則を定めたスタイルシ
ート240にそって整形処理を実施する。図7は、CS
S(Cascading Style Sheets)
と呼ばれるスタイルシートの一例を示した図である。ス
タイルシートは、構造化文書を構成する各要素の内容を
出力する際の文字サイズ、フォントの種類などを指定す
るシートである。
【0067】指定は、各タグに対しておこなう。図7の
例では、タグ「title」は24ポイントのフォント
で太字に指定するものであり、タグ「sectiont
itle」は18ポイントのフォントで太字、斜体に設
定するものである。他の要素についても必要に応じて指
定することが可能であるがここでは省略する。
【0068】以上のようなスタイルシートにより画面で
の表示、紙への印刷のための整形処理が文書処理部10
3で実施され、整形された構造化文書は文書出力部10
4から出力される。出力例を図8に示す。ここでは、l
evel1およびlevel2に対応するタグである
「title」、「sectiontitle」の要素
から構成される文書が出力された例を示している。
【0069】文書整形部135は、XML解析アプリケ
ーション232、スタイルシート240、OS231お
よびCPU201によりその機能を実現することができ
る。
【0070】(構造化文書の処理の流れ)つぎに、PC
100の具体的な処理の流れを説明する。図9は、構造
化文書の処理の流れの一例を示したフローチャートであ
る。文書入力部101は、電子ファイルを入力データと
して読み込む(ステップS901)。電子ファイルは、
モデム209からインターネット経由で読み込んでもよ
いし、場合によっては、既にハードディスク203に格
納されているものを読み出してもよい。
【0071】つぎに、文書種判定部131は、ファイル
の先頭を読み出し、入力した文書がXML文書ファイル
であるか否かを判定する(ステップS902)。XML
文書でないときは(ステップS902:NO)、処理を
終了し、XML文書であるときは(ステップS902:
YES)、文書型宣言と文書エンティティを読み込む
(ステップS903)。要素分離部132および要素解
析部133は、この読み込まれた文書型宣言と文書エン
ティティとを、タグと要素の内容とに分離し、これらを
構文解析木として管理する(ステップS904)。
【0072】出力決定部134は、構文解析木により管
理される要素のうち、出力すべき要素を、テーブル23
9を参照することにより決定する(ステップS90
5)。つづいて、文書整形部135は、スタイルシート
240を読み込み、タグにしたがって、要素の内容を処
理し、文書を整形する(ステップS906)。なお、こ
の整形は、フォントの大きさやフォントの飾り(斜体、
太字、下線)の他、音声ファイルの場合は、出力するボ
リュームの大きさや各種のサウンドエフェクトを施す。
また、動画の場合はその大きさや使用する色を調整する
(たとえば、カラー画像を白黒画像やセピア色に調整す
る)。
【0073】最後に、CRT204や図示しないスピー
カは処理された要素の内容を出力(表示)する(ステッ
プS907)。なお、ここではCRT204からの表示
を述べたが、プリンタ206から出力(印刷)してもよ
い。
【0074】以上説明したように、実施の形態1のPC
は、構造化文書のタグの種類にしたがって要素の内容を
出力するので、要素の物理量といった画一的な判断によ
らず、要素の意味内容を反映した出力が可能となる。ま
た、構造化文書作成者は、伝達したい要素の内容にかか
るタグを重要度の高いものとしてテーブル化することが
でき、意図した内容を閲覧者ないし利用者に伝達するこ
とができる。
【0075】実施の形態2.実施の形態2では、構造解
析木に基づいて要素の内容を出力する構造化文書処理装
置をPCに適用した例について説明する。なお、実施の
形態2では、実施の形態1の構成部分と同一の構成部分
については、その説明を省略し、特に断らない限り、同
一の符号を付することとする。
【0076】実施の形態2では、要素解析部133がテ
ーブル格納部122に格納されたテーブル239を参照
する。すなわち、要素解析部133は、要素分離部13
2で分離されたタグと要素の内容を構文解析木に振り分
けて管理する。すなわち、木構造の各節を、タグ、属
性、要素の内容に加えて、テーブル239を参照するこ
とにより各要素の重要度とカテゴリーも一組として管理
する。また、この構文解析木を構築することにより、各
要素の階層、すなわち、木構造の深さも管理されること
となる。
【0077】図10は、実施の形態2の構造化文書処理
装置をPCに適用した場合の構造化文書の処理の流れを
示したフローチャートである。文書入力部101は、電
子ファイルを入力データとして読み込む(ステップS1
001)。電子ファイルは、モデム209からインター
ネット経由で読み込んでもよいし、場合によっては、既
にハードディスク203に格納されているものを読み出
してもよい。
【0078】つぎに、文書種判定部131は、ファイル
の先頭を読み出し、入力した文書がXML文書ファイル
であるか否かを判定する(ステップS1002)。XM
L文書でないときは(ステップS1002:NO)、処
理を終了し、XML文書であるときは(ステップS10
02:YES)、文書型宣言と文書エンティティを読み
込む(ステップS1003)。要素分離部132はこの
読み込まれた文書型宣言と文書エンティティとを、タグ
と要素の内容とに分離する(ステップS1004)。
【0079】要素解析部133は、分離されたタグと要
素の内容から構文解析木を構築管理し、この際、図2に
示した各タグの入籠構造を解析する。すなわち、要素解
析部133は、木構造中の各要素の深さを求める(ステ
ップS1005)。たとえば、図2の例では、タグ「d
oc」を重要度level1と判定し、1段階下のタグ
である「title」、「main」、「misc」、
「img」は重要度level2と判定し、以下同様に
木構造の深さにしたがってlevel3、level4
を判定する。
【0080】出力決定部134は、構文解析木により管
理される要素のうち、出力すべき要素を、木構造の深さ
にしたがって決定する(ステップS1006)。すなわ
ち、木構造が深ければそれだけその要素ないし下層に展
開される要素が重要であると言えるので、出力決定部1
34は、木構造の深さにしたがって出力する要素を決定
するのである。
【0081】つづいて、文書整形部135は、スタイル
シート240を読み込み、タグにしたがって、要素の内
容を処理し、プリンタドライバを介して文書をプリント
アウト可能に整形する(ステップS1007)。最後
に、プリンタ206で整形された内容を印刷する(ステ
ップS1008)。
【0082】以上説明したように、実施の形態2のPC
は、構造化文書の木構造の深さにしたがって要素の内容
を出力するので、要素の物理量といった画一的な判断に
よらず、要素の意味内容を反映した出力が可能となる。
また、伝達したい要素の内容にかかるタグについてはそ
の構造が複雑になるので、すなわち、要素の階層が深く
なる傾向があるので、構造化文書作成者が特に意識しな
くても重要な要素の内容を閲覧者ないし利用者に伝達す
ることができる。
【0083】なお、実施の形態1ではタグの種類を、実
施の形態2では要素の階層の深さを重要度の判定基準、
すなわち、出力させるか否かを決定する基準としていた
が、使用の態様によっては、図5に示したカテゴリない
しタグの種類と、図2に示した要素の階層の深さとを両
方用いて、出力すべき重要な要素を選択してもよい。こ
の様にすることにより、重要度の判定精度をさらに向上
させることができる。
【0084】判定の手順としては、まず木構造の深さに
着目して重要度を判定する。すなわち、重要度の高いと
想定される要素を選択する。このとき、同一の深さのタ
グが複数ある場合に、図5に示したテーブルを参照し、
重要度の高い要素を細分化して重要度の高い要素を出力
する。
【0085】たとえば、図2の構文解析木について、実
施の形態2の方法で木構造の深さについて重要度を判定
した場合、タグ「sectiontitle」、「co
ntents」は共に重要度level4となるが、図
5のテーブルを参照すると「sectiontitl
e」は「contents」よりも重要度が高いタグと
して登録されている。この場合はタグ「section
title」の重要度はそのままlevel4とし、タ
グ「contents」の重要度をさらに一段階さげl
evel5と判定する。この方法を用いれば実施例2と
比較してさらに詳細な重要度の判定が可能となり精度が
向上する。
【0086】なお、本実施の形態1または2で説明した
構造化文書の処理は、あらかじめ用意されたプログラム
をパーソナル・コンピューターやワークステーション等
のコンピュータで実行することにより実現することがで
きる。すなわち、本発明は、コンピュータ上で単一のソ
フトウェア処理により実施することも可能である。この
ソフトウェア処理はコンピュータプログラムにより実現
され、フロッピー(登録商標)ディスクやCD−RO
M、ハードディスクなどの記録媒体に保存し、必要に応
じてコンピュータに読み込み実行する。
【0087】
【発明の効果】以上説明したように、本発明の構造化文
書処理装置(請求項1)は、構造化文書記述言語により
記述された要素の内容を出力可能に処理する構造化文書
処理装置であって、構造化文書入力手段が、前記構造化
文書記述言語により記述された構造化文書を入力し、出
力決定手段が、前記構造化文書入力手段により入力され
た構造化文書中の各要素のタグの種類にしたがって当該
要素を出力させるか否かを決定し、構造化文書処理手段
が、前記出力決定手段により出力させると決定された要
素を出力可能に処理するので、タグを基に重要度を判定
し、構造化文書内で重要な意味を持つ要素を特定でき、
これにより、重要な要素を出力させる際の判定精度を高
める構造化文書処理装置を提供することができる。
【0088】また、本発明の構造化文書処理装置(請求
項2)は、構造化文書記述言語により記述された要素の
内容を出力可能に処理する構造化文書処理装置であっ
て、構造化文書入力手段が、前記構造化文書記述言語に
より記述された構造化文書を入力し、出力決定手段が、
前記構造化文書入力手段により入力された構造化文書の
要素中に定義されるタグの個数にしたがって、もしく
は、当該要素中に定義されるタグの中でさらにタグが段
階的に定義される場合の当該階層の深さにしたがって、
当該要素を出力させるか否かを決定し、構造化文書処理
手段が、前記出力決定手段により出力させると決定され
た要素を出力可能に処理するので、タグと各要素間の論
理構造を基に重要度を判定し、構造化文書内で重要な意
味を持つ要素を特定でき、これにより、重要な要素を出
力させる際の判定精度を高める構造化文書処理装置を提
供することができる。
【0089】また、本発明の構造化文書処理装置(請求
項3)は、請求項1または2に記載の構造化文書処理装
置において、構造化文書出力手段が、前記構造化文書処
理手段により出力可能に処理された前記要素の内容を出
力するので、構造化文書のうちの重要な要素の内容を出
力でき、これにより、重要な要素を出力させる際の判定
精度を高める構造化文書処理装置を提供することができ
る。
【0090】また、本発明の構造化文書処理装置(請求
項4)は、請求項3に記載の構造化文書処理装置におい
て、前記構造化文書出力手段が、表示装置もしくは印刷
装置であるので、重要な要素を出力させる際の判定精度
を高める構造化文書処理装置を提供することができる。
【0091】また、本発明の構造化文書処理方法(請求
項5)は、構造化文書記述言語により記述された要素の
内容を出力可能に処理する構造化文書処理方法であっ
て、構造化文書入力工程では、前記構造化文書記述言語
により記述された構造化文書を入力し、出力決定工程で
は、前記構造化文書入力工程で入力された構造化文書中
の各要素のタグの種類にしたがって当該要素を出力させ
るか否かを決定し、構造化文書処理工程では、前記出力
決定工程で出力させると決定された要素を出力可能に処
理し、構造化文書出力工程では、前記構造化文書処理工
程で出力可能に処理された前記要素の内容を出力するの
で、タグを基に重要度を判定し、構造化文書内で重要な
意味を持つ要素を特定でき、これにより、重要な要素を
出力させる際の判定精度を高める構造化文書処理方法を
提供することができる。
【0092】また、本発明の構造化文書処理方法(請求
項6)は、構造化文書記述言語により記述された要素の
内容を出力可能に処理する構造化文書処理方法であっ
て、構造化文書入力工程では、前記構造化文書記述言語
により記述された構造化文書を入力し、出力決定工程で
は、前記構造化文書入力工程で入力された構造化文書の
要素中に定義されるタグの個数にしたがって、もしく
は、当該要素中に定義されるタグの中でさらにタグが段
階的に定義される場合の当該階層の深さにしたがって、
当該要素を出力させるか否かを決定し、構造化文書処理
工程では、前記出力決定工程で出力させると決定された
要素を出力可能に処理し、構造化文書出力工程では、前
記構造化文書処理工程で出力可能に処理された前記要素
の内容を出力するので、タグと各要素間の論理構造を基
に重要度を判定し、構造化文書内で重要な意味を持つ要
素を特定でき、これにより、重要な要素を出力させる際
の判定精度を高める構造化文書処理方法を提供すること
ができる。
【0093】また、本発明の構造化文書処理方法(請求
項7)は、請求項5または6に記載の構造化文書処理方
法において、前記構造化文書出力工程では、表示装置も
しくは印刷装置を介して前記要素の内容を出力するの
で、重要な要素を出力させる際の判定精度を高める構造
化文書処理方法を提供することができる。
【0094】また、本発明のプログラム(請求項8)
は、構造化文書記述言語により記述された要素の内容を
出力可能に処理するプログラムであって、コンピュータ
を、前記構造化文書記述言語により記述された構造化文
書を入力する構造化文書入力手段と、前記構造化文書入
力手段により入力された構造化文書中の各要素のタグの
種類にしたがって当該要素を出力させるか否かを決定す
る出力決定手段と、前記出力決定手段により出力させる
と決定された要素を出力可能に処理する構造化文書処理
手段として機能させるので、タグを基に重要度を判定さ
せ、構造化文書内で重要な意味を持つ要素を特定させる
ことができ、これにより、重要な要素を出力させる際の
判定精度を高めるプログラムを提供することができる。
【0095】また、本発明のプログラム(請求項9)
は、構造化文書記述言語により記述された要素の内容を
出力可能に処理するプログラムであって、コンピュータ
を、前記構造化文書記述言語により記述された構造化文
書を入力する構造化文書入力手段と、前記構造化文書入
力手段により入力された構造化文書の要素中に定義され
るタグの個数にしたがって、もしくは、当該要素中に定
義されるタグの中でさらにタグが段階的に定義される場
合の当該階層の深さにしたがって、当該要素を出力させ
るか否かを決定する出力決定手段と、前記出力決定手段
により出力させると決定された要素を出力可能に処理す
る構造化文書処理手段、として機能させるので、タグと
各要素間の論理構造を基に重要度を判定させ、構造化文
書内で重要な意味を持つ要素を特定させることができ、
これにより、重要な要素を出力させる際の判定精度を高
めるプログラムを提供することができる。
【0096】また、本発明のプログラム(請求項10)
は、請求項8または9に記載のプログラムにおいて、さ
らに、コンピュータを、前記構造化文書処理手段により
出力可能に処理された前記要素の内容を出力する構造化
文書出力手段として機能させるプログラムを含んだの
で、構造化文書の重要な要素の内容を出力させることが
でき、これにより、重要な要素を出力させる際の判定精
度を高めるプログラムを提供することができる。
【図面の簡単な説明】
【図1】実施の形態1で使用される、XMLが使用され
た構造化文書の構成例を示した図である。
【図2】構造化文書のタグの入籠構造の一例を示した説
明図である。
【図3】実施の形態1の構造化文書処理装置をPCに適
用した例の機能ブロック図である。
【図4】実施の形態1の構造化文書処理装置をPCに適
用した場合の構成例を示した説明図である。
【図5】テーブル格納部に格納されたテーブルの内容の
一例を表した説明図である。
【図6】テーブル格納部に格納されたテーブルのカテゴ
リと、タグと、重要度との関係の他の例を示した図であ
る。
【図7】CSS(Cascading Style S
heets)と呼ばれるスタイルシートの一例を示した
図である。
【図8】図1に示した構造化文書の出力例を示した図で
ある。
【図9】実施の形態1の構造化文書処理装置をPCに適
用した場合の構造化文書の処理の流れの一例を示したフ
ローチャートである。
【図10】実施の形態2の構造化文書処理装置をPCに
適用した場合の構造化文書の処理の流れを示したフロー
チャートである。
【図11】HTMLで記述した文書情報(ソース)の一
例を示した図である。
【図12】XMLで記述した文書情報(ソース)の一例
を示した図である。
【図13】図11または図12で示したソースに基づい
て構造化文書を出力した例である。
【符号の説明】
101 文書入力部 102 格納部 103 文書処理部 104 文書出力部 105 重要度指定部 121 文書格納部 122 テーブル格納部 123 スタイルシート格納部 131 文書種判定部 132 要素分離部 133 要素解析部 134 出力決定部 135 文書整形部 203 ハードディスク 206 プリンタ 207 キーボード 209 モデム 232 XML解析アプリケーション 233 プリンタドライバ 234 ブラウザ 235 構造化文書ファイル 239 テーブル 240 スタイルシート

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 構造化文書記述言語により記述された要
    素の内容を出力可能に処理する構造化文書処理装置であ
    って、 前記構造化文書記述言語により記述された構造化文書を
    入力する構造化文書入力手段と、 前記構造化文書入力手段により入力された構造化文書中
    の各要素のタグの種類にしたがって当該要素を出力させ
    るか否かを決定する出力決定手段と、 前記出力決定手段により出力させると決定された要素を
    出力可能に処理する構造化文書処理手段と、 を備えたことを特徴とする構造化文書処理装置。
  2. 【請求項2】 構造化文書記述言語により記述された要
    素の内容を出力可能に処理する構造化文書処理装置であ
    って、 前記構造化文書記述言語により記述された構造化文書を
    入力する構造化文書入力手段と、 前記構造化文書入力手段により入力された構造化文書の
    要素中に定義されるタグの個数にしたがって、もしく
    は、当該要素中に定義されるタグの中でさらにタグが段
    階的に定義される場合の当該階層の深さにしたがって、
    当該要素を出力させるか否かを決定する出力決定手段
    と、 前記出力決定手段により出力させると決定された要素を
    出力可能に処理する構造化文書処理手段と、 を備えたことを特徴とする構造化文書処理装置。
  3. 【請求項3】 前記構造化文書処理手段により出力可能
    に処理された前記要素の内容を出力する構造化文書出力
    手段を具備したことを特徴とする請求項1または2に記
    載の構造化文書処理装置。
  4. 【請求項4】 前記構造化文書出力手段は、表示装置も
    しくは印刷装置であることを特徴とする請求項3に記載
    の構造化文書処理装置。
  5. 【請求項5】 構造化文書記述言語により記述された要
    素の内容を出力可能に処理する構造化文書処理方法であ
    って、 前記構造化文書記述言語により記述された構造化文書を
    入力する構造化文書入力工程と、 前記構造化文書入力工程で入力された構造化文書中の各
    要素のタグの種類にしたがって当該要素を出力させるか
    否かを決定する出力決定工程と、 前記出力決定工程で出力させると決定された要素を出力
    可能に処理する構造化文書処理工程と、 前記構造化文書処理工程で出力可能に処理された前記要
    素の内容を出力する構造化文書出力工程と、 を含んだことを特徴とする構造化文書処理方法。
  6. 【請求項6】 構造化文書記述言語により記述された要
    素の内容を出力可能に処理する構造化文書処理方法であ
    って、 前記構造化文書記述言語により記述された構造化文書を
    入力する構造化文書入力工程と、 前記構造化文書入力工程で入力された構造化文書の要素
    中に定義されるタグの個数にしたがって、もしくは、当
    該要素中に定義されるタグの中でさらにタグが段階的に
    定義される場合の当該階層の深さにしたがって、当該要
    素を出力させるか否かを決定する出力決定工程と、 前記出力決定工程で出力させると決定された要素を出力
    可能に処理する構造化文書処理工程と、 前記構造化文書処理工程で出力可能に処理された前記要
    素の内容を出力する構造化文書出力工程と、 を含んだことを特徴とする構造化文書処理方法。
  7. 【請求項7】 前記構造化文書出力工程では、表示装置
    もしくは印刷装置を介して前記要素の内容を出力するこ
    とを特徴とする請求項5または6に記載の構造化文書処
    理方法。
  8. 【請求項8】 構造化文書記述言語により記述された要
    素の内容を出力可能に処理するプログラムであって、 コンピュータを、 前記構造化文書記述言語により記述された構造化文書を
    入力する構造化文書入力手段と、 前記構造化文書入力手段により入力された構造化文書中
    の各要素のタグの種類にしたがって当該要素を出力させ
    るか否かを決定する出力決定手段と、 前記出力決定手段により出力させると決定された要素を
    出力可能に処理する構造化文書処理手段として機能させ
    ることを特徴とするプログラム。
  9. 【請求項9】 構造化文書記述言語により記述された要
    素の内容を出力可能に処理するプログラムであって、 コンピュータを、 前記構造化文書記述言語により記述された構造化文書を
    入力する構造化文書入力手段と、 前記構造化文書入力手段により入力された構造化文書の
    要素中に定義されるタグの個数にしたがって、もしく
    は、当該要素中に定義されるタグの中でさらにタグが段
    階的に定義される場合の当該階層の深さにしたがって、
    当該要素を出力させるか否かを決定する出力決定手段
    と、 前記出力決定手段により出力させると決定された要素を
    出力可能に処理する構造化文書処理手段、 として機能させることを特徴とするプログラム。
  10. 【請求項10】 さらに、コンピュータを、前記構造化
    文書処理手段により出力可能に処理された前記要素の内
    容を出力する構造化文書出力手段として機能させるプロ
    グラムを含んだことを特徴とする請求項8または9に記
    載のプログラム。
JP2001030260A 2001-02-06 2001-02-06 構造化文書処理装置、構造化文書処理方法およびコンピュータに構造化文書処理を実行させるためのプログラム Pending JP2002229985A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001030260A JP2002229985A (ja) 2001-02-06 2001-02-06 構造化文書処理装置、構造化文書処理方法およびコンピュータに構造化文書処理を実行させるためのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001030260A JP2002229985A (ja) 2001-02-06 2001-02-06 構造化文書処理装置、構造化文書処理方法およびコンピュータに構造化文書処理を実行させるためのプログラム

Publications (2)

Publication Number Publication Date
JP2002229985A true JP2002229985A (ja) 2002-08-16
JP2002229985A5 JP2002229985A5 (ja) 2005-06-30

Family

ID=18894499

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001030260A Pending JP2002229985A (ja) 2001-02-06 2001-02-06 構造化文書処理装置、構造化文書処理方法およびコンピュータに構造化文書処理を実行させるためのプログラム

Country Status (1)

Country Link
JP (1) JP2002229985A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007200189A (ja) * 2006-01-30 2007-08-09 Hitachi Ltd 文書検索方法、文書検索プログラムおよび文書検索装置
US7600185B2 (en) 2003-03-28 2009-10-06 International Business Machines Corporation Information processing for creating a document digest
JP2009262331A (ja) * 2008-04-22 2009-11-12 Konica Minolta Business Technologies Inc 画像形成装置及びセキュリティ管理方法並びにセキュリティ処理プログラム
JP2010134203A (ja) * 2008-12-04 2010-06-17 Sony Computer Entertainment Inc 情報処理装置および情報処理方法
JP2010134780A (ja) * 2008-12-05 2010-06-17 Casio Computer Co Ltd 情報処理装置およびその制御プログラム
US7783115B2 (en) 2004-12-14 2010-08-24 Fujifilm Corporation Apparatus and method for setting degrees of importance, apparatus and method for representative image selection, apparatus and method for printing-recommended image selection, and programs therefor
JP2011090779A (ja) * 2003-10-04 2011-05-06 Samsung Electronics Co Ltd テキスト基盤のサブタイトルを提供する情報記録媒体及び再生装置
JP2012532395A (ja) * 2009-06-30 2012-12-13 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 選択的なコンテンツ抽出

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7890883B2 (en) 2003-03-28 2011-02-15 International Business Machines Corporation Information processing for creating a document digest
US7600185B2 (en) 2003-03-28 2009-10-06 International Business Machines Corporation Information processing for creating a document digest
US8204361B2 (en) 2003-10-04 2012-06-19 Samsung Electronics Co., Ltd. Information storage medium storing text-based subtitle, and apparatus and method for processing text-based subtitle
JP2011090779A (ja) * 2003-10-04 2011-05-06 Samsung Electronics Co Ltd テキスト基盤のサブタイトルを提供する情報記録媒体及び再生装置
US8331762B2 (en) 2003-10-04 2012-12-11 Samsung Electronics Co., Ltd. Information storage medium storing text-based subtitle, and apparatus and method for processing text-based subtitle
US8428432B2 (en) 2003-10-04 2013-04-23 Samsung Electronics Co., Ltd. Information storage medium storing text-based subtitle, and apparatus and method for processing text-based subtitle
US9031380B2 (en) 2003-10-04 2015-05-12 Samsung Electronics Co., Ltd. Information storage medium storing text-based subtitle, and apparatus and method for processing text-based subtitle
US7783115B2 (en) 2004-12-14 2010-08-24 Fujifilm Corporation Apparatus and method for setting degrees of importance, apparatus and method for representative image selection, apparatus and method for printing-recommended image selection, and programs therefor
JP4746433B2 (ja) * 2006-01-30 2011-08-10 株式会社日立製作所 文書検索方法、文書検索プログラムおよび文書検索装置
JP2007200189A (ja) * 2006-01-30 2007-08-09 Hitachi Ltd 文書検索方法、文書検索プログラムおよび文書検索装置
JP2009262331A (ja) * 2008-04-22 2009-11-12 Konica Minolta Business Technologies Inc 画像形成装置及びセキュリティ管理方法並びにセキュリティ処理プログラム
JP2010134203A (ja) * 2008-12-04 2010-06-17 Sony Computer Entertainment Inc 情報処理装置および情報処理方法
JP2010134780A (ja) * 2008-12-05 2010-06-17 Casio Computer Co Ltd 情報処理装置およびその制御プログラム
JP2012532395A (ja) * 2009-06-30 2012-12-13 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 選択的なコンテンツ抽出
US9032285B2 (en) 2009-06-30 2015-05-12 Hewlett-Packard Development Company, L.P. Selective content extraction

Similar Documents

Publication Publication Date Title
US10133707B2 (en) System and method for converting the digital typesetting documents used in publishing to a device-specific format for electronic publishing
US7134073B1 (en) Apparatus and method for enabling composite style sheet application to multi-part electronic documents
US7568154B2 (en) System and method for adaptive document layout via manifold content
US7120868B2 (en) System and method for adaptive document layout via manifold content
Bos et al. Cascading style sheets level 2 revision 1 (css 2.1) specification
US7085999B2 (en) Information processing system, proxy server, web page display method, storage medium, and program transmission apparatus
US20030110442A1 (en) Developing documents
US20020095443A1 (en) Method for automated generation of interactive enhanced electronic newspaper
US20030030645A1 (en) Modifying hyperlink display characteristics
KR20080053930A (ko) 문서 레이아웃의 적응을 용이하게 하는 시스템과, 콘텐트를배열하는 컴퓨터 구현 방법 및 컴퓨터 구현 시스템
MXPA04001932A (es) Metodo y sistema para mejorar la funcion de copiado de una aplicacion de programa de computadora.
JP2004086883A (ja) Xmlを理解するアプリケーションによって操作できる単一のxmlファイルに記憶されたワードプロセッシング文書
JP2002259112A (ja) デジタル文書閲覧システム、ブラウザ、文章要約システム、デジタル文書表示方法、文章要約方法、プログラム及び記憶媒体
US9286272B2 (en) Method for transformation of an extensible markup language vocabulary to a generic document structure format
US20070180359A1 (en) Method of and apparatus for preparing a document for display or printing
JP2002229985A (ja) 構造化文書処理装置、構造化文書処理方法およびコンピュータに構造化文書処理を実行させるためのプログラム
JP3308153B2 (ja) マルチメディア情報高次元化表示システム
KR20010047184A (ko) 전자서적 출판 프로그램이 기록된 컴퓨터로 읽을 수 있는기록매체
US20060242571A1 (en) Systems and methods for processing derivative featurees in input files
JP2002229984A (ja) 構造化文書処理装置、構造化文書処理方法およびコンピュータに構造化文書処理を実行させるためのプログラム
US7676746B1 (en) System and method for in-context authoring of alternate content for non-textual objects
Dengler et al. Scalable vector graphics (SVG) 1.1
JP4013748B2 (ja) 文書生成装置
Verhaart Designing web pages for producing electronic and paper based teaching material
Kent et al. Quick Start...

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041021

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041021

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070814

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080108