JP2004086855A - 文書処理装置及び文書処理方法、文書処理プログラム - Google Patents
文書処理装置及び文書処理方法、文書処理プログラム Download PDFInfo
- Publication number
- JP2004086855A JP2004086855A JP2003079123A JP2003079123A JP2004086855A JP 2004086855 A JP2004086855 A JP 2004086855A JP 2003079123 A JP2003079123 A JP 2003079123A JP 2003079123 A JP2003079123 A JP 2003079123A JP 2004086855 A JP2004086855 A JP 2004086855A
- Authority
- JP
- Japan
- Prior art keywords
- document
- information
- contents
- processing
- content information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
【課題】文書の内容と目次とを相互に参照しながら文書の参照や作成編集が可能であり、また指示時点での目次の参照や文書の内容の参照を可能とし、さらにレイアウト等の変更などに容易に対応可能な文書処理装置及び方法を提供する。
【解決手段】操作部4から目次の生成が指示されると、目次生成部2が文書格納部1に格納されている文書を参照して目次を生成して表示部5に出力し、目次が表示される。このとき、各目次項目には、対応する文書内容情報を生成するためのリンクを埋め込んでおく。操作部4によりリンクが指示されると、文書内容情報生成部3が動作し、文書格納部1に格納されている文書から文書内容情報を生成して表示部5に出力し、文書の内容が表示される。この時、目次の生成を指示するためのリンクを埋め込んでおく。操作部4によりリンクが指示されると、目次生成部2が目次を生成することになる。
【選択図】 図1
【解決手段】操作部4から目次の生成が指示されると、目次生成部2が文書格納部1に格納されている文書を参照して目次を生成して表示部5に出力し、目次が表示される。このとき、各目次項目には、対応する文書内容情報を生成するためのリンクを埋め込んでおく。操作部4によりリンクが指示されると、文書内容情報生成部3が動作し、文書格納部1に格納されている文書から文書内容情報を生成して表示部5に出力し、文書の内容が表示される。この時、目次の生成を指示するためのリンクを埋め込んでおく。操作部4によりリンクが指示されると、目次生成部2が目次を生成することになる。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、文書の作成や参照を支援する文書処理に関するものである。
【0002】
【従来の技術】
従来より、文書の作成を支援するための様々な試みがなされている。特に、文書の目次の作成は、形式的に行えることから従来より種々の技術が開発されている。例えば特許文献1の従来技術として、構造化文書のノード属性を手がかりにして目次を自動的に作成することができる旨が示唆されている。またこの文献には、部、章、節、項の構成と、それぞれ章見出し、節見出し、項見出しを有する構造化文書を、例えばHTML形式などで記述し、見出しなどの文字列を抽出するための指示タグを記述しておく。そして、構造化文書から抽出した文字列を挿入するための指示タグを記述したHTML形式のテンプレート文書を用意し、指示タグの内容に従って、HTML文書を生成する技術が記載されている。この技術を用いても、目次文書を生成することができる。
【0003】
しかし、このような従来の目次を作成する文書処理装置では、文書全体に対して一括処理を行う方法が一般的である。したがって文書の一部分や、章立てをわずかに変更した場合でも、その結果を確認するためには、文書全体を処理する必要がある。複数人で共同編集を行うような大規模文書の場合、その処理時間は膨大なものになるため、編集をしながら文書処理の結果を確認することが簡単に行えない、という問題があった。
【0004】
なお、テンプレートを利用した文書の変換自体は従来より行われている技術であり、例えば特許文献2などにも記載されている。しかし一般的に、テンプレートを利用した文書変換においては、文書に含まれる見出しの種類や個数に合わせてテンプレートを用意する必要があり、テンプレートを再利用できない場合が多い。
【0005】
また別の技術として、例えばXML形式で記述された文書をHTML形式の文書に変換する技術を利用することも考えられる。すなわち、部、章、節、項などの構成と、それぞれ章見出し、節見出し、項見出しなどを有する構造化文書をXML形式で記述しておき、これを、XSLスタイルプロセッサによって、節単位のHTML内容文書を生成する。別のXSLスタイルプロセッサによって、部、章、節、項の階層的要素と、部見出し、章見出し、節見出し、項見出しを関連づけることによって、HTML形式の目次文書を生成することができる。
【0006】
ここで用いているXSLスタイルプロセッサは、入力するXML文書を順に読み込んで、指定したパターンに従ってコンテンツを解析する。このとき、解析するためのパターンや、生成するHTML文書の構成要素は、スタイルファイルの中に記述しておく必要がある。すなわち、スタイルファイルは出力するHTMLのデザインと変換のための手続き的なプログラムロジックが同時に含まれており、内容が複雑になりがちである。
【0007】
図39は、XML文書の具体例の説明図、図40は、図39のXML文書から生成する目次の一例の説明図、図41は、図40に示した目次を得るためのXSLの記述一例の説明図、図42は、図39のXML文書から生成する目次の別の例の説明図、図43は、図42に示した目次を得るためのXSLの記述一例の説明図である。いま、図39に示すようなXML形式で記述された文書があるとする。この文書から図40に示すような目次を生成する場合を考える。この場合、XSLの記述は図41に示すようになる。すなわち、繰り返しの制御構造と制御変数を意識した手続き型のプログラム記述が含まれることになる。
【0008】
次に、同じ図39に示すXML文書から図42に示すような目次を生成する場合を考えると、XSLの記述は図43に示すようになる。このとき、図41に示したXSLの記述から図43に示したXSLの記述に変更するには、章番号の表示フォーマットを変更するだけではなく、部タイトルの表示を行わせるとともに、その部タイトルを章目次の間に挿入している。このため、XSLの記述中の繰り返しのための制御構造(for−each)を1重ループから2重ループに変更する必要がある。このような変更作業には、手続き的なプログラミングの知識が必要となる。
【0009】
また、XSLでの変換では、ページのデザインとそこに表示させる文字の生成ロジックが一緒に記述されているため、ファイルを修正できる人が限定される。場合によっては、1つのファイルを複数人で編集する必要がある。
【0010】
【特許文献1】
特開2001−209641号公報
【特許文献2】
特開2001−290812号公報
【0011】
【発明が解決しようとする課題】
本発明は、上述した事情に鑑みてなされたもので、文書の内容と目次とを相互に参照しながら文書の作成編集を行うことができ、また文書の作成編集状況に応じてその時点での目次や他の部分の文書の内容などを参照可能とし、さらにレイアウト等の見栄えの変更に容易に対応することができる文書処理装置及び文書処理方法と、その文書処理方法をコンピュータに実行させる文書処理プログラムを提供することを目的とするものである。
【0012】
【課題を解決するための手段】
本発明では、文書の目次を生成する際には、目次項目に対応する文書内容情報を生成するためのリンクを埋め込んでおく。そして、そのリンクを指示することによって、その目次項目を含む文書内容情報を生成し、出力する。その際に、目次の出力を指示するためのリンクを文書内容情報中に埋め込んでおく。文書内容情報中のリンクを指示することによって、その文書の内容に対応する目次項目を含む目次を生成し、出力する。この場合も、目次項目に対応する文書内容情報を生成するためのリンクを目次に埋め込んでおくことになる。
【0013】
このように、目次からリンクの指示によって目次に対応する文書内容情報だけを生成し、また文書内容情報からリンクの指示によって対応する目次だけ、あるいは、対応する文書内容だけを生成することができる。そのため、例えば1つの文書を複数人で編集しているような環境や、並行して文書の各部が更新されている場合でも、各部の文書の内容の確認や、目次による全体の確認などを自由に行うことが可能である。
【0014】
また、目次の生成の際に、下位あるいは上位の目次の表示を指示するためのリンクを埋め込んだ目次を生成すれば、例えばリンクの指示によって目次の内容の概略表示や詳細表示などを行うことが可能となる。また、文書の内容が変更されている場合にのみ、目次の当該文書の内容に対応する項目に、内容が変更されている旨を示す情報を付加して、文書の更新状況を知ることができる。このとき、内容が変更されている旨を示す情報は、例えば章あるいは節などの項目単位に付加することができ、その付加する項目単位を変更可能に構成することができる。さらに、目次となる見出しの読み仮名情報が付加されている場合には、その読み仮名情報を抽出し、抽出した読み仮名情報に基づいて索引を生成して出力するように構成することも可能である。
【0015】
このような目次は、予め格納されている文書から文書構造を抽出して文脈構造情報を生成し、文脈構造情報に対して目次を生成するための加工定義情報を用いて加工を施し、目次の出力形式を表す目次用のテンプレートを用いて加工された前記文脈構造情報から生成することができる。また文書内容情報は、文書あるいは該文書から指示されている部分を解析して内容情報を生成し、内容情報に対して加工定義情報を用いて加工を施し、文書の出力形式を表す文書用のテンプレートを用いて加工された内容情報から生成することができる。このように目次あるいは文書内容情報は、加工の方法は加工定義情報に、また出力形式をテンプレートに分離して記述して生成するので、例えば出力形式の変更時にはテンプレートのみを変更すればよい。
【0016】
テンプレートは、制御変数を定めるような手続き的な記述は不要で、章や節の番号、見出しの文字などを挿入する場所に変数記号を宣言的に記述して指定すればよい。さらに、それを必要な個数分繰り返すための繰り返し範囲の指定や、1つ前や1つ後などの異なる位置の文字列の挿入、文脈構造情報あるいは内容情報の階層と無関係な大域変数による固定した文字列の挿入や階層の無視、特定の階層以下の利用、処理手順の切り替え、選択的な文脈構造情報あるいは内容情報の利用などを指定することもできる。一般に、手続き的な記述に比べて宣言的な記述は容易であり、従来のXSL等のような手続き的プログラミングの知識や経験などは必要ない。
【0017】
また、加工定義情報は、文脈構造情報あるいは内容情報が文字列や演算可能な数値情報を有し、その文字列に他の文字列と連結したり、あるいは数値情報を使って演算を行うことによって加工結果を得るように定義しておくことができる。
【0018】
上述のような加工定義情報を利用した加工処理や、テンプレートを利用した目次あるいは文書内容情報の生成処理は、目次生成の場合及び文書内容情報の生成の場合に共通して利用することができ、システム構成も単純化することができる。なお、これらの加工定義情報やテンプレートは、例えば目次あるいは文書内容情報に埋め込むリンクに、テンプレートを指定するための情報、加工定義情報を指定するための情報のいずれかあるいは両方を含めておくことによって、使用するテンプレート、加工定義情報を簡単に変更できるように構成することができる。
【0019】
また、文書はタグを用いたマークアップ言語により作成されている場合、文書内容情報を生成する際に、タグ変換情報に従って出力する文書の形式へのタグの変換処理を行い、変換処理されたタグの情報を文書テンプレートとして利用して出力文書を生成するように構成することができる。この場合、出力する文書内容情報が元の文書とは異なるマークアップ言語であっても、タグ変換情報によって変換処理を行うことができる。なお、このタグ変換情報についても、目次あるいは文書内容情報に埋め込むリンクに、タグ変換情報を指定するための情報を含めておいて、使用するタグ変換情報を選択できるように構成することもできる。
【0020】
さらに、上述のような文書処理はコンピュータに実行させることができ、そのための文書処理プログラムを提供することができる。
【0021】
【発明の実施の形態】
図1は、本発明の実施の一形態を示すブロック図である。図中、1は文書格納部、2は目次生成部、3は文書内容情報生成部、4は操作部、5は表示部である。文書格納部1は、文書を格納している。文書としてはどのようなものでもよいが、ここでは章や節など、ある程度の文書構造を有しているものとする。また、1人が作成する比較的小規模な文書に限らず、部分毎に複数人で作成するような大規模な文書であってもよい。
【0022】
目次生成部2は、操作部4からの指示に従って、文書格納部1に格納されている文書から目次を生成して表示部5に対して出力する。生成する目次には、通常、章や節などの目次項目が配列されることになるが、その目次項目に対応する文書内容情報の出力を指示するためのリンクを埋め込んで出力する。すなわち、リンクが指示されることによって、必要に応じて文書内容情報生成部3が動作して文書内容情報を生成して出力し、あるいは既に文書内容情報が生成済であればその文書内容情報を出力するようなリンクを埋め込んでおく。このリンクによって、目次項目から対応する文書の内容を参照できるようにしている。さらに、そのような文書内容情報を出力するためのリンクとともに、下位あるいは上位の目次項目の表示を指示するためのリンクを埋め込んで目次を生成してもよい。これによって、例えば概略の目次と詳細な目次とを適宜切替ながら参照することが可能となる。
【0023】
また目次生成部2は、目次項目に対応する文書の内容が変更されているとき、目次中の当該文書内容情報に対応する目次項目に、内容が変更されている旨を示す情報を付加して目次を生成し、表示部5に表示させることができる。これによって、目次を参照しただけで文書中のどの目次項目が更新されたのかをすぐに把握することができる。このとき、文書の内容が変更されている旨を示す情報は、例えば章や節毎など、所定の項目単位毎に付加することができる。また、この文書の内容が変更されている旨を示す情報を付加する項目単位を変更可能に構成することもできる。
【0024】
文書内容情報生成部3は、操作部4からの指示に従って、文書格納部1に格納されている文書全体あるいはその一部の内容を抽出して文書内容情報を生成し、表示部5に対して出力する。生成する文書内容情報には、目次の出力を指示するためのリンクを埋め込んでおく。すなわち、リンクが指示されることによって必要に応じて目次生成部2が動作して目次を生成して出力し、既に出力すべき目次が生成済であればその目次を出力するようなリンクを文書内容情報中に埋め込んでおく。このリンクによって、文書の内容を表示しているときに、その文書の内容に対応する目次を表示させることができる。また、他の文書の内容を表示させるためのリンクを埋め込んでおくこともでき、この場合にも目次項目の場合と同様に、リンクの指示によって必要に応じて他の文書の文書内容情報を生成して出力するように構成することができる。
【0025】
操作部4は、ユーザの操作を受け付けるものであり、例えば目次生成部2や文書内容情報生成部3において目次や文書内容情報に埋め込んでおいたリンクを指示することができる。また表示部5は、目次生成部2や文書内容情報生成部3で生成した目次や文書内容情報を表示することができる。操作部4や表示部5は任意であり、例えば操作部4の代わりにソフトウェアから指示が受け渡される構成でもよいし、表示部5の代わりに、目次や文書内容情報をソフトウェアに対して出力するように構成してもよい。
【0026】
このような構成において、例えば操作部4から目次の作成が指示されると、目次生成部2は、文書格納部1に格納されている指示された文書の目次を生成して表示部5に出力する。ユーザは、表示部5に表示された目次を参照し、文書の概要を把握することができる。
【0027】
出力された目次には、それぞれの目次項目に、文書内容情報を生成するためのリンクが埋め込まれている。ユーザは、目次項目から文書の内容を参照したい場合に、対応するリンクを指示することができる。操作部4において目次中のリンクが指示されると、文書内容情報生成部3が起動し、文書格納部1に格納されている当該文書の一部を取り出し、表示部5に表示するための文書内容情報を生成して表示部5に出力する。これによって、ユーザは目次から対応する文書の内容を参照することができる。
【0028】
出力された文書内容情報には、上述のように目次を生成するためのリンクが埋め込まれている。ユーザは、目次を参照したい場合には、文書内容情報の表示画面から埋め込まれているリンクを操作部4から指示することができる。これによって目次生成部2が起動し、文書格納部1に格納されている当該文書の目次を生成して表示部5に表示させる。もちろんこの目次にもリンクが埋め込まれているので、再び文書内容情報を生成して表示させることができる。
【0029】
このような目次生成部2における目次の生成や、文書内容情報生成部3による文書内容情報の生成は、例えば操作部4において文書内容情報や目次中のリンクを指示することによって行われる。例えば複数人が1つの文書を並行して作成編集している場合、リンクを指示した時点での文書内容情報や目次が生成され、表示されることになる。例えば目次項目が変更されていたり、さらには章立てなどが変更されていても、指示した時点での目次を生成して出力することができる。また文書内容情報についても、最新の内容を出力することができる。
【0030】
図2は、本発明の実施の一形態を実現する構成例を示すブロック図である。図中、11は制御部、12は文脈構造情報生成部、13は加工処理部、14は整形処理部、15は内容情報生成部、16はタグ変換処理部である。図2に示す構成例において、目次生成部2は制御部11,文脈構造情報生成部12,加工処理部13,整形処理部14により構成される。また、文書内容情報生成部3は制御部11,内容情報生成部15,タグ変換処理部16,加工処理部13,整形処理部14により構成される。すなわち、制御部11,加工処理部13,整形処理部14は、目次生成部2及び文書内容情報生成部3において共用される。このように多くの処理部を目次生成時と文書内容情報生成時とで共用することによって、構成を簡単化している。なお、図2に示す構成では、文書格納部1に格納されている文書は、タグを用いたマークアップ言語により作成されたものであるとする。
【0031】
制御部11は、例えば図1に示す操作部4などから指示を受け取り、その指示に従って、目次の生成あるいは文書内容情報の生成を判断して各処理を制御する。指示が目次生成の場合には、文脈構造情報生成部12に対して文脈構造生成指示を与え、一連の目次の生成処理を開始させる。また、指示が文書内容情報の生成の指示である場合には、内容情報生成部15に対して内容情報生成指示を与えるとともに、タグ変換処理部16に対してタグ変換指示を与え、一連の文書内容情報の生成処理を開始させる。また生成された目次あるいは文書内容情報を例えば図1に示す表示部5などに出力する。
【0032】
文脈構造情報生成部12は、制御部11の指示に従って、文書格納部1に格納されている文書を解析して、部、章、節、項、表、図などの章立てを表す文書構造や、見出し文字列や文書部品の識別情報などを抽出し、各部、章、節、項、表、図の構造化文書内の位置、見出し文字列、文脈に依存して定まる番号、各節、項、表、図を含む文書の内容へのリンク情報などを所定の順に整列した文脈構造情報を生成する。この文脈構造情報は、各部、章、節、項、表等を表すタグ名と、上述の文脈に依存して定まる番号によって、検索したり部分を抜き出したりすることができる。
【0033】
加工処理部13は、文脈構造情報生成部12で生成された文脈構造情報や、内容情報生成部15で生成された内容情報に対して、加工定義情報を用いて加工を施す。例えば、1番目の章の題に対して、「1章」と付すか、「(1)」として付すかなど、文字列の変換処理などを行うことができる。この加工処理部13で加工した文脈構造情報又は内容情報が整形処理部14に渡される。
【0034】
整形処理部14は、与えられたテンプレート文書を用いて、加工処理部13から渡される加工後の文脈構造情報または内容情報を整形して目次あるいは文書内容情報を生成し、制御部11を介して出力する。具体的には、テンプレート文書を解析し、システムで規定された変数形式で記述されている部分を検出し、記述された変数記号をキーとして文脈構造情報または内容情報から文字列を取り出し、テンプレート文書の変数形式部分を置き換える処理を行う。例えば目次を生成する際に用いるテンプレートでは、各部、章、節、項の見出しと、各部、章、節、項の番号と、節、項を表す文書の内容を生成するためのリンクなどを、所定の変数表現で記述しておく。そしてこれらの変数表現の部分に対して、文脈構造情報を埋め込むことによって目次を生成することができる。文書内容情報についても整形処理部14の動作は同様である。ただし、文書内容情報を生成する場合は、タグ変換処理部16によって変換された情報をテンプレート文書として利用する。
【0035】
テンプレートは出力時のレイアウトを定めたものであり、このテンプレートを変更することによって異なるレイアウトで目次や文書の内容を参照することができる。このとき、文脈構造情報や内容情報に対する加工は加工処理部13において行っているので、ここではレイアウトのみについて設定することが可能である。また、タグ変換処理部16によって変換処理したタグの情報をテンプレートとして利用する場合は、元となる文書の構造を利用した文書内容情報を生成することができる。
【0036】
内容情報生成部15は、制御部11からの指示に従い、文書格納部1に格納されている指示された文書、あるいはその文書から指示されている部分を取り出して解析し、内容情報を生成する。内容情報としては、例えば後述するタグ変換処理部16から出力されるタグ変換情報中の変数形式を置き換えるための情報を抽出する。なお、上述のように内容情報生成部15で生成した内容情報は、加工処理部13によって加工定義情報に従って加工された後、整形処理部14に渡される。
【0037】
タグ変換処理部16は、制御部11からの指示に従い、文書格納部1に格納されている指示された文書、あるいはその文書から指示されている部分を取り出して解析し、タグの変換指示が記載されたタグ変換情報を用いて、出力する文書内容情報の形式へのタグの変換処理を行う。タグ変換情報において、変換後のタグの記述の中には、加工後の文脈構造情報や内容情報を埋め込むために、可変部分を含めておくことができる。この可変部分は、システムで規定された変数形式で記述しておけば、整形処理部14において変数形式の部分についての文書の内容による置換が行われる。
【0038】
次に、本発明の実施の一形態を実現する構成例における動作の一例について、具体例を用いながら説明してゆく。なお、以下の具体例においては、文書格納部1に格納されている文書は、マークアップ言語の一つであるXMLによって記述されているものとする。また、表示部15に出力する際には、HTMLによって記述された目次あるいは文書内容情報を出力するものとする。
【0039】
図3は、目次生成時に動作する構成の説明図である。図3には、図2に示す構成のうち目次の生成時に動作する構成要素のみを示している。以下、図3を用いながら目次生成時の動作について説明してゆく。例えば図1に示した操作部4などから目次の生成が指示され、あるいは、文書内容情報を表示時に、文書内容情報に埋め込まれているリンクが指示されると、その指示が制御部11に伝えられ、制御部11は文脈構造情報生成部12に対して文脈構造生成指示を行って、目次生成処理を開始させる。
【0040】
文脈構造情報生成部12では、上述のように文書格納部1に格納されている文書を解析して文脈構造情報を生成する。図4は、文書格納部1に格納されている文書の一例の説明図、図5は、文脈構造情報の一例の説明図である。ここでは、図4に一部を示したような、XMLによって記述された文書が文書格納部1に格納されているものとする。文脈構造情報生成部12では、このような文書を解析して、図5に示すような文脈構造情報を生成する。図5に示した文脈構造情報では、抽出した部、章、節、項、表、図などの章立てを表す文書構造をタグから抽出し、そのタグの名前をタグ欄に、また見出し文字列をタイトル欄に、その見出し文字列の別名文字列を別タイトル欄に、さらに見出し文字列及びその別名文字列の読み仮名をそれぞれ読み及び別名読み欄に、それぞれ格納している。また、各部、章、節、項、表、図の構造化文書内の位置を示す情報をアドレス欄及びインデックス欄に格納し、さらに、見出し文字列や文脈に依存して定まる番号をID欄に格納している。文脈構造情報生成部12では、図5に示すような文脈構造情報を抽出し、次の加工処理部13に渡す。
【0041】
加工処理部13では、加工定義情報に従って文脈構造情報に対して加工を施す。図6は、加工定義情報の一例の説明図、図7は、加工処理部による加工後の文脈構造情報の具体例の説明図である。図6に示す加工定義情報の一例では、文脈構造情報中のタグ欄の情報に従って、名前及びURIによるリンクを生成する加工を行う例を示している。
【0042】
生成するリンクとしては、例えば具体的にはIDなどを明示することによって性的なファイルの指示を行うように構成することもできるが、リンクによって直接、アプリケーションを起動する方法もある。その方法の一例として、例えばcgiやJava(登録商標) Servletの仕組みを利用してURL文字列を生成しておく方法がある。例えば図6中のURI欄及び目次URI欄に記載されているように、サーバ情報、メソッド名の情報、必要に応じて引数情報などを含めてURL文字列を生成し、埋め込んでおけばよい。
【0043】
例えば4行目の例では、タグ欄が“ARTICLE”であるとき、名前としてタイトル欄の情報の前に“○”を付した名前を生成する。またURIとして、サーバ名と、メソッド名、“?arg0=”、引数0、“&arg1=”、ID欄の左側7文字と“#”とID欄の右側3文字を順に連結した文字列を生成する。ここで、サーバ名、メソッド名、引数0には、図6(B)に示す加工定義表の文字列を、タグ欄の内容によらず共通して使用する。これに対して、IDとして使用する文字列は、文脈構造情報中の同一の行のID欄の内容を使用する。
【0044】
具体例として、図5に示した文脈構造情報の4行目(タグ=“ARTICLE”)の例では、図6に示す4行目の加工定義情報によって加工され、図7の4行目に示すように名前が“○中央営業所”、URIが“http://server:port/naiyou_method?arg0=aaa&arg1=0201001#001”という加工後の文脈構造情報が得られる。このURIはメソッド名“naiyou_method”を用いているので、この目次項目に対応する文書内容の出力を指示するものである。
【0045】
同様に例えば1行目の例では、タグ欄が“PART”であるとき、名前としてタイトル欄の情報に“地方”を付した名前を生成し、また、URIとしてサーバ名と、目次メソッド名、“?arg0=”、引数0、“&arg1=”、ID欄の左側7文字を順に連結した文字列を生成する。例えば図5に示した文脈構造情報の1行目(タグ=“PART”)の例がこの図6に示す1行目の加工定義情報によって加工され、図7の1行目に示すように名前が“東北地方”、URIが“http://server:port/mokuji_method?arg0=aaa&arg1=0200000”という加工後の文脈構造情報が得られる。このURIはメソッド名“mokuji_method”を用いており、このような場合には目次項目の上位または下位の目次項目の出力を指示するものである。他の文脈構造情報についても同様にして図6に示すような加工定義情報によって加工され、図7に示すような加工後の文脈構造情報が得られる。この加工後の文脈構造情報が整形処理部14に渡される。
【0046】
なお、アプリケーションが動作するサーバ情報やメソッド名の情報などは、図6に示すようにあらかじめ加工定義情報中に記述しておいてもよいし、加工処理部13が加工定義情報を読み込んだ時点で決定されるようにしてもよい。また、図6に示す例においても、文書中のどの部分を文書内容情報として生成するかは、ID情報から特定できることとし、URL中にアプリケーション(文書内容情報生成部3)へ渡すパラメータとして含めている。さらに、引数情報にはテンプレートや加工定義表を指定するための情報を設定することもできる。例えば図6において引数0に“aaa”と記述している部分をファイル名やファイルのURI文字列にしてもよい。
【0047】
また図6には、URI欄とは別に目次URI欄が設けられており、この欄を利用することによって文書内容情報を出力するためのURIとともに、上位または下位の目次を生成するためのURIを付加することができる。記述方法は上述のURI欄と同様である。ただし、ここではID情報として上位または下位のものを使用する必要がある。図6(A)の3行目の、”ID(CHAPTER)”は文脈構造情報中のタグ欄が“CHAPTER”である行(自身の上位のもの)のID欄の内容を使用することを表している。それ以外の部分はURI欄の場合と同様であり、URL中に目次メソッドを指定するとともにID情報を含めた文脈構造情報に加工することができる。この加工された文脈構造情報中のID情報を、同じく加工された文脈構造情報中の目次メソッドで指定されたアプリケーション(目次生成部2)へ渡して目次を生成させることができる。
【0048】
さらに、リンクには、整形処理部14で用いるテンプレート文書、加工処理部13で用いる加工定義情報、タグ変換処理部16で用いるタグ変換情報を選択するための情報を含ませておくことができる。例えば特開平8−292910号公報に記載されている技術を利用すれば、上述の各情報を選択するためのパラメータの指定に、HTTPリクエストのURLを利用することができる。
【0049】
整形処理部14では、ここでは目次を生成するので目次用のテンプレート文書を解析し、変数形式で記述されている部分を検出し、記述された変数記号をキーとして文脈構造情報から文字列を取り出し、テンプレート文書の変数形式部分を置き換える処理を行う。図8は、目次用のテンプレートの一例の説明図、図9は、生成された目次の一例の説明図、図10は、生成された目次の表示画面の一例の説明図である。テンプレート文書は、この例ではHTMLによって記述されており、繰り返しを示す部分を“{{”(繰り返し開始記号)及び“}}”(繰り返し終了記号)で囲み、また変数記号を‘$’で囲んで示している。整形処理部14では、テンプレート文書からこれらの変数記号や繰り返し開始記号及び繰り返し終了記号を抽出する。そして、抽出した変数記号に代えて置き換えるべき文字列を、加工処理部13で加工された文脈構造情報の中から選択し、その文脈構造情報に含まれている置き換え対象の文字列の個数に従って繰り返し回数を決定し、繰り返し開始記号から繰り返し終了記号までの間に含まれている文字列を、変数記号以外はそのままとし、変数記号は加工処理部13で加工された文脈構造情報中の文字列への置き換えを行って、決定した回数だけ出力する。
【0050】
図8に示す例では、二重の繰り返し構造を指定しており、項の目次項目の出力を繰り返す部分と、これを含み、節の目次項目を出力する繰り返し項目が存在している。また、これらの繰り返し部分には変数記号として“$SECTION.name$”、“$ARTICLE.uri$”、“$ARTICLE.name$”が存在しており、これらの部分に、それぞれ節の名称、項のURI、項の名称を割り当ててゆく。またこのほかに変数記号として“$SECTION.mokuji_uri$”が存在しており、この部分に節の目次URIが割り当てられる。これによって、図9に示すような目次が生成される。そして、このような目次の文書を例えば図1に示した表示部5で表示することによって、図10に示すような表示画面が得られることになる。
【0051】
図10に示す表示画面において、「○中央営業所」と「○南支店」のリンクについては、指示することによって文書内容を参照することができる。また、「上位の目次」のリンクについては、指示することによって上位の目次を参照することができる。
【0052】
以上のようにして、文書格納部1に格納されているXML形式の文書からHTML形式の目次を生成して出力することができる。このとき、例えば図8に示したような目次用のテンプレート文書では、文脈構造情報の配置(順序など)を示しているのみである。例えば出力時の表示形式を変更したければ、このテンプレート文書を変更するのみで対応可能である。
【0053】
なお、図8に示したテンプレートの一例においては、繰り返し開始記号から繰り返し終了記号までのそれぞれの繰り返し部分の階層に1つしか変数記号が存在しないため、繰り返し回数は一意に定まる。しかし、繰り返し開始記号と繰り返し終了記号の間に異なる階層に属する複数種類の変数記号が存在する場合もある。図11は、目次用のテンプレートの別の例の説明図である。テンプレート文書は図8に示した例と同様にHTMLによって記述されている。この図11に示す例では、1組の繰り返し開始記号と繰り返し終了記号によって囲まれた繰り返し部分に、変数記号“$CHAPTER.name$”と“$SECTION.name$”の2つの種類の変数記号が含まれている。このような場合は、複数種類の変数記号の中で最も下位の層に属する変数記号に従って繰り返しの回数を決定する。図11に示した例においては、変数記号“$CHAPTER.name$”と“$SECTION.name$”の階層を、図5に示した文脈構造情報を用いて比較すると、タグ=“SECTION”の方が下位の層に属することがわかる。そのため、繰り返し回数は“$SECTION.name$”によって決定することになる。なお、下から2行目に“$PART[FIRST].uri$”とあるが、これは部(PART)のうち最初の部のURIを指示するものである。詳細は後述する。
【0054】
また、例えば文書格納部1に格納されている文書の更新履歴が管理されている場合や、文書の部分ごとに別のファイルとして更新日時が管理されているなど、文書の更新に関する情報が取得できる場合、これらの情報を利用して、目次に当該目次の項目に対応する文書の内容が変更されているときにその旨を示す情報を目次に付加するように構成することもできる。
【0055】
図12は、文書の更新に関する情報を含む文脈構造情報の一例の説明図、図13は、文書の更新に関する情報を利用した加工定義情報の一例の説明図、図14は、文書の内容が変更されている旨を付加した目次の表示画面の一例の説明図である。図12に示す例では、文脈構造情報生成部12において、文書格納部1に格納されている文書を解析するとともに、当該文書の最終更新日及び前回発行日を取得し、文脈構造情報中に含めた例を示している。また、このような文脈構造情報を加工処理部13で利用するための加工定義情報を定義しておく。例えば図13に示す例では、4行目の例においてタグ欄が“ARTICLE”であるとき、名前として“○”及びタイトル名とともに、最終更新日から前回発行日を引いた値が正、すなわち前回発行日後に更新されていた場合には“(New!)”を付加することが定義されている。なお、最終更新日と前回発行日が等しかったり、最終更新日の方が前回発行日よりも古い場合には“(New!)”は付加されない。ここで、条件IFは3つのパラメータを含んでおり、最初のパラメータが条件、2番目のパラメータは条件が正(真)の場合、3番目のパラメータは条件が0または負(偽)の場合を表している。この条件IFによって、最終更新日と前回発行日に応じて加工結果を異ならせている。また、関数DATEVALUE()は、日付を値に変換する関数であり、演算を行うために利用している。
【0056】
図12に示す文脈構造情報に対して図13に示す加工定義情報を用いて加工を行い、生成された目次を表示したときの表示画面の一例を図14に示している。図12より、タグ欄が“ARTICLE”のタイトルは「中央営業所」と「南支店」である。ここで、「中央営業所」については前回発行日が最終更新日よりも後であり、「南支店」は最終更新部の方が前回発行日より後である。従って、図14に示す例ではタイトル「南支店」の脇に“New!”と表示されることになる。
【0057】
ここでは“New!”の表示のみであるが、例えば内容が変更されている旨とともに更新日を表示したり、あるいは、更新日が所定期間内の場合にのみ、内容が変更されている旨を表示するようにしてもよい。また、図12に示す例では日単位であるが、例えば時刻情報も含めて判定を行ってもよい。さらに、文書の内容が変更された旨の情報は、図14に示す例のように項目に付加するほか、それより上位の節や章などに付加することも可能であり、付加する項目単位を変更可能に構成してもよい。
【0058】
上述の目次の生成過程において、見出し文字列や文脈に依存して定まるIDを利用したURIを生成し、目次の項目に付している。図10に示す例においても下線を付して示している目次項目にURI(リンク)が付加されていることを示している。このURIを指示することによって、図1に示した文書内容生成部3が動作し、指示された項目に対応する文書内容の表示が行われる。
【0059】
なお、図10などにおいては下位の目次を生成して上位の目次へのURIを付加した例を示した。もちろん目次として上位の階層、例えば章や節の目次を生成し、その目次項目に、下位の目次を生成する処理を行わせるためのURIを付加しておいて、上位の階層の目次から章や節を選択して下位の階層の目次を表示させることができる。図15は、下位の階層へのリンクを付加した目次の表示例の説明図である。図15(A)には章までの目次を生成して表示させた例を示している。この場合、各章に付加されているURIは、その章の下位の階層の目次を生成させるためのものであり、例えば▲1▼に示すリンクを指示することによって図1に示す目次生成部2が再び動作し、例えば図15(B)に示すような節以下の階層の目次を生成して出力することができる。このとき、▲1▼のリンクには「1章」のIDを付加しておくことによって、このIDを利用して目次生成部2では「1章」の下位の階層の目次を生成することができる。もちろん、図15(B)に示すように下位の階層の目次に「上位へ」として示すような上位の階層の目次の生成を指示するリンクを付加しておくことができ、上位の階層の目次と下位の階層の目次を交互に表示させることが可能なように構成することもできる。またこの例の場合にも、最下位層のリンクを指示することによって、上述のように文書内容生成部3を動作させて文書内容情報を生成させることができる。
【0060】
次に、文書内容情報を生成する際の動作について説明する。図16は、文書内容情報生成時に動作する構成の説明図である。図16には、図2に示す構成のうち文書内容情報の生成時に動作する構成要素のみを示している。以下、図16を用いながら文書内容情報生成時の動作について説明してゆく。例えば図1に示した操作部4などから文書内容情報の生成が指示され、あるいは、上述のように目次を表示時に、目次に埋め込まれているリンクが指示されて文書内容情報の生成が指示されると、その指示が制御部11に伝えられ、制御部11は内容情報生成部15に対して内容情報生成指示を行うとともに、タグ変換処理部16に対してタグ変換指示を行って、文書内容情報の生成処理を開始させる。なお、目次に埋め込まれているリンクが指示された場合、上述の具体例ではリンクにIDが含まれているので、このIDを利用して文書内容情報を生成する際の文書部分を特定することが可能である。
【0061】
タグ変換処理部16では、文書格納部1に格納されている文書全体、あるいはその文書の一部を取り出して、タグ変換情報に従ってタグの変換処理を行う。例えば目次に埋め込まれた文書内容情報を生成するためのリンクが指示された場合には、当該リンクが付加されていた目次項目のIDがリンクに付与されているので、その項目の文書の内容を取り出すことになる。
【0062】
図17は、タグ変換情報の一例の説明図、図18は、タグの変換処理後の情報の一例の説明図である。ここでは上述の図4に示したXML形式の文書が文書格納部1に格納されているものとする。また、図17に示すようなタグ変換情報が与えられているものとする。図17に示すタグ変換情報では、指定された節以下の構造を取り出して文書内容情報を生成する場合のタグ変換情報を示している。変換前欄には、元となるXML形式の文書中のタグを示しており、そのタグが検出されたときの変換後のHTML形式のタグを変換後欄に示している。例えば最初の行では、“SECTION”、“TITLE”、“PARA”の順でタグが連続したとき、その右の変換後欄に示したような文字列に変換することを示している。また、終了タグについても、変換前欄に示されている終了タグを変換後欄に示されている終了タグに変換することを示している。このようなタグ変換情報を用いて、例えば図4に示した文書のタグを変換処理することによって、図18に示すようなタグ変換処理後の情報が得られる。
【0063】
なお、タグ変換情報において変換後の文字列の中には、例えば図17において‘$’で囲んで示したように変数形式の可変部分を含ませておくことができる。この変数形式の部分は、整形処理部14によって加工処理後の内容情報によって置換処理されることになる。
【0064】
また、図18の先頭にある“#PLAIN”は、後述する整形処理部14で文書内容情報を生成する際に、文脈構造情報あるいは内容情報の有している階層構造に関する情報を無効にすることを指示する指示記号である。例えば図18に示した例では変数形式の部分(“$ARTICLE.uri$”や“$ARTICLE.name$”など)が繰り返されているが、指示記号“#PLAIN”の指定がない場合には同じ階層のこれらの変数形式の部分には同じ文字列が割り当てられる。一方、指示記号“#PLAIN”の指定を行った場合には、同じ階層であっても別の文字列を割り当てるように制御することを表している。具体例については後述する整形処理部14の動作の説明において述べる。
【0065】
一方、内容情報生成部15では、タグ変換処理部16と同様に文書格納部1に格納されている文書全体、あるいはその文書の一部を取り出して解析し、タグ変換処理部16で変数形式で記述されている部分に対応する内容情報を抽出する。図19は、内容情報の一例の説明図、図20は、内容情報のための加工定義情報の一例の説明図、図21は、加工後の内容情報の一例の説明図である。図19に示した内容情報は、図5に示した文脈構造情報とほぼ同様であるが、この例ではURL欄を設けている。このような内容情報は、加工処理部13に渡され、例えば上述の図20に示すような加工定義情報を用いて内容情報を加工することによって、図21に示すような加工後の内容情報が得られる。なお、図20に示す加工定義情報の記述方法は図6に示した文脈構造情報のための加工定義情報と同様である。
【0066】
整形処理部14では、タグ変換処理部16によって変換されたタグの情報を文書内容情報用のテンプレート文書とし、これを解析して変数形式で記述されている部分を検出する。そして、テンプレート文書の変数記号の部分を加工処理部13から渡される加工後の内容情報によって置き換える処理を行う。図22は、生成された文書内容情報の一例の説明図、図23は、生成された文書内容情報の表示画面の一例の説明図である。図18に示した変換処理後のタグの情報中の変数形式で記述された部分が加工後の内容情報によって置きかえられ、図22に示すような文書内容情報が得られる。
【0067】
このとき、図18に示した変換処理後のタグの情報の先頭には指示記号“#PLAIN”が指定されている。この指定によって、図21に示した加工後の内容情報を変数記号と置き換えてゆく際に、階層関係を無視して、変数記号に適合する内容情報で順に置き換えてゆく。例えば図18に示した変換処理後のタグの情報中には変数記号“$ARTICLE.name$”が複数存在する。図21に示した加工後の内容情報から、最初の変数記号“$ARTICLE.name$”は“○中央営業所”に置き換えられ、次の変数記号“$ARTICLE.name$”は“○南支店”に置き換えられる。例えば指示記号“#PLAIN”が指定されていない場合には、同じ階層にあるいずれの変数記号“$ARTICLE.name$”も“○中央営業所”に置き換えられる。なお、整形処理部14が文書内容情報を生成する際に、“#PLAIN”の文字列自体は削除される。
【0068】
図22に示した文書内容情報を例えば図1に示した表示部5で表示することによって、図23に示すような表示画面が得られることになる。この図23に示した表示画面の上部において「目次表示」の部分に下線が付されている。この部分に目次生成を指示するリンクが付加されており、ユーザはこのリンクを指示することによって図1に示す目次生成部2を起動して目次を生成させることができる。また、文書の内容としてURLが指定されている部分についても、その文書に記述されているURLが付加されており、当該URLによりページを参照することが可能である。図23に示す例では「中央営業所の紹介ページ」を参照することができる。
【0069】
さらに、文書の内容中に他の部分を参照する記述が存在する場合、その部分へのリンクを付加しておくことができる。図24は、他の文書部分へのリンクを付加した場合の模式図である。図24(A)に示す例では、1節の内容中に5節が参照されている。このような場合、参照されている節へのリンクを付加しておくことができる。このリンク(▲2▼)を指示することによって、再び文書内容情報生成部3が起動して、指示された節の内容を含む文書内容情報を生成し、出力する。これによって図24(C)に示すように、この例では5節の内容を参照することができる。もちろん、図24(A)における目次生成のためのリンク(▲1▼)を指示することによって、図24(B)に示すように、目次を生成して表示させることができる。
【0070】
なお、上述の例では文書中の節以下の内容により文書内容情報を生成する例を示した。しかしこれに限らず、任意の文書構造の階層から文書内容情報を生成することが可能であり、どの階層から文書内容情報を生成するかを指示可能に構成してもよい。もちろん、目次が表示された状態で章が指示されれば章以下、節が指示されれば節以下の文書の内容を文書内容情報として生成するように構成することもできる。
【0071】
また、上述の例ではタグ変換処理部16において変換したタグの情報をテンプレート文書として利用して文書内容情報を生成する例を示した。しかしこれに限らず、タグ変換処理部16を用いず、あるいはタグ変換処理部16を設けずに、テンプレート文書を別途用意して整形処理部14で用いるようにしてもよい。
【0072】
以上説明したように、図2に示した構成によって目次の生成及び文書内容情報の生成を行うことができるが、目次の生成時の処理と同様にして索引を生成することも可能である。図25は、索引生成時のテンプレート文書の一例の説明図、図26は、生成された索引の一例の説明図である。索引を生成する場合、加工定義情報として文脈構造情報から読み仮名情報を残すようにしておき、読み仮名を含んだ加工後の文脈構造情報を取得しておく。また、整形処理部14に与えるテンプレート文書として、例えば図25に示すようなテンプレート文書を与える。整形処理部14では、図25に示すテンプレート文書を解析し、変数部分を加工後の文脈構造情報により置換してゆく。この時、条件として読み仮名情報の先頭文字によって分類している。このようなテンプレート文書によって、例えば図4に示した文書から図26に示すような索引が生成される。この索引においても、各項目には当該項目の文書内容情報を生成するためのリンクが付加されており、リンクを指示することによって文書の内容を参照することが可能である。
【0073】
また、上述の目次や文書内容情報の生成例では、文書全体を対象として処理を行っている。しかし、一部分のみが必要な場合もある。そのような場合の例を示す。図27は、文脈構造情報の別の例の説明図、図28は、部分的な目次を生成するための目次テンプレートの一例の説明図、図29は、生成された部分的な目次の一例の説明図、図30は、図28で部分的な目次の生成を指示しなかった場合に生成された目次の一例の説明図である。部分的な目次を生成する際には、文脈構造情報生成部12で文書から文脈構造情報を生成する際に、文書中のどの部分について文書内容情報を生成するかを指定するための指示記号を含めておく。図28に示す例では、先頭に指示記号“#CHAPTER[1]”が存在する。この指示記号“#CHAPTER[1]”は、タグ“CHAPTER”の2番目の章の目次を生成することを指定するものである。すなわち、図27に示す文脈構造情報の例では、タグ“CHAPTER”のうち、タイトルが“岩手県”の章(すなわち“岩手県”のノード以下に展開される構造)が目次の対象となる。なお、‘[’と‘]’の間の数字は0を最初として、0が1番目を示し、以下順に1が2番目を、2が3番目といったように示している。
【0074】
図27に示した文脈構造情報に対して、ここでは図6に示した加工定義表を用いて加工処理部13で加工し、得られた加工後の文脈構造情報に対して図28に示す目次テンプレートを適用して整形処理部14で目次を生成する。このとき、上述のように図28に示す目次テンプレート中の指示記号“#CHAPTER[1]”に従って、加工後の文脈構造情報中のタイトル“岩手県”以下に展開される構造が利用され、図29に示すような目次が生成される。
【0075】
もし、図28に示した目次テンプレートに指示記号“#CHAPTER[1]”が記述されていなかった場合には、図27に示した文脈構造情報全体が目次生成の対象となり、図30に示すようにタイトル“青森県”の章についても目次に含まれることになる。
【0076】
なお、上述の例では章単位で部分的に目次を生成する例を示したが、もちろんこれに限らず、“#PART”や“#SECTION”など、任意の単位で部分的な構造を指示することが可能である。
【0077】
また、ここでは部分的な目次を作成する例を示したが、これに限らず、文書内容情報を生成する際にも適用することができる。すなわち、タグ変換処理部16で変換後のタグの情報を生成する際に、部分的な文書内容情報の指示を行う指示記号を含めておけばよい。
【0078】
上述の指示記号中でも‘[’と‘]’の間に位置(何番目か)を指示しているように、同様の記述によって位置指定を行うことによって、変数記号に対して適用する文脈構造情報や内容情報を指定することができる。図31は、位置を指定した変数記号を用いた目次テンプレートの一例の説明図、図32は、位置指定によって生成された目次の一例の説明図である。図31に示した目次テンプレート中、▲1▼で示した行には変数記号“$CHAPTER[1].name$”が存在する。この変数記号は、2番目の章の名前によって置き換えることを明示的に指定するものである。なお、この場合も“[0]”が1番目を示している。
【0079】
また、図31中の▲2▼で示した行には“$PART[FIRST].uri$”が存在する。この変数記号は、最初の部(PART)のURIによって置き換えることを明示的に指定するものである。もちろん、“FIRST”を“0”としても同様である。
【0080】
例えば図27に示した文脈構造情報に対して図6に示した加工定義情報を用いて加工処理部13で加工し、得られた加工後の文脈構造情報に対して図31に示す目次テンプレートを適用して整形処理部14で目次を生成すると図32に示すような目次が生成される。
【0081】
ここで、図31に示した目次テンプレートの▲1▼で示した行において2番目の章が指定されているので、“第2章 岩手県”及びその下位に展開される項目についてのみの目次が生成されている。このような位置の指定がなければ、図30に示した用に“第1章 青森県”から目次が生成されることになるし、第3章以降が存在すれば、それらの目次も生成されることになる。
【0082】
また、図31に示した目次テンプレートの▲2▼で示した行においては、最初の部のURIが指定されているので、図6に示した加工定義情報に従って生成されるタイトル“東北”(加工後の名前は“東北地方”)のURI“http://server:port/mokuji_method?arg0=aaa&arg1=0200000”に置き換えられる。図32に示した例では2番目の章についての目次を生成しているが、この指定によって、最初の部の目次に戻るリンクを生成することができる。
【0083】
この例では‘[’と‘]’の間に0以上の数値あるいは“FIRST”を指定した例を示した。しかしこれに限らず、例えば‘+’あるいは‘−’とともに数値を指定して現在位置からの相対的な位置の指示を行うことができる。また、“FIRST”に対応して“LAST”により最後を指定したり、“NEXT”や“PREVIOUS”により1つ後あるいは1つ前を指定することもできる。もちろん、このほかの位置指定を可能としてもよい。
【0084】
また、ここでは目次を作成する場合の例を示したが、これに限らず、文書内容情報を生成する際にも適用することができる。すなわち、タグ変換処理部16で変換後のタグの情報を生成する際に、位置指定を含む変数記号を埋め込んでおけばよい。
【0085】
上述の各例では文字列の編集しか行っていないが、数値情報が含まれている場合には、数値情報に対する演算を指示することも可能である。ここでは目次の生成時の処理と同様にして、演算結果を含む文書を生成する例を示す。また、上述の変数記号の説明では、変数記号は文書の階層構造に依存しているが、階層構造とは無関係に文書全体に渡って共通して利用したい情報もある。このように階層構造とは無関係に利用可能な大域変数記号を利用した例について併せて説明する。
【0086】
図33は、数値演算を含む加工定義情報の一例の説明図、図34は、大域変数記号の内容を含む文脈構造情報の一例の説明図、図35は、数値演算を含む加工後の文脈構造情報の一例の説明図、図36は、大域変数記号を含む目次テンプレートの一例の説明図、図37は、数値演算及び大域変数記号を用いて生成された目次の一例の説明図である。例えば図6に示した加工定義情報では、文字列の連結のために‘&’を用いているが、演算を指示する場合には、この‘&’の代わりに数値演算のためのオペレータを使用すればよい。例えば図33の1行目に示したタグ“PLANT”の例では、不良率の欄に“=不良個数/生産個数*100”と記述している。‘/’は除算を、また‘*’は乗算をそれぞれ示すオペレータであり、生産個数に対する不良個数の比率を計算している。もちろんオペレータとしてはこれ以外にも、‘+’や‘−’、その他、様々な数値演算で用いられるオペレータ、さらには様々な演算のための関数やIFなどの制御関数(制御文)などを組み合わせて用いることが可能である。
【0087】
一方、文書から文脈構造情報生成部12で生成した文脈構造情報が図34の最下行を除くものであったとする。最下行のアドレス“GLOBAL”は大域変数記号の内容であることを示している。大域変数記号は文書の階層構造とは無関係に、文書を通じて利用可能な変数記号であり、その内容は予め設定されるものである。すなわち、図34に示す文脈構造情報のうち、最下行を除く部分は文書から文脈構造情報生成部12が生成し、最下行については、予め設定されているものである。もちろん、文書から抽出された内容でもよいが、予め、あるいは後から、大域変数記号の内容であることが指示あるいは判定される。この大域変数記号の内容は、後述するテンプレート文書中に記述されている大域変数記号によって参照される。
【0088】
このような図34に示した文脈構造情報は、加工処理部13において上述の図33に示した加工定義情報に従って加工される。この時、不良率の欄については数値演算が施される。図33に示す加工定義情報の例では、図34に示す文脈構造情報のうちの生産個数の欄と不良個数の欄の数値を用いて演算を行い、不良率の欄の数値としている。加工後の文脈構造情報を図35に示している。なお、大域変数記号の内容(タグ“MEAN”)についても、図33に示す加工定義情報中のタグ“MEAN”の情報に従って数値演算が行われている。
【0089】
このようにして加工された文脈構造情報に対して、整形処理部14で目次テンプレートに対応するテンプレートを適用し、出力文書を生成する。ここでは図36に示すようなテンプレートを用いるものとしている。テンプレートの構造自体は図8に示した目次用のテンプレートとほぼ同様であり、2重の繰り返しによって工場毎に製品の不良率を配置する構成を示している。このうち、▲1▼、▲2▼として示した行には大域変数記号“$MEAN.name$”が含まれている。この大域変数記号によって、加工後の文脈構造情報中の大域変数記号の内容が参照され、この場合は“全国平均”に置換される。▲2▼として示した行における“$MEAN.bad$”も同様であり、全国平均の不良率“0.9”(演算結果)に置換される。
【0090】
図36に示したようなテンプレートを用い、加工後の文脈構造情報を用いて整形処理部14で処理することによって、図37に示すような文書が得られる。この文書は、図34に示したように生産個数や不良個数などの数値の素データから演算された不良率の情報を含むものである。また、大域変数記号の内容として“全国平均”の文字列や全国での生産個数、不良個数が設定されており、これらの予め設定されている素データから演算された全国平均の不良率が示されている。
【0091】
この例では、大域変数記号の内容を示した部分は他の工場や製品との比較のために設けているものであるため、比較対象を変更する場合には大域変数記号の内容を変更するだけで、加工定義情報やテンプレート文書を変更する必要はない。例えば“関東地方”の生産個数及び不良個数を予め設定しておけば、関東地方の平均不良率が示され、それぞれの工場や製品の不良率と関東地方の不良率とを比較する文書が生成されることになる。
【0092】
ここに示した例は、もちろん一例であって、同様に数値演算を用いたり、あるいは大域変数記号を用いて、様々な文書を生成することが可能である。また、ここでは目次を作成する処理を利用して文書を生成する例を示したが、これに限らず、文書内容情報を生成する際の加工定義情報やタグ変換情報に数値演算の指示や大域変数記号を使用することも可能である。
【0093】
図38は、本発明の文書処理装置の機能または文書処理方法をコンピュータプログラムで実現した場合におけるコンピュータプログラム及びそのコンピュータプログラムを格納した記憶媒体の一例の説明図である。図中、101はプログラム、102はコンピュータ、111は光磁気ディスク、112は光ディスク、113は磁気ディスク、114はメモリ、121は光磁気ディスク装置、122は光ディスク装置、123は磁気ディスク装置である。
【0094】
上述の本発明の実施の形態で説明した機能は、コンピュータにより実行可能なプログラム101によっても実現することが可能である。その場合、そのプログラム101およびそのプログラムが用いるデータなどは、コンピュータが読み取り可能な記憶媒体に記憶することも可能である。記憶媒体とは、コンピュータのハードウェア資源に備えられている読取装置に対して、プログラムの記述内容に応じて、磁気、光、電気等のエネルギーの変化状態を引き起こして、それに対応する信号の形式で、読取装置にプログラムの記述内容を伝達できるものである。例えば、光磁気ディスク111,光ディスク112(CDやDVDなどを含む)、磁気ディスク113,メモリ114(ICカード、メモリカードなどを含む)等である。もちろんこれらの記憶媒体は、可搬型に限られるものではない。
【0095】
これらの記憶媒体にプログラム101を格納しておき、例えばコンピュータ102の光磁気ディスク装置121,光ディスク装置122,磁気ディスク装置123,あるいは図示しないメモリスロットにこれらの記憶媒体を装着することによって、コンピュータからプログラム101を読み出し、本発明の文書処理装置の機能または文書処理方法を実行することができる。あるいは、予め記憶媒体をコンピュータ102に装着しておき、例えばネットワークなどを介してプログラム101をコンピュータ102に転送し、記憶媒体にプログラム101を格納して実行させてもよい。なお、本発明の一部の機能についてハードウェアによって構成することもできるし、あるいは、すべてをハードウェアで構成してもよい。
【0096】
【発明の効果】
以上の説明から明らかなように、本発明によれば、目次から文書の内容を参照可能であり、また、文書の内容を参照している状態から目次を参照することができる。このとき、指示された時点で目次あるいは文書内容情報を生成するので、時々刻々と編集されてゆく文書であっても、常に最新の状態を参照することができる。これらを適宜切替ながら参照することによって、文書の参照が容易になり、また、文書の作成編集を支援することができる。
【0097】
また、目次あるいは文書内容情報を生成する際に、加工定義情報を使用した加工処理と、テンプレート文書を使用した整形処理とに分けて処理を行うので、見栄えの設定についてはテンプレート文書のみを編集すればよく、プログラミング経験のない人でも作成、変更、保守を行うことができる。また、変換対象の文書や、出力する目次や文書内容情報のデザインが変わっても、変更を加える個所がそれぞれ限定されるため、全体として、開発、カスタマイズが容易になり、保守性が向上するという効果がある。
【図面の簡単な説明】
【図1】本発明の実施の一形態を示すブロック図である。
【図2】本発明の実施の一形態を実現する構成例を示すブロック図である。
【図3】目次生成時に動作する構成の説明図である。
【図4】文書格納部1に格納されている文書の一例の説明図である。
【図5】文脈構造情報の一例の説明図である。
【図6】加工定義情報の一例の説明図である。
【図7】加工処理部による加工後の文脈構造情報の具体例の説明図である。
【図8】目次用のテンプレートの一例の説明図である。
【図9】生成された目次の一例の説明図である。
【図10】生成された目次の表示画面の一例の説明図である。
【図11】目次用のテンプレートの別の例の説明図である。
【図12】文書の更新に関する情報を含む文脈構造情報の一例の説明図である。
【図13】文書の更新に関する情報を利用した加工定義情報の一例の説明図である。
【図14】文書の内容が変更されている旨を付加した目次の表示画面の一例の説明図である。
【図15】下位の階層へのリンクを付加した目次の表示例の説明図である。
【図16】文書内容情報生成時に動作する構成の説明図である。
【図17】タグ変換情報の一例の説明図である。
【図18】タグの変換処理後の情報の一例の説明図である。
【図19】内容情報の一例の説明図である。
【図20】内容情報のための加工定義情報の一例の説明図である。
【図21】加工後の内容情報の一例の説明図である。
【図22】生成された文書内容情報の一例の説明図である。
【図23】生成された文書内容情報の表示画面の一例の説明図である。
【図24】他の文書部分へのリンクを付加した場合の模式図である。
【図25】索引生成時のテンプレート文書の一例の説明図である。
【図26】生成された索引の一例の説明図である。
【図27】文脈構造情報の別の例の説明図である。
【図28】部分的な目次を生成するための目次テンプレートの一例の説明図である。
【図29】生成された部分的な目次の一例の説明図である。
【図30】図28で部分的な目次の生成を指示しなかった場合に生成された目次の一例の説明図である。
【図31】位置を指定した変数記号を用いた目次テンプレートの一例の説明図である。
【図32】位置指定によって生成された目次の一例の説明図である。
【図33】数値演算を含む加工定義情報の一例の説明図である。
【図34】大域変数記号の内容を含む文脈構造情報の一例の説明図である。
【図35】数値演算を含む加工後の文脈構造情報の一例の説明図である。
【図36】大域変数記号を含む目次テンプレートの一例の説明図である。
【図37】数値演算及び大域変数記号を用いて生成された目次の一例の説明図である。
【図38】本発明の文書処理装置の機能または文書処理方法をコンピュータプログラムで実現した場合におけるコンピュータプログラム及びそのコンピュータプログラムを格納した記憶媒体の一例の説明図である。
【図39】XML文書の具体例の説明図である。
【図40】図39のXML文書から生成する目次の一例の説明図である。
【図41】図40に示した目次を得るためのXSLの記述一例の説明図である。
【図42】図39のXML文書から生成する目次の別の例の説明図である。
【図43】図42に示した目次を得るためのXSLの記述一例の説明図である。
【符号の説明】
1…文書格納部、2…目次生成部、3…文書内容情報生成部、4…操作部、5…表示部、11…制御部、12…文脈構造情報生成部、13…加工処理部、14…整形処理部、15…内容情報生成部、16…タグ変換処理部、101…プログラム、102…コンピュータ、111…光磁気ディスク、112…光ディスク、113…磁気ディスク、114…メモリ、121…光磁気ディスク装置、122…光ディスク装置、123…磁気ディスク装置。
【発明の属する技術分野】
本発明は、文書の作成や参照を支援する文書処理に関するものである。
【0002】
【従来の技術】
従来より、文書の作成を支援するための様々な試みがなされている。特に、文書の目次の作成は、形式的に行えることから従来より種々の技術が開発されている。例えば特許文献1の従来技術として、構造化文書のノード属性を手がかりにして目次を自動的に作成することができる旨が示唆されている。またこの文献には、部、章、節、項の構成と、それぞれ章見出し、節見出し、項見出しを有する構造化文書を、例えばHTML形式などで記述し、見出しなどの文字列を抽出するための指示タグを記述しておく。そして、構造化文書から抽出した文字列を挿入するための指示タグを記述したHTML形式のテンプレート文書を用意し、指示タグの内容に従って、HTML文書を生成する技術が記載されている。この技術を用いても、目次文書を生成することができる。
【0003】
しかし、このような従来の目次を作成する文書処理装置では、文書全体に対して一括処理を行う方法が一般的である。したがって文書の一部分や、章立てをわずかに変更した場合でも、その結果を確認するためには、文書全体を処理する必要がある。複数人で共同編集を行うような大規模文書の場合、その処理時間は膨大なものになるため、編集をしながら文書処理の結果を確認することが簡単に行えない、という問題があった。
【0004】
なお、テンプレートを利用した文書の変換自体は従来より行われている技術であり、例えば特許文献2などにも記載されている。しかし一般的に、テンプレートを利用した文書変換においては、文書に含まれる見出しの種類や個数に合わせてテンプレートを用意する必要があり、テンプレートを再利用できない場合が多い。
【0005】
また別の技術として、例えばXML形式で記述された文書をHTML形式の文書に変換する技術を利用することも考えられる。すなわち、部、章、節、項などの構成と、それぞれ章見出し、節見出し、項見出しなどを有する構造化文書をXML形式で記述しておき、これを、XSLスタイルプロセッサによって、節単位のHTML内容文書を生成する。別のXSLスタイルプロセッサによって、部、章、節、項の階層的要素と、部見出し、章見出し、節見出し、項見出しを関連づけることによって、HTML形式の目次文書を生成することができる。
【0006】
ここで用いているXSLスタイルプロセッサは、入力するXML文書を順に読み込んで、指定したパターンに従ってコンテンツを解析する。このとき、解析するためのパターンや、生成するHTML文書の構成要素は、スタイルファイルの中に記述しておく必要がある。すなわち、スタイルファイルは出力するHTMLのデザインと変換のための手続き的なプログラムロジックが同時に含まれており、内容が複雑になりがちである。
【0007】
図39は、XML文書の具体例の説明図、図40は、図39のXML文書から生成する目次の一例の説明図、図41は、図40に示した目次を得るためのXSLの記述一例の説明図、図42は、図39のXML文書から生成する目次の別の例の説明図、図43は、図42に示した目次を得るためのXSLの記述一例の説明図である。いま、図39に示すようなXML形式で記述された文書があるとする。この文書から図40に示すような目次を生成する場合を考える。この場合、XSLの記述は図41に示すようになる。すなわち、繰り返しの制御構造と制御変数を意識した手続き型のプログラム記述が含まれることになる。
【0008】
次に、同じ図39に示すXML文書から図42に示すような目次を生成する場合を考えると、XSLの記述は図43に示すようになる。このとき、図41に示したXSLの記述から図43に示したXSLの記述に変更するには、章番号の表示フォーマットを変更するだけではなく、部タイトルの表示を行わせるとともに、その部タイトルを章目次の間に挿入している。このため、XSLの記述中の繰り返しのための制御構造(for−each)を1重ループから2重ループに変更する必要がある。このような変更作業には、手続き的なプログラミングの知識が必要となる。
【0009】
また、XSLでの変換では、ページのデザインとそこに表示させる文字の生成ロジックが一緒に記述されているため、ファイルを修正できる人が限定される。場合によっては、1つのファイルを複数人で編集する必要がある。
【0010】
【特許文献1】
特開2001−209641号公報
【特許文献2】
特開2001−290812号公報
【0011】
【発明が解決しようとする課題】
本発明は、上述した事情に鑑みてなされたもので、文書の内容と目次とを相互に参照しながら文書の作成編集を行うことができ、また文書の作成編集状況に応じてその時点での目次や他の部分の文書の内容などを参照可能とし、さらにレイアウト等の見栄えの変更に容易に対応することができる文書処理装置及び文書処理方法と、その文書処理方法をコンピュータに実行させる文書処理プログラムを提供することを目的とするものである。
【0012】
【課題を解決するための手段】
本発明では、文書の目次を生成する際には、目次項目に対応する文書内容情報を生成するためのリンクを埋め込んでおく。そして、そのリンクを指示することによって、その目次項目を含む文書内容情報を生成し、出力する。その際に、目次の出力を指示するためのリンクを文書内容情報中に埋め込んでおく。文書内容情報中のリンクを指示することによって、その文書の内容に対応する目次項目を含む目次を生成し、出力する。この場合も、目次項目に対応する文書内容情報を生成するためのリンクを目次に埋め込んでおくことになる。
【0013】
このように、目次からリンクの指示によって目次に対応する文書内容情報だけを生成し、また文書内容情報からリンクの指示によって対応する目次だけ、あるいは、対応する文書内容だけを生成することができる。そのため、例えば1つの文書を複数人で編集しているような環境や、並行して文書の各部が更新されている場合でも、各部の文書の内容の確認や、目次による全体の確認などを自由に行うことが可能である。
【0014】
また、目次の生成の際に、下位あるいは上位の目次の表示を指示するためのリンクを埋め込んだ目次を生成すれば、例えばリンクの指示によって目次の内容の概略表示や詳細表示などを行うことが可能となる。また、文書の内容が変更されている場合にのみ、目次の当該文書の内容に対応する項目に、内容が変更されている旨を示す情報を付加して、文書の更新状況を知ることができる。このとき、内容が変更されている旨を示す情報は、例えば章あるいは節などの項目単位に付加することができ、その付加する項目単位を変更可能に構成することができる。さらに、目次となる見出しの読み仮名情報が付加されている場合には、その読み仮名情報を抽出し、抽出した読み仮名情報に基づいて索引を生成して出力するように構成することも可能である。
【0015】
このような目次は、予め格納されている文書から文書構造を抽出して文脈構造情報を生成し、文脈構造情報に対して目次を生成するための加工定義情報を用いて加工を施し、目次の出力形式を表す目次用のテンプレートを用いて加工された前記文脈構造情報から生成することができる。また文書内容情報は、文書あるいは該文書から指示されている部分を解析して内容情報を生成し、内容情報に対して加工定義情報を用いて加工を施し、文書の出力形式を表す文書用のテンプレートを用いて加工された内容情報から生成することができる。このように目次あるいは文書内容情報は、加工の方法は加工定義情報に、また出力形式をテンプレートに分離して記述して生成するので、例えば出力形式の変更時にはテンプレートのみを変更すればよい。
【0016】
テンプレートは、制御変数を定めるような手続き的な記述は不要で、章や節の番号、見出しの文字などを挿入する場所に変数記号を宣言的に記述して指定すればよい。さらに、それを必要な個数分繰り返すための繰り返し範囲の指定や、1つ前や1つ後などの異なる位置の文字列の挿入、文脈構造情報あるいは内容情報の階層と無関係な大域変数による固定した文字列の挿入や階層の無視、特定の階層以下の利用、処理手順の切り替え、選択的な文脈構造情報あるいは内容情報の利用などを指定することもできる。一般に、手続き的な記述に比べて宣言的な記述は容易であり、従来のXSL等のような手続き的プログラミングの知識や経験などは必要ない。
【0017】
また、加工定義情報は、文脈構造情報あるいは内容情報が文字列や演算可能な数値情報を有し、その文字列に他の文字列と連結したり、あるいは数値情報を使って演算を行うことによって加工結果を得るように定義しておくことができる。
【0018】
上述のような加工定義情報を利用した加工処理や、テンプレートを利用した目次あるいは文書内容情報の生成処理は、目次生成の場合及び文書内容情報の生成の場合に共通して利用することができ、システム構成も単純化することができる。なお、これらの加工定義情報やテンプレートは、例えば目次あるいは文書内容情報に埋め込むリンクに、テンプレートを指定するための情報、加工定義情報を指定するための情報のいずれかあるいは両方を含めておくことによって、使用するテンプレート、加工定義情報を簡単に変更できるように構成することができる。
【0019】
また、文書はタグを用いたマークアップ言語により作成されている場合、文書内容情報を生成する際に、タグ変換情報に従って出力する文書の形式へのタグの変換処理を行い、変換処理されたタグの情報を文書テンプレートとして利用して出力文書を生成するように構成することができる。この場合、出力する文書内容情報が元の文書とは異なるマークアップ言語であっても、タグ変換情報によって変換処理を行うことができる。なお、このタグ変換情報についても、目次あるいは文書内容情報に埋め込むリンクに、タグ変換情報を指定するための情報を含めておいて、使用するタグ変換情報を選択できるように構成することもできる。
【0020】
さらに、上述のような文書処理はコンピュータに実行させることができ、そのための文書処理プログラムを提供することができる。
【0021】
【発明の実施の形態】
図1は、本発明の実施の一形態を示すブロック図である。図中、1は文書格納部、2は目次生成部、3は文書内容情報生成部、4は操作部、5は表示部である。文書格納部1は、文書を格納している。文書としてはどのようなものでもよいが、ここでは章や節など、ある程度の文書構造を有しているものとする。また、1人が作成する比較的小規模な文書に限らず、部分毎に複数人で作成するような大規模な文書であってもよい。
【0022】
目次生成部2は、操作部4からの指示に従って、文書格納部1に格納されている文書から目次を生成して表示部5に対して出力する。生成する目次には、通常、章や節などの目次項目が配列されることになるが、その目次項目に対応する文書内容情報の出力を指示するためのリンクを埋め込んで出力する。すなわち、リンクが指示されることによって、必要に応じて文書内容情報生成部3が動作して文書内容情報を生成して出力し、あるいは既に文書内容情報が生成済であればその文書内容情報を出力するようなリンクを埋め込んでおく。このリンクによって、目次項目から対応する文書の内容を参照できるようにしている。さらに、そのような文書内容情報を出力するためのリンクとともに、下位あるいは上位の目次項目の表示を指示するためのリンクを埋め込んで目次を生成してもよい。これによって、例えば概略の目次と詳細な目次とを適宜切替ながら参照することが可能となる。
【0023】
また目次生成部2は、目次項目に対応する文書の内容が変更されているとき、目次中の当該文書内容情報に対応する目次項目に、内容が変更されている旨を示す情報を付加して目次を生成し、表示部5に表示させることができる。これによって、目次を参照しただけで文書中のどの目次項目が更新されたのかをすぐに把握することができる。このとき、文書の内容が変更されている旨を示す情報は、例えば章や節毎など、所定の項目単位毎に付加することができる。また、この文書の内容が変更されている旨を示す情報を付加する項目単位を変更可能に構成することもできる。
【0024】
文書内容情報生成部3は、操作部4からの指示に従って、文書格納部1に格納されている文書全体あるいはその一部の内容を抽出して文書内容情報を生成し、表示部5に対して出力する。生成する文書内容情報には、目次の出力を指示するためのリンクを埋め込んでおく。すなわち、リンクが指示されることによって必要に応じて目次生成部2が動作して目次を生成して出力し、既に出力すべき目次が生成済であればその目次を出力するようなリンクを文書内容情報中に埋め込んでおく。このリンクによって、文書の内容を表示しているときに、その文書の内容に対応する目次を表示させることができる。また、他の文書の内容を表示させるためのリンクを埋め込んでおくこともでき、この場合にも目次項目の場合と同様に、リンクの指示によって必要に応じて他の文書の文書内容情報を生成して出力するように構成することができる。
【0025】
操作部4は、ユーザの操作を受け付けるものであり、例えば目次生成部2や文書内容情報生成部3において目次や文書内容情報に埋め込んでおいたリンクを指示することができる。また表示部5は、目次生成部2や文書内容情報生成部3で生成した目次や文書内容情報を表示することができる。操作部4や表示部5は任意であり、例えば操作部4の代わりにソフトウェアから指示が受け渡される構成でもよいし、表示部5の代わりに、目次や文書内容情報をソフトウェアに対して出力するように構成してもよい。
【0026】
このような構成において、例えば操作部4から目次の作成が指示されると、目次生成部2は、文書格納部1に格納されている指示された文書の目次を生成して表示部5に出力する。ユーザは、表示部5に表示された目次を参照し、文書の概要を把握することができる。
【0027】
出力された目次には、それぞれの目次項目に、文書内容情報を生成するためのリンクが埋め込まれている。ユーザは、目次項目から文書の内容を参照したい場合に、対応するリンクを指示することができる。操作部4において目次中のリンクが指示されると、文書内容情報生成部3が起動し、文書格納部1に格納されている当該文書の一部を取り出し、表示部5に表示するための文書内容情報を生成して表示部5に出力する。これによって、ユーザは目次から対応する文書の内容を参照することができる。
【0028】
出力された文書内容情報には、上述のように目次を生成するためのリンクが埋め込まれている。ユーザは、目次を参照したい場合には、文書内容情報の表示画面から埋め込まれているリンクを操作部4から指示することができる。これによって目次生成部2が起動し、文書格納部1に格納されている当該文書の目次を生成して表示部5に表示させる。もちろんこの目次にもリンクが埋め込まれているので、再び文書内容情報を生成して表示させることができる。
【0029】
このような目次生成部2における目次の生成や、文書内容情報生成部3による文書内容情報の生成は、例えば操作部4において文書内容情報や目次中のリンクを指示することによって行われる。例えば複数人が1つの文書を並行して作成編集している場合、リンクを指示した時点での文書内容情報や目次が生成され、表示されることになる。例えば目次項目が変更されていたり、さらには章立てなどが変更されていても、指示した時点での目次を生成して出力することができる。また文書内容情報についても、最新の内容を出力することができる。
【0030】
図2は、本発明の実施の一形態を実現する構成例を示すブロック図である。図中、11は制御部、12は文脈構造情報生成部、13は加工処理部、14は整形処理部、15は内容情報生成部、16はタグ変換処理部である。図2に示す構成例において、目次生成部2は制御部11,文脈構造情報生成部12,加工処理部13,整形処理部14により構成される。また、文書内容情報生成部3は制御部11,内容情報生成部15,タグ変換処理部16,加工処理部13,整形処理部14により構成される。すなわち、制御部11,加工処理部13,整形処理部14は、目次生成部2及び文書内容情報生成部3において共用される。このように多くの処理部を目次生成時と文書内容情報生成時とで共用することによって、構成を簡単化している。なお、図2に示す構成では、文書格納部1に格納されている文書は、タグを用いたマークアップ言語により作成されたものであるとする。
【0031】
制御部11は、例えば図1に示す操作部4などから指示を受け取り、その指示に従って、目次の生成あるいは文書内容情報の生成を判断して各処理を制御する。指示が目次生成の場合には、文脈構造情報生成部12に対して文脈構造生成指示を与え、一連の目次の生成処理を開始させる。また、指示が文書内容情報の生成の指示である場合には、内容情報生成部15に対して内容情報生成指示を与えるとともに、タグ変換処理部16に対してタグ変換指示を与え、一連の文書内容情報の生成処理を開始させる。また生成された目次あるいは文書内容情報を例えば図1に示す表示部5などに出力する。
【0032】
文脈構造情報生成部12は、制御部11の指示に従って、文書格納部1に格納されている文書を解析して、部、章、節、項、表、図などの章立てを表す文書構造や、見出し文字列や文書部品の識別情報などを抽出し、各部、章、節、項、表、図の構造化文書内の位置、見出し文字列、文脈に依存して定まる番号、各節、項、表、図を含む文書の内容へのリンク情報などを所定の順に整列した文脈構造情報を生成する。この文脈構造情報は、各部、章、節、項、表等を表すタグ名と、上述の文脈に依存して定まる番号によって、検索したり部分を抜き出したりすることができる。
【0033】
加工処理部13は、文脈構造情報生成部12で生成された文脈構造情報や、内容情報生成部15で生成された内容情報に対して、加工定義情報を用いて加工を施す。例えば、1番目の章の題に対して、「1章」と付すか、「(1)」として付すかなど、文字列の変換処理などを行うことができる。この加工処理部13で加工した文脈構造情報又は内容情報が整形処理部14に渡される。
【0034】
整形処理部14は、与えられたテンプレート文書を用いて、加工処理部13から渡される加工後の文脈構造情報または内容情報を整形して目次あるいは文書内容情報を生成し、制御部11を介して出力する。具体的には、テンプレート文書を解析し、システムで規定された変数形式で記述されている部分を検出し、記述された変数記号をキーとして文脈構造情報または内容情報から文字列を取り出し、テンプレート文書の変数形式部分を置き換える処理を行う。例えば目次を生成する際に用いるテンプレートでは、各部、章、節、項の見出しと、各部、章、節、項の番号と、節、項を表す文書の内容を生成するためのリンクなどを、所定の変数表現で記述しておく。そしてこれらの変数表現の部分に対して、文脈構造情報を埋め込むことによって目次を生成することができる。文書内容情報についても整形処理部14の動作は同様である。ただし、文書内容情報を生成する場合は、タグ変換処理部16によって変換された情報をテンプレート文書として利用する。
【0035】
テンプレートは出力時のレイアウトを定めたものであり、このテンプレートを変更することによって異なるレイアウトで目次や文書の内容を参照することができる。このとき、文脈構造情報や内容情報に対する加工は加工処理部13において行っているので、ここではレイアウトのみについて設定することが可能である。また、タグ変換処理部16によって変換処理したタグの情報をテンプレートとして利用する場合は、元となる文書の構造を利用した文書内容情報を生成することができる。
【0036】
内容情報生成部15は、制御部11からの指示に従い、文書格納部1に格納されている指示された文書、あるいはその文書から指示されている部分を取り出して解析し、内容情報を生成する。内容情報としては、例えば後述するタグ変換処理部16から出力されるタグ変換情報中の変数形式を置き換えるための情報を抽出する。なお、上述のように内容情報生成部15で生成した内容情報は、加工処理部13によって加工定義情報に従って加工された後、整形処理部14に渡される。
【0037】
タグ変換処理部16は、制御部11からの指示に従い、文書格納部1に格納されている指示された文書、あるいはその文書から指示されている部分を取り出して解析し、タグの変換指示が記載されたタグ変換情報を用いて、出力する文書内容情報の形式へのタグの変換処理を行う。タグ変換情報において、変換後のタグの記述の中には、加工後の文脈構造情報や内容情報を埋め込むために、可変部分を含めておくことができる。この可変部分は、システムで規定された変数形式で記述しておけば、整形処理部14において変数形式の部分についての文書の内容による置換が行われる。
【0038】
次に、本発明の実施の一形態を実現する構成例における動作の一例について、具体例を用いながら説明してゆく。なお、以下の具体例においては、文書格納部1に格納されている文書は、マークアップ言語の一つであるXMLによって記述されているものとする。また、表示部15に出力する際には、HTMLによって記述された目次あるいは文書内容情報を出力するものとする。
【0039】
図3は、目次生成時に動作する構成の説明図である。図3には、図2に示す構成のうち目次の生成時に動作する構成要素のみを示している。以下、図3を用いながら目次生成時の動作について説明してゆく。例えば図1に示した操作部4などから目次の生成が指示され、あるいは、文書内容情報を表示時に、文書内容情報に埋め込まれているリンクが指示されると、その指示が制御部11に伝えられ、制御部11は文脈構造情報生成部12に対して文脈構造生成指示を行って、目次生成処理を開始させる。
【0040】
文脈構造情報生成部12では、上述のように文書格納部1に格納されている文書を解析して文脈構造情報を生成する。図4は、文書格納部1に格納されている文書の一例の説明図、図5は、文脈構造情報の一例の説明図である。ここでは、図4に一部を示したような、XMLによって記述された文書が文書格納部1に格納されているものとする。文脈構造情報生成部12では、このような文書を解析して、図5に示すような文脈構造情報を生成する。図5に示した文脈構造情報では、抽出した部、章、節、項、表、図などの章立てを表す文書構造をタグから抽出し、そのタグの名前をタグ欄に、また見出し文字列をタイトル欄に、その見出し文字列の別名文字列を別タイトル欄に、さらに見出し文字列及びその別名文字列の読み仮名をそれぞれ読み及び別名読み欄に、それぞれ格納している。また、各部、章、節、項、表、図の構造化文書内の位置を示す情報をアドレス欄及びインデックス欄に格納し、さらに、見出し文字列や文脈に依存して定まる番号をID欄に格納している。文脈構造情報生成部12では、図5に示すような文脈構造情報を抽出し、次の加工処理部13に渡す。
【0041】
加工処理部13では、加工定義情報に従って文脈構造情報に対して加工を施す。図6は、加工定義情報の一例の説明図、図7は、加工処理部による加工後の文脈構造情報の具体例の説明図である。図6に示す加工定義情報の一例では、文脈構造情報中のタグ欄の情報に従って、名前及びURIによるリンクを生成する加工を行う例を示している。
【0042】
生成するリンクとしては、例えば具体的にはIDなどを明示することによって性的なファイルの指示を行うように構成することもできるが、リンクによって直接、アプリケーションを起動する方法もある。その方法の一例として、例えばcgiやJava(登録商標) Servletの仕組みを利用してURL文字列を生成しておく方法がある。例えば図6中のURI欄及び目次URI欄に記載されているように、サーバ情報、メソッド名の情報、必要に応じて引数情報などを含めてURL文字列を生成し、埋め込んでおけばよい。
【0043】
例えば4行目の例では、タグ欄が“ARTICLE”であるとき、名前としてタイトル欄の情報の前に“○”を付した名前を生成する。またURIとして、サーバ名と、メソッド名、“?arg0=”、引数0、“&arg1=”、ID欄の左側7文字と“#”とID欄の右側3文字を順に連結した文字列を生成する。ここで、サーバ名、メソッド名、引数0には、図6(B)に示す加工定義表の文字列を、タグ欄の内容によらず共通して使用する。これに対して、IDとして使用する文字列は、文脈構造情報中の同一の行のID欄の内容を使用する。
【0044】
具体例として、図5に示した文脈構造情報の4行目(タグ=“ARTICLE”)の例では、図6に示す4行目の加工定義情報によって加工され、図7の4行目に示すように名前が“○中央営業所”、URIが“http://server:port/naiyou_method?arg0=aaa&arg1=0201001#001”という加工後の文脈構造情報が得られる。このURIはメソッド名“naiyou_method”を用いているので、この目次項目に対応する文書内容の出力を指示するものである。
【0045】
同様に例えば1行目の例では、タグ欄が“PART”であるとき、名前としてタイトル欄の情報に“地方”を付した名前を生成し、また、URIとしてサーバ名と、目次メソッド名、“?arg0=”、引数0、“&arg1=”、ID欄の左側7文字を順に連結した文字列を生成する。例えば図5に示した文脈構造情報の1行目(タグ=“PART”)の例がこの図6に示す1行目の加工定義情報によって加工され、図7の1行目に示すように名前が“東北地方”、URIが“http://server:port/mokuji_method?arg0=aaa&arg1=0200000”という加工後の文脈構造情報が得られる。このURIはメソッド名“mokuji_method”を用いており、このような場合には目次項目の上位または下位の目次項目の出力を指示するものである。他の文脈構造情報についても同様にして図6に示すような加工定義情報によって加工され、図7に示すような加工後の文脈構造情報が得られる。この加工後の文脈構造情報が整形処理部14に渡される。
【0046】
なお、アプリケーションが動作するサーバ情報やメソッド名の情報などは、図6に示すようにあらかじめ加工定義情報中に記述しておいてもよいし、加工処理部13が加工定義情報を読み込んだ時点で決定されるようにしてもよい。また、図6に示す例においても、文書中のどの部分を文書内容情報として生成するかは、ID情報から特定できることとし、URL中にアプリケーション(文書内容情報生成部3)へ渡すパラメータとして含めている。さらに、引数情報にはテンプレートや加工定義表を指定するための情報を設定することもできる。例えば図6において引数0に“aaa”と記述している部分をファイル名やファイルのURI文字列にしてもよい。
【0047】
また図6には、URI欄とは別に目次URI欄が設けられており、この欄を利用することによって文書内容情報を出力するためのURIとともに、上位または下位の目次を生成するためのURIを付加することができる。記述方法は上述のURI欄と同様である。ただし、ここではID情報として上位または下位のものを使用する必要がある。図6(A)の3行目の、”ID(CHAPTER)”は文脈構造情報中のタグ欄が“CHAPTER”である行(自身の上位のもの)のID欄の内容を使用することを表している。それ以外の部分はURI欄の場合と同様であり、URL中に目次メソッドを指定するとともにID情報を含めた文脈構造情報に加工することができる。この加工された文脈構造情報中のID情報を、同じく加工された文脈構造情報中の目次メソッドで指定されたアプリケーション(目次生成部2)へ渡して目次を生成させることができる。
【0048】
さらに、リンクには、整形処理部14で用いるテンプレート文書、加工処理部13で用いる加工定義情報、タグ変換処理部16で用いるタグ変換情報を選択するための情報を含ませておくことができる。例えば特開平8−292910号公報に記載されている技術を利用すれば、上述の各情報を選択するためのパラメータの指定に、HTTPリクエストのURLを利用することができる。
【0049】
整形処理部14では、ここでは目次を生成するので目次用のテンプレート文書を解析し、変数形式で記述されている部分を検出し、記述された変数記号をキーとして文脈構造情報から文字列を取り出し、テンプレート文書の変数形式部分を置き換える処理を行う。図8は、目次用のテンプレートの一例の説明図、図9は、生成された目次の一例の説明図、図10は、生成された目次の表示画面の一例の説明図である。テンプレート文書は、この例ではHTMLによって記述されており、繰り返しを示す部分を“{{”(繰り返し開始記号)及び“}}”(繰り返し終了記号)で囲み、また変数記号を‘$’で囲んで示している。整形処理部14では、テンプレート文書からこれらの変数記号や繰り返し開始記号及び繰り返し終了記号を抽出する。そして、抽出した変数記号に代えて置き換えるべき文字列を、加工処理部13で加工された文脈構造情報の中から選択し、その文脈構造情報に含まれている置き換え対象の文字列の個数に従って繰り返し回数を決定し、繰り返し開始記号から繰り返し終了記号までの間に含まれている文字列を、変数記号以外はそのままとし、変数記号は加工処理部13で加工された文脈構造情報中の文字列への置き換えを行って、決定した回数だけ出力する。
【0050】
図8に示す例では、二重の繰り返し構造を指定しており、項の目次項目の出力を繰り返す部分と、これを含み、節の目次項目を出力する繰り返し項目が存在している。また、これらの繰り返し部分には変数記号として“$SECTION.name$”、“$ARTICLE.uri$”、“$ARTICLE.name$”が存在しており、これらの部分に、それぞれ節の名称、項のURI、項の名称を割り当ててゆく。またこのほかに変数記号として“$SECTION.mokuji_uri$”が存在しており、この部分に節の目次URIが割り当てられる。これによって、図9に示すような目次が生成される。そして、このような目次の文書を例えば図1に示した表示部5で表示することによって、図10に示すような表示画面が得られることになる。
【0051】
図10に示す表示画面において、「○中央営業所」と「○南支店」のリンクについては、指示することによって文書内容を参照することができる。また、「上位の目次」のリンクについては、指示することによって上位の目次を参照することができる。
【0052】
以上のようにして、文書格納部1に格納されているXML形式の文書からHTML形式の目次を生成して出力することができる。このとき、例えば図8に示したような目次用のテンプレート文書では、文脈構造情報の配置(順序など)を示しているのみである。例えば出力時の表示形式を変更したければ、このテンプレート文書を変更するのみで対応可能である。
【0053】
なお、図8に示したテンプレートの一例においては、繰り返し開始記号から繰り返し終了記号までのそれぞれの繰り返し部分の階層に1つしか変数記号が存在しないため、繰り返し回数は一意に定まる。しかし、繰り返し開始記号と繰り返し終了記号の間に異なる階層に属する複数種類の変数記号が存在する場合もある。図11は、目次用のテンプレートの別の例の説明図である。テンプレート文書は図8に示した例と同様にHTMLによって記述されている。この図11に示す例では、1組の繰り返し開始記号と繰り返し終了記号によって囲まれた繰り返し部分に、変数記号“$CHAPTER.name$”と“$SECTION.name$”の2つの種類の変数記号が含まれている。このような場合は、複数種類の変数記号の中で最も下位の層に属する変数記号に従って繰り返しの回数を決定する。図11に示した例においては、変数記号“$CHAPTER.name$”と“$SECTION.name$”の階層を、図5に示した文脈構造情報を用いて比較すると、タグ=“SECTION”の方が下位の層に属することがわかる。そのため、繰り返し回数は“$SECTION.name$”によって決定することになる。なお、下から2行目に“$PART[FIRST].uri$”とあるが、これは部(PART)のうち最初の部のURIを指示するものである。詳細は後述する。
【0054】
また、例えば文書格納部1に格納されている文書の更新履歴が管理されている場合や、文書の部分ごとに別のファイルとして更新日時が管理されているなど、文書の更新に関する情報が取得できる場合、これらの情報を利用して、目次に当該目次の項目に対応する文書の内容が変更されているときにその旨を示す情報を目次に付加するように構成することもできる。
【0055】
図12は、文書の更新に関する情報を含む文脈構造情報の一例の説明図、図13は、文書の更新に関する情報を利用した加工定義情報の一例の説明図、図14は、文書の内容が変更されている旨を付加した目次の表示画面の一例の説明図である。図12に示す例では、文脈構造情報生成部12において、文書格納部1に格納されている文書を解析するとともに、当該文書の最終更新日及び前回発行日を取得し、文脈構造情報中に含めた例を示している。また、このような文脈構造情報を加工処理部13で利用するための加工定義情報を定義しておく。例えば図13に示す例では、4行目の例においてタグ欄が“ARTICLE”であるとき、名前として“○”及びタイトル名とともに、最終更新日から前回発行日を引いた値が正、すなわち前回発行日後に更新されていた場合には“(New!)”を付加することが定義されている。なお、最終更新日と前回発行日が等しかったり、最終更新日の方が前回発行日よりも古い場合には“(New!)”は付加されない。ここで、条件IFは3つのパラメータを含んでおり、最初のパラメータが条件、2番目のパラメータは条件が正(真)の場合、3番目のパラメータは条件が0または負(偽)の場合を表している。この条件IFによって、最終更新日と前回発行日に応じて加工結果を異ならせている。また、関数DATEVALUE()は、日付を値に変換する関数であり、演算を行うために利用している。
【0056】
図12に示す文脈構造情報に対して図13に示す加工定義情報を用いて加工を行い、生成された目次を表示したときの表示画面の一例を図14に示している。図12より、タグ欄が“ARTICLE”のタイトルは「中央営業所」と「南支店」である。ここで、「中央営業所」については前回発行日が最終更新日よりも後であり、「南支店」は最終更新部の方が前回発行日より後である。従って、図14に示す例ではタイトル「南支店」の脇に“New!”と表示されることになる。
【0057】
ここでは“New!”の表示のみであるが、例えば内容が変更されている旨とともに更新日を表示したり、あるいは、更新日が所定期間内の場合にのみ、内容が変更されている旨を表示するようにしてもよい。また、図12に示す例では日単位であるが、例えば時刻情報も含めて判定を行ってもよい。さらに、文書の内容が変更された旨の情報は、図14に示す例のように項目に付加するほか、それより上位の節や章などに付加することも可能であり、付加する項目単位を変更可能に構成してもよい。
【0058】
上述の目次の生成過程において、見出し文字列や文脈に依存して定まるIDを利用したURIを生成し、目次の項目に付している。図10に示す例においても下線を付して示している目次項目にURI(リンク)が付加されていることを示している。このURIを指示することによって、図1に示した文書内容生成部3が動作し、指示された項目に対応する文書内容の表示が行われる。
【0059】
なお、図10などにおいては下位の目次を生成して上位の目次へのURIを付加した例を示した。もちろん目次として上位の階層、例えば章や節の目次を生成し、その目次項目に、下位の目次を生成する処理を行わせるためのURIを付加しておいて、上位の階層の目次から章や節を選択して下位の階層の目次を表示させることができる。図15は、下位の階層へのリンクを付加した目次の表示例の説明図である。図15(A)には章までの目次を生成して表示させた例を示している。この場合、各章に付加されているURIは、その章の下位の階層の目次を生成させるためのものであり、例えば▲1▼に示すリンクを指示することによって図1に示す目次生成部2が再び動作し、例えば図15(B)に示すような節以下の階層の目次を生成して出力することができる。このとき、▲1▼のリンクには「1章」のIDを付加しておくことによって、このIDを利用して目次生成部2では「1章」の下位の階層の目次を生成することができる。もちろん、図15(B)に示すように下位の階層の目次に「上位へ」として示すような上位の階層の目次の生成を指示するリンクを付加しておくことができ、上位の階層の目次と下位の階層の目次を交互に表示させることが可能なように構成することもできる。またこの例の場合にも、最下位層のリンクを指示することによって、上述のように文書内容生成部3を動作させて文書内容情報を生成させることができる。
【0060】
次に、文書内容情報を生成する際の動作について説明する。図16は、文書内容情報生成時に動作する構成の説明図である。図16には、図2に示す構成のうち文書内容情報の生成時に動作する構成要素のみを示している。以下、図16を用いながら文書内容情報生成時の動作について説明してゆく。例えば図1に示した操作部4などから文書内容情報の生成が指示され、あるいは、上述のように目次を表示時に、目次に埋め込まれているリンクが指示されて文書内容情報の生成が指示されると、その指示が制御部11に伝えられ、制御部11は内容情報生成部15に対して内容情報生成指示を行うとともに、タグ変換処理部16に対してタグ変換指示を行って、文書内容情報の生成処理を開始させる。なお、目次に埋め込まれているリンクが指示された場合、上述の具体例ではリンクにIDが含まれているので、このIDを利用して文書内容情報を生成する際の文書部分を特定することが可能である。
【0061】
タグ変換処理部16では、文書格納部1に格納されている文書全体、あるいはその文書の一部を取り出して、タグ変換情報に従ってタグの変換処理を行う。例えば目次に埋め込まれた文書内容情報を生成するためのリンクが指示された場合には、当該リンクが付加されていた目次項目のIDがリンクに付与されているので、その項目の文書の内容を取り出すことになる。
【0062】
図17は、タグ変換情報の一例の説明図、図18は、タグの変換処理後の情報の一例の説明図である。ここでは上述の図4に示したXML形式の文書が文書格納部1に格納されているものとする。また、図17に示すようなタグ変換情報が与えられているものとする。図17に示すタグ変換情報では、指定された節以下の構造を取り出して文書内容情報を生成する場合のタグ変換情報を示している。変換前欄には、元となるXML形式の文書中のタグを示しており、そのタグが検出されたときの変換後のHTML形式のタグを変換後欄に示している。例えば最初の行では、“SECTION”、“TITLE”、“PARA”の順でタグが連続したとき、その右の変換後欄に示したような文字列に変換することを示している。また、終了タグについても、変換前欄に示されている終了タグを変換後欄に示されている終了タグに変換することを示している。このようなタグ変換情報を用いて、例えば図4に示した文書のタグを変換処理することによって、図18に示すようなタグ変換処理後の情報が得られる。
【0063】
なお、タグ変換情報において変換後の文字列の中には、例えば図17において‘$’で囲んで示したように変数形式の可変部分を含ませておくことができる。この変数形式の部分は、整形処理部14によって加工処理後の内容情報によって置換処理されることになる。
【0064】
また、図18の先頭にある“#PLAIN”は、後述する整形処理部14で文書内容情報を生成する際に、文脈構造情報あるいは内容情報の有している階層構造に関する情報を無効にすることを指示する指示記号である。例えば図18に示した例では変数形式の部分(“$ARTICLE.uri$”や“$ARTICLE.name$”など)が繰り返されているが、指示記号“#PLAIN”の指定がない場合には同じ階層のこれらの変数形式の部分には同じ文字列が割り当てられる。一方、指示記号“#PLAIN”の指定を行った場合には、同じ階層であっても別の文字列を割り当てるように制御することを表している。具体例については後述する整形処理部14の動作の説明において述べる。
【0065】
一方、内容情報生成部15では、タグ変換処理部16と同様に文書格納部1に格納されている文書全体、あるいはその文書の一部を取り出して解析し、タグ変換処理部16で変数形式で記述されている部分に対応する内容情報を抽出する。図19は、内容情報の一例の説明図、図20は、内容情報のための加工定義情報の一例の説明図、図21は、加工後の内容情報の一例の説明図である。図19に示した内容情報は、図5に示した文脈構造情報とほぼ同様であるが、この例ではURL欄を設けている。このような内容情報は、加工処理部13に渡され、例えば上述の図20に示すような加工定義情報を用いて内容情報を加工することによって、図21に示すような加工後の内容情報が得られる。なお、図20に示す加工定義情報の記述方法は図6に示した文脈構造情報のための加工定義情報と同様である。
【0066】
整形処理部14では、タグ変換処理部16によって変換されたタグの情報を文書内容情報用のテンプレート文書とし、これを解析して変数形式で記述されている部分を検出する。そして、テンプレート文書の変数記号の部分を加工処理部13から渡される加工後の内容情報によって置き換える処理を行う。図22は、生成された文書内容情報の一例の説明図、図23は、生成された文書内容情報の表示画面の一例の説明図である。図18に示した変換処理後のタグの情報中の変数形式で記述された部分が加工後の内容情報によって置きかえられ、図22に示すような文書内容情報が得られる。
【0067】
このとき、図18に示した変換処理後のタグの情報の先頭には指示記号“#PLAIN”が指定されている。この指定によって、図21に示した加工後の内容情報を変数記号と置き換えてゆく際に、階層関係を無視して、変数記号に適合する内容情報で順に置き換えてゆく。例えば図18に示した変換処理後のタグの情報中には変数記号“$ARTICLE.name$”が複数存在する。図21に示した加工後の内容情報から、最初の変数記号“$ARTICLE.name$”は“○中央営業所”に置き換えられ、次の変数記号“$ARTICLE.name$”は“○南支店”に置き換えられる。例えば指示記号“#PLAIN”が指定されていない場合には、同じ階層にあるいずれの変数記号“$ARTICLE.name$”も“○中央営業所”に置き換えられる。なお、整形処理部14が文書内容情報を生成する際に、“#PLAIN”の文字列自体は削除される。
【0068】
図22に示した文書内容情報を例えば図1に示した表示部5で表示することによって、図23に示すような表示画面が得られることになる。この図23に示した表示画面の上部において「目次表示」の部分に下線が付されている。この部分に目次生成を指示するリンクが付加されており、ユーザはこのリンクを指示することによって図1に示す目次生成部2を起動して目次を生成させることができる。また、文書の内容としてURLが指定されている部分についても、その文書に記述されているURLが付加されており、当該URLによりページを参照することが可能である。図23に示す例では「中央営業所の紹介ページ」を参照することができる。
【0069】
さらに、文書の内容中に他の部分を参照する記述が存在する場合、その部分へのリンクを付加しておくことができる。図24は、他の文書部分へのリンクを付加した場合の模式図である。図24(A)に示す例では、1節の内容中に5節が参照されている。このような場合、参照されている節へのリンクを付加しておくことができる。このリンク(▲2▼)を指示することによって、再び文書内容情報生成部3が起動して、指示された節の内容を含む文書内容情報を生成し、出力する。これによって図24(C)に示すように、この例では5節の内容を参照することができる。もちろん、図24(A)における目次生成のためのリンク(▲1▼)を指示することによって、図24(B)に示すように、目次を生成して表示させることができる。
【0070】
なお、上述の例では文書中の節以下の内容により文書内容情報を生成する例を示した。しかしこれに限らず、任意の文書構造の階層から文書内容情報を生成することが可能であり、どの階層から文書内容情報を生成するかを指示可能に構成してもよい。もちろん、目次が表示された状態で章が指示されれば章以下、節が指示されれば節以下の文書の内容を文書内容情報として生成するように構成することもできる。
【0071】
また、上述の例ではタグ変換処理部16において変換したタグの情報をテンプレート文書として利用して文書内容情報を生成する例を示した。しかしこれに限らず、タグ変換処理部16を用いず、あるいはタグ変換処理部16を設けずに、テンプレート文書を別途用意して整形処理部14で用いるようにしてもよい。
【0072】
以上説明したように、図2に示した構成によって目次の生成及び文書内容情報の生成を行うことができるが、目次の生成時の処理と同様にして索引を生成することも可能である。図25は、索引生成時のテンプレート文書の一例の説明図、図26は、生成された索引の一例の説明図である。索引を生成する場合、加工定義情報として文脈構造情報から読み仮名情報を残すようにしておき、読み仮名を含んだ加工後の文脈構造情報を取得しておく。また、整形処理部14に与えるテンプレート文書として、例えば図25に示すようなテンプレート文書を与える。整形処理部14では、図25に示すテンプレート文書を解析し、変数部分を加工後の文脈構造情報により置換してゆく。この時、条件として読み仮名情報の先頭文字によって分類している。このようなテンプレート文書によって、例えば図4に示した文書から図26に示すような索引が生成される。この索引においても、各項目には当該項目の文書内容情報を生成するためのリンクが付加されており、リンクを指示することによって文書の内容を参照することが可能である。
【0073】
また、上述の目次や文書内容情報の生成例では、文書全体を対象として処理を行っている。しかし、一部分のみが必要な場合もある。そのような場合の例を示す。図27は、文脈構造情報の別の例の説明図、図28は、部分的な目次を生成するための目次テンプレートの一例の説明図、図29は、生成された部分的な目次の一例の説明図、図30は、図28で部分的な目次の生成を指示しなかった場合に生成された目次の一例の説明図である。部分的な目次を生成する際には、文脈構造情報生成部12で文書から文脈構造情報を生成する際に、文書中のどの部分について文書内容情報を生成するかを指定するための指示記号を含めておく。図28に示す例では、先頭に指示記号“#CHAPTER[1]”が存在する。この指示記号“#CHAPTER[1]”は、タグ“CHAPTER”の2番目の章の目次を生成することを指定するものである。すなわち、図27に示す文脈構造情報の例では、タグ“CHAPTER”のうち、タイトルが“岩手県”の章(すなわち“岩手県”のノード以下に展開される構造)が目次の対象となる。なお、‘[’と‘]’の間の数字は0を最初として、0が1番目を示し、以下順に1が2番目を、2が3番目といったように示している。
【0074】
図27に示した文脈構造情報に対して、ここでは図6に示した加工定義表を用いて加工処理部13で加工し、得られた加工後の文脈構造情報に対して図28に示す目次テンプレートを適用して整形処理部14で目次を生成する。このとき、上述のように図28に示す目次テンプレート中の指示記号“#CHAPTER[1]”に従って、加工後の文脈構造情報中のタイトル“岩手県”以下に展開される構造が利用され、図29に示すような目次が生成される。
【0075】
もし、図28に示した目次テンプレートに指示記号“#CHAPTER[1]”が記述されていなかった場合には、図27に示した文脈構造情報全体が目次生成の対象となり、図30に示すようにタイトル“青森県”の章についても目次に含まれることになる。
【0076】
なお、上述の例では章単位で部分的に目次を生成する例を示したが、もちろんこれに限らず、“#PART”や“#SECTION”など、任意の単位で部分的な構造を指示することが可能である。
【0077】
また、ここでは部分的な目次を作成する例を示したが、これに限らず、文書内容情報を生成する際にも適用することができる。すなわち、タグ変換処理部16で変換後のタグの情報を生成する際に、部分的な文書内容情報の指示を行う指示記号を含めておけばよい。
【0078】
上述の指示記号中でも‘[’と‘]’の間に位置(何番目か)を指示しているように、同様の記述によって位置指定を行うことによって、変数記号に対して適用する文脈構造情報や内容情報を指定することができる。図31は、位置を指定した変数記号を用いた目次テンプレートの一例の説明図、図32は、位置指定によって生成された目次の一例の説明図である。図31に示した目次テンプレート中、▲1▼で示した行には変数記号“$CHAPTER[1].name$”が存在する。この変数記号は、2番目の章の名前によって置き換えることを明示的に指定するものである。なお、この場合も“[0]”が1番目を示している。
【0079】
また、図31中の▲2▼で示した行には“$PART[FIRST].uri$”が存在する。この変数記号は、最初の部(PART)のURIによって置き換えることを明示的に指定するものである。もちろん、“FIRST”を“0”としても同様である。
【0080】
例えば図27に示した文脈構造情報に対して図6に示した加工定義情報を用いて加工処理部13で加工し、得られた加工後の文脈構造情報に対して図31に示す目次テンプレートを適用して整形処理部14で目次を生成すると図32に示すような目次が生成される。
【0081】
ここで、図31に示した目次テンプレートの▲1▼で示した行において2番目の章が指定されているので、“第2章 岩手県”及びその下位に展開される項目についてのみの目次が生成されている。このような位置の指定がなければ、図30に示した用に“第1章 青森県”から目次が生成されることになるし、第3章以降が存在すれば、それらの目次も生成されることになる。
【0082】
また、図31に示した目次テンプレートの▲2▼で示した行においては、最初の部のURIが指定されているので、図6に示した加工定義情報に従って生成されるタイトル“東北”(加工後の名前は“東北地方”)のURI“http://server:port/mokuji_method?arg0=aaa&arg1=0200000”に置き換えられる。図32に示した例では2番目の章についての目次を生成しているが、この指定によって、最初の部の目次に戻るリンクを生成することができる。
【0083】
この例では‘[’と‘]’の間に0以上の数値あるいは“FIRST”を指定した例を示した。しかしこれに限らず、例えば‘+’あるいは‘−’とともに数値を指定して現在位置からの相対的な位置の指示を行うことができる。また、“FIRST”に対応して“LAST”により最後を指定したり、“NEXT”や“PREVIOUS”により1つ後あるいは1つ前を指定することもできる。もちろん、このほかの位置指定を可能としてもよい。
【0084】
また、ここでは目次を作成する場合の例を示したが、これに限らず、文書内容情報を生成する際にも適用することができる。すなわち、タグ変換処理部16で変換後のタグの情報を生成する際に、位置指定を含む変数記号を埋め込んでおけばよい。
【0085】
上述の各例では文字列の編集しか行っていないが、数値情報が含まれている場合には、数値情報に対する演算を指示することも可能である。ここでは目次の生成時の処理と同様にして、演算結果を含む文書を生成する例を示す。また、上述の変数記号の説明では、変数記号は文書の階層構造に依存しているが、階層構造とは無関係に文書全体に渡って共通して利用したい情報もある。このように階層構造とは無関係に利用可能な大域変数記号を利用した例について併せて説明する。
【0086】
図33は、数値演算を含む加工定義情報の一例の説明図、図34は、大域変数記号の内容を含む文脈構造情報の一例の説明図、図35は、数値演算を含む加工後の文脈構造情報の一例の説明図、図36は、大域変数記号を含む目次テンプレートの一例の説明図、図37は、数値演算及び大域変数記号を用いて生成された目次の一例の説明図である。例えば図6に示した加工定義情報では、文字列の連結のために‘&’を用いているが、演算を指示する場合には、この‘&’の代わりに数値演算のためのオペレータを使用すればよい。例えば図33の1行目に示したタグ“PLANT”の例では、不良率の欄に“=不良個数/生産個数*100”と記述している。‘/’は除算を、また‘*’は乗算をそれぞれ示すオペレータであり、生産個数に対する不良個数の比率を計算している。もちろんオペレータとしてはこれ以外にも、‘+’や‘−’、その他、様々な数値演算で用いられるオペレータ、さらには様々な演算のための関数やIFなどの制御関数(制御文)などを組み合わせて用いることが可能である。
【0087】
一方、文書から文脈構造情報生成部12で生成した文脈構造情報が図34の最下行を除くものであったとする。最下行のアドレス“GLOBAL”は大域変数記号の内容であることを示している。大域変数記号は文書の階層構造とは無関係に、文書を通じて利用可能な変数記号であり、その内容は予め設定されるものである。すなわち、図34に示す文脈構造情報のうち、最下行を除く部分は文書から文脈構造情報生成部12が生成し、最下行については、予め設定されているものである。もちろん、文書から抽出された内容でもよいが、予め、あるいは後から、大域変数記号の内容であることが指示あるいは判定される。この大域変数記号の内容は、後述するテンプレート文書中に記述されている大域変数記号によって参照される。
【0088】
このような図34に示した文脈構造情報は、加工処理部13において上述の図33に示した加工定義情報に従って加工される。この時、不良率の欄については数値演算が施される。図33に示す加工定義情報の例では、図34に示す文脈構造情報のうちの生産個数の欄と不良個数の欄の数値を用いて演算を行い、不良率の欄の数値としている。加工後の文脈構造情報を図35に示している。なお、大域変数記号の内容(タグ“MEAN”)についても、図33に示す加工定義情報中のタグ“MEAN”の情報に従って数値演算が行われている。
【0089】
このようにして加工された文脈構造情報に対して、整形処理部14で目次テンプレートに対応するテンプレートを適用し、出力文書を生成する。ここでは図36に示すようなテンプレートを用いるものとしている。テンプレートの構造自体は図8に示した目次用のテンプレートとほぼ同様であり、2重の繰り返しによって工場毎に製品の不良率を配置する構成を示している。このうち、▲1▼、▲2▼として示した行には大域変数記号“$MEAN.name$”が含まれている。この大域変数記号によって、加工後の文脈構造情報中の大域変数記号の内容が参照され、この場合は“全国平均”に置換される。▲2▼として示した行における“$MEAN.bad$”も同様であり、全国平均の不良率“0.9”(演算結果)に置換される。
【0090】
図36に示したようなテンプレートを用い、加工後の文脈構造情報を用いて整形処理部14で処理することによって、図37に示すような文書が得られる。この文書は、図34に示したように生産個数や不良個数などの数値の素データから演算された不良率の情報を含むものである。また、大域変数記号の内容として“全国平均”の文字列や全国での生産個数、不良個数が設定されており、これらの予め設定されている素データから演算された全国平均の不良率が示されている。
【0091】
この例では、大域変数記号の内容を示した部分は他の工場や製品との比較のために設けているものであるため、比較対象を変更する場合には大域変数記号の内容を変更するだけで、加工定義情報やテンプレート文書を変更する必要はない。例えば“関東地方”の生産個数及び不良個数を予め設定しておけば、関東地方の平均不良率が示され、それぞれの工場や製品の不良率と関東地方の不良率とを比較する文書が生成されることになる。
【0092】
ここに示した例は、もちろん一例であって、同様に数値演算を用いたり、あるいは大域変数記号を用いて、様々な文書を生成することが可能である。また、ここでは目次を作成する処理を利用して文書を生成する例を示したが、これに限らず、文書内容情報を生成する際の加工定義情報やタグ変換情報に数値演算の指示や大域変数記号を使用することも可能である。
【0093】
図38は、本発明の文書処理装置の機能または文書処理方法をコンピュータプログラムで実現した場合におけるコンピュータプログラム及びそのコンピュータプログラムを格納した記憶媒体の一例の説明図である。図中、101はプログラム、102はコンピュータ、111は光磁気ディスク、112は光ディスク、113は磁気ディスク、114はメモリ、121は光磁気ディスク装置、122は光ディスク装置、123は磁気ディスク装置である。
【0094】
上述の本発明の実施の形態で説明した機能は、コンピュータにより実行可能なプログラム101によっても実現することが可能である。その場合、そのプログラム101およびそのプログラムが用いるデータなどは、コンピュータが読み取り可能な記憶媒体に記憶することも可能である。記憶媒体とは、コンピュータのハードウェア資源に備えられている読取装置に対して、プログラムの記述内容に応じて、磁気、光、電気等のエネルギーの変化状態を引き起こして、それに対応する信号の形式で、読取装置にプログラムの記述内容を伝達できるものである。例えば、光磁気ディスク111,光ディスク112(CDやDVDなどを含む)、磁気ディスク113,メモリ114(ICカード、メモリカードなどを含む)等である。もちろんこれらの記憶媒体は、可搬型に限られるものではない。
【0095】
これらの記憶媒体にプログラム101を格納しておき、例えばコンピュータ102の光磁気ディスク装置121,光ディスク装置122,磁気ディスク装置123,あるいは図示しないメモリスロットにこれらの記憶媒体を装着することによって、コンピュータからプログラム101を読み出し、本発明の文書処理装置の機能または文書処理方法を実行することができる。あるいは、予め記憶媒体をコンピュータ102に装着しておき、例えばネットワークなどを介してプログラム101をコンピュータ102に転送し、記憶媒体にプログラム101を格納して実行させてもよい。なお、本発明の一部の機能についてハードウェアによって構成することもできるし、あるいは、すべてをハードウェアで構成してもよい。
【0096】
【発明の効果】
以上の説明から明らかなように、本発明によれば、目次から文書の内容を参照可能であり、また、文書の内容を参照している状態から目次を参照することができる。このとき、指示された時点で目次あるいは文書内容情報を生成するので、時々刻々と編集されてゆく文書であっても、常に最新の状態を参照することができる。これらを適宜切替ながら参照することによって、文書の参照が容易になり、また、文書の作成編集を支援することができる。
【0097】
また、目次あるいは文書内容情報を生成する際に、加工定義情報を使用した加工処理と、テンプレート文書を使用した整形処理とに分けて処理を行うので、見栄えの設定についてはテンプレート文書のみを編集すればよく、プログラミング経験のない人でも作成、変更、保守を行うことができる。また、変換対象の文書や、出力する目次や文書内容情報のデザインが変わっても、変更を加える個所がそれぞれ限定されるため、全体として、開発、カスタマイズが容易になり、保守性が向上するという効果がある。
【図面の簡単な説明】
【図1】本発明の実施の一形態を示すブロック図である。
【図2】本発明の実施の一形態を実現する構成例を示すブロック図である。
【図3】目次生成時に動作する構成の説明図である。
【図4】文書格納部1に格納されている文書の一例の説明図である。
【図5】文脈構造情報の一例の説明図である。
【図6】加工定義情報の一例の説明図である。
【図7】加工処理部による加工後の文脈構造情報の具体例の説明図である。
【図8】目次用のテンプレートの一例の説明図である。
【図9】生成された目次の一例の説明図である。
【図10】生成された目次の表示画面の一例の説明図である。
【図11】目次用のテンプレートの別の例の説明図である。
【図12】文書の更新に関する情報を含む文脈構造情報の一例の説明図である。
【図13】文書の更新に関する情報を利用した加工定義情報の一例の説明図である。
【図14】文書の内容が変更されている旨を付加した目次の表示画面の一例の説明図である。
【図15】下位の階層へのリンクを付加した目次の表示例の説明図である。
【図16】文書内容情報生成時に動作する構成の説明図である。
【図17】タグ変換情報の一例の説明図である。
【図18】タグの変換処理後の情報の一例の説明図である。
【図19】内容情報の一例の説明図である。
【図20】内容情報のための加工定義情報の一例の説明図である。
【図21】加工後の内容情報の一例の説明図である。
【図22】生成された文書内容情報の一例の説明図である。
【図23】生成された文書内容情報の表示画面の一例の説明図である。
【図24】他の文書部分へのリンクを付加した場合の模式図である。
【図25】索引生成時のテンプレート文書の一例の説明図である。
【図26】生成された索引の一例の説明図である。
【図27】文脈構造情報の別の例の説明図である。
【図28】部分的な目次を生成するための目次テンプレートの一例の説明図である。
【図29】生成された部分的な目次の一例の説明図である。
【図30】図28で部分的な目次の生成を指示しなかった場合に生成された目次の一例の説明図である。
【図31】位置を指定した変数記号を用いた目次テンプレートの一例の説明図である。
【図32】位置指定によって生成された目次の一例の説明図である。
【図33】数値演算を含む加工定義情報の一例の説明図である。
【図34】大域変数記号の内容を含む文脈構造情報の一例の説明図である。
【図35】数値演算を含む加工後の文脈構造情報の一例の説明図である。
【図36】大域変数記号を含む目次テンプレートの一例の説明図である。
【図37】数値演算及び大域変数記号を用いて生成された目次の一例の説明図である。
【図38】本発明の文書処理装置の機能または文書処理方法をコンピュータプログラムで実現した場合におけるコンピュータプログラム及びそのコンピュータプログラムを格納した記憶媒体の一例の説明図である。
【図39】XML文書の具体例の説明図である。
【図40】図39のXML文書から生成する目次の一例の説明図である。
【図41】図40に示した目次を得るためのXSLの記述一例の説明図である。
【図42】図39のXML文書から生成する目次の別の例の説明図である。
【図43】図42に示した目次を得るためのXSLの記述一例の説明図である。
【符号の説明】
1…文書格納部、2…目次生成部、3…文書内容情報生成部、4…操作部、5…表示部、11…制御部、12…文脈構造情報生成部、13…加工処理部、14…整形処理部、15…内容情報生成部、16…タグ変換処理部、101…プログラム、102…コンピュータ、111…光磁気ディスク、112…光ディスク、113…磁気ディスク、114…メモリ、121…光磁気ディスク装置、122…光ディスク装置、123…磁気ディスク装置。
Claims (51)
- 文書を格納する文書格納手段と、前記文書格納手段に格納されている文書から文書構造を抽出して文脈構造情報を生成する文脈構造情報生成手段と、前記文書格納手段に格納されている文書あるいは該文書から指示されている部分を取り出して解析し内容情報を生成する内容情報生成手段と、前記文脈構造生成手段で生成された文脈構造情報あるいは前記内容情報生成手段で生成された内容情報に対して加工定義情報を用いて加工を施す加工処理手段と、出力形式を表すテンプレートを用いて前記加工処理手段で加工された前記文脈構造情報あるいは内容情報から出力文書を生成する整形処理手段を有し、目次出力時には前記文脈構造情報生成手段で生成した前記文脈構造情報に対して前記加工処理手段による加工及び前記整形処理手段による目次用のテンプレートを適用して目次項目に対応する文書内容情報を必要に応じて生成して出力するためのリンクを埋め込んだ目次を前記出力文書として生成し、文書内容情報出力時には前記内容情報生成手段で生成した前記内容情報に対して前記加工処理手段による加工及び前記整形処理手段による文書内容情報出力用のテンプレートを適用して目次を必要に応じて生成して出力するためのリンクを埋め込んだ前記出力文書を生成することを特徴とする文書処理装置。
- 前記文書格納手段に格納されている文書はタグを用いたマークアップ言語により作成されており、さらに、タグ変換情報に従って出力する文書内容情報の形式へのタグの変換処理を行うタグ変換処理手段を有し、前記整形処理手段は、文書出力時には前記タグ変換処理手段によって変換処理されたタグの情報を前記テンプレートとして利用して出力文書を生成することを特徴とする請求項1に記載の文書処理装置。
- 前記目次あるいは文書内容情報に埋め込むリンクに、前記テンプレートを指定するための情報、前記加工定義情報を指定するための情報のいずれかあるいは両方を含めることを特徴とする請求項1または請求項2に記載の文書処理装置。
- 前記目次あるいは文書内容情報に埋め込むリンクに、前記テンプレートを指定するための情報、前記加工定義情報を指定するための情報、前記タグ変換情報を指定するための情報のうちの少なくとも1つを含めることを特徴とする請求項2に記載の文書処理装置。
- 前記目次出力時には、目次項目に対応する文書内容情報を必要に応じて生成して出力するためのリンクとともに、下位あるいは上位の目次を必要に応じて生成して出力するためのリンクを埋め込んだ目次を生成することを特徴とする請求項1ないし請求項4のいずれか1項に記載の文書処理装置。
- 前記目次出力時には、前記文書の内容が変更されているとき、目次の当該文書内容情報に対応する項目に内容が変更されている旨を示す情報を付加することを特徴とする請求項1ないし請求項5のいずれか1項に記載の文書処理装置。
- 前記目次出力時には、前記文書の内容が変更されている旨を示す情報を付加する章あるいは節などの項目単位を変更可能であることを特徴とする請求項6に記載の文書処理装置。
- 前記文脈構造情報生成手段は、前記文書格納手段に格納されている文書全体あるいは部分文書から文書構造を抽出して文脈構造情報を生成することを特徴とする請求項1ないし請求項7のいずれか1項に記載の文書処理装置。
- 前記整形処理手段は、前記テンプレートから、文字列置き換え処理を行うための変数記号を抽出し、抽出した変数記号に代えて置き換えるべき文字列を前記加工処理手段で加工された前記文脈構造情報あるいは内容情報の中から選択し、前記変数記号以外はそのまま出力し、また前記変数記号は前記加工処理手段で加工された前記文脈構造情報あるいは内容情報中の文字列への置き換えを行って出力し、出力文書を生成することを特徴とする請求項1ないし請求項8のいずれか1項に記載の文書処理装置。
- 前記整形処理手段は、前記テンプレートから、処理を複数回実行するための繰り返し開始記号及び繰り返し終了記号を抽出し、前記加工処理手段で加工された前記文脈構造情報あるいは内容情報に含まれている置き換え対象の文字列の個数に従って繰り返し回数を決定し、決定した回数だけ繰り返して出力文書を生成することを特徴とする請求項1ないし請求項9のいずれか1項に記載の文書処理装置。
- 前記整形処理手段は、前記文脈構造情報あるいは前記内容情報が階層構造を有する文書から生成されたものであって、前記繰り返し開始記号と前記繰り返し終了記号の間に異なる階層に属する複数種類の変数記号が含まれている場合に、前記複数種類の変数記号の中で最も下位の層に属する変数記号に従って繰り返しの回数を決定することを特徴とする請求項10に記載の文書処理装置。
- 前記整形処理手段は、前記文脈構造情報あるいは前記内容情報が階層構造を有する文書から生成されたものであって、前記繰り返し開始記号と前記繰り返し終了記号の間に1つ以上の前記繰り返し開始記号と前記繰り返し終了記号がある場合に、内側にある前記繰り返し開始記号と前記繰り返し終了記号の繰り返し回数を決定する変数記号として、1つ外側の前記繰り返し開始記号と前記繰り返し終了記号の繰り返し回数を決定する変数記号よりも下位の層に属する変数記号を用いることを特徴とする請求項11に記載の文書処理装置。
- 前記整形処理手段は、前記文脈構造情報あるいは前記内容情報が階層構造を有する文書から生成されたものであって、かつ、階層構造とは無関係な大域変数が含まれている場合に、前記テンプレートから抽出した前記大域変数に対応する変数記号を前記テンプレート中の位置によらず同じ文字列で置き換えて出力し、出力文書を生成することを特徴とする請求項1ないし請求項12のいずれか1項に記載の文書処理装置。
- 前記整形処理手段は、前記文脈構造情報あるいは前記内容情報が階層構造を有する文書から生成されたものであって、前記テンプレートから抽出した変数記号が前記文脈構造情報あるいは内容情報中の同じ種類の変数の中での位置を指定する位置指定変数記号である場合に、変数記号を指定された位置の文字列に置き換えて出力し、出力文書を生成することを特徴とする請求項1ないし請求項13のいずれか1項に記載の文書処理装置。
- 前記位置指定変数記号は、同じ種類の変数の中で現在位置の1つ前あるいは1つ後ろ、あるいは、先頭あるいは末尾を位置として指定可能であることを特徴とする請求項14に記載の文書処理装置。
- 前記整形処理手段は、前記テンプレートから、整形処理の手順を指定する指示記号を抽出し、抽出した前記指示記号の内容に従って処理の手順を切り替えることを特徴とする請求項1ないし請求項15のいずれか1項に記載の文書処理装置。
- 前記指示記号は、前記文脈構造情報あるいは前記内容情報の有している階層構造に関する情報の無効を指定するものであることを特徴とする請求項16に記載の文書処理装置。
- 前記指示記号は、前記文脈構造情報あるいは前記内容情報の指定した位置より下位の層にある情報の使用を指定するものであることを特徴とする請求項16または請求項17に記載の文書処理装置。
- 前記指示記号は、前記文脈構造情報あるいは前記内容情報の選択的な使用を指定するものであることを特徴とする請求項16ないし請求項18のいずれか1項に記載の文書処理装置。
- 前記文脈構造情報生成手段は、前記文書格納手段に格納されている文書から文書構造を抽出する際に目次となる見出しの読み仮名情報も抽出して文脈構造情報を生成するものであり、前記文脈構造情報生成手段で生成した前記文脈構造情報に対して前記加工処理手段による加工及び前記整形処理手段によるテンプレート中の前記文脈構造情報あるいは前記内容情報の選択的な使用を指定する前記指示記号の適用により前記読み仮名情報に基づいて索引を生成して出力可能であることを特徴とする請求項19に記載の文書処理装置。
- 前記加工定義情報は、前記文脈構造情報あるいは前記内容情報が1個以上の文字列情報を有し、前記文字列情報を他の文字列情報と連結した結果が加工結果となるように定義したものであることを特徴とする請求項1ないし請求項20のいずれか1項に記載の文書処理装置。
- 前記加工定義情報は、前記文脈構造情報あるいは前記内容情報が1個以上の演算可能な数値情報を有し、前記数値情報を使って演算を行った結果が加工結果となるように定義したものであることを特徴とする請求項1ないし請求項21のいずれか1項に記載の文書処理装置。
- 前記加工定義情報は、前記文脈構造情報あるいは前記内容情報が1個以上の文字列情報あるいは演算可能な数値情報の一方あるいは両方を有し、前記文字列情報あるいは前記数値情報を所定の規範で判定した結果が加工結果となるように定義したものであることを特徴とする請求項1ないし請求項20のいずれか1項に記載の文書処理装置。
- 指示に従って予め格納されている文書から文書構造を抽出して文脈構造情報を生成し、前記文脈構造情報に対して目次を生成するための加工定義情報を用いて加工を施し、目次の出力形式を表す目次用のテンプレートを用いて加工された前記文脈構造情報から目次項目に対応する文書内容情報を必要に応じて生成して出力するためのリンクを埋め込んだ目次を生成して出力し、また指示に従って前記文書あるいは該文書から指示されている部分を解析して内容情報を生成し、前記内容情報に対して加工定義情報を用いて加工を施し、文書の出力形式を表す文書用のテンプレートを用いて加工された前記内容情報から目次を必要に応じて生成して出力するためのリンクを埋め込んだ文書内容情報を生成して出力し、目次の出力時には目次中のリンクの指示に従って指示された前記文書内容情報の出力を行い、また文書内容情報の出力時には文書内容情報中に埋め込まれたリンクの指示に従って前記目次の出力を行うことを特徴とする文書処理方法。
- 前記文書はタグを用いたマークアップ言語により作成されており、前記文書内容情報を生成する際に、タグ変換情報に従って出力する文書の形式へのタグの変換処理を行い、変換処理されたタグの情報を前記文書用のテンプレートとして利用して文書内容情報を生成することを特徴とする請求項24に記載の文書処理方法。
- 前記目次あるいは文書内容情報に埋め込むリンクに、前記テンプレートを指定するための情報、前記加工定義情報を指定するための情報のいずれかあるいは両方を含めることを特徴とする請求項24または請求項25に記載の文書処理方法。
- 前記目次あるいは文書内容情報に埋め込むリンクに、前記テンプレートを指定するための情報、前記加工定義情報を指定するための情報、前記タグ変換情報を指定するための情報のうちの少なくとも1つを含めることを特徴とする請求項25に記載の文書処理方法。
- 前記目次の生成の際に、文書内容情報を必要に応じて生成して出力するためのリンクとともに、下位あるいは上位の目次の表示を指示するためのリンクを埋め込んだ目次を生成することを特徴とする請求項24ないし請求項27のいずれか1項に記載の文書処理方法。
- 前記目次の生成の際に、前記文書の内容が変更されているとき、目次の当該文書内容情報に対応する項目に内容が変更されている旨を示す情報を付加することを特徴とする請求項24ないし請求項28のいずれか1項に記載の文書処理方法。
- 前記目次の生成の際に、前記文書の内容が変更されている旨を示す情報を付加する章あるいは節などの項目単位を変更可能であることを特徴とする請求項29に記載の文書処理方法。
- 文書から文書構造を抽出して文脈構造情報を生成する際には、予め格納されている文書全体あるいは部分文書を文書構造の抽出対象とすることを特徴とする請求項24ないし請求項30のいずれか1項に記載の文書処理方法。
- 前記テンプレートを用いて前記目次あるいは前記文書内容情報を生成する処理として、前記テンプレートから、文字列置き換え処理を行うための変数記号を抽出し、抽出した変数記号に代えて置き換えるべき文字列を前記加工定義情報を用いて加工された前記文脈構造情報あるいは前記内容情報の中から選択し、前記変数記号以外はそのまま出力し、また前記変数記号は前記加工定義情報を用いて加工された前記文脈構造情報あるいは前記内容情報中の文字列への置き換えを行って出力することを特徴とする請求項24ないし請求項31のいずれか1項に記載の文書処理方法。
- 前記テンプレートを用いて前記目次あるいは前記文書内容情報を生成する処理として、前記テンプレートから、処理を複数回実行するための繰り返し開始記号及び繰り返し終了記号を抽出し、前記加工定義情報を用いて加工された前記文脈構造情報あるいは内容情報に含まれている置き換え対象の文字列の個数に従って繰り返し回数を決定し、決定した回数だけ繰り返して出力することを特徴とする請求項24ないし請求項32のいずれか1項に記載の文書処理方法。
- 前記文脈構造情報あるいは前記内容情報が階層構造を有する文書から生成されたものであって、前記繰り返し開始記号と前記繰り返し終了記号の間に異なる階層に属する複数種類の変数記号が含まれている場合に、前記複数種類の変数記号の中で最も下位の層に属する変数記号に従って繰り返しの回数を決定することを特徴とする請求項33に記載の文書処理方法。
- 前記文脈構造情報あるいは前記内容情報が階層構造を有する文書から生成されたものであって、前記繰り返し開始記号と前記繰り返し終了記号の間に1つ以上の前記繰り返し開始記号と前記繰り返し終了記号がある場合に、内側にある前記繰り返し開始記号と前記繰り返し終了記号の繰り返し回数を決定する変数記号として、1つ外側の前記繰り返し開始記号と前記繰り返し終了記号の繰り返し回数を決定する変数記号よりも下位の層に属する変数記号を用いることを特徴とする請求項34に記載の文書処理方法。
- 前記テンプレートを用いて前記目次あるいは前記文書内容情報を生成する処理として、前記文脈構造情報あるいは前記内容情報が階層構造を有する文書から生成されたものであって、かつ、階層構造とは無関係な大域変数が含まれている場合に、前記テンプレートから抽出した前記大域変数に対応する変数記号を前記テンプレート中の位置によらず同じ文字列で置き換えて出力することを特徴とする請求項24ないし請求項35のいずれか1項に記載の文書処理方法。
- 前記テンプレートを用いて前記目次あるいは前記文書内容情報を生成する処理として、前記文脈構造情報あるいは前記内容情報が階層構造を有する文書から生成されたものであって、前記テンプレートから抽出した変数記号が前記文脈構造情報あるいは内容情報中の同じ種類の変数の中での位置を指定する位置指定変数記号である場合に、変数記号を指定された位置の文字列に置き換えて出力することを特徴とする請求項24ないし請求項36のいずれか1項に記載の文書処理方法。
- 前記位置指定変数記号は、同じ種類の変数の中で現在位置の1つ前あるいは1つ後ろ、あるいは、先頭あるいは末尾を位置として指定可能であることを特徴とする請求項37に記載の文書処理方法。
- 前記テンプレートを用いて前記目次あるいは前記文書内容情報を生成する処理として、前記テンプレートから、整形処理の手順を指定する指示記号を抽出し、抽出した前記指示記号の内容に従って処理の手順を切り替えることを特徴とする請求項24ないし請求項38のいずれか1項に記載の文書処理方法。
- 前記指示記号は、前記文脈構造情報あるいは前記内容情報の有している階層構造に関する情報の無効を指定するものであることを特徴とする請求項39に記載の文書処理方法。
- 前記指示記号は、前記文脈構造情報あるいは前記内容情報の指定した位置より下位の層にある情報の使用を指定するものであることを特徴とする請求項39または請求項40に記載の文書処理方法。
- 前記指示記号は、前記文脈構造情報あるいは前記内容情報の選択的な使用を指定するものであることを特徴とする請求項39ないし請求項41のいずれか1項に記載の文書処理方法。
- さらに、前記文書から文書構造を抽出する際に目次となる見出しの読み仮名情報も抽出して前記文脈構造情報を生成し、前記文脈構造情報に対して前記加工定義情報を用いた加工、及び、前記テンプレート中の前記文脈構造情報あるいは前記内容情報の選択的な使用を指定する前記指示記号の適用によって、前記読み仮名情報に基づいて索引を生成して出力可能であることを特徴とする請求項42に記載の文書処理方法。
- 前記加工定義情報は、前記文脈構造情報あるいは前記内容情報が1個以上の文字列情報を有し、前記文字列情報を他の文字列情報と連結した結果が加工結果となるように定義したものであることを特徴とする請求項24ないし請求項43のいずれか1項に記載の文書処理方法。
- 前記加工定義情報は、前記文脈構造情報あるいは前記内容情報が1個以上の演算可能な数値情報を有し、前記数値情報を使って演算を行った結果が加工結果となるように定義したものであることを特徴とする請求項24ないし請求項44のいずれか1項に記載の文書処理方法。
- 前記加工定義情報は、前記文脈構造情報あるいは前記内容情報が1個以上の文字列情報あるいは演算可能な数値情報の一方あるいは両方を有し、前記文字列情報あるいは前記数値情報を所定の規範で判定した結果が加工結果となるように定義したものであることを特徴とする請求項24ないし請求項43のいずれか1項に記載の文書処理方法。
- 文書の作成や参照を支援する文書処理をコンピュータに実現させる文書処理プログラムであって、指示に従って予め格納されている文書から文書構造を抽出して文脈構造情報を生成する文脈構造情報生成機能と、前記文脈構造情報に対して目次を生成するための加工定義情報を用いて加工を施す加工処理機能と、目次の出力形式を表す目次用のテンプレートを用いて加工された前記文脈構造情報から目次項目に対応する文書内容情報を必要に応じて生成して出力するためのリンクを埋め込んだ目次を生成して出力する機能と、指示に従って前記文書あるいは該文書から指示されている部分を解析して内容情報を生成する機能と、前記内容情報に対して加工定義情報を用いて加工を施す機能と、文書の出力形式を表す文書用のテンプレートを用いて加工された前記内容情報から目次を必要に応じて生成して出力するためのリンクを埋め込んだ文書内容情報を生成して出力する機能と、目次の出力時には目次中のリンクの指示に従って指示された前記文書内容情報を出力する機能と、前記文書内容情報の出力時には文書内容情報中に埋め込まれたリンクの指示に従って前記目次の出力を行う機能をコンピュータに実現させることを特徴とする文書処理プログラム。
- 前記目次を生成する機能において、前記文書の内容が変更されているとき、目次の当該文書内容情報に対応する項目に内容が変更されている旨を示す情報を付加することを特徴とする請求項47に記載の文書処理プログラム。
- 前記目次を生成する機能において、前記文書の内容が変更されている旨を示す情報を付加する章あるいは節などの項目単位を変更可能であることを特徴とする請求項48に記載の文書処理プログラム。
- 前記テンプレートを用いて前記目次あるいは前記文書内容情報を生成する機能において、前記テンプレートから、処理を複数回実行するための繰り返し開始記号及び繰り返し終了記号を抽出し、前記加工定義情報を用いて加工された前記文脈構造情報あるいは内容情報に含まれている置き換え対象の文字列の個数に従って繰り返し回数を決定し、決定した回数だけ繰り返して出力することを特徴とする請求項47ないし請求項49のいずれか1項に記載の文書処理プログラム。
- 前記文脈構造情報あるいは前記内容情報が階層構造を有する文書から生成されたものであって、前記繰り返し開始記号と前記繰り返し終了記号の間に異なる階層に属する複数種類の変数記号が含まれている場合に、前記複数種類の変数記号の中で最も下位の層に属する変数記号に従って繰り返しの回数を決定することを特徴とする請求項50に記載の文書処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003079123A JP2004086855A (ja) | 2002-06-28 | 2003-03-20 | 文書処理装置及び文書処理方法、文書処理プログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002190398 | 2002-06-28 | ||
JP2003079123A JP2004086855A (ja) | 2002-06-28 | 2003-03-20 | 文書処理装置及び文書処理方法、文書処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004086855A true JP2004086855A (ja) | 2004-03-18 |
Family
ID=32071821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003079123A Pending JP2004086855A (ja) | 2002-06-28 | 2003-03-20 | 文書処理装置及び文書処理方法、文書処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004086855A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006046523A1 (ja) * | 2004-10-25 | 2006-05-04 | Nec Corporation | 文書解析システム、及び文書適応システム |
KR100890966B1 (ko) * | 2005-12-07 | 2009-03-27 | 후지제롯쿠스 가부시끼가이샤 | 문서 처리 방법, 기록 매체 및 시스템 |
US7698288B2 (en) | 2004-11-05 | 2010-04-13 | Fuji Xerox Co., Ltd. | Storage medium storing directory editing support program, directory editing support method, and directory editing support apparatus |
JP2014029701A (ja) * | 2007-03-30 | 2014-02-13 | Google Inc | モバイル装置のための文書処理 |
JP2023036180A (ja) * | 2021-09-02 | 2023-03-14 | 株式会社出版文化社 | 年史制作方法、プログラム、年史制作装置および年史制作システム |
-
2003
- 2003-03-20 JP JP2003079123A patent/JP2004086855A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006046523A1 (ja) * | 2004-10-25 | 2006-05-04 | Nec Corporation | 文書解析システム、及び文書適応システム |
US8051371B2 (en) | 2004-10-25 | 2011-11-01 | Nec Corporation | Document analysis system and document adaptation system |
US7698288B2 (en) | 2004-11-05 | 2010-04-13 | Fuji Xerox Co., Ltd. | Storage medium storing directory editing support program, directory editing support method, and directory editing support apparatus |
KR100890966B1 (ko) * | 2005-12-07 | 2009-03-27 | 후지제롯쿠스 가부시끼가이샤 | 문서 처리 방법, 기록 매체 및 시스템 |
US7912846B2 (en) | 2005-12-07 | 2011-03-22 | Fuji Xerox Co., Ltd. | Document processing method, recording medium, and document processing system |
JP2014029701A (ja) * | 2007-03-30 | 2014-02-13 | Google Inc | モバイル装置のための文書処理 |
JP2023036180A (ja) * | 2021-09-02 | 2023-03-14 | 株式会社出版文化社 | 年史制作方法、プログラム、年史制作装置および年史制作システム |
JP7437046B2 (ja) | 2021-09-02 | 2024-02-22 | 株式会社出版文化社 | 年史制作方法、プログラム、年史制作装置および年史制作システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20030037076A1 (en) | Method, computer program and system for style sheet generation | |
JP4775974B2 (ja) | ウェブページを編集するプログラム、装置、及びシステム | |
US20030007014A1 (en) | User interface system for composing an image page layout | |
CN102662921B (zh) | 一种文档处理方法、装置和编辑器 | |
JP2008097215A (ja) | データ処理装置 | |
JPWO2007052680A1 (ja) | 文書処理装置及び文書処理方法 | |
JP2010282327A (ja) | フォーマット変換システムおよびフォーマット変換方法並びにプログラム | |
JP2004086855A (ja) | 文書処理装置及び文書処理方法、文書処理プログラム | |
JP2002215519A (ja) | ウェブページ生成方法およびシステム、ウェブページ生成プログラム、記録媒体 | |
JP3531579B2 (ja) | マルチメディア文書生成装置及び方法、及びこれらをコンピュータに実行させるプログラムを記録した記録媒体 | |
JP4566196B2 (ja) | 文書処理方法および装置 | |
EP1830274A1 (en) | Server device and name space issuing method | |
JP2007183849A (ja) | 文書処理装置 | |
JP4627530B2 (ja) | 文書処理方法および装置 | |
JP2002189740A (ja) | データ変換システム | |
JPWO2006051974A1 (ja) | 文書処理装置および文書処理方法 | |
JP2003150377A (ja) | 画面出力モジュール開発システム、画面出力モジュール開発方法及びプログラム並びに記録媒体 | |
US20040267550A1 (en) | Automated method for authoring and delivering product catalogs | |
EP1744271A1 (en) | Document processing device | |
JP2009223882A (ja) | データ処理装置及びデータ処理方法 | |
JP2002229973A (ja) | ウェブサイト作成支援システムおよびその方法 | |
JP2009059110A (ja) | 情報処理装置およびプログラム | |
US20090083620A1 (en) | Document processing device and document processing method | |
EP1816572A1 (en) | Time sharing managing device, document creating device, document reading device, time sharing managing method, document creating method, and document reading method | |
KR20030069629A (ko) | 웹문서 저작시스템 및 저작방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080521 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080718 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081008 |