JP3935296B2 - 文書型定義生成方法及びその装置、及びそのプログラムを記憶した記憶媒体 - Google Patents

文書型定義生成方法及びその装置、及びそのプログラムを記憶した記憶媒体 Download PDF

Info

Publication number
JP3935296B2
JP3935296B2 JP33432399A JP33432399A JP3935296B2 JP 3935296 B2 JP3935296 B2 JP 3935296B2 JP 33432399 A JP33432399 A JP 33432399A JP 33432399 A JP33432399 A JP 33432399A JP 3935296 B2 JP3935296 B2 JP 3935296B2
Authority
JP
Japan
Prior art keywords
document
type definition
physical structure
document type
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP33432399A
Other languages
English (en)
Other versions
JP2000222438A (ja
JP2000222438A5 (ja
Inventor
貴史 水野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP33432399A priority Critical patent/JP3935296B2/ja
Publication of JP2000222438A publication Critical patent/JP2000222438A/ja
Publication of JP2000222438A5 publication Critical patent/JP2000222438A5/ja
Application granted granted Critical
Publication of JP3935296B2 publication Critical patent/JP3935296B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、パーソナルコンピュータやワードプロセッサ等で実行される電子化文書の処理に関し、特に構造化文書の文書型定義を生成する方法及びその装置、及びそのプログラムを記憶した記憶媒体に関するものである。
【0002】
【従来の技術】
近年、パーソナルコンピュータやワードプロセッサ等で作成された電子化された文書が広く用いられている。このような電子化文書を統一的に扱え、文書を構成する各要素に意味情報を付与した構造化文書の導入が進められている。この構造化文書は、各文書要素が要素名(タグ名)を含むタグで前後が挟まれており、文書のタイプ毎に、要素が出現する場所、順序、回数などを定義した文書型定義(DTD)に従って記述することが多い。
【0003】
【発明が解決しようとする課題】
一方、文書型定義を予め用意しておかなくても、構造化文書を記述することはできる。しかしながら、例えば、複数のユーザが作成した文書を統合して1つの文書を作成するような場合、ユーザ各々が勝手な名称のタグを使ってしまうと、同一の要素に異なるタグ名を付与したり、逆に異なる要素に同一のタグ名を付与したりしてしまう可能性がある。
【0004】
そのような場合、タグに付与された意味情報を正しく扱うことができなくなったり、タグに対する冗長性が生じたりしてしまうという問題がある。
【0005】
本発明は上述した課題を解決するためになされたものであり、タグ付の構造化文書から、文書型定義を生成する方法及びその装置、及びそのプログラムを記憶した記憶媒体を提供することを目的とする。
【0006】
また、本発明は、タグに与えられた意味情報を正しく扱うことができる文書型定義を生成する方法及びその装置、及びそのプログラムを記憶した記憶媒体を提供することを目的とする。
【0007】
また、本発明は、タグに対する冗長性を排除した文書型定義を生成することが可能な文書型定義を生成する方法及びその装置、及びそのプログラムを記憶した記憶媒体を提供することを目的とする。
【0008】
【課題を解決するための手段】
上述した目的を達成するための本発明の一態様による文書型定義生成方法は、各文書要素に要素名を持つタグが付与されている構造化文書に対する文書型定義生成装置の制御方法であって、前記文書型定義生成装置が有する物理的構造判断手段が、前記各文書要素の物理的構造を判断する物理的構造判断ステップと、前記文書型定義生成装置が有する意味的構造判断手段が、前記各文書要素の意味的構造を判断する意味的構造判断ステップと、前記文書型定義生成装置が有する文書型定義生成手段が、前記物理的構造判断ステップと前記意味的構造判断ステップとの判断結果に基づいて、前記構造化文書における文書要素の出現状態を定義する文書型定義を生成する文書型定義生成ステップとを有し、前記文書型定義生成ステップでは、要素名の異なるタグを持つ複数の文書要素の物理的構造と意味的構造とが類似する場合に、それらの文書要素を同一タイプと見なして一方の要素名を文書型定義の生成対象から除外することを特徴とする。
【0009】
上述した目的を達成するための本発明の一態様による文書型定義生成方法は、各文書要素に要素名を持つタグが付与されている構造化文書に対する文書型定義生成装置の制御方法であって、前記文書型定義生成装置が有する物理的構造判断手段が、前記各文書要素の物理的構造を判断する物理的構造判断ステップと、前記文書型定義生成装置が有する意味的構造判断手段が、前記各文書要素の意味的構造を判断する意味的構造判断ステップと、前記文書型定義生成装置が有する文書型定義生成手段が、前記物理的構造判断ステップと前記意味的構造判断ステップとの判断結果に基づいて、前記構造化文書における文書要素の出現状態を定義する文書型定義を生成する文書型定義生成ステップとを有し、前記文書型定義生成ステップでは、要素名が同一のタグを持つ複数の文書要素の物理的構造と意味的構造とが異なる場合に、それらの文書要素を異なるタイプと見なして一方の要素名を変更することを特徴とする。
【0011】
【発明の実施の形態】
以下、添付図面を参照しながら、本発明に係る好適な一実施例を詳細に説明する。
【0012】
<第1の実施の形態>
図1は、本実施形態に係る文書型定義生成装置のブロック構成を示す図である。
【0013】
同図において、入力部101は、キーボードやポインティング装置などで構成され、ユーザがデータやコマンドを入力するために用いられる。外部記憶部102はハードディスクなどを媒体とする記憶装置で構成され、処理対象となる構造化文書データや後述する意味情報DB(データベース)のデータ、生成された文書型定義などを記憶するものである。表示部103はCRTや液晶表示器などで構成され、構造化文書データや生成された文書型定義などを表示するものである。
【0014】
CPU104は、装置各部の制御を司り、プログラムを読み出して実行し、各種処理を実現する。ROM105は、固定的なデータやプログラムを記憶する。図2―6のフローチャートを参照して後述する処理手順を実現するための制御プログラムは、ROM105に格納されていてもよいし、外部記憶部102から読み出すようにしてもよい。RAM106は、本装置の処理に必要な作業領域を提供する。バス107は、装置各部を接続する。
【0015】
図2は、本実施形態に係る文書型定義生成処理の手順を示すフローチャートである。
【0016】
まず、ステップS201において構造化文書の入力が行われる。これは、外部記憶部102から構造化文書を読み出すことで実行される。ここで与える構造化文書の一例を図3に示す。
【0017】
例えば、図3の(a)の第1行の“<Title>”がスタートタグ、“</Title>”がエンドタグであり、これらのタグで挟まれた“テレビの使用説明書”がタグの内容となる文書要素である。また、“Title”が要素名(タグ名)である。更に、タグ内に要素の属性とその値とを記述することもできる。
【0018】
図3の(a) は、他人の作成した文書に8行目の(<Sect>4.音量を調整する</Sect>)を追加したものであり、図3の(b)は、複数人がそれぞれ作成した章(<Chap>から</Chap>まで)を1つの文書に統合したものである。このため、同一種の要素に対して、異なるタグ名(SectとSection)が付されてしまっている。
【0019】
図2に戻り、次のステップS202において、この構造化文書の中から各タグの位置が検出され、例えば、図3の(a) では、先頭の“<Title>”から順番にタグ番号が振られる。
【0020】
続いて、ステップS203において、上記文書における物理的構造の検出が行われる。例えば、図3の(c)において、段落を表すタグ“<Para>”において模式的に表現されているように、字下げで始まる文章群を段落と見なすという特徴の検出を行う。このような物理的構造を検出するための処理手順を図4のフローチャートに示す。
【0021】
まず、ステップS401で文書中の字下げが行われている行を見つけ出し、次のステップS402でその行に続く文章群を検出する。このときに字下げが行われている行から次の字下げが行われている行、あるいは空白行の直前の行までを文章群とすることができる。このとき、字下げを行うことによって引用を表す引用中に行われている字下げ(2重の字下げ)や、一行あるいはそれ以上に行を常に飛ばして記述されている場合の空白行は、ステップS402において、文書全体のパターンから、それらは物理的構造検出にとって無意味な構造として除外して処理を行う。
【0022】
図2に戻り、次のステップS204では、入力された構造化文書が持つ意味的構造を検出する。一例として、上記の図3の(a)において、“<Section>”タグの内容は、先頭に「1.」,「2.」,「3.」を付した形式をしている。ここで意味的に、“<Section>”タグの内容は、「数字.」を先頭とすると推察できる。この意味的構造を検出する処理手順の一例を図5のフローチャートに示す。
【0023】
まず、ステップS501において、文書中の全ての単語、記号について意味情報DB(データベース)51と通信をして、文書中の語間の繋がりや単語・記号の種類を与える。この結果を元に、次のステップS502において、各文書要素において見られる意味的な構造を検出する。
【0024】
図2に戻り、次のステップS205において、処理すべきタグを最初に出現したタグとし、ステップS206でタグの処理が全て終了したか否かを判断する。
【0025】
タグの処理が全て終了していない場合は、ステップS207に移行して、現在処理対象としているタグと、上記ステップS203―204において検出された物理的構造・意味的構造の情報との統合を行う。ここで、統合とは、現在、処理対象としているタグに関わる行に、物理的・意味的な特徴が存在するならば、タグとその情報とを結びつけることを言う。続いてステップS208で、次に出現したタグに処理を移し、上記ステップS206に戻る。
【0026】
一方、ステップS206においてタグの処理が全て終了したと判断した場合は、ステップS209に移行し、異なった名称のタグの間において類似度を求め、その類似度が予め設定したあるしきい値以上の場合にはそれらタグは互いに同一のタグと見なして、一方のタグを、生成する文書型定義に出現しないようにする。この類似度を求めて同じ内容を持つタグであるか否かを判定する処理手順を図6のフローチャートに示す。
【0027】
まず、ステップS601では、異なる名称をもつタグA,Bの類似度を算出する。この算出方法は、物理的構造が一致する場合は物理的構造の類似度を1とし、物理的構造が完全には一致しないが一部は一致する場合は、物理的構造の類似度をその一致した割合に対応する1未満の値にする。意味的構造についても同様の考えをあてはめて意味的構造の類似度を求め、物理的構造の類似度と意味的構造の類似度の和を2で割ったものを、AとBの総合的な類似度dABとする。
【0028】
次のステップS602では、ステップS601で求められた上記の類似度dABと予め与えられたしきい値δとの比較を行う。その類似度dABがδ未満のときは、ステップS604に飛んで、次の組み合せを試みる。
【0029】
その類似度dABがしきい値δ以上のときは、ステップS603に移行して、タグBはタグAと同一タイプと見なし、タグBを最終的に文書型定義を生成するリストから削除し、冗長性の排除を行う。
【0030】
ステップS603の処理が終了したらステップS604へ進み、全てのタグの組み合わせを試したか否かを判断し、全てのタグの組み合わせを試していない場合はステップS601に戻り、全てのタグの組み合わせを試した場合は本サブルーチンの処理を終了して図2のメインルーチンに戻る。
【0031】
また、ステップS209では、図6につき上述した処理に加え、同一名称を持つ文書要素の物理的構造、意味的構造を比較し、構造が異なっている場合、一方のタグの名称変更も行う。そのために、同一のタグ名を持つタグAa,Ab間で上記と同様に類似度を求めて、その類似度の値dAaAbがしきい値未満のときは、タグAbの名称の変更を行う。このしきい値は、上述のものと異なってもよい。
【0032】
図2のステップS210では、同一名称の開始タグと終了タグとの間の文の語句についての解析を行い、タグ中に含まれるべき情報を得る。この解析結果を用いて、次のステップS211において、文書型定義の生成を行う。
【0033】
図7は、生成された文書型定義の例を示す図である。図3の(a)に示した構造化文書データから生成された文書型定義を図7の(a)にmanualという文書型として示している。また、図3の(b)に示した構造化文書データから生成された文書型定義を図7の(b)にspecificationという文書型として示している。
【0034】
ここで、図3の(a)において、<Sect>タグの内容は、<Section>タグの内容と物理的構造が一致しており、かつ「数字.」の形式を持つ点で意味的構造も同一である。このため、ステップS209において、<Sect>タグは、<Section>タグと同じ内容を持つと判定されている。その結果、生成される文書型定義では、<Sect>は用いず、<Body>は、Section+すなわち<Section>タグの出現の繰り返しとなっている。
【0035】
また、図3の(b)においても、<Sect>タグは、「数字―数字.」の形式を持ち、<Section>タグと同じ内容を持つと判定され、図7の(b)では、<Chap>は、<Title>に続けて<Section>の繰り返しとされている。
【0036】
<第2の実施の形態>
上述した第1の実施形態においては、文書中の物理的構造、意味的構造の判断を本文(タグ以外の部分)に基づいて行なってきたが、本発明はそれに限らない。
【0037】
例えば、タグ同士の相対的な位置関係やタグの包含関係についての物理的な情報を物理的構造として検出したり、タグ名や属性が表わす意味を意味的構造として検出したりして、これらの構造を対象として類似度を求めるようにしてもよい。
【0038】
これによれば、例えば、図3の(b)では、<Sect>と<Section>は、共に<Chap>に含まれ、<Title>の次に現れる点で類似していると判定したり、タグ名であるSectとSectionはどちらもSectionの意味を表わすと考えられる点で類似していると判断することも可能となる。
【0039】
以上説明した実施形態によれば、タグで囲まれた文書要素の物理的構造や意味的構造を判断して、タグの付与された構造化文書の文書型定義を生成するようにしているので、タグに与えられた意味情報を正しく扱うことが可能となる。
【0040】
更に、同一内容を持つタグに対する冗長性を排除でき、同一名称で異なる意味のタグが存在することのない文書型定義を生成することが可能となる。
【0041】
なお、本発明は、複数の機器(例えば、ホストコンピュータ、インターフェース機器、リーダ、プリンタなど)から構成されるコンピュータシステムに適用しても、1つの機器からなる装置(例えば、ワードプロセッサ、複写機、ファクシミリ装置など)に適用してもよい。
【0042】
また、本発明の目的は、前述した実施の形態の機能を実現するソフトウエアのプログラムコードを記憶した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し、実行することによっても、達成されることは言うまでもない。
【0043】
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコードを記録した記憶媒体は本発明を構成することになる。
【0044】
そのプログラムコードを記憶し、またテーブル等の変数データを記憶する記憶媒体としては、例えばフロッピディスク(FD)、ハードディスク、光ディスク、光磁気ディスク、CD―ROM、CD―R、磁気テープ、不揮発性のメモリカード(ICメモリカード)、ROMなどを用いことができる。
【0045】
また、コンピュータが読み出したプログラムコードを実行することにより、前述の実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づいて、コンピュータ上で稼動しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行ない、その処理によって前述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0046】
【発明の効果】
以上説明したように、本発明によれば、各文書要素に要素名を持つタグが付与されている構造化文書において、各文書要素の物理的構造や意味的構造を判断して、構造化文書の文書型定義を生成するようにしているので、各文書要素に与えられた構造を正しく扱った文書型定義を生成することができるという効果がある。
【0047】
更に、同一内容を持つタグに対する冗長性を排除でき、同一名称で異なる意味のタグが存在することのない文書型定義を生成することが可能となる。
【図面の簡単な説明】
【図1】本発明に係る一実施形態の文書処理システムの構成を示すブロック図である。
【図2】操作画面の表示例を表わす図である。
【図3】構造化文書データの一例を示す図である。
【図4】物理的構造解析の処理手順を示すフローチャートである。
【図5】意味的構造解析の処理手順を示すフローチャートである。
【図6】タグの冗長性を排除する処理手順を示すフローチャートである。
【図7】文書型定義の例を示す図である。
【符号の説明】
51 意味情報DB
101 入力部
102 外部記憶部
103 表示部
104 CPU
105 ROM
106 RAM
107 バス

Claims (14)

  1. 各文書要素に要素名を持つタグが付与されている構造化文書に対する文書型定義生成装置の制御方法であって、
    前記文書型定義生成装置が有する物理的構造判断手段が、前記各文書要素の物理的構造を判断する物理的構造判断ステップと、
    前記文書型定義生成装置が有する意味的構造判断手段が、前記各文書要素の意味的構造を判断する意味的構造判断ステップと、
    前記文書型定義生成装置が有する文書型定義生成手段が、前記物理的構造判断ステップと前記意味的構造判断ステップの判断結果に基づいて、前記構造化文書における文書要素の出現状態を定義する文書型定義を生成する文書型定義生成ステップとを有し、
    前記文書型定義生成ステップでは、要素名の異なるタグを持つ複数の文書要素の物理的構造と意味的構造とが類似する場合に、それらの文書要素を同一タイプと見なして一方の要素名を文書型定義の生成対象から除外することを特徴とする文書型定義生成方法。
  2. 前記文書型定義生成ステップでは、要素名の異なるタグを持つ文書要素間において物理的構造と意味的構造のそれぞれの一致度合いについての類似度を求め、それらの類似度から算出した総合的な類似度の値が所定のしきい値以上の場合に、それらの文書要素を同一タイプと見なして一方の要素名を文書型定義の生成対象から除外することを特徴とする請求項1記載の文書型定義生成方法。
  3. 前記物理的構造判断ステップにおいて、字下げまたは空白行に基づいて、文書要素の物理的構造を判断することを特徴とする請求項記載の文書型定義生成方法。
  4. 前記字下げに基づいて、文書要素の物理的構造を判断する際に、引用を表す字下げを除外して判断することを特徴とする請求項3記載の文書型定義生成方法。
  5. 前記空白行に基づいて文書要素の物理的構造を判断する際に、常に所定行ずつ空白行を設けて記述した文書における空白行を除外して判断することを特徴とする請求項3記載の文書型定義生成方法。
  6. 前記物理的構造判断ステップにおいて、文書要素を囲むタグ同士の位置関係に基づいて、文書要素の物理的構造を判断することを特徴とする請求項記載の文書型定義生成方法。
  7. 前記意味的構造判断ステップにおいて、意味情報データベースを参照して文書中の語句の繋がりや単語の種類を基に文書要素の意味的構造を判断することを特徴とする請求項1記載の文書型定義生成方法。
  8. 前記意味的構造判断ステップにおいて、文書要素を囲むタグの表わす意味に基づいて、文書要素の意味的構造を判断することを特徴とする請求項1記載の文書型定義生成方法。
  9. 前記文書型定義生成ステップにおいては、同一名称の開始タグと終了タグとの間に存在する語句を解析して、当該タグ間に含まれるべき情報を得て、該情報に基づいて文書型定義を生成することを特徴とする請求項1記載の文書型定義生成方法。
  10. 各文書要素に要素名を持つタグが付与されている構造化文書に対する文書型定義生成装置の制御方法であって、
    前記文書型定義生成装置が有する物理的構造判断手段が、前記各文書要素の物理的構造を判断する物理的構造判断ステップと、
    前記文書型定義生成装置が有する意味的構造判断手段が、前記各文書要素の意味的構造を判断する意味的構造判断ステップと、
    前記文書型定義生成装置が有する文書型定義生成手段が、前記物理的構造判断ステップと前記意味的構造判断ステップとの判断結果に基づいて、前記構造化文書における文書要素の出現状態を定義する文書型定義を生成する文書型定義生成ステップとを有し、
    前記文書型定義生成ステップでは、要素名が同一のタグを持つ複数の文書要素の物理的構造と意味的構造とが異なる場合に、それらの文書要素を異なるタイプと見なして一方の要素名を変更することを特徴とする文書型定義生成方法。
  11. 各文書要素に要素名を持つタグが付与されている構造化文書に対し、
    前記各文書要素の物理的構造を判断する物理的構造判断手段と、
    前記各文書要素の意味的構造を判断する意味的構造判断手段と、
    前記物理的構造判断手段と前記意味的構造判断手段との判断結果に基づいて、前記構造化文書における文書要素の出現状態を定義する文書型定義を生成する文書型定義生成手段とを有し、
    前記文書型定義生成手段では、要素名の異なるタグを持つ複数の文書要素の物理的構造と意味的構造とが類似する場合に、それらの文書要素を同一タイプと見なして一方の要素名を文書型定義の生成対象から除外することを特徴とする文書型定義生成装置。
  12. 各文書要素に要素名を持つタグが付与されている構造化文書に対し、
    前記各文書要素の物理的構造を判断する物理的構造判断手段と、
    前記各文書要素の意味的構造を判断する意味的構造判断手段と、
    前記物理的構造判断手段と前記意味的構造判断手段との判断結果に基づいて、前記構造化文書における文書要素の出現状態を定義する文書型定義を生成する文書型定義生成手段とを有し、
    前記文書型定義生成手段では、要素名が同一のタグを持つ複数の文書要素の物理的構造と意味的構造とが異なる場合に、それらの文書要素を異なるタイプと見なして一方の要素名を変更することを特徴とする文書型定義生成装置。
  13. 各文書要素に要素名を持つタグが付与されている構造化文書に対し、
    前記各文書要素の物理的構造を判断する物理的構造判断手順と、
    前記各文書要素の意味的構造を判断する意味的構造判断手順と、
    前記物理的構造判断手順と前記意味的構造判断手順との判断結果に基づいて、前記構造化文書における文書要素の出現状態を定義する文書型定義を生成する文書型定義生成手順とをコンピュータに実行させるためのプログラムを記憶しているコンピュータ読み取り可能な記憶媒体であって、
    前記文書型定義生成手順では、要素名の異なるタグを持つ複数の文書要素の物理的構造と意味的構造とが類似する場合に、それらの文書要素を同一タイプと見なして一方の要素名を文書型定義の生成対象から除外することを特徴とするコンピュータ読み取り可能な記憶媒体。
  14. 各文書要素に要素名を持つタグが付与されている構造化文書に対し、
    前記各文書要素の物理的構造を判断する物理的構造判断手順と、
    前記各文書要素の意味的構造を判断する意味的構造判断手順と、
    前記物理的構造判断手順と前記意味的構造判断手順との判断結果に基づいて、前記構造化文書における文書要素の出現状態を定義する文書型定義を生成する文書型定義生成手順とをコンピュータに実行させるためのプログラムを記憶しているコンピュータ読み取り可能な記憶媒体であって、
    前記文書型定義生成手順では、要素名が同一のタグを持つ複数の文書要素の物理的構造と意味的構造とが異なる場合に、それらの文書要素を異なるタイプと見なして一方の要素名を変更することを特徴とするコンピュータ読み取り可能な記憶媒体。
JP33432399A 1998-11-26 1999-11-25 文書型定義生成方法及びその装置、及びそのプログラムを記憶した記憶媒体 Expired - Fee Related JP3935296B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33432399A JP3935296B2 (ja) 1998-11-26 1999-11-25 文書型定義生成方法及びその装置、及びそのプログラムを記憶した記憶媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10-336278 1998-11-26
JP33627898 1998-11-26
JP33432399A JP3935296B2 (ja) 1998-11-26 1999-11-25 文書型定義生成方法及びその装置、及びそのプログラムを記憶した記憶媒体

Publications (3)

Publication Number Publication Date
JP2000222438A JP2000222438A (ja) 2000-08-11
JP2000222438A5 JP2000222438A5 (ja) 2004-11-25
JP3935296B2 true JP3935296B2 (ja) 2007-06-20

Family

ID=26574809

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33432399A Expired - Fee Related JP3935296B2 (ja) 1998-11-26 1999-11-25 文書型定義生成方法及びその装置、及びそのプログラムを記憶した記憶媒体

Country Status (1)

Country Link
JP (1) JP3935296B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5784196B2 (ja) * 2014-08-06 2015-09-24 株式会社東芝 文書マークアップ支援装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP2000222438A (ja) 2000-08-11

Similar Documents

Publication Publication Date Title
US5623406A (en) Method and system for entering text in computer equipment
US6246976B1 (en) Apparatus, method and storage medium for identifying a combination of a language and its character code system
US7529656B2 (en) Translating method, translated sentence outputting method, recording medium, program, and computer device
US7295964B2 (en) Apparatus and method for selecting a translation word of an original word by using a target language document database
JP2003223437A (ja) 正解語の候補の表示方法、スペルチェック方法、コンピュータ装置、プログラム
US7284006B2 (en) Method and apparatus for browsing document content
US7793224B1 (en) Methods and apparatus for formatting identified content
US7996768B2 (en) Operations on document components filtered via text attributes
JP4067603B2 (ja) 文書分類装置、文書分類プログラムが記憶された記憶媒体、及び文書分類方法
EP1204053A1 (en) Method and apparatus for handling a plurality of test modes for a computer readable document
JP4021525B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
US6976214B1 (en) Method, system, and program for enhancing text composition in a text editor program
EP1004968B1 (en) Document type definition generating method and apparatus
JP3935296B2 (ja) 文書型定義生成方法及びその装置、及びそのプログラムを記憶した記憶媒体
KR100897992B1 (ko) 자연언어처리 기술을 이용한 텍스트-이미지 변환 시스템및 그 방법
JP2003108571A (ja) 文書要約装置、文書要約装置の制御方法、文書要約装置の制御プログラムおよび記録媒体
KR101005651B1 (ko) 트리 구조와 대화하는 방법 및 시스템
JP4047417B2 (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体および文書処理方法
JP4044644B2 (ja) 電子掲示板システム、電子掲示板プログラムが記憶された記憶媒体、及び電子掲示板の活性化方法
JP2004361992A (ja) 関連語抽出装置、関連語抽出方法及びプログラム
JP4000332B2 (ja) 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11102372A (ja) 文書要約装置及びコンピュータ読み取り可能な記録媒体
JP4283038B2 (ja) 文書登録装置、文書検索装置、プログラム及び記憶媒体
WO2003094040A1 (en) Ebook hyperlink editor
US6553374B1 (en) Method for controlling file processing, and data processing apparatus and storage medium therefor

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070306

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070319

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100330

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110330

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120330

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130330

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees