JP4519081B2 - ドキュメント変換装置、およびプログラム - Google Patents

ドキュメント変換装置、およびプログラム Download PDF

Info

Publication number
JP4519081B2
JP4519081B2 JP2006036052A JP2006036052A JP4519081B2 JP 4519081 B2 JP4519081 B2 JP 4519081B2 JP 2006036052 A JP2006036052 A JP 2006036052A JP 2006036052 A JP2006036052 A JP 2006036052A JP 4519081 B2 JP4519081 B2 JP 4519081B2
Authority
JP
Japan
Prior art keywords
tag
information
element information
document
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006036052A
Other languages
English (en)
Other versions
JP2007219579A (ja
Inventor
博 植野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ProField Co Ltd
Original Assignee
ProField Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ProField Co Ltd filed Critical ProField Co Ltd
Priority to JP2006036052A priority Critical patent/JP4519081B2/ja
Publication of JP2007219579A publication Critical patent/JP2007219579A/ja
Application granted granted Critical
Publication of JP4519081B2 publication Critical patent/JP4519081B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

本発明は、ドキュメントに自動的にタグを付すドキュメント変換装置等に関するものである。
従来のドキュメント変換装置は、コンテンツに含まれる情報に応じて適切にコンテンツの変換を行う技術を提供することを目的としている。具体的には、従来のドキュメント変換装置は、第1の構造化タグ言語で記述された第1ドキュメント情報を、端末装置において使用可能な第2の構造化タグ言語で記述された第2ドキュメント情報に変換し、前記端末装置に出力する情報処理システムであって、端末装置からの要求に応じて、第1ドキュメント情報の一部を抽出し、抽出した情報ごとに個別に第2ドキュメント情報に変換する変換手段を備える。また、前記変換手段は、第1ドキュメント情報に表構造の情報が含まれている場合、表構成要素の情報ごとに個別に第2ドキュメント情報に変換する。また、第1ドキュメント情報にツリー構造の情報が含まれている場合、ノードに対応する情報ごとに個別に第2ドキュメント情報に変換する。(例えば、特許文献1参照)。
特開2004−246395公報(第1頁、第1図等)
しかしながら、従来のドキュメント変換装置においては、タグが付されていないドキュメントに対して、適切なタグを付することができない、という課題があった。
本第一の発明のドキュメント変換装置は、1以上の属性値を有する情報である要素情報を1以上有するドキュメントが格納され得るドキュメント格納部と、1以上の属性値の情報を有する条件に関する情報である条件情報と、タグの組であるタグ条件情報を1以上格納され得るタグ条件情報格納部と、前記ドキュメントを構成する各要素情報が有する1以上の属性値と、前記タグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、前記各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得するタグ付与部と、前記タグ付与部が取得した1以上のタグ付き要素情報からなるタグ付ドキュメントを出力する出力部を具備するドキュメント変換装置である。
かかる構成により、ドキュメントを構成する要素情報の属性値に基づいて、タグが付されていない要素情報に対して、適切なタグを付し、タグ付きのドキュメントを得ることができる。
また、本第二の発明のドキュメント変換装置は、第一の発明に対して、前記条件情報は、1以上の属性値の情報または/および要素情報の内容についての情報を有する条件に関する情報であり、前記タグ付与部は、前記ドキュメントを構成する各要素情報が有する1以上の属性値または/および各要素情報の内容と、前記タグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、前記各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得するドキュメント変換装置である。
かかる構成により、ドキュメントを構成する要素情報の属性値または/および要素情報の内容に基づいて、タグが付されていない要素情報に対して、適切なタグを付し、タグ付きのドキュメントを得ることができる。
また、本第三の発明のドキュメント変換装置は、第一の発明に対して、前記条件情報は、要素情報と所定の関係を有する要素情報の属性値または/および要素情報の内容についての情報を有する条件に関する情報であり、前記タグ付与部は、前記ドキュメントを構成する各要素情報と所定の関係を有する要素情報の1以上の属性値または/および各要素情報と所定の関係を有する要素情報の内容と、前記タグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、前記各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得するドキュメント変換装置である。
かかる構成により、要素情報と所定の関係を有する要素情報の属性値または/および要素情報の内容に基づいて、タグが付されていない要素情報に対して、適切なタグを付し、タグ付きのドキュメントを得ることができる。
また、本第四の発明のドキュメント変換装置は、第一から第三いずれかの発明に対して、前記要素情報は、静止画であり、前記属性値に対応する属性は、画像サイズまたは/および解像度または/および画像の形状または/および画像形式であるドキュメント変換装置である。
かかる構成により、ドキュメントを構成する要素情報の属性値等に基づいて、タグが付されていない要素情報に対して、適切なタグを付し、タグ付きのドキュメントを得ることができる。
また、本第五の発明のドキュメント変換装置は、第一から第三いずれかの発明に対して、前記要素情報は、文字列であり、前記属性値に対応する属性は、フォントサイズまたは/およびフォント名または/およびフォントの色または/およびフォントの形状であるドキュメント変換装置である。
かかる構成により、ドキュメントを構成する要素情報の属性値等に基づいて、タグが付されていない要素情報に対して、適切なタグを付し、タグ付きのドキュメントを得ることができる。
また、本第六の発明のドキュメント変換装置は、第一から第三いずれかの発明に対して、前記属性値に対応する属性は、データタイプであるドキュメント変換装置である。
かかる構成により、ドキュメントを構成する要素情報の属性値等に基づいて、タグが付されていない要素情報に対して、適切なタグを付し、タグ付きのドキュメントを得ることができる。
また、本第七の発明のドキュメント変換装置は、第二の発明に対して、前記条件情報が有する要素情報の内容は、特定の文字列を含むか否かについての情報であるドキュメント変換装置である。
かかる構成により、ドキュメントを構成する要素情報の内容に基づいて、タグが付されていない要素情報に対して、適切なタグを付し、タグ付きのドキュメントを得ることができる。
本発明によるドキュメント変換装置によれば、自動的にタグ付きのドキュメントを得ることできる。
以下、ドキュメント変換装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態1)
図1は、本実施の形態におけるドキュメント変換装置のブロック図である。
ドキュメント変換装置は、ドキュメント格納部11、タグ条件情報格納部12、タグ付与部13、出力部14を具備する。
ドキュメント格納部11は、1以上の属性値を有する情報である要素情報を1以上有するドキュメントが格納され得る。要素情報のデータタイプは、文字列、静止画、動画などである。要素情報は、1以上の属性値を有する情報である。要素情報が文字列の場合、属性値に対応する属性とは、フォントサイズまたは/およびフォント名または/およびフォントの色または/およびフォントの形状などである。また、要素情報が、静止画である場合、属性値に対応する属性は、画像サイズまたは/および解像度または/および画像の形状または/および画像形式などである。要素情報が、動画である場合、属性値に対応する属性は、圧縮形式または/および解像度または/および画像の形状または/および画像形式である。また、要素情報のデータタイプも、要素情報の属性であり、「文字列」や「静止画」等のデータタイプは属性値である。ドキュメント格納部11は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
タグ条件情報格納部12は、1以上の属性値の情報を有する条件に関する情報である条件情報と、タグの組であるタグ条件情報を1以上格納され得る。条件情報は、2以上の条件を組み合わせたものでも良い。また、条件情報は、2以上の条件をAND、ORなどで連結した条件式を示す情報でも良い。タグとは、XML(Extensible Markup Language)やHTML(Hyper Text Markup Language)やC−HTML(Compact−Hyper Text Markup Language)、MML(Mobile Markup Language)、HDML(Handheld Device Markup Language)などのタグであり、その表記方法は問わない。タグ条件情報格納部12は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
タグ付与部13は、ドキュメントを構成する各要素情報が有する1以上の属性値と、タグ条件情報の条件情報とを比較する。そして、各要素情報が有する1以上の属性値が、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得する。なお、タグ付与部13は、ドキュメントを構成する各要素情報が有する1以上の属性値と、タグ条件情報の条件情報とを比較して、条件を満たす条件情報が2以上存在した場合、当該2以上の条件情報に対応する2以上のタグを要素情報に付与しても良いし、最初に見つけた条件情報に対応する一のタグを要素情報に付与しても良いし、最も多数の属性値が合致する条件情報に対応する一のタグを要素情報付与しても良いし、その他の方法により、一のタグを要素情報に付与しても良い。また、タグ付き要素情報は、タグと要素情報を有し、要素情報の属性値は含んでも含まなくても良い。要素情報が文字列の場合、タグ付き要素情報は、通常、要素情報の属性値は含まない。また、タグ付与部13は、条件を満たす条件情報が存在しない要素情報に対して、デフォルトのタグを付与しても良いし、出力対象から外しても良い(削除しても良い)。また、タグ付与部13が行うタグの付与の方法は、開始タグ(例えば、<タグX>)と終了タグ(例えば、</タグX>)の両方を付与しても良いし、開始タグのみ付与しても良い。タグ付与部13は、通常、MPUやメモリ等から実現され得る。タグ付与部13の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
出力部14は、タグ付与部13が取得した1以上のタグ付き要素情報を有するタグ付ドキュメントを出力する。タグ付ドキュメントは、タグ付き要素情報の他に、ヘッダー情報やフッター情報などを有しても良い。つまり、出力部14は、予め決められたヘッダー情報等を付与して、出力するドキュメントを構成しても良い。ここで、出力とは、記録媒体への蓄積、ディスプレイへの表示、プリンタへの印字、外部の装置への送信等を含む概念である。出力部14は、ディスプレイ等の出力デバイスを含むと考えても含まないと考えても良い。出力部14は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
次に、ドキュメント変換装置の動作について図2のフローチャートを用いて説明する。
(ステップS201)タグ付与部13は、ドキュメント格納部11からドキュメントを読み込む。タグ付与部13は、例えば、キーボード等の入力手段から、ドキュメント変換の指示を受け付け、ドキュメント格納部11からドキュメントを読み込む。なお、かかる場合、ユーザから指示があったドキュメントを読み込むことが好適である。
(ステップS202)タグ付与部13は、カウンタiに1を代入する。
(ステップS203)タグ付与部13は、ステップS201で読み込んだドキュメント中に、i番目の要素情報が存在するか否かを判断する。なお、ドキュメント中の要素情報の区切りは、例えば、リターンコード「¥n」や、データタイプ(文字列、画像など)の違いなどにより、タグ付与部13は判別する。キュメント中の要素情報の区切りの判別方法は、種々あり、特に限定しない。i番目の要素情報が存在すればステップS204に行き、i番目の要素情報が存在しなければステップS215に行く。
(ステップS204)タグ付与部13は、ステップS201で読み込んだドキュメントから、i番目の要素情報を取得する。
(ステップS205)タグ付与部13は、ステップS204で取得したi番目の要素情報の属性値を取得する。属性値は、2以上取得しても良いし、1つでも良い。また、属性値が0の場合は、タグ付与部13は、属性値を取得しない。なお、属性値が0の場合は、タグ付与部13は、デフォルトの属性値をi番目の要素情報の属性値としても良い。かかる場合、デフォルトの属性値は予め保持している。なお、要素情報の属性値は、要素情報の中に埋め込まれていても良いし、要素情報と対にドキュメント内に存在しても良い。要素情報が静止画である場合、解像度やデータサイズ等の属性値は、通常、静止画のヘッダー部等の内部に記述されている。
(ステップS206)タグ付与部13は、カウンタjに1を代入する。
(ステップS207)タグ付与部13は、タグ条件情報格納部12に、j番目のタグ条件情報が存在するか否かを判断する。j番目のタグ条件情報が存在すればステップS208に行き、j番目のタグ条件情報が存在しなければステップS212に行く。
(ステップS208)タグ付与部13は、タグ条件情報格納部12から、j番目のタグ条件情報を読み出す。
(ステップS209)タグ付与部13は、ステップS205で取得したi番目の要素情報の属性値と、ステップS208で読み出したj番目のタグ条件情報が有する条件情報とを比較する。
(ステップS210)タグ付与部13は、ステップS209における比較により、ステップS205で取得したi番目の要素情報の属性値が、j番目のタグ条件情報が有する条件情報が示す条件に合致するか否かを判断する。合致すればステップS211に行き、合致しなければステップS217に行く。
(ステップS211)タグ付与部13は、j番目のタグ条件情報が有するタグを取得する。
(ステップS212)タグ付与部13は、ステップS211で取得したタグと、i番目の要素情報を用いて、タグ付要素情報を構成する。タグ付要素情報の構成方法は、予め決められている。通常、タグ付要素情報の構成方法は、要素情報のデータタイプごとに決められている。タグ付要素情報の構成方法の具体例は、後述する。
(ステップS213)タグ付与部13は、ステップS212で構成したタグ付要素情報を一時蓄積する。
(ステップS214)タグ付与部13は、カウンタiを1、インクリメントする。ステップS203に戻る。
(ステップS215)出力部14は、ステップS213で一時蓄積したタグ付要素情報を用いて、タグ付ドキュメントを構成する。出力部14は、1以上のタグ付要素情報をそのままタグ付ドキュメントとする場合もあるし、1以上のタグ付要素情報にヘッダー、または/およびフッターを付与して、タグ付ドキュメントとする場合もある。通常、タグ付ドキュメントはファイルである。したがって、通常、出力部14は、ファイルを生成し、1以上のタグ付要素情報をファイルに書き込み、タグ付ドキュメントを構成する。
(ステップS216)出力部14は、ステップS215で構成したタグ付ドキュメントを出力する。処理を終了する。
(ステップS217)タグ付与部13は、カウンタjを1、インクリメントする。ステップS207に戻る。
なお、図2のフローチャートにおいて、最初に条件情報に合致したタグ条件情報が有するタグを、要素情報に付与したが、他のアルゴリズムで、要素情報に付与するタグを決定しても良い。
以下、本実施の形態におけるドキュメント変換装置の具体的な動作について説明する。今、ドキュメント格納部11は、図3に示すドキュメントを格納している、とする。図3に示すドキュメントは、例えば、ワープロソフトやプレゼンテーションツールで作成されたドキュメントであり、ソフトウェア(アプリケーション)固有のデータ構造を有する。つまり、ソフトウェア(アプリケーション)で決められた属性値が各要素情報に付与、または埋め込まれている。
また、図4は、図3に示すドキュメントを構成する要素情報について記載したものである。図3に示すドキュメントにおいて、図4の情報が、通常、一ファイル内に記載されている。図4の各レコードは、「要素情報」「データタイプ」「属性値」を有する。「要素情報」は、図3に示すドキュメントを構成する要素情報である。「データタイプ」は、要素情報のデータタイプであり、静止画、文字列、動画、テキストボックス、ボタンなど、種々のものが考えられる。「データタイプ」も、属性の一種である。「属性値」は、要素情報の属性値である。
図5は、タグ条件情報格納部12に格納されているタグ条件情報を管理しているタグ条件情報管理表である。タグ条件情報は、「条件情報」と「タグ」を有する。条件情報「画像=300dpi」は、300dpiの画像が条件に合致し、タグ「商品画像」が付与されることを示す。また、条件情報「フォント名=ポップ体 AND フォントサイズ=14pt」は、「フォント名=ポップ体」かつ「フォントサイズ=14pt」の文字列に対して、タグ「価格」が付与されることを示す。
今、例えば、ユーザが、ドキュメント変換装置に対して、ドキュメントの変換の指示を入力した、とする。
次に、タグ付与部13は、ドキュメント格納部11からドキュメントを読み込む。
次に、タグ付与部13は、読み込んだドキュメント中の1番目の要素情報(図4の第一レコードの情報)を取得する。そして、タグ付与部13は、取得した1番目の要素情報の属性値「画像=300dpi」を取得する。
次に、タグ付与部13は、タグ条件情報格納部12から1番目のタグ条件情報「条件情報(画像情報=300dpi)、タグ(商品画像)」を読み出す。
1番目の要素情報の属性値「画像=300dpi」は、1番目のタグ条件情報の条件情報「画像情報=300dpi」に合致する。また、1番目の要素情報の属性値「画像=300dpi」は、他のタグ条件情報の条件情報には合致しない。そこで、タグ付与部13は、1番目の要素情報に付与するタグを「商品画像」と決定する。
そして、タグ付与部13は、取得したタグ「商品画像」と、1番目の要素情報を用いて、タグ付要素情報「<商品画像>まぐろ.bmp</商品画像>」を構成する。つまり、タグ付与部13は、取得したタグ「商品画像」から、「<商品画像>」および「</商品画像>」を構成する。次に、要素情報のデータタイプが「静止画」であることを取得し、静止画に対応する以下の処理を行う。処理とは、属性値「名称=まぐろ.bmp」から名称「まぐろ.bmp」を取得し、「<商品画像>」および「</商品画像>」の間に挿入する処理である。その結果、タグ付与部13は、「<商品画像>まぐろ.bmp</商品画像>」を得る。なお、本画像の形式は「bmp」であり、その名称は「まぐろ.bmp」である(図4参照)。
次に、タグ付与部13は、構成したタグ付要素情報「<商品画像>まぐろ.bmp</商品画像>」を一時蓄積する。
次に、タグ付与部13は、ドキュメント中の2番目の要素情報(図4の第二レコードの情報)を取得する。そして、タグ付与部13は、取得した2番目の要素情報の属性値「フォントサイズ=6pt・・・」を取得する。
次に、タグ付与部13は、タグ条件情報格納部12から1番目のタグ条件情報「条件情報(画像情報=300dpi)、タグ(商品画像)」を読み出す。
そして、タグ付与部13は、2番目の要素情報の属性値「フォントサイズ=6pt・・・」は、1番目のタグ条件情報の条件情報「画像情報=300dpi」に合致しない、と判断する。
そして、タグ付与部13は、タグ条件情報格納部12から2番目のタグ条件情報「条件情報(フォントサイズ=10pt)、タグ(キャッチ)」を読み出す。次に、タグ付与部13は、2番目の要素情報の属性値「フォントサイズ=6pt・・・」は、1番目のタグ条件情報の条件情報「フォントサイズ=10pt」に合致しない、と判断する。
さらに、タグ付与部13は、3番目以降のタグ条件情報についても読み出し、同様に、2番目の要素情報の属性値「フォントサイズ=6pt・・・」と、タグ条件情報の条件情報が合致するか否かを判断する。2番目の要素情報の属性値「フォントサイズ=6pt・・・」は、どの条件情報とも合致しないので、タグ付与部13は、2番目の要素情報を捨てる、とする。
次に、タグ付与部13は、ドキュメント中の3番目の要素情報(図4の第三レコードの情報)を取得する。そして、タグ付与部13は、取得した3番目の要素情報の属性値「フォントサイズ=10pt,色=黒,・・・」を取得する。
次に、タグ付与部13は、タグ条件情報格納部12から1番目のタグ条件情報「条件情報(画像情報=300dpi)、タグ(商品画像)」を読み出す。
そして、タグ付与部13は、3番目の要素情報の属性値「フォントサイズ=10pt,色=黒,・・・」は、1番目のタグ条件情報の条件情報「画像情報=300dpi」に合致しない、と判断する。
次に、タグ付与部13は、タグ条件情報格納部12から2番目のタグ条件情報「条件情報(フォントサイズ=10pt)、タグ(キャッチ)」を読み出す。次に、タグ付与部13は、2番目の要素情報の属性値「フォントサイズ=10pt,色=黒,・・・」は、2番目のタグ条件情報の条件情報「フォントサイズ=10pt」に合致する、と判断する。
次に、タグ付与部13は、3番目の要素情報に付与するタグを「キャッチ」と決定する。
そして、タグ付与部13は、取得したタグ「キャッチ」と、3番目の要素情報「インドマグロ 赤身」を用いて、タグ付要素情報「<キャッチ>インドマグロ 赤身</キャッチ>」を構成する。なお、タグ付与部13は、取得したタグ「キャッチ」から、「<キャッチ>」および「</キャッチ>」を構成する。次に、要素情報のデータタイプが「文字列」であることを取得し、文字列に対応する以下の処理を行う。つまり、タグ付与部13は、3番目の要素情報「インドマグロ 赤身」を「<キャッチ>」および「</キャッチ>」の間に挿入する。その結果、タグ付与部13は、「<キャッチ>インドマグロ 赤身</キャッチ>」を得る。
次に、タグ付与部13は、構成したタグ付要素情報「<キャッチ>インドマグロ 赤身</キャッチ>」を一時蓄積する。
同様に、タグ付与部13は、4番目の要素情報を処理し、タグ付要素情報「<大きさ>500g</大きさ>」を得る。
また、タグ付与部13は、5番目の要素情報を処理し、タグ付要素情報「<価格>1,240円</価格>」を得る。
さらに、タグ付与部13は、6番目の要素情報を処理し、タグ付要素情報「<キャッチ>トロのようにとろける極上の赤身。マグロ1本から2kgしか取れない部位を特別定価で御提供!</キャッチ>」を得る。
次に、タグ付与部13は、7番目の要素情報(図4の第七レコードの情報)を取得する。そして、タグ付与部13は、取得した7番目の要素情報の属性値「フォントサイズ=8pt,国名テーブル」を取得する。
次に、タグ付与部13は、タグ条件情報格納部12の条件情報のうちで、7番目の要素情報の属性値「フォントサイズ=8pt,国名テーブル」に合致する条件情報を検索する。その結果、タグ付与部13は、条件情報「フォントサイズ=8pt AND 国名テーブル」に、7番目の要素情報の属性値「フォントサイズ=8pt,国名テーブル」が合致する、と判断する。
そして、タグ付与部13は、7番目の要素情報に付与するタグを「産地」と決定する。
そして、タグ付与部13は、取得したタグ「産地」と、7番目の要素情報を用いて、タグ付要素情報「<産地>インドネシア</産地>」を構成する。
次に、タグ付与部13は、構成したタグ付要素情報「<産地>インドネシア</産地>」を一時蓄積する。
そして、出力部14は、構成した図6のタグ付ドキュメントを出力する。
なお、タグ付与部13は、同一のタグを付与することをしないで、タグを生成する場合に、所定のルールに基づいてタグを生成しても良い。つまり、例えば、2度目以降に取得したタグ「キャッチ」を取得した場合、「<キャッチ>」のタグを作成せずに、「<キャッチ2>」を作成しても良い。かかる場合、タグ付ドキュメントは、図7のようになる。なお、上記の所定のルールとは、2度目以降に取得したタグについて、「<タグ名i>」(iは回数を示す数値)をタグとする、というルールである。かかるルールに基づく処理により、重複したタグを生成することが防止できる。
なお、図6や図7のようなタグ付ドキュメントは、公知技術であるXMLの処理系などにより処理され、出力されたり、データベースに挿入されたり、外部装置に転送されたりする。
以上、本実施の形態によれば、ドキュメントを構成する要素情報の属性値がドキュメントに埋め込まれているタグ無しのドキュメントを、タグ付きのドキュメントに自動的に変換できる。そのため、例えば、過去に固有のアプリケーションで作成し、特有のデータ構造を有するドキュメントの資産を、情報流通や加工が容易なタグ付きのドキュメントに自動的に変換できる。
なお、本実施の形態によれば、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態におけるドキュメント変換装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータに、ドキュメントを構成する各要素情報が有する1以上の属性値と、格納しているタグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、前記各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得するタグ付与ステップと、前記タグ付与ステップで取得した1以上のタグ付き要素情報からなるタグ付ドキュメントを出力する出力ステップを実行させるためのプログラムである。
(実施の形態2)
図8は、本実施の形態におけるドキュメント変換装置のブロック図である。
ドキュメント変換装置は、ドキュメント格納部11、タグ条件情報格納部82、タグ付与部83、出力部14を具備する。
タグ条件情報格納部82は、1以上の属性値の情報を有する条件に関する情報である条件情報と、タグの組であるタグ条件情報を1以上格納され得る。条件情報は、1以上の属性値の情報または/および要素情報の内容についての情報を有する条件に関する情報である。条件情報は、要素情報と所定の関係を有する要素情報の属性値または/および要素情報の内容についての情報を有する条件に関する情報でも良い。「要素情報の内容についての情報」とは、要素情報が文字列で行頭が「タブ」や「スペース」であること、また、要素情報が文字列で行頭に「*」などの予め決められた文字が存在すること、などである。「所定の関係」とは、例えば、予め決められた位置関係である。「位置関係」とは、直前に存在する、ドキュメント上に配置した場合に、横に存在する、などである。タグ条件情報格納部82は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
タグ付与部83は、ドキュメントを構成する各要素情報が有する1以上の属性値または/および各要素情報の内容と、タグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得する。また、タグ付与部83は、ドキュメントを構成する各要素情報と所定の関係を有する要素情報の1以上の属性値または/および各要素情報と所定の関係を有する要素情報の内容と、タグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得しても良い。タグ付与部83は、通常、MPUやメモリ等から実現され得る。タグ付与部の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
次に、ドキュメント変換装置の動作について図9、図10のフローチャートを用いて説明する。図9のフローチャートにおいて、図2のフローチャートと同一のステップの説明は省略する。
(ステップS901)タグ付与部83は、i番目の要素情報と所定の関係を有する要素情報を取得する。
(ステップS902)タグ付与部83は、ステップS901で取得した所定の関係を有する要素情報の属性値を取得する。
(ステップS903)タグ付与部83は、i番目の要素情報または属性値、またはi番目の要素情報と所定の関係を有する要素情報または属性値を用いて、タグ条件情報を参照して、i番目の要素情報に付与するタグを決定する。タグ決定処理の詳細について、図10のフローチャートを用いて説明する。
次に、ステップS903のタグ決定処理について図10のフローチャートを用いて説明する。図10のフローチャートにおいて、図2のフローチャートと同一のステップの説明は省略する。
(ステップS1001)タグ付与部83は、処理対象の要素情報、その属性値、処理対象の要素情報と所定の関係にある要素情報、およびその属性値と、j番目の条件情報を比較する。
(ステップS1002)タグ付与部83は、ステップS1001における比較の結果、処理対象の要素情報等が、条件情報に合致するか否かを判断する。条件情報に合致すればステップS1003に行き、条件情報に合致しなければステップS217に行く。
(ステップS1003)タグ付与部83は、ステップS1001における比較の結果の合致度を算出する。合致度は、例えば、条件情報の条件の数(ANDで連結された条件の数)でも良い。また、合致度は、例えば、処理対象の要素情報、その属性値、処理対象の要素情報と所定の関係にある要素情報、その属性値の4種類の条件のうち、使用している条件の種類の数などでも良い。
(ステップS1004)タグ付与部83は、j番目の条件情報と対になるタグを、タグ条件情報格納部82から取得する。
(ステップS1005)タグ付与部83は、ステップS1003で算出した合致度と、ステップS1004で取得したタグを対にして、一時蓄積する。ステップS217に行く。
(ステップS1006)タグ付与部83は、最大の合致度と対になるタグを読み出す。上位関数にリターンする。
以下、本実施の形態におけるドキュメント変換装置の具体的な動作について説明する。
今、ドキュメント格納部11は、図11に示すドキュメントを格納している、とする。図11に示すドキュメントは、例えば、ワープロソフトで作成されたドキュメントであり、ドキュメントには、静止画が貼付されている。また、本ドキュメントは、ソフトウェア(アプリケーション)固有のデータ構造を有する。つまり、ソフトウェア(アプリケーション)で決められた属性値が各要素情報に付与されている。
また、図12は、図11に示すドキュメントを構成する要素情報について記載したものである。
また、図13は、タグ条件情報格納部12に格納されているタグ条件情報を管理しているタグ条件情報管理表である。
かかる場合、例えば、ユーザが、ドキュメント変換装置に対して、ドキュメントの変換の指示を入力した、とする。
次に、タグ付与部13は、ドキュメント格納部11から図11に示すドキュメントを読み込む。
次に、タグ付与部13は、読み込んだドキュメント中の1番目の要素情報(図12の第一レコードの情報)を取得する。そして、タグ付与部13は、取得した1番目の要素情報の属性値「フォントサイズ=9pt,フォントスタイル(Bold)・・・」を取得する。
次に、タグ付与部13は、タグ条件情報格納部12から1番目のタグ条件情報「条件情報(画像情報=300dpi)、タグ(マニュアル画像)」を読み出す。
1番目の要素情報の属性値「フォントサイズ=9pt,フォントスタイル(Bold)・・・」は、1番目のタグ条件情報の条件情報「画像情報=300dpi」を満たさないので、タグ付与部13は、2番目のタグ条件情報「条件情報(フォントサイズ(9pt)AND フォントスタイル(Bold))、タグ(見出し)」を読み出す。
そして、タグ付与部13は、1番目の要素情報の属性値「フォントサイズ=9pt,フォントスタイル(Bold)・・・」が、2番目の条件情報「フォントサイズ(9pt) AND フォントスタイル(Bold))」を満たす、と判断する。そして、タグ付与部13は、合致度を「2」と判断する。この「2」は、条件情報が有する条件(「フォントサイズ(9pt)」および「フォントスタイル(Bold)」)の数である。
次に、タグ付与部13は、合致度「2」、タグ「見出し」を有する「2,見出し」を一時蓄積する。
次に、タグ付与部13は、2番目のタグ条件情報「条件情報(フォントサイズ(9pt)AND インデント(5pt))、タグ(説明)」を読み出す。そして、タグ付与部13は、2番目の条件情報「フォントサイズ(9pt)AND インデント(5pt)」を1番目の要素情報の属性値「フォントサイズ=9pt,フォントスタイル(Bold)・・・」が満たさないと判断する。
そして、タグ付与部13は、他のタグ条件情報も読み出し、1番目の要素情報の属性値「フォントサイズ=9pt,フォントスタイル(Bold)・・・」が、当該タグ条件情報が有する条件情報を満たすか否かを判断する。ここで、9番目の条件情報が「フォントサイズ=9pt」であり、1番目の要素情報の属性値「フォントサイズ=9pt,フォントスタイル(Bold)・・・」に対して合致する、とタグ付与部13は判断した、とする。次に、タグ付与部13は、合致度を「1」と判断し、「1,タグX」を一時蓄積する。なお、「タグX」は、9番目の条件情報と対になるタグである。
そして、すべてのタグ条件情報に対する1番目の要素情報の属性値のチェックが完了した後、タグ付与部13は、最大の合致度を有するタグ「見出し」を取得する。
次に、タグ付与部13は、タグ付要素情報「<見出し>● Microsoft Excel 読み込みオプション設定手順</見出し>」を構成する。かかる構成方法は、実施の形態1と同様である。そして、タグ付与部13は、タグ付要素情報「<見出し>● Microsoft Excel 読み込みオプション設定手順</見出し>」を一時蓄積する。
次に、タグ付与部13は、2番目の要素情報(図12の第二レコードの情報)を取得する。そして、タグ付与部13は、取得した2番目の要素情報の属性値「フォントサイズ=9pt,フォント名=ゴシック,・・・」を取得する。
次に、タグ付与部13は、タグ条件情報格納部12から1番目のタグ条件情報「条件情報(画像情報=300dpi)、タグ(マニュアル画像)」を読み出す。
2番目の要素情報の属性値「フォントサイズ=9pt,・・・」は、1番目のタグ条件情報の条件情報「画像情報=300dpi」を満たさないので、タグ付与部13は、2番目のタグ条件情報「条件情報(フォントサイズ(9pt)AND フォントスタイル(Bold))、タグ(見出し)」を読み出す。2番目の要素情報の属性値「フォントサイズ=9pt,・・・」は、2番目の条件情報「フォントサイズ(9pt)AND フォントスタイル(Bold)」をも満たさず、タグ付与部13は、3番目のタグ条件情報「条件情報(フォントサイズ(9pt) AND インデント(5pt))、タグ(見出し)」を読み出す。
次に、タグ付与部13は、2番目の要素情報の属性値「フォントサイズ=9pt,・・・」は、3番目の条件情報「フォントサイズ(9pt) AND 「タブ」で開始」のうちの「フォントサイズ(9pt)」を満たすことを検出する。そして、タグ付与部13は、2番目の要素情報の最初のコードが「タブ」であることを検知する。そして、タグ付与部13は、2番目の要素情報の属性値および内容は、3番目の条件情報「フォントサイズ(9pt) AND 「タブ」で開始」を満たすことを検知する。
次に、タグ付与部13は、合致度を「2」と判断する。
次に、タグ付与部13は、合致度「2」、タグ「説明」を有する「2,説明」を一時蓄積する。
次に、タグ付与部13は、他のタグ条件情報を読み出し、2番目の要素情報が他の条件情報を満たすか否かを判断し、ここでは、満たさない、との判断結果を得る、とする。
そして、タグ付与部13は、タグ付要素情報「<説明> 1. エクセルファイルを流し込むテンプレートをInDesign で開き、「Microsoft Excel 読み込みオプション」画面を呼び出すためにドキュメント上にエクセルファイルを配置します。「ファイル」メニューの「配置」を選択し([1])、表示されたファイル選択ダイアログより任意のエクセルファイルを選択します。([2])2. ファイル選択ダイアログの「開く」を押下することで([3])、「Microsoft Excel 読み込みオプション」画面が表示されます。「Microsoft Excel 読み込みオプション」画面の「フォーマット」にある「テーブル」を「フォーマットテーブル」または「アンフォーマットテーブル」に設定します。([4])</説明>」を構成する。
さらに、タグ付与部13は、上記または実施の形態1で述べた処理と同様に、3番目の要素情報、4番目の要素情報に対して、タグ変換の処理を行う。そして、タグ付与部13は、図14に示すタグ付ドキュメントを出力する。
以上、本実施の形態によれば、ドキュメントを構成する各要素情報が有する1以上の属性値または/および各要素情報の内容に基づいて、付与するタグを決定でき、適切なタグ付きのドキュメントを自動的に生成できる。
なお、本実施の形態の具体例によれば、1以上の属性値または/および各要素情報の内容に基づいて、付与するタグを決定した。しかし、ドキュメントを構成する各要素情報と所定の関係を有する要素情報の1以上の属性値または/および各要素情報と所定の関係を有する要素情報の内容に基づいて、付与するタグを決定しても良い。ここで、所定の関係とは、直前に存在する、などの所定の配置関係である。例えば、直前の要素情報の属性値が「フォントサイズ=40 AND フォントスタイル=Bold」である場合、その直後の要素情報に対して、「サブタイトル」のタグを付与するようにしても良い。かかる場合、所定の関係にある直前の要素情報のタグは、例えば、「タイトル」である。かかる場合の、タグ条件情報の例を、図15に示す。図15において、「直前.フォントサイズ(40pt)」は、直前の要素情報のフォントサイズが「40pt」である場合、当該要素情報には、「サブタイトル」のタグが付されることを示す。図15において、「直前.「¥n」」は、直前の要素情報にリターンコードが存在する場合は、当該要素情報には、「次項目」のタグが付されることを示す。
また、本実施の形態によれば、出力されるタグ付ドキュメントは、図14に示すものであった。しかし、図16に示すようなタグ付ドキュメントでも良いことは言うまでもない。図16に示すようなタグ付ドキュメントを作成するために、タグ付与部83は、予め決められたヘッダー部、フッター部等を、出力するドキュメントに付与する。なお、図16に示すタグ付ドキュメントは、例えば、図3に示すタグが付与されていないドキュメントを変換した結果のドキュメントである。
さらに、本実施の形態によれば、ドキュメント格納部11のドキュメントのデータは、例えば、図17に示すようなものであり、属性値がタグで指定されておらず、ドキュメント内に埋め込まれている。図17(a)は、属性値が埋め込まれたドキュメントの内容、図17(b)は、図17(a)のドキュメントを表示した場合の表示例を示す。図17(a)において、24ptの「ProField」の文字が記載されたファイルであり、特有のデータ構造を有するファイルである。また、図17(a)において、文字「ProField」は、図17(a)の「stream」から「endstream」までのバイナリデータで表現されている。つまり、ドキュメント変換装置は、要素情報(ここでは、「ProField」)を所定のアルゴリズムで変換(例えば、バイナリデータをテキストコードに変換)しても良い。また、タグ付与部13は、通常、図17(a)のドキュメントを読み出し、中間的に、図4や図12に示す情報をメモリ上に一時記憶する。このことは、本明細書における他の実施の形態においても該当する。
さらに、本実施の形態におけるドキュメント変換装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータに、ドキュメントを構成する各要素情報が有する1以上の属性値と、格納しているタグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、前記各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得するタグ付与ステップと、前記タグ付与ステップで取得した1以上のタグ付き要素情報からなるタグ付ドキュメントを出力する出力ステップを実行させるためのプログラムである。
また、上記プログラムにおいて、前記条件情報は、1以上の属性値の情報または/および要素情報の内容についての情報を有する条件に関する情報であり、前記タグ付与ステップは、前記ドキュメントを構成する各要素情報が有する1以上の属性値または/および各要素情報の内容と、前記タグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、前記各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得する、ことは好適である。
また、上記プログラムにおいて、前記条件情報は、要素情報と所定の関係を有する要素情報の属性値または/および要素情報の内容についての情報を有する条件に関する情報であり、前記タグ付与ステップは、前記ドキュメントを構成する各要素情報と所定の関係を有する要素情報の1以上の属性値または/および各要素情報と所定の関係を有する要素情報の内容と、前記タグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、前記各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得する、ことは好適である。
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
また、図18は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態のドキュメント変換装置を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図18は、このコンピュータシステム340の概観図であり、図19は、コンピュータシステム340のブロック図である。
図18において、コンピュータシステム340は、FD(Flexible Disk)ドライブ、CD−ROM(Compact Disk Read Only Memory)ドライブを含むコンピュータ341と、キーボード342と、マウス343と、モニタ344とを含む。
図19において、コンピュータ341は、FDドライブ3411、CD−ROMドライブ3412に加えて、CPU(Central Processing Unit)3413と、CPU3413、CD−ROMドライブ3412及びFDドライブ3411に接続されたバス3414と、ブートアッププログラム等のプログラムを記憶するためのROM(Read−Only Memory)3415と、CPU3413に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM(Random Access Memory)3416と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3417とを含む。ここでは、図示しないが、コンピュータ341は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
コンピュータシステム340に、上述した実施の形態のドキュメント変換装置の機能を実行させるプログラムは、CD−ROM3501、またはFD3502に記憶されて、CD−ROMドライブ3412またはFDドライブ3411に挿入され、さらにハードディスク3417に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ341に送信され、ハードディスク3417に記憶されても良い。プログラムは実行の際にRAM3416にロードされる。プログラムは、CD−ROM3501、FD3502またはネットワークから直接、ロードされても良い。
プログラムは、コンピュータ341に、上述した実施の形態のドキュメント変換装置の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム340がどのように動作するかは周知であり、詳細な説明は省略する。
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
以上のように、本発明にかかるドキュメント変換装置は、自動的にタグ付きのドキュメントを得ることできる、という効果を有し、ドキュメント変換装置等として有用である。
実施の形態1におけるドキュメント変換装置のブロック図 同ドキュメント変換装置の動作について説明するフローチャート 同ドキュメント格納部のドキュメントの例を示す図 同ドキュメントを構成する要素情報を示す図 同タグ条件情報管理表を示す図 同出力したタグ付ドキュメントの例を示す図 同出力したタグ付ドキュメントの例を示す図 実施の形態2におけるドキュメント変換装置のブロック図 同ドキュメント変換装置の動作について説明するフローチャート 同ドキュメント変換装置の動作について説明するフローチャート 同ドキュメント格納部のドキュメントの例を示す図 同ドキュメントを構成する要素情報を示す図 同タグ条件情報管理表を示す図 同出力したタグ付ドキュメントの例を示す図 同タグ条件情報管理表を示す図 同出力したタグ付ドキュメントの例を示す図 同ドキュメント格納部のドキュメントのデータ例を示す図 同ドキュメント変換装置を実現するコンピュータの外観図 同ドキュメント変換装置を実現するコンピュータシステムのブロック図
符号の説明
11 ドキュメント格納部
12、82 タグ条件情報格納部
13、83 タグ付与部
14 出力部

Claims (7)

  1. 1以上の属性値を有する情報であり、各々分離して管理されており、順序付けがされている情報である要素情報が2以上配置されているドキュメントが格納され得るドキュメント格納部と、
    要素情報と前記順序において所定の位置関係を有する要素情報の属性値についての情報を有する条件に関する情報である条件情報と、タグの組であるタグ条件情報を1以上格納され得るタグ条件情報格納部と、
    前記ドキュメントを構成する各要素情報と所定の位置関係を有する要素情報が有する1以上の属性値と、前記タグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、前記各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得するタグ付与部と、
    前記タグ付与部が取得した1以上のタグ付き要素情報からなるタグ付ドキュメントを出力する出力部を具備し、
    前記タグ付与部は、
    2度目以降に取得した同一のタグに対して、異なるタグを生成する所定のルールを用いて、異なる要素情報に対して、同一のタグを付さないようにタグを生成し、当該生成したタグを付与することを特徴とするドキュメント変換装置。
  2. 前記条件情報は、
    要素情報と所定の位置関係を有する要素情報の属性値および要素情報の内容についての情報を有する条件に関する情報であり、
    前記タグ付与部は、
    前記ドキュメントを構成する各要素情報と所定の位置関係を有する要素情報の1以上の属性値および各要素情報と所定の関係を有する要素情報の内容と、前記タグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、前記各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得する請求項1記載のドキュメント変換装置であり、
    前記タグ付与部は、
    2度目以降に取得した同一のタグに対して、異なるタグを生成する所定のルールを用いて、異なる要素情報に対して、同一のタグを付さないようにタグを生成し、当該生成したタグを付与することを特徴とする請求項1記載のドキュメント変換装置。
  3. 前記所定のルールは、「2度目以降に取得したタグについて、「<タグ名i>」(iは回数を示す数値)をタグとする」というルールであり、
    前記タグ付与部は、
    前記所定のルールを用いて、異なる要素情報に対して、同一のタグを付さないようにタグを生成し、当該生成したタグを付与する請求項1または請求項2いずれか記載のドキュメント変換装置。
  4. 前記タグ付与部は、
    条件を満たす条件情報が存在しない要素情報に対して、デフォルトのタグを付与することを特徴とする請求項1から請求項3いずれか記載のドキュメント変換装置。
  5. 前記タグ付与部は、
    条件を満たす条件情報が存在しない要素情報を削除し、
    前記出力部は、
    前記条件を満たす条件情報が存在しない要素情報を、出力対象から外して、タグ付ドキュメントを出力する請求項1から請求項3いずれか記載のドキュメント変換装置。
  6. 記憶媒体に、1以上の属性値を有する情報あり、各々分離して管理されており、順序付けがされている情報である要素情報が2以上配置されているドキュメントが格納されており、
    記憶媒体に、要素情報と前記順序において所定の位置関係を有する要素情報の属性値についての情報を有する条件に関する情報である条件情報と、タグの組であるタグ条件情報を1以上格納されており、
    コンピュータに、
    タグ付与部により、前記記憶媒体に格納されているドキュメントを構成する各要素情報と所定の位置関係を有する要素情報が有する1以上の属性値と、前記記憶媒体に格納されているタグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、前記各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得するタグ付与ステップと、
    出力部により、前記タグ付与ステップで取得した1以上のタグ付き要素情報からなるタグ付ドキュメントを出力する出力ステップを実行させるためのプログラムであり、
    前記タグ付与ステップにおいて、
    2度目以降に取得した同一のタグに対して、異なるタグを生成する所定のルールを用いて、異なる要素情報に対して、同一のタグを付さないようにタグを生成し、当該生成したタグを付与することを特徴とするプログラム。
  7. 記憶媒体に、1以上の属性値を有する情報あり、各々分離して管理されており、順序付けがされている情報である要素情報が2以上配置されているドキュメントが格納されており、
    記憶媒体に、要素情報と前記順序において所定の位置関係を有する要素情報の属性値についての情報を有する条件に関する情報である条件情報と、タグの組であるタグ条件情報を1以上格納されており、
    タグ付与部により、前記記憶媒体に格納されているドキュメントを構成する各要素情報と所定の位置関係を有する要素情報が有する1以上の属性値と、前記記憶媒体に格納されているタグ条件情報の条件情報とを比較し、当該条件情報が示す条件を満たす場合に、当該条件情報と組になるタグを、前記各要素情報に対してそれぞれ付与し、1以上のタグ付き要素情報を取得するタグ付与ステップと、
    出力部により、前記タグ付与ステップで取得した1以上のタグ付き要素情報からなるタグ付ドキュメントを出力する出力ステップを具備するドキュメントの生産方法であって、
    前記タグ付与ステップにおいて、
    2度目以降に取得した同一のタグに対して、異なるタグを生成する所定のルールを用いて、異なる要素情報に対して、同一のタグを付さないようにタグを生成し、当該生成したタグを付与することを特徴とするドキュメントの生産方法。
JP2006036052A 2006-02-14 2006-02-14 ドキュメント変換装置、およびプログラム Expired - Fee Related JP4519081B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006036052A JP4519081B2 (ja) 2006-02-14 2006-02-14 ドキュメント変換装置、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006036052A JP4519081B2 (ja) 2006-02-14 2006-02-14 ドキュメント変換装置、およびプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008261050A Division JP5400344B2 (ja) 2008-10-07 2008-10-07 ドキュメント変換装置、およびプログラム

Publications (2)

Publication Number Publication Date
JP2007219579A JP2007219579A (ja) 2007-08-30
JP4519081B2 true JP4519081B2 (ja) 2010-08-04

Family

ID=38496851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006036052A Expired - Fee Related JP4519081B2 (ja) 2006-02-14 2006-02-14 ドキュメント変換装置、およびプログラム

Country Status (1)

Country Link
JP (1) JP4519081B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5193894B2 (ja) * 2009-01-30 2013-05-08 株式会社プロフィールド データ編集装置、データ編集方法、およびプログラム
JP2013206261A (ja) * 2012-03-29 2013-10-07 Toshiba Corp 構造化データ生成装置、データ処理装置、構造化データ生成方法、及び構造化データ生成プログラム
JP2019040261A (ja) * 2017-08-22 2019-03-14 大日本印刷株式会社 情報処理装置及びプログラム

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339312A (ja) * 1999-05-31 2000-12-08 Toshiba Corp 文書編集システム及びタグ情報管理テーブル作成方法
JP2001195400A (ja) * 2000-01-17 2001-07-19 Nippon Telegr & Teleph Corp <Ntt> 文書文脈構造化方法及び装置
JP2001290801A (ja) * 2000-02-04 2001-10-19 Fujitsu Ltd 構造文書化システム,構造文書化プログラム,及び、コンピュータ可読格納媒体
JP2002342342A (ja) * 2001-05-17 2002-11-29 Hitachi Ltd 文書管理方法及びその実施システム並びにその処理プログラムと記録媒体
JP2003248690A (ja) * 2003-02-13 2003-09-05 Fuji Xerox Co Ltd 文書処理装置および方法
JP2004355528A (ja) * 2003-05-30 2004-12-16 Internatl Business Mach Corp <Ibm> 情報処理装置、プログラム、及び記録媒体
JP2005018390A (ja) * 2003-06-26 2005-01-20 Hitachi Ltd 記述言語変換方法及び実施システム並びに処理プログラム
JP2005173651A (ja) * 2003-12-05 2005-06-30 Masahiko Tazaki コメント自動生成システム
JP2005267566A (ja) * 2004-03-22 2005-09-29 Mitsubishi Electric Corp 構造化文書作成装置及び構造化文書作成方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4111552B2 (ja) * 1994-06-28 2008-07-02 富士通株式会社 文書自動マーク付け装置及び方法
JPH1063649A (ja) * 1996-08-15 1998-03-06 Niigata Nippon Denki Software Kk タグ付加文書作成方法および装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339312A (ja) * 1999-05-31 2000-12-08 Toshiba Corp 文書編集システム及びタグ情報管理テーブル作成方法
JP2001195400A (ja) * 2000-01-17 2001-07-19 Nippon Telegr & Teleph Corp <Ntt> 文書文脈構造化方法及び装置
JP2001290801A (ja) * 2000-02-04 2001-10-19 Fujitsu Ltd 構造文書化システム,構造文書化プログラム,及び、コンピュータ可読格納媒体
JP2002342342A (ja) * 2001-05-17 2002-11-29 Hitachi Ltd 文書管理方法及びその実施システム並びにその処理プログラムと記録媒体
JP2003248690A (ja) * 2003-02-13 2003-09-05 Fuji Xerox Co Ltd 文書処理装置および方法
JP2004355528A (ja) * 2003-05-30 2004-12-16 Internatl Business Mach Corp <Ibm> 情報処理装置、プログラム、及び記録媒体
JP2005018390A (ja) * 2003-06-26 2005-01-20 Hitachi Ltd 記述言語変換方法及び実施システム並びに処理プログラム
JP2005173651A (ja) * 2003-12-05 2005-06-30 Masahiko Tazaki コメント自動生成システム
JP2005267566A (ja) * 2004-03-22 2005-09-29 Mitsubishi Electric Corp 構造化文書作成装置及び構造化文書作成方法

Also Published As

Publication number Publication date
JP2007219579A (ja) 2007-08-30

Similar Documents

Publication Publication Date Title
US8849726B2 (en) Information processing apparatus and control method for the same
AU2007200385B2 (en) Re-usuable clauses
US20070150494A1 (en) Method for transformation of an extensible markup language vocabulary to a generic document structure format
US9286272B2 (en) Method for transformation of an extensible markup language vocabulary to a generic document structure format
JP4815934B2 (ja) テキストマイニング装置、テキストマイニング方法、テキストマイニングプログラム
US20060282469A1 (en) Method and device for configuring a variety of medical information
JP2005234837A (ja) 構造化文書処理方法、構造化文書処理システム及びそのプログラム
US20060271850A1 (en) Method and apparatus for transforming a printer into an XML printer
JP4519081B2 (ja) ドキュメント変換装置、およびプログラム
JP4666996B2 (ja) 電子ファイリングシステム、電子ファイリング方法
US7900136B2 (en) Structured document processing apparatus and structured document processing method, and program
JP2008129434A (ja) 音声合成サーバシステム
JP5400344B2 (ja) ドキュメント変換装置、およびプログラム
JP5697648B2 (ja) 単語分割装置、単語分割用辞書のデータ構造、単語分割方法、およびプログラム
JP2002215519A (ja) ウェブページ生成方法およびシステム、ウェブページ生成プログラム、記録媒体
CN116028062A (zh) 目标代码的生成方法、npu指令的显示方法及装置
EP2077505A2 (en) Data compression apparatus, data decompression apparatus, and method for compressing data
JP2019121164A (ja) 文書作成装置、文書作成方法、データベース構築装置、データベース構築方法、およびプログラム
JP6723726B2 (ja) 入力支援装置
JP2010224659A (ja) 情報処理装置、情報処理方法、プログラム及び記憶媒体
JP2005149269A (ja) 構造化文書の処理システム
JPWO2005101210A1 (ja) データ解析装置およびデータ解析プログラム
JP5206675B2 (ja) 構造化文書変換装置
JP7083473B2 (ja) 入力支援装置
JP2004145736A (ja) 文字認識装置および文字認識データ出力方法およびプログラムおよび記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080714

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20080724

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20080812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080818

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090105

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090519

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090626

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090925

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091211

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100309

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100514

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100518

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4519081

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees