JP2014175000A - ファイル変換方法及びシステム - Google Patents

ファイル変換方法及びシステム Download PDF

Info

Publication number
JP2014175000A
JP2014175000A JP2014043565A JP2014043565A JP2014175000A JP 2014175000 A JP2014175000 A JP 2014175000A JP 2014043565 A JP2014043565 A JP 2014043565A JP 2014043565 A JP2014043565 A JP 2014043565A JP 2014175000 A JP2014175000 A JP 2014175000A
Authority
JP
Japan
Prior art keywords
file
pdl
configuration metadata
configuration
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014043565A
Other languages
English (en)
Other versions
JP6130315B2 (ja
Inventor
Kirk Tecu
カーク テク,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Laboratory USA Inc
Original Assignee
Konica Minolta Laboratory USA Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Laboratory USA Inc filed Critical Konica Minolta Laboratory USA Inc
Publication of JP2014175000A publication Critical patent/JP2014175000A/ja
Application granted granted Critical
Publication of JP6130315B2 publication Critical patent/JP6130315B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/116Details of conversion of file system types or formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ファイル形式変換後に、オリジナルファイルに含まれる情報の検索を可能にする。
【解決手段】複数のオブジェクトを含むコンテンツを有するオリジナルファイルを取得し、前記複数のオブジェクトの各々をページ記述言語(PDL)形式にレンダリングしてレンダリングオブジェクトを取得し、前記オリジナルファイルから前記複数のオブジェクトの各オブジェクトに対するタグを抽出し、前記タグに対応する構成ルールに基づき、オブジェクト構成メタデータを生成する。前記オブジェクト構成メタデータは、前記オリジナルファイルにおける前記各オブジェクトの構成のディスクリプションを含み、前記レンダリングオブジェクトと共にPDLファイルに付加される。
【選択図】図2

Description

本発明は、ファイル変換方法及びシステムに関する。
電子文書は、コンピューター装置のユーザーにより、情報を記憶し、共有し、保管し、検索するのに用いられる。このような文書は、一時的に又は永久的にファイルに記憶される。多くの異なるファイル形式が存在する。各ファイル形式は、ファイルのコンテンツがどのようにエンコードされるかを規定する。すなわち、ファイルのコンテンツは、ファイル形式に基づいて読み取られ、表示される。
多くの異なるファイル形式が存在する一方で、ページ記述言語(PDL)ファイル形式は、データの共有及び保管において共通である。PDLファイル(すなわちPDLファイル形式のファイル)を生成するために、ユーザーは、まずワードプロセッシングプログラムのファイル形式等の異なるファイル形式で文書を作成することが多い。その後、ユーザーは文書を有するファイルをPDLファイルに変換する。
変換処理において、テキストに対応するコンテンツは、新たな形式のテキストにおいて文字列検索を可能とするために維持されうる。更に、著作者、作成時間、編集時間及びファイル全体を記述するその他のデータ等のメタデータがファイルを全体として記述するために生成されうる。しかしながら、変換処理においてオリジナルファイルからの他の情報は移されないので、検索可能ではない。
概して、一の側面では、実施形態はファイル変換方法に関する。前記方法は、複数のオブジェクトを含むコンテンツを有するオリジナルファイルを取得する工程を有する。前記方法は、前記複数のオブジェクトの各々をページ記述言語形式にレンダリングして複数のレンダリングオブジェクトを取得する工程と、前記オリジナルファイルから前記複数のオブジェクトの各オブジェクトに対するタグを抽出する工程と、を更に有する。前記方法は、前記タグに対応する構成ルールに基づき、オブジェクト構成メタデータを生成する工程を更に有する。前記オブジェクト構成メタデータは、前記オリジナルファイルにおける前記各オブジェクトの構成のディスクリプションを含み、前記複数のレンダリングオブジェクトと共にPDLファイルに付加され、また、前記PDLファイルにおいて検索可能である。
概して、一の側面では、実施形態はファイル変換システムに関する。前記システムは、複数の構成ルールを有するデータリポジトリと、コンピュータープロセッサーと、コンテンツコンバーターと、構成エクストラクターと、を有する。前記コンテンツコンバーターは、前記コンピュータープロセッサーにおいて動作を実行し、複数のオブジェクトを含むコンテンツを有するオリジナルファイルを取得する工程と、前記複数のオブジェクトの各々をページ記述言語形式にレンダリングして複数のレンダリングオブジェクトを取得する工程と、前記複数のレンダリングオブジェクトをPDLファイルに付加する工程と、
を行うように構成されている。また、前記構成エクストラクターは、前記コンピュータープロセッサーにおいて動作を実行し、前記オリジナルファイルからオブジェクトに対するタグを抽出する工程と、前記データリポジトリから、前記タグに対応する構成ルールを検索する工程と、前記構成ルールに基づき、オブジェクト構成メタデータを生成する工程と、を行うように構成されている。前記オブジェクト構成メタデータは、前記オリジナルファイルにおける前記各オブジェクトの構成のディスクリプションを含む。前記オブジェクト構成メタデータは前記PDLファイルに付加され、前記PDLファイルにおいて検索可能である。
概して、一の側面では、実施形態は、コンピューター読取可能なプログラムコードを含む非一時的なコンピューター読取可能な媒体に関する。前記コンピューター読取可能プログラムコードは、複数のオブジェクトを含むコンテンツを有するオリジナルファイルを取得するものである。また、前記コンピューター読取可能プログラムコードは、前記複数のオブジェクトの各々をページ記述言語形式にレンダリングして複数のレンダリングオブジェクトを取得し、前記オリジナルファイルから前記複数のオブジェクトの各オブジェクトに対するタグを抽出するものである。また、前記コンピューター読取可能プログラムコードは、前記タグに対応する構成ルールに基づき、オブジェクト構成メタデータを生成するものである。前記オブジェクト構成メタデータは、前記オリジナルファイルにおける前記各オブジェクトの構成のディスクリプションを含み、前記複数のレンダリングオブジェクトと共にPDLファイルに付加され、前記PDLファイルにおいて検索可能である。
本発明の他の側面は以下の記述及び添付図面より明らかとなる。
本発明の一以上の実施形態のシステムの概略図である。 本発明の一以上の実施形態のフローチャートである。 本発明の一以上の実施形態のフローチャートである。 本発明の一以上の実施形態のフローチャートである。 本発明の一以上の実施形態の例を示す図である。 本発明の一以上の実施形態のコンピューターシステムを示す図である。
本発明の特定の実施形態について添付の図面を参照して詳細に説明する。一貫性を保つため、種々の図面における同様の要素は同様の参照番号によって示す。
本発明の実施形態の下記の詳細な説明において、多くの特定の詳細事項は、発明の理解をより完全にするために述べられる。しかしながら、本発明をこれらの特定の詳細事項なしで実施しうることは当業者において明らかである。その他の例では、説明を必要以上に複雑化することを避けるため、周知の特徴については詳細に記載していない。
概して、本発明の実施形態はファイル交換方法及びシステムを提供する。具体的には、オリジナルファイルをページ記述言語(PDL)ファイルに変換するにあたり、本発明の一以上の実施形態はオリジナルファイルのコンテンツに関する構成メタデータを付加する。オリジナルファイルは、ファイルのコンテンツに対応する表示オブジェクトを含む。オリジナルファイルからのタグは、PDLファイルにオブジェクト構成メタデータを付加するのに用いられる。
図1は、本発明の一以上の実施形態におけるシステムの概略図を示す。図1に示すように、システムは、PDLコンバーター(102)、データリポジトリ(100)、PDLビューアー(106)及びファイル検索エンジン(104)を含む。図1には、オリジナルファイル(108)及びPDLファイル(110)も示されている。以下、図1の各要素について述べる。
オリジナルファイル(108)は、変換工程への入力ファイルである。例えば、オリジナルファイル(108)は、ワードプロセッサーファイル形式、プレゼンテーションファイル形式、スプレッドシートファイル形式、ハイパーテキストマークアップ言語又はその他のファイル形式でありうる。オリジナルファイル(108)は、一時的に又は半永久的に記憶される。例えば、オリジナルファイルの作成後、変換前に、ユーザーがオリジナルファイル(108)を保存した場合と保存しなかった場合がある。
本発明の一以上の実施形態において、オリジナルファイル(108)はオリジナル文書コンテンツ(112)を含む。オリジナル文書コンテンツ(112)はファイルにおける表示データに対応する。具体的には、オリジナル文書コンテンツ(112)は、ユーザーがオリジナルファイルの作成に用いられるプログラムを用いてオリジナルファイルを見たときに表示されるデータを含む。オリジナル文書コンテンツ(112)はオブジェクトを含む。各オブジェクトは、テキスト、グラフィック画像又は表示可能なコンテンツの他の部分である。グラフィック画像は、ビットマップによる画像及びベクトルによるグラフィック画像を含みうる。例えば、グラフィック画像は、定型文(例えばワードアート)、図表、絵画風画像又はその他のグラフィックスである。オリジナル文書コンテンツ(112)におけるオブジェクトは、一以上の隠しタグによって区切られてもよい。タグは、一以上のオブジェクトのフォーマッティング及びタイプ情報を特定する。フォーマッティングはオブジェクトがどのように表示されるかについて記述する。フォーマッティングは、色、サイズ、陰影、画像ファイル名(例えばpuppy.jpg)及び他のそうした情報を含みうる。タイプとは、オブジェクトが何であるかを言う。例えば、タイプは、特定の種類の図表、ワードアート、テキスト、画像、テーブル、クリップアート、箇条書きリスト及び他のそうしたタイプである。本発明の一以上の実施形態では、図表、ワードアート、画像及びクリップアートはグラフィックタイプと呼ばれる。
引き続きタグについて、例として、パイグラフオブジェクト(すなわちパイグラフに対応するオブジェクト)は、パイグラフを特定する隠れ開始タグ及び隠れ終了タグによって、オリジナルファイルの残りの部分から区切られる。パイグラフ内で、オブジェクトは、パイグラフの各部分のサイズ及び該部分の色を規定するタグでありうる。棒グラフオブジェクトは、棒グラフを特定する隠れ開始タグ及び隠れ終了タグによって、オリジナルファイルの残りの部分から区切られる。テキストは、テキストのフォントサイズ、フォント名、フォントカラー及びその他の属性を特定するタグによって区切られる。図1は単一ファイルを示しているが、ファイルは複数のファイルから構成されてもよい。複数のファイルの各々は、オブジェクトの少なくとも一つについて、オリジナルファイル形式に符号化を含む場合がある。
本発明の一以上の実施形態において、オリジナルファイル(108)はオリジナルファイルメタデータ(114)をも含む。オリジナルファイルメタデータ(114)は、ファイル全体を記述するデータに対応する。例えば、オリジナルファイルメタデータ(114)は、著作者、作成時間、編集時間、セキュリティーパラメータ、主題、タイトル、ファイル名、その他のオリジナルファイル全体についてのデータを含む。
PDLファイル(110)は、PDL形式であるファイルに対応する。ファイルがPDLで書き込まれると、ファイルはPDL形式となる。本発明の一以上の実施形態では、PDLは、ファイルコンテンツの一以上のオブジェクト(例えば、テキスト文字、記号、並びに、画像、写真及びクリップアート等を含むグラフィックオブジェクト)に対して、明確な或いは非常に簡単に生成された位置決めの詳細(すなわち座標)を提供する。更に、PDLは、ファイルコンテンツの間のページ区切りを識別する。例としてのPDLは、これらに限定されないが、デバイス独立ファイル形式(DVI)、ポータブルドキュメント形式(PDF)、PostScript(登録商標)及びXML Paper Specification(XPS)を含む。PostScriptはカリフォルニアのサンノゼにあるアドビシステムズ社の登録商標である。
PDLファイル(110)は、PDL文書コンテンツ(116)、コンテンツ構成メタデータ(118)及びPDLファイルメタデータ(120)を含む。PDL文書コンテンツ(116)は、オリジナル文書コンテンツ(112)の翻訳に対応する。オリジナルファイルの構成の少なくとも一部分は、翻訳においてレンダリングされない。すなわち、オリジナルファイル(108)のタグは、PDL文書コンテンツ(116)のオブジェクトを区切ることから除外される場合がある(すなわち一以上のタグは変換工程において事実上失われる)。タグの除去は、オブジェクトとオブジェクトのタイプとフォーマッティングとの明確な関連性を取り除く。例えば、オリジナル文書コンテンツ(112)がワードアートオブジェクト及び/又は図表オブジェクトを含む場合、PDL文書コンテンツ(116)は画像に翻訳されたワードアートオブジェクト及び/又は図表オブジェクトを含む。画像としてレンダリングされたPDL文書コンテンツ(116)のオブジェクトは、PDL形式において互いに識別不可能である。本発明の一以上の実施形態では、PDL文書コンテンツ(116)は、オリジナルファイル(108)に含まれるオブジェクトをスクリーンに同じく表示するためのすべての情報を含んでいる。
コンテンツ構成メタデータ(118)は、オリジナル文書コンテンツ(112)においてオブジェクトがどのように構成されているかを記述するメタデータである。具体的には、コンテンツ構成メタデータ(118)は、PDL文書コンテンツにおける少なくとも一つのオブジェクトに対して、オブジェクト構成メタデータを含んでいる。オブジェクト構成メタデータは、オリジナルファイルにおけるオブジェクトの構成のディスクリプションを含む。具体的に、該ディスクリプションは、特定のオブジェクトについて、オブジェクトのタイプ及びオブジェクトに対するフォーマッティングを特定する。オブジェクト構成メタデータ(118)は、更にオブジェクトの位置を含みうる。各オブジェクトの位置は、例えば、オブジェクトが位置するページのページ番号やページにおけるx及びy座標によって特定される。本発明の一以上の実施形態では、コンテンツ構成メタデータ(118)は、PDLファイルを表示するためにレンダリングするのに用いられない。かかる実施形態では、コンテンツ構成メタデータ(118)は情報提供を目的とする。すなわち、コンテンツ構成メタデータ(118)は、本発明の一以上の実施形態における検索のためだけ等、情報提供の目的にのみ用いられる。図1ではコンテンツ構成メタデータ(118)はPDL文書コンテンツ(116)と別であるように示されているが、コンテンツ構成メタデータ(118)はPDL文書コンテンツ(116)に組み込まれてもよい。
コンテンツ構成メタデータ(118)とは対照的に、PDLファイルメタデータ(120)は、PDLファイル(110)全体についてのデータである。具体的に、PDLファイルメタデータ(120)は、PDL文書コンテンツ(116)における個々のオブジェクトについての情報を提供するのではなく、全PDLファイル(110)についての情報を提供する。例えば、PDLファイルメタデータ(120)は、ファイル名、ファイル作成日、ファイル編集日、PDL文書コンテンツ(116)のタイトル、著者、セキュリティ追跡情報及びその他のPDLファイル(110)に関する情報を含む。
引き続き図1について、本発明の一以上の実施形態において、データリポジトリ(100)は、データを記憶するためのいかなる種類の記憶ユニット及び/又はデバイス(例えば、ファイルシステム、データベース、テーブルの集合又はその他の記憶機構)であってもよい。また、データリポジトリ(100)は、複数の異なる記憶ユニット及び/デバイスを有しうる。複数の異なる記憶ユニット及び/又はデバイスは、同じタイプである場合やそうでない場合、また、同じ物理的位置にある場合やそうでない場合がある。データリポジトリ(100)は、本発明の一以上の実施形態における変換ルール(122)及び構成ルール(124)を記憶する機能を有する。
変換ルール(122)は、各タイプのオブジェクトに対して、オブジェクトをPDL文書コンテンツ(116)にレンダリングするためのPDL形式を特定する。具体的には、変換ルール(122)は、オリジナルオブジェクトをどのようにPDLオブジェクトに翻訳するか特定する。例えば、変換ルールは、図表又はワードアートからビットマップ画像を作成することを特定する。
構成ルール(124)は、コンテンツ構成メタデータ(118)に付加するオブジェクト構成メタデータを特定する。本発明の一以上の実施形態では、オブジェクトを区切る一以上のタグに対して個々の構成ルールが存在する。構成ルール(124)は、一以上のタグをディスクリプションと関連づける。前記ルールにおける、そして、オブジェクト構成メタデータにおけるディスクリプションは、該ディスクリプションにおける用語の変化を含む場合がある。本発明の一以上の実施形態では、変化とは、つづりの変化、同義語、その他の変化である。例えば、ディスクリプションの「パイグラフ(pie chart)」は、ディスクリプションにおける「パイグラフ(pi chart)」、「グラフ(chart)」及び「円グラフ(circle chart)」をも含みうる。
引き続き図1について、PDLコンバーター(102)は、オリジナルファイル(108)をPDLファイル(110)に変換する機能を有するソフトウェアツールに対応する。PDLコンバータ(102)は、コンテンツコンバーター(126)及び構成エクストラクター(128)を含む。コンテンツコンバーター(126)は、オリジナル文書コンテンツ(112)からPDL文書コンテンツ(116)を生成する機能を有する。本発明の一以上の実施形態では、コンテンツコンバーターは変換ルール(122)と動作可能に接続されており、該変換ルールを用いて変換を行う機能を有する。
本発明の一以上の実施形態では、構成エクストラクター(128)は、オリジナル文書コンテンツ(112)からコンテンツ構成メタデータ(118)を生成する機能を有する。具体的には、構成エクストラクター(128)は構成ルール(124)と動作可能に接続されている。構成エクストラクター(128)は、オリジナル文書コンテンツ(112)から一以上のタグを取得し、該一以上のタグが構成ルールと一致するか否かを決定し、該一以上のタグが一致する場合はオブジェクト構成メタデータを生成する機能を有する。
引き続き図1について、ファイル検索エンジン(104)は、特定のプロパティを特定している検索要求を受信する機能を有する。該プロパティは、コンテンツ構成メタデータ(118)におけるディスクリプション、ファイルメタデータ(例えば、オリジナルファイルメタデータ(114)やPDLファイルメタデータ(120))の一以上の部分、コンテンツにおける一以上のオブジェクト、又はそれらの組合せを含む。また、ファイル検索エンジン(104)は、検索要求における特定のプロパティを有する一以上のファイルを識別して返信する機能を有する。本発明の一以上の実施形態では、ファイル検索エンジン(104)は、オペレーティングシステムによって提供されるツールである。
本発明の一以上の実施形態において、PDLビューアー(106)は、PDLファイル(110)を表示する機能を有する。具体的に、PDLビューアー(106)は、PDLファイル(110)を読み取り、該PDLファイル(110)を表示ウィンドウ(132)に表示する機能を有する。PDLビューアー(106)は、PDLビューアー検索エンジン(130)を有する。PDLビューアー検索エンジン(130)は、現在表示されているPDLファイルに対する検索要求を受信する機能を有する。検索要求は特定のプロパティを含む。該プロパティは、コンテンツ構成メタデータにおけるディスクリプション若しくはその部分、コンテンツにおける一以上のオブジェクト、又はそれらの組合せを含む。また、ビューアー検索エンジン(130)は、オブジェクトが検索要求のプロパティを有するか否かを識別し、オブジェクトを有するPDLファイルの部分を表示ウィンドウ(132)に表示する機能を有する。識別されたオブジェクトは、表示ウィンドウ(132)において強調表示されてもよい。
本発明の一以上の実施形態において、PDLビューアー検索エンジン及び/又はファイル検索エンジンは、標準ツールであってもよい。かかる実施形態では、コンテンツ構成メタデータは、オブジェクトを覆う又はオブジェクトに近接する不可視の又は隠し文字列であってもよい。すなわち、かかる実施形態では、コンテンツ構成メタデータは、PDLファイルを見る際に、ユーザーの目に見えないPDL文書コンテンツの一部となる。
図1は構成要素の構成を示すが、本発明の範囲を逸脱することなく、他の構成が用いられてもよい。例えば、種々の構成要素を組み合わせて一つの構成要素を作成してもよい。具体的には、構成ルール(124)は、本発明の範囲を逸脱することなく、構成エクストラクター(128)の一部とされてもよい。他の例としては、一つの構成要素が実行する機能を一以上の構成要素が実行してもよい。
図2、図3A及び図3Bは、本発明の一以上の実施形態のフローチャートを示す。これらのフローチャートにおける種々の工程が順次示され説明されるが、該工程の一部又は全部は異なる順序で実行され、組み合わされ又は省略される場合があり、また、該工程の一部又は全部が平行して実行される場合もある。更に、該工程は能動的に又は受動的に実行される。例えば、一部の工程は、本発明の一以上の実施形態に従い、ポーリングを用いて実施されるか、割り込み駆動方式であってもよい。例として、決定工程は、本発明の一以上の実施形態に従い、条件が存在することを示すために、割り込みが受信されない限り、指示の処理をプロセッサーに要求しない場合がある。他の例として、決定工程は、本発明の一以上の実施形態に従い、データ値をチェックして該値がテスト済の条件と一致するか否かをテストする等、テストの実行により実行される場合がある。
図2は、本発明の一以上の実施形態におけるPDLファイルの生成工程のフローチャートである。ステップS201において、オリジナルファイルが取得される。具体的には、ユーザーは、オリジナルファイルの識別子によりPDLコンバーターを起動することができる。例えば、オリジナルファイルは、該オリジナルファイルを解釈し表示するプログラムを用いて開かれ、ユーザーは、開かれたファイルをPDLに変換するよう要求する場合がある。他の例としては、ユーザーはオリジナルファイルを選択し、オペレーティングシステムインタフェースを通して、ファイルをPDLに変換することを要求する場合がある。いくつかの実施形態では、ユーザーは、コンテンツ構成メタデータを記憶するために設定されるデフォルトパラメータを要求し又は有する。いくつかの他の実施形態では、コンテンツ構成メタデータは常に記憶される。ここで用いられるように、ユーザーは、直接的又は間接的に(例えばスクリプトを介して)変換を開始する場合、変換を要求する。ユーザーが変換を要求すると、オリジナルファイルはコンバーターに渡る。
ステップ203では、本発明の一以上の実施形態におけるオリジナルファイルにおいてオブジェクト及びオブジェクトの位置が識別される。オブジェクト及びオブジェクトの位置の識別には標準的な技術を用いることができる。例えば、オブジェクト及びオブジェクトの位置の識別は、オリジナルファイルを解析し、タグにより区切られたオブジェクトを抽出することによって行われる。
ステップS205では、本発明の一以上の実施形態のオリジナルファイルにおいて各オブジェクトに対するタグが取得される。具体的には、オブジェクトに対応する一以上のタグの組が、テンポラリーデータ構造におけるオブジェクトに関連づけられる。本発明の一以上の実施形態において、一以上のタグの組は、同じ種類の開始タグ及び終了タグの間にあるオブジェクトに基づいて識別される。
ステップ207において、各オブジェクトは、本発明の一以上の実施形態のPDL形式にレンダリングされる。各オブジェクトのレンダリングは、オブジェクトをPDL形式に翻訳することを含む。例えば、図表、グラフ及び他のそのようなオブジェクトが画像に変換される。該オブジェクトを画像に変換することによって、該オブジェクトを見るのに専用のソフトウェアが必要なくなる。レンダリングされたオブジェクトは、PDLファイルに付加される。更に、タグにおけるデータの一部は、オリジナルファイルの変換過程において事実上失われる。しかしながら、当該データがオブジェクト構成メタデータを介して維持される場合もある。
ステップS209において、オブジェクトに対する一以上のタグが構成ルールに一致するか否かが決定される。具体的には、オブジェクトに対応するタグの組が、構成ルールにおける各ルールと比較される。構成ルールがオブジェクトに対応するタグ又はその一部を含む場合、一致があると決定される。一致がない場合、フローはステップ215に進み、他の未解析のオブジェクトが存在するか否かが決定される。
一致がある場合、ステップ211において、一致構成ルールに基づき、本発明の一以上の実施形態の前記位置を用いて、オブジェクトについてのオブジェクト構成メタデータが生成される。特に、一致構成ルールから、該一致構成ルールのディスクリプションが取得される。本発明の一以上の実施形態において、ディスクリプションは、人間の言語(コンピューター言語の対語)による個々のワードを有する。したがって、ディスクリプションは、人間の言語による検索文字列を用いて検索することができる。ディスクリプションは、オブジェクト構成メタデータに付加される。更に、ステップ203で得られた位置がオブジェクト構成メタデータに付加され、ディスクリプションに関連づけられる。
ステップS213において、オブジェクト構成メタデータは、PDLファイルに付加される。本発明の一以上の実施形態において、オブジェクト構成メタデータは、コンテンツ構成メタデータを有するPDLファイルの別の部分に保存される。一以上の実施形態では、オブジェクト構成メタデータは、オブジェクトと共にPDLファイルに組み込まれる。すなわち、オブジェクト構成メタデータは、PDLファイルのオブジェクトの隣(或いは上/下)において、PDLファイルに付加されうる。オブジェクト構成メタデータは、PDL文書コンテンツを表示する際にオブジェクト構成メタデータがビューアーに解釈されないように付加されうる。本発明の一以上の実施形態では、オブジェクト構成メタデータは隠しコンテンツとしてPDLファイルに加えられる。隠しコンテンツは、表示されない文書コンテンツに対応する。
ステップ211及び213は一つの一致ルールを開示するが、複数の一致ルールが同じオブジェクトに関連づけられてもよい。かかる実施形態では、各一致ルールについてのディスクリプションがオブジェクト構成メタデータに付加される。
ステップ215において、他の未解析オブジェクトが存在するか否かについての決定が行われる。特に、各オブジェクトは解析され、一以上のルールがオブジェクトと一致するか否かが決定される。他に未解析のオブジェクトが存在すると決定された場合は、ステップ209により、他のオブジェクトを解析すべく前記方法が繰り返される。他の未解析オブジェクトが存在しない場合は、ステップ217においてPDLファイルの生成が完了する。いったん完了すると、PDLファイルを見ること及び検索することが可能となる。
上述のフローチャートにおいて、PDLファイルが作成されると、オブジェクト構成メタデータがそのように生成されたPDLファイルに付加される。しかしながら、本発明はかかる特定の実施に限定されない。例えば、PDLファイルの生成は、ステップ217が実行されるまで保留することができる。この場合、レンダリングされたオブジェクト及びオブジェクト構成メタデータはいったんメモリー領域に保存され、その後、PDLファイル形式にコンパイルされる。
図3Aは、特定の構成を有するオブジェクトのためのPDLファイルにおける検索のフローチャートを示す。検索要求(search request)及び捜索要求(find request)は、ここでは同様に用いられ、クエリーの文字列に対する一以上の一致のための、一以上のファイルにおける任意のクエリー文字列を言う。
ステップS301において、PDL文書に対し、オブジェクト構成を特定している検索要求がユーザーから受信される。本発明の一以上の実施形態において、ユーザーはPDLビューアーでPDL文書を開くことができる。ユーザーは、PDLビューアーにおいて検索ダイアログボックスを開き、オブジェクト構成を特定する検索文字列を打ち込むことができる。例えば、ユーザーがワードアートを探しているが、該ワードアートの特定のワードを思い出せない場合、ユーザーは検索ダイアログボックスに「ワードアート」と入力することができる。本発明の一以上の実施形態では、現存する(例えばレガシー)検索エンジンがコンテンツ構成メタデータを検索することができるように、コンテンツ構成メタデータをPDLファイルに付加する。
ステップ303において、PDL文書が検索され、オブジェクト構成を有するオブジェクトの位置が特定される。本発明の一以上の実施形態では、ビューアー検索エンジンは、コンテンツ構成メタデータ内を検索し、検索文字列と一致するディスクリプションを識別する。検索の実施において、ビューアー検索エンジンは、PDL文書コンテンツを含むPDLファイル全体を検索することができる。或いは、ビューアー検索エンジンがコンテンツ構成メタデータを検索するだけの場合もある。本発明の一以上の実施形態では、一致がみられた場合は、PDLビューアーは位置を取得する。位置は、オブジェクト構成メタデータにおいて明確に特定されるか、オブジェクト構成メタデータの位置に基づいて識別される。
ステップ305では、本発明の一以上の実施形態におけるオブジェクトの位置がユーザーに提示される。位置の提示には、一致するオブジェクト構成メタデータに対応するオブジェクトを強調すること、並びに/又は前記位置をページ及びページ上の場所によってリスト化することが含まれる。代替的に又は追加的に、位置の提示には、現在の表示をオブジェクトの中心に置くことが含まれる。特許請求の範囲を逸脱することなく、位置をリスト化する他の技術を用いることができる。
図3Bは、特定された構成のオブジェクトを有する文書の検索工程を示すフローチャートである。ステップ307では、本発明の一以上の実施形態における、オブジェクト構成を特定している検索要求がユーザーから受信される。例えば、ユーザーは、オペレーティングシステムでファイル検索エンジンダイアログボックスを開く。ファイル検索エンジンを用いて、ユーザーは任意のパラメータ(例えば、ファイルメタデータの構成要素)及びオブジェクト構成を特定する検索文字列を特定することができる。検索文字列の入力は、上記ステップ301に記載したように実行される。
ステップS309では、ファイルが検索され、本発明の一以上の実施形態におけるオブジェクト構成のPDLファイルが識別される。特に、ファイル検索エンジンが各ファイルを検索して、任意のパラメータと一致し、該オブジェクト構成のオブジェクトを有するファイルを識別する。一致するオブジェクト構成の検索は、上述のように実行される。
ステップ311において、本発明の一以上の実施形態におけるPDLファイルがユーザーに提示される。具体的には、一致がみられた場合、一致するPDLファイル又は一致するPDLファイルへのリンクがユーザーに対して表示される。
図3A及び図3Bに示すように、実施形態は、文書コンテンツについてのみならず、オリジナルファイルにおいて文書コンテンツがどのように構成されているかについてPDLファイルを検索することを可能とする。これにより、ユーザーが構成を覚えているが特定のテキストを覚えていない場合でも、ユーザーはPDLファイル又は構成に一致するオブジェクトを検索することができる。
図4は、本発明の一以上の実施形態の例を示す。下記の例は説明のためのものであって、本発明の範囲を限定するものではない。ユーザーがパイグラフを含むスライドでプレゼンテーションファイルを作成する場合を考える。ユーザーは、例えば、マイクロソフト(登録商標)パワーポイント(登録商標)2007(パワーポイントはワシントン州レドモンドにあるマイクロソフト社の登録商標である)を用いて、プレゼンテーションファイルを作成することができる。ユーザーがマイクロソフト(登録商標)パワーポイント(登録商標)2007を用いてファイルを作成する例では、プレゼンテーションファイルはOOXML形式である。
次に、ユーザーは、マイクロソフト(登録商標)パワーポイント(登録商標)2007を有しない可能性がある他のユーザーにプレゼンテーションファイルを配布しようとする。したがって、ユーザーはPDFコンバーターにプレゼンテーションファイルをPDF形式に変換するよう要求する。PDFコンバーターは、標準オブジェクトコンテンツをPDFファイルにレンダリング及びアセンブルするのみならず、オブジェクトのタグデータを取り出し、下記のようにオブジェクト構成メタデータを不可視文字列としてオブジェクトの上に適用する。
PDFコンバーターのOOXML仕様に関する情報により、PDFコンバーターは、ppt/charts/_rels/chart1.xmlにおけるOOXMLファイルのタグ「c:pieChart」を見つけ出し、該タグを抽出する。更に、PDFコンバーターは、「パイグラフ(pie chart)」の検索向け文字列を作成し、該検索向け文字列を、可視層中にレンダリングされたパイグラフの中心位置の上に、不可視テキストとして適用する(これは変換ツールにおいて可能な論理/ルールの単なる例である)。PDFコンテンツ及びコンテンツ構成メタデータは、PDFにアセンブルされ保存される。
図4は、本発明の一以上の実施形態において結果として得られるPDFファイル(400)の例を示す。図のように、PDF文書コンテンツ(402)は、ユーザーにより生成されたパイグラフ(404)及び対応するリスト(412)を含む。PDF文書コンテンツ(402)にレンダリングされたパイグラフ(404)は画像であり、リスト(412)はテキストである。コンテンツ構成メタデータ(408)は、PDFファイル(400)の作成時に生成される。コンテンツ構成メタデータ(408)は、PDF文書コンテンツ(402)の上の不可視層である。図4において、コンテンツ構成メタデータ(408)は、明確性のため別に示している。図4に示すように、コンテンツ構成メタデータ(408)は、PDF文書コンテンツ(402)のパイグラフ(404)上における「パイグラフ」とのディスクリプションを含むパイグラフメタデータ(410)を有する。また、コンテンツ構成メタデータ(408)は、PDF文書コンテンツ(402)のリスト(412)上における「リスト」とのディスクリプションを含むパイグラフメタデータ(410)を有する。
引き続き上記の例において、ユーザーはPDFファイル(400)を配布し、保管する。その後、ユーザーは見直しのために文書を検索しようとする。しかしながら、ユーザーはパイグラフのタイトル「売り上げ数量‐2013」を思い出すことができない。構成エクストラクター及びコンテンツ構成メタデータの記憶により、ユーザーは文書の「高水準」プロパティ(例えば、大文字・小文字を区別しない検索エンジンを使用する場合は「パイグラフ(Pie Chart)」又は「パイグラフ(pie chart)」)を検索することができ、「パイグラフ(pie chart)」の文字列がPDFにおいて見えない場合でも、パイグラフ(404)を含むPDFファイル(400)をうまく見つけることができる。
本発明の実施形態は、使用されるプラットフォームに関わらず、事実上いかなる種類のコンピューティングシステムにおいても実施することができる。例えば、コンピューティングシステムは、一以上のモバイル機器(例えば、ラップトップコンピューター、スマートフォン、パーソナルデジタルアシスタント(PDA)、タブレットコンピューター若しくは他のモバイル機器)、デスクトップコンピューター、サーバ、サーバシャーシのブレード、或いは、本発明の一以上の実施形態を実施するための最小の処理パワー、メモリー及び入力/出力デバイスを少なくとも有する、他のいかなる種類のコンピューティングデバイスであってもよい。例えば、図5に示すように、コンピューティングシステム(500)は、一以上のコンピュータープロセッサー(502)、関連するメモリー(504)(例えば、ランダムアクセスメモリー(RAM)、キャッシュメモリー、フラッシュメモリー等)、一以上の記憶デバイス(506)(例えば、ハードディスク、コンパクトディスク(CD)ドライブやデジタル多用途ディスク(DVD)ドライブ等の光学デバイス、フラッシュメモリースティック等)、及び他の多くの要素及び機能性を有する。コンピュータープロセッサー(502)は、処理命令のための集積回路でありうる。例えば、コンピュータープロセッサーは、一以上のコア、又はプロセッサーのマイクロコアでありうる。また、コンピューティングシステム(500)は、タッチスクリーン、キーボード、マウス、マイクロホン、タッチパッド、電子ペン、その他のいかなる入力デバイスをも含む一以上の入力デバイス(510)を含む。更に、コンピューティングシステム(500)は、スクリーン(液晶ディスプレイ(LCD)、プラズマディスプレイ、タッチスクリーン、ブラウン管(CRT)モニター、プロジェクター、又は他のディスプレイデバイス)等の一以上の出力デバイス(508)、プリンター、外部記憶装置、又は他のいかなる出力デバイスをも含む一以上の出力デバイス(508)を含む。一以上の出力デバイスは、入力デバイスと同じであってもよく、違うものであってもよい。コンピューティングシステム(500)は、ネットワークインターフェース接続(図示せず)を介して、ネットワーク(514)(例えば、ローカルエリアネットワーク(LAN)、インターネット等のワイドエリアネットワーク(WAN)、モバイルネットワーク、及び他のあらゆるネットワーク)に接続されうる。入力及び出力デバイスは、局所的に又は遠隔的に(例えばネットワーク512を介して)、コンピュータープロセッサー(502)、メモリー(504)、及び記憶デバイス(506)に接続される。多くの異なる種類のコンピューティングシステムが存在するため、上記入力及び出力デバイスは他の形をとってもよい。
本発明の実施形態を実施するコンピューター読取可能なプログラムコードの形をとるソフトウェア命令は、全部又は一部において、一時的に又は永久的に、CD、DVD、記憶デバイス、ディスケット、テープ、フラッシュメモリー、物理メモリー等の非一時的コンピューター読取可能な媒体、又は他のあらゆるコンピューター読取可能な記憶媒体に記憶されうる。具体的には、上記ソフトウェア命令は、プロセッサーによって実行される際に、本発明の実施形態を実施するように構成されているコンピューター読取可能なプログラムコードに対応する。
更に、上記コンピューティングシステム(500)の一以上の要素は、遠隔地にあり、ネットワーク(514)越しに他の要素と接続されてもよい。更に、本発明の実施形態は、複数のノードを有する分散システムであって、発明の各々の部分が分散システム内の異なるノードに位置するものにおいて実行されてもよい。本発明の一の実施形態では、ノードは別個のコンピューティングデバイスに対応する。又は、ノードは、関連する物理メモリーを備えたコンピュータープロセッサーに対応してもよい。或いは、ノードは、コンピュータープロセッサー、又は共有メモリー及び/又はリソースを備えるコンピュータープロセッサーのマイクロコアと対応してもよい。
本発明は限られた数の実施形態に関して説明されたが、本開示の利益を有する当業者であれば、本明細書に開示される本発明の範囲を逸脱しない他の実施形態を考案しうることがわかる。したがって、本発明の範囲は、添付の特許請求の範囲によってのみ限定されるものである。

Claims (24)

  1. 複数のオブジェクトを含むコンテンツを有するオリジナルファイルを取得する工程と、
    前記複数のオブジェクトの各々をページ記述言語(PDL)形式にレンダリングして複数のレンダリングオブジェクトを取得する工程と、
    前記オリジナルファイルから前記複数のオブジェクトの各オブジェクトに対するタグを抽出する工程と、
    前記タグに対応する構成ルールに基づき、前記オリジナルファイルにおける前記各オブジェクトの構成のディスクリプションを含むオブジェクト構成メタデータを生成する工程と、
    前記各オブジェクトに対する前記オブジェクト構成メタデータ及び前記複数のレンダリングオブジェクトをPDLファイルに付加する工程であって、前記オブジェクト構成メタデータは前記PDLファイルにおいて検索可能である工程と、
    を有することを特徴とするファイル変換方法。
  2. 前記PDLファイルは、前記オブジェクト構成メタデータの生成前に生成されることを特徴とする請求項1に記載の方法。
  3. 前記PDLファイルは、前記オブジェクト構成メタデータの生成後に生成されることを特徴とする請求項1に記載の方法。
  4. 前記各オブジェクトはグラフィックオブジェクトであり、前記オブジェクト構成メタデータは前記各オブジェクトのグラフィックタイプを記述することを特徴とする請求項1に記載の方法。
  5. 前記オブジェクト構成メタデータを生成する工程は、
    前記オリジナルファイルのページ上の前記各オブジェクトの位置を検出する工程と、
    前記オブジェクト構成メタデータに前記位置を記憶する工程と、
    を更に有することを特徴とする請求項1に記載の方法。
  6. 前記各オブジェクトの前記構成の前記ディスクリプションを含む検索要求を受信する工程と、
    前記PDLファイルにおいて、前記オブジェクト構成メタデータを有する構成メタデータを検索して、前記オブジェクト構成メタデータを識別する工程と、
    前記オブジェクト構成メタデータから前記位置を検索する工程と、
    を更に有することを特徴とする請求項4に記載の方法。
  7. 前記位置を含む前記PDLファイルの部分を表示する工程を更に有することを特徴とする請求項5に記載の方法。
  8. 前記オブジェクトの前記構成の前記ディスクリプションを含む検索要求を受信する工程と、
    前記PDLファイルを含む複数のPDLファイルにおいて、構成メタデータを検索し、前記PDLファイルにおいて前記オブジェクト構成メタデータを識別する工程と、
    前記PDLファイルの識別子を返信する工程と、
    を更に有することを特徴とする請求項1に記載の方法。
  9. 前記オブジェクト構成メタデータは、前記ディスクリプションについて複数の同義語を含むことを特徴とする請求項1に記載の方法。
  10. 複数の構成ルールを有するデータリポジトリと、
    コンピュータープロセッサーと、
    前記コンピュータープロセッサーにおいて動作を実行し、
    複数のオブジェクトを含むコンテンツを有するオリジナルファイルを取得する工程と、
    前記複数のオブジェクトの各々をページ記述言語(PDL)形式にレンダリングして複数のレンダリングオブジェクトを取得する工程と、
    前記複数のレンダリングオブジェクトをPDLファイルに付加する工程と、
    を行うように構成されたコンテンツコンバーターと、
    前記コンピュータープロセッサーにおいて動作を実行し、
    前記オリジナルファイルから前記複数のオブジェクトの各オブジェクトに対するタグを抽出する工程と、
    前記データリポジトリから、前記タグに対応する構成ルールを検索する工程と、
    前記構成ルールに基づき、前記オリジナルファイルにおける前記各オブジェクトの構成のディスクリプションを含むオブジェクト構成メタデータを生成する工程と、
    前記各オブジェクトについて、前記オブジェクト構成メタデータを前記PDLファイルに付加する工程であって、前記オブジェクト構成メタデータは前記PDLファイルにおいて検索可能である工程と、
    を行うように構成された構成エクストラクターと、
    を有することを特徴とするファイル変換システム。
  11. 前記PDLファイルは、前記オブジェクト構成メタデータの生成前に生成されることを特徴とする請求項10に記載のシステム。
  12. 前記PDLファイルは、前記オブジェクト構成メタデータの生成後に生成されることを特徴とする請求項10に記載のシステム。
  13. 前記オブジェクト構成メタデータを生成する工程は、
    前記オリジナルファイルのページ上の前記各オブジェクトの位置を検出する工程と、
    前記オブジェクト構成メタデータに前記位置を記憶する工程と、
    を更に有することを特徴とする請求項10に記載のシステム。
  14. 前記コンピュータープロセッサーにおいて動作を実行するPDLビューアーを更に備え、
    該PDLビューアーは、
    前記各オブジェクトの前記構成の前記ディスクリプションを含む検索要求を受信する工程と、
    前記PDLファイルにおいて、前記オブジェクト構成メタデータを有する構成メタデータを検索して、前記オブジェクト構成メタデータを識別する工程と、
    前記オブジェクト構成メタデータから前記位置を検索する工程と、
    を行うように構成されたビューアー検索エンジンを有することを特徴とする請求項13に記載のシステム。
  15. 前記PDLビューアーは、前記位置を含む前記PDLファイルの部分を表示するように構成されたディスプレイウィンドウを更に有することを特徴とする請求項14に記載のシステム。
  16. 前記各オブジェクトの前記構成の前記ディスクリプションを含む検索要求を受信する工程と、
    前記PDLファイルを含む複数のPDLファイルにおいて、構成メタデータを検索し、前記PDLファイルにおいて前記オブジェクト構成メタデータを識別する工程と、
    前記PDLファイルの識別子を返信する工程と、
    を行うように構成されたファイル検索エンジンを更に有することを特徴とする請求項10に記載のシステム。
  17. 前記PDLファイルは、
    前記PDLファイルを記述するPDLファイルメタデータと、
    前記オブジェクト構成メタデータを有するコンテンツ構成メタデータと、
    前記PDL形式にレンダリングされた前記複数のオブジェクトを有するPDL文書コンテンツと、
    を有することを特徴とする請求項10に記載のシステム。
  18. 複数のオブジェクトを含むコンテンツを有するオリジナルファイルを取得する工程と、
    前記複数のオブジェクトの各々をページ記述言語(PDL)形式にレンダリングして複数のレンダリングオブジェクトを取得する工程と、
    前記オリジナルファイルから前記複数のオブジェクトの各オブジェクトに対するタグを抽出する工程と、
    前記タグに対応する構成ルールに基づき、前記オリジナルファイルにおける前記各オブジェクトの構成のディスクリプションを含むオブジェクト構成メタデータを生成する工程と、
    前記各オブジェクトに対する前記オブジェクト構成メタデータ及び前記複数のレンダリングオブジェクトをPDLファイルに付加する工程であって、前記オブジェクト構成メタデータは前記PDLファイルにおいて検索可能である工程と、
    を行うためのコンピューター読取可能プログラムコードが内蔵された非一時的コンピューター読取可能媒体。
  19. 前記PDLファイルは、前記オブジェクト構成メタデータの生成前に生成されることを特徴とする請求項18に記載の非一時的コンピューター読取可能媒体。
  20. 前記PDLファイルは、前記オブジェクト構成メタデータの生成後に生成されることを特徴とする請求項18に記載の非一時的コンピューター読取可能媒体。
  21. 前記オブジェクト構成メタデータを生成する工程は、
    前記オリジナルファイルのページ上の前記各オブジェクトの位置を検出する工程と、
    前記オブジェクト構成メタデータに前記位置を記憶する工程と、
    を更に有することを特徴とする請求項18に記載の非一時的コンピューター読取可能媒体。
  22. 前記各オブジェクトの前記構成の前記ディスクリプションを含む検索要求を受信する工程と、
    前記PDLファイルにおいて、前記オブジェクト構成メタデータを有する構成メタデータを検索して、前記オブジェクト構成メタデータを識別する工程と、
    前記オブジェクト構成メタデータから前記位置を検索する工程と、
    を行うためのコンピューター読取可能プログラムコードを更に有することを特徴とする請求項21に記載の非一時的コンピューター読取可能媒体。
  23. 前記位置を含む前記PDLファイルの部分を表示する工程を行うためのコンピューター読取可能プログラムコードを更に有することを特徴とする請求項21に記載の非一時的コンピューター読取可能媒体。
  24. 前記オブジェクトの前記構成の前記ディスクリプションを含む検索要求を受信する工程と、
    前記PDLファイルを含む複数のPDLファイルにおいて、構成メタデータを検索し、前記PDLファイルにおいて前記オブジェクト構成メタデータを識別する工程と、
    前記PDLファイルの識別子を返信する工程と、
    を行うためのコンピューター読取可能プログラムコードを更に有することを特徴とする請求項18に記載の非一時的コンピューター読取可能媒体。
JP2014043565A 2013-03-08 2014-03-06 ファイル変換方法及びシステム Active JP6130315B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/791,661 US9535913B2 (en) 2013-03-08 2013-03-08 Method and system for file conversion
US13/791,661 2013-03-08

Publications (2)

Publication Number Publication Date
JP2014175000A true JP2014175000A (ja) 2014-09-22
JP6130315B2 JP6130315B2 (ja) 2017-05-17

Family

ID=51489177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014043565A Active JP6130315B2 (ja) 2013-03-08 2014-03-06 ファイル変換方法及びシステム

Country Status (2)

Country Link
US (3) US9535913B2 (ja)
JP (1) JP6130315B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016129021A (ja) * 2014-12-31 2016-07-14 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011013125A1 (en) 2009-07-27 2011-02-03 Storwize Ltd. Method and system for transformation of logical data objects for storage
US20150169508A1 (en) * 2013-12-13 2015-06-18 Konica Minolta Laboratory U.S.A., Inc. Obfuscating page-description language output to thwart conversion to an editable format
US9798724B2 (en) * 2014-12-31 2017-10-24 Konica Minolta Laboratory U.S.A., Inc. Document discovery strategy to find original electronic file from hardcopy version
JP6797610B2 (ja) * 2016-08-31 2020-12-09 キヤノン株式会社 装置、方法、及びプログラム
US10997362B2 (en) * 2016-09-01 2021-05-04 Wacom Co., Ltd. Method and system for input areas in documents for handwriting devices
CN113961244B (zh) * 2021-12-22 2022-04-08 深圳市明源云科技有限公司 一种页面转换方法、装置、设备及存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08194697A (ja) * 1994-09-12 1996-07-30 Adobe Syst Inc ページ記述言語ファイル内に記載された単語を識別する方法及び装置
JP2001092952A (ja) * 1999-08-18 2001-04-06 Hewlett Packard Co <Hp> アーティファクトを防止して、装置に依存しないビットマップを合体させる方法
WO2005122010A1 (en) * 2004-06-10 2005-12-22 Icon Biometrics Plc Method and system for in-rip processing and printing of variable documents
JP2006268638A (ja) * 2005-03-25 2006-10-05 Shigenori Tanaka 文書差分検出装置
JP2006285612A (ja) * 2005-03-31 2006-10-19 Canon Inc 情報処理装置およびその方法
JP2009182823A (ja) * 2008-01-31 2009-08-13 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2009277092A (ja) * 2008-05-15 2009-11-26 Canon Inc 画像処理装置及び画像処理方法ならびに画像処理方法を実行させるプログラム
JP2009282709A (ja) * 2008-05-21 2009-12-03 Canon Inc 画像処理装置及びその制御方法、プログラム、記憶媒体
JP2010218098A (ja) * 2009-03-16 2010-09-30 Ricoh Co Ltd 情報処理装置、情報処理方法、制御プログラム及び記録媒体
JP2010287178A (ja) * 2009-06-15 2010-12-24 Sharp Corp 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP2011028503A (ja) * 2009-07-24 2011-02-10 Canon Inc 画像処理装置、画像処理方法、およびプログラム
JP2011505605A (ja) * 2007-10-12 2011-02-24 マイクロソフト コーポレーション ウェブドキュメントセット自動編集システム及びその方法
JP2011141598A (ja) * 2010-01-05 2011-07-21 Canon Inc 画像処理装置、画像処理方法、及びプログラム
JP2013008172A (ja) * 2011-06-24 2013-01-10 Canon Inc フォーマット変換装置、方法、及びプログラム

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001251736A1 (en) 2000-03-27 2001-10-08 Documentum, Inc Method and apparatus for generating metadata for a document
US7076728B2 (en) * 2000-12-22 2006-07-11 International Business Machines Corporation Method and apparatus for end-to-end content publishing system using XML with an object dependency graph
US7019864B2 (en) * 2001-06-22 2006-03-28 Xeikon International N.V. Page composition in an image reproduction system using segmented page elements
US7313754B2 (en) * 2003-03-14 2007-12-25 Texterity, Inc. Method and expert system for deducing document structure in document conversion
US7653876B2 (en) * 2003-04-07 2010-01-26 Adobe Systems Incorporated Reversible document format
US8521737B2 (en) * 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US20060085442A1 (en) 2004-10-20 2006-04-20 Kabushiki Kaisha Toshiba Document image information management apparatus and document image information management program
US8245131B2 (en) * 2005-02-10 2012-08-14 Hewlett-Packard Development Company, L.P. Constraining layout variations for accommodating variable content in electronic documents
US20060224952A1 (en) * 2005-03-30 2006-10-05 Xiaofan Lin Adaptive layout templates for generating electronic documents with variable content
JP4892427B2 (ja) * 2007-07-13 2012-03-07 キヤノン株式会社 画像処理装置、画像処理方法、及び、画像処理プログラム
JP4956319B2 (ja) * 2007-07-30 2012-06-20 キヤノン株式会社 画像処理装置、その制御方法、ならびにそのプログラムおよび記憶媒体
US20090327873A1 (en) * 2008-06-26 2009-12-31 Glen Cairns Page editing
US8359302B2 (en) * 2008-07-02 2013-01-22 Adobe Systems Incorporated Systems and methods for providing hi-fidelity contextual search results
JP5072739B2 (ja) * 2008-07-02 2012-11-14 キヤノン株式会社 画像形成システム、画像形成装置、及び画像処理装置
JP5058904B2 (ja) * 2008-07-15 2012-10-24 キヤノン株式会社 画像処理装置、画像処理方法、及びそのプログラム
JP5226553B2 (ja) * 2009-02-06 2013-07-03 キヤノン株式会社 画像処理装置、画像処理方法、プログラムおよび記録媒体
US20100214614A1 (en) * 2009-02-23 2010-08-26 Andrew Rodney Ferlitsch Context-aware printing method and system
US20140033004A1 (en) * 2010-04-08 2014-01-30 Adobe Systems Incorporated Visualization of a packaged file
US20110295879A1 (en) * 2010-05-27 2011-12-01 Neuone, Llc Systems and methods for document management
US9098471B2 (en) * 2011-12-29 2015-08-04 Chegg, Inc. Document content reconstruction
US9396174B1 (en) * 2015-03-12 2016-07-19 Kabushiki Kaisha Toshiba Inserting and using metadata within a portable document format document

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08194697A (ja) * 1994-09-12 1996-07-30 Adobe Syst Inc ページ記述言語ファイル内に記載された単語を識別する方法及び装置
JP2001092952A (ja) * 1999-08-18 2001-04-06 Hewlett Packard Co <Hp> アーティファクトを防止して、装置に依存しないビットマップを合体させる方法
WO2005122010A1 (en) * 2004-06-10 2005-12-22 Icon Biometrics Plc Method and system for in-rip processing and printing of variable documents
JP2006268638A (ja) * 2005-03-25 2006-10-05 Shigenori Tanaka 文書差分検出装置
JP2006285612A (ja) * 2005-03-31 2006-10-19 Canon Inc 情報処理装置およびその方法
JP2011505605A (ja) * 2007-10-12 2011-02-24 マイクロソフト コーポレーション ウェブドキュメントセット自動編集システム及びその方法
JP2009182823A (ja) * 2008-01-31 2009-08-13 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2009277092A (ja) * 2008-05-15 2009-11-26 Canon Inc 画像処理装置及び画像処理方法ならびに画像処理方法を実行させるプログラム
JP2009282709A (ja) * 2008-05-21 2009-12-03 Canon Inc 画像処理装置及びその制御方法、プログラム、記憶媒体
JP2010218098A (ja) * 2009-03-16 2010-09-30 Ricoh Co Ltd 情報処理装置、情報処理方法、制御プログラム及び記録媒体
JP2010287178A (ja) * 2009-06-15 2010-12-24 Sharp Corp 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP2011028503A (ja) * 2009-07-24 2011-02-10 Canon Inc 画像処理装置、画像処理方法、およびプログラム
JP2011141598A (ja) * 2010-01-05 2011-07-21 Canon Inc 画像処理装置、画像処理方法、及びプログラム
JP2013008172A (ja) * 2011-06-24 2013-01-10 Canon Inc フォーマット変換装置、方法、及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016129021A (ja) * 2014-12-31 2016-07-14 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法

Also Published As

Publication number Publication date
US20180307696A1 (en) 2018-10-25
US20140258258A1 (en) 2014-09-11
US20170075905A1 (en) 2017-03-16
US9535913B2 (en) 2017-01-03
US10366051B2 (en) 2019-07-30
JP6130315B2 (ja) 2017-05-17

Similar Documents

Publication Publication Date Title
JP6130315B2 (ja) ファイル変換方法及びシステム
US10929449B2 (en) Generating a structured document guiding view
US8856647B2 (en) Font handling for viewing documents on the web
US8473911B1 (en) Documentation generation from a computer readable symbolic representation
US9081769B2 (en) Providing translation assistance in application localization
US8484238B2 (en) Automatically generating regular expressions for relaxed matching of text patterns
US9594788B2 (en) Displaying logical statement relationships between diverse documents in a research domain
US9870484B2 (en) Document redaction
US9588941B2 (en) Context-based visualization generation
JP6462970B1 (ja) 分類装置、分類方法、生成方法、分類プログラム及び生成プログラム
WO2011091442A1 (en) System and method for optimizing search objects submitted to a data resource
US10936667B2 (en) Indication of search result
US10339204B2 (en) Converting electronic documents having visible objects
KR20120058544A (ko) 이미지 구성요소의 검색
CN105765564A (zh) 标识语义上有意义的文本选择
US11768804B2 (en) Deep search embedding of inferred document characteristics
JP6384469B2 (ja) 情報処理装置、情報処理システム、制御方法、及びプログラム
CN112699642A (zh) 复杂医疗文书的索引提取方法及装置、介质及电子设备
JP5612552B2 (ja) レイアウト依存文書内のページ参照を解決する方法、コンピューター読取可能媒体及びシステム
US9779068B2 (en) Method for associating fixed and flexible layout modes for reading documents

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150709

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161031

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170413

R150 Certificate of patent or registration of utility model

Ref document number: 6130315

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150