JP2023142628A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2023142628A
JP2023142628A JP2022049610A JP2022049610A JP2023142628A JP 2023142628 A JP2023142628 A JP 2023142628A JP 2022049610 A JP2022049610 A JP 2022049610A JP 2022049610 A JP2022049610 A JP 2022049610A JP 2023142628 A JP2023142628 A JP 2023142628A
Authority
JP
Japan
Prior art keywords
document
pdf
file
converted
pages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022049610A
Other languages
English (en)
Inventor
史織 新井
Shiori Arai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Priority to JP2022049610A priority Critical patent/JP2023142628A/ja
Priority to US17/862,387 priority patent/US20230305995A1/en
Priority to CN202211059492.2A priority patent/CN116842908A/zh
Publication of JP2023142628A publication Critical patent/JP2023142628A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/116Details of conversion of file system types or formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】実際にページに印刷されたときの状態で保存される文書形式にデータ変換することによって変換前の文書に含まれるオブジェクトがページをまたいで表示されるようになる場合、変換前の文書全体を再度データ変換することなく、ページをまたがないオブジェクトを提供可能とする。【解決手段】クラウドシステム10は、ユーザ端末20から取得した元文書と、PDF変換処理部12により元文書をPDF変換して作成されたPDFファイルを紐付けて管理する文書管理部13と、PDFファイルをユーザ端末20に提供するPDF文書提供部14と、を有する。ユーザ端末20において、元文書ではページをまたいでいないもののPDFファイルではまたぐオブジェクトがユーザにより選択されると、PDF変換処理部12は、当該オブジェクトをPDFファイルに紐付く元文書から抽出してPDF変換することでページをまたいでいないオブジェクトを作成する。【選択図】図1

Description

本発明は、情報処理装置及びプログラムに関する。
複数のユーザが1つの文書を共有する場合がある。ある文書アプリケーションを使用して共有対象の文書を作成すると、その文書アプリケーションを使用可能なシステム環境にいないユーザは、共有文書を閲覧することができない。これを回避するために、例えば特別なソフトウェアがなくても文書を同じように扱えるファイルフォーマット、例えばPDF(Portable Document Format)ファイル等に変換して共有する場合がある。PDFファイルは、文書が実際にページに印刷されるときの状態で表示される文書形式の文書である。
特開2013-161375号公報
文書が実際にページに印刷されるときの状態で表示される文書形式の文書に変換された場合、変換前の文書では、図や表等のオブジェクトがページをまたいでいないけれども、変換後の文書では、ページをまたいでしまう場合がある。ページをまたいだ状態では、オブジェクトが参照しづらい場合がある。そのため、ページをまたいでいない状態のオブジェクトを得るために、変換前の文書を探し出して、変換前の文書からページをまたいでいない状態のオブジェクトを作成し直すのは面倒である。
本発明は、実際にページに印刷されたときの状態で保存される文書形式に変換することによって変換前の文書に含まれるオブジェクトがページをまたいで表示されるようになる場合、変換前の文書全体を再度変換することなく、ページをまたがないオブジェクトを提供可能とすることを目的とする。
本発明に係る情報処理装置は、プロセッサを備え、前記プロセッサは、文書が実際にページに印刷されるときの状態で表示される文書形式の文書に変換された場合、変換前後の文書を紐付けて管理し、 変換後の文書においてページにまたいで表示されるようになるオブジェクトを、前記変換後の文書に紐付く変換前の文書から抽出し、抽出したオブジェクトを前記文書形式に変換する、ことを特徴とする。
また、前記プロセッサは、前記文書形式に変換したオブジェクトを前記変換後の文書内に結合させて保存することを特徴とする。
また、前記プロセッサは、前記文書形式に変換したオブジェクトを前記変換後の文書に添付させて保存することを特徴とする。
また、前記プロセッサは、前記変換後の文書における前記オブジェクトの位置と前記文書形式に変換したオブジェクトとの間に文書内リンクを設定することを特徴とする。
本発明に係るプログラムは、コンピュータに、文書が実際にページに印刷されるときの状態で表示される文書形式の文書に変換された場合、変換前後の文書を紐付けて管理する機能、 変換後の文書においてページにまたいで表示されるようになるオブジェクトを、前記変換後の文書に紐付く変換前の文書から抽出する機能、抽出したオブジェクトを前記文書形式に変換する機能、を実現させる。
請求項1に記載の発明によれば、実際にページに印刷されたときの状態で保存される文書形式にデータ変換することによって変換前の文書に含まれるオブジェクトがページをまたいで表示されるようになる場合、変換前の文書全体を再度データ変換することなく、ページをまたがないオブジェクトを提供することができる。
請求項2に記載の発明によれば、変換後の文書とオブジェクトを一体にして管理することができる。
請求項3に記載の発明によれば、外部情報を文書と別のファイルにて保存することができる。
請求項4に記載の発明によれば、変換後の文書においてページをまたいでいるオブジェクトの位置と、ページをまたいでいないオブジェクトとの行き来を容易に行うことができる。
請求項5に記載の発明によれば、実際にページに印刷されたときの状態で保存される文書形式にデータ変換することによって変換前の文書に含まれるオブジェクトがページをまたいで表示されるようになる場合、変換前の文書全体を再度データ変換することなく、ページをまたがないオブジェクトを提供することができる。
本実施の形態におけるネットワークシステムの全体構成及びクラウドシステムのブロック構成の一例を示す図である。 本実施の形態におけるアップロード時処理を示すフローチャートである。 本実施の形態のユーザ端末における画面表示例を示す図である。 本実施の形態における文書管理情報記憶部に記憶される文書管理情報のデータ構成の一例を示す図である。 本実施の形態において、PDFファイルが提供された後のユーザ端末における画面表示例を示す図である。 本実施の形態における文書管理処理を示すフローチャートである。 本実施の形態において、オブジェクトのみが元文書から抽出されてPDF化された後のPDFファイルの構成を示す概念図である。 本実施の形態における文書管理情報記憶部に記憶される文書管理情報のデータ構成の他の例を示す図である。 本実施の形態において、表(PDF)が提供された後のユーザ端末における画面表示例を示す図である。 本実施の形態において、表(PDF)を文書(PDF)に結合させた状態を示す概念図である。 本実施の形態において、表(PDF)を文書(PDF)に添付させた状態を示す概念図である。
以下、図面に基づいて、本発明の好適な実施の形態について説明する。
図1は、本実施の形態におけるネットワークシステムの全体構成及びクラウドシステム10のブロック構成の一例を示す図である。図1には、クラウドシステム10と、ユーザ端末20とがインターネット2で接続されるネットワークシステムが示されている。
ユーザ端末20は、文書管理等のためにクラウドシステム10を利用するユーザが使用する情報処理装置である。ユーザ端末20は、例えば汎用的なPC(Personal Computer)等で実現できる。すなわち、ユーザ端末20は、ハードウェア構成として、CPU、ROM、記憶手段としてのRAM及びハードディスクドライブ(HDD)、ユーザインタフェース、インターネット2に接続する通信手段としてのネットワークインタフェースを内部バスに接続して構成される。ユーザインタフェースは、マウスやキーボード等の入力手段及びディスプレイ等の表示手段を有する。あるいは、入力手段及び表示手段を兼用するタッチパネル等により形成してもよい。
ユーザ端末20には、文書の作成、編集、閲覧等の機能を有する文書アプリケーションがインストールされており、文書処理部21は、この文書アプリケーションの機能によって文書に対して所定の処理を施す。文書アプリケーションとしては、例えば、マイクロソフト社のofficeアプリケーションや、アドビシステム社のPDFを取り扱う各種ソフトや富士フイルムビジネスイノベーション社のDocuWorks(登録商標)などがある。文書処理部21は、一の文書アプリケーション又は複数の文書アプリケーションを連携されることで文書処理を実現する。また、文書の閲覧は、ウェブブラウザを利用してもよい。いずれにしても、文書処理部21は、ユーザ端末20において文書に関する処理を実行する。
なお、ネットワークシステムには、複数のユーザ端末が含まれているが、それぞれに以下に説明する処理機能を同等に有していればよいので、図1には、1台のユーザ端末20のみ図示する。
クラウドシステム10は、クラウド・コンピューティングの一部を利用して構築されるシステムであり、本発明に係る情報処理装置の一形態である1又は複数のコンピュータにより実現される。コンピュータは、ハードウェア構成として、CPU、ROM、記憶手段、インターネット2に接続する通信手段としてのネットワークインタフェース等を有している。クラウドシステム10は、文書取得部11、PDF変換処理部12、文書管理部13、PDF文書提供部14、文書記憶部15及び文書管理情報記憶部16を有している。なお、本実施の形態の説明に用いない構成要素については、図から省略している。
文書取得部11は、ユーザ端末20からアップロードされてくる文書を取得する。本実施の形態で取り扱う文書は、ファイル形式の電子文書である。本実施の形態で用いる「文書」と「文書ファイル」は、同じファイル形式の電子文書を指している。なお、文書ファイルは、テキスト文字のみならず図や表などのオブジェクトを含む場合がある。本実施の形態で取り扱う文書ファイルは、オブジェクトを含むことができ、またハイパーリンクが設定可能な文書であり、例えばマイクロソフト社のofficeアプリケーションを用いて作成された文書である。
「ハイパーリンク」は、単に「リンク」とも称され、文書などの情報資源の中に埋め込まれた、他の情報資源に対する参照情報、またそのような参照が設定された文字や画像など文書内の要素などと定義される。一般に文書内にリンクを挿入することを「リンクを設定する」や「リンクを張る」などと表現する場合もある。以下の説明においてもリンクを挿入する、あるいは設定すると記載するが、これは同じことを指している。
PDF変換処理部12は、文書取得部11が取得した文書ファイルをPDF形式の文書ファイルに変換する。本実施の形態では、PDF形式の文書とそうでない形式の文書ファイルを混同しないように、「PDF形式の文書」や「PDF文書」のことを「PDFファイル」と称することにする。また、本実施の形態では、「PDFファイルに変換する」ことを、「PDF化」ともいう。PDFファイルは、ソフトウェア環境に依存することなく閲覧可能な文書形式の文書であり、また文書が実際にページに印刷されるときの状態で表示される文書形式の文書の一例である。
文書管理部13は、クラウドシステム10が取り扱う文書ファイルを文書記憶部15に保存して管理する。また、文書管理部13は、PDF変換前後の文書、すなわち文書取得部11が取得した文書ファイル、及びPDF変換処理部12によるPDF変換により作成されたPDFファイルを紐付けて管理する。このファイルの紐付けの関係を示す文書管理情報は、文書管理情報記憶部16に登録することにより管理する。
PDF文書提供部14は、PDF変換処理部12による変換により作成されたPDFファイルを元文書、すなわち文書取得部11が取得した文書ファイルのアップロード元となるユーザ端末20に提供する。
クラウドシステム10における各構成要素11~14は、クラウドシステム10を形成するコンピュータと、コンピュータに搭載されたCPUで動作するプログラムとの協調動作により実現される。また、各記憶部15,16は、クラウドシステム10に含まれる記憶手段にて実現される。
また、本実施の形態で用いるプログラムは、通信手段により提供することはもちろん、CD-ROMやUSBメモリ等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。通信手段や記録媒体から提供されたプログラムはコンピュータにインストールされ、コンピュータのCPUがプログラムを順次実行することで各種処理が実現される。
ユーザは、文書アプリケーションを用いて、図や表などのオブジェクトを挿入して文書を作成する場合がある。この文書を複数ユーザで共有する場合、作成した文書アプリケーションを使用していないユーザでも参照できるように、文書ファイルをPDFファイルに変換してから電子メールに添付するなどして送信する場合がある。PDFファイルを取得したユーザは、PDF化された文書を画面に表示して閲覧したり、ページプリンタから印刷したりする。
ただ、文書を作成した文書アプリケーションでその作成した文書(上記「元文書」)を閲覧する場合、文書内のオブジェクトがページをまたいだ状態で表示されなくても、PDFファイルに変換するとページをまたいだ状態で表示される場合がある。このように、1つのオブジェクトがページをまたいで表示されると参照しづらくなる。これを解消するために、元文書のレイアウトを変更したりするなどの作業が発生しうる。
そこで、本実施の形態においては、元文書ではページをまたがない状態で表示される場合でもPDFファイルに変換するとページをまたいだ状態で表示されるようになる場合、元文書全体を再度変換することなく、ページをまたがないオブジェクトを提供できるようにすることを特徴としている。
以下、本実施の形態の動作について説明する。
本実施の形態では、ユーザは、文書ファイルをクラウドシステム10にアップロードすることで共有化する。クラウドシステム10は、アップロードされてきた文書ファイルをPDF化して管理する。このアップロードの際に本実施の形態において実施される処理について、図2に示すフローチャートを用いて説明する。
ユーザは、例えば所定のアプリケーションを起動して、図3に示すようにアップロード対象の文書ファイルを識別するアイコン(説明の便宜上、以下、単に「文書ファイル」ともいう)31を画面表示させ、所定の操作を行うことで文書ファイル31のアップロードを指示する。所定のアプリケーションは、ユーザからの指示に応じて文書ファイル31をアップロードする。
クラウドシステム10において、文書取得部11がユーザ端末20からアップロードされてくる文書ファイルを取得すると(ステップ111)、PDF変換処理部12は、文書ファイルに対してPDF変換処理を施すことでPDFファイルを作成する(ステップ112)。PDF変換処理自体は、従前からある処理機能を利用すればよい。
文書管理部13は、変換前の文書ファイルと変換後のPDFファイルを紐付け、その紐付けた情報を文書管理情報として文書管理情報記憶部16に登録する(ステップ113)。
図4は、本実施の形態における文書管理情報記憶部16に記憶される文書管理情報のデータ構成の一例を示す図である。図4に示すように、文書管理情報には、元文書ファイルとPDFファイルとが対応付けて登録される。厳密には、文書管理情報には、ファイルの実体ではなくファイルの識別情報(本実施の形態では、「ファイル名」)が設定される。元文書ファイルは、PDFへの変換対象となる文書ファイルである。PDFファイルは、元文書ファイルをPDF変換することによって作成される文書ファイルである。
元文書ファイルとPDFファイルが紐付けられると、文書管理部13は、各ファイルを文書記憶部15の所定の格納場所に保存する(ステップ114)。格納場所に関しては、特に限定する必要はなく、例えば文書ファイルを共有する複数のユーザがアクセス可能なフォルダ等でよい。
続いて、PDF文書提供部14は、作成されたPDFファイルを、元文書のアップロード元のユーザ端末20に提供する(ステップ115)。提供する情報や方法は、ユーザ端末20のソフトウェア環境に合わせてもよい。例えば、この時点でPDFファイルの実体を送信してもよいし、送信せずにユーザ端末20での表示に必要な情報、例えば元文書とPDFファイルとを紐付ける情報やPDFファイルのアイコン画像又はサムネイル画像(以下、「アイコン」と総称する)等を送信することに留めてもよい。例えば、ユーザ端末20がブラウザを利用して画面表示させている場合、PDF文書提供部14は、画面表示するためのページ(HTML(HyperText Markup Language)ファイル)を提供することになる。PDF文書提供部14は、文書管理情報を参照することで、文書ファイルのアイコンとPDFファイルのアイコンの各表示位置を設定する。
図5は、PDFファイルが提供された後のユーザ端末20における画面表示例を示す図である。図5に示すように、文書処理部231は、アップロードされた文書ファイルに関連付けるように、アイコン31に隣接させてPDFファイルのアイコン32を表示させる。換言すると、文書処理部231は、アップロードされた文書ファイルの位置に基づく位置にPDFファイルのアイコン32を表示させる。文書ファイルのアイコン31が選択されると、所定の文書アプリケーションで文書ファイルが開かれる。また、PDFファイルのアイコン32が選択されると、所定の文書アプリケーション又はPDFファイル閲覧用のアプリケーションでPDFファイルが開かれる。
ところで、前述したように、所定の文書アプリケーションで作成された文書ファイル(上記「元文書」)をその文書アプリケーションを用いて表示させるとページをまたいで表示されないオブジェクトでも、PDF化されるとページをまたいだ状態で表示される場合がある。この場合、ユーザは、次のようにしてこのような不都合な表示を解消することができる。アイコン31,32を表示している文書アプリケーションは、後述するユーザ操作に応じて以下のように表示を制御する。
例えば、ユーザは、PDFファイルのアイコン32の右上の位置しているアイコンにマウスオーバーすると、PDFファイルが拡大表示される。この操作により表示される拡大表示用画像は、例えばクラウドシステム10に用意させておいてもよい。ユーザは、この拡大表示用画像上にマウスオーバーしている状態でクリックすると、拡大表示をロックできる。
ユーザは、拡大表示用画像をページめくりすることができる。そして、拡大表示用画像を参照することでページをまたいでいることで見づらいオブジェクトを見つけたとする。この場合、ユーザは、所定の操作によりメニュー画面を表示させ、そのメニュー画面の中から部分出力機能を選択し、その後、部分出力対象とするオブジェクトを指定するために、ページをまたいでいるオブジェクトを選択する。文書アプリケーションは、このユーザ操作に応じて、PDFファイル及び選択されたオブジェクトの各識別情報をクラウドシステム10へ送信することで、オブジェクトのPDF化を指示する。なお、処理対象とするPDFファイルとオブジェクトを特定しうる情報を含む指示情報をクラウドシステム10に送ることができれば、オブジェクトを選択するまでのユーザ操作は、上記操作に限る必要はない。
以下、本実施の形態における文書管理処理について、図6に示すフローチャートを用いて説明する。ここでは、オブジェクトとして表を例にして説明する。
ユーザ端末20から送信されてくる指示情報を受信することによってPDFファイル及び表を特定すると(ステップ121)、文書管理部13は、PDFファイルにおいてページにまたいで表示されるようになる表を、PDFファイルに紐付く元文書ファイルから抽出する。そのために、文書管理部13は、文書管理情報を参照することで、PDFファイルに対応する元文書ファイルを特定し、その特定した元文書ファイルを文書記憶部15から読み出し取得する(ステップ122)。図4に示す文書管理情報の設定例によると、PDFファイルが“文書A.pdf”の場合、元文書は“文書A.xlsx”と特定できる。続いて、PDF変換処理部12は、取得した元文書の中からユーザにより選択された表を抽出し(ステップ123)、その表のみをPDF変換する(ステップ124)。本実施の形態では、このように元文書全体ではなく、ユーザにより選択された表のみを再度PDF変換の対象とする。
図7は、前述した処理によって作成されるPDFファイルの構成を示す概念図である。文書A.pdfは、アップロード時処理におけるステップ112で作成されたPDFファイルである。文書A.pdfには表1が含まれているが、図7に例示すように、表1は、複数のページ、つまり2ページ目と3ページ目にまたがった状態でPDFファイルに含まれている。前述したように、ユーザは、拡大表示用画像の中から部分出力機能を利用して表1をページがまたがらない状態で表示させることを指示している。これにより、PDF変換処理部12は、ステップ124においてPDFファイル“表1.pdf”を作成している。表1は、文書A.pdfでは2ページにまたがっているが、表1.pdfではページにまたがっていない。なお、本実施の形態において、元文書から作成されるPDFファイルは、元文書と同じファイル名とし、オブジェクトのPDFファイルは、オブジェクト名としているが、PDFファイルの命名は、所定の規則に従ってすればよい。また、以降の説明では、元文書をPDF変換して作成されたPDFファイルを「文書(PDF)」、元文書から表を抽出してPDF変換して作成されたPDFファイルを「表(PDF)」、文書(PDF)及び表(PDF)を総称する場合に「PDFファイル」とする。
以上のようにして、ページをまたがない状態で表(PDF)を作成すると、文書管理部13は、次のようにして表(PDF)を管理する。いずれの方法で管理するかは、ユーザに選択させてもよいし、例えば、オブジェクトのサイズ等の属性を選択条件として自動的に選択するようにしてもよい。
まず、表(PDF)を文書(PDF)に関連付けて管理しない場合(ステップ125でN)、文書管理部13は、文書ファイル31と表(PDF)を紐付け、その紐付けた情報を文書管理情報として文書管理情報記憶部16に登録する(ステップ126)。
図8は、本実施の形態における文書管理情報記憶部16に記憶される文書管理情報のデータ構成の他の例を示す図であり、表(PDF)を文書(PDF)に関連付けて管理しない場合において表(PDF)が作成された後のデータ構成を示す図である。図4と比較すれば明らかなように、表(PDF)が作成されると、文書管理情報には、図8に示すように元文書ファイルと表(PDF)とが対応付けて登録される。厳密には、文書管理情報には、ファイルの実体ではなくファイルの識別情報(本実施の形態では、「ファイル名」)が設定される。このように、表(PDF)は、文書(PDF)に直接関連付けられていない。
続いて、元文書と表(PDF)が紐付けられると、文書管理部13は、表(PDF)を所定の格納場所に保存する(ステップ127)。格納場所に関しては、特に限定する必要はなく、文書(PDF)を共有する複数のユーザがアクセス可能なフォルダであればよい。例えば、文書(PDF)と同じフォルダとする。
続いて、PDF文書提供部14は、作成された表(PDF)を、元文書のアップロード元のユーザ端末20に提供する(ステップ128)。「提供」については、図5において説明したが、ユーザ端末20がブラウザで画面表示する場合、PDF文書提供部14は、画面表示するためのページを提供する。PDF文書提供部14は、文書管理情報を参照することで、文書ファイルと文書(PDF)と表(PDF)の各表示位置を設定する。
図9は、表(PDF)が提供された後のユーザ端末20における画面表示例を示す図である。図9に示すように、文書処理部21は、アップロードされた文書ファイル及び文書(PDF)の各アイコン31,32に関連付けるように、表(PDF)のアイコン33を、アイコン32に隣接させて表示させる。表(PDF)のアイコン33が選択されると、所定の文書アプリケーション又はPDFファイル閲覧用のアプリケーションで表(PDF)が開かれる。すなわち、ページをまたいでいない状態で表1が表示される。
一方、表(PDF)を文書(PDF)に関連付けて管理する場合(ステップ125でY)、文書管理部13は、結合又は添付により関連付けるかを判断する。いずれの方法で関連付けるかは、ユーザに選択させてもよし、添付条件若しくは結合条件を予め設定しておき、添付条件に合致する場合若しくは結合条件に合致しない場合に添付を自動的に選択し、あるいは添付条件に合致しない場合若しくは結合条件に合致する場合に結合を自動的に選択するように処理してもよい。
ここで、結合することを選択する場合(ステップ129で「結合」)、文書管理部13は、表(PDF)を、Appendixとして文書(PDF)に結合させて保存する(ステップ130)。本実施の形態でいう「結合」というのは、複数のファイルを一体に形成する、すなわち一ファイルとすることをいう。この状態の文書(PDF)を図10に示す。
図10に例示するように、表(PDF)は、文書(PDF)に組み込まれることで、文書(PDF)の一部となる。なお、本実施の形態では、表(PDF)を、Appendix、つまり付録として文書(PDF)の末尾に追加して結合するようにしたが、結合する文書(PDF)内における結合位置は、これに限る必要はない。
本実施の形態によれば、文書(PDF)ではページをまたいで表示されることになる表1を、元文書からPDF化して元の文書(PDF)に結合するようにした。ただ、図10に示す文書(PDF)によると、ページをまたいでいない表1は、文書(PDF)における表1の位置ではなく、文末に移動されていることになる。文書(PDF)のページ数が膨大であれば、ページの移動が面倒である。
そこで、本実施の形態においては、元文書の変換後の文書、すなわち文書(PDF)における表1の位置と、PDF化した表1の位置、すなわち表(PDF)の結合位置との間に文書内リンク(「相互リンク」ともいう)を設定するようにした(ステップ131)。この相互リンクについて、図10を用いて説明する。
文書管理部13は、図10に示す結合後の文書(PDF)内の表1の位置に文字列(“リンク表1”)34を挿入してハイパーリンクを設定する。文字列34はこの例に限る必要はない。図10では、表1の直前に挿入しているが、挿入位置は、これに限らず、例えば、表1の直後や表中に挿入してもよい。文字列34に設定するハイパーリンクは、表(PDF)への文書内リンクである。従って、ユーザが文字列34をクリックすると、表(PDF)が画面表示されることになる。
一方、文書管理部13は、表(PDF)のページ内に文字列(“戻る”)35を挿入してハイパーリンクを設定する。文字列35はこの例に限る必要はない。文字列35の挿入位置は、図10に示す位置に限定する必要はない。文字列35に設定するハイパーリンクは、文書(PDF)内の表1の位置への文書内リンクである。
一方、添付することを選択する場合(ステップ129で「添付」)、文書管理部13は、表(PDF)を、文書(PDF)の添付ファイル36として保存する(ステップ132)。なお、添付ファイル36の格納先は、文書記憶部15における所定のフォルダと予め決めているが、保存する際にユーザに問い合わせてもよい。
「添付」の方法としては、文書(PDF)の添付ファイルとしてもよいし、アドビシステム社のアプリケーションが提供するポートフォリオ機能を利用してもよい。ここでは、添付する表(PDF)を「添付ファイル」と総称する。表(PDF)を文書(PDF)の添付ファイル36として保存する場合の概念図を図11に示す。
ところで、表1を文書(PDF)と一体に形成する「結合」の場合、クラウドシステム10は、表1をPDF化して表(PDF)を作成する必要はある。ただ、表1を文書(PDF)に「添付」する場合、クラウドシステム10は、表(PDF)を文書(PDF)と別ファイルとして管理する。従って、文書(PDF)を共通するユーザが元文書を作成した文書アプリケーションを使用している場合、クラウドシステム10は、表1を必ずしもPDF化する必要はない。従って、クラウドシステム10は、元文書から表1を抽出して、表1のみを含む文書ファイルを作成し、添付ファイル36として文書(PDF)に関連付けるようにしてもよい。
表(PDF)を添付ファイル36とした後、文書管理部13は、文書(PDF)と表(PDF)との間に相互リンクを設定するが(ステップ131)、この設定処理は、すでに説明しているので、ここでは説明を省略する。
なお、本実施の形態では、ページをまたぐオブジェクトを対象に説明したが、例えば、ページをまたいでいないオブジェクトを本文(つまり、文書(PDF))と別個に取り扱いたいような場合にも、本実施の形態を適用することは可能である。
上記実施の形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU:Central Processing Unit等)や、専用のプロセッサ(例えばGPU:Graphics Processing Unit、ASIC:Application Specific Integrated Circuit、FPGA:Field Programmable Gate Array、プログラマブル論理デバイス等)を含むものである。
また上記実施の形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施の形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
2 インターネット、10 クラウドシステム、11 文書取得部、12 PDF変換処理部、13 文書管理部、14 PDF文書提供部、15 文書記憶部、16 文書管理情報記憶部、20 ユーザ端末、21 文書処理部。

Claims (5)

  1. プロセッサを備え、
    前記プロセッサは、
    文書が実際にページに印刷されるときの状態で表示される文書形式の文書に変換された場合、変換前後の文書を紐付けて管理し、
    変換後の文書においてページにまたいで表示されるようになるオブジェクトを、前記変換後の文書に紐付く変換前の文書から抽出し、
    抽出したオブジェクトを前記文書形式に変換する、
    ことを特徴とする情報処理装置。
  2. 前記プロセッサは、前記文書形式に変換したオブジェクトを前記変換後の文書内に結合させて保存することを特徴とする請求項1に記載の情報処理装置。
  3. 前記プロセッサは、前記文書形式に変換したオブジェクトを前記変換後の文書に添付させて保存することを特徴とする請求項1に記載の情報処理装置。
  4. 前記プロセッサは、前記変換後の文書における前記オブジェクトの位置と前記文書形式に変換したオブジェクトとの間に文書内リンクを設定することを特徴とする請求項1に記載の情報処理装置。
  5. コンピュータに、
    文書が実際にページに印刷されるときの状態で表示される文書形式の文書に変換された場合、変換前後の文書を紐付けて管理する機能、
    変換後の文書においてページにまたいで表示されるようになるオブジェクトを、前記変換後の文書に紐付く変換前の文書から抽出する機能、
    抽出したオブジェクトを前記文書形式に変換する機能、
    を実現させるためのプログラム。
JP2022049610A 2022-03-25 2022-03-25 情報処理装置及びプログラム Pending JP2023142628A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2022049610A JP2023142628A (ja) 2022-03-25 2022-03-25 情報処理装置及びプログラム
US17/862,387 US20230305995A1 (en) 2022-03-25 2022-07-11 Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
CN202211059492.2A CN116842908A (zh) 2022-03-25 2022-09-01 信息处理装置、记录介质及信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022049610A JP2023142628A (ja) 2022-03-25 2022-03-25 情報処理装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2023142628A true JP2023142628A (ja) 2023-10-05

Family

ID=88095845

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022049610A Pending JP2023142628A (ja) 2022-03-25 2022-03-25 情報処理装置及びプログラム

Country Status (3)

Country Link
US (1) US20230305995A1 (ja)
JP (1) JP2023142628A (ja)
CN (1) CN116842908A (ja)

Also Published As

Publication number Publication date
US20230305995A1 (en) 2023-09-28
CN116842908A (zh) 2023-10-03

Similar Documents

Publication Publication Date Title
JP5148612B2 (ja) 永続保存ポータル
US7715625B2 (en) Image processing device, image processing method, and storage medium storing program therefor
JP3714548B2 (ja) ネットワークを利用したcadデータファイル変換システム
JP5235671B2 (ja) 端末装置、コンテンツ表示方法、およびコンテンツ表示プログラム
JP6825465B2 (ja) 情報処理装置、情報処理方法、及びプログラム
US20090100023A1 (en) Information processing apparatus and computer readable information recording medium
JP6840597B2 (ja) 検索結果要約装置、プログラム及び方法
US10817646B2 (en) Information processing system and control method therefor
US20080155501A1 (en) System and Method for Revising an Electronic Draft
JP2015028750A (ja) 画像形成装置、画像形成装置の制御方法、およびプログラム
KR101975111B1 (ko) 대용량 웹페이지 문서 변환 시스템 및 그 방법
JP2023142628A (ja) 情報処理装置及びプログラム
JP5900050B2 (ja) 情報処理装置、情報処理システム及びプログラム
JP2010113730A (ja) 検索サーバ及びコンピュータプログラム
JP6115664B2 (ja) 情報処理装置及びプログラム
JP2005339333A (ja) 帳票管理システム
JP2005107635A (ja) 電子フォーム入力システム、方法、プログラムおよび媒体
JP5169291B2 (ja) 文書管理システム、画像形成装置およびプログラム
JP7428451B1 (ja) 情報処理システム、情報処理方法及びプログラム
JPH08147445A (ja) 文書管理方法及びそれを実現する文書処理装置
US20230306189A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
KR20060024847A (ko) 통합뷰 서비스 제공시스템 및 제공방법
JP2012203619A (ja) データ作成支援システム
EP4213041A1 (en) Information processing apparatus, program, and information processing method
JP2009245061A (ja) 検索サーバ及びコンピュータプログラム