JP2017054451A - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP2017054451A JP2017054451A JP2015180054A JP2015180054A JP2017054451A JP 2017054451 A JP2017054451 A JP 2017054451A JP 2015180054 A JP2015180054 A JP 2015180054A JP 2015180054 A JP2015180054 A JP 2015180054A JP 2017054451 A JP2017054451 A JP 2017054451A
- Authority
- JP
- Japan
- Prior art keywords
- data
- character string
- document data
- unit
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
【課題】電子書籍の文書データを印刷する場合に、当該データに含まれるリンク情報が欠落する事態を防ぐ。【解決手段】情報処理装置であって、電子文書データを取得する取得手段と、前記電子文書データを印刷データに変換する変換手段と、前記電子文書データに、リンク情報が付与された文字列が含まれる場合に、当該文字列を抽出する抽出手段と、前記変換後の印刷データにおける、前記文字列が含まれる位置を検索する検索手段と、前記リンク情報が付与された文字列と関連付けて、前記検索された位置を表す情報を、前記変換後の印刷データに付与する付与手段と、を有する。【選択図】図2
Description
本発明は、情報処理装置及び情報処理プログラムに関する。
近年、電子書籍やHTML文書などのデジタルコンテンツの文書が盛んに利用されるようになっている。電子書籍の特徴の一つは、紙面に印刷された書籍と異なり、いわゆるリンク情報を付加することにより、ディスプレイ上で閲覧中に、特定の頁から別な関連頁へと即座に表示内容を変えるリンク機能である。例えば、下記特許文献1には、本文データの文字列の中から辞書に含まれている単語を検索し、予め定められた条件を満たす場合に、当該単語を索引単語として抽出して目次を作成する点や、目次や索引情報にリンク情報を付加する点が開示されている。
ところで、電子書籍において多用されるデータ形式は、画面の大きさに合わせて表示を調整する機能を有することから、リンク情報が付与された文字列の掲載ページは、表示するデバイスやレイアウト等によって変化する。また、電子書籍は、そもそも紙面に印刷された書籍の末尾に記載されているような索引ページが不要であるため、当該索引ページに相当するデータを含まない。さらに、当該リンク情報は、電子データには含まれるものの、ディスプレイ上で閲覧する際にディスプレイ上に表示されない。
従って、電子書籍の文書データをディスプレイに表示された状態のまま印刷した場合、索引ページを含まない書籍が印刷され、電子データには含まれていたリンク情報が欠落してしまう。本発明は上記課題を鑑みてなされたものであって、その目的は、電子書籍の文書データを印刷する場合に、当該データに含まれるリンク情報が欠落する事態を防ぐことにある。
請求項1に記載の情報処理装置は、電子文書データを取得する取得手段と、前記電子文書データを印刷データに変換する変換手段と、前記電子文書データに、リンク情報が付与された文字列が含まれる場合に、当該文字列を抽出する抽出手段と、前記変換後の印刷データにおける、前記文字列が含まれる位置を検索する検索手段と、前記リンク情報が付与された文字列と関連付けて、前記検索された位置を表す情報を、前記変換後の印刷データに付与する付与手段と、を有することを特徴とする。
請求項2に記載の情報処理装置は、請求項1に記載の情報処理装置において、前記検索手段は、前記リンク情報が付与された文字列、及び、該文字列の前後の文字列を含む文字列が含まれる位置を検索する、ことを特徴とする。
請求項3に記載の情報処理装置は、請求項1または2に記載の情報処理装置において、前記付与手段は、前記検索手段が検索した位置が複数である場合に、当該複数の位置を表す情報を統合して前記変換後の印刷データに付与する、ことを特徴とする。
請求項4に記載の情報処理装置は、請求項1乃至3のいずれかに記載の情報処理装置において、前記電子文書データは、それぞれ前記リンク情報が付与された文字列を含む参照元文書データと参照先文書データを含み、前記リンク情報は、前記参照元文書データに含まれる前記文字列と、前記参照先文書データに含まれる前記文字列を関連付ける情報である、ことを特徴とする。
請求項5に記載の情報処理プログラムは、電子文書データを取得する取得手段、前記電子文書データを印刷データに変換する変換手段、前記電子文書データに、リンク情報が付与された文字列が含まれる場合に、当該文字列を抽出する抽出手段、前記変換後の印刷データにおける、前記文字列が含まれる位置を検索する検索手段、及び、前記リンク情報が付与された文字列と関連付けて、前記検索された位置を表す情報を、前記変換後の印刷データに付与する付与手段、としてコンピュータを機能させるためのプログラムであることを特徴とする。
請求項1、4及び5に係る発明によれば、作者の意図を反映したリンク情報を有する索引単語の一覧が印刷データに付与される。
請求項2に係る発明によれば、リンク情報が付与された索引単語と同じ文字列が電子書籍の本文中に複数ある場合であっても、当該索引単語の掲載ページが一意に特定される。
請求項3に係る発明によれば、リンク情報が付与された索引単語と同じ文字列が電子書籍の本文中に複数ある場合に、当該文字列が掲載された全ての掲載ページを統合して索引ページが作成される。
以下、本発明を実施するための好適な実施の形態を、図面に従って説明する。なお、図面については、同一又は同等の要素には同一の符号を付し、重複する説明については省略する。図1は、本実施の形態における情報処理装置101の使用環境について説明するための図である。図1に示すように、情報処理システム100は、情報処理装置101、ネットワーク102、及び、端末103を含み、情報処理装置101と端末103は、ネットワーク102を介して通信する。
情報処理装置101は、例えば、サーバー装置であって、入力部104、表示部105、制御部106、記憶部107、通信部108、操作部109、及び、内部バス110を有する。入力部104は、例えば、USB(Universal Serial Bus)ポートや、光学ドライブ等であって、外部からデータを入力される。表示部105は、例えば、液晶ディスプレイ、有機ELディスプレイであって、制御部106からの指示に従い、情報を表示する。
制御部106は、例えば、CPU、MPU等であって、記憶部107に格納されたプログラムに従って動作する。また、制御部106は、端末103から取得した電子文書データを処理するとともに、処理が完了した場合には、当該旨を対応する端末103に対して通知するように通信部108に対して指示を行う。
記憶部107は、例えば、ROMやRAM、ハードディスクなどの情報記録媒体で構成され、制御部106によって実行されるプログラムを保持する情報記録媒体である。また、記憶部107は、例えば、制御部106のワークメモリとしても動作する。通信部108は、ネットワーク102を介して端末103と通信し、リンク情報が付与された文字列を含む参照元文書データと参照先文書データとを含む電子文書データを取得する。
操作部109は、例えば、複数のボタンやタッチパネル等で構成され、ユーザの指示操作に応じて、当該指示操作の内容を制御部106に出力する。内部バス110は、入力部104、通信部108、制御部106、記憶部107、表示部105、操作部109を相互に接続する。
ネットワーク102は、例えば、LAN(Local Area Network)回線同士を接続する広域の通信回線であり、インターネットによって、情報処理装置101と端末103を接続する。ここで、ネットワーク102は、一定の限定された領域内において、機器間に設置するLAN回線等の内部ネットワークであってもよい。
端末103は、例えば、CPUやメモリ等で構成されるPC(Personal Computer)やスマートフォン等であって、情報処理装置101との間で、電子文書データの送受信を行う。
図2は、本実施の形態における制御部106及び記憶部107の機能的な構成について説明するための図である。図2に示すように、制御部106は、変換部201と、抽出部202と、検索部203と、付与部204と、を有する。
変換部201は、電子文書データを印刷データに変換する。例えば、変換部201は、EPUB(Electronic PUBlication)形式のデータである電子文書データを、PDF(Portable Document Format)形式である印刷データに変換する。具体例として、通信部108が図3に示すような電子文書データを取得した場合について説明する。
図3に示す電子文書データは、「sample.html」というファイル名のデータ(以下、サンプルデータとする)と、「reference.html」というファイル名のデータ(以下、リファレンスデータとする)と、を含むEPUB形式のデータである。そして、図3(a)に示すように、サンプルデータは、「ABC」、「<a href=“reference.html#idxxxx”>DEF</a>」及び「GHI」という文字列を含む。また、リファレンスデータは、図3(b)に示すように、「<h2 id=“idxxxx”>DEF</h2>」という文字列を含む。
ここで、EPUB形式のデータに対応したアプリケーションによって、上記サンプルデータが開かれた場合、タグ情報は表示されず、「ABC」、「DEF」及び「GHI」という文字列が表示される。同様に、EPUB形式のデータに対応したアプリケーションによって、上記リファレンスデータが開かれた場合、「DEF」という文字列が表示される。すなわち、サンプルデータは、上記参照元文書データに相当し、リファレンスデータは、上記参照先文書データに相当する。
変換部201は、EPUB形式のデータであるサンプルデータ及びリファレンスデータを、上記アプリケーションによって表示された場合と同様に、それぞれタグ情報を含まないPDF形式の印刷データ(以下、印刷サンプルデータ及び印刷リファレンスデータとする)に変換する。そして、変換後の印刷データは、後述する印刷データ記憶部206に記憶される。なお、変換後のデータ形式は、PDF形式に限られず、PS(PostScript)等のデータ形式であってもよい。
抽出部202は、電子文書データに、リンク情報が付与された文字列(以下、索引単語とする)が含まれる場合に、当該文字列を抽出する。リンク情報は、参照元文書データに含まれる索引単語と、参照先文書データに含まれる索引単語を関連付ける情報を表す。具体的には、上記例においては、抽出部202は、「<a href=“reference.html#idxxxx”>」というリンク情報が付与された「DEF」という索引単語を抽出する。
ここで、サンプルデータに含まれる「<a href=“reference.html#idxxxx”>」というタグ情報は、「reference.html」というファイル名のデータに含まれる「id=“ridxxxx”」というタグ情報が付与された「DEF」という索引単語を参照することを表す。すなわち、上記アプリケーションによってサンプルデータが開かれている状態において、ユーザが「DEF」という索引単語を選択すると、リファレンスデータに含まれる「DEF」という索引単語が参照される。なお、抽出部202が抽出した索引単語は、後述する索引データ記憶部207に記憶される。
検索部203は、変換後の印刷データにおける、抽出部202が抽出した索引単語が含まれる位置を検索する。具体的には、上記例では、変換前のサンプルデータに含まれる「DEF」という索引単語が、変換後である印刷リファレンスデータの「23」ページに含まれる場合に、検索部203は、「23」という掲載ページを検索する。そして、検索部203は、図4の2行目に示すように、検索した索引単語と関連付けて、掲載ページを後述する索引データ記憶部207に記憶する。
なお、検索部203は、リンク情報が付与された文字列、及び、該文字列の前後の文字列を含む文字列が含まれる位置を検索するようにしてもよい。すなわち、検索部203は、リンク情報が付与された文字列と当該文字列の前後に記載された文字列を合わせた文字列を索引単語として検索を行うようにしてもよい。具体的には、上記例では、変換部201が変換したPDF形式の印刷データにおいて、「ABCDEFGHI」という索引単語が含まれる掲載ページを検索するようにしてもよい。リンク情報が付与された文字列の前後を含む文字列を検索することによって、リンク情報が付与された索引単語と同じ文字列が電子書籍の本文中に複数ある場合であっても、当該索引単語の掲載ページが一意に特定される。
また、変換後のリファレンスデータに複数の索引単語が含まれる場合には、検索部203は当該索引単語が含まれる複数の掲載ページを検索するようにしてもよい。具体的には、例えば、変換前のサンプルデータに含まれる「DEF」という索引単語が、変換後のリファレンスデータの「23」、「30」、「37」及び「44」ページに含まれる場合に、検索部203は、「23」、「30」、「37」及び「44」という全ての掲載ページを検索するようにしてもよい。
付与部204は、リンク情報が付与された文字列と関連付けて、検索された位置を表す情報を、変換後の印刷データに付与する。具体的には、例えば、検索部203が、図4に示すような検索した索引単語と掲載ページの一覧を検索した場合について説明する。図4に示すように、検索部203は、「DEF」という索引単語に対して、「23」という掲載ページを検索し、「HTMLS」という索引単語に対して、「11」という掲載ページを検索し、「TrueType」という索引単語に対して、「51」という掲載ページを検索している。この場合、付与部204は、印刷サンプルデータに対して、図4に示す索引単語と掲載ページの一覧を含むデータを付与し、出力データを生成する。当該出力データは、後述する出力データ記憶部208に記憶される。なお、付与部204は、印刷サンプルデータの先頭に当該データを付与してもよいし、印刷サンプルデータの末尾に付与するようにしてもよい。
また、1つの索引単語に対して検索部203が検索した位置が複数である場合に、付与部204は、当該複数の位置を表す情報を統合して変換後の印刷データに付与するようにしてもよい。具体的には、例えば、検索部203は、「DEF」という索引単語に対して、「23」、「30」、「37」及び「44」という掲載ページを検索し、「HTMLS」という索引単語に対して、「11」及び「16」という掲載ページを検索し、「TrueType」という索引単語に対して、「51」という掲載ページを検索した場合について説明する。
上記の場合、付与部204は、印刷サンプルデータに対して、各索引単語に対して検索された複数の掲載ページを統合したデータを付与するようにしてもよい。すなわち、付与部204は、図5に示すような索引単語と掲載ページの一覧を印刷サンプルデータに対して付与するようにしてもよい。これにより、リンク情報が付与された索引単語と同じ文字列が電子書籍の本文中に複数ある場合に、当該文字列が掲載された全ての掲載ページを統合して索引ページが作成される。
ここで、図2の説明に戻る。図2に示すように、記憶部は、本文データ記憶部205と、印刷データ記憶部206と、索引データ記憶部207と、出力データ記憶部208と、を有する。本文データ記憶部205は、通信部108が電子文書データを取得した場合に、当該電子文書データを記憶する。具体的には、上記例では、本文データ記憶部205は、サンプルデータ及びリファレンスデータを記憶する。
印刷データ記憶部206は、変換部201が変換した印刷データを記憶する。具体的には、上記例では、変換データ記憶部は、印刷サンプルデータ及び印刷リファレンスデータを記憶する。
索引データ記憶部207は、検索部203が検索した索引単語と掲載ページの一覧を含むデータを記憶する。具体的には、例えば、索引データ記憶部207は、図4や図5に示すような索引単語と掲載ページの一覧を含むデータを記憶する。
出力データ記憶部208は、索引単語と掲載ページの一覧を含むデータが付与された印刷データを記憶する。具体的には、印刷サンプルデータに対して、図4や図5に示すような索引単語と掲載ページの一覧を含むデータが付与されたデータを記憶する。
続いて、情報処理装置101が行う処理のフローについて、図6を用いて説明する。なお、下記のフローは一例であって、本実施の形態はこれに限定されるものではない。
まず、通信部108は、ネットワーク102を介して端末103と通信し、それぞれリンク情報が付与された文字列を含む参照元文書データと参照先文書データとを含む電子文書データを取得する(S601)。具体的には、例えば、ユーザが端末103から情報処理装置101に対して電子文書データをアップロードすることによって、通信部108は、図3に示すようなサンプルデータ及びリファレンスデータを取得する。
次に、変換部201は、S601において取得された電子文書データを印刷データに変換する(S602)。具体的には、例えば、変換部201は、サンプルデータを印刷サンプルデータに変換し、リファレンスデータを印刷リファレンスデータに変換する。
続いて、抽出部202は、電子文書データに、サンプルデータに含まれる索引単語を抽出する(S603)。ここで索引単語が抽出された場合はS604へ進み、索引単語が抽出されなかった場合はS609へ進む。
S603において索引単語が抽出された場合は、抽出部202は、検索した索引単語を索引データ記憶部207に記憶する(S604)。具体的には、例えば、抽出部202は、「DEF」という索引単語を索引データ記憶部207に記憶する。
次に、検索部203は、変換後の印刷データにおける、抽出部202が抽出した索引単語が含まれる位置を検索する(S605)。具体的には、上記例では、検索部203は、印刷リファレンスデータにおいて、「DEF」という索引単語が含まれる「23」という掲載ページを検索する。
次に、検索部203は、検索した掲載ページを索引単語と関連付けて索引データ記憶部207に記憶する(S606)。具体的には、例えば、検索部203は、図4の2行目に示すように「DEF」という索引単語と関連付けて「23」という掲載ページを記憶する。
続いて、抽出部202は、S604において抽出した索引単語以外の索引単語を、サンプルデータから抽出する(S607)。ここで索引単語が抽出された場合はS604へ進み、索引単語が抽出されなかった場合はS608へ進む。具体的には、上記例では、サンプルデータには、「DEF」という索引単語以外に「HTMLS」という索引単語を含むため、S604へ進む。そして上記と同様に、S605及びS606において、図4の3行目に示すように、検索部203は、「HTMLS」という索引単語と関連付けて「11」という掲載ページを記憶する。
S604乃至S607のステップは、抽出単語が抽出する索引単語がなくなるまで繰り返し実行される。上記例では、さらに、抽出部202は、「TrueType」という索引単語を抽出し、検索部203は、「TrueType」という索引単語と関連付けて「51」という掲載ページを記憶する。
そしてS607において、抽出部が索引単語を抽出しなかった場合、付与部204は、S604乃至S607のステップにおいて検索された位置を表す情報を、変換後の印刷データに付与する(S608)。具体的には、上記例では、印刷サンプルデータに対して、図4に示すような検索した索引単語と掲載ページの一覧データを付与し、出力データを生成する。
最後に、通信部108は、電子文書データを送信した端末103に、出力データを送信する(S609)。具体的には、S603において索引単語が抽出されなかった場合は、変換した印刷サンプルデータ及び印刷リファレンスデータをそのまま端末103に送信する。また、S608において出力データが生成された場合は、電子文書データを送信した端末103に、当該出力データ及び印刷リファレンスデータを送信する。
以上のように、端末103から送信された電子文書データを印刷データに変換した上で、当該印刷データに対して索引単語と掲載ページの一覧データを付与することにより、電子文書データに含まれるリンク情報が消失する事態が防止される。
本発明は、上記の実施形態に限定されるものではなく、種々の変形が可能である。例えば、上記の実施形態で示した構成と実質的に同一の構成、同一の作用効果を奏する構成または同一の目的を達成する構成で置き換えてもよい。具体的には、例えば、上記情報処理装置101の構成やフローは一例であって、これに限定されるものではない。
100 情報処理システム、101 情報処理装置、102 ネットワーク、103 端末、104 入力部、105 表示部、106 制御部、107 記憶部、108 通信部、109 操作部、110 内部バス、201 変換部、202 抽出部、203 検索部、204 付与部、205 本文データ記憶部、206 印刷データ記憶部、207 索引データ記憶部、208 出力データ記憶部。
Claims (5)
- 電子文書データを取得する取得手段と、
前記電子文書データを印刷データに変換する変換手段と、
前記電子文書データに、リンク情報が付与された文字列が含まれる場合に、当該文字列を抽出する抽出手段と、
前記変換後の印刷データにおける、前記文字列が含まれる位置を検索する検索手段と、
前記リンク情報が付与された文字列と関連付けて、前記検索された位置を表す情報を、前記変換後の印刷データに付与する付与手段と、
を有することを特徴とする情報処理装置。 - 前記検索手段は、前記リンク情報が付与された文字列、及び、該文字列の前後の文字列を含む文字列が含まれる位置を検索する、ことを特徴とする請求項1に記載の情報処理装置。
- 前記付与手段は、前記検索手段が検索した位置が複数である場合に、当該複数の位置を表す情報を統合して前記変換後の印刷データに付与する、ことを特徴とする請求項1または2に記載の情報処理装置。
- 前記電子文書データは、それぞれ前記リンク情報が付与された文字列を含む参照元文書データと参照先文書データを含み、
前記リンク情報は、前記参照元文書データに含まれる前記文字列と、前記参照先文書データに含まれる前記文字列を関連付ける情報である、ことを特徴とする請求項1乃至3のいずれかに記載の情報処理装置。 - 電子文書データを取得する取得手段、
前記電子文書データを印刷データに変換する変換手段、
前記電子文書データに、リンク情報が付与された文字列が含まれる場合に、当該文字列を抽出する抽出手段、
前記変換後の印刷データにおける、前記文字列が含まれる位置を検索する検索手段、及び、
前記リンク情報が付与された文字列と関連付けて、前記検索された位置を表す情報を、前記変換後の印刷データに付与する付与手段
としてコンピュータを機能させるための情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015180054A JP2017054451A (ja) | 2015-09-11 | 2015-09-11 | 情報処理装置及び情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015180054A JP2017054451A (ja) | 2015-09-11 | 2015-09-11 | 情報処理装置及び情報処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017054451A true JP2017054451A (ja) | 2017-03-16 |
Family
ID=58316774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015180054A Pending JP2017054451A (ja) | 2015-09-11 | 2015-09-11 | 情報処理装置及び情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017054451A (ja) |
-
2015
- 2015-09-11 JP JP2015180054A patent/JP2017054451A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20150033116A1 (en) | Systems, Methods, and Media for Generating Structured Documents | |
US11386184B2 (en) | Information processing apparatus, search server, web server, and non-transitory computer readable storage medium | |
CN106168944B (zh) | 文档转换方法 | |
US20160171106A1 (en) | Webpage content storage and review | |
JP2010129057A (ja) | 情報処理装置、表示データ翻訳方法、及びプログラム | |
JP6840597B2 (ja) | 検索結果要約装置、プログラム及び方法 | |
JP6232736B2 (ja) | 文書読解支援装置、文書読解支援システム、文書読解支援方法およびプログラム | |
JP2017054451A (ja) | 情報処理装置及び情報処理プログラム | |
JP2019197381A (ja) | 判決文データベースの作成方法、判決文データベースの検索方法、文作成方法、判決文データベースの作成装置、判決文データベースの検索装置、文作成装置、判決文データベースの作成プログラム、判決文データベースの検索プログラム、および文作成プログラム | |
JP2010113730A (ja) | 検索サーバ及びコンピュータプログラム | |
JP6102886B2 (ja) | データ入力装置及びプログラム | |
JP6838771B2 (ja) | 点訳エラー出力機能を用いた点字編集方法、これを実現するためのプログラムが格納された記録媒体、及びこれを実現するために媒体に格納されたコンピュータプログラム | |
KR102613685B1 (ko) | 콘텐츠 무단 복사 무력화 방법 및 장치 | |
CN110874519B (zh) | 一种将Markdown文档转换为PDF文档的方法、装置 | |
JP6796337B2 (ja) | 評釈データベース作成装置、評釈データベース作成方法、評釈データベース作成プログラム | |
JP5779412B2 (ja) | クライアント・サーバシステム、クライアント機器、サーバ機器、クライアント・サーバシステムにおけるコメント画面作成方法、およびクライアント機器のプログラム、サーバ機器のプログラム | |
CN110377284B (zh) | 一种基于UEFI Shell图形界面操作文件的方法和装置以及设备 | |
JP6564910B2 (ja) | 変換装置、変換方法、及びプログラム | |
JP2009245061A (ja) | 検索サーバ及びコンピュータプログラム | |
JP2017068307A (ja) | 情報検索装置及びその制御方法、情報検索用プログラム | |
WO2015022759A1 (ja) | ドキュメントファイル生成装置、ドキュメントファイル生成方法およびドキュメントファイル生成プログラム | |
Joseph | FOUNDATIONS THE MENORAH. | |
JP2015170093A (ja) | 未知語抽出装置及び未知語抽出方法 | |
JP5094902B2 (ja) | 情報処理装置、変換候補抽出方法、及びプログラム | |
JP2012226678A (ja) | 情報処理装置、画像処理装置、画像形成装置、及び、プログラム |