JP2021043519A

JP2021043519A - 情報処理システム及びプログラム

Info

Publication number: JP2021043519A
Application number: JP2019162999A
Authority: JP
Inventors: 将弘山田; Masahiro Yamada
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2019-09-06
Filing date: 2019-09-06
Publication date: 2021-03-18

Abstract

【課題】複数の部分を含むデータのうち必要な部分がクライアント側で事前に分からない場合でも、そのデータ全体を取得するよりも少ないデータ転送量で、必要な部分を特定して取得できるようにする。【解決手段】文書管理サーバ１００は、クライアント２００から文書が要求されると、文書の全体データの代わりに、その文書内のテキストデータと、そのテキストデータの文書内での位置とを示すテキスト位置テーブルを提供する。テキスト位置テーブルには、文書の各ページに含まれるテキスト以外のデータ（例えば画像）は含まれない。クライアント２００は、受け取ったテキスト位置テーブルに対して検索を行う。クライアント２００は、検索にヒットした部分を含むページの全体データが必要かユーザに問い合わせ、ユーザが必要と回答した場合、そのページの全体データを文書管理サーバ１００からダウンロードし、画面に表示する。【選択図】図１

Description

本発明は，情報処理システム及びプログラムに関する。

特許文献１には、コンテンツデータの複数の部分を有する単一のファイルを格納し、その部分を少なくとも１つ選択的にダウンロードするシステムが開示される。サーバには、例えば音楽データ、カバー写真、歌詞のテキストデータを含む音楽ファイルのように、複数の部分を含んだデータが保存されている。クライアントは、そのデータのうち自分の機種に応じた部分のみを選択的にダウンロードする。例えば音楽プレイヤーは、音楽ファイルのうち音楽データのみをダウンロードし、歌詞データ等はダウンロードしない。また、ユーザがダウンロードする部分（種類）を示す「使用状況」を規定することも可能であり（同文献の段落００１８参照）。

特表２００７-５１１８２９号公報

サーバに記憶された複数の部分を含むデータのうちの特定の部分のみをクライアントが選択的に取得可能なシステムが存在する。このシステムでは、クライアントがデータのうち特定の部分のみを必要とする場合には、データ全体を取得するよりも、サーバ・クライアント間で転送されるデータ量が削減される。

しかし、このシステムでは、データのうちクライアント側に必要な部分が分からない場合、必要な部分を指定することができず、結局クライアントはサーバからそのデータの全体を取得するしかない。

本発明は、複数の部分を含むデータのうち必要な部分がクライアント側で事前に分からない場合でも、そのデータ全体を取得するよりも少ないデータ転送量で、必要な部分を特定して取得できる仕組みを提供する。

請求項１に係る発明は、第１の情報処理装置と、第２の情報処理装置と、を含み、前記第１の情報処理装置は、データを記憶する記憶手段であって、前記データは複数の部分を含み、前記複数の部分の各々はそれぞれ１以上の要素を含む、記憶手段と、前記データ中の前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報を前記第２の情報処理装置に提供する第１提供手段と、前記第２の情報処理装置から前記データの特定の前記部分を要求された場合に、当該部分を前記第２の情報処理装置に提供する第２提供手段と、を含み、前記第２の情報処理装置は、ユーザから前記要素についての検索条件の入力を受け付け、前記検索条件を満たす要素を前記特定情報から検索する検索手段と、前記検索手段により検索された要素が含まれる前記部分を前記特定情報から求め、求めた部分を前記第１の情報処理装置に要求し、この要求に応じて前記第１の情報処理装置から提供された前記部分を取得する取得手段と、を含む情報処理システムである。

請求項２に係る発明は、前記データは、テキストとテキスト以外の種類の情報とを含む文書データであり、前記部分は、前記文書データが含む個々のページであり、それら各ページは、それぞれ当該ページに含まれるテキストとテキスト以外の種類の情報とを含み、前記要素は、テキスト中の語句であり、前記特定情報は、前記各ページに含まれるテキストを特定する情報である、請求項１に記載の情報処理システムである。

請求項３に係る発明は、前記ページは、１以上のテキストオブジェクトを含み、前記ページが含む前記１以上のテキストオブジェクトは、それぞれ、当該テキストオブジェクトに含まれるテキストと、当該テキストの表示属性を表す表示属性情報と、当該テキストオブジェクトの前記ページ内での位置を表す位置情報と、を含み、前記特定情報は、前記各テキストオブジェクトに含まれるテキストと前記各テキストオブジェクトの前記位置情報とを特定する情報を含み、前記第２の情報処理装置は、前記検索手段により検索された要素が含まれる前記ページ内の、テキストの概略的な配置を示すページ画像を、前記特定情報に基づいて生成して表示する手段、を更に含む、請求項２に記載の情報処理システムである。

請求項４に係る発明は、前記取得手段は、表示された前記ページ画像に対応付けて、前記ユーザに、当該ページの全体データの取得を希望するか否かを問合せ、この問合せに応じて取得を希望する旨の回答があった場合には、当該ページに含まれるテキストとテキスト以外の種類の情報とを含む当該ページの全体データを前記部分として取得する、請求項３に記載の情報処理システムである。

請求項５に係る発明は、前記取得手段は、前記検索手段により検索された要素が含まれる前記部分を取得するか否かを前記ユーザに問い合わせ、前記ユーザから取得する旨の回答があった場合に、前記部分を前記第１の情報処理装置に要求する、請求項１に記載の情報処理システムである。

請求項６に係る発明は、コンピュータを、データを記憶する記憶手段であって、前記データは複数の部分を含み、前記複数の部分の各々はそれぞれ１以上の要素を含む、記憶手段、前記データ中の前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報を第２の情報処理装置に提供する第１提供手段、前記第２の情報処理装置から前記データの特定の前記部分を要求された場合に、当該部分を前記第２の情報処理装置に提供する第２提供手段、として機能させるためのプログラムである。

請求項７に係る発明は、コンピュータを、データに含まれる複数の部分の各々に含まれる１以上の要素のそれぞれについて、前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報を第１の情報処理装置から受け取る手段、ユーザから前記要素についての検索条件の入力を受け付け、前記検索条件を満たす要素を前記特定情報から検索する検索手段、前記検索手段により検索された要素が含まれる前記部分を前記特定情報から求め、求めた部分を前記第１の情報処理装置に要求し、この要求に応じて前記第１の情報処理装置から提供された前記部分を取得する取得手段、として機能させるためのプログラムである。

請求項１、２、６又は７に係る発明によれば、複数の部分を含むデータのうち必要な部分がクライアント側で事前に分からない場合でも、そのデータ全体を取得するよりも少ないデータ転送量で、必要な部分を特定して取得できる。

請求項３に係る発明によれば、第２の情報処理装置が、データ全体を受け取っていなくても、特定情報に基づきそのデータに含まれるテキストの概略的な配置を示すページ画像をユーザに提供することができる。

請求項４又は５に係る発明によれば、データのうちユーザが必要としない部分を取得しないようにすることができる。

実施形態のシステム構成を例示する図である。文書のページの構成を例示する図である。テキスト位置テーブルの例を示す図である。実施形態におけるクライアントの処理手順を例示する図である。参考例１におけるクライアントの処理手順を例示する図である。参考例２におけるクライアントの処理手順を例示する図である。

図１に、本発明の一実施形態のシステム構成を示す。このシステムは、第１の情報処理装置の一例である文書管理サーバ１００と、第２の情報処理装置の一例であるクライアント２００とを含む。クライアント２００は、インターネットやローカルエリアネットワーク等のネットワーク３００を介して、文書管理サーバ１００と通信可能に構成されている。

文書管理サーバ１００は、複数の文書を記憶しており、クライアント２００に対して、ネットワーク３００経由でそれら文書の情報を提供する。文書管理サーバ１００は、記憶部１１０、文書登録部１２０及びサービス部１３０を含む。

記憶部１１０は、文書群の情報を記憶するシステムである。記憶部１１０は、文書ＤＢ（データベース）１１２及びテーブルＤＢ１１４を含む。

文書ＤＢ１１２は、各文書のファイルそのものを記憶している。文書ＤＢ１１２に記憶される文書は、テキストデータと、テキストデータ以外の一以上の形式のデータとを含み得るデータ形式のファイルである。このようなデータ形式の例には、例えばＰＤＦ（ＰｏｔａｂｌｅＤｏｃｕｍｅｎｔＦｉｌｅ）形式や、出願人が開発したＤｏｃｕｗｏｒｋｓ（登録商標）形式、マイクロソフト（登録商標）社のオフィス文書形式等がある。文書に含まれるテキストデータ以外のデータ形式には、画像データ、グラフィックスデータ、表形式データ、音声データ等、様々なものがあり得る。

図２に、文書ＤＢ１１２に登録されている文書のあるページ４００を模式的に示す。このページ４００は、２つのテキストオブジェクト４１０と、１つの画像オブジェクトを含んでいる。テキストオブジェクト４１０は、テキストデータを含むオブジェクトであり、画像オブジェクト４２０はテキストデータ以外の形式のオブジェクトの例である。

テーブルＤＢ１１４は、文書ＤＢ１１２に記憶されている文書ごとに、その文書のテキスト位置テーブルを記憶している。テキスト位置テーブルは、文書に含まれる各テキストデータの、文書内での位置の情報が登録されたテーブルである。

図３に、ある文書についてのテキスト位置テーブルの例を示す。この例では、文書は複数のページから構成されている。この場合、テキスト位置テーブルは、文書に含まれる個々のテキストデータごとに、そのテキストデータと、そのテキストデータが存在するページの番号と、そのページ内でのそのテキストデータの位置とを保持する。テキストデータが存在するページの番号と、そのページ内でのそのテキストデータの位置との組合せが、そのテキストデータの文書内の位置を示す。テキスト位置テーブルには、文書の１ページ目から順に、各ページ内にあるテキストデータの情報が登録されている。

例えば、個々のテキストデータがテキストオブジェクトの矩形領域内に配置される場合、そのテキストデータのページ内での位置は、その矩形領域の所定の対角線上の２頂点（例えば矩形の左上と右下の頂点）の座標の組合せである。

また別の例のテキスト位置テーブルは、文書に含まれる個々の段落ごとに、その段落に含まれるテキストデータと、文書の先頭から数えたその段落の段落番号とを対応付けて保持するものであってもよい。この場合段落番号がテキストデータの文書内での位置を示す。

文書登録部１２０は、記憶部１１０に対して文書を登録する処理を行う。文書登録部１２０は、テーブル作成部１２２を含む。テーブル作成部１２２は、ユーザから登録された文書について、上述したテキスト位置テーブルを作成する。

ユーザから文書の登録が要求された場合、文書登録部１２０は、その文書を文書ＤＢ１１２に登録する。また、このときテーブル作成部１２２は、その文書の内容を解析することにより、その文書に含まれる個々のテキストデータを抽出する。文書内に含まれる個々のテキストオブジェクトには、テキストデータの他に、そのテキストデータの表示に用いるフォント、太字や斜字体等の文字の表示スタイル等と表示属性情報、及びそのテキストオブジェクトの文書内での位置の情報（例えばページの番号とそのページ内でのそのテキストオブジェクトの位置）が含まれる。テーブル作成部１２２は、テキストオブジェクトが含むそれら情報のうち、テキストデータと、位置の情報を取り出す。そして、テーブル作成部１２２は、取り出したテキストデータと、そのテキストデータの文書内での位置の情報とを含んだテキスト位置テーブルを作成し、作成したテキスト位置テーブルを、文書ＤＢ１１２に登録した文書と対応付けて、テーブルＤＢ１１４に登録する。この対応付けは、例えば、文書とテキスト位置テーブルを、同じ文書識別情報と対応付けて、文書ＤＢ１１２及びテーブルＤＢ１１４に登録することで行えばよい。

サービス部１３０は、クライアント２００からの要求に応じて、文書に関する情報を提供する。サービス部１３０は、ページ提供部１３２とテーブル提供部１３４を含む。ページ提供部１３２は、クライアント２００から要求された文書のうち、ユーザが指定したページのフルデータをクライアント２００に提供する。ページのフルデータには、文書中のそのページに含まれる全てのコンテンツを含んだデータである。すなわちページのフルデータには、そのページに含まれるテキストデータとテキスト以外の全ての形式のデータが含まれる。すなわちページのフルデータは、そのページの全体データである。テーブル提供部１３４は、要求された文書のテキスト位置テーブルをクライアント２００に提供する。

サービス部１３０は、クライアント２００から文書が要求されると、その文書のフルデータを応答する代わりに、その文書のテキスト位置テーブルをテーブル提供部１３４からクライアント２００に応答する。ユーザは、そのテキスト位置テーブルを用いて、閲覧したいページを特定する。ページ提供部１３２は、ユーザが特定したページのフルデータをクライアント２００に提供する。

クライアント２００は、ユーザが操作する情報処理装置であり、文書ＵＩ部２０２、検索部２０４、及びデータ取得部２０６を含む。

文書ＵＩ部２０２は、文書管理サーバ１００の利用のためのＵＩ（ユーザインタフェース）を提供する。文書ＵＩ部２０２は、例えば、文書管理サーバ１００が管理している文書群の一覧を提示してユーザから文書の選択を受け付ける画面を提供する。また文書ＵＩ部２０２は、文書内のテキスト検索のためのダイアログや、文書のページを表示する画面を提供する。文書ＵＩ部２０２は、ウェブブラウザを用いて構成されていてもよい。

検索部２０４は、文書内のテキスト検索のための検索条件を受け付け、その検索条件を満たす部分をその文書中から検索する。

データ取得部２０６は、ユーザが要求した文書のテキスト位置データや、ユーザが選択したページのフルデータを文書管理サーバ１００から取得する。

図４に、クライアント２００が実行する処理手順を例示する。

ユーザは、クライアント２００の文書ＵＩ部２０２を操作して文書管理サーバ１００にログインする。そして、例えば、そのユーザがアクセス可能な文書の一覧を示す画面を取得し、その画面の中から取得したい文書を選択する。選択された文書の識別情報を含んだ文書要求が、クライアント２００のデータ取得部２０６から文書管理サーバ１００に送られる。文書管理サーバ１００のテーブル提供部１３４は、その文書要求が示す文書のテキスト位置テーブルをテーブルＤＢ１１４から取得し、クライアント２００に送信する。クライアント２００のデータ取得部２０６は、そのテキスト位置テーブルを取得する（Ｓ１０）。

なお、クライアント２００からの文書要求に応じて、文書管理サーバ１００は、テキスト位置テーブルだけでなく、その文書の最初のページのフルデータをクライアント２００に送信してもよい。

文書ＵＩ部２０２は、取得したテキスト位置テーブル（及び、もしあれば、最初のページのフルデータ）を用いて、現ページ（すなわちこの時点では最初のページ）の画像をクライアント２００の画面に表示する（Ｓ１２）。このとき、現ページのフルデータを取得している場合は、フルデータを表示する。また、現ページのフルデータを未だ取得していない場合は、文書ＵＩ部２０２は、テキスト位置テーブル中の現ページのページ番号に対応するテキストデータ群から、現ページの簡易画像を生成し、表示する。簡易画像は、例えば、１ページの領域内に、テキスト位置テーブル中の現ページのページ番号に対応する各テキストデータの位置に、そのテキストデータが示すテキストを配置したものである。言い換えれば、簡易画像は、ページのフルデータが示す画像から、テキスト以外の形式のオブジェクトを除いたものに似た画像である。

次に文書ＵＩ部２０２は、ユーザからの操作を待ち受ける。この表示に対して受け付け可能な操作は、終了又は検索である。操作があった場合、その操作が終了操作かどうか判定する（Ｓ１４）。ユーザからの操作が検索であった場合、Ｓ１４の判定結果はＮｏとなり、文書ＵＩ部２０２は検索ダイアログを表示してユーザから検索条件（例えば検索語）の入力を受け付ける。

検索部２０４は、そのダイアログに入力された検索条件を満たす語句を、テキスト位置テーブルにおけるテキストデータ群から検索する（Ｓ１６）。この検索は、現在のカーソル位置（この時点では文書の第１ページの先頭）から現ページの末尾の方向に進められる。検索条件を満たす語句が現ページ内から見つかると、Ｓ１８の判定結果がＮｏとなり、検索部２０４はその語句を特定する情報を文書ＵＩ部２０２に渡し、文書ＵＩ部２０２は、表示している現ページの画像中でその語句を強調表示する。

別のページが検索でヒットした場合、すなわち検索条件を満たす語句が別のページから見つかった場合、Ｓ１８の判定結果がＹｅｓとなる。この場合、文書ＵＩ部２０２は、テキスト位置テーブル内の、ヒットしたページのテキストデータから簡易画像を生成し、画面に表示する（Ｓ２０）。そして、文書ＵＩ部２０２は、ページのフルデータのダウンロードが必要か否かを問い合わせるダイアログを表示してユーザからの指示を受け付け（Ｓ２２）、その指示がダウンロード要又は不要のいずれであるかを判定する（Ｓ２４）。

ユーザからの指示が、ダウンロード要であった場合、データ取得部２０６が、その文書のそのページを特定する情報を含んだフルデータ要求を文書管理サーバ１００に送る。この要求に応じて、文書管理サーバ１００は、その情報が示すページのフルデータを文書ＤＢ１１２から取り出し、そのフルデータをデータ取得部２０６に応答する。データ取得部２０６はそのフルデータを取得する（Ｓ２６）。文書ＵＩ部２０２は、そのフルデータが表すページの画像を表示する（Ｓ１２）。ユーザは、そのフルデータのページの画像を閲覧する。

Ｓ２４の判定の結果がＮｏ、すなわちユーザからの指示がダウンロード不要の場合、文書ＵＩ部２０２は、Ｓ１２に戻り、Ｓ２０で表示したページの簡易表示を続行する。

その後、文書ＵＩ部２０２は、終了指示、同じ検索条件での検索続行指示、又は新たな検索条件での検索指示をユーザから受け付け、ユーザからの指示に応じてＳ１４以降の処理を繰り返す。

以上に説明したように、この実施形態では、文書管理サーバ１００は、クライアント２００から文書を要求されたときに、文書のフルデータの代わりに、テキスト位置テーブルを提供する。テキスト位置テーブルは、画像やグラフィックス等のサイズの大きいデータを含まないので、文書のフルデータよりも一般にはるかにサイズが小さい。

テキスト位置テーブルは、文書内のテキストデータを全て含んでいる。したがって、テキスト位置テーブル内のテキストデータに対して全文検索が可能である。

またテキスト位置テーブルは、各テキストデータの文書内での位置の情報を含んでいる。したがって、テキスト位置テーブル内で検索にヒットした語句が、文書内でのどの位置（例えばどのページ内）にあるかがテキスト位置テーブルから特定される。そして、特定した位置の情報をクライアント２００から文書管理サーバ１００に送ることで、文書管理サーバ１００から、文書のうちその位置に対応する部分（例えばページ）のフルデータを取得することが可能になる。

図４の手順では、検索にヒットした語句が見つかる都度、ユーザにその語句を含むページをダウンロードするかどうかを問い合わせたが、これは一例に過ぎない。問合せを行わずに、ヒットしたページのフルデータを自動的にダウンロードしてもよい。

また、上記実施形態において、クライアント２００からの文書の要求に応じて、文書管理サーバ１００は、テキスト位置テーブルに加えて、その文書の各ページのサムネイル画像をクライアント２００に提供してもよい。クライアント２００の文書ＵＩ部２０２は、受け取った各ページのサムネイル画像を一覧表示する。ユーザはこの一覧表示により、その文書に含まれるページ群の概要を知る。また、文書ＵＩ部２０２は、この一覧表示上でサムネイル画像の選択を受け付け、選択されたサムネイル画像が示すページの簡易画像を、テキスト位置テーブル内の当該ページのテキストデータから生成し、画面に表示してもよい。

また、上記実施形態では、文書が登録されたときに、文書登録部１２０のテーブル作成部１２２がその文書のテキスト位置テーブルを生成し、テーブルＤＢ１１４に登録したが、これは一例に過ぎない。この代わりに、クライアント２００から文書を要求された際に、テーブル作成部１２２がオンデマンドで、その文書のテキスト位置テーブルを作成し、提供してもよい。この点は、この後に説明する参考例１及び２の場合も同様である。

上記実施形態の文書管理サーバ１００は「第１の情報処理装置」の例であり、クライアント２００は「第２の情報処理装置」の例である。また、文書管理サーバ１００内の記憶部１１０は、「データを記憶する記憶手段」の一例であり、その記憶部１１０に記憶される個々の文書は、「記憶手段」に記憶される「データ」の例である。また、文書中の各ページは「データ」が含む複数の「部分」の一例である。また，ページ中に含まれる個々のテキストデータ内の語句は「部分」が含み得る「要素」の一例である。また、テキスト位置テーブルは、「前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報」の一例であり、テーブル提供部１３４は「第１提供手段」の一例である。また、ページ提供部１３２は「第２提供手段」の一例である。また、クライアント２００の検索部２０４は「検索手段」の一例であり、データ取得部２０６は「取得手段」の一例である。また、文書ＵＩ部２０２がテキスト位置テーブルの情報から生成するページの簡易画像は、「ページ内の、テキストの概略的な配置を示すページ画像」の一例である。
＜参考例１＞

次に、図５を参照して、文書のテキスト位置テーブルを利用した音声読み上げサービスの例を説明する。この例では、文書ＵＩ部２０２が、文書管理サーバ１００から取得したテキスト位置テーブルを参照して、文書のテキスト読み上げを実行する。

図５の手順では、ユーザの文書の要求に応じて、クライアント２００のデータ取得部２０６が文書管理サーバ１００からその文書のテキスト位置テーブルをダウンロードする（Ｓ３０）。次に、文書ＵＩ部２０２が、テキスト位置テーブルから、最初のページ内にあるテキストデータを取得する（Ｓ３２）。そのページ内に複数のテキストデータがある場合には、それら複数のテキストデータを全て取得し、それらテキストデータを所定の順序に並べる。

そして、文書ＵＩ部２０２は、取得したテキストデータの先頭の語句から順に音声読み上げを実行する（Ｓ３４）。この音声読み上げには、外部の音声読み上げソフトを用いてもよい。文書ＵＩ部２０２は、現ページのテキストデータ内に未だ読み上げていない語句が残っているか判定し（Ｓ３５）、残っていれば次の語句に移行し（Ｓ３６）、音声読み上げを続行する（Ｓ３４）。

Ｓ３５の判定結果がＮｏの場合、文書ＵＩ部２０２は、ユーザから終了指示が入力されたこと、又は現ページが当該文書の最後のページであること、の少なくとも一方が満足されたかどうかを判定する（Ｓ３８）。この判定の結果がＮｏの場合、文書ＵＩ部２０２はテキスト位置テーブルから次のページのテキストデータを取得し（Ｓ３９）、そのテキストデータの先頭の語句から順に音声読み上げを実行する（Ｓ３４）。Ｓ３８の判定結果がＹｅｓの場合、この処理手順を終了する。

図５の例では、クライアント２００は最初に文書の全ページについてのテキスト位置テーブルを文書管理サーバ１００からダウンロードしたが、この代わりに、変形例として、テキスト位置データを先頭ページから順に１ページ分ずつダウンロードしてもよい。この場合、Ｓ３９では、データ取得部２０６が、次のページ分のテキスト位置データを文書管理サーバ１００からダウンロードする。この例では、最初にダウンロードするのは１ページ目のテキスト位置テーブルだけなので、ダウンロードに要する時間が短く、それだけ１ページ目の読み上げの開始が早くなる。

またこの変形例では、Ｓ３２及びＳ３９でページ内のテキストデータを取得した際に、そのページ内のテキストデータの総文字数を計算し、その総文字数を次ページのテキスト位置テーブルのダウンロード制御に利用してもよい。すなわち、文書ＵＩ部２０２がページの先頭から読み上げた文字数を計数し、その計数値がそのページの総文字数から所定の文字数を差し引いた値に達した時点で、データ取得部２０６が、テキスト位置テーブルから次のページのテキストデータのダウンロードを開始する。これにより、現ページの読み上げが完了するまでに、次ページのテキスト位置テーブルのダウンロードを終わらせる。ここで、総文字数から差し引く「所定の文字数」は、音声読み上げの速度（例えば１秒あたりの読み上げ文字数）と、１ページ分のテキスト位置テーブルをダウンロードするのに要する平均的な時間から求めておけばよい。
＜参考例２＞

次に、図６を参照して、文書のテキスト位置テーブルを利用したテキスト校正の例を説明する。この例では、文書ＵＩ部２０２が、文書管理サーバ１００から取得したテキスト位置テーブルを用いて各ページのテキストを表示し、ユーザから誤記等の修正を受け付け、その修正結果を文書管理サーバ１００内の文書に反映させる。

図６の手順では、ユーザの文書の要求に応じて、クライアント２００のデータ取得部２０６が文書管理サーバ１００からその文書のテキスト位置テーブルをダウンロードする（Ｓ４０）。次に、文書ＵＩ部２０２が、テキスト位置テーブルから、文書の最初のページのテキストデータを読み出し、画面に表示する（Ｓ４２）。この表示では、そのページ内の各テキストデータを、そのページ内のそのテキストデータの位置に表示してもよい。

次に文書ＵＩ部２０２は、そのページ内のテキストデータの先頭から順に、スペルチェックを行う（Ｓ４４）。スペルチェックでは、誤記や禁則の誤りなどを検出する。スペルチェックは、文書ＵＩ部２０２ではなく外部システムに実行させてもよい。また、ユーザがその画面上のテキストデータを読んで、スペルチェックを行ってもよい。そして、スペルチェックで誤記等を検出する（Ｓ４６の判定結果がＹｅｓ）と、文書ＵＩ部２０２は、表示しているページのテキストデータ中のその検出した誤記等の部分までカーソルを移動させ、その誤記等の部分を強調表示する。そして、ユーザから、その誤記等の部分について修正の入力を受け付ける（Ｓ４８）。なお、Ｓ４８では、ユーザに修正させる代わりに、外部システムに修正を実行させてもよい。

修正処理の後、文書ＵＩ部２０２は、修正結果の情報を文書管理サーバ１００に送信する（Ｓ５０）。このとき送る情報には、例えば、当該文書の識別情報、当該ページの番号、修正した部分を含むテキストデータの位置（これはテキスト位置テーブルから取得可能）、修正した部分のそのテキストデータ内での位置、修正結果の文字列、等が含まれる。修正した部分のテキストデータ内での位置は、例えばその部分がそのテキストデータの先頭文字から何文字目から何文字目までの部分かを示す情報である。

修正結果の情報を受け取った文書管理サーバ１００は、その情報に従い、文書ＤＢ１１２内のその文書内のその部分の文字列を、その修正結果の文字列に変更する。

次に、文書ＵＩ部２０２は、現ページ内に残り（すなわちスペルチェック未実行の部分）があるか判定し（Ｓ５２）、この判定結果がＹｅｓならばＳ４４に戻り、残りの部分のスペルチェックを行う。

Ｓ５２の判定結果がＮｏの場合は、文書ＵＩ部２０２は、ユーザから終了指示が入力されたこと、又は現ページが当該文書の最後のページであること、の少なくとも一方が満足されたかどうかを判定する（Ｓ５４）。この判定の結果がＮｏの場合、文書ＵＩ部２０２はテキスト位置テーブルから次のページのテキストデータを取得して画面に表示し（Ｓ５６）、Ｓ４４に戻ってそのページを現ページとして、スペルチェックを実行する。Ｓ５４の判定結果がＹｅｓの場合、この処理手順を終了する。

以上に説明した実施形態及び参考例の文書管理サーバ１００及びクライアント２００は、コンピュータに上述のその文書管理サーバ１００又はクライアント２００を構成する要素群の機能を表すプログラムを実行させることにより実現される。ここで、コンピュータは、例えば、ハードウエアとして、プロセッサ、ランダムアクセスメモリ（ＲＡＭ）等のメモリ（主記憶装置）、フラッシュメモリやＳＳＤ（ソリッドステートドライブ）、ＨＤＤ（ハードディスクドライブ）や等の補助記憶装置を制御するコントローラ、各種Ｉ／Ｏ（入出力）インタフェース、ローカルエリアネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース等が、たとえばバス等を介して接続された回路構成を有する。それら各機能の処理内容が記述されたプログラムがネットワーク等の経由で補助記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがメモリに読み出されプロセッサにより実行されることにより、上に例示した機能モジュール群が実現される。

ここでプロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ（例えばＣＰＵ：ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、等）や、専用のプロセッサ（例えばＧＰＵ：ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、ＡＳＩＣ：ＡｐｐｌｉｃｔｉｏｎＳｐｅｓｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ、ＦＰＧＡ：ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ、プログラマブル論理デバイス、等）を含むものである。

また、上記実施形態及び参考例におけるプロセッサの動作は、１つのプロセッサによってなすのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働してなすものであってもよい。また、プロセッサの各動作（すなわちプロセッサの動作により実現される図１の各要素の処理動作）は、上記実施形態及び各参考例において記載した順序のみに限定されるものではなく、適宜に変更してもよい。

１００文書管理サーバ、１１０記憶部、１１２文書ＤＢ、１１４テーブルＤＢ、１２０文書登録部、１２２テーブル作成部、１３０サービス部、１３２ページ提供部、１３４テーブル提供部、２００クライアント、２０２文書ＵＩ部、２０４検索部、２０６データ取得部、３００ネットワーク。

Claims

第１の情報処理装置と、第２の情報処理装置と、を含み、
前記第１の情報処理装置は、
データを記憶する記憶手段であって、前記データは複数の部分を含み、前記複数の部分の各々はそれぞれ１以上の要素を含む、記憶手段と、
前記データ中の前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報を前記第２の情報処理装置に提供する第１提供手段と、
前記第２の情報処理装置から前記データの特定の前記部分を要求された場合に、当該部分を前記第２の情報処理装置に提供する第２提供手段と、
を含み、
前記第２の情報処理装置は、
ユーザから前記要素についての検索条件の入力を受け付け、前記検索条件を満たす要素を前記特定情報から検索する検索手段と、
前記検索手段により検索された要素が含まれる前記部分を前記特定情報から求め、求めた部分を前記第１の情報処理装置に要求し、この要求に応じて前記第１の情報処理装置から提供された前記部分を取得する取得手段と、
を含む情報処理システム。
前記データは、テキストとテキスト以外の種類の情報とを含む文書データであり、
前記部分は、前記文書データが含む個々のページであり、それら各ページは、それぞれ当該ページに含まれるテキストとテキスト以外の種類の情報とを含み、
前記要素は、テキスト中の語句であり、
前記特定情報は、前記各ページに含まれるテキストを特定する情報である、
請求項１に記載の情報処理システム。
前記ページは、１以上のテキストオブジェクトを含み、
前記ページが含む前記１以上のテキストオブジェクトは、それぞれ、当該テキストオブジェクトに含まれるテキストと、当該テキストの表示属性を表す表示属性情報と、当該テキストオブジェクトの前記ページ内での位置を表す位置情報と、を含み、
前記特定情報は、前記各テキストオブジェクトに含まれるテキストと前記各テキストオブジェクトの前記位置情報とを特定する情報を含み、
前記第２の情報処理装置は、前記検索手段により検索された要素が含まれる前記ページ内の、テキストの概略的な配置を示すページ画像を、前記特定情報に基づいて生成して表示する手段、を更に含む、請求項２に記載の情報処理システム。
前記取得手段は、表示された前記ページ画像に対応付けて、前記ユーザに、当該ページの全体データの取得を希望するか否かを問合せ、この問合せに応じて取得を希望する旨の回答があった場合には、当該ページに含まれるテキストとテキスト以外の種類の情報とを含む当該ページの全体データを前記部分として取得する、
請求項３に記載の情報処理システム。
前記取得手段は、前記検索手段により検索された要素が含まれる前記部分を取得するか否かを前記ユーザに問い合わせ、前記ユーザから取得する旨の回答があった場合に、前記部分を前記第１の情報処理装置に要求する、請求項１に記載の情報処理システム。
コンピュータを、
データを記憶する記憶手段であって、前記データは複数の部分を含み、前記複数の部分の各々はそれぞれ１以上の要素を含む、記憶手段、
前記データ中の前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報を第２の情報処理装置に提供する第１提供手段、
前記第２の情報処理装置から前記データの特定の前記部分を要求された場合に、当該部分を前記第２の情報処理装置に提供する第２提供手段、
として機能させるためのプログラム。
コンピュータを、
データに含まれる複数の部分の各々に含まれる１以上の要素のそれぞれについて、前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報を第１の情報処理装置から受け取る手段、
ユーザから前記要素についての検索条件の入力を受け付け、前記検索条件を満たす要素を前記特定情報から検索する検索手段、
前記検索手段により検索された要素が含まれる前記部分を前記特定情報から求め、求めた部分を前記第１の情報処理装置に要求し、この要求に応じて前記第１の情報処理装置から提供された前記部分を取得する取得手段、
として機能させるためのプログラム。