JP2021043519A - 情報処理システム及びプログラム - Google Patents

情報処理システム及びプログラム Download PDF

Info

Publication number
JP2021043519A
JP2021043519A JP2019162999A JP2019162999A JP2021043519A JP 2021043519 A JP2021043519 A JP 2021043519A JP 2019162999 A JP2019162999 A JP 2019162999A JP 2019162999 A JP2019162999 A JP 2019162999A JP 2021043519 A JP2021043519 A JP 2021043519A
Authority
JP
Japan
Prior art keywords
text
data
page
document
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019162999A
Other languages
English (en)
Inventor
将弘 山田
Masahiro Yamada
将弘 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2019162999A priority Critical patent/JP2021043519A/ja
Publication of JP2021043519A publication Critical patent/JP2021043519A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

【課題】複数の部分を含むデータのうち必要な部分がクライアント側で事前に分からない場合でも、そのデータ全体を取得するよりも少ないデータ転送量で、必要な部分を特定して取得できるようにする。【解決手段】文書管理サーバ100は、クライアント200から文書が要求されると、文書の全体データの代わりに、その文書内のテキストデータと、そのテキストデータの文書内での位置とを示すテキスト位置テーブルを提供する。テキスト位置テーブルには、文書の各ページに含まれるテキスト以外のデータ(例えば画像)は含まれない。クライアント200は、受け取ったテキスト位置テーブルに対して検索を行う。クライアント200は、検索にヒットした部分を含むページの全体データが必要かユーザに問い合わせ、ユーザが必要と回答した場合、そのページの全体データを文書管理サーバ100からダウンロードし、画面に表示する。【選択図】図1

Description

本発明は,情報処理システム及びプログラムに関する。
特許文献1には、コンテンツデータの複数の部分を有する単一のファイルを格納し、その部分を少なくとも1つ選択的にダウンロードするシステムが開示される。サーバには、例えば音楽データ、カバー写真、歌詞のテキストデータを含む音楽ファイルのように、複数の部分を含んだデータが保存されている。クライアントは、そのデータのうち自分の機種に応じた部分のみを選択的にダウンロードする。例えば音楽プレイヤーは、音楽ファイルのうち音楽データのみをダウンロードし、歌詞データ等はダウンロードしない。また、ユーザがダウンロードする部分(種類)を示す「使用状況」を規定することも可能であり(同文献の段落0018参照)。
特表2007-511829号公報
サーバに記憶された複数の部分を含むデータのうちの特定の部分のみをクライアントが選択的に取得可能なシステムが存在する。このシステムでは、クライアントがデータのうち特定の部分のみを必要とする場合には、データ全体を取得するよりも、サーバ・クライアント間で転送されるデータ量が削減される。
しかし、このシステムでは、データのうちクライアント側に必要な部分が分からない場合、必要な部分を指定することができず、結局クライアントはサーバからそのデータの全体を取得するしかない。
本発明は、複数の部分を含むデータのうち必要な部分がクライアント側で事前に分からない場合でも、そのデータ全体を取得するよりも少ないデータ転送量で、必要な部分を特定して取得できる仕組みを提供する。
請求項1に係る発明は、第1の情報処理装置と、第2の情報処理装置と、を含み、前記第1の情報処理装置は、データを記憶する記憶手段であって、前記データは複数の部分を含み、前記複数の部分の各々はそれぞれ1以上の要素を含む、記憶手段と、前記データ中の前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報を前記第2の情報処理装置に提供する第1提供手段と、前記第2の情報処理装置から前記データの特定の前記部分を要求された場合に、当該部分を前記第2の情報処理装置に提供する第2提供手段と、を含み、前記第2の情報処理装置は、ユーザから前記要素についての検索条件の入力を受け付け、前記検索条件を満たす要素を前記特定情報から検索する検索手段と、前記検索手段により検索された要素が含まれる前記部分を前記特定情報から求め、求めた部分を前記第1の情報処理装置に要求し、この要求に応じて前記第1の情報処理装置から提供された前記部分を取得する取得手段と、を含む情報処理システムである。
請求項2に係る発明は、前記データは、テキストとテキスト以外の種類の情報とを含む文書データであり、前記部分は、前記文書データが含む個々のページであり、それら各ページは、それぞれ当該ページに含まれるテキストとテキスト以外の種類の情報とを含み、前記要素は、テキスト中の語句であり、前記特定情報は、前記各ページに含まれるテキストを特定する情報である、請求項1に記載の情報処理システムである。
請求項3に係る発明は、前記ページは、1以上のテキストオブジェクトを含み、前記ページが含む前記1以上のテキストオブジェクトは、それぞれ、当該テキストオブジェクトに含まれるテキストと、当該テキストの表示属性を表す表示属性情報と、当該テキストオブジェクトの前記ページ内での位置を表す位置情報と、を含み、前記特定情報は、前記各テキストオブジェクトに含まれるテキストと前記各テキストオブジェクトの前記位置情報とを特定する情報を含み、前記第2の情報処理装置は、前記検索手段により検索された要素が含まれる前記ページ内の、テキストの概略的な配置を示すページ画像を、前記特定情報に基づいて生成して表示する手段、を更に含む、請求項2に記載の情報処理システムである。
請求項4に係る発明は、前記取得手段は、表示された前記ページ画像に対応付けて、前記ユーザに、当該ページの全体データの取得を希望するか否かを問合せ、この問合せに応じて取得を希望する旨の回答があった場合には、当該ページに含まれるテキストとテキスト以外の種類の情報とを含む当該ページの全体データを前記部分として取得する、請求項3に記載の情報処理システムである。
請求項5に係る発明は、前記取得手段は、前記検索手段により検索された要素が含まれる前記部分を取得するか否かを前記ユーザに問い合わせ、前記ユーザから取得する旨の回答があった場合に、前記部分を前記第1の情報処理装置に要求する、請求項1に記載の情報処理システムである。
請求項6に係る発明は、コンピュータを、データを記憶する記憶手段であって、前記データは複数の部分を含み、前記複数の部分の各々はそれぞれ1以上の要素を含む、記憶手段、前記データ中の前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報を第2の情報処理装置に提供する第1提供手段、前記第2の情報処理装置から前記データの特定の前記部分を要求された場合に、当該部分を前記第2の情報処理装置に提供する第2提供手段、として機能させるためのプログラムである。
請求項7に係る発明は、コンピュータを、データに含まれる複数の部分の各々に含まれる1以上の要素のそれぞれについて、前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報を第1の情報処理装置から受け取る手段、ユーザから前記要素についての検索条件の入力を受け付け、前記検索条件を満たす要素を前記特定情報から検索する検索手段、前記検索手段により検索された要素が含まれる前記部分を前記特定情報から求め、求めた部分を前記第1の情報処理装置に要求し、この要求に応じて前記第1の情報処理装置から提供された前記部分を取得する取得手段、として機能させるためのプログラムである。
請求項1、2、6又は7に係る発明によれば、複数の部分を含むデータのうち必要な部分がクライアント側で事前に分からない場合でも、そのデータ全体を取得するよりも少ないデータ転送量で、必要な部分を特定して取得できる。
請求項3に係る発明によれば、第2の情報処理装置が、データ全体を受け取っていなくても、特定情報に基づきそのデータに含まれるテキストの概略的な配置を示すページ画像をユーザに提供することができる。
請求項4又は5に係る発明によれば、データのうちユーザが必要としない部分を取得しないようにすることができる。
実施形態のシステム構成を例示する図である。 文書のページの構成を例示する図である。 テキスト位置テーブルの例を示す図である。 実施形態におけるクライアントの処理手順を例示する図である。 参考例1におけるクライアントの処理手順を例示する図である。 参考例2におけるクライアントの処理手順を例示する図である。
図1に、本発明の一実施形態のシステム構成を示す。このシステムは、第1の情報処理装置の一例である文書管理サーバ100と、第2の情報処理装置の一例であるクライアント200とを含む。クライアント200は、インターネットやローカルエリアネットワーク等のネットワーク300を介して、文書管理サーバ100と通信可能に構成されている。
文書管理サーバ100は、複数の文書を記憶しており、クライアント200に対して、ネットワーク300経由でそれら文書の情報を提供する。文書管理サーバ100は、記憶部110、文書登録部120及びサービス部130を含む。
記憶部110は、文書群の情報を記憶するシステムである。記憶部110は、文書DB(データベース)112及びテーブルDB114を含む。
文書DB112は、各文書のファイルそのものを記憶している。文書DB112に記憶される文書は、テキストデータと、テキストデータ以外の一以上の形式のデータとを含み得るデータ形式のファイルである。このようなデータ形式の例には、例えばPDF(Potable Document File)形式や、出願人が開発したDocuworks(登録商標)形式、マイクロソフト(登録商標)社のオフィス文書形式等がある。文書に含まれるテキストデータ以外のデータ形式には、画像データ、グラフィックスデータ、表形式データ、音声データ等、様々なものがあり得る。
図2に、文書DB112に登録されている文書のあるページ400を模式的に示す。このページ400は、2つのテキストオブジェクト410と、1つの画像オブジェクトを含んでいる。テキストオブジェクト410は、テキストデータを含むオブジェクトであり、画像オブジェクト420はテキストデータ以外の形式のオブジェクトの例である。
テーブルDB114は、文書DB112に記憶されている文書ごとに、その文書のテキスト位置テーブルを記憶している。テキスト位置テーブルは、文書に含まれる各テキストデータの、文書内での位置の情報が登録されたテーブルである。
図3に、ある文書についてのテキスト位置テーブルの例を示す。この例では、文書は複数のページから構成されている。この場合、テキスト位置テーブルは、文書に含まれる個々のテキストデータごとに、そのテキストデータと、そのテキストデータが存在するページの番号と、そのページ内でのそのテキストデータの位置とを保持する。テキストデータが存在するページの番号と、そのページ内でのそのテキストデータの位置との組合せが、そのテキストデータの文書内の位置を示す。テキスト位置テーブルには、文書の1ページ目から順に、各ページ内にあるテキストデータの情報が登録されている。
例えば、個々のテキストデータがテキストオブジェクトの矩形領域内に配置される場合、そのテキストデータのページ内での位置は、その矩形領域の所定の対角線上の2頂点(例えば矩形の左上と右下の頂点)の座標の組合せである。
また別の例のテキスト位置テーブルは、文書に含まれる個々の段落ごとに、その段落に含まれるテキストデータと、文書の先頭から数えたその段落の段落番号とを対応付けて保持するものであってもよい。この場合段落番号がテキストデータの文書内での位置を示す。
文書登録部120は、記憶部110に対して文書を登録する処理を行う。文書登録部120は、テーブル作成部122を含む。テーブル作成部122は、ユーザから登録された文書について、上述したテキスト位置テーブルを作成する。
ユーザから文書の登録が要求された場合、文書登録部120は、その文書を文書DB112に登録する。また、このときテーブル作成部122は、その文書の内容を解析することにより、その文書に含まれる個々のテキストデータを抽出する。文書内に含まれる個々のテキストオブジェクトには、テキストデータの他に、そのテキストデータの表示に用いるフォント、太字や斜字体等の文字の表示スタイル等と表示属性情報、及びそのテキストオブジェクトの文書内での位置の情報(例えばページの番号とそのページ内でのそのテキストオブジェクトの位置)が含まれる。テーブル作成部122は、テキストオブジェクトが含むそれら情報のうち、テキストデータと、位置の情報を取り出す。そして、テーブル作成部122は、取り出したテキストデータと、そのテキストデータの文書内での位置の情報とを含んだテキスト位置テーブルを作成し、作成したテキスト位置テーブルを、文書DB112に登録した文書と対応付けて、テーブルDB114に登録する。この対応付けは、例えば、文書とテキスト位置テーブルを、同じ文書識別情報と対応付けて、文書DB112及びテーブルDB114に登録することで行えばよい。
サービス部130は、クライアント200からの要求に応じて、文書に関する情報を提供する。サービス部130は、ページ提供部132とテーブル提供部134を含む。ページ提供部132は、クライアント200から要求された文書のうち、ユーザが指定したページのフルデータをクライアント200に提供する。ページのフルデータには、文書中のそのページに含まれる全てのコンテンツを含んだデータである。すなわちページのフルデータには、そのページに含まれるテキストデータとテキスト以外の全ての形式のデータが含まれる。すなわちページのフルデータは、そのページの全体データである。テーブル提供部134は、要求された文書のテキスト位置テーブルをクライアント200に提供する。
サービス部130は、クライアント200から文書が要求されると、その文書のフルデータを応答する代わりに、その文書のテキスト位置テーブルをテーブル提供部134からクライアント200に応答する。ユーザは、そのテキスト位置テーブルを用いて、閲覧したいページを特定する。ページ提供部132は、ユーザが特定したページのフルデータをクライアント200に提供する。
クライアント200は、ユーザが操作する情報処理装置であり、文書UI部202、検索部204、及びデータ取得部206を含む。
文書UI部202は、文書管理サーバ100の利用のためのUI(ユーザインタフェース)を提供する。文書UI部202は、例えば、文書管理サーバ100が管理している文書群の一覧を提示してユーザから文書の選択を受け付ける画面を提供する。また文書UI部202は、文書内のテキスト検索のためのダイアログや、文書のページを表示する画面を提供する。文書UI部202は、ウェブブラウザを用いて構成されていてもよい。
検索部204は、文書内のテキスト検索のための検索条件を受け付け、その検索条件を満たす部分をその文書中から検索する。
データ取得部206は、ユーザが要求した文書のテキスト位置データや、ユーザが選択したページのフルデータを文書管理サーバ100から取得する。
図4に、クライアント200が実行する処理手順を例示する。
ユーザは、クライアント200の文書UI部202を操作して文書管理サーバ100にログインする。そして、例えば、そのユーザがアクセス可能な文書の一覧を示す画面を取得し、その画面の中から取得したい文書を選択する。選択された文書の識別情報を含んだ文書要求が、クライアント200のデータ取得部206から文書管理サーバ100に送られる。文書管理サーバ100のテーブル提供部134は、その文書要求が示す文書のテキスト位置テーブルをテーブルDB114から取得し、クライアント200に送信する。クライアント200のデータ取得部206は、そのテキスト位置テーブルを取得する(S10)。
なお、クライアント200からの文書要求に応じて、文書管理サーバ100は、テキスト位置テーブルだけでなく、その文書の最初のページのフルデータをクライアント200に送信してもよい。
文書UI部202は、取得したテキスト位置テーブル(及び、もしあれば、最初のページのフルデータ)を用いて、現ページ(すなわちこの時点では最初のページ)の画像をクライアント200の画面に表示する(S12)。このとき、現ページのフルデータを取得している場合は、フルデータを表示する。また、現ページのフルデータを未だ取得していない場合は、文書UI部202は、テキスト位置テーブル中の現ページのページ番号に対応するテキストデータ群から、現ページの簡易画像を生成し、表示する。簡易画像は、例えば、1ページの領域内に、テキスト位置テーブル中の現ページのページ番号に対応する各テキストデータの位置に、そのテキストデータが示すテキストを配置したものである。言い換えれば、簡易画像は、ページのフルデータが示す画像から、テキスト以外の形式のオブジェクトを除いたものに似た画像である。
次に文書UI部202は、ユーザからの操作を待ち受ける。この表示に対して受け付け可能な操作は、終了又は検索である。操作があった場合、その操作が終了操作かどうか判定する(S14)。ユーザからの操作が検索であった場合、S14の判定結果はNoとなり、文書UI部202は検索ダイアログを表示してユーザから検索条件(例えば検索語)の入力を受け付ける。
検索部204は、そのダイアログに入力された検索条件を満たす語句を、テキスト位置テーブルにおけるテキストデータ群から検索する(S16)。この検索は、現在のカーソル位置(この時点では文書の第1ページの先頭)から現ページの末尾の方向に進められる。検索条件を満たす語句が現ページ内から見つかると、S18の判定結果がNoとなり、検索部204はその語句を特定する情報を文書UI部202に渡し、文書UI部202は、表示している現ページの画像中でその語句を強調表示する。
別のページが検索でヒットした場合、すなわち検索条件を満たす語句が別のページから見つかった場合、S18の判定結果がYesとなる。この場合、文書UI部202は、テキスト位置テーブル内の、ヒットしたページのテキストデータから簡易画像を生成し、画面に表示する(S20)。そして、文書UI部202は、ページのフルデータのダウンロードが必要か否かを問い合わせるダイアログを表示してユーザからの指示を受け付け(S22)、その指示がダウンロード要又は不要のいずれであるかを判定する(S24)。
ユーザからの指示が、ダウンロード要であった場合、データ取得部206が、その文書のそのページを特定する情報を含んだフルデータ要求を文書管理サーバ100に送る。この要求に応じて、文書管理サーバ100は、その情報が示すページのフルデータを文書DB112から取り出し、そのフルデータをデータ取得部206に応答する。データ取得部206はそのフルデータを取得する(S26)。文書UI部202は、そのフルデータが表すページの画像を表示する(S12)。ユーザは、そのフルデータのページの画像を閲覧する。
S24の判定の結果がNo、すなわちユーザからの指示がダウンロード不要の場合、文書UI部202は、S12に戻り、S20で表示したページの簡易表示を続行する。
その後、文書UI部202は、終了指示、同じ検索条件での検索続行指示、又は新たな検索条件での検索指示をユーザから受け付け、ユーザからの指示に応じてS14以降の処理を繰り返す。
以上に説明したように、この実施形態では、文書管理サーバ100は、クライアント200から文書を要求されたときに、文書のフルデータの代わりに、テキスト位置テーブルを提供する。テキスト位置テーブルは、画像やグラフィックス等のサイズの大きいデータを含まないので、文書のフルデータよりも一般にはるかにサイズが小さい。
テキスト位置テーブルは、文書内のテキストデータを全て含んでいる。したがって、テキスト位置テーブル内のテキストデータに対して全文検索が可能である。
またテキスト位置テーブルは、各テキストデータの文書内での位置の情報を含んでいる。したがって、テキスト位置テーブル内で検索にヒットした語句が、文書内でのどの位置(例えばどのページ内)にあるかがテキスト位置テーブルから特定される。そして、特定した位置の情報をクライアント200から文書管理サーバ100に送ることで、文書管理サーバ100から、文書のうちその位置に対応する部分(例えばページ)のフルデータを取得することが可能になる。
図4の手順では、検索にヒットした語句が見つかる都度、ユーザにその語句を含むページをダウンロードするかどうかを問い合わせたが、これは一例に過ぎない。問合せを行わずに、ヒットしたページのフルデータを自動的にダウンロードしてもよい。
また、上記実施形態において、クライアント200からの文書の要求に応じて、文書管理サーバ100は、テキスト位置テーブルに加えて、その文書の各ページのサムネイル画像をクライアント200に提供してもよい。クライアント200の文書UI部202は、受け取った各ページのサムネイル画像を一覧表示する。ユーザはこの一覧表示により、その文書に含まれるページ群の概要を知る。また、文書UI部202は、この一覧表示上でサムネイル画像の選択を受け付け、選択されたサムネイル画像が示すページの簡易画像を、テキスト位置テーブル内の当該ページのテキストデータから生成し、画面に表示してもよい。
また、上記実施形態では、文書が登録されたときに、文書登録部120のテーブル作成部122がその文書のテキスト位置テーブルを生成し、テーブルDB114に登録したが、これは一例に過ぎない。この代わりに、クライアント200から文書を要求された際に、テーブル作成部122がオンデマンドで、その文書のテキスト位置テーブルを作成し、提供してもよい。この点は、この後に説明する参考例1及び2の場合も同様である。
上記実施形態の文書管理サーバ100は「第1の情報処理装置」の例であり、クライアント200は「第2の情報処理装置」の例である。また、文書管理サーバ100内の記憶部110は、「データを記憶する記憶手段」の一例であり、その記憶部110に記憶される個々の文書は、「記憶手段」に記憶される「データ」の例である。また、文書中の各ページは「データ」が含む複数の「部分」の一例である。また,ページ中に含まれる個々のテキストデータ内の語句は「部分」が含み得る「要素」の一例である。また、テキスト位置テーブルは、「前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報」の一例であり、テーブル提供部134は「第1提供手段」の一例である。また、ページ提供部132は「第2提供手段」の一例である。また、クライアント200の検索部204は「検索手段」の一例であり、データ取得部206は「取得手段」の一例である。また、文書UI部202がテキスト位置テーブルの情報から生成するページの簡易画像は、「ページ内の、テキストの概略的な配置を示すページ画像」の一例である。
<参考例1>
次に、図5を参照して、文書のテキスト位置テーブルを利用した音声読み上げサービスの例を説明する。この例では、文書UI部202が、文書管理サーバ100から取得したテキスト位置テーブルを参照して、文書のテキスト読み上げを実行する。
図5の手順では、ユーザの文書の要求に応じて、クライアント200のデータ取得部206が文書管理サーバ100からその文書のテキスト位置テーブルをダウンロードする(S30)。次に、文書UI部202が、テキスト位置テーブルから、最初のページ内にあるテキストデータを取得する(S32)。そのページ内に複数のテキストデータがある場合には、それら複数のテキストデータを全て取得し、それらテキストデータを所定の順序に並べる。
そして、文書UI部202は、取得したテキストデータの先頭の語句から順に音声読み上げを実行する(S34)。この音声読み上げには、外部の音声読み上げソフトを用いてもよい。文書UI部202は、現ページのテキストデータ内に未だ読み上げていない語句が残っているか判定し(S35)、残っていれば次の語句に移行し(S36)、音声読み上げを続行する(S34)。
S35の判定結果がNoの場合、文書UI部202は、ユーザから終了指示が入力されたこと、又は現ページが当該文書の最後のページであること、の少なくとも一方が満足されたかどうかを判定する(S38)。この判定の結果がNoの場合、文書UI部202はテキスト位置テーブルから次のページのテキストデータを取得し(S39)、そのテキストデータの先頭の語句から順に音声読み上げを実行する(S34)。S38の判定結果がYesの場合、この処理手順を終了する。
図5の例では、クライアント200は最初に文書の全ページについてのテキスト位置テーブルを文書管理サーバ100からダウンロードしたが、この代わりに、変形例として、テキスト位置データを先頭ページから順に1ページ分ずつダウンロードしてもよい。この場合、S39では、データ取得部206が、次のページ分のテキスト位置データを文書管理サーバ100からダウンロードする。この例では、最初にダウンロードするのは1ページ目のテキスト位置テーブルだけなので、ダウンロードに要する時間が短く、それだけ1ページ目の読み上げの開始が早くなる。
またこの変形例では、S32及びS39でページ内のテキストデータを取得した際に、そのページ内のテキストデータの総文字数を計算し、その総文字数を次ページのテキスト位置テーブルのダウンロード制御に利用してもよい。すなわち、文書UI部202がページの先頭から読み上げた文字数を計数し、その計数値がそのページの総文字数から所定の文字数を差し引いた値に達した時点で、データ取得部206が、テキスト位置テーブルから次のページのテキストデータのダウンロードを開始する。これにより、現ページの読み上げが完了するまでに、次ページのテキスト位置テーブルのダウンロードを終わらせる。ここで、総文字数から差し引く「所定の文字数」は、音声読み上げの速度(例えば1秒あたりの読み上げ文字数)と、1ページ分のテキスト位置テーブルをダウンロードするのに要する平均的な時間から求めておけばよい。
<参考例2>
次に、図6を参照して、文書のテキスト位置テーブルを利用したテキスト校正の例を説明する。この例では、文書UI部202が、文書管理サーバ100から取得したテキスト位置テーブルを用いて各ページのテキストを表示し、ユーザから誤記等の修正を受け付け、その修正結果を文書管理サーバ100内の文書に反映させる。
図6の手順では、ユーザの文書の要求に応じて、クライアント200のデータ取得部206が文書管理サーバ100からその文書のテキスト位置テーブルをダウンロードする(S40)。次に、文書UI部202が、テキスト位置テーブルから、文書の最初のページのテキストデータを読み出し、画面に表示する(S42)。この表示では、そのページ内の各テキストデータを、そのページ内のそのテキストデータの位置に表示してもよい。
次に文書UI部202は、そのページ内のテキストデータの先頭から順に、スペルチェックを行う(S44)。スペルチェックでは、誤記や禁則の誤りなどを検出する。スペルチェックは、文書UI部202ではなく外部システムに実行させてもよい。また、ユーザがその画面上のテキストデータを読んで、スペルチェックを行ってもよい。そして、スペルチェックで誤記等を検出する(S46の判定結果がYes)と、文書UI部202は、表示しているページのテキストデータ中のその検出した誤記等の部分までカーソルを移動させ、その誤記等の部分を強調表示する。そして、ユーザから、その誤記等の部分について修正の入力を受け付ける(S48)。なお、S48では、ユーザに修正させる代わりに、外部システムに修正を実行させてもよい。
修正処理の後、文書UI部202は、修正結果の情報を文書管理サーバ100に送信する(S50)。このとき送る情報には、例えば、当該文書の識別情報、当該ページの番号、修正した部分を含むテキストデータの位置(これはテキスト位置テーブルから取得可能)、修正した部分のそのテキストデータ内での位置、修正結果の文字列、等が含まれる。修正した部分のテキストデータ内での位置は、例えばその部分がそのテキストデータの先頭文字から何文字目から何文字目までの部分かを示す情報である。
修正結果の情報を受け取った文書管理サーバ100は、その情報に従い、文書DB112内のその文書内のその部分の文字列を、その修正結果の文字列に変更する。
次に、文書UI部202は、現ページ内に残り(すなわちスペルチェック未実行の部分)があるか判定し(S52)、この判定結果がYesならばS44に戻り、残りの部分のスペルチェックを行う。
S52の判定結果がNoの場合は、文書UI部202は、ユーザから終了指示が入力されたこと、又は現ページが当該文書の最後のページであること、の少なくとも一方が満足されたかどうかを判定する(S54)。この判定の結果がNoの場合、文書UI部202はテキスト位置テーブルから次のページのテキストデータを取得して画面に表示し(S56)、S44に戻ってそのページを現ページとして、スペルチェックを実行する。S54の判定結果がYesの場合、この処理手順を終了する。
以上に説明した実施形態及び参考例の文書管理サーバ100及びクライアント200は、コンピュータに上述のその文書管理サーバ100又はクライアント200を構成する要素群の機能を表すプログラムを実行させることにより実現される。ここで、コンピュータは、例えば、ハードウエアとして、プロセッサ、ランダムアクセスメモリ(RAM)等のメモリ(主記憶装置)、フラッシュメモリやSSD(ソリッドステートドライブ)、HDD(ハードディスクドライブ)や等の補助記憶装置を制御するコントローラ、各種I/O(入出力)インタフェース、ローカルエリアネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース等が、たとえばバス等を介して接続された回路構成を有する。それら各機能の処理内容が記述されたプログラムがネットワーク等の経由で補助記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがメモリに読み出されプロセッサにより実行されることにより、上に例示した機能モジュール群が実現される。
ここでプロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU:Central Processing Unit、等)や、専用のプロセッサ(例えばGPU:Graphics Processing Unit、 ASIC:Appliction Spesific Integrated Circuit、 FPGA:Field Programmable Gate Array、 プログラマブル論理デバイス、等)を含むものである。
また、上記実施形態及び参考例におけるプロセッサの動作は、1つのプロセッサによってなすのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働してなすものであってもよい。また、プロセッサの各動作(すなわちプロセッサの動作により実現される図1の各要素の処理動作)は、上記実施形態及び各参考例において記載した順序のみに限定されるものではなく、適宜に変更してもよい。
100 文書管理サーバ、110 記憶部、112 文書DB、114 テーブルDB、120 文書登録部、122 テーブル作成部、130 サービス部、132 ページ提供部、134 テーブル提供部、200 クライアント、202 文書UI部、204 検索部、206 データ取得部、300 ネットワーク。

Claims (7)

  1. 第1の情報処理装置と、第2の情報処理装置と、を含み、
    前記第1の情報処理装置は、
    データを記憶する記憶手段であって、前記データは複数の部分を含み、前記複数の部分の各々はそれぞれ1以上の要素を含む、記憶手段と、
    前記データ中の前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報を前記第2の情報処理装置に提供する第1提供手段と、
    前記第2の情報処理装置から前記データの特定の前記部分を要求された場合に、当該部分を前記第2の情報処理装置に提供する第2提供手段と、
    を含み、
    前記第2の情報処理装置は、
    ユーザから前記要素についての検索条件の入力を受け付け、前記検索条件を満たす要素を前記特定情報から検索する検索手段と、
    前記検索手段により検索された要素が含まれる前記部分を前記特定情報から求め、求めた部分を前記第1の情報処理装置に要求し、この要求に応じて前記第1の情報処理装置から提供された前記部分を取得する取得手段と、
    を含む情報処理システム。
  2. 前記データは、テキストとテキスト以外の種類の情報とを含む文書データであり、
    前記部分は、前記文書データが含む個々のページであり、それら各ページは、それぞれ当該ページに含まれるテキストとテキスト以外の種類の情報とを含み、
    前記要素は、テキスト中の語句であり、
    前記特定情報は、前記各ページに含まれるテキストを特定する情報である、
    請求項1に記載の情報処理システム。
  3. 前記ページは、1以上のテキストオブジェクトを含み、
    前記ページが含む前記1以上のテキストオブジェクトは、それぞれ、当該テキストオブジェクトに含まれるテキストと、当該テキストの表示属性を表す表示属性情報と、当該テキストオブジェクトの前記ページ内での位置を表す位置情報と、を含み、
    前記特定情報は、前記各テキストオブジェクトに含まれるテキストと前記各テキストオブジェクトの前記位置情報とを特定する情報を含み、
    前記第2の情報処理装置は、前記検索手段により検索された要素が含まれる前記ページ内の、テキストの概略的な配置を示すページ画像を、前記特定情報に基づいて生成して表示する手段、を更に含む、請求項2に記載の情報処理システム。
  4. 前記取得手段は、表示された前記ページ画像に対応付けて、前記ユーザに、当該ページの全体データの取得を希望するか否かを問合せ、この問合せに応じて取得を希望する旨の回答があった場合には、当該ページに含まれるテキストとテキスト以外の種類の情報とを含む当該ページの全体データを前記部分として取得する、
    請求項3に記載の情報処理システム。
  5. 前記取得手段は、前記検索手段により検索された要素が含まれる前記部分を取得するか否かを前記ユーザに問い合わせ、前記ユーザから取得する旨の回答があった場合に、前記部分を前記第1の情報処理装置に要求する、請求項1に記載の情報処理システム。
  6. コンピュータを、
    データを記憶する記憶手段であって、前記データは複数の部分を含み、前記複数の部分の各々はそれぞれ1以上の要素を含む、記憶手段、
    前記データ中の前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報を第2の情報処理装置に提供する第1提供手段、
    前記第2の情報処理装置から前記データの特定の前記部分を要求された場合に、当該部分を前記第2の情報処理装置に提供する第2提供手段、
    として機能させるためのプログラム。
  7. コンピュータを、
    データに含まれる複数の部分の各々に含まれる1以上の要素のそれぞれについて、前記要素がそれぞれ前記複数の部分のいずれに含まれているかを特定するための特定情報を第1の情報処理装置から受け取る手段、
    ユーザから前記要素についての検索条件の入力を受け付け、前記検索条件を満たす要素を前記特定情報から検索する検索手段、
    前記検索手段により検索された要素が含まれる前記部分を前記特定情報から求め、求めた部分を前記第1の情報処理装置に要求し、この要求に応じて前記第1の情報処理装置から提供された前記部分を取得する取得手段、
    として機能させるためのプログラム。
JP2019162999A 2019-09-06 2019-09-06 情報処理システム及びプログラム Pending JP2021043519A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019162999A JP2021043519A (ja) 2019-09-06 2019-09-06 情報処理システム及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019162999A JP2021043519A (ja) 2019-09-06 2019-09-06 情報処理システム及びプログラム

Publications (1)

Publication Number Publication Date
JP2021043519A true JP2021043519A (ja) 2021-03-18

Family

ID=74864076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019162999A Pending JP2021043519A (ja) 2019-09-06 2019-09-06 情報処理システム及びプログラム

Country Status (1)

Country Link
JP (1) JP2021043519A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001101203A (ja) * 1999-09-29 2001-04-13 Sony Corp 電子ファイリング装置および電子ファイリング装置を利用した文書の検索方法
JP2009169538A (ja) * 2008-01-11 2009-07-30 Ricoh Co Ltd 文書検索装置、文書検索方法及び文書検索プログラム
JP2013030089A (ja) * 2011-07-29 2013-02-07 E-Jidai:Kk 文書検索システムおよび文書検索プログラム
JP2014241013A (ja) * 2013-06-11 2014-12-25 富士ゼロックス株式会社 プログラム、文書提供装置及び文書表示システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001101203A (ja) * 1999-09-29 2001-04-13 Sony Corp 電子ファイリング装置および電子ファイリング装置を利用した文書の検索方法
JP2009169538A (ja) * 2008-01-11 2009-07-30 Ricoh Co Ltd 文書検索装置、文書検索方法及び文書検索プログラム
JP2013030089A (ja) * 2011-07-29 2013-02-07 E-Jidai:Kk 文書検索システムおよび文書検索プログラム
JP2014241013A (ja) * 2013-06-11 2014-12-25 富士ゼロックス株式会社 プログラム、文書提供装置及び文書表示システム

Similar Documents

Publication Publication Date Title
JP5911304B2 (ja) ウェブ上の文書を閲覧するためのフォントの取扱い
JP4290011B2 (ja) ビューワ装置及びその制御方法、プログラム
US7617449B2 (en) Method and system for mapping content between a starting template and a target template
US7617450B2 (en) Method, system, and computer-readable medium for creating, inserting, and reusing document parts in an electronic document
US9317622B1 (en) Methods and systems for fragmenting and recombining content structured language data content to reduce latency of processing and rendering operations
CN102063483A (zh) 基于用户代理类型以变化格式提供字体文件
CN101361059A (zh) 支持在便携设备上显示内容的系统和方法
JPH10124413A (ja) 埋め込みウェブオブジェクトの優先順位づけダウンローディングの方法と装置
JP2009545077A (ja) 利用可能なソースデータ及びローカライゼーションの再利用
JP3809863B2 (ja) サーバ
JP2003085087A (ja) トランスコーディングシステム、コンテンツ変換方法、アノテーションデータを格納した記録媒体及びアノテーション管理装置
JP2005107597A (ja) 類似文検索装置、類似文検索方法、およびプログラム
US9158748B2 (en) Correction of quotations copied from electronic documents
US20100042914A1 (en) Information processing apparatus, information processing method, and program
JP2019040260A (ja) 情報処理装置及びプログラム
US9871933B2 (en) Information processing apparatus and image processing system for generating image data for a preview image by using print data described in page description language
JP2002215519A (ja) ウェブページ生成方法およびシステム、ウェブページ生成プログラム、記録媒体
JP2021043519A (ja) 情報処理システム及びプログラム
US8156428B1 (en) Method and apparatus for merging digital content
US9946698B2 (en) Inserting text and graphics using hand markup
US10853558B2 (en) Transforming digital text content using expressions
JP2009128929A (ja) 情報出力方法、情報出力装置、及び情報出力プログラム
JP2003345783A (ja) 文書作成方法
JP7081238B2 (ja) 情報処理システム、情報処理方法及びプログラム
US20220107939A1 (en) File management apparatus and non-transitory computer readable medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220829

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230613

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231205