JP4683963B2 - 電子ファイル書き込みシステム、プログラム、電子ファイルへの書き込み情報反映方法 - Google Patents

電子ファイル書き込みシステム、プログラム、電子ファイルへの書き込み情報反映方法 Download PDF

Info

Publication number
JP4683963B2
JP4683963B2 JP2005060022A JP2005060022A JP4683963B2 JP 4683963 B2 JP4683963 B2 JP 4683963B2 JP 2005060022 A JP2005060022 A JP 2005060022A JP 2005060022 A JP2005060022 A JP 2005060022A JP 4683963 B2 JP4683963 B2 JP 4683963B2
Authority
JP
Japan
Prior art keywords
text group
information
writing
electronic file
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005060022A
Other languages
English (en)
Other versions
JP2006244199A (ja
JP2006244199A5 (ja
Inventor
泰 不破
正志 青沼
文隆 酒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Shinshu University NUC
Original Assignee
Seiko Epson Corp
Shinshu University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp, Shinshu University NUC filed Critical Seiko Epson Corp
Priority to JP2005060022A priority Critical patent/JP4683963B2/ja
Publication of JP2006244199A publication Critical patent/JP2006244199A/ja
Publication of JP2006244199A5 publication Critical patent/JP2006244199A5/ja
Application granted granted Critical
Publication of JP4683963B2 publication Critical patent/JP4683963B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、電子ファイルに書き込みを行うための、電子ファイル書き込みシステム、プログラム、電子ファイルへの書き込み情報反映方法に関するものである。
近年、インターネットやイントラネットを介して閲覧されるWebファイル等の電子ファイルは、単なる情報提供に限らず様々な利用方法が知られている。その一例として、電子教育システム(e−ラーニングシステム)が挙げられる(例えば特許文献1参照)。この電子教育システムとは、教材となる電子ファイルを、ユーザ(生徒)がインターネット等を利用して閲覧し、学習を進める自主自習型の教育システムである。
この教育システムに依れば、図や動画等を用いたより効果的なマルチメディア教材の提供が可能であるだけでなく、大勢の生徒を一箇所に集合させて講義を行う必要がないので、コストを大幅に削減することが実現可能であるとともに、ユーザ(生徒)にとっても自身の都合に合わせて学習を進めることができるといった利点がある。さらに、多数の生徒に教材となる印刷物を配布する必要がなく、また、教材の内容変更に伴う更新も容易であることから、教材の作成コストを大幅に軽減させることができるので、従来の講義形式で学習を進める場合にも、この電子教育システムが導入されつつある。
特開平11−282826号公報
しかし、ユーザが学習を進めるうえで、教材である電子ファイルに対して、メモ書きやマーキングといった書き込み情報の書き込みを行う場合には、通常教材をプリントアウトし、プリントアウトした出力物に対して、メモ書きやマーキングを行うといった煩雑な作業を行っている。また、教材である電子ファイル自体に、メモ書きやマーキングを書き込むことができる場合でも、電子ファイルを表示する表示層、書き込みを行うための書き込み層との2層を構成し、これらを特定のサイズで固定的に表示しているため、電子ファイルの表示サイズは常に固定される。従って、ユーザは電子ファイルの表示サイズを所望のサイズに変更できない。さらに、教材の内容が変更され、新たに更新された場合には、書き込み情報の位置を特定することが困難であり、書き込み情報を反映することができない。
本発明は、上記の問題に鑑み、電子ファイルのテキスト文書に含まれる任意のテキスト群に書き込まれた書き込み情報を、対応するテキスト群に反映させることができる電子ファイル書き込みシステム、プログラム、電子ファイルへの書き込み情報反映方法を提供することをその課題とする。
本発明の電子ファイル書き込みシステムは、1以上のテキスト群を含む電子ファイルに書き込みを行うための情報端末と、当該情報端末に接続され、電子ファイルを記憶するサーバと、から構成される電子ファイル書き込みシステムであって、情報端末は、電子ファイルに書き込みを行う書き込み手段と、書き込み手段によって書き込まれた画像データ、テキストデータ、および音声データの少なくともいずれか1のデータから成るメモ書き情報、または、テキスト群に含まれる文字のマーキングに関するマーキング情報を含む書き込み情報と、当該書き込み情報の電子ファイル上の位置を示す位置情報と、を含む書き込み詳細情報をサーバへ送信する送信手段と、を備え、サーバは、受信した書き込み詳細情報と、位置情報に基づいて生成した当該書き込み情報が属するテキスト群を特定するためのテキスト群特定情報と、マーキングが行われた文字を特定するための文字特定情報と、を記憶する記憶手段と、記憶した書き込み情報を、テキスト群特定情報に基づいて、電子ファイルに反映させる書き込み情報反映手段と、を備え、
前記記憶手段は、記憶された複数のテキスト群の順序に関する順序情報及び文字特定情報をさらに記憶し、書き込み情報反映手段は、書き込み情報がメモ書き情報であって、電子ファイルの更新によって、書き込み情報が属するテキスト群が削除された場合、順序情報に基づいて、書き込み情報が属するテキスト群の直前または直後に位置するテキスト群に前記書き込み情報を反映させ、書き込み情報がマーキング情報の場合、テキスト群特定情報に基づいて、マーキングが行われた文字が属するテキスト群を特定した後、記憶した文字特定情報に基づいて、マーキングが行われた文字をさらに特定し、書き込み情報を反映させることを特徴とする。
また、本発明の電子ファイルへの書き込み情報反映方法は、1以上のテキスト群を含む電子ファイルに書き込みを行うための情報端末と、当該情報端末に接続され、電子ファイルを記憶するサーバと、から構成されるネットワークシステムの電子ファイルへの書き込み情報反映方法であって、情報端末が、電子ファイルに書き込みを行う書き込みステップと、書き込みステップによって書き込まれた画像データ、テキストデータ、および音声データの少なくともいずれか1のデータから成るメモ書き情報、または、テキスト群に含まれる文字のマーキングに関するマーキング情報を含む書き込み情報と、当該書き込み情報の電子ファイル上の位置を示す位置情報と、を含む書き込み詳細情報をサーバへ送信する送信ステップと、を実行し、サーバが、受信した書き込み詳細情報と、位置情報に基づいて生成した当該書き込み情報が属するテキスト群を特定するためのテキスト群特定情報と、マーキングが行われた文字を特定するための文字特定情報と、を記憶する記憶ステップと、記憶した書き込み情報を、テキスト群特定情報に基づいて、電子ファイルに反映させる書き込み情報反映ステップと、を実行し、記憶ステップにおいて、記憶された複数のテキスト群の順序に関する順序情報及び文字特定情報をさらに記憶し、書き込み情報反映ステップは、書き込み情報がメモ書き情報であって、電子ファイルの更新によって、書き込み情報が属するテキスト群が削除された場合、順序情報に基づいて、書き込み情報が属するテキスト群の直前または直後に位置するテキスト群に書き込み情報を反映させ、書き込み情報がマーキング情報の場合、テキスト群特定情報に基づいて、マーキングが行われた文字が属するテキスト群を特定した後、記憶した文字特定情報に基づいて、マーキングが行われた文字をさらに特定し、書き込み情報を反映させることを特徴とする。
これらの構成によれば、テキスト群を特定するための情報に基づいて、例えばWebファイルといった電子ファイル上に書き込まれた書き込み情報が属するテキスト群を特定し、書き込み情報を反映させることができるので、表示画面の表示サイズが変更されても、対応するテキスト群に正しく書き込み情報を反映させることができる。
この場合、サーバは、書き込み情報記憶時の電子ファイルに含まれるテキスト群である旧テキスト群、および書き込み情報反映時の電子ファイルに含まれるテキスト群である新テキスト群、の全てについて、それらの特徴量であるテキスト群特徴量を算出するテキスト群特徴量算出手段、をさらに備え、記憶手段は、テキスト群特定情報として、旧テキスト群のテキスト群特徴量および新テキスト群のテキスト群特徴量を記憶し、書き込み情報反映手段は、各旧テキスト群のテキスト群特徴量および各新テキスト群のテキスト群特徴量に基づいて、対応するテキスト群を特定し、書き込み情報を反映させることが好ましい。
この構成によれば、電子ファイルに含まれるテキスト群全てについて、テキスト群のテキスト群特定情報、すなわちテキスト群の特徴量を算出し、算出したその特徴量に基づいて、電子ファイルに書き込まれた書き込み情報を反映するので、例えば、テキスト群の順序が入れ替わったような場合でも、書き込み情報が属するテキスト群を正しく特定し、書き込み情報を反映させることが可能である。
また、この場合、サーバは、電子ファイルを更新する更新手段と、記憶した全テキスト群のテキスト群特徴量を用いて、各旧テキスト群と、各新テキスト群との対応付けを行うテキスト群マッチング手段と、各旧テキスト群のテキスト群特徴量と、テキスト群マッチング手段によって当該各旧テキスト群に対応付けられた、各新テキスト群のテキスト群特徴量との差異が、所定の閾値未満であるかを判定するテキスト群判定手段と、をさらに備え、電子ファイルが更新された場合、テキスト群特徴量算出手段は、新テキスト群のテキスト群特徴量として、更新時の前記電子ファイルに含まれるテキスト群のテキスト群特徴量を算出し、記憶手段は、新テキスト群のテキスト群特徴量として、書き込み情報反映直前の更新時におけるテキスト群特徴量を記憶し、書き込み情報反映手段は、テキスト群判定手段によって、両テキスト群特徴量の差異が所定の閾値未満であると判定された、旧テキスト群と新テキスト群の組み合わせを、対応するテキスト群として特定し、書き込み情報を反映させることが好ましい。
この構成によれば、マッチングの結果、対応付けられた2つのテキスト群の特徴量の差が所定の閾値未満である組み合わせを、対応するテキスト群として特定する、すなわち一定以上の類似度を有するテキスト群の組み合わせを、対応するテキスト群として特定するので、たとえ電子ファイルが更新され、その内容に若干の変更が加えられた場合にも、更新前のテキスト群に対して、対応するテキスト群を正しく特定し、書き込み情報を反映することが可能となる。
さらに、記憶手段が、書き込み情報保存時のテキスト群特徴量、および書き込み情報反映直前の更新時における、テキスト群特徴量、を記憶しているので、サーバは、情報端末が複数の場合でも、各情報端末からの電子ファイル送信要求の度に、テキスト群特徴量を算出しなくてよい。特に情報端末の数が数十台、数百台に達する場合等には、かなりの負荷を軽減することができる。また、書き込み情報を反映する直前に算出されたテキスト群特徴量を新テキスト群特徴量として記憶するので、書き込み情報が反映されるまでの間に、電子ファイルが複数回に亘って更新された場合にも、その更新毎に算出された全てのテキスト群特徴量を記憶する必要がなくメモリ容量を節約できる。
この構成によれば、電子ファイルに書き込まれたメモ書き情報が属するテキスト群が、電子ファイルの更新によって削除された場合にも、メモ書き情報を反映させることができる。さらに、更新前にメモ書き情報が属していたテキスト群の、直前または直後に位置するテキスト群に対してメモ書き情報を反映するので、別のテキスト群にメモ書き情報を反映したことによる、ユーザが抱く虞のある違和感を可能な限り減少させ得る。また、メモ書き情報が画像や音声である場合には、ユーザが電子ファイルに描画した画像や貼り付けた音声をそのまま再現するので、ユーザによる書き込み処理の自由度をより高めることができる。
また、これらの場合、書き込み情報には、テキスト群に含まれる文字のマーキングに関するマーキング情報が含まれ、記憶手段は、マーキングが行われた文字を特定するための文字特定情報をさらに記憶し、書き込み情報反映手段は、テキスト群特定情報に基づいて、マーキングが行われた文字が属するテキスト群を特定した後、記憶した文字特定情報に基づいて、マーキングが行われた文字をさらに特定し、書き込み情報を反映させることが好ましい。
この構成によれば、文字列を特定するための情報に基づいて、電子ファイルに書き込まれた書き込み情報(マーキング情報)が属する文字列を特定し、書き込み情報を反映させることができるので、ユーザが表示画面の表示サイズに規制されることなく、マーキング情報を電子ファイルに書き込むことができる。
この場合、旧テキスト群に含まれる、句読点および/または改行位置で区切られる1以上の文字列である旧文字列、および当該旧テキスト群に対応する新テキスト群に含まれる前記1以上の文字列である新文字列、の全てについて、それらの特徴量である文字列特徴量を算出する文字列特徴量算出手段をさらに備え、記憶手段は、文字特定情報として、各旧文字列の文字列特徴量および各新文字列の文字列特徴量を記憶し、書き込み情報反映手段は、各旧文字列の文字列特徴量および各新文字列の文字列特徴量に基づいて、対応する文字列を特定し、書き込み情報を反映させることが好ましい。
この構成によれば、算出した文字列特徴量に基づいて、文字列の対応付けを行うことによって、マーキング情報が属している旧文字列に対応する新文字列を特定し、マーキング情報を反映させるので、たとえ、テキスト群を構成する文字列の順序が入れ替わったような場合でも、マーキング情報が属する文字列を特定し、反映させることが可能である。但しこの場合、マーキング情報は文字列単位で反映される。
また、この場合、記憶した全文字列の文字列特徴量を用いて、各旧文字列と各新文字列との対応付けを行う文字列マッチング手段と、各旧文字列の文字列特徴量と、文字列マッチング手段によって当該各旧文字列に対応付けられた、各新文字列の文字列特徴量との差異が、所定の閾値未満であるかを判定する文字列判定手段と、をさらに備え、書き込み情報反映手段は、文字列判定手段によって、両文字列特徴量の差異が所定の閾値未満であると判定された、旧文字列と新文字列の組み合わせを対応する文字列として特定し、書き込み情報を反映させることが好ましい。
この構成によれば、マッチングの結果、対応付けられた2つの文字列の特徴量の差が所定の閾値未満である組み合わせを、対応する文字列として特定する、すなわち一定以上の類似度を有する文字列の組み合わせを、対応する文字列として特定するので、たとえ電子ファイルが更新され、その内容に若干の変更が加えられた場合にも、更新前の文字列に対して、対応する文字列を正しく特定し、書き込み情報を反映することが可能となる。
これらの場合、文字特定情報には、マーキングが行われた文字を示すテキストデータがさらに含まれ、書き込み情報反映手段は、マーキングが行われた文字が属する文字列を特定した後、テキストデータに基づいて、マーキングが行われた文字をさらに特定し、書き込み情報を反映させることが好ましい。
この構成によれば、たとえマーキングが行われた文字が、句読点および/または改行位置で区切られる文字列に満たない文字(例えば単語)であるときにも、対応する文字列の中から、マーキングが行われた文字を特定して書き込み情報を反映させることができる。
また、これらの場合、記憶手段は、マーキングの種別を示す情報に関するマーキング種別情報をさらに記憶することが好ましい。
この構成によれば、直線、波線、二重線、下線、点線など多様なマーキングを電子ファイルに書き込み、反映させることが可能となる。
本発明のプログラムは、コンピュータを、上記のいずれか1に記載の電子ファイル書き込みシステムにおける各手段として機能させることを特徴とする。
この構成によれば、電子ファイルのテキスト文書に含まれる任意のテキスト群に書き込まれた書き込み情報を、対応するテキスト群に反映させるためのプログラムを提供することができる。
以下、添付の図面を参照して、本発明の電子ファイル書き込みシステム、プログラム、電子ファイルへの書き込み情報反映方法について、詳細に説明する。本発明の電子ファイル書き込みシステム等は、例えばインターネットやイントラネットを介して閲覧するWebファイル等の電子ファイルを教材とし、ユーザ(生徒)がこの電子ファイルを用いて学習を進める形態のe−ラーニングシステムに用いられるような、電子ファイルにユーザがメモ書きやマーキングといった書き込みを行うためのシステムである。
本実施形態に係る電子ファイル書き込みシステム1は、図1に示すように、電子ファイルEF(図3参照)および書き込み情報81(図2参照)を記憶するサーバ50と、このサーバ50にネットワーク150を介して接続され、電子ファイルEFに書き込みを行うための情報端末となるクライアントPC(以下単にPCと記載)100(図では3台表示)と、から構成されている。
PC100は、WWWブラウザ106(図2参照)を備え、利用者がWWWブラウザ106を介して電子ファイルEFを閲覧しようとすると、サーバ50へ電子ファイルEFの送信を要求する。そして、その要求に対してサーバ50から送信された電子ファイルEFを受信し、ディスプレイ109(図2参照)に表示する。さらに、表示している電子ファイルEFに対して、マーキングやメモ書きといった書き込みを行うための書き込み手段120と、ユーザにより書き込み手段120を用いて書き込まれた書き込み情報81、および書き込み情報81の電子ファイル上の位置を示す位置情報82、を含む書き込み詳細情報80(いずれも図2参照)を取得し、サーバ50へ送信する送信手段130と、を有している。なお、書き込み手段120は、図2に示すキーボード110並びにマウス111によってその主要部が構成されている。
サーバ50は、電子ファイルEFを記憶する電子ファイルデータベースDB1と、PC100から受信した書き込み詳細情報80を記憶する書き込み情報データベースDB2と、を有している。また、サーバ50は、データ処理部60(書き込み情報反映手段)を有し、データ処理部60は、PC100からの電子ファイルEF送信要求に応じて、書き込み情報81を電子ファイルEFに反映させるための様々な処理を行い、ネットワークインタフェース(NT−I/F)54(図2参照)と共同して書き込み情報81を反映した電子ファイルEFをPC100に送信する。
続いて、図2を参照してサーバ50およびPC100のハードウェア構成について説明する。サーバ50は、ネットワーク150とのデータ送受信部であるネットワークインタフェース(NT−I/F)54、サーバ50で実行される各種処理を制御するCPU51、処理プログラム等を記憶するROM52、ワークエリアとなるRAM53、および電子ファイルデータベースDB1、書き込み情報データベースDB2等を記憶するハードディスク55を備え、これらは互いにシステムバス56を介して互いに接続されている。なお、ハードディスク55にはOS57がインストールされている。また、書き込み情報データベースDB2には、PC100から受信した書き込み詳細情報80(書き込み情報81、位置情報82)に加え、位置情報82に基づいて生成したテキスト群特定情報90および文字特定情報95(詳細については後述する)が記憶されている。
さらに、サーバ50は、電子ファイルEFを更新するための更新手段70(図1参照)を有しており、電子ファイルEFの内容が変更され更新された電子ファイルEFを、元のファイルに上書きして記憶しておくことが可能である。また、サーバ50のハードディスク55には、書き込み情報81を電子ファイルEFに反映させるための様々な処理を行うための、書き込み情報反映プログラムPがインストールされている。
一方、PC100は、ネットワーク150とのデータ送受信部であるネットワークインタフェース(NT−I/F)104、PC100で実行される各種処理を制御するCPU101、処理プログラム等を記憶するROM102、ワークエリアとなるRAM103、WWWブラウザ106を含む各種アプリケーションプログラム107、およびOS108がインストールされているハードディスク105、電子ファイルEFを閲覧するためのディスプレイ109、閲覧している電子ファイルEFに対して、ユーザが書き込みや保存の操作を行うためのキーボード110、およびマウス111を備え、これらは互いにシステムバス112を介して接続されている。
さらに、ユーザが電子ファイルEFに対して行う、メモ書きやマーキングといった書き込み操作について図3ないし図6を参照して説明する。図3に示すように、電子ファイルEFには、例えば空白行Wで区切られる1以上のテキスト群T(T1〜T4)が含まれ、さらに各テキスト群Tには、句読点および/または改行位置で区切られる、1以上の文字列Sが含まれている(本実施形態では句点で区切られる文字列とする)。また、電子ファイルEF上部には、書き込み情報を保存するための保存ボタン200が配置されており、利用者は、メモ書きやマーキングといった書き込みを行った後、この保存ボタン200を選択することによって、書き込み情報を保存する。
図4は、ユーザが電子ファイルEFにメモ書きを書き込む操作手順を示している。同図に示すように、ユーザはまずメモ書きを書き込む所望の位置に、マウス111やキーボード110を用いてカーソルKを合わせ、例えば右クリック操作等でメニューM1を表示させ、「新規メモ作成」を選択する(同図(a)参照)。「新規メモ作成」を選択したことによって、メモ書き用ボックスMBが表示され、メモ書き用ボックスMB内にメモ書きを書き込む(同図(b)参照)。最後に、書き込んだメモ書きを保存するため、保存ボタン200を選択する(同図(c)参照)。
図5は、ユーザが電子ファイルEFに含まれる文字をマーキングするマーキング操作手順を示している。同図に示すように、まずマーキングを行う所望の位置に、マウス111やキーボード110を用いてカーソルKを合わせ、例えば右クリック操作等でメニューM1を表示させ、「新規マーキング作成」を選択する(同図(a)参照)。そして、マーキングを行う範囲指定を行う。例えばマウス111のドラック操作で行う場合、マーキングを行う範囲の開始位置でクリックし(同図(b)参照)そのままマウスをドラッグしてマーキングを行う範囲の終了位置でドラッグを終了する(同図(c)参照)。
なお、この操作に限らずマーキングを行う範囲を指定できる操作なら何でもよい。最後に、書き込んだマーキングを保存するため、保存ボタン200を選択する(同図(d)参照)。このような手順で、ユーザがメモ書きやマーキングといった書き込みを電子ファイルEFに対して行い、次回ユーザが電子ファイルEFを閲覧すると、図6に示すように、電子ファイルEFに対してメモ書きやマーキングといった書き込み情報81が反映されて表示される。また、書き込み情報81を複数書き込んだ場合、複数の書き込み情報81を一括して保存するようにしてもよい。
また、ユーザが書き込み情報を保存すると、PC100は、書き込み情報81および書き込み情報81の電子ファイルEF上の位置を示す位置情報82を取得し、書き込み詳細情報80としてサーバ50へ送信する。なお、「書き込み情報」とは、書き込みがメモ書きの場合、「メモ書きされた画像データ、テキストデータ、および音声データの少なくともいずれか1のデータ」であり、書き込みがマーキングの場合、「マーキングされた文字のテキストデータ」である。また、「位置情報」とは、書き込みがメモ書きの場合、「メモ書きが属するテキスト群T」に関する情報であり、書き込みがマーキングの場合、「マーキングされた文字が属するテキスト群T、およびマーキングされた文字が属する文字列S」に関する情報である。
さらに、書き込み情報81には、書き込まれたメモ書きやマーキングのフォントに関するフォント情報やカラーに関するカラー情報が含まれている。なお、書き込みがメモ書きの場合、本実施形態では「メモ書きが属するテキスト群T」内の位置情報については特に記憶していないが、もちろん「メモ書きが属するテキスト群T」内の位置情報を記憶する構成でもよい。この場合、位置情報はマーキングと同様に、「メモ書きが属するテキスト群T、およびメモ書きの作成位置として指定された位置が含まれる文字列S」に関する情報である。
また、サーバ50は、PC100から受信した書き込み詳細情報80を書き込み情報データベースDB2に記憶する際、受信した書き込み詳細情報80に含まれる位置情報82に基づいて、書き込まれたメモ書きが属するテキスト群Tを特定するためのテキスト群特定情報90(図2参照)、およびマーキングされた文字を特定するための文字特定情報95(図2参照)、を生成し、書き込み情報データベースDB2にさらに記憶する。
ここで、テキスト群特定情報90および文字特定情報95の生成について、詳細に説明する。テキスト群特定情報90とは、電子ファイルEFに含まれる各テキスト群T(図3参照)の特徴量を意味しており(以下テキスト群特徴量Tvと記載)、以下、サーバ50が行うテキスト群Tのテキスト群特徴量Tvの算出について述べる(テキスト群特徴量算出手段)。テキスト群特徴量Tvは、テキスト群Tを形態素解析して得られた各単語のTFIDF値を要素とする多次元ベクトルである。形態素解析について簡単に説明すると、例えば図2に示すハードディスク55に格納された日本語辞書(図示省略)を用いてテキスト群Tを解析し、テキスト群Tを構成する各単語を求めるものである。
図3に示すテキスト群T1の一部である「データリンクには、様々な特徴やアクセス方式がある。」という文章に対して形態素解析を行うと、「データ」「リンク」「に」「は」「様々」「な」「特徴」「や」「アクセス」「方式」「が」「ある」といった単語が得られる。また、TFIDF(Term Frequency Inverse Document Frequency)値とは、ある単語が、所定のテキストデータ内で出現する回数を、そのテキストデータの量に応じて正規化したものである。
本実施形態では、上記のTFIDF値として、例えばテキスト群T1(図3参照)に含まれる「データ」という単語のTFIDF値を求めるとすると、
TF=テキスト群T1に含まれる「データ」の単語数/テキスト群T1に含まれる全ての単語数 ×
IDF=LOG(電子ファイルEFに含まれるテキスト群Tの総数/「データ」の単語を含むテキスト群Tの数)の計算式で求めることができる。
形態素解析によって得られたテキスト群T1に含まれる全ての単語について、上記の要領でTFIDF値を求めることによって、各単語を軸とし、各単語のTFIDF値を要素とした多次元ベクトルが得られ、テキスト群T1のテキスト群特徴量Tv1が算出されたことになる。同様にして、この処理を各テキスト群Tについて行うと、各テキスト群Tのテキスト群特徴量Tvを算出することができる。
図7は、3つのテキスト群Ta〜Tcのテキスト群特徴量Tva〜Tvcを簡略して示したものである。同図(a)に示すように、テキスト群Taのテキスト群特徴量Tvaは、xa、ya、za・・・を要素とする多次元ベクトルであり、xa、ya、zaは、テキスト群Taにおける単語「x」、「y」、「z」のそれぞれのTFIDF値である。同様に、テキスト群Tbのテキスト群特徴量Tvbは、xb、yb、zb・・・を要素とする多次元ベクトルであり、xb、yb、zbは、テキスト群Tbにおける単語「x」、「y」、「z」のそれぞれのTFIDF値である。
さらに、テキスト群Tcのテキスト群特徴量Tvcについても、xc、yc、zc・・・を要素とする多次元ベクトルであり、xc、yc、zcは、テキスト群Tcにおける単語「x」、「y」、「z」のそれぞれのTFIDF値となる。なお、簡略化のため図示では3次元のベクトルとして表示しているが、実際のテキスト群特徴量Tvは、テキスト群Tに含まれる単語数に応じた多次元空間上にマッピングされる。なお、テキスト群特定情報90として、テキスト群特徴量Tvに代えて、例えば段落番号等を記憶する構成でもよい。
続いて、文字特定情報95について説明する。文字特定情報95とは、マーキングされた文字を特定するための情報であり、マーキングが行われた文字が属するテキスト群Tに含まれる、句読点や改行位置で区切られる所定の文字列Sの文字列特徴量Svを意味している。以下、サーバ50が行う文字列Sの文字列特徴量Svの算出について述べる(文字列特徴量算出手段)。文字列特徴量Svは、テキスト群特徴量Tvと同様に、文字列Sを形態素解析して得られた各単語のTFIDF値を要素とする多次元ベクトルである。
従って、例えばテキスト群T1における文字列S1(図3参照)に含まれる「データ」という単語のTFIDF値を求めるとすると、
TF=文字列S1に含まれる「データ」の単語数/文字列S1に含まれる全ての単語数 ×
IDF=LOG(テキスト群T1に含まれる文字列Sの総数/「データ」の単語を含む文字列Sの数)で求めることができる。
形態素解析によって得られた文字列Sに含まれる全ての単語について、上記の要領でTFIDF値を求めることによって、各単語を軸とし、各単語のTFIDF値を要素とした多次元ベクトルが得られ、文字列S1の文字列特徴量Sv1が算出されたことになる。同様にして、この処理を各文字列Sについて行うと、各文字列Sの文字列特徴量Svを算出することができる。なお、TFIDF値算出の対象となる単語は、日本語において、文書を意味する大きな部分を担うとされている、「名詞」、「サ変名詞」、「固有名詞」および「形容動詞」である。
テキスト群特徴量Tvおよび文字列特徴量Svの算出は、書き込み情報の保存時と書き込み情報反映時と、の2回のタイミングで行われる。そして、書き込み情報保存時に算出されたテキスト群特徴量Tvおよび文字列特徴量Svは、旧テキスト群特徴量Tovおよび旧文字列特徴量Sovとして記憶され、書き込み情報反映時に算出されたテキスト群特徴量Tvおよび文字列特徴量Svは、新テキスト群特徴量Tnvおよび新文字列特徴量Snvとして記憶される。また、書き込み情報が反映される以前に電子ファイルEFが更新された場合には、電子ファイルEF更新のタイミングで、新テキスト群特徴量Tnvおよび新文字列特徴量Snvが算出される。
さらに、その更新が複数回に及んだ場合には、更新の度にそれぞれの特徴量が算出され、前回算出された特徴量に上書きして書き込み情報データベースDB2へ記憶される。なお、電子ファイルEFが更新された場合についても、更新毎ではなく書き込み情報反映時に新テキスト群特徴量Tnvおよび新文字列特徴量Snvを算出する構成でもよい。
続いて、サーバ50が、書き込み情報81を書き込み情報データベースDB2に記憶し、次回電子ファイルEFをPC100に送信する際に、その書き込み情報を電子ファイルEFに対して反映するまでの流れを、図8のフローチャートを参照して説明する。なお、以下の説明では、書き込み情報記憶時の電子ファイルEFに含まれるテキスト群Tおよび文字列Sを、旧テキスト群Toおよび旧文字列Soと定義し、書き込み情報反映時の電子ファイルEFに含まれるテキスト群Tおよび文字列Sを、新テキスト群Tnおよび新文字列Snと定義して、説明する。
まず、ユーザが書き込み情報の保存ボタン200をクリックすると(S01)、PC100は書き込み詳細情報80を取得しサーバ50へ送信する。そして、サーバ50は、上述した手順で、書き込み情報が属するテキスト群Tを始め、電子ファイルEFに含まれるテキスト群T全てについて、テキスト群特徴量Tvを算出する。また、書き込み情報がマーキングである場合、テキスト群特徴量Tvに加えて、書き込まれたマーキングが属するテキスト群Tに含まれる、文字列S全ての文字列特徴量Svを算出する(S02)。そして、算出したテキスト群特徴量Tvおよび文字列特徴量Svを、旧テキスト群特徴量Tovおよび旧文字列特徴量Sovとして、書き込み情報データベースDB2へ、書き込み詳細情報80とともに記憶する。
その後、再びPC100においてユーザが電子ファイルEFの閲覧をしようとすると、まずPC100は、電子ファイル送信要求をサーバ50に対して行う(S03)。サーバ50は、PC100からの電子ファイル送信要求を受信すると、まず書き込み情報データベースDB2から、書き込み詳細情報80を取得する。そして、電子ファイルEFを電子ファイルデータベースDB1から取得し、その電子ファイルEFに含まれるテキスト群T全てについて、テキスト群特徴量Tvを算出する(S04)。そして、算出したテキスト群特徴量Tvを新テキスト群特徴量Tnvとして、一旦書き込み情報データベースDB2へ記憶する。
次に、サーバ50は、旧テキスト群特徴量Tovおよび新テキスト群特徴量Tnvに基づいて、DPマッチングを含む対応付け処理を行い、各旧テキスト群Toに対して各新テキスト群Tnを対応付ける処理を行う(S05)。なお、この処理の詳細については後述する。そして、対応付け処理の結果に基づいて、書き込み情報81が属する旧テキスト群Toに対応する新テキスト群Tnを特定する(S06)。対応する新テキスト群Tnが特定できた場合(S06:Yes)、書き込みがメモ書きであるときは、メモ書きを電子ファイルEFの対応付けられたテキスト群Tの所定位置に反映する(S07)。また、書き込みがマーキングであるときは、さらに特定された新テキスト群Tnに含まれる、文字列S全ての文字列特徴量Svを算出して(S08)、これを新文字列特徴量Snvとして一旦書き込み情報データベースDB2へ記憶する。そして旧文字列特徴量Sovおよび新文字列特徴量Snvに基づいてDPマッチングを含む対応付け処理を行い、対応するテキスト群Tにおいて、さらに各旧文字列Soに対して各新文字列Snを対応付ける処理を行う(S09)。
そして、対応付け処理の結果に基づいて、マーキングが属する旧文字列Soに対応する新文字列Snを特定する(S10)。対応する新文字列Snを特定できた場合(S10:Yes)、書き込み情報81として記憶していた、「マーキングされた文字のテキストデータ」に基づいて、マーキングを電子ファイルEFに対して反映する(S11)。また、対応する新文字列Snが存在しない場合(S10:No)、マーキングを削除する(S12)。
一方、対応する新テキスト群Tnが特定できない場合(S06:No)、書き込み情報81を削除する(S13)。そして、記憶していた書き込み情報81を全て処理したか否かを判定し(S14)、未処理の書き込み情報81がある場合には(S14:No)、次の書き込み情報81について処理を続行する。このようにして、書き込み情報81の処理を全て終了すると(S14:Yes)、サーバ50は、書き込み情報81が反映された電子ファイルEFをPC100へ送信する。
なお、対応するテキスト群Tが特定できない場合でも(S06:No)、書き込み情報81がメモ書きである場合には、書き込み情報保存時に、電子ファイル上における各テキスト群の順序に関する順序情報をさらに記憶しておき、メモ書きが属していた旧テキスト群Toの、直前または直後に位置していたテキスト群Toに対応する新テキスト群Tnに、メモ書きを反映させる構成でもよい。例えば、旧テキスト群To2にメモ書きが書き込まれ、電子ファイルEFの更新によって旧テキスト群To2が削除された場合、旧テキスト群To2の直前に位置していた旧テキスト群To1に対応する新テキスト群Tn1、あるいは旧テキスト群To2の直後に位置していた旧テキスト群To3に対応する新テキスト群Tn3にメモ書き情報を反映させる。
また、書き込み情報81を記憶してから、書き込み情報81を反映するまでの間に、電子ファイルEFの更新を行っている場合には、電子ファイル更新時に、新テキスト群特徴量Tnvおよび新文字列特徴量Snvを既に算出し記憶しているので、書き込み情報反映時に行われる新テキスト群特徴量Tnvおよび新文字列特徴量Snvの算出処理(S04、S08に該当)は省略される。
ここで、サーバ50が行う旧テキスト群Toに対する新テキスト群Tnの対応付け処理について説明する。まず、書き込み情報81が保存されてから、書き込み情報81が反映されるまでの間に、電子ファイルEFが更新されていない場合について説明する。
旧テキスト群Toに対する新テキスト群Tnの対応付けには、最初にDPマッチング等のマッチング処理を実行する(テキスト群マッチング手段)。そして、マッチングによって対応付けられた、旧テキスト群Toと新テキスト群Tnとの組み合わせにおいて、旧テキスト群特徴量Tovと、新テキスト群特徴量Tnvとの差異が所定の閾値未満であるかどうかを判定する処理を行う(テキスト群判定手段)。電子ファイルEFが更新されていない場合、各旧テキスト群Toと各新テキスト群Tnとにおいて、その内容は全く同一である。従って、当然対応付けられた新テキスト群特徴量Tnvとの差異は所定の閾値未満となり、マッチングによって対応付けられた旧テキスト群Toと新テキスト群Tnとの組み合わせを、対応するテキスト群Tとして特定する。なお、「DPマッチング」とは、動的計画法によるパターンマッチングを意味し、二つのパターンの要素間の対応付けを行いながら類似度を計算する方法を指すものである。
一方、書き込み情報81を記憶してから、書き込み情報81を反映するまでの間に、電子ファイルEFが更新されていた場合には、更新されなかった場合のように容易に対応するテキスト群Tが定まるとは限らない。そこで、電子ファイルEFが更新された場合について、図9〜図12に示す4種の例を挙げて説明する。
図9に示す例は、書き込み情報記憶時の電子ファイルEFに、旧テキスト群To1、旧テキスト群To2、旧テキスト群To3、旧テキスト群To4、旧テキスト群To5の順序から成る5つのテキスト群Tが含まれ、旧テキスト群To2の内容を変更し電子ファイルEFを更新した例を示している。この場合、まずDPマッチング等のマッチング処理を行うと、旧テキスト群To1〜To5に対してそれぞれ新テキスト群Tn1〜Tn5が対応付けられる(図9参照)。
そして、マッチングによって対応付けられた、旧テキスト群Toと新テキスト群Tnとの組み合わせにおいて、旧テキスト群特徴量Tovと、新テキスト群特徴量Tnvとの差異が所定の閾値未満であるかどうかを判定する処理を行う。旧テキスト群To1と新テキスト群Tn1、および旧テキスト群To3〜To5と新テキスト群Tn3〜Tn5の組み合わせについては、旧テキスト群特徴量Tovと、新テキスト群特徴量Tnvとの差異は所定の閾値未満であり、対応するテキスト群Tとして特定される。
しかし、旧テキスト群To2の内容は変更され、新テキスト群Tn2の内容とは異なることから、旧テキスト群To2の旧テキスト群特徴量Tovと新テキスト群Tn2の新テキスト群特徴量Tnvとは異なるものとなる。例えば、図7(a)に示す電子ファイルEFにおいて、テキスト群Tbの内容が変更され、テキスト群Tb′になった場合、テキスト群Tb′のテキスト群特徴量Tvb′は、図7(b)に示す通りとなる。
よってこの場合、旧テキスト群To2の旧テキスト群特徴量Tovと新テキスト群Tn2の新テキスト群特徴量Tnvとの差異が所定の閾値未満である場合には、旧テキスト群To2に対応するテキスト群を新テキスト群Tn2として特定する。また、旧テキスト群To2の旧テキスト群特徴量Tovと新テキスト群Tn2の新テキスト群特徴量Tnvとの差異が所定の閾値以上である場合、旧テキスト群To2に対応するテキスト群Tはないものと判定する。
図10に示す例は、書き込み情報記憶時の電子ファイルEFに、旧テキスト群To1、旧テキスト群To2、旧テキスト群To3、旧テキスト群To4、旧テキスト群To5の順序から成る5つのテキスト群Tが含まれ、旧テキスト群To2を削除して電子ファイルEFを更新した例を示している。この場合、マッチングを行った結果の一例として、図10に示すとおり、新テキスト群Tn1に対して、旧テキスト群To1および旧テキスト群To2の2つのテキスト群Tが対応付けられる。なお、旧テキスト群To3〜To5に対しては、それぞれ新テキスト群Tn3〜Tn5が対応付けられ、対応するテキスト群Tとして特定される。
このように、1のテキスト群Tに対して複数のテキスト群Tが対応付けられた場合、これらのテキスト群T全ての組み合わせにおいて、旧テキスト群特徴量Tovと新テキスト群特徴量Tnvとの差異を判定し、そして、その差異が所定の閾値未満となった組み合わせを、対応するテキスト群Tとして特定する。図10に示す例の場合、旧テキスト群To1と新テキスト群Tn1、および旧テキスト群To2と新テキスト群Tn1、の2つの組み合わせにおいて、旧テキスト群特徴量Tovと新テキスト群特徴量Tnvとの差異を判定する。
旧テキスト群To1と新テキスト群Tn1との内容は同一であり当然特徴量の差は所定の閾値未満となる。従って、旧テキスト群To1と新テキスト群Tn1の組み合わせを対応するテキスト群Tとして特定する。なお、テキスト群特徴量Tvの差異が所定の閾値未満となった組み合わせが複数存在する場合には、テキスト群特徴量Tvの差異が最小となる組み合わせを対応するテキスト群Tとして特定する。
図11に示す例は、書き込み情報記憶時の電子ファイルEFに、旧テキスト群To1、旧テキスト群To2、旧テキスト群To3、旧テキスト群To4、旧テキスト群To5の順序から成る5つのテキスト群Tが含まれ、旧テキスト群To2を旧テキスト群To4と旧テキスト群To5との間に移動して電子ファイルEFを更新した例を示している。この場合、マッチングを行った結果の一例として、図11に示すとおり、新テキスト群Tn1に対して、旧テキスト群To1および旧テキスト群To2の2つのテキスト群Tが対応付けられ、さらに旧テキスト群To4に対して、新テキスト群Tn4および新テキスト群Tn2の2つのテキスト群Tが対応付けられている。なお、旧テキスト群To3、To5に対しては、それぞれ新テキスト群Tn3、Tn5が対応付けられ、対応するテキスト群Tとして特定される。
この場合、新テキスト群Tn1に対する旧テキスト群To1および旧テキスト群To2の組み合わせと、旧テキスト群To4に対する新テキスト群Tn4および新テキスト群Tn2の組み合わせそれぞれについて、図10に示す例で説明したようにテキスト群特徴量Tvの差を判定する構成でもよいが、ここでは異なる方法を説明する。
図11に示す例では、対応付けが特定されていない旧テキスト群To1、旧テキスト群To2、旧テキスト群To4、新テキスト群Tn1、新テキスト群Tn4並びに新テキスト群Tn2について、各旧テキスト群Toの旧テキスト群特徴量Tovと、各新テキスト群Tnの新テキスト群特徴量Tnvとの差を、全ての組み合わせ分合計した合計値Dが最小となる組み合わせを算出する。例えば、旧テキスト群To1と新テキスト群Tn1、旧テキスト群To2と新テキスト群Tn4、旧テキスト群To4と新テキスト群Tn2、の組み合わせにおける合計値Dは以下に示す計算式で算出される。
Figure 0004683963
すなわち、旧テキスト群To1、旧テキスト群To2、旧テキスト群To4、新テキスト群Tn1、新テキスト群Tn4並びに新テキスト群Tn2において、旧テキスト群Toと新テキスト群Tnとの組み合わせは、6組存在する。この6つの各組み合わせにおいて、各旧テキスト群Toの旧テキスト群特徴量Tovと、各新テキスト群Tnの新テキスト群特徴量Tnvとの差を、全ての組み合わせ分合計した合計値Dを算出し、その値が最小となる合計値Dの組み合わせを求める。このような処理を行った結果、図13に示すように、旧テキスト群To1には新テキスト群Tn1が、旧テキスト群To2には新テキスト群Tn2が、旧テキスト群To4には新テキスト群Tn4がそれぞれ対応付けられることによって、対応するテキスト群Tを全てのテキスト群Tについて特定することができる。
なお、上述した各旧テキスト群Toのテキスト群特徴量Tovと各新テキスト群Tnのテキスト群特徴量Tnvとの差を、全ての組み合わせ分合計した合計値Dが最小となる組み合わせを算出する処理は、最大、テキスト群Tの数の2乗まで計算量が膨大となるので、遺伝的アルゴリズムを用いて算出することが好ましい。
図12に示す例は、書き込み情報記憶時の電子ファイルEFに、旧テキスト群To1、旧テキスト群To2、旧テキスト群To3、旧テキスト群To4、旧テキスト群To5、旧テキスト群To6の順序から成る6つのテキスト群Tが含まれ、旧テキスト群To3と旧テキスト群To4との間に、新テキスト群Tn7および新テキスト群Tn8を追加し、さらに旧テキスト群To5を削除して電子ファイルEFを更新した例を示している。この場合、マッチングを行った結果の一例として、図12に示すとおり、旧テキスト群To4に対して、新テキスト群Tn7、新テキスト群Tn8、新テキスト群Tn4の3つのテキスト群Tがそれぞれ対応付けられ、新テキスト群Tn6に対して、旧テキスト群To5および旧テキスト群To6の2つのテキスト群Tが対応付けられている。なお、旧テキスト群To1〜To3に対しては、それぞれ新テキスト群Tn1〜Tn3が対応付けられ、対応するテキスト群Tとして特定される。
この場合、図11に示して説明した例と同様に、対応付けが特定されていない旧テキスト群To4、旧テキスト群To5、旧テキスト群To6、新テキスト群Tn7、新テキスト群Tn8、新テキスト群Tn4並びに新テキスト群Tn6について、各旧テキスト群Toのテキスト群特徴量Tovと、各新テキスト群Tnのテキスト群特徴量Tnvとの差を全ての組み合わせ分合計した合計値Dが、最小となる組み合わせを算出する。ところで、テキスト群Tの追加/削除によって、書き込み情報記憶時の電子ファイルEFに含まれるテキスト群Toの数と、書き込み情報反映時の電子ファイルEFに含まれるテキスト群Tnの数とが異なる場合、旧テキスト群Toの数をn個、新テキスト群Tnの数をm個とすると、その対応付けは、図14に示すように、n+1×m+1のマトリクスで表すことが可能である。
すなわち、旧テキスト群To4、旧テキスト群To5、旧テキスト群To6、新テキスト群Tn7、新テキスト群Tn8、新テキスト群Tn4並びに新テキスト群Tn6について、各旧テキスト群Toのテキスト群特徴量Tovと、各新テキスト群Tnのテキスト群特徴量Tnvとの差を、全ての組み合わせ分合計した合計値Dが、最小となる組み合わせを算出すると、更新によって削除された旧テキスト群To5は、同図に示すマトリクスにおいてm+1に該当する箇所にはじき出され、また更新によって新たに追加された新テキスト群Tn7および新テキスト群Tn8は、n+1に該当する箇所にはじき出される。このようにして、対応するテキスト群Tをそれぞれ特定することができる。
さらに、サーバ50が行う旧文字列Soに対する新文字列Snの対応付け処理について説明する。文字列Sの対応付け処理は図15に示すように、旧テキスト群Toに含まれる旧文字列Soと、旧テキスト群Toに対応付けされた新テキスト群Tnに含まれる新文字列Snとの対応付けを行うものである。文字列Sの対応付け処理には、テキスト群Tと同様に、各文字列Sの文字列特徴量Svを算出し、算出した文字列特徴量Svを用いてDPマッチング等を行い対応付けを特定する。
例えば、図15に示す旧テキスト群To1における、旧文字列So1〜So5について、それぞれの旧文字列特徴量Sov1〜Sov5を算出する。また、新テキスト群T1における新文字列Sn1〜Sn5について、それぞれの新文字列特徴量Snv1〜Snv5を算出する。そして、旧文字列So1〜So5の旧文字列特徴量Sov1〜Sov5と、新文字列Sn1〜Sn5の新文字列特徴量Snv1〜Snv5を用いて、DPマッチング等を行い対応付けを特定する。なお、文字列Sの対応付け処理については、テキスト群Tの対応付け処理において行った説明と同様であり詳細(文字列マッチング手段、文字列判定手段)については省略する。
書き込み情報がマーキングである場合、対応する文字列Sを特定した後、さらに書き込み情報として記憶した「マーキングされた文字のテキストデータ」に基づいて、対応する文字列Sからマーキングされた文字を特定し、サーバ50は電子ファイルEFに対してマーキングを反映する。
例えば図16に示すように、PC100から受信して取得した書き込み詳細情報80(書き込み情報81:「ネットワーク層」位置情報82:「テキスト群3、文字列1」)が書き込み情報データベースDB2に記憶され、旧テキスト群To全ての旧テキスト群特徴量Tov、および新テキスト群Tn全ての新テキスト群特徴量Tnvをテキスト群特定情報90として記憶し、旧テキスト群To3に含まれる文字列So全ての文字列特徴量Sov、および新テキスト群Tn3に含まれる文字列Sn全ての文字列特徴量Snvを文字特定情報95として書き込み情報データベースDB2に記憶している場合、サーバ50は位置情報82およびテキスト群特定情報90に基づいてテキスト群T3(旧テキスト群To3)に対応するテキスト群Tを新テキスト群Tn3として特定する。
さらに、位置情報82および文字特定情報95に基づいて、新テキスト群Tn3の中から、旧テキスト群To3に含まれる文字列1「ネットワーク層〜用いられる。」(旧文字列So1)に対応する文字列「ネットワーク層〜用いられる。」を新文字列Sn1として特定する。そして、新文字列Sn1「ネットワーク層〜用いられる。」の中から、書き込み情報81として記憶した「ネットワーク層」をさらに特定し、マーキングを反映させる。
なお、文字列S単位でマーキングを反映させる構成でもよい。この場合、ユーザが図16に示す旧文字列So1に含まれる「ネットワーク層」にマーキングを行うと、新文字列Sn1「ネットワーク層〜用いられる。」全てにマーキングが反映される。この構成によれば、「マーキングされた文字列のテキストデータ」を記憶する必要がない。また、文字列Sの内容が若干変更したような場合にも、文字列S単位でマーキング情報を反映させることによる利点がある。
例えば「日本の都市は、東京や大阪である。」という文字列Sにマーキングを行い、その文字列Sが「日本の都市は、東京、大阪、並びに名古屋である。」と変更された場合、対応する文字列Sを特定しさらに「マーキングされた文字列のテキストデータ」を特定する構成では、対応する文字列S「日本の都市は、東京、大阪、並びに名古屋である。」の中から「日本の都市は、東京や大阪である。」を特定するので、マーキングは「日本の都市は、東京」「大阪」および「である。」の文字列に対して反映される。しかし、文字列S単位でマーキング情報を反映させることによって、文字列S「日本の都市は、東京、大阪、並びに名古屋である。」全体に対してマーキングを反映させることができる。
また、マーキングの書き込み時におけるユーザの選択に基づいて、図17に示すマーキング種別情報97を書き込み情報81としてさらに記憶し、記憶したマーキング種別情報97に基づいて、マーキング情報を反映させる構成でもよい。この構成によれば、直線、波線、二重線、下線、点線など多様なマーキングを電子ファイルEFに書き込み、反映させることが可能となる。
なお、マーキングやメモ書きといった書き込み情報81として、画像を書き込む構成でもよい。この場合、位置情報82として、表示画面のサイズに関する情報と、テキスト群Tに対する書き込み情報81の相対的な位置に関する情報をPC100が取得し、サーバ50に送信する構成となる。この構成によれば、ユーザが電子ファイルEFに描画した画像を、サーバ50はそのまま書き込み情報81として電子ファイルEFに対して反映することができるので、ユーザによる書き込み処理の自由度をより高めることができる。さらにこの場合、PC100に接続されたペンを用いて、ユーザがディスプレイ109に画像を描画することも可能である。
また、電子ファイルデータベースDB1、および書き込み情報データベースDB2をそれぞれ別のサーバで構成してもよい。この構成によれば、書き込み情報データベースDB2を記憶するサーバのメモリ負担が軽くなるので、書き込み情報を反映させるための処理能力を高めることができる。
なお、電子ファイルEFにはテキスト群Tに加えて画像や動画が含まれていてもよい。また、位置情報82として、表示画面のサイズに関する情報と、表示画面に対する位置(座標)を記憶する構成でもよい。
また、上述した実施例によらず、電子ファイル書き込みシステム1の装置構成や処理工程等について、本発明の要旨を逸脱しない範囲で、適宜変更も可能である。
本実施形態に係る電子ファイル書き込みシステムの全体図である。 電子ファイル書き込みシステムのハードウェア構成を示す図である。 電子ファイルの一例を示す図である。 電子ファイルへのメモ書き操作の一例を示す説明図である。 電子ファイルへのマーキング操作の一例を示す説明図である。 書き込み情報が反映された電子ファイルの一例を示す図である。 テキスト群特徴量を説明するための説明図である。 書き込み情報の記憶から書き込み情報の反映までの流れを示すフローチャートである。 テキスト群のマッチング処理結果の一例を示す図である。 テキスト群のマッチング処理結果の他の例を示す図である。 テキスト群のマッチング処理結果の他の例を示す図である。 テキスト群のマッチング処理結果の他の例を示す図である。 テキスト群の対応付け処理の処理結果の一例を示す図である。 テキスト群の対応付け処理の処理結果の他の例を示す図である。 文字列の対応付け処理を説明するための説明図である。 文字列の対応付け処理を説明するための説明図である。 マーキング種別情報を表す図である。
符号の説明
1 電子ファイル書き込みシステム 50 サーバ
60 データ処理部 70 更新手段
80 書き込み詳細情報 81 書き込み情報
82 位置情報 90 テキスト群特定情報
95 文字特定情報 100 クライアントPC
120 書き込み手段 130 送信手段
P 書き込み情報反映プログラム DB1 電子ファイルデータベース
DB2 書き込み情報データベース T テキスト群
To 旧テキスト群 Tn 新テキスト群
Tv テキスト群特徴量 Sv 文字列特徴量
S 文字列 So 旧文字列
Sn 新文字列

Claims (9)

  1. 1以上のテキスト群を含む電子ファイルに書き込みを行うための情報端末と、当該情報
    端末に接続され、前記電子ファイルを記憶するサーバと、から構成される電子ファイル書
    き込みシステムであって、
    前記情報端末は、
    前記電子ファイルに書き込みを行う書き込み手段と、
    前記書き込み手段によって書き込まれた画像データ、テキストデータ、および音声データの少なくともいずれか1のデータから成るメモ書き情報、または、前記テキスト群に含まれる文字のマーキングに関するマーキング情報を含む書き込み情報と、当該書き込み情報の前記電子ファイル上の位置を示す位置情報と、を含む書き込み詳細情報を前記サーバへ送信する送信手段と、を備え、
    前記サーバは、
    受信した前記書き込み詳細情報と、前記位置情報に基づいて生成した当該書き込み情報
    が属するテキスト群を特定するためのテキスト群特定情報と、前記マーキングが行われた文字を特定するための文字特定情報と、を記憶する記憶手段と、
    記憶した前記書き込み情報を、前記テキスト群特定情報に基づいて、前記電子ファイル
    に反映させる書き込み情報反映手段と、を備え、
    前記記憶手段は、前記記憶された複数のテキスト群の順序に関する順序情報及び前記文字特定情報をさらに記憶し、
    記書き込み情報反映手段は、
    前記書き込み情報がメモ書き情報であって、前記電子ファイルの更新によって、前記書き込み情報が属するテキスト群が削除された場合、前記順序情報に基づいて、前記書き込み情報が属するテキスト群の直前または直後に位置するテキスト群に前記書き込み情報を反映させ
    前記書き込み情報がマーキング情報の場合、前記テキスト群特定情報に基づいて、前記マーキングが行われた文字が属するテキスト群を特定した後、記憶した前記文字特定情報に基づいて、前記マーキングが行われた文字をさらに特定し、前記書き込み情報を反映させることを特徴とする電子ファイル書き込みシステム。
  2. 前記サーバは、
    前記書き込み情報記憶時の電子ファイルに含まれるテキスト群である旧テキスト群、および前記書き込み情報反映時の電子ファイルに含まれるテキスト群である新テキスト群、の全てについて、それらの特徴量であるテキスト群特徴量を算出するテキスト群特徴量算出手段、をさらに備え、
    前記記憶手段は、前記テキスト群特定情報として、前記旧テキスト群のテキスト群特徴量および前記新テキスト群のテキスト群特徴量を記憶し、
    前記書き込み情報反映手段は、
    前記各旧テキスト群のテキスト群特徴量および前記各新テキスト群のテキスト群特徴量に基づいて、対応するテキスト群を特定し、前記書き込み情報を反映させることを特徴とする請求項1に記載の電子ファイル書き込みシステム。
  3. 前記サーバは、
    前記電子ファイルを更新する更新手段と、
    記憶した全テキスト群の前記テキスト群特徴量を用いて、前記各旧テキスト群と、前記各新テキスト群との対応付けを行うテキスト群マッチング手段と、
    前記各旧テキスト群のテキスト群特徴量と、前記テキスト群マッチング手段によって当該各旧テキスト群に対応付けられた、前記各新テキスト群のテキスト群特徴量との差異が、所定の閾値未満であるかを判定するテキスト群判定手段と、をさらに備え、
    前記電子ファイルが更新された場合、
    前記テキスト群特徴量算出手段は、前記新テキスト群のテキスト群特徴量として、更新時の前記電子ファイルに含まれるテキスト群のテキスト群特徴量を算出し、
    前記記憶手段は、前記新テキスト群のテキスト群特徴量として、書き込み情報反映直前の更新時における前記テキスト群特徴量を記憶し、
    前記書き込み情報反映手段は、
    前記テキスト群判定手段によって、前記両テキスト群特徴量の差異が前記所定の閾値未満であると判定された、旧テキスト群と新テキスト群の組み合わせを、対応するテキスト群として特定し、前記書き込み情報を反映させることを特徴とする請求項2に記載の電子ファイル書き込みシステム。
  4. 前記旧テキスト群に含まれる、句読点および/または改行位置で区切られる1以上の文
    字列である旧文字列、および当該旧テキスト群に対応する新テキスト群に含まれる前記1
    以上の文字列である新文字列、の全てについて、それらの特徴量である文字列特徴量を算
    出する文字列特徴量算出手段をさらに備え、
    前記記憶手段は、前記文字特定情報として、前記各旧文字列の文字列特徴量および前記
    各新文字列の文字列特徴量を記憶し、
    前記書き込み情報反映手段は、
    前記各旧文字列の文字列特徴量および前記各新文字列の文字列特徴量に基づいて、対応
    する文字列を特定し、前記書き込み情報を反映させることを特徴とする請求項に記載の
    電子ファイル書き込みシステム。
  5. 記憶した全文字列の前記文字列特徴量を用いて、前記各旧文字列と、前記各新文字列と
    の対応付けを行う文字列マッチング手段と、
    前記各旧文字列の文字列特徴量と、前記文字列マッチング手段によって当該各旧文字列
    に対応付けられた、前記各新文字列の文字列特徴量との差異が、所定の閾値未満であるか
    を判定する文字列判定手段と、をさらに備え、
    前記書き込み情報反映手段は、
    前記文字列判定手段によって、前記両文字列特徴量の差異が前記所定の閾値未満である
    と判定された、旧文字列と新文字列の組み合わせを、対応する文字列として特定し、前記
    書き込み情報を反映させることを特徴とする請求項に記載の電子ファイル書き込みシス
    テム。
  6. 記書き込み情報反映手段は、
    前記マーキングが行われた文字が属する前記文字列を特定した後、前記テキストデータ
    に基づいて、前記マーキングが行われた文字をさらに特定し、前記書き込み情報を反映さ
    せることを特徴とする請求項またはに記載の電子ファイル書き込みシステム。
  7. 前記記憶手段は、前記マーキングの種別を示す情報に関するマーキング種別情報をさら
    に記憶することを特徴とする請求項ないしのいずれか1項に記載の電子ファイル書き
    込みシステム。
  8. コンピュータを、請求項1ないしのいずれか1項に記載の電子ファイル書き込みシス
    テムにおける各手段として機能させるためのプログラム。
  9. 1以上のテキスト群を含む電子ファイルに書き込みを行うための情報端末と、当該情報
    端末に接続され、前記電子ファイルを記憶するサーバと、から構成されるネットワークシ
    ステムの電子ファイルへの書き込み情報反映方法であって、
    前記情報端末が、
    前記電子ファイルに書き込みを行う書き込みステップと、
    前記書き込みステップによって書き込まれた画像データ、テキストデータ、および音声データの少なくともいずれか1のデータから成るメモ書き情報、または、前記テキスト群に含まれる文字のマーキングに関するマーキング情報を含む書き込み情報と、当該書き込み情報の前記電子ファイル上の位置を示す位置情報と、を含む書き込み詳細情報を前記サーバへ送信する送信ステップと、を実行し、
    前記サーバが、
    受信した前記書き込み詳細情報と、前記位置情報に基づいて生成した当該書き込み情報
    が属するテキスト群を特定するためのテキスト群特定情報と、前記マーキングが行われた文字を特定するための文字特定情報と、を記憶する記憶ステップと、
    記憶した前記書き込み情報を、前記テキスト群特定情報に基づいて、前記電子ファイル
    に反映させる書き込み情報反映ステップと、を実行し、
    前記記憶ステップにおいて、前記記憶された複数のテキスト群の順序に関する順序情報及び前記文字特定情報をさらに記憶し、
    記書き込み情報反映ステップは、
    前記書き込み情報がメモ書き情報であって、前記電子ファイルの更新によって、前記書き込み情報が属するテキスト群が削除された場合、前記順序情報に基づいて、前記書き込み情報が属するテキスト群の直前または直後に位置するテキスト群に前記書き込み情報を反映させ
    前記書き込み情報がマーキング情報の場合、前記テキスト群特定情報に基づいて、前記マーキングが行われた文字が属するテキスト群を特定した後、記憶した前記文字特定情報に基づいて、前記マーキングが行われた文字をさらに特定し、前記書き込み情報を反映させることを特徴とする電子ファイルへの書き込み情報反映方法。
JP2005060022A 2005-03-04 2005-03-04 電子ファイル書き込みシステム、プログラム、電子ファイルへの書き込み情報反映方法 Expired - Fee Related JP4683963B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005060022A JP4683963B2 (ja) 2005-03-04 2005-03-04 電子ファイル書き込みシステム、プログラム、電子ファイルへの書き込み情報反映方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005060022A JP4683963B2 (ja) 2005-03-04 2005-03-04 電子ファイル書き込みシステム、プログラム、電子ファイルへの書き込み情報反映方法

Publications (3)

Publication Number Publication Date
JP2006244199A JP2006244199A (ja) 2006-09-14
JP2006244199A5 JP2006244199A5 (ja) 2008-02-14
JP4683963B2 true JP4683963B2 (ja) 2011-05-18

Family

ID=37050550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005060022A Expired - Fee Related JP4683963B2 (ja) 2005-03-04 2005-03-04 電子ファイル書き込みシステム、プログラム、電子ファイルへの書き込み情報反映方法

Country Status (1)

Country Link
JP (1) JP4683963B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5098605B2 (ja) * 2007-12-03 2012-12-12 富士通株式会社 アノテーションプログラム、アノテーション装置
JP2011003010A (ja) * 2009-06-18 2011-01-06 Fujitsu Ltd 修飾線配置プログラム、修飾線配置装置及び修飾線配置方法
CN103186991B (zh) * 2011-12-28 2015-01-21 北京中文在线数字出版股份有限公司 实现多设备无缝阅读的电子书阅读系统及设备间切换方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07295970A (ja) * 1994-04-21 1995-11-10 Fuji Xerox Co Ltd 文書処理装置
JP2000339299A (ja) * 1999-05-25 2000-12-08 Matsushita Electric Ind Co Ltd 文書管理装置
JP2003058535A (ja) * 2001-08-16 2003-02-28 Oki Electric Ind Co Ltd 情報管理装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07295970A (ja) * 1994-04-21 1995-11-10 Fuji Xerox Co Ltd 文書処理装置
JP2000339299A (ja) * 1999-05-25 2000-12-08 Matsushita Electric Ind Co Ltd 文書管理装置
JP2003058535A (ja) * 2001-08-16 2003-02-28 Oki Electric Ind Co Ltd 情報管理装置

Also Published As

Publication number Publication date
JP2006244199A (ja) 2006-09-14

Similar Documents

Publication Publication Date Title
US10394942B1 (en) Method and system for contextually placed chat-like annotations
CN100429646C (zh) 包括手写数据的电子文档的显示装置及方法
US6389435B1 (en) Method and system for copying a freeform digital ink mark on an object to a related object
Coleman et al. DELTA for Beginners: An introduction into the taxonomy software package DELTA
CN100507839C (zh) 用于在起始模板和目标模板之间映射内容的方法和系统
JPH1196166A (ja) 文書情報管理システム
US20140075281A1 (en) Systems and methods for annotating digital documents
CN108958731B (zh) 一种应用程序界面生成方法、装置、设备和存储介质
US20230169264A1 (en) Method and system for content management for resume generation
JP4683963B2 (ja) 電子ファイル書き込みシステム、プログラム、電子ファイルへの書き込み情報反映方法
US4717911A (en) Technique for chaining lines of a document together to facilitate editing or proofreading
JP2007025393A (ja) 教育指導支援装置、教育指導支援方法及び教育指導支援プログラム
JP4621514B2 (ja) テキスト群特定方法、プログラム、電子ファイル管理システム
US9619126B2 (en) Computer-readable non-transitory storage medium with image processing program stored thereon, element layout changed material generating device, image processing device, and image processing system
US7788283B2 (en) On demand data proxy
JP2011170418A (ja) 画像イメージを検索するタグデータの生成方法
US20220261439A1 (en) System and method for annotating website content
JP2016091347A (ja) 手書き文字管理システム、手書き文字管理方法、および手書き文字管理プログラム
JP2006244200A (ja) 電子ファイル書き込みシステム、プログラム、電子ファイルへの書き込み情報反映方法
US8484580B2 (en) Content presentation device, content presentation method, and information storage medium
CN113505568A (zh) 一种排版方法、装置、电子设备及计算机可读存储介质
JPH07121565A (ja) 情報提示装置
KR101995315B1 (ko) 검색을 통한 폰트 제시 시스템 및 방법
US20030044759A1 (en) Paper preparation supporting method
JP2010165120A (ja) 電子情報表示装置及び電子情報表示方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070404

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101019

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110208

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140218

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4683963

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees