JP2012103593A - 電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム - Google Patents

電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム Download PDF

Info

Publication number
JP2012103593A
JP2012103593A JP2010253817A JP2010253817A JP2012103593A JP 2012103593 A JP2012103593 A JP 2012103593A JP 2010253817 A JP2010253817 A JP 2010253817A JP 2010253817 A JP2010253817 A JP 2010253817A JP 2012103593 A JP2012103593 A JP 2012103593A
Authority
JP
Japan
Prior art keywords
data
information
replacement
partial text
document data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010253817A
Other languages
English (en)
Other versions
JP5827467B2 (ja
Inventor
Eisuke Kanzaki
英介 神崎
Yasuyo Nakayama
恭与 中山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2010253817A priority Critical patent/JP5827467B2/ja
Priority to US13/281,999 priority patent/US9378649B2/en
Priority to CN201110343132.0A priority patent/CN102467489B/zh
Publication of JP2012103593A publication Critical patent/JP2012103593A/ja
Application granted granted Critical
Publication of JP5827467B2 publication Critical patent/JP5827467B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/02Electrically-operated educational appliances with visual presentation of the material to be studied, e.g. using film strip
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

【課題】電子文書データであっても所望の部分テキストデータを容易にマスクデータに置換することができ、マスクデータに置換する位置を動的に容易に変更することができる方法、装置、サーバ及びコンピュータプログラムを提供する。
【解決手段】電子文書データを取得し、マスクデータに置換する対象となる部分テキストデータの指定を受け付け、固有の識別情報と対応付けて記憶し、取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する。識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報を記憶し、規則情報の選択を受け付ける。選択を受け付けた規則情報をキー情報として抽出した置換情報に基づいて、置換文書データに含まれる識別情報をマスクデータ又は部分テキストデータに置換する。
【選択図】図3

Description

本発明は、電子文書中の所望の部分テキストデータをマスクし、あるいはマスクする部分テキストデータを容易に変更することができる方法、装置、サーバ及びコンピュータプログラムに関する。
近年、電子文書データをパソコンのディスプレイ、ビューワ等で表示する電子書籍が普及し始めている。最近の電子書籍では、表示されている電子文書データの中から所望の部分テキストデータだけマスクデータに置換したり、タグを付与したりすることができるようになっている。
一方、電子化されていない従来の書籍では、書籍中の暗記するべき語句をラインマーカ等でなぞり、なぞったページを透明なカラーシートでフィルタリングすることにより、ラインマーカでなぞった語句を読むことができないようにすることで暗記効果を高める勉強方法が普及している。例えば暗記したい語句を赤、緑等のラインマーカでなぞり、そのページに赤、緑等の透明シートでフィルタリングすることにより、ラインマーカでなぞった語句を読むことができなくなる。
特開2003−173129号公報
電子書籍では、暗記したい部分テキストデータをマスクデータに置換するよう操作する必要がある。しかし、一度マスクデータに置換した場合、元の部分テキストデータに戻すことができないという問題点があった。また、電子書籍では電子文書データ自体を容易に交換することができるので、電子文書データ自体を交換した場合には、マスクデータは消去される。
電子文書データ自体を交換した場合であってもマスクデータを残すためには、これらのデータを原電子文書データに書き込んでおく必要がある。しかし、原電子文書データに直接書き込んだ場合、マスクデータに置換する位置の変更、色の変更等を行うことができず、従来の書籍のように色の異なるマスクを重ねて記載したり、既に記載されているマスクの長さを伸ばしたり、容易にマスクされている範囲を変えることができないという問題点もあった。
本発明は斯かる事情に鑑みてなされたものであり、電子文書データであっても所望の部分テキストデータを容易にマスクデータに置換することができ、マスクデータに置換する部分テキストデータの位置を動的に容易に変更することができる方法、装置、サーバ及びコンピュータプログラムを提供することを目的とする。
上記目的を達成するために第1発明に係る方法は、電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換して表示する方法において、電子文書データを取得する工程と、取得した電子文書データの中から、前記マスクデータに置換する対象となる部分テキストデータの指定を受け付ける工程と、指定を受け付けた部分テキストデータを固有の識別情報と対応付けて記憶する工程と、取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する工程と、前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を記憶する工程と、前記規則情報の選択を受け付ける工程と、選択を受け付けた規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する工程とを含む。
また、第2発明に係る方法は、第1発明において、複数の前記規則情報の選択を受け付ける。
また、第3発明に係る方法は、第1又は第2発明において、前記規則情報に対する適用解除要求を受け付ける工程と、前記適用解除要求を受け付けた場合、受け付けた適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する工程とを含む。
次に、上記目的を達成するために第4発明に係る装置は、電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換して表示する装置において、電子文書データを取得するデータ取得部と、取得した電子文書データの中から、前記マスクデータに置換する対象となる部分テキストデータの指定を受け付ける指定受付部と、指定を受け付けた部分テキストデータを固有の識別情報と対応付けて記憶する識別情報記憶部と、取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する置換文書データ生成部と、前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を記憶する置換情報記憶部と、前記規則情報の選択を受け付ける選択受付部と、選択を受け付けた規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する置換部とを備える。
また、第5発明に係る装置は、第4発明において、複数の前記規則情報の選択を受け付けるようにしてある。
また、第6発明に係る装置は、第4又は第5発明において、前記規則情報に対する適用解除要求を受け付ける解除要求受付部と、前記適用解除要求を受け付けた場合、受け付けた適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する再置換部とを備える。
次に、上記目的を達成するために第7発明に係るサーバは、電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換して表示するクライアントとデータ通信することが可能に接続されたサーバにおいて、取得した電子文書データの中から、前記マスクデータに置換する対象として指定を受け付けた部分テキストデータを受信する部分テキストデータ受信部と、受信した部分テキストデータを固有の識別情報と対応付けて記憶する識別情報記憶部と、取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する置換文書データ生成部と、前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を受信して記憶する置換情報記憶部と、選択を受け付けた規則情報を受信する規則情報受信部と、受信した規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信する置換情報送信部とを備える。
また、第8発明に係るサーバは、第7発明において、複数選択を受け付けた前記規則情報を受信するようにしてある。
また、第9発明に係るサーバは、第7又は第8発明において、前記規則情報に対する適用解除要求を受信する解除要求受信部を備え、前記置換情報送信部は、前記適用解除要求を受信した場合、受信した適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信するようにしてある。
次に、上記目的を達成するために第10発明に係るコンピュータプログラムは、電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換するサーバで実行することが可能なコンピュータプログラムにおいて、前記サーバを、取得した電子文書データの中から、前記マスクデータに置換する対象として指定を受け付けた部分テキストデータを受信する部分テキストデータ受信手段、受信した部分テキストデータを固有の識別情報と対応付けて記憶する識別情報記憶手段、取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する置換文書データ生成手段、前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を受信して記憶する置換情報記憶手段、選択を受け付けた規則情報を受信する規則情報受信手段、及び受信した規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信する置換情報送信手段として機能させる。
また、第11発明に係るコンピュータプログラムは、第10発明において、前記規則情報受信手段を、複数選択を受け付けた前記規則情報を受信する手段として機能させる。
また、第12発明に係るコンピュータプログラムは、第10又は第11発明において、前記サーバを、前記規則情報に対する適用解除要求を受信する解除要求受信手段として機能させ、前記置換情報送信手段を、前記適用解除要求を受信した場合、受信した適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信する手段として機能させる。
次に、上記目的を達成するために第13発明に係るコンピュータプログラムは、電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換するサーバとデータ通信することが可能に接続されているクライアントで実行することが可能なコンピュータプログラムにおいて、前記クライアントを、電子文書データの入力を受け付けるデータ入力受付手段、入力を受け付けた電子文書データの中から、前記マスクデータに置換する対象となる部分テキストデータの指定を受け付け、前記サーバへ送信する指定受付手段、指定を受け付けた部分テキストデータに対応付けた固有の識別情報を置換する規則に関する規則情報の選択を受け付け、前記サーバへ送信する選択受付手段、選択を受け付けた規則情報ごとに、電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報及び部分テキストデータを識別情報に置換した置換文書データを受信する置換情報受信手段、及び受信した置換情報及び置換文書データに基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する置換手段として機能させる。
本発明によれば、電子文書データに含まれる所望の部分テキストデータを、選択を受け付けた規則情報に基づいてマスクデータに置換する、あるいは元の部分テキストデータに戻すことができ、適用する規則情報を選択することによりマスクデータに置換する位置をどこにするかを制御することができる。また、マスクデータに置換する部分テキストデータの長さ、位置に特段の制約が生じることがなく、部分テキストデータの長さとマスクデータの長さとが相違している場合であっても不自然な空白部等が生じることがない。
本発明の実施の形態1に係る電子文書マスキング装置の構成を模式的に示すブロック図である。 本発明の実施の形態1に係る電子文書マスキング装置の機能ブロック図である。 本発明の実施の形態1に係る電子文書マスキング装置のCPUの処理手順を示すフローチャートである。 本発明の実施の形態1に係る電子文書マスキング装置が取得する電子文書データのレイアウトの例示図である。 本発明の実施の形態1に係る電子文書マスキング装置が取得する電子文書データの領域ごとの表示内容の例示図である。 本発明の実施の形態1に係る電子文書マスキング装置の部分テキストデータに対する識別情報の割り当ての例示図である。 本発明の実施の形態1に係る電子文書マスキング装置の置換文書データの例示図である。 本発明の実施の形態1に係る電子文書マスキング装置の置換情報記憶部に記憶されている、一の規則情報に対応する置換情報の例示図である。 本発明の実施の形態1に係る電子文書マスキング装置のマスクデータ置換後の表示を示す例示図である。 本発明の実施の形態1に係る電子文書マスキング装置のマスクパターン記憶部に記憶してあるマスクパターンの対応付けの例示図である。 本発明の実施の形態1に係る電子文書マスキング装置のマスクデータ置換後の表示を示す例示図である。 本発明の実施の形態1に係る電子文書マスキング装置のCPUの処理手順を示すフローチャートである。 本発明の実施の形態1に係る電子文書マスキング装置の置換情報記憶部に記憶されている、一の規則情報に対応する置換情報の例示図である。 本発明の実施の形態1に係る電子文書マスキング装置のマスクデータ置換後の表示を示す例示図である。 本発明の実施の形態2に係る電子文書マスキングシステムの構成を模式的に示すブロック図である。 本発明の実施の形態2に係る電子文書マスキングシステムの機能ブロック図である。 本発明の実施の形態2に係る電子文書マスキングシステムのサーバのCPUの処理手順を示すフローチャートである。 本発明の実施の形態2に係る電子文書マスキングシステムのクライアントのCPUの処理手順を示すフローチャートである。
以下、本発明の実施の形態に係る、電子文書中の所望の部分テキストデータをマスクする装置について、図面に基づいて具体的に説明する。以下の実施の形態は、特許請求の範囲に記載された発明を限定するものではなく、実施の形態の中で説明されている特徴的事項の組み合わせの全てが解決手段の必須事項であるとは限らないことは言うまでもない。
また、本発明は多くの異なる態様にて実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。実施の形態を通じて同じ要素には同一の符号を付している。
以下の実施の形態では、コンピュータシステムにコンピュータプログラムを導入した装置について説明するが、当業者であれば明らかな通り、本発明はその一部をコンピュータで実行することが可能なコンピュータプログラムとして実施することができる。したがって、本発明は、電子文書中の所望の部分テキストデータをマスクする装置というハードウェアとしての実施の形態、ソフトウェアとしての実施の形態、又はソトウェアとハードウェアとの組み合わせの実施の形態をとることができる。コンピュータプログラムは、ハードディスク、DVD、CD、光記憶装置、磁気記憶装置等の任意のコンピュータで読み取ることが可能な記録媒体に記録することができる。
本発明の実施の形態によれば、電子文書データに含まれる所望の部分テキストデータを、選択を受け付けた規則情報に基づいてマスクデータに置換する、あるいは元の部分テキストデータに戻すことができ、適用する規則情報を選択することによりマスクデータに置換する位置をどこにするかを制御することができる。また、マスクデータに置換する部分テキストデータの長さ、位置に特段の制約が生じることがなく、部分テキストデータの長さとマスクデータの長さとが相違している場合であっても不自然な空白部等が生じることがない。
(実施の形態1)
図1は、本発明の実施の形態1に係る電子文書マスキング装置の構成を模式的に示すブロック図である。本発明の実施の形態1に係る電子文書マスキング装置1は、少なくともCPU(中央演算装置)11、メモリ12、記憶装置13、I/Oインタフェース14、ビデオインタフェース15、可搬型ディスクドライブ16、通信インタフェース17及び上述したハードウェアを接続する内部バス18で構成されている。
CPU11は、内部バス18を介して電子文書マスキング装置1の上述したようなハードウェア各部と接続されており、上述したハードウェア各部の動作を制御するとともに、記憶装置13に記憶されたコンピュータプログラム100に従って、種々のソフトウェア的機能を実行する。メモリ12は、SRAM、SDRAM等の揮発性メモリで構成され、コンピュータプログラム100の実行時にロードモジュールが展開され、コンピュータプログラム100の実行時に発生する一時的なデータ等を記憶する。
記憶装置13は、内蔵される固定型記憶装置(ハードディスク)、ROM等で構成されている。記憶装置13に記憶されたコンピュータプログラム100は、プログラム及びデータ等の情報を記録したDVD、CD−ROM等の可搬型記録媒体90から、可搬型ディスクドライブ16によりダウンロードされ、実行時には記憶装置13からメモリ12へ展開して実行される。もちろん、通信インタフェース17を介して接続されている外部コンピュータからダウンロードされたコンピュータプログラムであっても良い。
記憶装置13は、識別情報記憶部131、置換情報記憶部132、置換文書データ記憶部133及びマスクデータ記憶部134を備えている。識別情報記憶部131は、指定を受け付けた部分テキストデータ及び対応付けられた識別情報を記憶する。
置換情報記憶部132は、部分テキストデータをマスクデータに置換する規則を識別するための規則情報ごとに、識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報を記憶する。規則情報とは、マスクする部分テキストデータを選択するルール全般に関する情報を意味しており、例えば年号のみをマスクする、電話番号のみをマスクする等のルールを意味する。
置換文書データ記憶部133は、取得した電子文書データ中の、指定を受け付けた部分テキストデータを対応する識別情報に置換した置換文書データを記憶する。例えば記憶してある置換文書データを外部へ送信することで、識別情報をマスクデータ又は部分テキストデータに置換する処理は外部のコンピュータで実行することができる。また、置換文書データと置換情報とを組み合わせることにより、任意のマスキングを施した電子文書データを容易に生成することができる。
マスクデータ記憶部134は、置換文書データに含まれる識別情報を置換するマスクデータのパターン情報(マスクパターン)を記憶する。パターン情報としては、置換した部分テキストデータを読み取りすることが不可能なパターンであれば特に限定されるものではなく、各色の矩形の塗りつぶしパターン、斜線パターン等何でも良い。
通信インタフェース17は内部バス18に接続されており、インターネット、LAN、WAN等の外部のネットワークに接続されることにより、外部コンピュータ等とデータ送受信を行うことが可能となっている。
I/Oインタフェース14は、キーボード21、マウス22等のデータ入力媒体と接続され、データの入力を受け付ける。また、ビデオインタフェース15は、CRTモニタ、LCD等の表示装置23と接続され、所定の電子文書データを表示する。
以下、上述した構成の電子文書マスキング装置1の動作について説明する。図2は、本発明の実施の形態1に係る電子文書マスキング装置1の機能ブロック図である。
図2において、電子文書マスキング装置1の電子文書データ取得部101は、マスキングの対象となる電子文書データを取得する。電子文書データの取得方法は特に限定されるものではなく、テキストデータとして取得しても良いし、イメージデータとして取得してテキストデータを抽出しても良い。
部分テキストデータ指定受付部(指定受付手段)102は、取得した電子文書データの中から、マスクデータに置換する対象となる部分テキストデータの指定を受け付ける。部分テキストデータは、テキストデータ化された電子文書データに対して形態素解析等を実行して抽出した、品詞単位の語句又は連続した品詞を組み合わせた語句となる。
識別情報割当部(識別情報記憶手段)103は、指定を受け付けた部分テキストデータに対して固有の識別情報、例えば識別IDを割り当て、記憶装置13の識別情報記憶部131に記憶する。識別情報の割当は、CPU11により自動的に行っても良いし、ユーザによる指定を受け付けても良い。
置換文書データ生成部(置換文書データ生成手段)104は、取得した電子文書データ中の指定を受け付けた部分テキストデータを、割り当てられた識別情報に置換した置換文書データを生成する。生成した置換文書データは、記憶装置13の置換文書データ記憶部133に記憶する。
置換情報設定受付部(置換情報記憶手段)105は、指定を受け付けた部分テキストデータをマスクデータに置換する規則を識別するための規則情報ごとに、識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報の設定を受け付けて記憶する。規則情報とは、マスクする部分テキストデータを選択するルール全般に関する情報を意味しており、例えば年号のみをマスクする、電話番号のみをマスクする等のルールを意味する。規則情報は、キーボード21、マウス22等を介してユーザが事前に設定し、記憶装置13に記憶しておく。
置換情報は、マスクデータに置換する部分テキストデータの項目名として記憶する。すなわち、キーボード21、マウス22等を介して、置換対象となる部分テキストデータの項目名を設定する。設定されていない項目名は、マスクデータに置換されない。設定した項目名は、置換情報として記憶装置13の置換情報記憶部132に記憶する。
規則情報選択受付部(選択受付手段)106は、規則情報の選択を受け付ける。置換部(置換手段)107は、選択を受け付けた規則情報をキー情報として置換情報記憶部132から抽出した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報を、マスクデータ又は部分テキストデータに置換する。置換するマスクデータのパターン情報として、マスクデータ記憶部134に記憶されているマスクパターンを用いる。表示部111は、置換された電子文書データを表示装置23に表示する。もちろん、記憶装置13に記憶しても良い。
規則情報選択受付部106では、一の規則情報の選択を受け付けることに限定されるものではなく、複数の規則情報の選択を受け付けても良い。複数の規則情報の選択を受け付けた場合、複数の規則情報それぞれに基づいて、置換部107は、置換文書データに含まれる識別情報をマスクデータ又は部分テキストデータに置換する。各部分テキストデータについて、選択を受け付けた規則情報のうち1つでもマスクデータに置換するルールが存在する場合には、該部分テキストデータはマスクデータに置換する。したがって、規則情報の選択に応じて、マスクされる部分テキストデータを自由に選択することができる。
図3は、本発明の実施の形態1に係る電子文書マスキング装置1のCPU11の処理手順を示すフローチャートである。図3において、電子文書マスキング装置1のCPU11は、マスキングの対象となる電子文書データを取得する(ステップS301)。電子文書データの取得方法は特に限定されるものではなく、テキストデータとして取得しても良いし、イメージデータとして取得してテキストデータを抽出しても良い。
CPU11は、取得した電子文書データの中から、マスクデータに置換する対象となる部分テキストデータの指定を受け付ける(ステップS302)。部分テキストデータは、テキストデータ化された電子文書データに対して形態素解析等を実行して抽出した、品詞単位の語句又は連続した品詞を組み合わせた語句となる。
CPU11は、指定を受け付けた部分テキストデータに対して固有の識別情報、例えば識別IDを割り当て(ステップS303)、記憶装置13の識別情報記憶部131に記憶する。識別情報の割当は、CPU11により自動的に行っても良いし、ユーザによる指定を受け付けても良い。
CPU11は、取得した電子文書データ中の部分テキストデータを、割り当てられた識別情報に置換した置換文書データを生成する(ステップS304)。生成した置換文書データは、記憶装置13の置換文書データ記憶部133に記憶する。
CPU11は、指定を受け付けた部分テキストデータをマスクデータに置換する規則を識別するための規則情報ごとに、識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報を設定して記憶する(ステップS305)。規則情報は、キーボード21、マウス22等を介してユーザが事前に設定し、記憶装置13に記憶しておく。
CPU11は、規則情報の選択を受け付け(ステップS306)、選択を受け付けた規則情報をキー情報として置換情報記憶部132から置換情報を抽出し(ステップS307)、抽出した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報を、マスクデータ又は部分テキストデータに置換する(ステップS308)。置換するマスクデータのパターンとして、マスクデータ記憶部134に記憶されているマスクパターンを用いる。CPU11は、識別情報をマスクデータ又は部分テキストデータに置換した電子文書データを表示装置23に表示する(ステップS309)。
なお、規則情報の選択については、ユーザによる解除要求を受け付けることが好ましい。マスクする部分テキストデータを段階的に調整することができるからである。例えば図2の解除要求受付部108は、規則情報に対する適用を解除する要求である解除要求を受け付ける。具体的には、キーボード21、マウス22等を介して、選択された規則情報の中から適用を解除するべき規則情報の選択を受け付ける。
図4は、本発明の実施の形態1に係る電子文書マスキング装置1が取得する電子文書データのレイアウトの例示図である。図4に示す、取得した電子文書データのレイアウトの例では、領域(A)、領域(B)、領域(C)の3つの領域に分割されている。
図5は、本発明の実施の形態1に係る電子文書マスキング装置1が取得する電子文書データの領域ごとの表示内容の例示図である。図5に示すように、領域(A)には項目名「名前」に対して「山田太郎」と表示されている。領域(B)には項目名「日時」に対して「2000.1.1」と表示されている。領域(C)には項目名「カード番号」に対して「123.123.123」、「345.345.345」、「567.567.567」と、それぞれ表示されている。
図6は、本発明の実施の形態1に係る電子文書マスキング装置1の部分テキストデータに対する識別情報の割り当ての例示図である。図6に示すように、領域(A)の「山田太郎」には、識別ID(識別情報)として「T0001」を、領域(B)の「2000.1.1」には、識別IDとして「T0002」を、領域(C)の「123.123.123」、「345.345.345」、「567.567.567」には、それぞれ識別IDとして「T0003」、「T0004」、「T0005」が、それぞれ割り当てられている。
図7は、本発明の実施の形態1に係る電子文書マスキング装置1の置換文書データの例示図である。図7に示すように、領域(A)の「山田太郎」は、識別ID「T0001」に置換され、領域(B)の「2000.1.1」は、識別ID「T0002」に置換され、領域(C)の「123.123.123」、「345.345.345」、「567.567.567」は、それぞれ識別ID「T0003」、「T0004」、「T0005」に置換されている。置換情報として、各識別IDがマスクデータに置換されるのか、部分テキストデータに置換されるのかを指定することにより、マスクする部分テキストデータの位置を動的に容易に変更することができる。
すなわち置換情報としては、規則情報ごとにマスクデータに置換する項目名を記憶しておけば足りる。図8は、本発明の実施の形態1に係る電子文書マスキング装置1の置換情報記憶部132に記憶されている、一の規則情報に対応する置換情報の例示図である。図8に示すように、領域ごとに、マスクデータに置換する項目名を記憶しておく。もちろん、項目名でなく領域だけを指定して記憶しても良い。領域を記憶する場合、領域内に含まれるすべての部分テキストデータを置換対象とすることも可能である。
マスクデータは、事前にマスクパターンを指定しておき、置換情報として置換情報記憶部132に記憶されている項目名に対して、識別IDをマスクデータに置換する。置換情報として置換情報記憶部132に記憶されていない項目名に対しては、識別IDを部分テキストデータに置換する。図9は、本発明の実施の形態1に係る電子文書マスキング装置1のマスクデータ置換後の表示を示す例示図である。
図9の例では、マスクパターンは4文字分の「□」列としてある。したがって、図8に示す置換情報として記憶されている項目名については、識別IDがマスクデータ、すなわち4文字分の「□」列に置換されて表示されている。
もちろん、マスクデータのマスクパターンは、項目ごとに変えても良い。この場合、識別IDに対応付けて、置換するマスクパターンを記憶装置13のマスクデータ記憶部134に記憶しておく。図10は、本発明の実施の形態1に係る電子文書マスキング装置1のマスクデータ記憶部134に記憶してあるマスクパターンの対応付けの例示図である。
図10に示すように、識別ID「T0001」にはマスクパターンとして4文字分の「□」列を対応付けているが、識別ID「T0002」にはマスクパターンとして2文字分の「□」列を、識別ID「T0003」、「T0004」、「T0005」にはマスクパターンとして3文字分の「□」列を対応付けている。
このように識別IDに対応付けてマスクパターンを記憶しておくことにより、置換情報として記憶されている項目名に対して、識別IDを所望のマスクデータに置換することができる。図11は、本発明の実施の形態1に係る電子文書マスキング装置1のマスクデータ置換後の表示を示す例示図である。
図11の例では、図8に示す置換情報として記憶されている項目名について、識別IDが図10に示すマスクパターンにそれぞれ置換されて表示されている。
なお、規則情報ごとに置換情報を記憶することができるので、複数の規則情報が記憶されている場合、どの規則情報を適用するか選択することにより、所望の項目についてのみマスクデータに置換して表示することができる。
図2の再置換部109は、解除要求受付部108にて解除要求を受け付けた場合、解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出された置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別IDをマスクデータ又は部分テキストデータに置換する。表示部111は、再置換部109で置換された電子文書データを表示装置23に表示する。もちろん、記憶装置13に記憶しても良い。
図12は、本発明の実施の形態1に係る電子文書マスキング装置1のCPU11の処理手順を示すフローチャートである。図12において、電子文書マスキング装置1のCPU11は、規則情報に対する適用を解除する要求である解除要求を受け付ける(ステップS1201)。具体的には、キーボード21、マウス22等を介して、選択された規則情報の中から適用を解除するべき規則情報の選択を受け付ける。
CPU11は、受け付けた解除要求に対応する規則情報を除外した他の規則情報をキー情報として置換情報を抽出する(ステップS1202)。CPU11は、抽出した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報を、マスクデータ又は部分テキストデータに置換する(ステップS1203)。規則情報ごとに適用するか否かを決定することにより、マスクデータに置換する位置をどこにするかを容易に制御することができる。なお、ステップS1202を、最初の置換情報の抽出時に事前に実行しておき、解除要求の受付時に抽出してある置換情報を選択することで、全体の処理パフォーマンスを向上させることも可能である。
図13は、本発明の実施の形態1に係る電子文書マスキング装置1の置換情報記憶部132に記憶されている、一の規則情報に対応する置換情報の例示図である。図13の例では、図13(a)、(b)、(c)の3つの置換情報が記憶されている。
図14は、本発明の実施の形態1に係る電子文書マスキング装置1のマスクデータ置換後の表示を示す例示図である。図14の例では、マスクパターンは4文字分の「□」列としてある。
例えば複数の規則情報に対応する置換情報として、図13(a)、(b)、(c)が抽出された場合、図9に示すように識別IDがマスクデータ、すなわち4文字分の「□」列に置換されて表示される。それに対して図13(a)に示す置換情報に対応する規則情報の適用を解除する解除要求を受け付けた場合、領域(A)の識別ID「T0001」は、部分テキストデータ「山田太郎」に置換され、図14(a)のように表示される。
また、図13(b)に示す置換情報に対応する規則情報の適用を解除する解除要求を受け付けた場合、領域(B)の識別ID「T0002」は、部分テキストデータ「2000.1.1」に置換され、図14(b)のように表示される。このように規則情報の選択に応じて、マスクされる部分テキストデータを自由に選択することができる。
以上のように本実施の形態1によれば、電子文書データに含まれる所望の部分テキストデータを、選択を受け付けた規則情報に基づいてマスクデータに置換する、あるいは元の部分テキストデータに戻すことができ、適用する規則情報を選択することによりマスクデータに置換する位置をどこにするかを制御することができる。また、マスクデータでマスクする部分テキストデータの長さ、位置に特段の制約が生じることがなく、部分テキストデータの長さとマスクデータの長さとが相違している場合であっても不自然な空白部等が生じることがない。
(実施の形態2)
図15は、本発明の実施の形態2に係る電子文書マスキングシステムの構成を模式的に示すブロック図である。本発明の実施の形態2に係る電子文書マスキングシステムは、データの入出力を実行するクライアント4と、クライアント4とネットワーク5を介してデータ通信することが可能に接続してあるサーバ3とで構成されている。本発明の実施の形態2に係る電子文書マスキングシステムのサーバ3は、少なくともCPU(中央演算装置)31、メモリ32、記憶装置33、I/Oインタフェース34、ビデオインタフェース35、可搬型ディスクドライブ36、通信インタフェース37及び上述したハードウェアを接続する内部バス38で構成されている。
CPU31は、内部バス38を介してサーバ3の上述したようなハードウェア各部と接続されており、上述したハードウェア各部の動作を制御するとともに、記憶装置33に記憶されたコンピュータプログラム120に従って、種々のソフトウェア的機能を実行する。メモリ32は、SRAM、SDRAM等の揮発性メモリで構成され、コンピュータプログラム120の実行時にロードモジュールが展開され、コンピュータプログラム120の実行時に発生する一時的なデータ等を記憶する。
記憶装置33は、内蔵される固定型記憶装置(ハードディスク)、ROM等で構成されている。記憶装置33に記憶されたコンピュータプログラム120は、プログラム及びデータ等の情報を記録したDVD、CD−ROM等の可搬型記録媒体92から、可搬型ディスクドライブ36によりダウンロードされ、実行時には記憶装置33からメモリ32へ展開して実行される。もちろん、通信インタフェース37を介して接続されている外部コンピュータからダウンロードされたコンピュータプログラムであっても良い。
記憶装置33は、識別情報記憶部331、置換情報記憶部332、置換文書データ記憶部333及びマスクデータ記憶部334を備えている。識別情報記憶部331は、クライアント4で指定を受け付けた部分テキストデータ及び対応付けられた識別情報を受信して記憶する。
置換情報記憶部332は、指定を受け付けた部分テキストデータをマスクデータに置換する規則を識別するための規則情報ごとに、識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報を記憶する。規則情報とは、マスクする部分テキストデータを選択するルール全般に関する情報を意味しており、例えば年号のみをマスクする、電話番号のみをマスクする等のルールを意味する。
置換文書データ記憶部333は、取得した電子文書データ中の、指定を受け付けた部分テキストデータを対応する識別情報に置換した置換文書データを記憶する。記憶してある置換文書データをクライアント4へ送信することで、識別情報をマスクデータ又は部分テキストデータに置換する処理はクライアント4で実行することができる。また、置換文書データと置換情報とを組み合わせることにより、任意のマスキングを施した電子文書データを容易に生成することができる。
マスクデータ記憶部334は、置換文書データに含まれる識別情報を置換するマスクデータのパターン情報を記憶する。パターン情報としては、置換された部分テキストデータを読み取りすることが不可能なパターンであれば特に限定されるものではなく、各色の矩形の塗りつぶしパターン、斜線パターン等何でも良い。
通信インタフェース37は内部バス38に接続されており、インターネット、LAN、WAN等の外部のネットワーク5に接続されることにより、クライアント4、外部コンピュータ等とデータ送受信を行うことが可能となっている。
I/Oインタフェース34は、キーボード51、マウス52等のデータ入力媒体と接続され、データの入力を受け付ける。また、ビデオインタフェース35は、CRTモニタ、LCD等の表示装置53と接続され、所定の電子文書データを表示する。
本発明の実施の形態2に係る電子文書マスキングシステムのクライアント4は、少なくともCPU(中央演算装置)41、メモリ42、記憶装置43、I/Oインタフェース44、ビデオインタフェース45、可搬型ディスクドライブ46、通信インタフェース47及び上述したハードウェアを接続する内部バス48で構成されている。
CPU41は、内部バス48を介してクライアント4の上述したようなハードウェア各部と接続されており、上述したハードウェア各部の動作を制御するとともに、記憶装置43に記憶されたコンピュータプログラム110に従って、種々のソフトウェア的機能を実行する。メモリ42は、SRAM、SDRAM等の揮発性メモリで構成され、コンピュータプログラム110の実行時にロードモジュールが展開され、コンピュータプログラム110の実行時に発生する一時的なデータ等を記憶する。
記憶装置43は、内蔵される固定型記憶装置(ハードディスク)、ROM等で構成されている。記憶装置43に記憶されたコンピュータプログラム110は、プログラム及びデータ等の情報を記録したDVD、CD−ROM等の可搬型記録媒体91から、可搬型ディスクドライブ46によりダウンロードされ、実行時には記憶装置43からメモリ42へ展開して実行される。もちろん、通信インタフェース47を介して接続されている外部コンピュータからダウンロードされたコンピュータプログラムであっても良い。
通信インタフェース47は内部バス48に接続されており、インターネット、LAN、WAN等の外部のネットワーク5に接続されることにより、外部コンピュータ等とデータ送受信を行うことが可能となっている。
I/Oインタフェース44は、キーボード54、マウス55等のデータ入力媒体と接続され、データの入力を受け付ける。また、ビデオインタフェース45は、CRTモニタ、LCD等の表示装置56と接続され、所定の電子文書データを表示する。
以下、上述した構成の電子文書マスキングシステムの動作について説明する。図16は、本発明の実施の形態2に係る電子文書マスキングシステムの機能ブロック図である。
図16において、電子文書マスキングシステムのクライアント4の電子文書データ入力受付部(データ入力受付手段)401は、マスキングの対象となる電子文書データの入力を受け付け、サーバ3へ送信する。電子文書データの入力の受付方法は特に限定されるものではなく、テキストデータとして直接入力を受け付けても良いし、イメージデータとして入力を受け付けてテキストデータを抽出しても良い。
部分テキストデータ指定受付部(指定受付手段)402は、入力を受け付けた電子文書データの中から、マスクデータに置換する対象となる部分テキストデータの指定を受け付け、サーバ3へ送信する。部分テキストデータは、テキストデータ化された電子文書データに対して形態素解析等を実行して抽出した、品詞単位の語句又は連続した品詞を組み合わせた語句となる。
サーバ3の部分テキストデータ受信部301は、クライアント4で指定を受け付けた部分テキストデータを受信し、識別情報割当部(識別情報記憶手段)302は、受信した部分テキストデータに対して固有の識別情報、例えば識別IDを割り当て、記憶装置33の識別情報記憶部331に記憶する。識別情報の割当は、CPU31により自動的に行っても良いし、ユーザによる指定を受け付けても良い。
サーバ3の置換文書データ生成部303は、受信した電子文書データ中の部分テキストデータを、割り当てられた識別情報に置換した置換文書データを生成する。生成した置換文書データは、記憶装置33の置換文書データ記憶部333に記憶する。
クライアント4の置換情報設定受付部403は、指定を受け付けた部分テキストデータをマスクデータに置換する規則を識別するための規則情報ごとに、識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報の設定を受け付けてサーバ3へ送信する。規則情報は、マスクする部分テキストデータを選択するルール全般に関する情報を意味しており、例えば年号のみをマスクする、電話番号のみをマスクする等のルールを意味する。規則情報は、キーボード54、マウス55等を介してユーザが事前に設定し、サーバ3へ送信して記憶装置33に記憶しておく。
置換情報は、マスクデータに置換する部分テキストデータの項目名として記憶する。すなわち、キーボード54、マウス55等を介して、置換対象となる部分テキストデータの項目名を設定する。設定した項目名はサーバ3へ送信され、サーバ3の置換情報受信部304は、クライアント4で設定を受け付けた置換情報を受信し、置換情報として記憶装置33の置換情報記憶部332に記憶する。
クライアント4の規則情報選択受付部(選択受付手段)404は、規則情報の選択を受け付け、サーバ3へ送信する。サーバ3の規則情報受信部305は、クライアント4から選択を受け付けた規則情報を受信し、置換情報送信部306は、受信した規則情報をキー情報として置換情報記憶部332から抽出した置換情報、識別情報、置換文書データ、マスクデータをクライアント4へ送信する。
クライアント4の置換情報受信部405は、サーバ3から置換情報、識別情報、置換文書データ、マスクデータを受信し、置換部406は、受信した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報を、マスクデータ又は部分テキストデータに置換する。置換するマスクデータのパターンとして、マスクデータ記憶部334に記憶されているマスクパターンを用いる。もちろん、マスクデータ記憶部334をクライアント4に設けていても良い。
規則情報選択受付部404では、一の規則情報の選択を受け付けることに限定されるものではなく、複数の規則情報の選択を受け付けても良い。複数の規則情報の選択を受け付けた場合、複数の規則情報それぞれに基づいて、置換部406は、置換文書データに含まれる識別情報をマスクデータ又は部分テキストデータに置換する。部分テキストデータについて、規則情報のうち1つでもマスクデータに置換する場合には、該部分テキストデータはマスクデータに置換する。したがって、規則情報の選択に応じて、マスクされる部分テキストデータを自由に選択することができる。
クライアント4の解除要求受付部407は、規則情報に対する適用を解除する要求である解除要求を受け付け、サーバ3へ送信する。サーバ3の解除要求受信部308は、解除要求を受信し、置換情報送信部306は、受信した解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出された置換情報、識別情報、置換文書データ、マスクデータをクライアント4へ送信する。これにより、クライアント4の再置換部409は、新たに受信した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報をマスクデータ又は部分テキストデータに置換する。
もちろん、事前に規則情報、置換情報、識別情報、置換文書データ、マスクデータをクライアント4にて受信して記憶しておき、クライアント4の解除要求受付部407が解除要求を受け付けた場合、クライアント4の再置換部409において、事前に記憶してある置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報をマスクデータ又は部分テキストデータに置換しても良い。これにより、通信負荷を軽減することができ、全体として表示レスポンスの向上を図ることができる。
図17は、本発明の実施の形態2に係る電子文書マスキングシステムのサーバ3のCPU31の処理手順を示すフローチャートである。図17において、サーバ3のCPU31は、マスキングの対象となる電子文書データをテキストデータとして受信し(ステップS1701)、指定を受け付けた部分テキストデータを受信する(ステップS1702)。
CPU31は、受信した部分テキストデータに対して固有の識別情報、例えば識別IDを割り当て(ステップS1703)、記憶装置33の識別情報記憶部331に記憶する。識別情報の割当は、CPU31により自動的に行っても良いし、ユーザによる指定を受け付けても良い。
CPU31は、受信した電子文書データ中の部分テキストデータを、割り当てられた識別情報に置換した置換文書データを生成し(ステップS1704)、記憶装置33の置換文書データ記憶部333に記憶する。CPU31は、設定を受け付けた置換情報を受信して記憶する(ステップS1705)。CPU31は、選択を受け付けた規則情報を受信し(ステップS1706)、受信した規則情報をキー情報として置換情報を抽出し(ステップS1707)、抽出した置換情報、識別情報、置換文書データ、マスクデータをクライアント4へ送信する(ステップS1708)。
CPU31は、規則情報に対する適用を解除する要求である解除要求を受信したか否かを判断し(ステップS1709)、CPU31が、解除要求を受信していないと判断した場合(ステップS1709:NO)、CPU31は、処理を終了するか否かを判断する(ステップS1710)。CPU31が、処理を終了しないと判断した場合(ステップS1710:NO)、CPU31は、処理をステップS1709へ戻し、解除要求の受信待ち状態となる。CPU31が、処理を終了すると判断した場合には(ステップS1710:YES)、処理を終了する。
CPU31が、解除要求を受信したと判断した場合(ステップS1709:YES)、CPU31は、受信した解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出された置換情報、識別情報、置換文書データ、マスクデータをクライアント4へ送信する(ステップS1711)。これにより、クライアント4の再置換部409は、新たに受信した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報をマスクデータ又は部分テキストデータに置換する。
図18は、本発明の実施の形態2に係る電子文書マスキングシステムのクライアント4のCPU41の処理手順を示すフローチャートである。図18において、クライアント4のCPU41は、マスキングの対象となる電子文書データの入力を受け付け、サーバ3へ送信する(ステップS1801)。電子文書データの入力の受付方法は特に限定されるものではなく、テキストデータとして直接入力を受け付けても良いし、イメージデータとして入力を受け付けてテキストデータを抽出しても良い。
CPU41は、入力を受け付けた電子文書データの中から、マスクデータに置換する対象となる部分テキストデータの指定を受け付け、サーバ3へ送信する(ステップS1802)。部分テキストデータは、テキストデータ化された電子文書データに対して形態素解析等を実行して抽出した、品詞単位の語句又は連続した品詞を組み合わせた語句となる。
CPU41は、指定を受け付けた部分テキストデータをマスクデータに置換する規則を識別するための規則情報ごとに、識別情報をマスクデータ又は部分テキストデータに置換するか否かに関する置換情報の設定を受け付け、サーバ3へ送信する(ステップS1803)。規則情報は、マスクする部分テキストデータを選択するルール全般に関する情報を意味しており、例えば年号のみをマスクする、電話番号のみをマスクする等のルールを意味する。規則情報は、キーボード54、マウス55等を介してユーザが事前に設定し、サーバ3へ送信して記憶装置33に記憶しておく。
CPU41は、規則情報の選択を受け付け、サーバ3へ送信する(ステップS1804)。CPU41は、送信した規則情報をキー情報として置換情報記憶部332から抽出された置換情報、識別情報、置換文書データ、マスクデータを受信する(ステップS1805)。
CPU41は、受信した置換情報、識別情報、置換文書データ、マスクデータに基づいて、置換文書データに含まれる識別情報を、マスクデータ又は部分テキストデータに置換し(ステップS1806)、置換後の電子文書データを表示装置56に表示する(ステップS1807)。
CPU41は、規則情報に対する適用を解除する要求である解除要求を受け付けたか否かを判断する(ステップS1808)。CPU41が、解除要求を受け付けていないと判断した場合(ステップS1808:NO)、CPU41は、処理を終了するか否かを判断する(ステップS1809)。
CPU41が、処理を終了しないと判断した場合(ステップS1809:NO)、CPU41は、処理をステップS1808へ戻し、解除要求の受付待ち状態となる。CPU41が、処理を終了すると判断した場合には(ステップS1809:YES)、処理を終了する。
CPU41が、解除要求を受け付けたと判断した場合(ステップS1808:YES)、CPU41は、受け付けた解除要求をサーバ3へ送信し、送信した解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出された置換情報、識別情報、置換文書データ、マスクデータを受信し(ステップS1810)、処理をステップS1806へ戻して上述した処理を繰り返す。
以上のように本実施の形態2によれば、電子文書データに含まれる所望の部分テキストデータを、選択を受け付けた規則情報に基づいてマスクデータに置換する、あるいは元の部分テキストデータに戻すことができ、適用する規則情報を選択することによりマスクデータに置換する位置をどこにするかを制御することができる。また、マスクデータでマスクする語句の長さ、位置に特段の制約が生じることがなく、語句の長さとマスクデータの長さとが相違している場合であっても不自然な空白部等が生じることがない。
なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨の範囲内であれば多種の変更、改良等が可能である。例えば置換情報、規則情報等は、クライアント4にて入力を受け付けても良いし、サーバ3にて直接、入力を受け付けても良い。また、置換部107、406と再置換部109、409とは、同一のハードウェアであっても良いし、別個のハードウェアであっても良い。
1 電子文書マスキング装置
3 サーバ
4 クライアント
11、31、41 CPU
12、32、42 メモリ
13、33、43 記憶装置
14、34、44 I/Oインタフェース
15、35、45 ビデオインタフェース
16、36、46 可搬型ディスクドライブ
17、37、47 通信インタフェース
18、38、48 内部バス
90、91、92 可搬型記録媒体
100、110、120 コンピュータプログラム
131、331 識別情報記憶部
132、332 置換情報記憶部
133、333 置換文書データ記憶部
134、334 マスクデータ記憶部

Claims (13)

  1. 電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換して表示する方法において、
    電子文書データを取得する工程と、
    取得した電子文書データの中から、前記マスクデータに置換する対象となる部分テキストデータの指定を受け付ける工程と、
    指定を受け付けた部分テキストデータを固有の識別情報と対応付けて記憶する工程と、
    取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する工程と、
    前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を記憶する工程と、
    前記規則情報の選択を受け付ける工程と、
    選択を受け付けた規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する工程と
    を含む方法。
  2. 複数の前記規則情報の選択を受け付ける請求項1記載の方法。
  3. 前記規則情報に対する適用解除要求を受け付ける工程と、
    前記適用解除要求を受け付けた場合、受け付けた適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する工程と
    を含む請求項1又は2記載の方法。
  4. 電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換して表示する装置において、
    電子文書データを取得するデータ取得部と、
    取得した電子文書データの中から、前記マスクデータに置換する対象となる部分テキストデータの指定を受け付ける指定受付部と、
    指定を受け付けた部分テキストデータを固有の識別情報と対応付けて記憶する識別情報記憶部と、
    取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する置換文書データ生成部と、
    前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を記憶する置換情報記憶部と、
    前記規則情報の選択を受け付ける選択受付部と、
    選択を受け付けた規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する置換部と
    を備える装置。
  5. 複数の前記規則情報の選択を受け付けるようにしてある請求項4記載の装置。
  6. 前記規則情報に対する適用解除要求を受け付ける解除要求受付部と、
    前記適用解除要求を受け付けた場合、受け付けた適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報に基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する再置換部と
    を備える請求項4又は5記載の装置。
  7. 電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換して表示するクライアントとデータ通信することが可能に接続されたサーバにおいて、
    取得した電子文書データの中から、前記マスクデータに置換する対象として指定を受け付けた部分テキストデータを受信する部分テキストデータ受信部と、
    受信した部分テキストデータを固有の識別情報と対応付けて記憶する識別情報記憶部と、
    取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する置換文書データ生成部と、
    前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を受信して記憶する置換情報記憶部と、
    選択を受け付けた規則情報を受信する規則情報受信部と、
    受信した規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信する置換情報送信部と
    を備えるサーバ。
  8. 複数選択を受け付けた前記規則情報を受信するようにしてある請求項7記載のサーバ。
  9. 前記規則情報に対する適用解除要求を受信する解除要求受信部を備え、
    前記置換情報送信部は、前記適用解除要求を受信した場合、受信した適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信するようにしてある請求項7又は8記載のサーバ。
  10. 電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換するサーバで実行することが可能なコンピュータプログラムにおいて、
    前記サーバを、
    取得した電子文書データの中から、前記マスクデータに置換する対象として指定を受け付けた部分テキストデータを受信する部分テキストデータ受信手段、
    受信した部分テキストデータを固有の識別情報と対応付けて記憶する識別情報記憶手段、
    取得した電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データを生成する置換文書データ生成手段、
    前記識別情報を置換する規則に関する規則情報ごとに、生成した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報を受信して記憶する置換情報記憶手段、
    選択を受け付けた規則情報を受信する規則情報受信手段、及び
    受信した規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信する置換情報送信手段
    として機能させるコンピュータプログラム。
  11. 前記規則情報受信手段を、複数選択を受け付けた前記規則情報を受信する手段として機能させる請求項10記載のコンピュータプログラム。
  12. 前記サーバを、前記規則情報に対する適用解除要求を受信する解除要求受信手段として機能させ、
    前記置換情報送信手段を、前記適用解除要求を受信した場合、受信した適用解除要求に対応する規則情報を除外した他の規則情報をキー情報として抽出した置換情報及び前記置換文書データをクライアントへ送信する手段として機能させる請求項10又は11記載のコンピュータプログラム。
  13. 電子文書データに含まれる部分テキストデータを、読解することができないマスクデータに置換するサーバとデータ通信することが可能に接続されているクライアントで実行することが可能なコンピュータプログラムにおいて、
    前記クライアントを、
    電子文書データの入力を受け付けるデータ入力受付手段、
    入力を受け付けた電子文書データの中から、前記マスクデータに置換する対象となる部分テキストデータの指定を受け付け、前記サーバへ送信する指定受付手段、
    指定を受け付けた部分テキストデータに対応付けた固有の識別情報を置換する規則に関する規則情報の選択を受け付け、前記サーバへ送信する選択受付手段、
    選択を受け付けた規則情報ごとに、電子文書データ中の部分テキストデータを、対応する識別情報に置換した置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換するか否かに関する置換情報及び部分テキストデータを識別情報に置換した置換文書データを受信する置換情報受信手段、及び
    受信した置換情報及び置換文書データに基づいて、前記置換文書データに含まれる前記識別情報を前記マスクデータ又は前記部分テキストデータに置換する置換手段
    として機能させるコンピュータプログラム。
JP2010253817A 2010-11-12 2010-11-12 電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム Expired - Fee Related JP5827467B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010253817A JP5827467B2 (ja) 2010-11-12 2010-11-12 電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム
US13/281,999 US9378649B2 (en) 2010-11-12 2011-10-26 Masking partial text data in digital document
CN201110343132.0A CN102467489B (zh) 2010-11-12 2011-10-27 对电子文档中的部分文本数据屏蔽的方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010253817A JP5827467B2 (ja) 2010-11-12 2010-11-12 電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2012103593A true JP2012103593A (ja) 2012-05-31
JP5827467B2 JP5827467B2 (ja) 2015-12-02

Family

ID=46071136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010253817A Expired - Fee Related JP5827467B2 (ja) 2010-11-12 2010-11-12 電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム

Country Status (3)

Country Link
US (1) US9378649B2 (ja)
JP (1) JP5827467B2 (ja)
CN (1) CN102467489B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016038903A (ja) * 2014-08-07 2016-03-22 莊新宏 試験問題生成システム及びその方法
CN111950293A (zh) * 2020-06-24 2020-11-17 北京百度网讯科技有限公司 语义表示模型的生成方法、装置、电子设备及存储介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9617791B2 (en) 2013-03-14 2017-04-11 Smith International, Inc. Sidetracking system and related methods
CN104809417A (zh) * 2014-01-29 2015-07-29 北京三星通信技术研究有限公司 在显示屏上进行信息屏蔽的方法、装置及设备
US10754970B2 (en) * 2017-01-27 2020-08-25 International Business Machines Corporation Data masking
US10671753B2 (en) 2017-03-23 2020-06-02 Microsoft Technology Licensing, Llc Sensitive data loss protection for structured user content viewed in user applications
US10380355B2 (en) 2017-03-23 2019-08-13 Microsoft Technology Licensing, Llc Obfuscation of user content in structured user data files
US10410014B2 (en) 2017-03-23 2019-09-10 Microsoft Technology Licensing, Llc Configurable annotations for privacy-sensitive user content
TWI641958B (zh) * 2017-05-05 2018-11-21 兆豐國際商業銀行股份有限公司 報表管理伺服器及報表管理方法
US11308236B2 (en) 2020-08-12 2022-04-19 Kyndryl, Inc. Managing obfuscation of regulated sensitive data

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0695583A (ja) * 1992-09-09 1994-04-08 Brother Ind Ltd 学習支援装置
JPH08329053A (ja) * 1995-05-30 1996-12-13 Casio Comput Co Ltd 自動文書作成装置
JPH1185742A (ja) * 1997-09-11 1999-03-30 Toshiba Corp 情報処理装置、文書編集方法、及び記録媒体
JP2002007420A (ja) * 2000-06-26 2002-01-11 Casio Comput Co Ltd 電子辞書装置およびそのプログラム記録媒体
JP2002041012A (ja) * 2000-07-19 2002-02-08 Nyuuton:Kk 電子学習機及び電子学習機における文章問題の解答方法
JP2003029612A (ja) * 2001-07-13 2003-01-31 Kaiteki Soft:Kk 学習システム
JP2006331329A (ja) * 2005-05-30 2006-12-07 Oki Electric Ind Co Ltd 言語処理装置、言語処理方法、言語処理プログラム及び記録媒体
JP2007172404A (ja) * 2005-12-22 2007-07-05 Internatl Business Mach Corp <Ibm> 文字列処理方法、装置、およびプログラム
US20080239365A1 (en) * 2007-03-26 2008-10-02 Xerox Corporation Masking of text in document reproduction
JP2009086203A (ja) * 2007-09-28 2009-04-23 Adc Technology Kk 学習システム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5038316A (en) 1988-08-22 1991-08-06 James D. Hempleman Method for generating user documentation for an application program by executing commands associated with different aspects of the application program in response to analysis of the application program
JP2002207725A (ja) 2001-01-10 2002-07-26 Planet Computer:Kk 電子文書に対する隠蔽処理装置
JP3638145B2 (ja) 2001-09-28 2005-04-13 伊吉子 斉藤 穴埋め問題作成装置、穴埋め問題作成用のコンピュータプログラム及びそのプログラムを記録した記録媒体
US20040117501A1 (en) * 2002-12-12 2004-06-17 International Business Machines Corporation Apparatus and method for correction of textual information based on locale of the recipient
JP2005309829A (ja) 2003-06-13 2005-11-04 Canon Inc 文書管理装置および文書管理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体および文書管理プログラム
US7536635B2 (en) * 2005-04-25 2009-05-19 Microsoft Corporation Enabling users to redact portions of a document
US8584005B1 (en) * 2006-06-28 2013-11-12 Adobe Systems Incorporated Previewing redaction content in a document
US7724918B2 (en) * 2006-11-22 2010-05-25 International Business Machines Corporation Data obfuscation of text data using entity detection and replacement
US8219374B1 (en) * 2007-02-21 2012-07-10 University Of Central Florida Research Foundation, Inc. Symbolic switch/linear circuit simulator systems and methods
US20090019048A1 (en) * 2007-07-12 2009-01-15 Pendergast Brian S Document lock manager
US8500450B1 (en) * 2007-07-17 2013-08-06 Taylor Associates/Communications, Inc. Computer-implemented method of improving reading skills
US20110239113A1 (en) * 2010-03-25 2011-09-29 Colin Hung Systems and methods for redacting sensitive data entries

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0695583A (ja) * 1992-09-09 1994-04-08 Brother Ind Ltd 学習支援装置
JPH08329053A (ja) * 1995-05-30 1996-12-13 Casio Comput Co Ltd 自動文書作成装置
JPH1185742A (ja) * 1997-09-11 1999-03-30 Toshiba Corp 情報処理装置、文書編集方法、及び記録媒体
JP2002007420A (ja) * 2000-06-26 2002-01-11 Casio Comput Co Ltd 電子辞書装置およびそのプログラム記録媒体
JP2002041012A (ja) * 2000-07-19 2002-02-08 Nyuuton:Kk 電子学習機及び電子学習機における文章問題の解答方法
JP2003029612A (ja) * 2001-07-13 2003-01-31 Kaiteki Soft:Kk 学習システム
JP2006331329A (ja) * 2005-05-30 2006-12-07 Oki Electric Ind Co Ltd 言語処理装置、言語処理方法、言語処理プログラム及び記録媒体
JP2007172404A (ja) * 2005-12-22 2007-07-05 Internatl Business Mach Corp <Ibm> 文字列処理方法、装置、およびプログラム
US20080239365A1 (en) * 2007-03-26 2008-10-02 Xerox Corporation Masking of text in document reproduction
JP2009086203A (ja) * 2007-09-28 2009-04-23 Adc Technology Kk 学習システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016038903A (ja) * 2014-08-07 2016-03-22 莊新宏 試験問題生成システム及びその方法
CN111950293A (zh) * 2020-06-24 2020-11-17 北京百度网讯科技有限公司 语义表示模型的生成方法、装置、电子设备及存储介质
CN111950293B (zh) * 2020-06-24 2023-06-23 北京百度网讯科技有限公司 语义表示模型的生成方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
US20120278709A1 (en) 2012-11-01
CN102467489A (zh) 2012-05-23
CN102467489B (zh) 2015-04-22
JP5827467B2 (ja) 2015-12-02
US9378649B2 (en) 2016-06-28

Similar Documents

Publication Publication Date Title
JP5827467B2 (ja) 電子文書中の部分テキストデータをマスクする方法、装置、サーバ及びコンピュータプログラム
JP4776626B2 (ja) フォントサービス提供方法及びこの方法を実行するシステム
JP6535974B1 (ja) 法律文書作成支援システム、法律文書作成支援方法及びプログラム
JP2012216193A (ja) デジタルブック提供システム
CN102750081A (zh) 信息处理设备、信息处理方法和程序
JP6670051B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6194878B2 (ja) 授業管理システム、授業管理装置、その制御方法、及びプログラム
JP2009093389A (ja) 情報処理装置、情報処理方法、およびプログラム
JP2023057113A (ja) 情報処理装置、学習装置、情報処理方法、学習情報の生産方法、およびプログラム
KR20150095160A (ko) 다양한 형태의 카드를 이용하여 사이트의 제작을 지원하는 사이트 관리 방법 및 시스템
JP5468660B2 (ja) 情報管理システム及び入力支援プログラム
JP2017102779A (ja) 管理情報の印刷方法
WO2018066502A1 (ja) コンテンツ管理システム
JP2021039624A (ja) 情報処理装置および情報処理システム
JP6828287B2 (ja) 情報処理装置及び情報処理プログラム
JP5015907B2 (ja) 地図検索サーバ、地図検索システム及び地図検索方法
JP7300406B2 (ja) 情報処理装置、情報処理方法、およびプログラム
US20100083130A1 (en) Computer product, content providing apparatus, and content providing method
CN103218984A (zh) 阅读器单元、服务器单元、显示控制方法及数字漫画编辑方法
Bellido Patents In Miniature: The Effects of Microfilm as an Information Technology, 1938–68
WO2016129118A1 (ja) プレゼンテーション支援方法、プレゼンテーション支援プログラム及びプレゼンテーション支援装置
Raposo et al. Advances in Design, Music and Arts II: 8th International Meeting of Research in Music, Arts and Design, EIMAD 2022, July 7–9, 2022
JP2016004394A (ja) 情報処理装置、その制御方法、及びプログラム
JP2009003496A (ja) 帳票データ変換装置
JP2007293655A (ja) 文書処理装置、電子文書の出力処理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140715

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140716

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141014

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141118

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20150407

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150407

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150731

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20150807

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151016

R150 Certificate of patent or registration of utility model

Ref document number: 5827467

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees