JP6194180B2 - 文章マスク装置及び文章マスクプログラム - Google Patents

文章マスク装置及び文章マスクプログラム Download PDF

Info

Publication number
JP6194180B2
JP6194180B2 JP2013059480A JP2013059480A JP6194180B2 JP 6194180 B2 JP6194180 B2 JP 6194180B2 JP 2013059480 A JP2013059480 A JP 2013059480A JP 2013059480 A JP2013059480 A JP 2013059480A JP 6194180 B2 JP6194180 B2 JP 6194180B2
Authority
JP
Japan
Prior art keywords
text
character string
mask
confidential
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013059480A
Other languages
English (en)
Other versions
JP2014186425A (ja
Inventor
裕三 峯本
裕三 峯本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Information Network Corp
Original Assignee
Mitsubishi Electric Information Network Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Information Network Corp filed Critical Mitsubishi Electric Information Network Corp
Priority to JP2013059480A priority Critical patent/JP6194180B2/ja
Publication of JP2014186425A publication Critical patent/JP2014186425A/ja
Application granted granted Critical
Publication of JP6194180B2 publication Critical patent/JP6194180B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Description

この発明は、文章データに存在する機密文字列を検出してマスキングする文章マスク装置及び文章マスクプログラムに関する。
下記の特許文献1、2は「キーワードに一致したデータに対するマスキング技術」に相当する技術である。従来は、膨大な量の機密情報のキーワードを事前に準備する必要があり(特許文献1)、また、作成した文書に対して機密部分と公開する部分を予め分けておく必要があった(特許文献2)。
特許公開2010−108072号公報 特許公開2010−231802号公報
この発明は、事前に機密文字列を登録するだけでマスキングすることが可能な文章マスク装置の提供を目的とする。
この発明の文章マスク装置は、
電子文章を読み込む電子文章読込部と、
マスキングすべき複数の異なる文字列が定義されたマスク文字列情報を格納するマスク文字列情報格納部と、
前記電子文章読込部が読み込んだ前記電子文章に前記マスク文字列情報に定義された複数の特定の文字列が存在するかどうかを探索し、前記複数の特定の文字列を発見したときに、前記電子文章に存在する前記複数の特定の文字列をマスキングするマスク処理部と
を備えたことを特徴とする。
この発明により、事前に機密文字列を登録するだけでマスキングすることが可能な文章マスク装置を提供できる。
実施の形態1の文章マスク装置1000のブロック図。 実施の形態1の機密文字列情報120A−1を示す図。 実施の形態1の文章マスク装置1000の動作を示すフローチャート。 実施の形態1の機密文章マッチング部150の動作を示す図。 実施の形態1の機密文章マッチング部150の動作を示す別の図。 実施の形態2のアドレス帳120B等を示す図。 実施の形態3の文章マスク装置1000のハードウェア構成を示す図。
実施の形態1.
図1〜図5を参照して実施の形態1を説明する。図1は、文章マスク装置1000のブロック図である。文章マスク装置1000は、操作部110、機密文章記憶部120(マスク文字列情報格納部)、電子ファイル読取部130(電子文章読込部)、文章データ記憶部140、機密文章マッチング部150、機密文章マスキング部160、電子ファイル書込部170を備える。
(1)操作部110は、マスキング対象となる機密文字列(後述の機密文字列情報120A−1の機密文字列)の入力や、処理対象の電子ファイル10を入力する。なお、図1に示すように、入力する処理対象の電子ファイルを「電子ファイル10」と記載し、文章マスク装置1000によって処理された電子ファイル、つまり文章マスク装置1000が「電子ファイル10」を処理して機密文字列がマスクされた後の「電子ファイル10」を「電子ファイル10a」と記載して区別する。
(2)機密文章記憶部120は、操作部110から入力された単語または文節からなる機密文字列を記憶する。
(3)電子ファイル読取部130は、操作部110から入力された処理対象の電子ファイル10を開き、文章データ(電子文章)を読み出す。
(4)文章データ記憶部140は、電子ファイル読取部130で読み出した文章データを記憶する。
(5)機密文章マッチング部150は、文章データ記憶部140に記憶されている文章データと、機密文章記憶部120に記憶されている機密文字列(図2の機密文字列情報120A−1の機密文字列)との比較を行う。
(6)機密文章マスキング部160は、文章データ記憶部140に記録された文章データを、機密文章マッチング部150のマッチング結果に基づきマスキングデータで上書きする。なお、機密文章マッチング部150と機密文章マスキング部160とは、マスク処理部180を構成する。
(7)電子ファイル書込部170は、文章データ記憶部140に記録されている文章データで電子ファイル10の内容を更新して電子ファイル10aとして保存する。
(動作)
図2は、操作部110から入力された機密文字列を用いて生成された機密文字列情報120A−1(マスク文字列情報)を示す図である。機密文字列は、単語または分節単位で、操作部110から入力する。「種別」は、その機密文字列が単語か分節かを示す。機密文字列情報120A−1は、機密文章記憶部120に格納される。機密文字列情報120A−1は、操作部110(機密文字列情報生成部)が生成しても良いし、機密文章記憶部120(機密文字列情報生成部)が生成してもよい。
次に動作について説明する。
図3は、文章マスク装置1000の動作を示すフローチャートである。図3のフローチャートに従って説明する。操作部110から処理対象の電子ファイル10を指定することにより処理が開始する。まず電子ファイル読取部130が文章データ記憶部140を初期化する。その後、電子ファイル読取部130が、処理対象の電子ファイル10から読み出した文章データを文章データ記憶部140に入力する(ST1)。
(マッチング処理)
次に、機密文章マッチング部150は、文章データ記憶部140の文章データと、機密文章記憶部120の機密文字列情報120A−1の機密文字列とを比較(マッチング)する(ST2)。
(タイプ1のマッチング方式)
機密文章マッチング部150は、タイプ1のマッチング方式として、以下の様なマッチング処理を行う。
図4は、タイプ1のマッチング方式を説明する図である。機密文章マッチング部150は、文章データ記憶部140の文章データに、機密文字列情報120A−1に定義された文字列のうち、例えば特定の文字列である「AAA」と、特定の文字列である「BBB」との両方が存在する場合にのみ、特定文字列「AAA」と特定文字列「BBB」とをマスキングするというマスキング設定がされている。この設定、つまり、存在すべき複数の特定文字列の設定と、その存在のAND条件の設定とは、操作部110から機密文章マッチング部150に対して行う。この設定がされている場合機密文章マッチング部150は、これら複数の特定文字列が存在するかどうか文章データを探索する。図4(a)の場合には、処理対象の文章データには特定文字列「AAA」しか存在しないので、機密文章マスキング部160は特定文字列「AAA」をマスキングしない。一方、図4(b)の場合には、処理対象の文章データには特定文字列「AAA」と特定文字列「BBB」とが存在する(AND条件の成立)。このため、機密文章マッチング部150が探索により特定文字列「AAA」と特定文字列「BBB」との存在を発見すると、機密文章マスキング部160が特定文字列「AAA」、特定文字列「BBB」をマスキングする。
(タイプ2のマッチング方式)
機密文章マッチング部150が行うマッチング処理は、以下のタイプ2のマッチング方式でもよい。タイプ2のマッチング方式は、処理対象の文章データの特定の範囲毎に、タイプ1として説明したマッチング方式の処理を実行する内容である。
図5はタイプ2のマッチング方式を説明する図である。機密文章マッチング部150は、タイプ2のマッチング方式として、以下の様なマッチング処理を行ってもよい。図4の場合と同様に特定文字列は「AAA」と「BBB」とする。機密文章マッチング部150は、文章データの設定探索範囲ごとに、特定文字列「AAA」、特定文字列「BBB」との両方が存在するかどうかを探索する。設定探索範囲は操作部110によって機密文章マッチング部150に対して設定することができる。例えば、処理対象となる文章データのページ毎でもよいし、改行からきまる段落毎でもよいし、句読点を基準としてもよいし、あるいは特定の行数毎でもよい。図5の場合は、文章データが1ページ20行で設定されており、1ページに対して設定探索範囲が、5行ごとに設定された場合を示す。図5の場合には、1行目〜5行目の第1範囲101と、6行目〜10行目の第2範囲102とには特定文字列「AAA」しか存在しない。このため機密文章マスキング部160は、第1範囲101、第2範囲102をマスキングしない。また11行目〜15行目の第3範囲103には特定文字列「BBB」しか存在しないので、機密文章マスキング部160は第3範囲103をマスキングしない。
一方、16行目〜20行目の第4範囲104には特定文字列の「AAA」と「BBB」が存在する。このため、機密文章マッチング部150が探索の結果これを発見すると、機密文章マスキング部160が第4範囲104の特定文字列である「AAA」及び「BBB」をマスキングする。
以上の様にマッチングに該当があれば(ST3−YES)、機密文章マッチング部150はマッチング処理を中断し、機密文章マスキング部160が、文章データ記憶部140のマッチング該当部分の文章データを、マスキングデータで上書きし、その後再び、機密文章マッチング部150が、マッチング処理を再開する(ST4)。
マッチングに該当がなければ(ST3−NO)、操作部110で指定した電子ファイル10の内容を文章データ記憶部の文章データで更新して電子ファイル10aとして保存(ST5)し、動作を完了する。
以上のように、機密文章マッチング部150は、上記タイプ1あるいは上記タイプ2のマッチング方式によって特定文字列(機密文字列)を探索するので、氏名と住所などのように、互いに関連する文字列を効率的にマスキングすることができる。
実施の形態2.
図6を用いて実施の形態2を説明する。実施の形態2は、実施の形態1の文章マスク装置1000を、「受信アドレス」に対して電子メールによって送信しようとする送信前の電子文章に適用する場合を説明する。
図6は、機密文章記憶部120(マスク文字列情報格納部、アドレス対応情報格納部、機密等級対応情報格納部)が格納するアドレス帳120B(アドレス対応情報)、機密等級対応情報120C及び機密文字列情報120A−2(マスク文字列情報)を示す。アドレス帳120Bは、電子メールのアドレスと、「職位、氏名」(これらはアドレスの属性である)とが対応付けられている。アドレス帳120Bの各行が、そのアドレスに関するアドレス対応情報である。機密等級対応情報120Cは、職位(属性)と機密等級とが、職位ごとに対応付けられている。機密等級対応情報120Cの各行が職位毎の機密等級対応情報である。また実施の形態2では、機密文字列情報120A−2が、機密文字列ごとに機密等級が対応付けられている。
(タイプ3のマッチング方式)
機密文章マッチング部150は、実施の形態3において、タイプ3のマッチング方式として、以下のマッチング処理を行う。まず操作部110は、文章データ(電子文章)として、電子メールで送信される送信前の文章データであって、送信アドレスと受信アドレスとの少なくともいずれかが決定された電子メールの文章データを読み込む。ここで「送信アドレス」とは電子メールを送信する送信側のアドレスであり、「受信アドレス」とは電子メールを受信する受信側のアドレスをいう。機密文章マッチング部150は、アドレス帳120Bと、機密等級対応情報120Cと、機密文字列情報120A−2とに基づいてマスキングするべき機密等級に応じた機密文字列を文章データの中から探索する。機密文章マスキング部160は、機密文章マッチング部150が機密文字列を発見すると、その機密文字列をマスキングする。
以下、具体的に説明する。機密文章マッチング部150には、電子メールに対して「受信アドレス」の場合にマッチング処理をすべきことが設定されているとする。この設定は操作部110から行う。機密文章マッチング部150は、文章データに受信アドレスが決定されている場合、アドレス帳120Bを参照する。この場合、決定済の受信アドレスは「123@ABC」とする。機密文章マッチング部150は、アドレス帳120Bから「123@ABC」の行を特定し、この行の職位(属性)が「部長」であることを検出する。次に機密文章マッチング部150は機密等級対応情報120Cを参照し、職位「部長」の機密等級が「1」であることを知る。次に機密文章マッチング部150は、機密文字列情報120A−2を参照し、機密等級が「1」に対応する機密文字列が「ABC」及び「DEF」であることを検知し、実施の形態1で述べたタイプ1のマッチング方式、あるいはタイプ2のマッチング方式によってマッチング処理を行う。
なお、この実施の形態2では、タイプ1のマッチング方式、あるいはタイプ2のマッチング方式で説明したような特定文字「AAA」と特定文字「BBB」とのANDマッチングでなくても構わない。例えば図6の文章データの送信アドレスが「456@DEF」の場合は、機密文章マッチング部150によって職位「課長」を介して機密等級対応情報120Cから機密等級「2」が特定され、機密等級「2」を介して機密文字列情報120A−2から機密文字列「abc」が特定される。機密文章マッチング部150は文章データから機密文字列「abc」を探索し発見した場合、機密文章マスキング部160が機密文字列「abc」をマスキングする構成でもよい。
また以上の実施の形態2ではメールアドレスが受信アドレスに適用される設定を説明したが、送信アドレスに適用される設定、あるいは送信アドレスと受信アドレスとの両方に適用される設定でも構わない。
以上の実施の形態2の文章マスク装置1000によれば、電子メールで送信する電子文章を作成したときに、電子メールの受信者あるいは送信者の属性に応じて、効率よく電子文章をマスキングできる。
実施の形態3.
図7を参して実施の形態3を説明する。実施の形態3は、コンピュータである文章マスク装置1000のハードウェア構成を述べる。
図7は、文章マスク装置1000のハードウェア資源の一例を示す図である。ハードウェア資源を示す図7において、文章マスク装置1000は、プログラムを実行するCPU810(Central Processing Unit)を備えている。CPU810は、バス825を介してROM(Read Only Memory)811、RAM(Random Access Memory)812、表示装置813、キーボード814、マウス815、通信ボード816、CDD(Compact Disk Drive)818、磁気ディスク装置820と接続され、これらのハードウェアデバイスを制御する。
磁気ディスク装置820には、オペレーティングシステム821(OS)、プログラム群823、ファイル群824が記憶されている。プログラム群823のプログラムは、CPU810、オペレーティングシステム821により実行される。
上記プログラム群823には、以上の実施の形態の説明において「〜部」として説明した機能を実行するプログラムが記憶されている。プログラムは、CPU810により読み出され実行される。
ファイル群824には、データや信号値や変数値やパラメータなどが、「〜ファイル」や「〜データベース」の各項目として記憶されている。
また、以上の実施の形態の説明において「〜部」として説明したものは「〜手段」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち「〜部」として説明したものは、ソフトウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせで実施されても構わない。
以上の実施の形態では、文章マスク装置1000を説明したが文章マスク装置1000の動作はコンピュータを文章マスク装置1000として機能させるためのプログラムとしても把握できることは以上の説明から当然である。また、文章マスク装置1000の各「〜部」の動作はマスク方法としても把握できることは以上の説明により明らかである。
10,10a 電子ファイル、110 操作部、120 機密文章記憶部、120A−1,120A−2 機密文字列情報、120B アドレス帳、120C 機密等級対応情報、130 電子ファイル読取部、140 文章データ記憶部、150 機密文章マッチング部、160 機密文章マスキング部、170 電子ファイル書込部、1000 文章マスク装置。

Claims (3)

  1. 電子文章を読み込む電子文章読込部と、
    マスキングすべき複数の異なる文字列が定義されたマスク文字列情報を格納するマスク文字列情報格納部と、
    前記電子文章読込部が読み込んだ前記電子文章に前記マスク文字列情報に定義された複数の特定の文字列が存在するかどうかを探索し、前記複数の特定の文字列を発見したときに、前記電子文章に存在する前記複数の特定の文字列をマスキングするマスク処理部と、
    電子メールのアドレスと、前記アドレスの属性とが対応づけられたアドレス対応情報を前記アドレスごとに複数格納するアドレス対応情報格納部と、
    前記属性と機密等級とが対応付けられた機密等級対応情報を属性ごとに格納する機密等級対応情報格納部と
    を備え、
    前記マスク文字列情報格納部が格納する前記マスク文字列情報は、
    前記文字列ごとに前記機密等級が対応付けられており、
    前記電子文章読込部は、
    前記電子文章として、電子メールで送信される送信前の電子文章であって前記電子メールを送信する送信側の送信アドレスと前記電子メールを受信する受信側の受信アドレスとの少なくともいずれかが決定された電子メール文章を読み込み、
    前記マスク処理部は、
    前記電子メール文章の前記送信アドレスと前記受信アドレスとのいずれかに対応付けられた前記属性を前記アドレス対応情報から検出し、検出した前記属性に対応付けられた前記機密等級を前記機密等級対応情報から検出し、検出した機密等級に対応付けられた互いに異なる前記文字列を前記マスク文字列情報から検出し、検出した互いに異なる前記文字列を前記電子メール文章から探索し、探索によって互いに異なる前記文字列を発見した場合には、発見した互いに異なる前記文字列をすべてマスキングすることを特徴とする文章マスク装置。
  2. 前記マスク処理部は、
    前記電子文章の設定された設定探索範囲ごとに、互いに異なる前記文字列が存在するかどうかを探索し、前記設定探索範囲に、互いに異なる前記文字列を発見した場合には、前記設定探索範囲に存在する互いに異なる前記文字列をすべてマスキングすることを特徴とする請求項1記載の文章マスク装置。
  3. コンピュータが実行することにより、請求項1または請求項2に記載の文章マスク装置として上記コンピュータを機能させるための文章マスクプログラム。
JP2013059480A 2013-03-22 2013-03-22 文章マスク装置及び文章マスクプログラム Expired - Fee Related JP6194180B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013059480A JP6194180B2 (ja) 2013-03-22 2013-03-22 文章マスク装置及び文章マスクプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013059480A JP6194180B2 (ja) 2013-03-22 2013-03-22 文章マスク装置及び文章マスクプログラム

Publications (2)

Publication Number Publication Date
JP2014186425A JP2014186425A (ja) 2014-10-02
JP6194180B2 true JP6194180B2 (ja) 2017-09-06

Family

ID=51833970

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013059480A Expired - Fee Related JP6194180B2 (ja) 2013-03-22 2013-03-22 文章マスク装置及び文章マスクプログラム

Country Status (1)

Country Link
JP (1) JP6194180B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6531373B2 (ja) * 2014-10-31 2019-06-19 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理装置の制御方法、プログラム
JP6930203B2 (ja) * 2016-07-22 2021-09-01 株式会社リコー 情報処理装置、情報処理システム、システム、情報処理方法およびプログラム
JP7229821B2 (ja) * 2019-03-15 2023-02-28 エヌ・ティ・ティ・コミュニケーションズ株式会社 情報処理装置、情報処理方法およびプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3961760B2 (ja) * 2000-11-07 2007-08-22 沖電気工業株式会社 電子メール装置
JP2002312362A (ja) * 2001-04-18 2002-10-25 Nippon Telegr & Teleph Corp <Ntt> 文書公開方法、文書閲覧システム、そのプログラム及び記録媒体
JP2005259015A (ja) * 2004-03-15 2005-09-22 Ricoh Co Ltd 文書開示装置、文書開示システム、プログラム及び記憶媒体
JP2007067619A (ja) * 2005-08-30 2007-03-15 Canon Inc データ送信装置およびデータ送信方法およびプログラム
JP2010287245A (ja) * 2010-07-21 2010-12-24 Sky Co Ltd 電子メールシステム
JP5773137B2 (ja) * 2011-03-30 2015-09-02 日本電気株式会社 文書印刷システム
JP5731361B2 (ja) * 2011-11-25 2015-06-10 日本電信電話株式会社 文字列変換方法及び文字列変換プログラム
JP5676522B2 (ja) * 2012-05-22 2015-02-25 日本電信電話株式会社 文字列変換方法及びプログラム

Also Published As

Publication number Publication date
JP2014186425A (ja) 2014-10-02

Similar Documents

Publication Publication Date Title
JP5460887B2 (ja) 分類ルール生成装置及び分類ルール生成プログラム
EP3370183B1 (en) Characterizing malware files for similarity searching
US20180211041A1 (en) Detection of Malware Using Feature Hashing
US20150081824A1 (en) Forgotten Attachment Detection
CN109983464B (zh) 检测恶意脚本
US20160171106A1 (en) Webpage content storage and review
CN106921682A (zh) 文件上传方法和装置
JP6194180B2 (ja) 文章マスク装置及び文章マスクプログラム
US20120331562A1 (en) Method, apparatus and computer program for supporting determination on degree of confidentiality of document
JP5687312B2 (ja) デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム
CN105354506B (zh) 隐藏文件的方法和装置
JP5287099B2 (ja) 検索装置、情報処理装置、検索方法、プログラム及び記録媒体
US10331902B2 (en) Data loss prevention
JP5162215B2 (ja) データ処理装置、データ処理方法、および、プログラム
JP2009199385A (ja) 情報管理装置
US20130246455A1 (en) Document management apparatus, non-transitory computer readable medium, and document management method
JP2018206189A (ja) 情報収集装置、および、情報収集方法
US11899698B2 (en) Wordbreak algorithm with offset mapping
US11356853B1 (en) Detection of malicious mobile apps
JP5585686B2 (ja) 検索装置、検索方法及び検索プログラム
WO2022201309A1 (ja) 情報補完装置、情報補完方法、及びコンピュータ読み取り可能な記録媒体
US20230098812A1 (en) Improving network security through real-time analysis of character similarities
US10943056B1 (en) System and method for identifying location of content within an electronic document
JP2009301511A (ja) 索引情報作成装置、索引情報作成方法及びプログラム
WO2022265744A1 (en) Smart browser history search

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160826

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160906

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170307

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170814

R150 Certificate of patent or registration of utility model

Ref document number: 6194180

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees