JP3961760B2 - E-mail device - Google Patents

E-mail device Download PDF

Info

Publication number
JP3961760B2
JP3961760B2 JP2000339369A JP2000339369A JP3961760B2 JP 3961760 B2 JP3961760 B2 JP 3961760B2 JP 2000339369 A JP2000339369 A JP 2000339369A JP 2000339369 A JP2000339369 A JP 2000339369A JP 3961760 B2 JP3961760 B2 JP 3961760B2
Authority
JP
Japan
Prior art keywords
mask
message
electronic document
mask processing
confidential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000339369A
Other languages
Japanese (ja)
Other versions
JP2002149638A (en
Inventor
宏行 大沼
佳孝 濱口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000339369A priority Critical patent/JP3961760B2/en
Publication of JP2002149638A publication Critical patent/JP2002149638A/en
Application granted granted Critical
Publication of JP3961760B2 publication Critical patent/JP3961760B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、編集したメッセージを転送する電子メール装置に関する。
【0002】
【従来の技術】
電子メールサービスを利用するための機能が実装された携帯電話等の可搬性に優れた携帯端末の普及により、企業等の構内の電子メールサーバあるいは端末装置等に届いたメッセージを、外出先で受信したり、携帯端末宛に転送したりすることが多くなっている。
【0003】
また、パーソナルコンピュータ(PC)等の汎用の情報処理装置で実行される電子メールの送受信のためのソフトウェア(メーラ)には、メッセージの内容が読取られないようにメッセージ(特に本文)を暗号化して伝送するための暗号化/復号化機能を有しているものがある。このような機能を有するメーラ間では、送信側では暗号化したメッセージを送信し、受信側では受信したメッセージを復号化して内容を復元する。これにより、伝送される際にメッセージが他者に見られた場合であっても、メッセージの内容が漏洩する可能性を低減させることができるようになっている。
【0004】
【発明が解決しようとする課題】
しかしながら、上述のような携帯端末は、軽量化,低消費電力化等の要請からデータ容量,表示能力等が制限されていることが多く、例えば送受信できるメッセージの文字数が制限されていたり,暗号化/復号化機能が実装されていない場合がある。このため、送信側のメーラがメッセージを暗号化して送信しても、受信側の携帯端末において当該メッセージを復号化することができない場合がある。
【0005】
このような暗号化/復号化機能が実装されていない携帯端末宛には、暗号化していないメッセージを伝送することになるため、伝送経路にインタネット等のネットワークを用いている場合には、他者に伝送中のメッセージが受信されてしまう場合があり、メッセージの内容が漏洩してしまう可能性がある。
【0006】
また、携帯端末の操作環境によっては、電子メールのメッセージ等の電子文書の表示が周囲の者に覗き見られてしまう可能性もある。例えば混雑環境下では、携帯端末の表示部を周囲の者の視界から隔離させた状態で操作することが困難な場合もある。さらに、小型軽量であるが故に携帯端末を紛失し易く、紛失した携帯端末を取得した者にメッセージの内容を見られてしまう可能性もある。
【0007】
本発明は、上述の課題に鑑みてなされたものであり、電子メールのメッセージ,テキスト形式のファイル等の電子文書の内容が漏洩する可能性の低減に寄与することができる電子メール装置を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明は、転送すべきメッセージに関するアドレス情報に応じて、該メッセージにマスク処理を行うか否かを判定するマスク判定手段と、前記メッセージ中の予め設定されているマスク処理範囲に対してマスク処理を実行するマスク処理手段と、前記マスク判定手段がマスク処理を行わないと判定した場合には、前記転送すべきメッセージを前記アドレス情報によって指定されるアドレスに転送し、前記マスク判定手段がマスク処理を行うと判定した場合には、前記マスク処理手段によってマスク処理されたメッセージを前記アドレス情報によって指定されるアドレスに転送する転送手段とを備える電子メール装置において、前記マスク判定手段は、転送すべきメッセージ中の差出人アドレスと宛先アドレスのドメイン名が同一であり、かつ、宛先アドレスと該宛先アドレスに対して予め設定された転送先アドレスのドメイン名が同一でない場合にマスク処理を行うと判定することを特徴とする。
また、他の発明は、転送すべきメッセージに関するアドレス情報に応じて、該メッセージにマスク処理を行うか否かを判定するマスク判定手段と、前記メッセージ中の予め設定されているマスク処理範囲に対してマスク処理を実行するマスク処理手段と、前記マスク判定手段がマスク処理を行わないと判定した場合には、前記転送すべきメッセージを前記アドレス情報によって指定されるアドレスに転送し、前記マスク判定手段がマスク処理を行うと判定した場合には、前記マスク処理手段によってマスク処理されたメッセージを前記アドレス情報によって指定されるアドレスに転送する転送手段とを備える電子メール装置において、イントラネット内の全ての内部ドメイン名を登録する内部ドメイン記憶手段を有し、前記マスク判定手段は、転送すべきメッセージ中の差出人アドレスと宛先アドレスのドメイン名が前記内部ドメイン記憶手段に記憶されており、かつ、宛先アドレスに対して予め設定された転送先アドレスのドメイン名が前記内部ドメイン記憶手段に記憶されていない場合にマスク処理を行うと判定することを特徴とする。
【0009】
【発明の実施の形態】
図1は、本発明の第1の実施形態に係る電子文書編集装置の構成を示すブロック図である。この電子文書編集装置は、例えば電子メールとして送信するメッセージ等の電子文書(文字情報を含むデータ)の編集を行うために使用され、同図中に示すように、電子メールを送信するための電子メールサーバ(例えばSMTP[Simple Mail Transfer Protocol]サーバ)あるいはユーザからの指示等に応じて供給される電子文書中のマスク処理を行う範囲(マスク処理範囲)を決定するマスク処理範囲決定部1と、決定されたマスク処理範囲に対してマスク処理を実行するマスク処理部2と、マスク処理された電子文書を例えば電子メールサーバあるいは所定ディレクトリ等に出力する出力部3とを備えている。
【0010】
マスク処理範囲決定部1は、外部から供給された電子文書の種類に応じてマスク処理を行うマスク処理範囲を決定する。すなわち、このマスク処理範囲決定部1は、外部から電子文書が供給されると、電子文書の種類を判定する。
【0011】
電子メールのメッセージには、メッセージのデータの先頭に、宛先アドレス[To:フィールドの記載To:aaa@bb#.ccc],タイトル[Subject:フィールドの記載Subject:abt....]等のヘッダ情報が付加されている。このため、電子メールのメッセージであるか否かの判定はこのヘッダ情報の有無によって行うことができる。
【0012】
また、供給された電子文書が電子メールのメッセージ以外である場合には、例えばファイルの拡張子によって電子文書の種類を判定する。ある種のオペレーティングシステム(OS)においては、電子文書のファイル名に、当該ファイルのデータ形式に対応する拡張子が付加されていることがある。例えば内部のデータが文字コードの羅列となっている標準的なテキスト形式(標準テキスト形式)には、拡張子“.txt”が割り当てられている。このため、このような拡張子を用いている場合には、電子文書のファイルのファイル名の拡張子によって電子文書の種類を判定するための要素の1つであるデータの形式を判断することができる。
【0013】
標準テキスト形式と同様な内部のデータ構造を有する形式として、他に、例えば電子メールのメッセージ形式(拡張子“.eml”に対応),HTML形式,CSV形式等がある。これらの形式である場合には、標準テキスト形式と同様な手順で当該電子文書のファイルにアクセスすることができる。このため、この電子文書編集装置では、例えば拡張子“.txt”に対応する標準テキスト形式,拡張子“.html”に対応するHTML形式,拡張子“.csv”に対応するCSV形式(カンマ“,”,改行で区切られた表を表すデータ形式の1つ)等も一括して単に“テキスト形式”として取り扱う。なお、テキスト形式以外のファイルについては、別途ファイル形式に応じたマスク処理を定義しておくか、マスク処理を行わないようにする。
【0014】
電子文書の種類を判定すると、マスク処理範囲決定部1は、電子文書の種類に応じてマスク処理範囲を決定する。このために、予め電子文書の種類毎にマスク処理範囲を決定するための規則を設定しておき、これらの規則のいずれかを上述のように検出した電子文書の種類に応じて選択し、選択した規則に従ってマスク処理範囲を決定する。
【0015】
例えば電子文書の種類が電子メールのメッセージである場合には、上述のヘッダ情報中のタイトル[Subject:フィールドの記載Subject:abt....],差出人アドレス[From:フィールドの記載From:xxx@yy#.zzz],宛先アドレス[To:フィールドの記載To:aaa@bb#.ccc]と、電子メールの本文をマスク処理範囲とし、残りのヘッダ情報等はマスク処理範囲としない。また、テキスト形式の場合には、(電子文書の一部としてもいいが、)例えば全ての範囲をマスク処理範囲とする。
【0016】
マスク処理範囲決定部1によってマスク処理範囲が決定されると、マスク処理部2は、外部から供給された電子文書のマスク処理範囲から機密部分を抽出し、抽出した機密部分に対してマスク処理を実行する。機密部分は、例えば場所名,製品名,会社名,氏名等の固有名詞、金額,日時,個数,単位等の部分である。
【0017】
このマスク処理部2は、例えばマスク処理範囲決定部1によって決定されたマスク処理範囲内の機密を保持する必要のある機密部分(機密部分以外でもいい)を抽出するマスク箇所抽出部20と、抽出された機密部分の置換処理を行う置換処理部21と、機密部分となる固有名詞を登録した固有名詞辞書部22と、この固有名詞辞書部22によって抽出された固有名詞を統合化するための規則(統合規則)を記憶する統合規則記憶部23と、固有名詞以外の機密部分を抽出するための規則を記憶する抽出規則記憶部24とを備えている。
【0018】
マスク箇所抽出部20における機密部分の抽出の内、固有名詞の抽出は、例えば情報通信学会技術報告「固有名詞抽出における日本語と英語の比較」, NLC98-21, pp.45-52, 1998に示されている方法によって行う。
【0019】
この方法では、まず、電子文書を構成する文字列を文字種によって分割し、平仮名,句読点以外の文字で2つ以上連続するものを抽出し、抽出された文字から固有名詞辞書部22に格納された固有名詞に該当するものを抽出する。固有名詞辞書部22には、図2に示すように、固有名詞がその種類毎に分類されて格納されている。このように固有名詞を抽出すると、マスク箇所抽出部20は、固有名詞の前後にいわゆるSGMLタグ(“<”,“>”で挟まれた文字列)を付加する。
【0020】
マスク箇所抽出部20は、上述のようにSGMLタグの付加によって固有名詞を抽出すると、抽出した固有名詞を統合規則によって統合化する。統合規則記憶部23には、図3に示すように、このための規則(統合規則)が格納されている。
【0021】
また、固有名詞以外の他の機密部分,例えば金額,日時等の抽出は、例えば予め登録しておいた規則と電子文書を比較するパターンマッチングによって行う。このため、抽出規則記憶部24には、図4に示すように、金額,日時等を抽出するための規則(抽出規則)が格納されている。
【0022】
上述のようにマスク箇所(機密部分)が抽出されると、置換処理部21は、機密部分を所定のキャラクタ,例えばアスタリスク“**”で置換する。このように機密部分がマスクされた電子文書は、出力部3により、例えば電子メールサーバあるいは所定ディレクトリ等に出力される。
【0023】
以下、上述のように構成された電子文書編集装置の詳細な動作を説明する。
外部から電子文書が供給されると、図5中のステップS100からの処理が開始され、このステップS100において、マスク処理範囲決定部1は、供給された電子文書が電子メールのメッセージであるか否かを判断すべく、電子文書の先頭にヘッダ情報があるか否かを確認する。ヘッダ情報がある場合には電子メールのメッセージであるとしてステップS120に進み、ヘッダ情報がない場合には電子メールのメッセージではないとしてステップS110に進む。
【0024】
ステップS110において、マスク処理範囲決定部1は、供給された電子文書のファイル名に付加されている拡張子が、テキスト形式として取り扱う上述の“.txt”,“.csv”,“.html”等であるか否かを確認し、これらの拡張子でない場合には、当該電子文書編集装置で編集できない種類の電子文書であるとして処理を終了する。これに対し、供給された電子文書のファイル名に付加されている拡張子が上述の拡張子のいずれかである場合には、電子文書の種類がテキスト形式であるとして、ステップS150に進み、電子文書全体をマスク処理範囲としてステップS160に進む。
【0025】
一方、ステップS120以降の処理では、まず、ステップS120においてヘッダ情報中の差出人アドレス(From:フィールド)をマスク処理範囲とし、次に、続くステップS130において宛先アドレス(To:フィールド)をマスク処理範囲とし、さらにステップS140において,タイトル(Subject:フィールド)及びメッセージの本文をマスク処理範囲としてステップS160に進む。
【0026】
なお、ステップS120、S130おいて各々差出人アドレス,宛先アドレスをマスク処理しておき、後(工程)のマスク処理におけるマスク処理範囲は、タイトルとメッセージ本文のみとしてもよい。また、これらのステップにおけるアドレスのマスク処理は、例えばアドレス中のドメイン名の所属組織を示す部分、例えばアドレスが“xxx@h$gehog#.co.jp”である場合には、ドメイン名の第3レベル以上の部分“h$gehog#”、アドレスが“xxx@%ogeho&e.com”である場合には、ドメイン名の第2レベル以上の部分“%ogeho&e”を、所定の文字,例えば“**”等で置換することによって行う。このように、ドメイン名の所属組織を示す部分のアドレスをマスクすれば、残りのドメイン名“co.jp”あるいは“.com”では差出人等の所属組織を特定することができなくなる。
【0027】
ステップS160では、マスク処理範囲全体について処理が終了したか否かを判定し、終了していなければ以下のステップS170〜ステップS190の処理を繰り返し、終了していればステップS200に進む。
【0028】
ステップS170では、マスク箇所抽出部20は、電子文書のマスク処理範囲からマスク対象の文字列を抽出する。上述のマスク処理部2中の固有名詞辞書部22には、図2に示すように、上述の固有名詞を抽出するために、固有名詞のカテゴリ別にリスト名と当該カテゴリ内の固有名詞が対応付けられて登録されている。マスク箇所抽出部20は、電子文書中の単語を固有名詞辞書部22に登録されている固有名詞と比較し、一致する単語をリスト名を含むタグ(“<”,“>”で囲まれた文字[この場合はリスト名])で囲む。
【0029】
これにより、例えば図6(A)中に示す単語“ABC電気株式会社”が組織名リスト(on),組織修飾語リスト(onm),組織名接辞リスト(os)に対応するタグ<on>,</on>、<onm>,</onm>、<os>,</os>、で囲まれ、同図(B)に示すように“<on>ABC</on><onm>電気</onm><os>株式会社</os>”に変換される。また、例えば図6(A)中に示す単語“河田様”が人名リスト(pn),人名接辞リスト(ps)に対応するタグ<pn>,</pn>、<ps>,</ps>、で囲まれ、同図(B)に示すように“<pn>河田</pn><ps>様</ps>”に変換される。
【0030】
また、抽出規則記憶部24には、上述の図4に示すように、固有名詞以外の機密部分である金額,日時等をパターンマッチングによって抽出するための条件が規定されている。例えば左辺の条件を満たす単語が、右辺で定義された形式に変換される。具体的には、例えば左辺で定義された数値と文字“円”が連続する単語は、右辺で定義された形式に変換され、数値が右辺第1項で定義されたタグ<金額>,</金額>で囲まれ、右辺第2項で定義された文字“円”が付加される。これにより、例えば図4中の規則(1)に従って、図6(A)の電子メールのメッセージ中の単語“5,000,000円”中の数値部分“5,000,000”がタグ<金額>,</金額>で囲まれ、同図(B)に示すように“<金額>5,000,000</金額>円”に変換される。
【0031】
続く、ステップS180では、ステップS170で抽出された各文字列を上述の統合規則に従って統合する。統合規則記憶部23には、上述の図3に示すように、抽出された各固有名詞を統合化するための統合規則が記録されている。この統合規則により、同図中の左辺のリスト名に対応する複数の固有名詞(例えばリスト名onに対応する組織名リストとリスト名onmに対応する組織修飾語リスト)が右辺の1つの固有名詞(リスト名onに対応する組織名リスト)に変換される。
【0032】
これにより、例えば図6(B)中の機密部分“<on>ABC</on><onm>電気</onm><os>株式会社</os>”は、図3中の統合規則(7)によって一旦、“<on>ABC電気</on><os>株式会社</os>”に変換された後、同図中の統合規則(3)によって“<on>ABC電気株式会社</on>”に変換され、さらに同図中の統合規則(9)によって、図6(C)に示すように“<o>ABC電気株式会社</o>”に変換される。また、例えば図6(B)中の機密部分“<pn>河田</pn><ps>様</ps>”は、図3中の統合規則(2)によって同図(C)に示す“<p>河田</p><ps>様</ps>”に変換される。このような機密部分の統合を行うことにより、関連のある一連の単語を1つの機密部分として処理することができ、後のステップにおいて、単語の用法に応じた適切なマスク処理を行うことが容易になる。
【0033】
さらに、ステップS190では、機密部分をマスクする。上述のように、機密部分がタグで囲まれると、置換処理部21は、タグ及びタグで囲まれた部分からなる機密部分の文字を所定の文字,例えばアスタリスク“**”で置換し、ステップS160に戻る。この際、機密部分の内、上述の図2に示す接辞リスト(例えば人名接辞リスト,組織名接辞リスト,地名接辞リスト等)中に例として挙げられた文字列は機密を保持する必要がないと考えられるため、これらと一致した文字列に対しては置換を行わない。置換処理部21は、例えばパターンマッチング等によって機密部分の文字列と接辞リスト中の例とを比較して文字を置換する部分を選択する。これにより、例えば図6(C)に示す機密部分“<o>ABC電気株式会社</o>”の組織名接辞リスト中の例“株式会社”以外の部分が文字“**”で置換され、図6(D)に示すように“**株式会社”に変換される。また、図6(C)中の機密部分“<p>河田</p><ps>様</ps>”中の人名接辞リスト中の例“様”以外の部分が文字“**”で置換され、図6(D)に示すように“**様”に変換される。また、図6(C)中の機密部分“<p>山田太郎</p>”が文字“**”で置換され、図6(D)に示すように“**”に変換される。また、図6(C)中の文字列“<金額>5,000,000</金額>円”は、機密部分の“<金額>5,000,000</金額>”のみが文字“**”で置換され、図6(D)に示すように“**円”に変換される。
【0034】
以上のステップS170〜ステップS190までの処理を繰り返し、全ての機密部分についてのマスク処理が終了すると、ステップS160からステップS200に進み、このステップS200において出力部3がマスク処理された電子文書を(例えばメッセージを送信するためのSMTPサーバ,メッセージを表示等するメーラ,あるいは所定のディレクトリに)出力し、処理を終了する。
【0035】
このように電子文書中の機密部分をマスクすることにより、他人は電子文書の内容を理解することができなくなるが、本人であれば、業務知識,マスクされていないヘッダ情報等に基づいて、電子文書のおおまかな内容を理解することができる。
【0036】
以上説明したように、この実施形態の電子文書編集装置では、供給された電子文書の種類を判定し、電子文書の種類に応じてマスク処理を行うマスク処理範囲を決定し、供給された電子文書中のマスク処理範囲に対して、マスク処理を行って出力することにより、マスク処理範囲として機密部分の条件等を設定しておけば機密部分をマスクすることができ、例えば電子メール等の電子文書の内容が漏洩する可能性の低減に寄与することができる。
【0037】
なお、上述の説明では、携帯端末等に送信/転送する電子メールのメッセージに対して予めマスク処理を実行する場合について説明したが、携帯端末側のデータサイズ上の制限が比較的緩く、セキュリティの確保だけを目的とする場合には、携帯端末側に電子メールのメッセージのマスク処理を行う手段を設けてもよく、携帯端末側に受信したメッセージの原文を表示させずにマスク処理後のメッセージのみを表示するように構成しておけば、受信したメッセージの内容の漏洩の可能性の低減には充分である場合もある。さらに、受信したメッセージを速やかにマスク処理し、原文を消去するように構成すれば、メッセージの内容の漏洩の可能性をさらに低減させることができる。また、このように携帯端末側にマスク処理を行う手段を設けることにより、送信側の装置では、通常のSMTPサーバ等の既存の装置をそのまま利用できる利点がある。
【0038】
さらに、携帯端末側の処理能力に余裕がある場合には、復号化手段を実装しておき、携帯端末側で暗号化された受信メッセージを復号化した後,マスク処理を行って表示するようにしてもよい。これにより、メッセージの伝送時の漏洩の可能性をも低減させることができる。
【0039】
また、上述の説明では、マスク処理範囲を示すための情報としてタグを用いた例を示したが、マスク処理範囲を認識できれば、例えばタグの代わりに所定の制御コードを挿入したり、電子文書のデータ中のマスク処理範囲を示す位置情報として示す等、適宜変更することができる。
【0040】
その他、▲1▼マスク処理態様は、機密部分を文字“**”で置換する処理に限られず、▲2▼電子メールのメッセージのマスク処理範囲,マスク処理態様は、メッセージの種類毎に設定しておいてもよく、▲3▼電子文書の種類がテキスト文書の場合に、拡張子,あるいは内容毎にマスク処理範囲,マスク処理態様を設定しておいてもよい。
【0041】
図7は、本発明の第2の実施形態に係る電子文書編集装置の構成を示すブロック図である。この電子文書編集装置は、上述の図1に示す第1の実施形態の電子文書編集装置と同様に、マスク処理範囲決定部1,マスク処理部102及び出力部3とを備えている。
【0042】
上述の第1の実施形態の電子文書編集装置では、機密部分を全て所定の文字列で置換していたが、機密の保持の点では優れているものの、電子文書の本来の利用者が、内容を(特定できる程度に)理解し難い場合も考えられる。このため、この実施形態の電子文書編集装置では、機密部分の固有名詞を頭文字(イニシャル)に変換し、他の部分を上述の第1の実施形態と同様に所定の文字に変換する。
【0043】
このために、この実施形態では、図7に示すように、マスク処理部102に、図1中のマスク処理部2の構成に加えて、マスク箇所抽出部20によって抽出された機密部分の読みを決定して置換処理部21に供給する読み決定部25と、この読み決定部25が読みを決定するために参照する読み情報を記憶する読み情報記憶部26とを備えている。
【0044】
読み情報記憶部26には、例えば図8に示すように、固有名詞の文字列とこの文字列の読み(ローマ字表記)が対応付けられて記憶されている。読み決定部25は、上述のマスク箇所抽出部20によって抽出された固有名詞の読みを、読み情報記憶部26を参照して決定し、この読みによって固有名詞のイニシャルを決定する。また、置換処理部21は、上述の第1の実施形態と同様に、機密範囲の文字を所定の文字に変換するが、この際、機密範囲中の固有名詞はイニシャルを示すアルファベットに変換する。
【0045】
上述のような置換処理を行うために、マスク処理部102の置換処理部21は、以下のような処理を実行する。
まず、図9に示す処理において、上述の図5に示すフローチャート中のステップS100からステップS180,ステップS200と同一の処理を実行するが、ステップS190の処理に代えて図9に示すステップS300〜ステップS330に示す処理を実行する。
【0046】
上述の図5に示すフローチャートにおける動作と同様に、ステップS180までの処理によって、機密部分がタグで囲まれた文字として抽出されると、図9中のステップS300において、読み決定部25は、マスク箇所抽出部20によって抽出された機密部分が固有名詞かどうか判定し、固有名詞でなければステップS330に進み、抽出された機密部分の文字を上述のステップS190と同様に所定の文字(キャラクタ),例えば文字“**”で置換してステップS160に戻る。
【0047】
一方、抽出された機密部分が固有名詞であれば、ステップS310に進み、読み決定部25は、機密部分すなわちタグで囲まれた文字列に対応する読みを読み情報記憶部26から取得して当該機密部分の読みを決定し、続くステップS320に進む。なお、機密部分そのものの読みが読み情報記憶部26に記憶されていない場合には、読み決定部25は、機密部分の最初の文字の読みを取得する。例えば図10(A)に示す電子文書から抽出された機密部分“<p>山田太郎</p>”そのものの読みは読み情報記憶部26に記憶されていないが、“山”の読みは記憶されているため、この機密部分の読みを“Yama”とする。
【0048】
ステップS320において、置換処理部21は、機密部分を、上述のように決定した読みのイニシャルに置換して、ステップS160に戻る。これにより、上述のように読み“Yamata・・・”が決定された機密部分“<p>山田太郎</p>”は、図10(B)に示すように文字“Y”に置換される。また、図10(A)中の“ABC電気”,“河田”,“商品Aサーバ”,“商品Bサーバ”,“山田建設”は、同様に各々文字“A”,“K”,“S”,“S”,“Y”に置換される。
【0049】
以上のステップS170〜ステップS180,ステップS300〜ステップS330までの処理を繰り返し、全ての機密部分についてのマスク処理が終了すると、上述の図5における処理と同様に、ステップS160からステップS200に進み、このステップS200において出力部3がマスク処理された電子文書を出力し、処理を終了する。
【0050】
以上説明したように、この実施形態の電子文書編集装置では、機密部分の固有名詞の全てを所定の文字(キャラクタ)で置換する代わりに、当該固有名詞のイニシャルで置換することにより、電子文書の本来の利用者による機密部分の内容の推測をより容易にすることができる。
【0051】
本発明の第3の実施形態に係る電子文書編集装置は、上述の図1に示す第1の実施形態の電子文書編集装置と同様に、マスク処理範囲決定部1,マスク処理部2及び出力部3とを備えている。
【0052】
上述の第1の実施形態の電子文書編集装置では、機密部分を全て一定数の文字,例えば2文字の“**”で置換していたが、例えば機密部分が金額等の数値である場合には、桁数程度は把握したい場合がある。このため、この実施形態では、抽出した機密部分の文字数と同数の文字で、機密部分を置換する。例えば機密部分が“2000円”である場合には、文字列“2000”を、この文字列の文字数である4つの文字で置換する。このような置換を行うことにより、金額等の数値の桁数を容易に把握することができるようになる。
【0053】
上述のような置換処理を行うために、マスク処理部2の置換処理部21は、以下のような処理を実行する。
まず、図11に示す処理において、上述の図5に示すフローチャート中のステップS100からステップS180,ステップS200と同一の処理を実行するが、ステップS190の処理に代えて図11に示すステップS400及びステップS410に示す処理を実行する。
【0054】
上述の図5に示すフローチャートにおける動作と同様に、ステップS180までの処理によって、機密部分がタグで囲まれた文字として抽出されると、図11中のステップS400において、置換処理部21は、当該機密部分の文字数をカウントし、続くステップS410に進む。この際、置換処理部21は、金額,個数等に含まれる“,(コンマ)”は文字数としてカウントしない。また、置換処理部21は、上述の接辞リスト中の例と一致した文字列も文字数としてカウントしない。このように機密部分の文字数をカウントすると置換処理部21は、続くステップS410において、機密部分をこの文字数分の所定の文字,例えば“*”で置換する。この際、上述のステップS190と同様に、接辞リスト(例えば人名接辞リスト,組織名接辞リスト,地名接辞リスト等)中に例として挙げられた文字列に対しては置換を行わない。また、文字数分の同一の文字“*”で置換する代わりにランダムに選択した記号によって置換するようにしてもよい。これにより、7文字分の機密部分が、例えば“!#$%&@¥”に変換される。
【0055】
これにより、例えば図12(A)中の機密部分“ABC電気株式会社”の置換を行う文字数は、同図(B)に示すように“ABC電気”の5文字であり、置換処理部21は、この部分を同図(C)に示すように5文字分の“*”で置換する。また、図12(A)中の機密部分“5,000,000円”の置換を行う文字数は、同図(B)に示すように“5000000”の7文字であり、置換処理部21は、この部分を同図(C)に示すように7文字分の“*”で置換する。
【0056】
以上のステップS170〜ステップS180,ステップS400〜ステップS410までの処理を繰り返し、全ての機密部分についてのマスク処理が終了すると、上述の図5における処理と同様に、ステップS160からステップS200に進み、このステップS200において出力部3がマスク処理された電子文書を出力し、処理を終了する。
【0057】
以上説明したように、この実施形態の電子文書編集装置では、抽出した機密部分の文字数と同数の文字で、機密部分を置換することにより、金額等の数値の桁数を容易に把握することができ、機密部分の内容の推測を容易に行うことができる。
【0058】
図13は、本発明の第4の実施形態に係る電子文書編集装置の構成を示すブロック図である。この電子文書編集装置は、上述の図1に示す第1の実施形態の電子文書編集装置と同様に、マスク処理範囲決定部1,マスク処理部112及び出力部3とを備えている。
【0059】
上述の各実施形態の電子文書編集装置では、機密部分の全てを同一の文字,例えば“*”で置換していたが、全ての項目を同一の文字でマスクしてしまっては、機密部分の項目を把握し難い結果、機密部分の憶測が困難になる場合がある。このため、この実施形態では、抽出した機密部分の項目に応じた異なる文字で機密部分を置換する。
【0060】
このために、この実施形態では、図13に示すように、マスク処理部112に、機密部分の種類に応じた文字(マスク記号)を保持するマスク記号記憶部27を備えている。このマスク記号記憶部27には、図14に示すように、機密部分の種類とこれに対応するマスク記号が記憶されており、置換処理部21は、このマスク記号記憶部27を参照し、マスク箇所抽出部20によって抽出された機密部分の種類毎に、置換を行うためのマスク記号を取得し、取得したマスク記号によって置換を行う。
【0061】
上述のような置換処理を行うために、マスク処理部112の置換処理部21は、以下のような処理を実行する。
まず、図15に示す処理において、上述の図5に示すフローチャート中のステップS100からステップS180,ステップS200と同一の処理を実行するが、ステップS190の処理に代えて図15に示すステップS500及びステップS510に示す処理を実行する。
【0062】
上述の図5に示すフローチャートにおける動作と同様に、ステップS180までの処理によって、機密部分がタグで囲まれた文字として抽出されると、図15中のステップS500において、置換処理部21は、タグの種類によって機密部分の種類を判定し、この判定結果に応じてマスク記号記憶部27を参照し、機密部分の種類に対応するマスク記号を取得する。続くステップS510において、置換処理部21は、取得したマスク記号により、上述のステップS190と同様に機密部分の置換を実行する。ここで、マスク記号記憶部27に機密部分の種類に対応するマスク記号が記憶されていない場合には、置換処理部21は当該機密部分の置換を行わない。また、置換処理部21は、上述のステップS190と同様に、接辞リスト(例えば人名接辞リスト,組織名接辞リスト,地名接辞リスト等)中に例として挙げられた文字列に対しては置換を行わない。
【0063】
これにより、例えば図16(A)中の機密部分“ABC電気株式会社”中の“ABC電気”が、同図(B)に示すように組織名を示す“*”に置換され、当該機密部分が“**株式会社”に変換される。また、図16(A)中の機密部分“5,000,000円”中の“5,000,000”が、同図(B)に示すように金額を示す“(星印)(星印)”に置換され、当該機密部分が“(星印)(星印)円”に変換される。このように置換された機密部分を見ることにより、電子文書の利用者は、機密部分の各項目の種類を容易に認識することができる。
【0064】
以上のステップS170〜ステップS180,ステップS500,ステップS510までの処理を繰り返し、全ての機密部分についてのマスク処理が終了すると、上述の図5における処理と同様に、ステップS160からステップS200に進み、このステップS200において出力部3がマスク処理された電子文書を出力し、処理を終了する。
【0065】
以上説明したように、この実施形態の電子文書編集装置では、抽出した機密部分の種類毎に置換を行うための文字を異なる文字として機密部分を置換することにより、機密部分の種類を容易に認識することができ、機密部分の内容の憶測を容易にすることができる。
【0066】
本発明の第5の実施形態に係る電子文書編集装置は、上述の図1に示す第1の実施形態の電子文書編集装置と同様に、マスク処理範囲決定部1,マスク処理部102及び出力部3とを備えている。
【0067】
上述の第3の実施形態の電子文書編集装置では、機密部分の全てを当該機密部分と同じ文字数の所定文字,例えば“*”で置換していたが、完全にマスクしてしまっては、機密部分の内容を憶測することが困難である。このため、この実施形態では、抽出した機密部分の一部の文字のみを置換する。この置換を行う文字の選択は、例えば各文字を所定の文字で置換するか否かをランダムに決定し、置換を行うこととした文字に対して置換を行うようにする。
【0068】
上述のような置換処理を行うために、マスク処理部2の置換処理部21は、以下のような処理を実行する。
まず、図17に示す処理において、上述の図5に示すフローチャート中のステップS100からステップS180,ステップS200と同一の処理を実行するが、ステップS190の処理に代えて図17に示すステップS600及びステップS610に示す処理を実行する。
【0069】
上述の図5に示すフローチャートにおける動作と同様に、ステップS180までの処理によって、機密部分がタグで囲まれた文字として抽出されると、図17中のステップS600において、置換処理部21は、抽出された機密部分の各文字について、置換するか否かをランダムに決定し、置換を行うこととした文字に対して続くステップS610において所定の文字に置換する。
【0070】
これにより、例えば図18(A)中の機密部分“山田建設”が、同図(B)に示すように“山**設”に置換される。なお、この例は、置換確率を50%とした場合の置換例を示している。このように置換されていない文字により機密部分内容の憶測をすることが容易になる。
【0071】
以上のステップS170〜ステップS180,ステップS600,ステップS610までの処理を繰り返し、全ての機密部分についてのマスク処理が終了すると、上述の図5における処理と同様に、ステップS160からステップS200に進み、このステップS200において出力部3がマスク処理された電子文書を出力し、処理を終了する。
【0072】
以上説明したように、この実施形態の電子文書編集装置では、機密部分の各文字をランダムに置換することにより、置換されていない文字により機密部分内容の憶測をすることが容易になる。
【0073】
図19は、本発明の第6の実施形態に係る電子文書編集装置の構成を示すブロック図である。この電子文書編集装置は、上述の図1に示す第1の実施形態の電子文書編集装置と同様に、マスク処理範囲決定部1,マスク処理部122及び出力部3とを備えている。
【0074】
上述の第3の実施形態の電子文書編集装置では、機密部分の全てを当該機密部分と同じ文字数の所定文字,例えば“*”で置換していたが、全ての機密部分について同一の文字でマスクしてしまっては、機密部分の内容を憶測することが困難である。このため、この実施形態では、抽出した機密部分内の固有名詞の内、同一の文字列については同一のマスク文字列に置換する。さらに、この実施形態では、機密部分の種類を知ることができるように、マスク文字列を機密部分の種類を示す文字等とする。例えば機密部分中に複数の人名,例えば“山田さん”,“田中さん”が存在した場合に、各々を識別できるように、“山田さん”を“人名1”に置換し、“田中さん”を“人名2”に置換する。
【0075】
このために、この実施形態では、図19に示すように、マスク処理部122に、機密部分の内容と置換すべき文字列の対応を一時的に記憶する置換情報一時記憶部28を備えている。この置換情報一時記憶部28には、図20に示すように、マスク箇所抽出部20によって抽出された機密部分の内容と当該機密部分の種類及び置換すべき文字列が対応付けられて記憶されている。なお、同じ文字列を認識するだけであれば、必ずしも機密部分の種類を示す文字としなくてもよく、例えば同じ文字列毎に固有の文字列としてもよい。なお、この置換情報一時記憶部28の内容は、処理単位の電子文書毎にクリアされ、置換処理前は何もデータを持たず、置換処理中に置換した固有名詞の、置換前と置換後の文字列を一時的に記憶し、同一の電子文書内で既に置換した文字列と同じ文字列が新たに抽出されたときに、同じ文字列に置換するために使用される。
【0076】
上述のような置換処理を行うために、マスク処理部122の置換処理部21は、以下のような処理を実行する。
まず、図21に示す処理において、上述の図5に示すフローチャート中のステップS100からステップS180,ステップS200と同一の処理を実行するが、ステップS190の処理に代えて図21に示すステップS700〜ステップS730に示す処理を実行する。
【0077】
上述の図5に示すフローチャートにおける動作と同様に、ステップS180までの処理によって、機密部分がタグで囲まれた文字として抽出されると、図21中のステップS700において、置換処理部21は、抽出された機密部分内の文字列が置換情報一時記憶部28に記憶されているか否かを検出し、記憶されていなければ、続くステップS710に進み、抽出した機密部分を当該部分の種類を示す文字,例えば“人名”と当該種類内の個々の機密部分を示す番号(連番)を示す文字,例えば“1”で置換する。この際、連番は、置換情報一時記憶部28に、登録されていない最小の数字とする。そして、続くステップS720において、当該置換した文字列を置換情報一時記憶部28に登録し、ステップS160に戻る。
【0078】
一方、ステップS700において、抽出された機密部分内の文字列が置換情報一時記憶部28に記憶されていればステップS730に進み、置換情報一時記憶部28に記憶されている文字列で置換してステップS160に戻る。
【0079】
これにより、抽出された機密部分の固有名詞が、その種類及び種類内の番号を示す文字に置換される。例えば図22(A)中の▲1▼の“ABC電気株式会社”は、当該文書中の最初の組織名であるとして、同図(B)に示すように、“[組織名1]株式会社”に置換され、置換情報一時記憶部28に[組織名1]として登録される。また、図22(A)中の▲2▼の“ABC電気”を処理する際には、当該文字列が、既に[組織名1]として置換情報一時記憶部28に登録されているため、同図(B)に示すように、当該文字列は“[組織名1]”に置換される。さらに、図22(A)中の▲3▼の“山田建設株式会社”を処理する際には、当該文字列が置換情報一時記憶部28に登録されておらず、既に[組織名1]が置換情報一時記憶部28に登録されているため、同図(B)に示すように、当該文字列が“[組織名2]株式会社”に置換される。また、図22(A)中の“河田様”は、当該文書中の最初の人名であるとして、同図(B)に示すように、“[人名1]様”に置換される。
【0080】
以上のステップS170〜ステップS180,ステップS700〜ステップS730までの処理を繰り返し、全ての機密部分についてのマスク処理が終了すると、上述の図5における処理と同様に、ステップS160からステップS200に進み、このステップS200において出力部3がマスク処理された電子文書を出力し、処理を終了する。
【0081】
以上説明したように、この実施形態の電子文書編集装置では、抽出した機密部分の、同じ固有名詞を同じ文字列に置換することにより、同一のマスク文字列に対応するマスク前の文字列が同じであったことを知ることができる。また、同じ固有名詞を、当該固有名詞の種類に対応した,例えば当該種類を示す文字列に置換することにより、マスクされた固有名詞の種類を知ることができる。これにより、機密部分の内容の推測をより容易にすることができる。
【0082】
図23は、本発明の第7の実施形態に係る電子文書編集装置の構成を示すブロック図である。この電子文書編集装置は、上述の図19に示す第6の実施形態の電子文書編集装置と同様に、マスク処理範囲決定部1,マスク処理部132及び出力部3とを備えている。
【0083】
上述の第6の実施形態の電子文書編集装置では、機密部分の同一の文字列に対して同一のマスク文字列に置換し、さらに、機密部分の種類の認識を容易にするために、マスク文字列を機密部分の種類を示す文字列としていたが、これだけではマスク前の文字列を類推することが困難な場合もあった。このため、この実施形態では、電子文書にマスク文字列から機密部分の内容を連想するために役立ちそうな文字列(連想情報)を付加している。
【0084】
このために、この実施形態では、図19の構成に加えて、マスク処理部132に、機密部分の内容と連想情報とを対応付けて記憶する連想情報記憶部29を設けている。この連想情報記憶部29には、図24に示すように、マスク箇所抽出部20によって抽出された機密部分の内容と当該機密部分の種類及び連想情報が対応付けられて記憶されている。例えば“ABC電気”に対しては、種類組織名(o)及び連想情報“わが社を表す。”が対応付けられており、“山田建設”に対しては、種類組織名(o)及び連想情報“取引先の建設会社である。”が対応付けられている。
【0085】
上述のような置換処理を行うために、マスク処理部132の置換処理部21は、上述の図21と同様な処理を実行する。
この際、図21中のステップS720において、機密部分の新たな文字列を置換情報一時記憶部28に登録した後、連想情報記憶部29を参照し、置換情報一時記憶部28に登録した機密部分の文字列に対応する連想情報が登録されていれば、これを取得し、マスク処理後の電子文書の文末に、機密部分の文字列に対応するマスク文字列と取得した連想情報を対応させて付加する。なお、ステップS710とステップS720の間に、同様の処理を実行するステップを設けてもよい。
【0086】
このような処理を行って、上述の図21中のステップS170〜ステップS180,ステップS700〜ステップS730までの処理を繰り返し、全ての機密部分についてのマスク処理が終了すると、図25(A)に示す電子文書は、同図(B)に示すように、上述の第6の実施形態と同様に、同じ固有名詞が同じマスク文字列で置換され、さらに、文末に、マスク文字列に対応する連想情報が付加された電子文書に変換される。なお、文末に連想情報を付加する代わりに、別のファイルとしてもよく、あるいは、例えば電子メールのメッセージを編集する場合では、他のメッセージあるいは当該メッセージの添付ファイルとしてもよい。
【0087】
以上説明したように、この実施形態の電子文書編集装置では、上述の第6の実施形態の効果に加え、マスク文字列に対応する連想情報により、置換前の機密部分の内容の推測をより容易に行うことができる。
【0088】
図26は、本発明の第8の実施形態に係る電子文書編集装置の構成を示すブロック図である。この電子文書編集装置は、上述の図1に示す第1の実施形態の電子文書編集装置と同様に、マスク処理範囲決定部1,マスク処理部142及び出力部3とを備えている。
【0089】
上述の第7の実施形態の電子文書編集装置では、機密部分の同一の文字列に対して同一のマスク文字列に置換し、さらに、機密部分の種類の認識を容易にするために、マスク文字列を機密部分の種類を示す文字列とし、さらに、マスク文字列から機密部分の内容を連想するために役立ちそうな連想情報を付加していた。
【0090】
この連想情報として、内部の者には知られている(あるいは内部の者には周知である)が外部の者には知られていない,例えば事業所内等の内部でのニックネーム,商品等の内部コード等を用いることができる場合には、これらのニックネーム,内部コード等をマスク文字列としても用いることができる。また、内部の者に知られているニックネーム,内部コード等をマスク文字列として用いれば、上述の第7の実施形態のように、文末にマスク文字列と連想情報との対応関係を示さなくても、マスク文字列に対応する機密部分の内容を(容易に)推測することができる。
【0091】
このため、この電子文書編集装置は、上述の第1の実施形態の電子文書編集装置の構成に加えて、マスク処理部142に、機密部分の内容を連想するために役立ちそうな文字列(連想情報)を記憶する連想情報記憶部29を設けている。この連想情報記憶部29には、上述の図24とは異なり、マスク文字列としても用いられる上述のニックネーム,内部コード等が機密部分の内容,機密部分の種類に対応する連想情報として記憶されている。この連想情報は、各固有名詞毎に設定しておいてもよく、例えば図27に示すように、組織名であれば“ABC電気”に対応する連想情報“A電気”のようにイニシャルとしても、“山田建設”に対応する連想情報“山建”のように略称としてもよい。また、例えば商品名であれば“商品Aサーバ”に対応する“SV1995”のように内部コードとすることができる。
【0092】
上述のような置換処理を行うために、マスク処理部142の置換処理部21は、上述の図5と同様な処理を実行する。
図5中のステップS180までの処理を実行し、マスク箇所抽出部20によって機密部分が抽出されると、マスク処理部142の置換処理部21は、ステップS190において、上述の処理の代わりに抽出された機密部分に対応する連想情報が連想情報記憶部29に記憶されているか否かを判定し、記憶されていれば当該連想情報を取得し、取得した連想情報によって機密部分の文字列を置換してステップS160に戻る。また、機密部分に対応する連想情報が連想情報記憶部29に記憶されていなければ、機密部分を文字列“**”で置換してステップS160に戻る。
【0093】
これにより、例えば図28(A)中の機密部分“ABC電気”は連想情報記憶部29中に記憶されているため、同図(B)に示すように、当該機密部分に対応する連想情報“A電気”に変換される。同様に、図28(A)中の機密部分“商品Aサーバ”,“商品Bサーバ”,“山田建設”は連想情報記憶部29中に記憶されているため、同図(B)に示すように、各々対応する連想情報“SV1995”,“SV1997”,“山建”に変換される。また、図28(A)中の機密部分“河田様”は連想情報記憶部29中に記憶されていないため、固有名詞部分が文字“**”によって置換され、同図(B)に示すように、“**様”に変換される。
【0094】
このような処理を行って、上述の図5中のステップS170〜ステップS190までの処理を繰り返し、全ての機密部分についてのマスク処理が終了すると、ステップS160からステップS200に進み、このステップS200において出力部3がマスク処理された電子文書を出力し、処理を終了する。
【0095】
以上説明したように、この実施形態の電子文書編集装置では、機密部分を内部の者に知られているニックネーム,内部コードによるマスク文字列で置換することにより、置換前の機密部分の内容の推測をより容易に行うことができる。さらに、第7の実施形態のように、別途マスク文字列と連想情報とを対応付けてマスク処理後の電子文書に付加する必要がないため、電子文書のデータサイズの増加を抑制することができる。
【0096】
本発明の第9の実施形態に係る電子文書編集装置は、上述の図7に示す第2の実施形態の電子文書編集装置と同様に、マスク処理範囲決定部1,マスク処理部102及び出力部3とを備えている。
【0097】
上述の第2の実施形態の電子文書編集装置では、機密部分の固有名詞をイニシャルに置換していたが、イニシャルだけでは、機密部分の内容の推測が容易でない場合もある。
【0098】
このため、この実施形態では、上述の第2の実施形態と同様に機密部分の固有名詞の読みを決定した後、この読みを示すローマ字の一部(例えば子音)の文字列で、当該機密部分を置換する。このために、置換処理部21は、読み決定部25が決定した機密部分の固有名詞の読みから母音を取り除いたマスク文字列を生成し、このマスク文字列で当該機密部分を置換する。
【0099】
上述のような置換処理を行うために、マスク処理部102の置換処理部21は、以下のような処理を実行する。
まず、図29に示す処理において、上述の図5に示すフローチャート中のステップS100からステップS180,ステップS200と同一の処理を実行するが、ステップS190の処理に代えて図29に示すステップS300及びステップS800〜ステップS860に示す処理を実行する。
【0100】
上述の図5に示すフローチャートにおける動作と同様に、ステップS180までの処理によって、機密部分がタグで囲まれた文字として抽出されると、図29中のステップS300において、読み決定部25は、マスク箇所抽出部20によって抽出された機密部分が固有名詞かどうか判定し、固有名詞でなければステップS330に進み、抽出された機密部分の文字を上述のステップS190と同様に所定の文字(キャラクタ),例えば文字“**”で置換してステップS160に戻る。
【0101】
一方、抽出された機密部分が固有名詞であれば、ステップS800に進み、読み決定部25は、処理単位である上述のタグで区切られた1つの機密部分内の全ての部分について処理が終了したか否かを判定し、終了していなければ続くステップS810〜ステップS830までの処理を実行し、終了していればステップS840に進む。
【0102】
ステップS810において、読み決定部25は、タグで区切られた機密部分の文字列と完全に一致する文字列が読み情報記憶部26に登録されているか否かを判定し、登録されていればステップS830に進み、完全に一致する文字列の読みを読み情報記憶部26から取得し、ステップS800に戻る。例えば図30に示す機密部分“<on>ABC</on><onm>電気</onm>”内の文字列“電気”は、読み情報記憶部26に登録されているため、これに対応する読み“DeNKi”を取得する。一方、完全に一致する文字列が登録されていなければステップS820に進み、読み決定部25は、機密部分の個々の文字毎に読みを取得し、ステップS800に戻る。例えば図30に示す機密部分“<pn>河田</pn>”内の文字列“河田”は読み情報記憶部26には登録されていないので、個々の文字“河”,“田”毎に読み“KaWa”,“Ta”を取得し、“KaWa+Ta”とする。この際、例えば図30中の機密部分“<on>ABC</on><onm>電気</onm>”内の文字列“ABC”等のアルファベットについては読みを取得せず、アルファベット表記をそのまま読みと同様に取り扱う。
【0103】
ステップS800〜ステップS830までの処理によって1つの機密部分内の全ての文字について読みが求められると、ステップS800からステップS840に進み、このステップS840において、電子文書中で隣接する機密部分の読みを結合する。例えば機密部分“<on>ABC</on><onm>電気</onm>”の読み“ABC”,“DeNKi”は“ABCDeNKi”とされる。続くステップS850において、結合した読みから母音を削除する。これにより、読み“ABCDeNKi”は、“ABCDNK”とされる。また、例えば上述の文字列“河田”の読み“KaWaTa”は“KWT”とされる。このように母音を消去した文字列を求めると、続くステップS860に進み、当該求めた文字列で、機密部分を置換し、ステップS160に戻る。
【0104】
以上のステップS170〜ステップS180,ステップS800〜ステップS860までの処理を繰り返し、全ての機密部分についてのマスク処理が終了すると、上述の図5における処理と同様に、ステップS160からステップS200に進み、このステップS200において出力部3がマスク処理された電子文書を出力し、処理を終了する。これにより、例えば図31(A)に示す機密部分の文字列“ABC電気株式会社”,“河田様”は、同図(B)に示すように、文字列“ABCDNK株式会社”,“KWT様”と変換されるため、イニシャルで表示した場合に比較して内容を推測することが容易となる。
【0105】
以上説明したように、この実施形態の電子文書編集装置では、機密部分の固有名詞をイニシャルで置換する代わりに、当該固有名詞の読みを示すローマ字の一部(例えば子音)の文字列で置換することにより、電子文書の本来の利用者による機密部分の内容の推測をより容易にすることができる。
【0106】
図32は、本発明の第10の実施形態に係る電子文書編集装置の構成を示すブロック図である。この電子文書編集装置は、上述の図1に示す第1の実施形態の電子文書編集装置と同様に、マスク処理範囲決定部1,マスク処理部152及び出力部3とを備えている。
【0107】
この電子文書編集装置は、機密部分を所定の文字で置換する代わりに、機密部分の漢字を、当該漢字と同一の部首を有する他の漢字で置換することによってマスク処理を行っている。
【0108】
例えば機密部分の文字列“沢松”中の文字“沢”を、例えば同じ「さんずい」を有する文字“決”に変換し、“松”を、例えば同じ「きへん」を有する“枝”に変換する。
【0109】
このために、この電子文書編集装置では、マスク処理部152に、部首が同じ漢字を検出するための漢字部首情報記憶部30を備えている。この漢字部首情報記憶部30には、例えば図33に示すように、漢字の部首と当該部首を有する漢字が対応付けられて記憶されている。
【0110】
上述のような置換処理を行うために、マスク処理部152の置換処理部21は、以下のような処理を実行する。
まず、図34に示す処理において、上述の図5に示すフローチャート中のステップS100からステップS180,ステップS200と同一の処理を実行するが、ステップS190の処理に代えて図34に示すステップS900〜ステップS940までの処理を実行する。
【0111】
上述の図5に示すフローチャートにおける動作と同様に、ステップS180までの処理によって、機密部分がタグで囲まれた文字として抽出されると、図34中のステップS900において、置換処理部21は、1つの機密部分内の全ての文字について処理が終了したか否かを判定し、終了していなければ、続くステップS910〜ステップS940までの処理を実行し、終了していればステップS200に進む。
【0112】
ステップS910では、機密部分の1文字を処理対象とし、当該処理対象の文字が漢字であるか否かを判定し、漢字でなければステップS940に進み、漢字であればステップS920に進む。ステップS920において、置換処理部21は、漢字部首情報記憶部30から処理対象の漢字と同一の部首を有する漢字を取得する。取得する漢字は、漢字部首情報記憶部30に記憶されているものからランダムに選択してもよく、あるいは、漢字の読み等に応じて変換するための規則を定義しておき、これに従って選択するようにしてもよい。処理対象の漢字と同一の部首を有する漢字を取得すると、置換処理部21は、続くステップS930に進み、処理対象の漢字を取得した漢字に置換してステップS900に戻る。これにより、例えば図35(A)中に示す機密部分“ABC電気”は、同図(B)に示すように、漢字“電”が同じ「あめかんむり」を有する「雪」に置換され、漢字“気”が同じ「きがまえ」を有する「氣」に置換される。このように、同じ部首を有する漢字に変換することにより、機密部分の内容の推測が容易になる。
【0113】
一方、処理対象の文字が漢字でない場合には、ステップS910からステップS940に進み、処理対象の文字を所定の文字,例えば“*”で置換してステップS900に戻る。これにより、例えば図35(A)中に示す機密部分“ABC電気”内の文字列“ABC”は、同図(B)に示すように、3文字の“*”に置換される。
【0114】
ステップS900〜ステップS940までの処理によって1つの機密部分内の全ての文字についてのマスク処理が終了すると、ステップS900からステップS160に戻る。そして、1つの電子文書内の全ての機密部分についてのマスク処理が終了すると、ステップS160からステップS200に進み、出力部3がマスク処理された電子文書を出力し、処理を終了する。
【0115】
以上説明したように、この実施形態の電子文書編集装置では、機密部分の漢字を同一の部首を有する他の漢字に置換することにより、電子文書の本来の利用者による機密部分の内容の推測をより容易にすることができる。
【0116】
以上の各実施形態では、本発明を電子文書編集装置に適用した場合について説明したが、以下の実施形態では、本発明を電子文書の1つであるメッセージを送受信するための電子メール装置に適用した場合について説明する。
【0117】
図36は、本発明の第11の実施形態に係る電子メール装置の構成を示している。この電子メール装置50は、インタネット,イントラネットあるいはLAN(Local Area Network)等のネットワーク40を介して接続された他の電子メール装置と電子メール(メッセージ)の送受信を行うための送受信部51と、ユーザが送信するメッセージ(送信メッセージ)を作成するための作成部52と、送信メッセージが機密を要するものであるか否かを判断する機密判断部53と、送信メッセージの編集を制御する編集制御部54と、送信メッセージに対して上述のマスク処理に相当する伏字処理を実行する伏字処理部55と、転送先のアドレスを記憶する転送先記憶部57とを備えている。
【0118】
この電子メール装置50は、例えばパーソナルコンピュータ(PC)等の情報処理装置によって実現されており、送受信部51は、例えば当該装置において実行されているプログラムによって実現されるSMTPサーバ,POPサーバ等によって実現されている。なお、これ以外のプロトコルを用いた電子メールシステムであってもよい。また、この送受信部51は、この送受信部51が受信したメッセージを他の宛先に転送する機能を有している。転送先を示した転送先アドレスは、転送先記憶部57に記憶されている。
【0119】
また、作成部52は、例えば当該装置において実行されているメール送受信プログラム(メーラ)等によって実現されている。同様に、機密判断部53,編集制御部54,伏字処理部55も、当該装置において実行されるプログラムによって実現されている。
【0120】
また、伏字処理部55は、メッセージ内の固有名詞,数値等の機密部分に対して外部の者に知られないように伏字処理する。この伏字処理の具体例としては、上述の各実施形態において示したマスク処理を用いる。
【0121】
転送先記憶部57には、図40に示すように、宛先アドレスと転送先アドレスが対応付けられて記憶されている。すなわち、電子メール装置50の送受信部51が転送すべきメッセージの宛先アドレスと、転送すべき転送先のアドレス(転送先アドレス)が対応付けられて記憶されている。また、1つの宛先アドレスに対して複数の転送先アドレスを記憶することもできるようになっている。例えば図40の例では、宛先アドレスKawa@bb#.ne.jpに対してKawa@bc#.ne.jpとKawa@bd#.ne.jpが登録されている。また、この転送先記憶部57は、例えば電子メール装置50のOSとしてUNIX(登録商標)互換のOSを用いている場合には、転送すべきメッセージの宛先のユーザのforwardファイルとすることができ、このファイルには転送先アドレスが登録されている。なお、この場合、上述の図40中の宛先アドレスは当該ユーザのアカウントで特定できるため、必ずしもforwardファイルに記憶する必要はない。
【0122】
以下、上述のように構成された電子メール装置の動作を、送受信部51が受信したメッセージを他の宛先に転送する場合について説明する。
機密判断部53は、送受信部51によるメッセージの転送の際の発信要求の有無を監視しており、発信要求があると図37中のステップS1000からの処理を開始し、このステップS1000において、機密判断部53は、発信要求を受理して続くステップS1010に進む。
【0123】
ステップS1010からステップS1030までの処理では、発信が要求されたメッセージが機密を要するものであるか否かを判断している。具体的には、この判断は、メッセージの宛先に応じて判断し、例えば企業等の組織内のいわゆるイントラネット内で送受信されるメッセージをイントラネット外のアドレスに転送する場合等に、機密を要するものと判断する。
【0124】
ステップS1010において、送受信部51は、転送しようとするメッセージのヘッダ部分から宛先アドレスを抽出し、抽出した宛先アドレスに対応する転送先アドレスを、続くステップS1015において転送先記憶部57から1つ抽出する。続くステップS1020において、機密判断部53は、転送しようとするメッセージのヘッダ部分から差出人アドレスを抽出し、抽出した差出人アドレスと宛先アドレスのドメイン名を比較し、一致していなければステップS1050に進み、一致していれば続くステップS1030に進む。従って、イントラネット内で送受信されるメッセージであれば差出人アドレスと宛先アドレスのドメイン名が一致しているためステップS1030に進むが、イントラネット内で送受信されるメッセージでなければ差出人アドレスと宛先アドレスのドメイン名が一致していないためステップS1050に進む。
【0125】
ステップS1030では、宛先アドレスと転送先のアドレスのドメイン名を比較し、一致していればステップS1050に進み、一致していなければ続くステップS1040に進み、このステップS1040において伏字処理を実行した後、ステップS1050に進む。イントラネット内で送受信されるメッセージをイントラネット外に転送する場合には、宛先アドレスと転送先のアドレスのドメイン名が異なるためステップS1040に進むが、宛先アドレスと転送先のアドレスのドメイン名が一致していれば、ステップS1050に進む。
【0126】
ステップS1050では、転送先のアドレスに対して、転送が指示されたメッセージを送信し、ステップS1060に進む。ステップS1060では、転送が指示されたメッセージの全ての転送先アドレスについて上述のステップS1010からステップS1050までの処理を実行したか否かを判定し、全ての転送先について処理が終了していなければステップS1015に戻り、再度、転送先記憶部57から転送先アドレスを抽出してステップS1015〜ステップS1050までの処理を実行する。全ての転送先について処理が終了していれば、処理を終了する。
【0127】
以上説明したように、この実施形態の電子メール装置では、上述のように、転送されるメッセージの宛先アドレス,差出人アドレス及び転送先アドレスによって、機密を要するか否かを判定し、必要である場合には、伏字処理すなわち上述の各実施形態において示したいずれかのマスク処理を実行してメッセージを転送することにより、機密を要する転送先について自動的にマスク処理をすることができる。
【0128】
図38は、本発明の第12の実施形態に係る電子メール装置の構成を示している。この電子メール装置50は、上述の図36に示す第1の実施形態のメール装置と同様に、送受信部51,作成部52,機密判断部53,編集制御部54,伏字処理部55を備えており、さらに、イントラネット内の内部ドメインのドメイン名を記憶する内部ドメイン記憶部56を備えている。
【0129】
上述の第11の実施形態では、イントラネット内の内部ドメインが一つであるとして、イントラネットの内外の判断を宛先アドレス,差出人アドレス及び転送先アドレス内のドメイン名で判断していた。しかしながら、イントラネット内の内部ドメインが複数である場合には、各々のドメイン名が異なるため、イントラネット内で送受信されるメッセージであっても宛先アドレスと差出人アドレスのドメイン名が異なる場合がある。このような場合にも、機密を要するとして伏字処理の対象とすべく、この実施形態のメール装置では、イントラネット内の内部ドメインのドメイン名をも考慮して機密の要否の判断を行うようになっている。
【0130】
このために、内部ドメイン記憶部56には、図39に示すように、イントラネット内の全ての内部ドメインのドメイン名が記憶されている。
【0131】
上述のように構成された電子メール装置では、上述の図37に示す処理と同様の処理が実行されるが、図37中のステップS1020及びステップS1030においては、内部ドメイン記憶部56に記憶された全ての内部ドメインのドメイン名が考慮される。
【0132】
すなわち、ステップS1020では、宛先アドレスと差出人アドレスのドメイン名が共に内部ドメイン記憶部56に記憶されていれば、ドメイン名が一致していると判定する。また、ステップS1030では、宛先アドレスと転送先アドレスのいずれか一方のドメイン名が内部ドメイン記憶部56に記憶されており、他方が記憶されていなければ、ドメイン名が不一致であると判定する。このようなドメイン名の判断を行うことにより、イントラネット内の内部ドメインを考慮して、機密の要否の判断を正確に行うことができる。
【0133】
以上説明したように、この実施形態の電子メール装置では、上述のように、イントラネット内の全ての内部ドメインのドメイン名に基づいて機密の要否を判断しているので、機密の要否の判断を正確に行うことができる。これにより、機密を要するイントラネット内で送受信されるメッセージがマスク処理されずにイントラネット外に転送されることを防止することができ、機密の漏洩の可能性の低減に寄与することができる。
【0134】
【発明の効果】
本発明では、外部から供給された電子文書中の、当該電子文書の種類に応じて決定された処理範囲に対して、マスク処理を実行することにより、電子メールのメッセージ,テキスト形式のファイル等の電子文書の内容が漏洩する可能性の低減に寄与することができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る電子文書編集装置の構成を示すブロック図である。
【図2】前記電子文書編集装置を構成する固有名詞辞書部に記憶された固有名詞の例を示す図である。
【図3】前記電子文書編集装置を構成する統合規則記憶部に記憶された統合規則の例を示す図である。
【図4】前記電子文書編集装置を構成する抽出規則記憶部に記憶された抽出規則の例を示す図である。
【図5】前記電子文書編集装置の動作を示すフローチャートである。
【図6】前記電子文書編集装置によるマスク処理の過程における電子文書の例を示す図である。
【図7】本発明の第2の実施形態に係る電子文書編集装置の構成を示すブロック図である。
【図8】前記電子文書編集装置を構成する読み情報記憶部に記憶された読み情報の例を示す図である。
【図9】前記電子文書編集装置の動作の一部を示すフローチャートである。
【図10】前記電子文書編集装置によるマスク処理の前後における電子文書の例を示す図である。
【図11】本発明の第3の実施形態に係る電子文書編集装置の動作の一部を示すフローチャートである。
【図12】前記電子文書編集装置によるマスク処理の過程における電子文書の例を示す図である。
【図13】本発明の第4の実施形態に係る電子文書編集装置の構成を示すブロック図である。
【図14】前記電子文書編集装置を構成するマスク記号記憶部に記憶されたマスク記号の例を示す図である。
【図15】前記電子文書編集装置の動作の一部を示すフローチャートである。
【図16】前記電子文書編集装置によるマスク処理の過程における電子文書の例を示す図である。
【図17】本発明の第5の実施形態に係る電子文書編集装置の動作を示すフローチャートである。
【図18】前記電子文書編集装置によるマスク処理の前後における電子文書の例を示す図である。
【図19】本発明の第6の実施形態に係る電子文書編集装置の構成を示すブロック図である。
【図20】前記電子文書編集装置を構成する置換情報一時記憶部に記憶された置換文字列の例を示す図である。
【図21】前記電子文書編集装置の動作を示すフローチャートである。
【図22】前記電子文書編集装置によるマスク処理の前後における電子文書の例を示す図である。
【図23】本発明の第7の実施形態に係る電子文書編集装置の構成を示すブロック図である。
【図24】前記電子文書編集装置を構成する連想情報記憶部に記憶された連想情報の例を示す図である。
【図25】前記電子文書編集装置によるマスク処理の前後における電子文書の例を示す図である。
【図26】本発明の第8の実施形態に係る電子文書編集装置の構成を示すブロック図である。
【図27】前記電子文書編集装置を構成する連想情報記憶部に記憶された連想情報の例を示す図である。
【図28】前記電子文書編集装置によるマスク処理の前後における電子文書の例を示す図である。
【図29】本発明の第9の実施形態に係る電子文書編集装置の動作を示すフローチャートである。
【図30】前記電子文書編集装置による固有名詞の読みの変換の例を示す図である。
【図31】前記電子文書編集装置によるマスク処理の前後における電子文書の例を示す図である。
【図32】本発明の第10の実施形態に係る電子文書編集装置の構成を示すブロック図である。
【図33】前記電子文書編集装置を構成する漢字部首情報記憶部に記憶された漢字リストの例を示す図である。
【図34】前記電子文書編集装置の動作を示すフローチャートである。
【図35】前記電子文書編集装置によるマスク処理の前後における電子文書の例を示す図である。
【図36】本発明の第11の実施形態に係る電子メール装置の構成を示すブロック図である。
【図37】前記電子メール装置の動作を示すフローチャートである。
【図38】本発明の第12の実施形態に係る電子メール装置の構成を示すブロック図である。
【図39】前記電子メール装置の内部ドメイン記憶部に記憶されるドメイン名を示すデータの例を示す図である。
【図40】前記転送先記憶部に記憶される転送先の例を示す図である。
【符号の説明】
1 マスク処理範囲決定部
2,102,112,122,132,142,152… マスク処理部
3 出力部
20 マスク箇所抽出部
21 置換処理部
22 固有名詞辞書部
23 統合規則記憶部
24 抽出規則記憶部
25 読み決定部
26 読み情報記憶部
27 マスク記号記憶部
28 置換情報一時記憶部
29 連想情報記憶部
30 漢字部首情報記憶部
40 ネットワーク
50 電子メール装置
51 送受信部
52 作成部
53 機密判断部
54 編集制御部
55 伏字処理部
56 内部ドメイン記憶部
57 転送先記憶部
[0001]
BACKGROUND OF THE INVENTION
  The present inventionHenThe present invention relates to an electronic mail apparatus for transferring collected messages.
[0002]
[Prior art]
With the spread of mobile terminals with excellent portability, such as mobile phones equipped with functions for using e-mail services, messages that have arrived at e-mail servers or terminal devices on the premises of companies are received on the go Or transfer to a mobile terminal.
[0003]
In addition, in a software (mailer) for sending and receiving e-mails executed by a general-purpose information processing apparatus such as a personal computer (PC), the message (particularly the text) is encrypted so that the content of the message is not read. Some have an encryption / decryption function for transmission. Between mailers having such a function, the transmitting side transmits an encrypted message, and the receiving side decrypts the received message to restore the contents. As a result, even if the message is seen by others when it is transmitted, the possibility of the content of the message leaking can be reduced.
[0004]
[Problems to be solved by the invention]
However, mobile terminals such as those described above are often limited in data capacity, display capability, and the like due to demands for weight reduction and low power consumption. For example, the number of characters of messages that can be transmitted / received is limited or encrypted. / Decryption function may not be implemented. For this reason, even if the transmitting mailer encrypts and transmits the message, the receiving portable terminal may not be able to decrypt the message.
[0005]
Since an unencrypted message is transmitted to a mobile terminal that is not equipped with such an encryption / decryption function, if a network such as the Internet is used for the transmission path, In some cases, a message being transmitted is received, and the content of the message may be leaked.
[0006]
In addition, depending on the operating environment of the mobile terminal, there is a possibility that the display of an electronic document such as an e-mail message may be peeped by those around. For example, in a congested environment, it may be difficult to operate in a state where the display unit of the mobile terminal is isolated from the field of view of the surrounding people. Furthermore, since it is small and light, it is easy to lose the mobile terminal, and there is a possibility that the content of the message can be seen by the person who acquired the lost mobile terminal.
[0007]
  The present invention has been made in view of the above-described problems, and can contribute to reducing the possibility of leakage of the contents of electronic documents such as e-mail messages and text format files.RudenAn object is to provide a child mail device.
[0008]
[Means for Solving the Problems]
  Main departureTomorrowA mask determining means for determining whether or not to perform mask processing on the message according to address information relating to the message to be transferred, and executing mask processing on a preset mask processing range in the message When the mask processing unit and the mask determination unit determine not to perform mask processing, the message to be transferred is transferred to the address specified by the address information, and the mask determination unit performs mask processing. A transfer means for transferring the message masked by the mask processing means to an address designated by the address information when it is determined;RudenChild mail deviceThe mask determination means has the same sender address and destination address domain name in the message to be transferred, and the destination address and the destination address domain name set in advance for the destination address are the same. If not, it is determined that mask processing is performed.
  Further, another invention relates to a mask determination means for determining whether or not to mask a message according to address information relating to the message to be transferred, and a mask processing range set in advance in the message. A mask processing unit that executes mask processing, and when the mask determination unit determines not to perform mask processing, the message to be transferred is transferred to an address specified by the address information, and the mask determination unit If the electronic mail apparatus comprises a transfer means for transferring the message masked by the mask processing means to the address specified by the address information, the An internal domain storage means for registering a domain name, and the mask determination means The sender address and the destination address domain name in the message to be transferred are stored in the internal domain storage means, and the domain name of the transfer destination address preset for the destination address is stored in the internal domain storage means. It is characterized in that it is determined that the mask process is performed when it is not stored.
[0009]
DETAILED DESCRIPTION OF THE INVENTION
FIG. 1 is a block diagram showing a configuration of an electronic document editing apparatus according to the first embodiment of the present invention. This electronic document editing apparatus is used for editing an electronic document (data including character information) such as a message to be transmitted as an e-mail, for example. As shown in FIG. A mask processing range determining unit 1 that determines a range (mask processing range) for performing mask processing in an electronic document supplied in response to an instruction from a mail server (for example, an SMTP (Simple Mail Transfer Protocol) server) or a user; A mask processing unit 2 that performs mask processing on the determined mask processing range, and an output unit 3 that outputs the masked electronic document to, for example, an e-mail server or a predetermined directory are provided.
[0010]
The mask processing range determination unit 1 determines a mask processing range for performing mask processing according to the type of electronic document supplied from the outside. That is, when the electronic document is supplied from the outside, the mask processing range determination unit 1 determines the type of the electronic document.
[0011]
The e-mail message includes a destination address [To: field description To: aaa @ bb #. ccc], title [Subject: field description Subject: abt. . . . ] Or the like is added. Therefore, it can be determined whether or not the message is an e-mail message based on the presence or absence of the header information.
[0012]
If the supplied electronic document is other than an e-mail message, the type of the electronic document is determined based on, for example, a file extension. In a certain type of operating system (OS), an extension corresponding to the data format of the file may be added to the file name of the electronic document. For example, the extension “.txt” is assigned to a standard text format (standard text format) in which the internal data is a list of character codes. For this reason, when such an extension is used, it is possible to determine the data format that is one of the elements for determining the type of the electronic document based on the extension of the file name of the file of the electronic document. it can.
[0013]
Other formats having an internal data structure similar to the standard text format include, for example, an e-mail message format (corresponding to the extension “.eml”), HTML format, CSV format, and the like. In the case of these formats, the electronic document file can be accessed in the same procedure as the standard text format. Therefore, in this electronic document editing apparatus, for example, a standard text format corresponding to the extension “.txt”, an HTML format corresponding to the extension “.html”, and a CSV format corresponding to the extension “.csv” (comma “ , ", One of the data formats representing a table delimited by line breaks), etc. are also collectively treated as" text format ". For files other than the text format, mask processing corresponding to the file format is separately defined or mask processing is not performed.
[0014]
When the type of electronic document is determined, the mask processing range determination unit 1 determines the mask processing range according to the type of electronic document. For this purpose, a rule for determining a mask processing range is set in advance for each type of electronic document, and one of these rules is selected according to the type of electronic document detected as described above, and selected. The mask processing range is determined according to the rule.
[0015]
For example, when the electronic document type is an e-mail message, the title [Subject: field description Subject: abt. . . . ], Sender address [From: field description From: xxx @ yy #. zzz], destination address [To: field description To: aaa @ bb #. ccc] and the body of the e-mail are set as a mask processing range, and the remaining header information is not set as a mask processing range. In the case of the text format, for example, the entire range is set as the mask processing range (although it may be part of the electronic document).
[0016]
When the mask processing range is determined by the mask processing range determination unit 1, the mask processing unit 2 extracts a confidential portion from the mask processing range of the electronic document supplied from the outside, and performs mask processing on the extracted confidential portion. Execute. The confidential portion is, for example, a proper noun such as a place name, a product name, a company name, and a name, an amount, a date, a number, a unit, and the like.
[0017]
The mask processing unit 2 includes, for example, a mask location extraction unit 20 that extracts a confidential part (may be other than a confidential part) that needs to maintain confidentiality within the mask processing range determined by the mask processing range determination unit 1, and an extraction Rules for integrating the proper nouns extracted by the proper noun dictionary unit 22 and the proper noun dictionary unit 22 for registering the proper nouns to be the secret parts. An integrated rule storage unit 23 that stores (integrated rules) and an extraction rule storage unit 24 that stores rules for extracting confidential parts other than proper nouns are provided.
[0018]
Among the extraction of confidential parts in the mask part extraction unit 20, the extraction of proper nouns can be found in, for example, the technical report “Comparison of Japanese and English in proper noun extraction”, NLC98-21, pp. 45-52, 1998. Do as indicated.
[0019]
In this method, first, a character string constituting an electronic document is divided according to character type, two or more consecutive characters other than hiragana and punctuation marks are extracted, and stored in the proper noun dictionary unit 22 from the extracted characters. Extract appropriate nouns. As shown in FIG. 2, the proper noun dictionary unit 22 stores proper nouns classified by type. When the proper noun is extracted in this way, the mask location extraction unit 20 adds a so-called SGML tag (a character string sandwiched between “<” and “>”) before and after the proper noun.
[0020]
When extracting the proper noun by adding the SGML tag as described above, the mask location extraction unit 20 integrates the extracted proper noun by the integration rule. The integrated rule storage unit 23 stores rules (integrated rules) for this purpose as shown in FIG.
[0021]
In addition, extraction of confidential parts other than proper nouns, such as the amount of money, date, etc., is performed by, for example, pattern matching that compares a pre-registered rule with an electronic document. Therefore, as shown in FIG. 4, the extraction rule storage unit 24 stores rules (extraction rules) for extracting amounts, dates and the like.
[0022]
When the mask portion (secret portion) is extracted as described above, the replacement processing unit 21 replaces the secret portion with a predetermined character, for example, an asterisk “**”. The electronic document with the confidential part masked in this way is output by the output unit 3 to, for example, an e-mail server or a predetermined directory.
[0023]
The detailed operation of the electronic document editing apparatus configured as described above will be described below.
When an electronic document is supplied from the outside, the processing from step S100 in FIG. 5 is started. In this step S100, the mask processing range determination unit 1 determines whether the supplied electronic document is an e-mail message. In order to determine whether or not there is header information at the head of the electronic document, it is confirmed. If there is header information, it is determined that the message is an e-mail message, and the process proceeds to step S120.
[0024]
In step S110, the mask processing range determination unit 1 uses the above-mentioned “.txt”, “.csv”, “.html”, etc., in which the extension added to the file name of the supplied electronic document is handled as a text format. If the file extension is not one of these extensions, the process ends as a type of electronic document that cannot be edited by the electronic document editing apparatus. On the other hand, if the extension added to the file name of the supplied electronic document is one of the above-mentioned extensions, it is determined that the type of the electronic document is text format, and the process proceeds to step S150. The process proceeds to step S160 with the entire document as the mask processing range.
[0025]
On the other hand, in the processing after step S120, first, the sender address (From: field) in the header information is set as the mask processing range in step S120, and then the destination address (To: field) is set as the mask processing range in step S130. Further, in step S140, the process proceeds to step S160 with the title (Subject: field) and the body of the message as the mask processing range.
[0026]
It should be noted that the sender address and the destination address are masked in steps S120 and S130, respectively, and the mask processing range in the later (step) mask processing may be only the title and the message body. In addition, the masking process of the address in these steps is performed, for example, when the part indicating the organization to which the domain name belongs in the address, for example, when the address is “xxx@h$gehog#.co.jp” When the portion “h $ gehog #” at the third level or higher and the address is “xxx@%geho&e.com”, the portion “% geho & e” at the second level or higher of the domain name is set to a predetermined character, for example, “* * Replaced with “,” etc. Thus, if the address of the part indicating the affiliated organization of the domain name is masked, the affiliated organization such as the sender cannot be specified with the remaining domain name “co.jp” or “.com”.
[0027]
In step S160, it is determined whether or not the process has been completed for the entire mask processing range. If the process has not been completed, the following steps S170 to S190 are repeated. If the process has been completed, the process proceeds to step S200.
[0028]
In step S170, the mask location extraction unit 20 extracts a character string to be masked from the mask processing range of the electronic document. In the proper noun dictionary unit 22 in the mask processing unit 2 described above, as shown in FIG. 2, in order to extract the proper nouns described above, the list names and proper nouns in the categories are associated with each proper noun category. Registered. The mask location extraction unit 20 compares the words in the electronic document with the proper nouns registered in the proper noun dictionary unit 22, and the matching words are surrounded by tags ("<", ">" including list names). Enclose in characters [in this case list name]).
[0029]
Accordingly, for example, the word “ABC Electric Co., Ltd.” shown in FIG. 6A is a tag <on> corresponding to the organization name list (on), organization modifier list (onm), organization name affix list (os), </ on>, <onm>, </ onm>, <os>, </ os>, and as shown in FIG. 5B, “<on> ABC </ on> <onm> electricity < / onm> <os> corporation </ os> ”. Further, for example, the word “Kawada-sama” shown in FIG. 6A corresponds to the tags <pn>, </ pn>, <ps>, </ ps> corresponding to the personal name list (pn) and personal name affix list (ps). , And converted into “<pn> Kawada </ pn> <ps> </ ps>” as shown in FIG.
[0030]
In addition, as shown in FIG. 4 described above, the extraction rule storage unit 24 defines conditions for extracting the amount of money, date, etc., which are confidential parts other than proper nouns, by pattern matching. For example, a word that satisfies the condition on the left side is converted into a format defined on the right side. Specifically, for example, a word in which a numerical value defined on the left side and a character “yen” are continuous is converted into a format defined on the right side, and the tag <amount>, </ The character “yen” enclosed in the amount of money> and defined in the second term on the right side is added. Thus, for example, according to the rule (1) in FIG. 4, the numerical value portion “5,000,000” in the word “5,000,000 yen” in the e-mail message in FIG. >, </ Amount> and is converted into “<amount> 5,000,000 </ amount> yen” as shown in FIG.
[0031]
In step S180, the character strings extracted in step S170 are integrated according to the above-described integration rule. In the integration rule storage unit 23, as shown in FIG. 3 described above, integration rules for integrating the extracted proper nouns are recorded. By this integration rule, a plurality of proper nouns corresponding to the list name on the left side in the figure (for example, the organization name list corresponding to the list name on and the organization modifier list corresponding to the list name onm) are one proper noun on the right side. (Organization name list corresponding to list name on).
[0032]
As a result, for example, the confidential part “<on> ABC </ on> <onm> Electric </ onm> <os> corporation </ os>” in FIG. ) Once converted into “<on> ABC Electric </ on> <os> Corporation </ os>” and then, according to the integration rule (3) in FIG. on> ”and further converted into“ <o> ABC Electric Co., Ltd. </ o> ”as shown in FIG. 6C by the integration rule (9) in FIG. Also, for example, the confidential portion “<pn> Kawada </ pn> <ps> </ ps>” in FIG. 6B is shown in FIG. 3C by the integration rule (2) in FIG. <p> Kawada </ p> <ps> Like </ ps> ”. By integrating such confidential parts, a series of related words can be processed as one confidential part, and it is easy to perform an appropriate masking process according to the word usage in a later step. become.
[0033]
In step S190, the confidential part is masked. As described above, when the confidential part is surrounded by the tag, the replacement processing unit 21 replaces the character of the confidential part made up of the tag and the part surrounded by the tag with a predetermined character, for example, an asterisk “**”. The process returns to S160. At this time, it is not necessary to maintain confidentiality of the character strings listed as examples in the affix list (for example, the person name affix list, organization name affix list, place name affix list, etc.) shown in FIG. Because it is possible, substitution is not performed for character strings that match these. For example, the replacement processing unit 21 compares the character string of the confidential portion with the example in the affix list by pattern matching or the like, and selects a portion to replace the character. Thus, for example, the part other than the example “corporation” in the organization name affix list of the confidential part “<o> ABC Electric Co., Ltd. </ O>” shown in FIG. 6C is replaced with the character “**”. As shown in FIG. 6D, it is converted into “** Corporation”. In addition, in the confidential part “<p> Kawada </ p> <ps>” </ ps> ”in FIG. 6C, the part other than“ Example ”in the person name affix list is the character“ ** ”. It is replaced and converted into “**-like” as shown in FIG. Also, the confidential portion “<p> Taro Yamada </ p>” in FIG. 6C is replaced with the character “**” and converted to “**” as shown in FIG. 6D. In the character string “<amount> 5,000,000 </ amount> yen” in FIG. 6C, only the confidential part “<amount> 5,000,000 </ amount>” has the characters “*”. * "Is substituted and converted to" ** circle "as shown in FIG.
[0034]
When the processes from step S170 to step S190 are repeated and the mask process for all confidential parts is completed, the process proceeds from step S160 to step S200, and the electronic document in which the output unit 3 is masked in step S200 (for example, The message is output to an SMTP server for sending a message, a mailer for displaying the message, or a predetermined directory, and the process is terminated.
[0035]
By masking the confidential part in the electronic document in this way, other people cannot understand the contents of the electronic document. However, if it is the person himself, the electronic document is based on business knowledge, unmasked header information, etc. Can understand the rough contents of the document.
[0036]
As described above, in the electronic document editing apparatus of this embodiment, the type of the supplied electronic document is determined, the mask processing range for performing the mask process is determined according to the type of the electronic document, and the supplied electronic document By masking and outputting the mask processing range, the confidential part can be masked if the conditions for the confidential part are set as the mask processing range. For example, an electronic document such as e-mail It is possible to contribute to the reduction of the possibility of leakage of the contents.
[0037]
In the above description, the case where mask processing is executed in advance for an e-mail message to be transmitted / transferred to a mobile terminal or the like has been described. For the purpose of securing only, it is possible to provide a means for masking e-mail messages on the mobile terminal side, and only the message after masking without displaying the original text of the received message on the mobile terminal side. May be sufficient to reduce the possibility of leakage of the content of the received message. Furthermore, if the received message is quickly masked and the original text is erased, the possibility of leakage of the message content can be further reduced. In addition, by providing a means for performing mask processing on the mobile terminal side in this way, there is an advantage that an existing apparatus such as a normal SMTP server can be used as it is in the apparatus on the transmission side.
[0038]
In addition, when there is a margin in processing capacity on the mobile terminal side, a decryption means is installed so that the received message encrypted on the mobile terminal side is decrypted and then masked for display. May be. This can also reduce the possibility of leakage during message transmission.
[0039]
In the above description, an example is shown in which a tag is used as information for indicating the mask processing range. However, if the mask processing range can be recognized, for example, a predetermined control code may be inserted instead of the tag, or the electronic document It can be changed as appropriate, for example, as position information indicating the mask processing range in the data.
[0040]
In addition, (1) the mask processing mode is not limited to the process of replacing the confidential portion with the character “**”, and (2) the mask processing range and mask processing mode of the e-mail message are set for each message type. (3) When the electronic document type is a text document, a mask processing range and a mask processing mode may be set for each extension or content.
[0041]
FIG. 7 is a block diagram showing a configuration of an electronic document editing apparatus according to the second embodiment of the present invention. This electronic document editing apparatus includes a mask processing range determination unit 1, a mask processing unit 102, and an output unit 3, similarly to the electronic document editing apparatus according to the first embodiment shown in FIG.
[0042]
In the electronic document editing apparatus according to the first embodiment described above, all confidential portions are replaced with predetermined character strings. Although the confidentiality is excellent, the original user of the electronic document can It may be difficult to understand (to a certain extent). For this reason, in the electronic document editing apparatus of this embodiment, the proper noun of the confidential part is converted into an initial letter (initial), and the other part is converted into a predetermined character as in the first embodiment.
[0043]
For this reason, in this embodiment, as shown in FIG. 7, in addition to the configuration of the mask processing unit 2 in FIG. 1, the mask processing unit 102 reads the confidential portion extracted by the mask location extracting unit 20. A reading determination unit 25 that determines and supplies to the replacement processing unit 21 and a reading information storage unit 26 that stores reading information that is referred to by the reading determination unit 25 to determine reading are provided.
[0044]
In the reading information storage unit 26, for example, as shown in FIG. 8, a character string of a proper noun and a reading of this character string (in Roman letters) are stored in association with each other. The reading determination unit 25 determines the reading of the proper noun extracted by the mask location extraction unit 20 with reference to the reading information storage unit 26, and determines the initial of the proper noun by this reading. Further, the replacement processing unit 21 converts the character in the confidential range into a predetermined character as in the first embodiment described above. At this time, the proper noun in the confidential range is converted into an alphabet indicating the initial.
[0045]
In order to perform the replacement process as described above, the replacement processing unit 21 of the mask processing unit 102 executes the following process.
First, in the process shown in FIG. 9, the same processes as those in steps S100 to S180 and S200 in the flowchart shown in FIG. 5 are executed. However, instead of the process in step S190, steps S300 to S300 shown in FIG. The process shown in S330 is executed.
[0046]
Similar to the operation in the flowchart shown in FIG. 5 described above, when the confidential part is extracted as a character surrounded by a tag by the processing up to step S180, in step S300 in FIG. It is determined whether or not the confidential part extracted by the location extraction unit 20 is a proper noun. If it is not a proper noun, the process proceeds to step S330. For example, the character “**” is substituted and the process returns to step S160.
[0047]
On the other hand, if the extracted confidential part is a proper noun, the process proceeds to step S310, and the reading determination unit 25 acquires the reading corresponding to the confidential part, that is, the character string surrounded by the tag, from the reading information storage unit 26, and The reading of the confidential part is determined, and the process proceeds to subsequent step S320. When the reading of the confidential part itself is not stored in the reading information storage unit 26, the reading determination unit 25 acquires the reading of the first character of the confidential part. For example, the reading of the confidential part “<p> Taro Yamada </ p>” itself extracted from the electronic document shown in FIG. 10A is not stored in the reading information storage unit 26, but the reading of “mountain” is stored. Therefore, the reading of the confidential part is “Yama”.
[0048]
In step S320, the replacement processing unit 21 replaces the confidential portion with the reading initial determined as described above, and returns to step S160. As a result, the confidential portion “<p> Taro Yamada </ p>” whose reading “Yamata...” Has been determined as described above is replaced with the letter “Y” as shown in FIG. . In addition, “ABC Electric”, “Kawada”, “Product A Server”, “Product B Server”, and “Yamada Construction” in FIG. 10A are similarly denoted by letters “A”, “K”, and “S”, respectively. "," S ", and" Y ".
[0049]
When the processes from Step S170 to Step S180 and Step S300 to Step S330 are repeated and mask processing for all the confidential parts is completed, the process proceeds from Step S160 to Step S200 in the same manner as the process in FIG. In step S200, the output unit 3 outputs the electronic document subjected to the masking process, and the process ends.
[0050]
As described above, in the electronic document editing apparatus of this embodiment, instead of replacing all the proper nouns in the confidential portion with predetermined characters (characters), the electronic document editing apparatus replaces the proper noun initial with the initial of the proper noun. It is possible to make it easier for the original user to guess the contents of the confidential part.
[0051]
The electronic document editing apparatus according to the third embodiment of the present invention is similar to the electronic document editing apparatus of the first embodiment shown in FIG. 1 described above, and includes a mask processing range determination unit 1, a mask processing unit 2, and an output unit. 3 is provided.
[0052]
In the electronic document editing apparatus according to the first embodiment described above, all the confidential parts are replaced with a certain number of characters, for example, two characters “**”. May want to know the number of digits. For this reason, in this embodiment, the confidential part is replaced with the same number of characters as the number of characters of the extracted confidential part. For example, when the confidential portion is “2000 yen”, the character string “2000” is replaced with four characters that are the number of characters in the character string. By performing such replacement, the number of digits of a numerical value such as an amount can be easily grasped.
[0053]
In order to perform the replacement process as described above, the replacement processing unit 21 of the mask processing unit 2 performs the following process.
First, in the process shown in FIG. 11, the same processes as those in steps S100 to S180 and S200 in the flowchart shown in FIG. 5 are executed. However, instead of the process in step S190, step S400 and step shown in FIG. The process shown in S410 is executed.
[0054]
Similar to the operation in the flowchart shown in FIG. 5 described above, when the confidential part is extracted as a character surrounded by tags by the processing up to step S180, the replacement processing unit 21 in step S400 in FIG. The number of characters in the confidential part is counted, and the process proceeds to subsequent step S410. At this time, the replacement processing unit 21 does not count “, (comma)” included in the amount, the number, etc. as the number of characters. Further, the replacement processing unit 21 does not count the character string that matches the example in the above-mentioned affix list as the number of characters. When the number of characters in the secret portion is counted in this way, the replacement processing unit 21 replaces the secret portion with a predetermined character corresponding to the number of characters, for example, “*” in the subsequent step S410. At this time, as in step S190 described above, substitution is not performed for character strings listed as examples in the affix list (for example, the person name affix list, organization name affix list, place name affix list, etc.). Further, instead of replacing with the same number of characters “*” as the number of characters, it may be replaced with a randomly selected symbol. As a result, the confidential portion of 7 characters is converted into, for example, “! # $% & @ ¥”.
[0055]
Thus, for example, the number of characters to be replaced in the confidential part “ABC Electric Co., Ltd.” in FIG. 12A is five characters “ABC Electric” as shown in FIG. This portion is replaced with “*” for five characters as shown in FIG. Further, the number of characters to be replaced with the confidential portion “5,000,000 yen” in FIG. 12A is seven characters “5000000” as shown in FIG. This part is replaced with “*” for 7 characters as shown in FIG.
[0056]
When the processes from Step S170 to Step S180 and Step S400 to Step S410 are repeated and the mask process for all the confidential parts is completed, the process proceeds from Step S160 to Step S200 in the same manner as the process in FIG. In step S200, the output unit 3 outputs the electronic document subjected to the masking process, and the process ends.
[0057]
As described above, in the electronic document editing apparatus of this embodiment, it is possible to easily grasp the number of digits of a numerical value such as a monetary amount by replacing the secret part with the same number of characters as the extracted secret part. It is possible to easily guess the contents of the confidential part.
[0058]
FIG. 13 is a block diagram showing a configuration of an electronic document editing apparatus according to the fourth embodiment of the present invention. This electronic document editing apparatus includes a mask processing range determination unit 1, a mask processing unit 112, and an output unit 3, similarly to the electronic document editing device of the first embodiment shown in FIG. 1 described above.
[0059]
In the electronic document editing apparatus of each of the embodiments described above, all of the confidential part is replaced with the same character, for example, “*”, but if all items are masked with the same character, the confidential part As a result of difficulty in grasping items, it is sometimes difficult to speculate on confidential parts. Therefore, in this embodiment, the confidential part is replaced with a different character corresponding to the extracted confidential part item.
[0060]
For this reason, in this embodiment, as shown in FIG. 13, the mask processing unit 112 is provided with a mask symbol storage unit 27 that holds characters (mask symbols) corresponding to the types of confidential portions. As shown in FIG. 14, the mask symbol storage unit 27 stores the types of confidential portions and the corresponding mask symbols. The replacement processing unit 21 refers to the mask symbol storage unit 27 and performs masking. For each type of confidential portion extracted by the location extraction unit 20, a mask symbol for replacement is acquired, and replacement is performed using the acquired mask symbol.
[0061]
In order to perform the replacement process as described above, the replacement processing unit 21 of the mask processing unit 112 performs the following process.
First, in the process shown in FIG. 15, the same processes as those in steps S100 to S180 and S200 in the flowchart shown in FIG. 5 described above are executed, but instead of the process in step S190, steps S500 and steps shown in FIG. The process shown in S510 is executed.
[0062]
Similar to the operation in the flowchart shown in FIG. 5 described above, when the confidential part is extracted as a character surrounded by a tag by the processing up to step S180, the replacement processing unit 21 in step S500 in FIG. The type of the confidential part is determined based on the type of the mask, and the mask symbol storage unit 27 is referred to according to the determination result to obtain the mask symbol corresponding to the type of the confidential part. In subsequent step S510, the replacement processing unit 21 performs replacement of the confidential portion by the acquired mask symbol in the same manner as in step S190 described above. Here, when the mask symbol corresponding to the type of the confidential portion is not stored in the mask symbol storage unit 27, the replacement processing unit 21 does not replace the confidential portion. Further, the replacement processing unit 21 performs the replacement for the character strings listed as examples in the affix list (for example, the person name affix list, the organization name affix list, the place name affix list, etc.) as in step S190 described above. Absent.
[0063]
Thereby, for example, “ABC Electric” in the confidential part “ABC Electric Co., Ltd.” in FIG. 16A is replaced with “*” indicating the organization name as shown in FIG. Is converted to “** Corporation”. In addition, “5,000,000” in the confidential part “5,000,000 yen” in FIG. 16A indicates the amount of money as shown in FIG. ) ”And the confidential part is converted to“ (star) (star) circle ”. By looking at the confidential portion thus replaced, the user of the electronic document can easily recognize the type of each item of the confidential portion.
[0064]
When the processes from step S170 to step S180, step S500, and step S510 are repeated and mask processing for all the confidential portions is completed, the process proceeds from step S160 to step S200 in the same manner as the process in FIG. In step S200, the output unit 3 outputs the electronic document subjected to the masking process, and the process ends.
[0065]
As described above, the electronic document editing apparatus according to this embodiment easily recognizes the type of the confidential part by replacing the confidential part with a different character as the character for replacement for each type of the extracted confidential part. And can make it easy to speculate the contents of the confidential part.
[0066]
The electronic document editing apparatus according to the fifth embodiment of the present invention is similar to the electronic document editing apparatus according to the first embodiment shown in FIG. 1 described above, and includes a mask processing range determination unit 1, a mask processing unit 102, and an output unit. 3 is provided.
[0067]
In the electronic document editing apparatus according to the third embodiment described above, all of the confidential part is replaced with a predetermined character having the same number of characters as that of the confidential part, for example, “*”. It is difficult to speculate about the contents of the part. For this reason, in this embodiment, only some characters of the extracted confidential part are replaced. In selecting the character to be replaced, for example, whether or not each character is replaced with a predetermined character is determined at random, and the character to be replaced is replaced.
[0068]
In order to perform the replacement process as described above, the replacement processing unit 21 of the mask processing unit 2 performs the following process.
First, in the process shown in FIG. 17, the same processes as those in steps S100 to S180 and S200 in the flowchart shown in FIG. 5 described above are executed. However, instead of the process in step S190, steps S600 and steps shown in FIG. The process shown in S610 is executed.
[0069]
Similar to the operation in the flowchart shown in FIG. 5 described above, when the confidential part is extracted as a character surrounded by a tag by the processing up to step S180, the replacement processing unit 21 extracts in step S600 in FIG. Whether or not to replace each character of the confidential portion thus determined is determined at random, and the character to be replaced is replaced with a predetermined character in the subsequent step S610.
[0070]
Thereby, for example, the confidential part “Yamada Construction” in FIG. 18A is replaced with “Mountain ** Installation” as shown in FIG. This example shows a replacement example when the replacement probability is 50%. Thus, it becomes easy to speculate the contents of the confidential portion by the characters that are not replaced.
[0071]
When the processes from step S170 to step S180, step S600, and step S610 are repeated and the mask process for all the confidential portions is completed, the process proceeds from step S160 to step S200 in the same manner as the process in FIG. In step S200, the output unit 3 outputs the electronic document subjected to the masking process, and the process ends.
[0072]
As described above, in the electronic document editing apparatus according to this embodiment, by randomly replacing each character of the confidential portion, it is easy to guess the content of the confidential portion using the characters that have not been replaced.
[0073]
FIG. 19 is a block diagram showing a configuration of an electronic document editing apparatus according to the sixth embodiment of the present invention. Similar to the electronic document editing apparatus of the first embodiment shown in FIG. 1 described above, this electronic document editing apparatus includes a mask processing range determination unit 1, a mask processing unit 122, and an output unit 3.
[0074]
In the electronic document editing apparatus according to the third embodiment described above, all of the confidential part is replaced with a predetermined character having the same number of characters as the confidential part, for example, “*”. However, all the confidential parts are masked with the same character. Then, it is difficult to speculate the contents of the confidential part. For this reason, in this embodiment, among the proper nouns in the extracted confidential portion, the same character string is replaced with the same mask character string. Furthermore, in this embodiment, the mask character string is a character or the like indicating the type of the confidential part so that the type of the confidential part can be known. For example, if there are multiple personal names in the confidential part, such as “Mr. Yamada” and “Mr. Tanaka”, replace “Mr. Yamada” with “Personal name 1” so that each can be identified. Replace with “person name 2”.
[0075]
Therefore, in this embodiment, as shown in FIG. 19, the mask processing unit 122 is provided with a replacement information temporary storage unit 28 that temporarily stores the correspondence between the contents of the confidential portion and the character string to be replaced. . In the replacement information temporary storage unit 28, as shown in FIG. 20, the content of the confidential portion extracted by the mask location extraction unit 20, the type of the confidential portion, and the character string to be replaced are stored in association with each other. Yes. If only the same character string is recognized, it is not always necessary to use a character indicating the type of the confidential portion. For example, a unique character string may be used for each same character string. Note that the contents of the replacement information temporary storage unit 28 are cleared for each electronic document in the processing unit, have no data before the replacement process, and before and after the replacement of the proper nouns replaced during the replacement process. The character string is temporarily stored, and is used to replace the character string when the same character string as the character string already replaced in the same electronic document is newly extracted.
[0076]
In order to perform the replacement process as described above, the replacement processing unit 21 of the mask processing unit 122 executes the following process.
First, in the process shown in FIG. 21, the same processes as those in steps S100 to S180 and S200 in the flowchart shown in FIG. 5 are executed. However, instead of the process in step S190, steps S700 to S700 shown in FIG. The process shown in S730 is executed.
[0077]
Similar to the operation in the flowchart shown in FIG. 5 described above, when the confidential portion is extracted as a character surrounded by tags by the processing up to step S180, the replacement processing unit 21 extracts in step S700 in FIG. It is detected whether or not the character string in the classified part is stored in the replacement information temporary storage unit 28. If it is not stored, the process proceeds to the next step S710, where the extracted confidential part is a character indicating the type of the part. , For example, “person name” and a character (for example, “1”) indicating a number (serial number) indicating each confidential part in the type. At this time, the serial number is the smallest number that is not registered in the replacement information temporary storage unit 28. In the subsequent step S720, the replaced character string is registered in the replacement information temporary storage unit 28, and the process returns to step S160.
[0078]
On the other hand, if the extracted character string in the confidential part is stored in the replacement information temporary storage unit 28 in step S700, the process proceeds to step S730, where the character string stored in the replacement information temporary storage unit 28 is replaced. The process returns to step S160.
[0079]
Thereby, the proper noun of the extracted confidential part is replaced with the character indicating the type and the number in the type. For example, “ABC Electric Co., Ltd.” in (1) in FIG. 22A is assumed to be the first organization name in the document, and as shown in FIG. ”And registered in the replacement information temporary storage unit 28 as [Organization name 1]. In addition, when processing “ABC Electric” in (2) in FIG. 22A, the character string is already registered in the replacement information temporary storage unit 28 as [Organization name 1]. As shown in FIG. (B), the character string is replaced with “[organization name 1]”. Further, when processing “Yamada Construction Co., Ltd.” in (3) in FIG. 22A, the character string is not registered in the replacement information temporary storage unit 28, and [organization name 1] is already stored. Since it is registered in the replacement information temporary storage unit 28, the character string is replaced with “[organization name 2] corporation” as shown in FIG. Also, “Kawada-sama” in FIG. 22A is replaced with “[Personal name 1] -like” as shown in FIG.
[0080]
When the processes from Step S170 to Step S180 and Step S700 to Step S730 are repeated and the mask process for all the confidential parts is completed, the process proceeds from Step S160 to Step S200 in the same manner as the process in FIG. In step S200, the output unit 3 outputs the electronic document subjected to the masking process, and the process ends.
[0081]
As described above, in the electronic document editing apparatus of this embodiment, the same character string before the mask corresponding to the same mask character string is the same by replacing the same proper noun in the extracted confidential part with the same character string. You can know that it was. Further, by replacing the same proper noun with a character string corresponding to the type of the proper noun, for example, the type indicating the type, the type of the proper noun masked can be known. This makes it easier to guess the contents of the confidential part.
[0082]
FIG. 23 is a block diagram showing a configuration of an electronic document editing apparatus according to the seventh embodiment of the present invention. This electronic document editing apparatus includes a mask processing range determination unit 1, a mask processing unit 132, and an output unit 3 in the same manner as the electronic document editing apparatus according to the sixth embodiment shown in FIG.
[0083]
In the electronic document editing apparatus of the sixth embodiment described above, in order to replace the same character string in the confidential part with the same mask character string, and to facilitate the recognition of the type of the confidential part, Although the string is a character string indicating the type of the confidential part, it may be difficult to infer the character string before the mask only with this. Therefore, in this embodiment, a character string (associative information) that is likely to be useful for associating the contents of the confidential part from the mask character string is added to the electronic document.
[0084]
Therefore, in this embodiment, in addition to the configuration of FIG. 19, the mask processing unit 132 is provided with an associative information storage unit 29 that stores the contents of the confidential portion and the associative information in association with each other. In the association information storage unit 29, as shown in FIG. 24, the content of the confidential part extracted by the mask location extraction unit 20, the type of the confidential part, and the association information are stored in association with each other. For example, “ABC Electric” is associated with the type organization name (o) and the association information “represents our company”, and “Yamada Construction” is associated with the type organization name (o) and the association. The information “is a construction company of a business partner” is associated.
[0085]
In order to perform the replacement process as described above, the replacement processing unit 21 of the mask processing unit 132 performs the same process as in FIG.
At this time, in step S720 in FIG. 21, after the new character string of the confidential part is registered in the replacement information temporary storage unit 28, the confidential information registered in the replacement information temporary storage unit 28 with reference to the associative information storage unit 29 If the associative information corresponding to the character string is registered, this is obtained, and the mask character string corresponding to the character string of the confidential part is associated with the acquired associative information at the end of the electronic document after the mask processing. Append. In addition, you may provide the step which performs the same process between step S710 and step S720.
[0086]
When such processing is performed and the processing from step S170 to step S180 and step S700 to step S730 in FIG. 21 described above is repeated and the mask processing for all confidential portions is completed, FIG. 25A shows. In the electronic document, as shown in FIG. 5B, the same proper noun is replaced with the same mask character string as in the sixth embodiment, and the associative information corresponding to the mask character string is added at the end of the sentence. Is converted to an electronic document to which is added. Note that instead of adding associative information to the end of the sentence, it may be a separate file, or may be another message or an attached file of the message when editing an e-mail message, for example.
[0087]
As described above, in the electronic document editing apparatus of this embodiment, in addition to the effects of the above-described sixth embodiment, it is easier to estimate the content of the confidential part before replacement by using the associative information corresponding to the mask character string. Can be done.
[0088]
FIG. 26 is a block diagram showing a configuration of an electronic document editing apparatus according to the eighth embodiment of the present invention. This electronic document editing apparatus includes a mask processing range determination unit 1, a mask processing unit 142, and an output unit 3, similarly to the electronic document editing apparatus according to the first embodiment shown in FIG.
[0089]
In the electronic document editing apparatus according to the seventh embodiment described above, in order to replace the same character string in the confidential part with the same mask character string, and to facilitate the recognition of the type of the confidential part, The column is a character string indicating the type of the confidential part, and further, associative information that is useful for associating the contents of the confidential part from the mask character string is added.
[0090]
This association information is known to insiders (or well-known to insiders) but not to outsiders. For example, internal nicknames, products, etc. When codes can be used, these nicknames, internal codes, etc. can also be used as mask character strings. Also, if a nickname, internal code, etc. known to the insider is used as a mask character string, the correspondence between the mask character string and the associative information is not shown at the end of the sentence as in the seventh embodiment. Also, the content of the confidential part corresponding to the mask character string can be estimated (easily).
[0091]
For this reason, in addition to the configuration of the electronic document editing apparatus of the first embodiment described above, this electronic document editing apparatus has a character string (associative) that is likely to be useful for associating the contents of the confidential part with the mask processing unit 142. An associative information storage unit 29 for storing information). Unlike the above-described FIG. 24, the associative information storage unit 29 stores the above-mentioned nickname, internal code, etc., which are also used as a mask character string, as associative information corresponding to the content of the confidential part and the type of the confidential part Yes. This associative information may be set for each proper noun. For example, as shown in FIG. 27, an organization name may be an initial such as associative information “A Electric” corresponding to “ABC Electric”. An abbreviation such as “Yamaken” associated with “Yamada Construction” may be used. Further, for example, in the case of a product name, an internal code such as “SV1995” corresponding to “product A server” can be used.
[0092]
In order to perform the replacement process as described above, the replacement processing unit 21 of the mask processing unit 142 performs the same process as in FIG.
When the processing up to step S180 in FIG. 5 is executed and the confidential portion is extracted by the mask location extraction unit 20, the replacement processing unit 21 of the mask processing unit 142 is extracted instead of the above-described processing in step S190. It is determined whether or not the associative information corresponding to the confidential part is stored in the associative information storage unit 29, and if it is stored, the associative information is acquired, and the character string of the confidential part is replaced with the acquired associative information. The process returns to step S160. If the associative information corresponding to the confidential part is not stored in the associative information storage unit 29, the confidential part is replaced with the character string “**” and the process returns to step S160.
[0093]
Thus, for example, since the confidential part “ABC Electric” in FIG. 28A is stored in the associative information storage unit 29, as shown in FIG. 28B, the associative information “ Converted to "A electricity". Similarly, since the confidential parts “product A server”, “product B server”, and “Yamada construction” in FIG. 28A are stored in the associative information storage unit 29, as shown in FIG. Are converted into corresponding association information “SV1995”, “SV1997”, and “Yamaken”. Further, since the confidential part “Kawada-sama” in FIG. 28A is not stored in the associative information storage unit 29, the proper noun part is replaced with the characters “**”, as shown in FIG. Is converted into “**-like”.
[0094]
By performing such processing, the processing from step S170 to step S190 in FIG. 5 described above is repeated, and when the mask processing for all the confidential portions is completed, the process proceeds from step S160 to step S200, and output in this step S200. The unit 3 outputs the masked electronic document and ends the process.
[0095]
As described above, in the electronic document editing apparatus according to this embodiment, the content of the confidential part before replacement is estimated by replacing the confidential part with a nickname known to the insider and a mask character string based on the internal code. Can be performed more easily. Further, unlike the seventh embodiment, it is not necessary to separately associate a mask character string with associative information and add it to the electronic document after the mask process, so that an increase in the data size of the electronic document can be suppressed. .
[0096]
The electronic document editing apparatus according to the ninth embodiment of the present invention is similar to the electronic document editing apparatus according to the second embodiment shown in FIG. 7 described above, and includes a mask processing range determination unit 1, a mask processing unit 102, and an output unit. 3 is provided.
[0097]
In the electronic document editing apparatus of the second embodiment described above, the proper noun of the confidential part is replaced with the initial. However, it may not be easy to guess the content of the confidential part only with the initial.
[0098]
For this reason, in this embodiment, after determining the proper noun reading of the confidential portion in the same manner as in the second embodiment described above, the confidential portion is represented by a character string of a part of Roman characters (for example, consonant) indicating the reading. Is replaced. For this purpose, the replacement processing unit 21 generates a mask character string in which the vowels are removed from the reading of the proper part proper noun determined by the reading determination unit 25, and replaces the confidential part with this mask character string.
[0099]
In order to perform the replacement process as described above, the replacement processing unit 21 of the mask processing unit 102 executes the following process.
First, in the process shown in FIG. 29, the same processes as those in steps S100 to S180 and step S200 in the flowchart shown in FIG. 5 are executed, but steps S300 and steps shown in FIG. The process shown in S800 to Step S860 is executed.
[0100]
Similar to the operation in the flowchart shown in FIG. 5 described above, when the confidential part is extracted as a character surrounded by a tag by the processing up to step S180, in step S300 in FIG. It is determined whether or not the confidential part extracted by the location extraction unit 20 is a proper noun. If it is not a proper noun, the process proceeds to step S330, and the extracted confidential part character is set to a predetermined character (character), as in step S190 described above. For example, the character “**” is substituted and the process returns to step S160.
[0101]
On the other hand, if the extracted confidential part is a proper noun, the process proceeds to step S800, and the reading determination unit 25 completes the processing for all the parts in one confidential part divided by the above-described tag as a processing unit. If not completed, the process from step S810 to step S830 is executed. If completed, the process proceeds to step S840.
[0102]
In step S810, the reading determination unit 25 determines whether or not a character string that completely matches the character string of the confidential part delimited by the tag is registered in the reading information storage unit 26. Proceeding to S830, reading of the completely matched character string is acquired from the reading information storage unit 26, and the process returns to Step S800. For example, the character string “electricity” in the confidential part “<on> ABC </ on> <onm> electricity </ onm>” shown in FIG. 30 is registered in the reading information storage unit 26 and corresponds to this. Get the reading “DeNKi”. On the other hand, if a completely matching character string is not registered, the process proceeds to step S820, where the reading determination unit 25 acquires a reading for each individual character of the confidential portion, and returns to step S800. For example, since the character string “Kawada” in the confidential part “<pn> Kawada </ pn>” shown in FIG. 30 is not registered in the reading information storage unit 26, for each character “Kawa” and “field”. The readings “KaWa” and “Ta” are acquired and set as “KaWa + Ta”. At this time, for example, the alphabet such as the character string “ABC” in the confidential part “<on> ABC </ on> <onm> electric </ onm>” in FIG. Treat as you read.
[0103]
When all the characters in one confidential part are requested to be read by the processing from step S800 to step S830, the process proceeds from step S800 to step S840, and in this step S840, the adjacent confidential part readings in the electronic document are combined. To do. For example, the readings “ABC” and “DeNKi” of the confidential portion “<on> ABC </ on> <onm> electric </ onm>” are set to “ABCDeNKi”. In a subsequent step S850, the vowel is deleted from the combined reading. Thus, the reading “ABCDeNKi” is changed to “ABCDNK”. Further, for example, the reading “KaWaTa” of the character string “Kawada” is set to “KWT”. When the character string from which the vowel has been deleted is obtained in this way, the process proceeds to step S860, where the confidential part is replaced with the obtained character string, and the process returns to step S160.
[0104]
When the processes from step S170 to step S180 and step S800 to step S860 are repeated and the mask process for all the confidential parts is completed, the process proceeds from step S160 to step S200, as in the process in FIG. In step S200, the output unit 3 outputs the electronic document subjected to the masking process, and the process ends. As a result, for example, the confidential character strings “ABC Electric Co., Ltd.” and “Kawada-sama” shown in FIG. 31A are converted into the character strings “ABCNKNK Co., Ltd.” and “KWT Therefore, it is easier to guess the content than when the initial display is performed.
[0105]
As described above, in the electronic document editing apparatus of this embodiment, instead of replacing the proper part of the proper noun with the initial, the part is replaced with a character string of a part of Roman letters (for example, consonant) indicating the reading of the proper noun. As a result, it is possible to make it easier for the original user of the electronic document to guess the content of the confidential portion.
[0106]
FIG. 32 is a block diagram showing a configuration of an electronic document editing apparatus according to the tenth embodiment of the present invention. Similar to the electronic document editing apparatus of the first embodiment shown in FIG. 1 described above, this electronic document editing apparatus includes a mask processing range determination unit 1, a mask processing unit 152, and an output unit 3.
[0107]
This electronic document editing apparatus performs mask processing by replacing the kanji in the confidential portion with another kanji having the same radical as the kanji instead of replacing the confidential portion with a predetermined character.
[0108]
For example, the character “sawa” in the character string “sawamatsu” in the confidential part is converted to a character “decision” having the same “sanzui”, for example, and “pine” is converted to a “branch” having the same “kinen”, for example. To do.
[0109]
For this purpose, in this electronic document editing apparatus, the mask processing unit 152 includes a kanji radical information storage unit 30 for detecting kanji with the same radical. For example, as shown in FIG. 33, the kanji radical information storage unit 30 stores a kanji radical and a kanji having the radical in association with each other.
[0110]
In order to perform the replacement process as described above, the replacement processing unit 21 of the mask processing unit 152 executes the following process.
First, in the process shown in FIG. 34, the same processes as those in steps S100 to S180 and S200 in the flowchart shown in FIG. 5 are executed, but steps S900 to S900 shown in FIG. The process up to S940 is executed.
[0111]
Similar to the operation in the flowchart shown in FIG. 5 described above, when the confidential part is extracted as a character surrounded by tags by the processing up to step S180, the replacement processing unit 21 in step S900 in FIG. It is determined whether or not the processing has been completed for all the characters in one confidential portion. If not, the processing from step S910 to step S940 is executed. If the processing has been completed, the processing proceeds to step S200.
[0112]
In step S910, one character in the confidential portion is set as a processing target, and it is determined whether or not the processing target character is a kanji character. If it is not a kanji character, the process proceeds to step S940. In step S920, the replacement processing unit 21 acquires a Chinese character having the same radical as the target Chinese character from the Chinese character radical information storage unit 30. The kanji to be acquired may be selected at random from those stored in the kanji radical information storage unit 30, or a rule for conversion according to kanji reading etc. is defined and selected accordingly You may make it do. When the kanji having the same radical as the processing target kanji is acquired, the replacement processing unit 21 proceeds to step S930, replaces the processing target kanji with the acquired kanji, and returns to step S900. Thus, for example, the confidential portion “ABC Electric” shown in FIG. 35A is replaced with “snow” having the same “Amekanmuri” in the Chinese character “Den” as shown in FIG. The Chinese character “Ki” is replaced with “氣” having the same “Kigamae”. In this way, by converting into kanji having the same radical, it becomes easier to guess the contents of the confidential part.
[0113]
On the other hand, if the character to be processed is not a Chinese character, the process proceeds from step S910 to step S940, the character to be processed is replaced with a predetermined character, for example, “*”, and the process returns to step S900. Thereby, for example, the character string “ABC” in the confidential portion “ABC Electric” shown in FIG. 35A is replaced with “*” of three characters as shown in FIG.
[0114]
When the mask processing for all the characters in one confidential portion is completed by the processing from step S900 to step S940, the process returns from step S900 to step S160. When the mask process for all confidential parts in one electronic document is completed, the process proceeds from step S160 to step S200, the output unit 3 outputs the masked electronic document, and the process ends.
[0115]
As described above, in the electronic document editing apparatus of this embodiment, the content of the confidential part is estimated by the original user of the electronic document by replacing the Chinese character of the confidential part with another Chinese character having the same radical. Can be made easier.
[0116]
In each of the above embodiments, the case where the present invention is applied to an electronic document editing apparatus has been described. However, in the following embodiments, the present invention is applied to an electronic mail apparatus for transmitting and receiving a message that is one of electronic documents. The case will be described.
[0117]
FIG. 36 shows the configuration of an electronic mail apparatus according to the eleventh embodiment of the present invention. The electronic mail device 50 includes a transmission / reception unit 51 for transmitting / receiving electronic mail (message) to / from other electronic mail devices connected via a network 40 such as the Internet, an intranet, or a LAN (Local Area Network), and a user. A creation unit 52 for creating a message (transmission message) to be transmitted, a confidentiality determination unit 53 for determining whether or not the transmission message requires confidentiality, and an editing control unit 54 for controlling editing of the transmission message And a baffle processing unit 55 that executes a baffle process corresponding to the above-described masking process on the transmission message, and a transfer destination storage unit 57 that stores a transfer destination address.
[0118]
The electronic mail device 50 is realized by an information processing device such as a personal computer (PC), and the transmission / reception unit 51 is realized by an SMTP server, a POP server, or the like realized by a program executed in the device, for example. Has been. An e-mail system using a protocol other than this may be used. The transmission / reception unit 51 has a function of transferring a message received by the transmission / reception unit 51 to another destination. The transfer destination address indicating the transfer destination is stored in the transfer destination storage unit 57.
[0119]
The creation unit 52 is realized by, for example, a mail transmission / reception program (mailer) executed in the apparatus. Similarly, the security judgment unit 53, the editing control unit 54, and the prone character processing unit 55 are also realized by programs executed in the apparatus.
[0120]
Further, the prone character processing unit 55 performs prone character processing so that secret parts such as proper nouns and numerical values in the message are not known to outsiders. As a specific example of the character processing, the mask processing shown in the above-described embodiments is used.
[0121]
As shown in FIG. 40, the destination storage unit 57 stores a destination address and a destination address in association with each other. That is, the destination address of the message to be transferred by the transmission / reception unit 51 of the electronic mail apparatus 50 and the transfer destination address (transfer destination address) to be transferred are stored in association with each other. In addition, a plurality of transfer destination addresses can be stored for one destination address. For example, in the example of FIG. 40, the destination address Kawa @ bb #. ne. jp to Kawa @ bc #. ne. jp and Kawa @ bd #. ne. jp is registered. Further, for example, when a UNIX (registered trademark) compatible OS is used as the OS of the electronic mail apparatus 50, the transfer destination storage unit 57 can be a forward file of the user of the message destination to be transferred. In this file, the forwarding address is registered. In this case, since the destination address in FIG. 40 described above can be specified by the user's account, it is not necessarily stored in the forward file.
[0122]
Hereinafter, the operation of the electronic mail apparatus configured as described above will be described in the case where a message received by the transmission / reception unit 51 is transferred to another destination.
The confidentiality judgment unit 53 monitors the presence or absence of a transmission request when the transmission / reception unit 51 transfers a message. When there is a transmission request, the confidentiality determination unit 53 starts processing from step S1000 in FIG. Judgment unit 53 accepts the outgoing call request and proceeds to step S1010.
[0123]
In the processing from step S1010 to step S1030, it is determined whether or not the message requested to be transmitted is confidential. Specifically, this determination is made according to the destination of the message. For example, when a message transmitted / received within a so-called intranet in an organization such as a company is transferred to an address outside the intranet, confidentiality is required. to decide.
[0124]
In step S1010, the transmission / reception unit 51 extracts a destination address from the header portion of the message to be transferred, and extracts one transfer destination address corresponding to the extracted destination address from the transfer destination storage unit 57 in the subsequent step S1015. . In subsequent step S1020, the confidentiality judgment unit 53 extracts the sender address from the header portion of the message to be transferred, compares the extracted sender address with the domain name of the destination address, and if they do not match, proceeds to step S1050. If they match, the process proceeds to step S1030. Therefore, if the message is sent / received within the intranet, the sender address and the domain name of the destination address match, and the process proceeds to step S1030. However, if the message is not sent / received within the intranet, the domain name of the sender address and the destination address is determined. Since they do not match, the process proceeds to step S1050.
[0125]
In step S1030, the domain names of the destination address and the forwarding address are compared. If they match, the process proceeds to step S1050. If they do not match, the process proceeds to the next step S1040. Proceed to step S1050. When a message transmitted / received within the intranet is transferred outside the intranet, the domain name of the destination address is different from the domain name of the transfer destination address, so the process proceeds to step S1040. Then, the process proceeds to step S1050.
[0126]
In step S1050, a message instructed to be transferred is transmitted to the transfer destination address, and the flow advances to step S1060. In step S1060, it is determined whether or not the above-described processing from step S1010 to step S1050 has been executed for all transfer destination addresses of the message instructed to transfer, and if processing has not been completed for all transfer destinations, step S1060 is executed. Returning to S1015, the transfer destination address is extracted from the transfer destination storage unit 57 again, and the processing from step S1015 to step S1050 is executed. If the processing has been completed for all transfer destinations, the processing ends.
[0127]
As described above, in the electronic mail apparatus according to this embodiment, as described above, it is determined whether or not confidentiality is required based on the destination address, sender address, and transfer destination address of the message to be transferred. In this case, the masking process can be automatically performed for a transfer destination that requires confidentiality by executing the masking process, that is, performing any one of the mask processes shown in the above-described embodiments and transferring the message.
[0128]
  FIG. 38 shows the configuration of an electronic mail apparatus according to the twelfth embodiment of the present invention. This electronic mail apparatus 50 is the first one shown in FIG.1As in the mail apparatus of the embodiment, the transmission / reception unit 51, the creation unit 52, the confidentiality determination unit 53, the editing control unit 54, and the baffle processing unit 55 are provided, and the domain name of the internal domain in the intranet is stored. An internal domain storage unit 56 is provided.
[0129]
In the above eleventh embodiment, assuming that there is one internal domain in the intranet, the internal / external determination of the intranet is determined by the domain name in the destination address, the sender address, and the forwarding address. However, when there are a plurality of internal domains in the intranet, each domain name is different, and therefore the domain name of the destination address and the sender address may be different even for messages transmitted and received within the intranet. Even in such a case, the mail apparatus according to this embodiment determines whether or not the confidentiality is necessary in consideration of the domain name of the internal domain in the intranet in order to make it a target of the illegitimate processing when the confidentiality is required. It has become.
[0130]
For this purpose, the internal domain storage unit 56 stores the domain names of all internal domains in the intranet, as shown in FIG.
[0131]
In the electronic mail apparatus configured as described above, the same processing as the processing shown in FIG. 37 described above is executed. However, in steps S1020 and S1030 in FIG. Domain names of all internal domains are considered.
[0132]
That is, in step S1020, if both the destination address and sender address domain names are stored in internal domain storage unit 56, it is determined that the domain names match. In step S1030, one of the destination address and the transfer destination address is stored in the internal domain storage unit 56, and if the other is not stored, it is determined that the domain names do not match. By determining the domain name in this way, it is possible to accurately determine the necessity of confidentiality in consideration of the internal domain in the intranet.
[0133]
As described above, in the electronic mail apparatus according to this embodiment, as described above, the necessity of confidentiality is determined based on the domain names of all internal domains in the intranet. Can be done accurately. As a result, it is possible to prevent a message transmitted / received within the intranet requiring confidentiality from being transferred outside the intranet without being masked, thereby contributing to a reduction in the possibility of confidential leakage.
[0134]
【The invention's effect】
In the present invention, by executing a mask process on a processing range determined according to the type of the electronic document in the electronic document supplied from the outside, an e-mail message, a text format file, etc. This can contribute to reducing the possibility of leakage of the contents of the electronic document.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an electronic document editing apparatus according to a first embodiment of the present invention.
FIG. 2 is a diagram showing an example of proper nouns stored in a proper noun dictionary part constituting the electronic document editing apparatus.
FIG. 3 is a diagram illustrating an example of an integration rule stored in an integration rule storage unit configuring the electronic document editing apparatus.
FIG. 4 is a diagram illustrating an example of extraction rules stored in an extraction rule storage unit constituting the electronic document editing apparatus.
FIG. 5 is a flowchart showing an operation of the electronic document editing apparatus.
FIG. 6 is a diagram showing an example of an electronic document in the process of mask processing by the electronic document editing apparatus.
FIG. 7 is a block diagram showing a configuration of an electronic document editing apparatus according to a second embodiment of the present invention.
FIG. 8 is a diagram showing an example of reading information stored in a reading information storage unit constituting the electronic document editing apparatus.
FIG. 9 is a flowchart showing a part of the operation of the electronic document editing apparatus.
FIG. 10 is a diagram illustrating an example of an electronic document before and after mask processing by the electronic document editing apparatus.
FIG. 11 is a flowchart showing a part of the operation of the electronic document editing apparatus according to the third embodiment of the present invention.
FIG. 12 is a diagram showing an example of an electronic document in the process of mask processing by the electronic document editing apparatus.
FIG. 13 is a block diagram showing a configuration of an electronic document editing apparatus according to a fourth embodiment of the present invention.
FIG. 14 is a diagram showing an example of a mask symbol stored in a mask symbol storage unit constituting the electronic document editing apparatus.
FIG. 15 is a flowchart showing a part of the operation of the electronic document editing apparatus.
FIG. 16 is a diagram showing an example of an electronic document in the process of mask processing by the electronic document editing apparatus.
FIG. 17 is a flowchart showing an operation of the electronic document editing apparatus according to the fifth embodiment of the present invention.
FIG. 18 is a diagram illustrating an example of an electronic document before and after mask processing by the electronic document editing apparatus.
FIG. 19 is a block diagram showing a configuration of an electronic document editing apparatus according to a sixth embodiment of the present invention.
FIG. 20 is a diagram illustrating an example of a replacement character string stored in a replacement information temporary storage unit included in the electronic document editing apparatus.
FIG. 21 is a flowchart showing an operation of the electronic document editing apparatus.
FIG. 22 is a diagram illustrating an example of an electronic document before and after mask processing by the electronic document editing apparatus.
FIG. 23 is a block diagram showing a configuration of an electronic document editing apparatus according to a seventh embodiment of the present invention.
FIG. 24 is a diagram showing an example of associative information stored in an associative information storage unit constituting the electronic document editing apparatus.
FIG. 25 is a diagram illustrating an example of an electronic document before and after mask processing by the electronic document editing apparatus.
FIG. 26 is a block diagram showing a configuration of an electronic document editing apparatus according to an eighth embodiment of the present invention.
FIG. 27 is a diagram illustrating an example of associative information stored in an associative information storage unit included in the electronic document editing apparatus.
FIG. 28 is a diagram illustrating an example of an electronic document before and after mask processing by the electronic document editing apparatus.
FIG. 29 is a flowchart showing the operation of the electronic document editing apparatus according to the ninth embodiment of the present invention.
FIG. 30 is a diagram showing an example of proper noun reading conversion by the electronic document editing apparatus.
FIG. 31 is a diagram illustrating an example of an electronic document before and after mask processing by the electronic document editing apparatus.
FIG. 32 is a block diagram showing a configuration of an electronic document editing apparatus according to a tenth embodiment of the present invention.
FIG. 33 is a diagram illustrating an example of a kanji list stored in a kanji radical information storage unit included in the electronic document editing apparatus.
FIG. 34 is a flowchart showing the operation of the electronic document editing apparatus.
FIG. 35 is a diagram illustrating an example of an electronic document before and after mask processing by the electronic document editing apparatus.
FIG. 36 is a block diagram showing a configuration of an electronic mail apparatus according to an eleventh embodiment of the present invention.
FIG. 37 is a flowchart showing the operation of the electronic mail apparatus.
FIG. 38 is a block diagram showing a configuration of an electronic mail apparatus according to a twelfth embodiment of the present invention.
FIG. 39 is a diagram showing an example of data indicating a domain name stored in an internal domain storage unit of the electronic mail apparatus.
FIG. 40 is a diagram illustrating an example of transfer destinations stored in the transfer destination storage unit;
[Explanation of symbols]
1 Mask processing range determination unit
2, 102, 112, 122, 132, 142, 152 ... Mask processing unit
3 Output section
20 Mask location extraction unit
21 Replacement processing part
22 proper noun dictionary
23 Integrated rule storage
24 Extraction rule storage
25 Reading decision section
26 Reading information storage
27 Mask symbol storage
28 Replacement information temporary storage unit
29 association information storage
30 Kanji radical information storage
40 network
50 E-mail device
51 Transceiver
52 Creation Department
53 Confidentiality Judgment Department
54 Editing control section
55 Blob processing section
56 Internal domain storage
57 Transfer destination storage

Claims (4)

転送すべきメッセージに関するアドレス情報に応じて、該メッセージにマスク処理を行うか否かを判定するマスク判定手段と、
前記メッセージ中の予め設定されているマスク処理範囲に対してマスク処理を実行するマスク処理手段と、
前記マスク判定手段がマスク処理を行わないと判定した場合には、前記転送すべきメッセージを前記アドレス情報によって指定されるアドレスに転送し、前記マスク判定手段がマスク処理を行うと判定した場合には、前記マスク処理手段によってマスク処理されたメッセージを前記アドレス情報によって指定されるアドレスに転送する転送手段とを備える電子メール装置において、
前記マスク判定手段は、転送すべきメッセージ中の差出人アドレスと宛先アドレスのドメイン名が同一であり、かつ、宛先アドレスと該宛先アドレスに対して予め設定された転送先アドレスのドメイン名が同一でない場合にマスク処理を行うと判定することを特徴とする電子メール装置。
Mask determining means for determining whether or not to mask the message according to address information relating to the message to be transferred;
Mask processing means for performing mask processing on a preset mask processing range in the message;
When the mask determination means determines not to perform mask processing, the message to be transferred is transferred to the address specified by the address information, and when the mask determination means determines to perform mask processing in Ru email device and a transfer means for transferring the address specified by the address information of the mask processed message by said mask processing means,
The mask determination means, when the sender address and the destination address domain name in the message to be transferred are the same, and the destination address and the destination address domain name preset for the destination address are not the same An e-mail apparatus characterized by determining that mask processing is to be performed.
転送すべきメッセージに関するアドレス情報に応じて、該メッセージにマスク処理を行うか否かを判定するマスク判定手段と、
前記メッセージ中の予め設定されているマスク処理範囲に対してマスク処理を実行するマスク処理手段と、
前記マスク判定手段がマスク処理を行わないと判定した場合には、前記転送すべきメッセージを前記アドレス情報によって指定されるアドレスに転送し、前記マスク判定手段がマスク処理を行うと判定した場合には、前記マスク処理手段によってマスク処理されたメッセージを前記アドレス情報によって指定されるアドレスに転送する転送手段とを備える電子メール装置において、
イントラネット内の全ての内部ドメイン名を登録する内部ドメイン記憶手段を有し、
前記マスク判定手段は、転送すべきメッセージ中の差出人アドレスと宛先アドレスのドメイン名が前記内部ドメイン記憶手段に記憶されており、かつ、宛先アドレスに対して予め設定された転送先アドレスのドメイン名が前記内部ドメイン記憶手段に記憶されていない場合にマスク処理を行うと判定することを特徴とする電子メール装置。
Mask determining means for determining whether or not to mask the message according to address information relating to the message to be transferred;
Mask processing means for performing mask processing on a preset mask processing range in the message;
When the mask determination means determines not to perform mask processing, the message to be transferred is transferred to the address specified by the address information, and when the mask determination means determines to perform mask processing And an e-mail device comprising transfer means for transferring the message masked by the mask processing means to an address specified by the address information,
An internal domain storage means for registering all internal domain names in the intranet;
The mask determination means stores the sender address and the destination address domain name in the message to be transferred in the internal domain storage means, and the domain name of the transfer destination address preset for the destination address. the internal domain storage means performs a masking process if not stored as determination email device electrostatic you characterized by.
前記転送手段は、前記マスク判定手段がマスク処理を行わないと判定した場合には、前記転送すべきメッセージを該メッセージ中の宛先アドレスに対して予め設定された転送先アドレスに転送し、前記マスク判定手段がマスク処理を行うと判定した場合に、該マスク処理手段によってマスク処理されたメッセージを前記転送先アドレスに転送することを特徴とする請求項1又は請求項のいずれかに記載の電子メール装置。When the mask determining unit determines not to perform mask processing, the transfer unit transfers the message to be transferred to a transfer destination address set in advance with respect to a destination address in the message, and the mask If the determination means determines to perform the masking process, electrons according to claim 1 or claim 2 mask processing messages, characterized in that transferred to the transfer destination address by said masking means Mail device. 前記マスク処理手段は、前記メッセージの機密情報を示す部分を抽出し、該機密情報を示す部分の全てまたは一部を他の情報に置換するマスク処理を実行することを特徴とする請求項1から請求項のいずれかに記載の電子メール装置。2. The mask processing means extracts a portion indicating confidential information of the message and executes a mask processing for replacing all or a part of the portion indicating the confidential information with other information. The electronic mail apparatus according to claim 3 .
JP2000339369A 2000-11-07 2000-11-07 E-mail device Expired - Fee Related JP3961760B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000339369A JP3961760B2 (en) 2000-11-07 2000-11-07 E-mail device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000339369A JP3961760B2 (en) 2000-11-07 2000-11-07 E-mail device

Publications (2)

Publication Number Publication Date
JP2002149638A JP2002149638A (en) 2002-05-24
JP3961760B2 true JP3961760B2 (en) 2007-08-22

Family

ID=18814448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000339369A Expired - Fee Related JP3961760B2 (en) 2000-11-07 2000-11-07 E-mail device

Country Status (1)

Country Link
JP (1) JP3961760B2 (en)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004178238A (en) * 2002-11-27 2004-06-24 Fujitsu Ten Ltd E-mail device and terminal device
JP2004349755A (en) * 2003-05-20 2004-12-09 Nippon Telegr & Teleph Corp <Ntt> Secret information communication system
JP2005309829A (en) * 2003-06-13 2005-11-04 Canon Inc Document management apparatus, document management method, storage medium with computer-readable program stored thereon, and document management program
JP3846893B2 (en) * 2003-07-30 2006-11-15 松下電器産業株式会社 Approval result notification system and method
JP4671637B2 (en) * 2004-01-30 2011-04-20 株式会社リコー Context information exchange system, server, client, program to be executed by computer, and computer-readable recording medium
JP2005338903A (en) * 2004-05-24 2005-12-08 Fujitsu Ltd Document disclosure method, program and device
JP4680667B2 (en) * 2005-05-09 2011-05-11 株式会社日立アドバンストデジタル Email reference method
US8051487B2 (en) * 2005-05-09 2011-11-01 Trend Micro Incorporated Cascading security architecture
JP2007213268A (en) * 2006-02-08 2007-08-23 Kernel Systems Kk Method and program for supporting prevention of information leakage
JP4762027B2 (en) * 2006-03-30 2011-08-31 株式会社沖データ Image forming apparatus
JP5214914B2 (en) * 2007-06-04 2013-06-19 株式会社東芝 Medical information management system
JP5459749B2 (en) * 2007-10-05 2014-04-02 Necカシオモバイルコミュニケーションズ株式会社 Document processing apparatus and program
JP2009187339A (en) * 2008-02-07 2009-08-20 Nec Corp E-mail apparatus, e-mail system, e-mail inspection method and e-mail inspection program
JP2009288856A (en) * 2008-05-27 2009-12-10 Kyocera Corp Peep prevention function-equipped mobile terminal
WO2010038763A1 (en) * 2008-10-01 2010-04-08 株式会社Icon Information management system, terminal unit, server device and program
JP5684128B2 (en) * 2009-08-19 2015-03-11 レノボ・イノベーションズ・リミテッド(香港) Information processing device
JP5812805B2 (en) * 2011-10-31 2015-11-17 三菱スペース・ソフトウエア株式会社 Document concealment system, document concealment program, and document concealment method
JP5731361B2 (en) * 2011-11-25 2015-06-10 日本電信電話株式会社 Character string conversion method and character string conversion program
JP5676522B2 (en) * 2012-05-22 2015-02-25 日本電信電話株式会社 Character string conversion method and program
JP6194180B2 (en) * 2013-03-22 2017-09-06 三菱電機インフォメーションネットワーク株式会社 Text mask device and text mask program
JP6037461B2 (en) 2014-05-09 2016-12-07 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation Apparatus, system, method and program for performing display according to confidential information
JP6531373B2 (en) * 2014-10-31 2019-06-19 キヤノンマーケティングジャパン株式会社 INFORMATION PROCESSING APPARATUS, CONTROL METHOD FOR INFORMATION PROCESSING APPARATUS, AND PROGRAM
JP6038110B2 (en) * 2014-12-26 2016-12-07 株式会社Osk Document file masking process, control program for the process, and computer system for implementing the control program
JP2017162114A (en) * 2016-03-08 2017-09-14 富士通株式会社 Program, information processing method, and information processing apparatus
JP6614099B2 (en) * 2016-11-01 2019-12-04 株式会社Osk Document file masking process, control program for the process, and computer system for implementing the control program
JP2019066917A (en) * 2017-09-28 2019-04-25 京セラドキュメントソリューションズ株式会社 Electronic device and translation support method
JP7064162B2 (en) * 2017-11-01 2022-05-10 株式会社リコー Information processing equipment, information processing systems, information processing methods and programs
JP7004920B2 (en) * 2019-10-30 2022-01-21 株式会社Osk Information processing equipment, information processing methods and information processing programs

Also Published As

Publication number Publication date
JP2002149638A (en) 2002-05-24

Similar Documents

Publication Publication Date Title
JP3961760B2 (en) E-mail device
CN100362513C (en) Translation requesting method, translation requesting terminal and computer readable recording medium
JP4395848B2 (en) Method, system, and computer program for generating and processing disposable email addresses
US7243304B2 (en) Apparatus and method for creating a map of a real name word to an anonymous word for an electronic document
US20130173563A1 (en) Reliability of duplicate document detection algorithms
US20020112015A1 (en) Selective security encryption of electronic communication for selected recipients
Resnick RFC2822: Internet message format
US6014136A (en) Data processing apparatus with communication function
KR20050022284A (en) Url based filtering of electronic communications and web pages
US7624274B1 (en) Decreasing the fragility of duplicate document detecting algorithms
JP2003006116A (en) E-mail system
US6622248B1 (en) File data retrieving device and recording medium containing computer program for controlling the same
JP2007135170A (en) Electronic data delivery method
JP2020077134A (en) Translation apparatus, control program of translation apparatus, and translation method using translation apparatus
JP2000174802A (en) Electronic mail server system
JP4998302B2 (en) Mail misdelivery prevention system, mail misdelivery prevention method, and mail misdelivery prevention program
JP3689632B2 (en) Confidential information transfer device, information processing terminal, and recording medium storing processing program
JP2020077356A (en) Translation apparatus, control program of translation apparatus, and translation method using translation apparatus
JP2005317029A (en) Transmission of secure e-mail format
Spencer " Son of 1036": News Article Format and Transmission
JP7471691B2 (en) Voice information processing service provision system based on personal information protection
JP2008234437A (en) Electronic mail incorrect transmission prevention device and electronic mail incorrect transmission prevention method and program
JP4200650B2 (en) E-mail summary transfer system
JP3863139B2 (en) Communication method, communication system, and communication program
JP2004040304A (en) Electronic mail address control method and program, electronic mail terminal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050708

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060912

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070417

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070517

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110525

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120525

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130525

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140525

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees