JP2020024505A - Document processing device and document processing program - Google Patents
Document processing device and document processing program Download PDFInfo
- Publication number
- JP2020024505A JP2020024505A JP2018147695A JP2018147695A JP2020024505A JP 2020024505 A JP2020024505 A JP 2020024505A JP 2018147695 A JP2018147695 A JP 2018147695A JP 2018147695 A JP2018147695 A JP 2018147695A JP 2020024505 A JP2020024505 A JP 2020024505A
- Authority
- JP
- Japan
- Prior art keywords
- term
- alternative
- confidential
- document
- security permission
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、機密タームを含むドキュメントを処理するドキュメント処理装置及びドキュメント処理プログラムに関する。 The present invention relates to a document processing apparatus and a document processing program for processing a document including a confidential term.
機密タームを含むドキュメントを処理するドキュメント処理装置が知られている(特許文献1乃至特許文献3)。 Document processing devices that process documents containing confidential terms are known (Patent Documents 1 to 3).
機密タームを含むドキュメントを適切に処理することが望ましい。 It is desirable to properly handle documents containing confidential terms.
本発明の一形態に係るドキュメント処理装置は、
オリジナルドキュメントに含まれるオリジナルセンテンスに含まれる機密タームを抽出する機密ターム抽出モジュールと、
抽出した前記機密タームを、前記機密タームを意味する代替タームに置換することにより、前記オリジナルセンテンスの構文と同じ構文の代替センテンスを含む代替ドキュメントを生成する編集モジュール
として動作する制御回路
を具備する。
A document processing device according to an embodiment of the present invention includes:
A confidential term extraction module for extracting confidential terms included in the original sentence included in the original document,
A control circuit that operates as an editing module that generates an alternative document including an alternative sentence having the same syntax as the syntax of the original sentence by replacing the extracted confidential term with an alternative term meaning the confidential term.
本実施形態によれば、代替ドキュメントに含まれる代替センテンスは、オリジナルセンテンスの構文と同じ構文である。このため、代替センテンスは、機密タームを伏せつつ、文として何が書いてあるかをユーザーが意味的に理解可能である。このため、セキュリティー許可レベルが低いユーザーにとっても、黒塗りやボカシの量が多くてオリジナルドキュメントに何が書いてあったのか全く理解できない、ということが無い。さらに、代替ドキュメントの読者(ユーザー)にとっては、黒塗りやボカシに比較して、どのタームが代替タームであるのか(逆に言えば、どこに機密タームが記載されていたのか)を判別しにくい。このことから、機密タームを代替タームに置換することで、機密タームに黒塗りやボカシを入れる編集に比べて、機密性の向上を図れる。 According to the present embodiment, the alternative sentence included in the alternative document has the same syntax as the syntax of the original sentence. For this reason, the alternative sentence allows the user to semantically understand what is written as a sentence while hiding the secret term. For this reason, even for a user with a low security permission level, there is no possibility that the user cannot understand at all what was written in the original document due to the large amount of blackening and blurring. Furthermore, it is more difficult for the reader (user) of the substitute document to determine which term is the substitute term (in other words, where the confidential term is described) than the blackened or blurred one. For this reason, by replacing the confidential term with the alternative term, confidentiality can be improved as compared with editing in which the confidential term is painted or blurred.
前記編集モジュールは、複数のセキュリティー許可レベルに応じて異なる複数の異なる代替ドキュメントを生成する。 The editing module generates a plurality of different alternative documents according to a plurality of security permission levels.
これにより、1つのオリジナルドキュメントから、複数の異なる代替ドキュメントを生成することができる。 Thus, a plurality of different alternative documents can be generated from one original document.
前記制御回路は、さらに、
前記複数のセキュリティー許可レベルに応じて、抽出した前記機密タームから、前記代替タームに置換すべき機密タームを判断するセキュリティー許可レベル判断モジュールとして動作し、
前記編集モジュールは、前記複数のセキュリティー許可レベルに応じて異なる前記機密タームを前記代替タームに置換することにより、前記複数のセキュリティー許可レベルに応じて異なる前記複数の異なる代替ドキュメントを生成する。
The control circuit further includes:
From the extracted security terms according to the plurality of security permission levels, operate as a security permission level determination module that determines a security term to be replaced with the alternative term,
The editing module replaces the different confidential terms with the alternative terms according to the plurality of security permission levels to generate the plurality of different alternative documents different according to the plurality of security permission levels.
これにより、セキュリティー許可レベルに応じて、代替タームに置換すべき機密タームとして、適切な機密タームを判断することができる。 Thus, an appropriate confidential term can be determined as a confidential term to be replaced with an alternative term according to the security permission level.
前記制御回路は、さらに、
前記複数の異なる代替ドキュメントを出力する対象であるユーザーに応じて、セキュリティー許可レベルを判断するユーザーレベル判断モジュール
として動作する。
The control circuit further includes:
It operates as a user level determination module that determines a security permission level according to a user who outputs the plurality of different alternative documents.
これにより、複数の異なる代替ドキュメントから、ユーザーごとに適切な代替ドキュメントを出力することができる。 This makes it possible to output an appropriate substitute document for each user from a plurality of different substitute documents.
前記編集モジュールは、前記機密タームを置換可能な前記代替タームが無く前記同じ構文の代替センテンスを生成できないとき、前記オリジナルセンテンスを削除した前記代替ドキュメントを生成する。 The editing module generates the substitute document in which the original sentence is deleted when there is no substitute term that can replace the confidential term and the substitute sentence having the same syntax cannot be generated.
このようにオリジナルセンテンスを一文まるごと削除することにより、機密タームを伏せつつ、構文が成り立たないために、文として何が書いてあるかをユーザーが意味的に理解不可能である、ということが無い。さらに、代替ドキュメントの読者(ユーザー)にとっては、オリジナルセンテンスを一文まるごと削除することで、黒塗りやボカシに比較して、どのタームが代替タームであるのか(逆に言えば、どこに機密タームが記載されていたのか)を判別しにくい。このことから、オリジナルセンテンスを一文まるごと削除することで、機密タームに黒塗りやボカシを入れる編集に比べて、機密性の向上を図れる。 By deleting the entire original sentence in this way, there is no possibility that the user cannot semantically understand what is written as a sentence because the syntax does not hold down while confidential terms are hidden. . In addition, for the reader (user) of the substitute document, deleting the entire sentence of the original sentence makes it possible to determine which term is the substitute term compared to blackening or blurring (in other words, where the confidential term is described) Is difficult to determine. For this reason, by deleting the entire original sentence, the confidentiality can be improved as compared with the editing in which the confidential terms are blackened or blurred.
本発明の一形態に係るドキュメント処理プログラムは、
ドキュメント処理装置の制御回路を、
オリジナルドキュメントに含まれるオリジナルセンテンスに含まれる機密タームを抽出する機密ターム抽出モジュールと、
抽出した前記機密タームを、前記機密タームを意味する代替タームに置換することにより、前記オリジナルセンテンスの構文と同じ構文の代替センテンスを含む代替ドキュメントを生成する編集モジュール
として動作させる。
A document processing program according to an embodiment of the present invention includes:
The control circuit of the document processing device
A confidential term extraction module for extracting confidential terms included in the original sentence included in the original document,
By replacing the extracted confidential term with a substitute term meaning the confidential term, the system is operated as an editing module that generates a substitute document including a substitute sentence having the same syntax as the syntax of the original sentence.
本発明によれば、機密タームを含むドキュメントを適切に処理することができる。 According to the present invention, a document including a confidential term can be appropriately processed.
なお、ここに記載された効果は必ずしも限定されるものではなく、本発明中に記載されたいずれかの効果であってもよい。 Note that the effects described here are not necessarily limited, and may be any of the effects described in the present invention.
以下、図面を参照しながら、本発明の実施形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
1.ドキュメント処理装置のハードウェア構成 1. Hardware configuration of document processing device
図1は、本発明の一実施形態に係るドキュメント処理装置のハードウェア構成を示す。 FIG. 1 shows a hardware configuration of a document processing apparatus according to an embodiment of the present invention.
本実施形態において、ドキュメント処理装置10を画像形成装置(Multifunction Peripheral、MFP)とし、以下、MFP10と称する。しかしながら、ドキュメント処理装置は、画像形成装置に限定されない。ドキュメント処理装置は、クラウドコンピューティングのサーバーとして動作する情報処理装置でもよい。あるいは、ドキュメント処理装置は、パーソナルコンピューター、タブレットコンピューター、スマートフォン等でもよい。
In the present embodiment, the
MFP10は、制御回路11を備える。制御回路11は、プロセッサーであるCPU11a(Central Processing Unit)、RAM11b(Random Access Memory)、メモリーであるROM11c(Read Only Memory)及び専用のハードウェア回路等から構成され、MFP10の全体的な動作制御を司る。CPU11aは、ROM11cが記憶する情報処理プログラムをRAM11bにロードして実行する。ROM11cは、CPU11aが実行するプログラムやデータなどを固定的に記憶する。ROM11cは、非一過性のコンピューター読み取り可能な記録媒体の一例である。
The MFP 10 includes a
制御回路11は、画像読取部12、画像処理部14、画像メモリー15、画像形成部16、表示部17aを備える操作部17、記憶装置18、ファクシミリ通信部19及びネットワーク通信インターフェース13等と接続されている。制御回路11は、接続されている上記各部の動作制御や、各部との間での信号又はデータの送受信を行う。
The
2.ドキュメント処理装置の機能的構成 2. Functional configuration of document processing device
図2は、ドキュメント処理装置の機能的構成を示す。 FIG. 2 shows a functional configuration of the document processing apparatus.
MFP10の制御回路11において、CPU11aは、ROM11cが記憶する情報処理プログラムをRAM11bにロードして実行することにより、機密ターム抽出モジュール101、セキュリティー許可レベル判断モジュール102、編集モジュール103、ユーザーレベル判断モジュール104及び出力モジュール105として動作する。
In the
機密ターム抽出モジュール101は、オリジナルドキュメントに含まれるオリジナルセンテンスに含まれる機密タームを抽出する。
The confidential
セキュリティー許可レベル判断モジュール102は、複数のセキュリティー許可レベルに応じて、抽出した機密タームから、代替タームに置換すべき機密タームを判断する。
The security permission
編集モジュール103は、抽出した機密タームを、機密タームを意味する代替タームに置換することにより、オリジナルセンテンスの構文と同じ構文の代替センテンスを含む代替ドキュメントを生成する。編集モジュール103は、複数のセキュリティー許可レベルに応じて異なる複数の異なる代替ドキュメントを生成する。
The
ユーザーレベル判断モジュール104は、複数の異なる代替ドキュメントを出力する対象であるユーザーに応じて、セキュリティー許可レベルを判断する。
The user
出力モジュール105は、ユーザーレベル判断モジュール104が判断したセキュリティー許可レベルに対応する代替ドキュメントを、ユーザーに宛てて出力(印刷又は電子メール送信等)する。
The
3.ドキュメント処理装置の動作フロー 3. Operation flow of document processing device
図3は、ドキュメント処理装置の動作フローを示す。 FIG. 3 shows an operation flow of the document processing apparatus.
前提として、MFP10は、オリジナルドキュメントを取得済みである。オリジナルドキュメントは、原稿をスキャンして得られたスキャンデータを光学文字認識(OCR、Optical character recognition)によりテキストデータに変換したデータでよい。あるいは、オリジナルドキュメントは、外部の情報処理装置(パーソナルコンピューター、タブレットコンピューター、スマートフォン等。図示せず)から受信したテキストデータでよい。オリジナルドキュメントは、典型的には、複数のセンテンス(オリジナルセンテンス)を含む。
As a premise, the
機密ターム抽出モジュール101は、機密ターム辞書110を参照し、オリジナルドキュメントに含まれるオリジナルセンテンスに含まれる機密タームを抽出する(ステップS101)。本実施形態で「ターム」は、語及び句を少なくとも意味する。
The confidential
図4は、機密ターム辞書の一構成例を示す。 FIG. 4 shows a configuration example of the confidential term dictionary.
機密ターム辞書110は、種別111、機密ターム112、同義機密ターム113及び代替ターム114を互いに関連付けて記憶する。機密ターム112は、機密性のあるタームである。機密ターム112の具体例は、プロジェクト名(コードネーム)や人名等の固有名詞や、予算や株式に係わる通貨記号付きの数値等を含む。同義機密ターム113は、機密ターム112と同義のタームである。このため、同義機密ターム113は、概念的には、機密ターム112に含まれる、あるいは、機密ターム112の一種であると言える。従って、本明細書で「機密ターム」(符号なし)は、機密ターム112及び同義機密ターム113の両方を含む。種別111は、機密ターム112及び同義機密ターム113の種別である。代替ターム114は、機密ターム112及び同義機密ターム113を意味するタームであり、典型的には、機密ターム112及び同義機密ターム113より広義、一般的、汎用的な(言い換えれば、固有名詞ではない)タームである。
The
例えば、機密ターム112であるプロジェクト名の固有名詞「プロジェクトM」に対して、種別111「プロジェクト名」及び代替ターム114「調査プロジェクト」が関連付けられる。機密ターム112である人名「アベさん」に対して、種別111「投資家情報」、同義機密ターム113「アベ氏」及び代替ターム114「投資家」が関連付けられる。機密ターム112である通貨記号付きの数値「[$, \]+[0-9]」に対して、種別111「株式」及び「予算情報」が関連付けられるが、代替ターム114は関連付けられない。
For example, the
具体的には、機密ターム抽出モジュール101は、オリジナルドキュメントに含まれるオリジナルセンテンスから、機密ターム辞書110に記録された機密ターム112及び同義機密ターム113を抽出する(ステップS101)。
Specifically, the confidential
次に、セキュリティー許可レベル判断モジュール102は、セキュリティー許可レベルテーブル120を参照し、複数のセキュリティー許可レベルに応じて、機密ターム抽出モジュール101がオリジナルドキュメントに含まれるオリジナルセンテンスから抽出した機密ターム112及び同義機密ターム113のうちから、代替ターム114に置換すべき機密ターム112及び同義機密ターム113を判断する(ステップS102)。
Next, the security permission
図5は、セキュリティー許可レベルテーブルの一構成例を示す。 FIG. 5 shows a configuration example of the security permission level table.
セキュリティー許可レベルテーブル120は、セキュリティー許可レベル121及び種別122を互いに関連付けて記憶する。セキュリティー許可レベル121が高いほど、より多くの機密情報の出力が許可されることを意味する。一方、セキュリティー許可レベル121が低いほど、より少ない機密情報の出力が許可される(逆に言えば、より多くの機密情報が伏せられる)ことを意味する。種別122は、セキュリティー許可レベル121に応じて、代替タームに置換すべき機密タームの種別を示す。種別122は、機密ターム辞書110に記憶された種別111の何れかである。
The security permission level table 120 stores the
例えば、セキュリティー許可レベル121「高」に対して、種別122は関連付けられない。これは、セキュリティー許可レベル121「高」の場合、代替タームに置換すべき機密タームの種別が無い(逆に言えば、全ての機密タームは置換されない)ことを意味する。セキュリティー許可レベル121「中」に対して、種別122「投資家情報」、「株式」及び「プロジェクト名」が関連付けられる。これは、セキュリティー許可レベル121「中」の場合、種別122(機密ターム辞書110の種別111)「投資家情報」、「株式」及び「プロジェクト名」に関連付けられた機密タームを、代替タームに置換すべきであることを意味する。セキュリティー許可レベル121「低」に対して、種別122「投資家情報」、「株式」及び「予算情報」が関連付けられる。これは、セキュリティー許可レベル121「低」の場合、種別122(機密ターム辞書110の種別111)「投資家情報」、「株式」及び「予算情報」に関連付けられた機密タームを、代替タームに置換すべきであることを意味する。
For example, the
具体的には、セキュリティー許可レベル判断モジュール102は、セキュリティー許可レベルテーブル120を参照し、機密ターム抽出モジュール101がオリジナルドキュメントに含まれるオリジナルセンテンスから抽出した機密タームから、セキュリティー許可レベル121「高」の場合に代替タームに置換すべき種別122の機密ターム(本例では、無し)と、セキュリティー許可レベル121「中」の場合に代替タームに置換すべき種別122の機密タームと、セキュリティー許可レベル121「低」の場合に代替タームに置換すべき種別122の機密タームとを判断する(ステップS102)。
More specifically, the security permission
次に、編集モジュール103は、機密ターム抽出モジュール101が抽出した機密ターム112及び同義機密ターム113を代替ターム114に置換することにより、オリジナルセンテンスの構文と同じ構文の代替センテンスを含む代替ドキュメント130を生成し、記憶装置18に記憶する(ステップS103)。編集モジュール103は、複数のセキュリティー許可レベル(本例では、「高」、「中」及び「低」の3レベル)に応じて異なる、複数(本例では、3つ)の異なる代替ドキュメント130を生成する。具体的には、編集モジュール103は、複数のセキュリティー許可レベルに応じて異なる機密タームを代替タームに置換することにより、複数のセキュリティー許可レベルに応じて異なる複数の異なる代替ドキュメント130を生成する。編集モジュール103は、機密タームを置換可能な代替タームが無く同じ構文の代替センテンスを生成できないとき、オリジナルセンテンスを削除した代替ドキュメント130を生成する。編集モジュール103が生成する代替センテンスを含む代替ドキュメントは、後で具体例を挙げて説明する。
Next, the
次に、ユーザーレベル判断モジュール104は、ユーザーレベルテーブル140を参照し、複数の異なる代替ドキュメント130を出力する対象であるユーザーに応じて、セキュリティー許可レベルを判断する(ステップS104)。「代替ドキュメント130を出力する対象であるユーザー」は、例えば、代替ドキュメント130を印刷するためにMFP10にログインするユーザー(単数)や、代替ドキュメント130を電子メールで送信する宛先となるデバイスを使用するユーザー(単数又は複数)を意味する。「代替ドキュメント130を出力する対象であるユーザー」は、任意のタイミングで決定される。
Next, the user
図6は、ユーザーレベルテーブルの一構成例を示す。 FIG. 6 shows a configuration example of the user level table.
ユーザーレベルテーブル140は、ユーザー識別子141及びセキュリティー許可レベル142を互いに関連付けて記憶する。ユーザー識別子141は、ユーザー個人又はユーザーの役職を識別する。セキュリティー許可レベル142は、セキュリティー許可レベルテーブル120に記憶されたセキュリティー許可レベル121の何れかである。
The user level table 140 stores the
例えば、ユーザー識別子141「社長」及び「副社長」に対してセキュリティー許可レベル142「高」が関連付けられる。ユーザー識別子141「マネージャーA」に対してセキュリティー許可レベル142「中」が関連付けられる。ユーザー識別子141「従業員A」及び「従業員B」に対してセキュリティー許可レベル142「低」が関連付けられる。
For example, the
具体的には、ユーザーレベル判断モジュール104は、ユーザーレベルテーブル140を参照し、複数の異なる代替ドキュメント130を出力する対象であるユーザーを識別するユーザー識別子141に関連付けられたセキュリティー許可レベル142を判断する(ステップS104)。
Specifically, the user
出力モジュール105は、ユーザーレベル判断モジュール104が判断したセキュリティー許可レベル142に対応する代替ドキュメント130を記憶装置18から読み出し、代替ドキュメント130を出力する対象であるユーザーに宛てて出力(印刷又は電子メール送信等)する(ステップS105)。
The
4.具体例 4. Concrete example
具体例に係るオリジナルドキュメントは「アベ氏は当社株を大量に購入した。アベ氏が現在所有する株は総額\327,000,000に達する。多数の従業員が我々のプロジェクトMにより離職した。」である。オリジナルドキュメントは、オリジナルセンテンス「アベ氏は当社株を大量に購入した。」、「アベ氏が現在所有する株は総額\327,000,000に達する。」及び「多数の従業員が我々のプロジェクトMにより離職した。」を含む。 The original document according to the example is, "Abe has purchased a large amount of our shares. Ave currently owns a total of ¥ 327,000,000. A large number of employees have left our project M." The original documents are the original sentence "Abe has purchased a large amount of our shares.", "The current shares owned by Abe amount to \ 327,000,000." And "Many employees have left our project M. ."including.
オリジナルセンテンス「アベ氏は当社株を大量に購入した。」を説明する。機密ターム抽出モジュール101は、機密ターム辞書110に機密ターム112「アベさん」に関連付けて記憶された同義機密ターム113「アベ氏」をオリジナルセンテンスから抽出し、機密ターム辞書110に同義機密ターム113「アベ氏」に関連付けて記憶された種別111「投資家情報」を判断する。セキュリティー許可レベル判断モジュール102は、セキュリティー許可レベルテーブル120に、種別122「投資家情報」に関連付けてセキュリティー許可レベル121「中」及び「低」が記憶されており、セキュリティー許可レベル121「高」が記憶されていないことを判断する。編集モジュール103は、セキュリティー許可レベル121「中」及び「低」に対して、オリジナルセンテンス「アベ氏は当社株を大量に購入した。」に含まれる同義機密ターム113「アベ氏」を、これに関連付けて機密ターム辞書110に記憶された代替ターム114「投資家」に置換することにより、オリジナルセンテンスの構文と同じ構文の代替センテンス「投資家は当社株を大量に購入した。」を生成する。一方、編集モジュール103は、セキュリティー許可レベル121「高」に対して、オリジナルセンテンス「アベ氏は当社株を大量に購入した。」のまま変更しない(代替しない)。
Explain the original sentence "Abe has purchased a large amount of our stock." The confidential
オリジナルセンテンス「アベ氏が現在所有する株は総額\327,000,000に達する。」を説明する。機密ターム抽出モジュール101は、機密ターム辞書110に機密ターム112「アベさん」に関連付けて記憶された同義機密ターム113「アベ氏」をオリジナルセンテンスから抽出し、機密ターム辞書110に同義機密ターム113「アベ氏」に関連付けて記憶された種別111「投資家情報」を判断する。セキュリティー許可レベル判断モジュール102は、セキュリティー許可レベルテーブル120に、種別122「投資家情報」に関連付けてセキュリティー許可レベル121「中」及び「低」が記憶されており、「高」が記憶されていないことを判断する。一方、機密ターム抽出モジュール101は、機密ターム辞書110に機密ターム112「[$, \]+[0-9]」を意味する「\327,000,000」をオリジナルセンテンスから抽出し、機密ターム辞書110に機密ターム112「[$, \]+[0-9]」に関連付けて記憶された種別111「株式」及び「予算情報」を判断する。セキュリティー許可レベル判断モジュール102は、セキュリティー許可レベルテーブル120に、種別122「株式」及び「予算情報」に関連付けてセキュリティー許可レベル121「低」が記憶されており、種別122「株式」に関連付けてセキュリティー許可レベル121「中」が記憶されており、種別122「株式」及び「予算情報」に関連付けてセキュリティー許可レベル121「高」が記憶されていないことを判断する。編集モジュール103は、セキュリティー許可レベル121「中」及び「低」に対して、オリジナルセンテンス「アベ氏が現在所有する株は総額\327,000,000に達する。」に含まれる機密ターム112「[$, \]+[0-9]」を意味する「\327,000,000」を置換可能な代替ターム114が機密ターム辞書110に記憶されておらず同じ構文の代替センテンスを生成できないので、オリジナルセンテンスを一文まるごと削除する。一方、編集モジュール103は、セキュリティー許可レベル121「高」に対して、オリジナルセンテンス「アベ氏が現在所有する株は総額\327,000,000に達する。」のまま変更しない(代替しない)。
Explains the original sentence "Abe currently owns a total of \ 327,000,000." The confidential
オリジナルセンテンス「多数の従業員が我々のプロジェクトMにより離職した。」を説明する。機密ターム抽出モジュール101は、機密ターム辞書110に機密ターム112「プロジェクトM」をオリジナルセンテンスから抽出し、機密ターム辞書110に機密ターム112「プロジェクトM」に関連付けて記憶された種別111「プロジェクト名」を判断する。セキュリティー許可レベル判断モジュール102は、セキュリティー許可レベルテーブル120に、種別122「プロジェクト名」に関連付けてセキュリティー許可レベル121「中」が記憶されており、セキュリティー許可レベル121「高」及び「低」が記憶されていないことを判断する。編集モジュール103は、セキュリティー許可レベル121「中」に対して、オリジナルセンテンス「多数の従業員が我々のプロジェクトMにより離職した。」に含まれる機密ターム112「プロジェクトM」を、これに関連付けて機密ターム辞書110に記憶された代替ターム114「調査プロジェクト」に置換することにより、オリジナルセンテンスの構文と同じ構文の代替センテンス「多数の従業員が我々の調査プロジェクトにより離職した。」を生成する。一方、編集モジュール103は、セキュリティー許可レベル121「高」及び「低」に対して、オリジナルセンテンス「多数の従業員が我々のプロジェクトMにより離職した。」のまま変更しない(代替しない)。
Explain the original sentence "Many employees have left our project M." The secret
編集モジュール103は、セキュリティー許可レベル「高」、「中」及び「低」に対して、上で生成した代替センテンス、オリジナルセンテンス又はオリジナルセンテンスの削除をそれぞれ組み合わせることにより、それぞれのレベルの代替ドキュメントを生成する。具体的には、編集モジュール103は、セキュリティー許可レベル「高」に対して、代替ドキュメントを生成せず、オリジナルドキュメントアベ氏は当社株を大量に購入した。アベ氏が現在所有する株は総額\327,000,000に達する。多数の従業員が我々のプロジェクトMにより離職した。」のまま変更しない(代替しない)。編集モジュール103は、セキュリティー許可レベル「中」に対して、代替ドキュメント「投資家は当社株を大量に購入した。多数の従業員が我々の調査プロジェクトにより離職した。」を生成する。編集モジュール103は、セキュリティー許可レベル「低」に対して、代替ドキュメント「投資家は当社株を大量に購入した。多数の従業員が我々のプロジェクトMにより離職した。」を生成する。なお、セキュリティー許可レベル「中」及び「低」の代替ドキュメントでは、「アベ氏が現在所有する株は総額\327,000,000に達する。」は削除されている。
The
5.変形例 5. Modified example
本実施形態では、編集モジュール103は、複数のセキュリティー許可レベルに応じて異なる、複数の異なる代替ドキュメント130を生成して記憶装置18に記憶する(ステップS103)。次に、ユーザーレベル判断モジュール104は、代替ドキュメントを出力する対象であるユーザーのセキュリティー許可レベル142を判断する(ステップS104)。次に、出力モジュール105は、判断したセキュリティー許可レベル142に対応する代替ドキュメントを記憶装置18から読み出し、代替ドキュメントを出力する対象であるユーザーに宛てて出力(印刷又は電子メール送信等)する(ステップS105)。これに替えて、以下の構成でもよい(図示せず)。
In the present embodiment, the
ユーザーレベル判断モジュール104は、代替ドキュメントを出力する対象であるユーザーのセキュリティー許可レベル142を判断する(ステップS104に相当)。次に、編集モジュール103は、判断したセキュリティー許可レベル142に対応する代替ドキュメントを生成する(ステップS103に相当)。次に、出力モジュール105は、生成した代替ドキュメントをユーザーに宛てて出力(印刷又は電子メール送信等)する(ステップS105に相当)。本変形例の場合、代替ドキュメントを出力する対象であるユーザーのセキュリティー許可レベル142が1レベルの場合(例えば、ユーザーが単数の場合)、生成する代替ドキュメントの数も1種類となる。
The user
6.結語 6. Conclusion
組織や企業では、機密情報の保護が重要である。典型的に、セキュリティー許可レベルが高いユーザーは、全ての機密情報にアクセスできる。一方、セキュリティー許可レベルが低いユーザーは、全ての機密情報にアクセスできるわけではない。セキュリティー許可レベルが低いユーザーに対して出力されるドキュメントを作成する際、典型的には、機密タームを含むオリジナルドキュメントをマニュアルで編集する(例えば、黒塗りやボカシを入れる等)。マニュアルでの編集は、時間と手間が掛かる上、編集漏れなどのミス(例えば、黒塗りやボカシを入れるべきタームに入れない等)も発生しうる。また、黒塗りやボカシの量が多いと、オリジナルドキュメントに何が書いてあったのか全く理解できないこともありうる。 In organizations and businesses, protecting confidential information is important. Typically, a user with a higher security permission level has access to all sensitive information. On the other hand, a user with a low security permission level cannot access all confidential information. When creating a document to be output to a user with a low security permission level, typically, the original document including the confidential terms is manually edited (for example, blackened or blurred). Manual editing takes time and effort, and may cause mistakes such as omission of editing (for example, blackening or not entering a term that should be blurred). Also, if the amount of blackening or blurring is large, it may be impossible to understand at all what was written in the original document.
これに対して、本実施形態によれば、機密ターム抽出モジュール101は、オリジナルドキュメントに含まれるオリジナルセンテンスに含まれる機密タームを抽出する。編集モジュール103は、抽出した機密タームを、機密タームを意味する代替タームに置換することにより、オリジナルセンテンスの構文と同じ構文の代替センテンスを含む代替ドキュメントを生成する。
On the other hand, according to the present embodiment, the confidential
本実施形態によれば、代替ドキュメントに含まれる代替センテンスは、オリジナルセンテンスの構文と同じ構文である。このため、代替センテンスは、機密タームを伏せつつ、文として何が書いてあるかをユーザーが意味的に理解可能である。このため、セキュリティー許可レベルが低いユーザーにとっても、黒塗りやボカシの量が多くてオリジナルドキュメントに何が書いてあったのか全く理解できない、ということが無い。さらに、代替ドキュメントの読者(ユーザー)にとっては、黒塗りやボカシに比較して、どのタームが代替タームであるのか(逆に言えば、どこに機密タームが記載されていたのか)を判別しにくい。このことから、機密タームを代替タームに置換することで、機密タームに黒塗りやボカシを入れる編集に比べて、機密性の向上を図れる。 According to the present embodiment, the alternative sentence included in the alternative document has the same syntax as the syntax of the original sentence. For this reason, the alternative sentence allows the user to semantically understand what is written as a sentence while hiding the secret term. For this reason, even for a user with a low security permission level, there is no possibility that the user cannot understand at all what was written in the original document due to the large amount of blackening and blurring. Furthermore, it is more difficult for the reader (user) of the substitute document to determine which term is the substitute term (in other words, where the confidential term was described) than in the case of blackening or blurring. For this reason, by replacing the confidential term with the alternative term, confidentiality can be improved as compared with editing in which the confidential term is painted or blurred.
本実施形態によれば、編集モジュール103は、複数のセキュリティー許可レベルに応じて異なる複数の異なる代替ドキュメントを生成する。
According to the present embodiment, the
これにより、1つのオリジナルドキュメントから、複数の異なる代替ドキュメントを生成することができる。 Thus, a plurality of different alternative documents can be generated from one original document.
本実施形態によれば、セキュリティー許可レベル判断モジュール102は、複数のセキュリティー許可レベルに応じて、抽出した機密タームから、代替タームに置換すべき機密タームを判断する。編集モジュール103は、複数のセキュリティー許可レベルに応じて異なる機密タームを代替タームに置換することにより、複数のセキュリティー許可レベルに応じて異なる複数の異なる代替ドキュメントを生成する。
According to the present embodiment, the security permission
これにより、セキュリティー許可レベルに応じて、代替タームに置換すべき機密タームとして、適切な機密タームを判断することができる。 Thus, an appropriate confidential term can be determined as a confidential term to be replaced with an alternative term according to the security permission level.
本実施形態によれば、ユーザーレベル判断モジュール104は、複数の異なる代替ドキュメントを出力する対象であるユーザーに応じて、セキュリティー許可レベルを判断する。
According to the present embodiment, the user
これにより、複数の異なる代替ドキュメントから、ユーザーごとに適切な代替ドキュメントを出力することができる。 This makes it possible to output an appropriate substitute document for each user from a plurality of different substitute documents.
編集モジュール103は、機密タームを置換可能な代替タームが無く同じ構文の代替センテンスを生成できないとき、オリジナルセンテンスを削除した代替ドキュメントを生成する。
When there is no alternative term that can replace the confidential term and an alternative sentence having the same syntax cannot be generated, the
このようにオリジナルセンテンスを一文まるごと削除することにより、機密タームを伏せつつ、構文が成り立たないために、文として何が書いてあるかをユーザーが意味的に理解不可能である、ということが無い。さらに、代替ドキュメントの読者(ユーザー)にとっては、オリジナルセンテンスを一文まるごと削除することで、黒塗りやボカシに比較して、どのタームが代替タームであるのか(逆に言えば、どこに機密タームが記載されていたのか)を判別しにくい。このことから、オリジナルセンテンスを一文まるごと削除することで、機密タームに黒塗りやボカシを入れる編集に比べて、機密性の向上を図れる。 By deleting the entire original sentence in this way, it is possible that the user will not be able to semantically understand what is written as a sentence because the syntax does not hold while the secret term is hidden. . In addition, for the reader (user) of the substitute document, deleting the entire sentence of the original sentence makes it possible to determine which term is the substitute term compared to blackening or blurring (in other words, where the confidential term is described) Is difficult to determine. For this reason, by deleting the entire original sentence, the confidentiality can be improved as compared with the editing in which the confidential terms are blackened or blurred.
本技術の各実施形態及び各変形例について上に説明したが、本技術は上述の実施形態にのみ限定されるものではなく、本技術の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。 Although each embodiment and each modification of the present technology have been described above, the present technology is not limited to only the above-described embodiments, and it is possible to make various changes without departing from the gist of the present technology. Of course.
ドキュメント処理装置(MFP)10
機密ターム抽出モジュール101
セキュリティー許可レベル判断モジュール102
編集モジュール103
ユーザーレベル判断モジュール104
出力モジュール105
Document processing device (MFP) 10
Secret
Security permission
Editing
User
Claims (6)
抽出した前記機密タームを、前記機密タームを意味する代替タームに置換することにより、前記オリジナルセンテンスの構文と同じ構文の代替センテンスを含む代替ドキュメントを生成する編集モジュール
として動作する制御回路
を具備するドキュメント処理装置。 A confidential term extraction module for extracting confidential terms included in the original sentence included in the original document,
A control circuit that operates as an editing module that generates an alternative document including an alternative sentence having the same syntax as that of the original sentence by replacing the extracted confidential term with an alternative term that indicates the confidential term. Processing equipment.
前記編集モジュールは、複数のセキュリティー許可レベルに応じて異なる複数の異なる代替ドキュメントを生成する
ドキュメント処理装置。 The document processing device according to claim 1, wherein
The document processing apparatus, wherein the editing module generates a plurality of different alternative documents according to a plurality of security permission levels.
前記制御回路は、さらに、
前記複数のセキュリティー許可レベルに応じて、抽出した前記機密タームから、前記代替タームに置換すべき機密タームを判断するセキュリティー許可レベル判断モジュールとして動作し、
前記編集モジュールは、前記複数のセキュリティー許可レベルに応じて異なる前記機密タームを前記代替タームに置換することにより、前記複数のセキュリティー許可レベルに応じて異なる前記複数の異なる代替ドキュメントを生成する
ドキュメント処理装置。 The document processing device according to claim 2, wherein
The control circuit further includes:
From the extracted security terms according to the plurality of security permission levels, operate as a security permission level determination module that determines a security term to be replaced with the alternative term,
The document processing apparatus, wherein the editing module generates the plurality of different alternative documents different according to the plurality of security permission levels by replacing the confidential terms different according to the plurality of security permission levels with the alternative terms. .
前記制御回路は、さらに、
前記複数の異なる代替ドキュメントを出力する対象であるユーザーに応じて、セキュリティー許可レベルを判断するユーザーレベル判断モジュール
として動作する
ドキュメント処理装置。 The document processing device according to claim 2 or 3,
The control circuit further includes:
A document processing device that operates as a user level determination module that determines a security permission level according to a user who outputs the plurality of different alternative documents.
前記編集モジュールは、前記機密タームを置換可能な前記代替タームが無く前記同じ構文の代替センテンスを生成できないとき、前記オリジナルセンテンスを削除した前記代替ドキュメントを生成する
ドキュメント処理装置。 The document processing apparatus according to claim 1, wherein:
The document processing device, wherein, when there is no alternative term that can replace the confidential term and the alternative sentence having the same syntax cannot be generated, the editing module generates the alternative document in which the original sentence is deleted.
オリジナルドキュメントに含まれるオリジナルセンテンスに含まれる機密タームを抽出する機密ターム抽出モジュールと、
抽出した前記機密タームを、前記機密タームを意味する代替タームに置換することにより、前記オリジナルセンテンスの構文と同じ構文の代替センテンスを含む代替ドキュメントを生成する編集モジュール
として動作させる
ドキュメント処理プログラム。 The control circuit of the document processing device
A confidential term extraction module for extracting confidential terms included in the original sentence included in the original document,
A document processing program that operates as an editing module that generates an alternative document including an alternative sentence having the same syntax as the syntax of the original sentence by replacing the extracted confidential term with an alternative term meaning the confidential term.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018147695A JP2020024505A (en) | 2018-08-06 | 2018-08-06 | Document processing device and document processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018147695A JP2020024505A (en) | 2018-08-06 | 2018-08-06 | Document processing device and document processing program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020024505A true JP2020024505A (en) | 2020-02-13 |
Family
ID=69618693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018147695A Pending JP2020024505A (en) | 2018-08-06 | 2018-08-06 | Document processing device and document processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020024505A (en) |
-
2018
- 2018-08-06 JP JP2018147695A patent/JP2020024505A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3803668B1 (en) | Obfuscating information related to personally identifiable information (pii) | |
US11061991B2 (en) | Secure document sharing | |
US7446895B2 (en) | Print content system and method for providing document control | |
JP6503926B2 (en) | Program and information processing apparatus | |
US9967416B2 (en) | Document policies for a document processing unit | |
US10282605B2 (en) | Print data semantic analyzer | |
US10868942B2 (en) | Methods and system for generating a confidential document | |
JP2006065837A (en) | Method and system for detecting time when outgoing communication includes specified content | |
JP4631792B2 (en) | Print record management apparatus, program and method | |
US10944888B2 (en) | Methods and system of devices for managing confidential documents using authentication codes | |
US20080204791A1 (en) | Image-processing system, image-processing log recording method, computer-readable medium, and computer data signal | |
JP2007004431A (en) | Document management system, document disposal apparatus, and document management method | |
US8250103B2 (en) | Image log management device, image log management method, image log management program | |
JP2008271534A (en) | Content-based accounting method implemented in image reproduction devices | |
JP2007312225A (en) | Data processing apparatus, and data processing method and data processing program executed by the apparatus | |
WO2017088684A1 (en) | Information security management system and office machine using same | |
US10630854B2 (en) | Image processing apparatus | |
JP2008262259A (en) | Information leakage prevention system | |
JP2020024505A (en) | Document processing device and document processing program | |
US20180262648A1 (en) | Image forming apparatus | |
US11108922B2 (en) | Image processing apparatus, system, server, control method, and storage medium to perform encryption processes on image data and attribute data using first and second keys and further perform character recognition process | |
KR20160059001A (en) | Electronic Document Management System for Trade Secret based on Document Controll Module and Method thereof | |
US10681247B1 (en) | Methods and system of devices for managing confidential documents having redacted information | |
JP2012114718A (en) | Image forming apparatus capable of processing codes, and control method thereof | |
US20070118650A1 (en) | Data input/output system, data input/output server, and data input/output method |